Detection, characterisation and use of open clusters in a Galactic context in a Big Data environment

dc.contributor
Universitat de Barcelona. Departament de Física Quàntica i Astrofísica
dc.contributor.author
Castro Ginard, Alfred
dc.date.accessioned
2021-06-01T11:22:44Z
dc.date.available
2021-06-01T11:22:44Z
dc.date.issued
2021-04-30
dc.identifier.uri
http://hdl.handle.net/10803/671790
dc.description.abstract
Open clusters are groups of stars, gravitationally bound together, that were born from the same molecular cloud and, thus, share similar positions, kinematics, ages and metallicities. Traditional methods to detect open clusters rely in the visual inspection of regions of the sky to look for positional overdensities of stars, which then are checked to follow an isochrone pattern in a colour-magnitude diagram. The publication of the second Gaia data release, with more than 1.3 billion stars with parallax and proper motion measurements together with mean photometry in three broadbands, boosted the development of novel machine learning-based techniques to automatise the search for open clusters, using both the astrometric and photometric information. The characterised open clusters in the Galaxy are popular tracers of properties of the Galactic disc such as the structure and evolution of the spiral arms, or testbed for stellar evolution studies for instance, because their astrophysical parameters are estimated with greater precision than for field stars. Therefore, a good understanding of the open cluster population in the Milky Way is key for Galactic archaeology studies. Our aim for this thesis is to transform classical methodologies to detect different kinds of patterns from astronomical data, that mostly relies on visual inspection, to an automatic data mining procedure to extract meaningful information from stellar catalogues. We also aim to use the result of the application of machine learning techniques to Gaia data, in a broader Galactic context. We have developed a data mining methodology to blindly search for open clusters in the Galactic disc. First, we use a density-based clustering algorithm, DBSCAN, to search for overdensities in the five-dimensional astrometric parameter space in Gaia data. The deployment of the clustering step in a Big Data environment, at the MareNostrum supercomputer located in the Barcelona Supercomputing Center, prevents the search to be limited by computational limitations. Second, the detected overdensities are classified into mere statistical or physical overdensities using an artificial neural network trained to recognise the isochrone pattern that open cluster member stars follow in a colour-magnitude diagram. We estimate astrophysical parameters such as ages, distances and line-of-sight extinctions for the whole open cluster population using an artificial neural network trained on well-known open clusters. We use this additional information, together with radial velocities gathered from different space-based and ground-based surveys, to trace the Galactic spiral present-day structure using GaussianMixtureModels to associate the young (< 30 Myr) open clusters to their mother spiral arms. We also describe the spiral arms evolution during the last 80 Myr to provide new insights into the nature of the Milky Way spiral structure. The automatization of the open cluster detection procedure, together with its deployment in a Big Data environment, has resulted in more than 650 new open clusters detected with this methodology. The new UBC clusters (named after the University of Barcelona) represent one-third of the actual open clusters census (2017 objects with Gaia DR2 parameters), and it is the largest single contribution to the open cluster catalogue. We are able to add 264 young open clusters (< 30 Myr) to the 84 high-mass star- forming regions traditionally used to trace spiral arms, to increase the Galactocentric azimuth range where the Milky Way spiral arms are defined, and better estimate their present-day parameters. By analysing the age distribution of the open clusters across the Galactic spiral arms, and computing the spiral arms pattern speeds following the open clusters orbits from their birthplaces, we are able to disfavour classical density waves as the main mechanism for the formation of the Milky Way spiral arms, favouring a transient behaviour. This thesis has shown that the use of machine learning, with proper treatment of the computational resources, has a long journey ahead in a data-dominated future for Astronomy.
en_US
dc.description.abstract
Els cúmuls estel·lars oberts són conjunts d'estels, lligats gravitatòriament, nascuts al mateix núvol molecular que tenen propietats similars. Aquests cúmuls són traçadors populars de la estructura del disc Galàctic, com ara els braços espirals. El segon llançament de dades de Gaia, amb més de 1300 milions d'estels, impossibilita la detecció de cúmuls a partir de mètodes tradicionals degut al gran volum del catàleg. Per això, el desenvolupament de tècniques automàtiques per aquest fi ha crescut juntament amb el volums dels catàlegs a analitzar. Hem desenvolupat una metodologia per a la cerca a cegues de cúmuls oberts al disc Galàctic. Hem utilitzat un algoritme de clustering, DBSCAN, per trobar sobredensitats en l'espai astromètric de cinc dimensions de Gaia. La implementació del mètode de clustering a un entorn de Big Data, al superordinador MareNostrum, ens permet cercar cúmuls oberts basant-nos en les seves propietats físiques. Les sobredensitats detectades s'identifiquen com a cúmuls oberts reals per mitjà d'una xarxa neuronal artificial que reconeix isòcrones en un diagrama de color-magnitud. L'automatització del procediment de detecció amb l'ús de tècniques de Big Data, ha resultat en més de 650 nous cúmuls. Aquests nous cúmul representen un terç de la població actual, i és la contribució individual més gran al catàleg. Hem pogut estimar les propietats físiques dels cúmuls com distància, edat i extinció, fent servir una xarxa neuronal artificial entrenada sobre cúmuls coneguts. Fem servir aquesta informació, juntament amb mesures de velocitat radial, per traçar l'estructura espiral actual de la nostra Galàxia associant els cúmuls oberts més joves (< 30 milions d'anys) al braç espiral on s'han format. Amb això, hem augmentat el nombre de traçadors de braços espirals, afegint 264 cúmuls joves als traçadors utilitzats tradicionalment. Això ens ha permès estimar millor els paràmetres actuals d'aquests braços. Analitzant la distribució en edat dels cúmuls dins dels braços espirals, i calculant la velocitat en la que aquests braços es mouen a partir de l'orbita dels cúmuls, hem pogut desfavorir la teoria clàssica d'ona de densitat com a mecanisme principal de formació de l'estructura espiral, trobant un comportament més transitori dels braços.
en_US
dc.format.extent
176 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Cúmuls d'estels
en_US
dc.subject
Cúmulos de estrellas
en_US
dc.subject
Clusters of stars
en_US
dc.subject
Astrometria
en_US
dc.subject
Astrometría
en_US
dc.subject
Astrometry
en_US
dc.subject
Galàxies
en_US
dc.subject
Galaxias
en_US
dc.subject
Galaxies
en_US
dc.subject
Dades massives
en_US
dc.subject
Datos masivos
en_US
dc.subject
Big data
en_US
dc.subject.other
Ciències Experimentals i Matemàtiques
en_US
dc.title
Detection, characterisation and use of open clusters in a Galactic context in a Big Data environment
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
52
en_US
dc.contributor.director
Luri Carrascoso, Xavier
dc.contributor.director
Jordi i Nebot, Carme
dc.contributor.tutor
Manrique Oliva, Albert
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess


Documents

ACG_PhD_THESIS.pdf

43.71Mb PDF

This item appears in the following Collection(s)