Precise photometry and photo-z s with multi narrow-band data and deep learning

Autor/a

Cabayol García, Laura

Director/a

Borstad Eriksen, Martin

Tutor/a

Delfino Reznicek, Manuel

Data de defensa

2022-09-09

Pàgines

196 p.



Programa de doctorat

Universitat Autònoma de Barcelona. Programa de Doctorat en Física

Resum

En les darreres dècades, millores tecnològiques com la potència de càlcul dels ordinadors i dels fotodetectors, han provocat un progrés sense precedents en el coneixement de l'Univers. Les exploracions sistemàtiques de l'Univers ens han permès obtenir catàlegs fotomètrics de galàxies, que són necessaris per poder calcular la distància a la qual es troben les galàxies (redshift) i poder així fer mapes de l'Univers. En l'actualitat, s'han observat de l'ordre de milions de galàxies, però en properes exploracions, com per exemple les que faran Euclid o LSST, n'observarem de l'ordre de bilions. Totes aquestes dades requeriran mètodes ràpids i acurats per a calcular la fotometria i el redshift de les galàxies. Aquesta tesi se centra en el desenvolupament d'un algoritme d'aprenentatge profund per mesurar simultàniament la fotometria i el redshift d'una galàxia. L'algoritme s'implementa directament sobre imatges astronòmiques i va d'extrem a extrem, incrementant gradualment la complexitat del procés d'extracció de dades. D'aquesta manera, hem optimitzat cada pas de la reducció d'imatges de manera independent, fet que ens ha permès aprendre els requeriments i mecanismes de les xarxes neuronals emprades. Per desenvolupar el mètode, hem utilitzat dades de l'experiment Physics of the Accelerating Universe Survey (PAUS).\\ La primera part de la tesi s'enfoca en la predicció del soroll de fons de les imatges utilitzant xarxes neuronal convolucionals. De mitjana, l'algoritme millora la fotometria de les galàxies entre un 7 i un 20%. A més a més, les nostres mesures de soroll redueixen un 35% els photo-z atípics presents en la mostra.\\ La segona part de la tesi, extenem el treball previ i desenvolupem una xarxa neuronal que mesura la distribució de probabilitat de la fotometria en cada banda fotomètrica de manera independent. La nostra fotometria duplica el senyal-soroll de les mesures de flux realitzades amb un codi existent de fotometria d'obertura. El nostre algoritme d'aprenentatge profund incorpora altres beneficis com robustesa en presència d'elements distorsionats, per exemple raigs còsmics, i menys sensitivitat a inexactituds en els paràmetres que defineixen les galàxies. Això permet reduir el nombre de galàxies amb fotometria atípica d'un 10% a un 2%, en comparació amb la fotometria d'obertura. La tesi també explora com millorar les mesures del redshift de les galàxies fotografiades amb filtres fotomètrics de banda ampla utilitzant observacions en bandes estretes. El mètode consisteix en una xarxa neuronal multitasca que prediu el redshift i la fotometria en banda estreta d'una galàxia a partir de la seva fotometria en banda ampla. La fotometria està correlacionada amb el redshift, així la xarxa neuronal pot emprar el coneixement adquirit en la predicció d'una de les quantitats per millorar l'altra. La fotometria en banda estreta no són dades d'entrada a la xarxa neuronal. D'aquesta manera, un cop entrenada la xarxa pot predir el redshift de qualsevol galàxia a partir de la seva fotometria en banda ampla sense requerir fotometria en banda estreta. Al camp ''COSMOS··, el nostre mètode prediu photo-z amb un 14% més de precisió fins a magnituds i<23 i redueix el nombre de photo-z atípics un 40%. A més, hem pogut provar en simulacions que la xarxa neuronal multitasca també redueix un 15\% la dispersió en el photo-z de galàxies amb magnitud 24<i<25. L'últim capítol mesura fotometria multibanda i el photo-z de les galàxies a partir de les imatges. Aquesta xarxa utilitza la informació disponible en totes les imatges obtingudes d'una galàxia per fer prediccions en cadascuna de les bandes. La fotometria multibanda duplica el senyal-soroll de la fotmetria banda per banda. Les prediccions del redshift són encara treball en procès i tenen encara marge de millora. Estem treballant en en entendre una tendència sistemàtica en el photo-z de galàxies brillants.


En las últimas décadas, mejoras tecnológicas como la potencia de cálculo de los ordenadores y de los fotodetectores, han generado un progreso sin precedentes en el conocimiento del Universo. Las exploraciones sistemáticas del Universo nos han permitido obtener catálogos fotométricos de galaxias, necesarios para poder calcular la distancia a la que se encuentran las galaxias (redshift) y realizar mapas del Universo. En la actualidad, se han observado del orden de millones de galaxias, pero exploraciones venideras, como por ejemplo las que harán Euclid o LSST, observaremos del orden de billones. Todos estos datos requerirán métodos rápidos y precisos para calcular la fotometría y el redshift de las galaxias.\\ Esta tesis se centra en el desarrollo de un algoritmo de aprendizaje profundo para medir simultáneamente la fotometría y el redshift de una galaxia. El algoritmo se implementa directamente sobre imágenes astronómicas y va de extremo a extremo, incrementando paulatinamente la complejidad del proceso de extracción de datos. De esta forma, hemos optimizado cada paso de la reducción de imágenes de forma independiente. Esto nos ha permitido aprender los requerimientos y mecanismos de las redes neuronales utilizadas. Para desarrollar el método, hemos utilizado datos del experimento Physics of the Accelerating Universe Survey (PAUS). La primera parte de la tesis se enfoca en la predicción del ruido de fondo de las imágenes utilizando redes neuronal convolucionales. Por término medio, el algoritmo mejora la fotometría de las galaxias entre un 7 y un 20%. Además, nuestras medidas de ruido reducen un 35% los photo-z atípicos presentes en la muestra. La segunda parte de la tesis extiende el trabajo previo y desarrollamos una red neuronal que mide la distribución de probabilidad de la fotometría en cada lado banda de forma independiente. Nuestra fotometría duplica la señal-ruido de las medidas de flujo realizadas con un código existente de fotometría de apertura. Nuestro algoritmo de aprendizaje profundo incorpora otros beneficios como robustez en presencia de elementos distorsionados, e.g. rayos cósmicos. Esto permite reducir el número de galaxias con fotometría atípica de un 10% a un 2%, en comparación con la fotometría de apertura. La tesis también explora cómo mejorar las medidas del redshift de las galaxias fotografiadas con filtros fotométricos de banda ancha utilizando observaciones en bandas estrechas. El método consiste en una red neuronal multitarea que predice el redshift y la fotometría en banda estrecha de una galaxia a partir de su fotometría en banda ancha. La fotometría está correlacionada con el redshift, así la red neuronal puede utilizar el conocimiento adquirido en la predicción de una de las cantidades para mejorar la otra. La fotometría en banda estrecha no son datos de entrada en la red neuronal. De esta forma, una vez entrenada, la red puede predecir el redshift de cualquier galaxia a partir de su fotometría en banda ancha sin requerir fotometría en banda estrecha. En el campo ''COSMOS'', nuestro método predice photo-z con un 14% más de precisión hasta magnitudes i<23 y reduce el número de photo-z atípicos un 40%. Además, hemos podido probar en simulaciones que la red neuronal multitarea también reduce un 15% la dispersión en el photo-z de galaxias con magnitud 24<i<25. El último capítulo mide fotometría multibanda y el photo-z de las galaxias a partir de las imágenes. Esta red utiliza la información disponible en todas las imágenes obtenidas de una galaxia para realizar predicciones en cada una de las bandas. La fotometría multibanda duplica la señal-ruido de la fotometría banda a banda. Las predicciones del redshift son todavía trabajo en proceso y todavía tienen margen de mejora. Estamos trabajando en entender una tendencia sistemática en el photo-z de galaxias brillantes.


In the last decades, galaxy surveys have triggered unprecedented progress in our understanding of the Universe. Better astronomical cameras or more powerful computers have enabled the collection of more and better data. Astronomical images need to be processed to turn into photometric catalogues and ultimately into photometric redshifts. Current galaxy surveys have observed the order of millions of galaxies while upcoming surveys like Euclid or LSST will increase these numbers to billions. These data will require fast and precise methods to extract the photometry and the photometric redshift. In this thesis, we have used data from the Physics of the Accelerating Universe Survey (PAUS) to develop an end-to-end deep-learning algorithm to extract the photometry and predict the photometric redshift from astronomical images. We have built the pipeline in three steps, gradually increasing the complexity of the data-reduction operation. In this step-wise approach, we have optimised each photometry process independently, learning about the data, the network requirements, and its underlying mechanisms. The first project predicts the background noise in the presence of nuisance artefacts and strongly-varying backgrounds. On average, our deep-learning background measurements improve the photometry by 7% and up to 20% at the bright end. The background measurements also reduce the photometric redshift outlier rate by 35% for the best 20% galaxies. The second project measures the probability distribution of the photometry in single-exposure images. On average, the deep-learning photometry increases the signal-to-noise of the flux measurements by a factor of two compared to an existing aperture photometry algorithm. This algorithm also incorporates other advantages such as robustness towards distorting artefacts, e.g. cosmic rays or scattered light, the ability of deblending, and less sensitivity to uncertainties in the galaxy profile parameters used to infer the photometry. This enables reducing the number of photometry outlier observations from 10% to 2%, compared to aperture photometry. The thesis also presents a novel methodology to enable better broad-band photometric redshifts using data only available for a fraction of the observations. The method consists of a multi-task neural network that predicts the photometric redshift and the PAUS narrow-band photometry. The photometry estimation is an auxiliary quantity that correlates with the redshift. This forces the network to learn a general solution capable of predicting the photometry and the redshift simultaneously. As the auxiliary data are not used as input to the network, we can evaluate the redshift of any galaxy without such data available. In the COSMOS field, we find that the method predicts photometric redshifts that are 14\% more precise down to magnitude i<23 while reducing the outlier rate by 40\% with respect to the broad-band photometric redshifts. Furthermore, for simulated data, training on a sample with i<23 the method reduces the photo-z scatter by 15% for all galaxies with 24<i<25. Finally, the last step expands the single-band photometry measurements to multi-band photometry. Using information from the full galaxy spectral energy distribution, this network predicts the photometry in each of the bands and the photometric redshift. This method duplicates the signal-to-noise ratio of the galaxy photometry with respect to the Lumos photometry. Furthermore, colour histograms indicate that multi-band photometry contains less noise that the Lumos and the MEMBA ones since the colour-histograms width is reduced by 5 and 3, respectively. The photometric redshifts are trained on simulations and adapted to the data using transfer learning. These photo-zs improves BCNz2 template-based photo-z measurements, particularly at the faint end with 25% more precise photo-z. However, we have not reached the Deepz precision. This project is still work in progress and in the near future we aim to study and improve the photo-z precision at the bright end.

Paraules clau

Astronomia; Astronomía; Astronomy; Intel·ligència artifical; Inteligencia artificial; Artificial intelligence

Matèries

52 - Astronomia. Astrofísica. Investigació espacial. Geodèsia

Àrea de coneixement

Ciències Experimentals

Documents

lcg1de1.pdf

11.39Mb

 

Drets

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Aquest element apareix en la col·lecció o col·leccions següent(s)