Enhancing environmental risk scores with informed machine learning and explainable AI

Author

Guimbaud, Jean-Baptiste ORCID

Director

Cabazet, Rémy

Maître, Léa

Date of defense

2024-10-11

Pages

189 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Medicina i Ciències de la Vida

Doctorate programs

Programa de Doctorat en Biomedicina

Abstract

This thesis explores the development of Environmental Risk Scores (ERSs) that go beyond traditional linear models to capture nonlinear relationships and interactions among a wide range of environmental exposures. Utilizing advanced machine learning techniques and Explainable AI, the research aims to improve the identification of factors influencing chronic diseases from childhood to adulthood. A novel approach, SEANN (Summary Effects Adapted Neural Network), integrates expert knowledge into deep learning, enhancing the robustness and generalizability of ERSs. The thesis demonstrates the effectiveness of these methods through applications on children's health and a Spanish adult cohort, showing improved prediction and alignment with established literature. Ultimately, the research underscores the potential of these advanced ERSs to discover new environmental health relationships and provide actionable insights for personalized preventive healthcare, reflecting a shift towards modifiable risk factors in the post-genetic era.


Esta tesis explora el desarrollo de Puntuaciones de Riesgo Ambiental (Environmental Risk Scores - ERS) que van más allá de los modelos lineales tradicionales para capturar relaciones no lineales e interacciones entre una amplia gama de exposiciones ambientales. Utilizando técnicas avanzadas de aprendizaje automático e inteligencia artificial explicable, la investigación busca mejorar la identificación de factores que influyen en las enfermedades crónicas desde la niñez hasta la adultez. Un enfoque novedoso, SEANN, integra el conocimiento experto en el aprendizaje profundo, mejorando la robustez y la generalización de las ERS. La tesis demuestra la efectividad de estos métodos a través de aplicaciones en la salud infantil y una cohorte de adultos españoles, mostrando una mejora en la predicción y una mayor alineación con la literatura establecida. En última instancia, la investigación destaca el potencial de estas ERS avanzadas para descubrir nuevas relaciones de salud ambiental y proporcionar información accionable para la atención preventiva personalizada, reflejando un cambio hacia factores de riesgo modificables en la era post-genética.

Keywords

Machine learning; Informed machine learning; Exposome; Environmental risk scores; Deep neural networks; Aprendizaje automático; Aprendizaje automático informado; Puntuaciones de riesgo ambiental; Redes neuronales profundas

Subjects

614 - Public health and hygiene. Pollution. Accident prevention

Documents

tjbg.pdf

8.420Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/

This item appears in the following Collection(s)