Universitat Politècnica de Catalunya. Departament de Ciències de la Computació
Nowadays, it is widely accepted that many of modern lifestyle habits such as diet and exercise, together with genetics, play an important role in the development of many diseases such as cardiovascular disease, diabetes, cancer, obesity and so on. Thanks to the great advances in genetics in recent years, nutritional genomic science has emerged to personalize an individual's diet based on the particular needs of each person, aiming to maintain health and prevent disease. In order to study the relationship between genes, nutrients and health, pre-post dietary intervention studies are made. By means of these studies, and after following a certain dietary pattern for a period of time, one can compare the individuals' initial health status against their final health status, and observe the different reactions. These studies have a high complexity due to several factors: i) large number of attributes; ii) attributes with different origins; iii) the relationship between food and health is complex and bidirectional: it depends on the genes, the interaction between nutrients, and on multiple external factors. This equation turns more difficult when the health condition and disease are included. Currently, there is no methodology for analyzing problems with this structure and most of the results are reduced to classical statistical tests assessing two factors. In some of these studies it has been found that not all attributes play the same role. The main idea of this thesis is to build a hybrid methodology suitable to assess the effects of a dietary intervention in these pre-post studies by means of integrating statistics with Artificial Intelligence techniques in a new Data Mining methodology. Studies of this kind, have a different structure to those problems typically dealt with by AI. The building of a model that will incorporate the complexity of such interactions, including multiple external factors, and above all, being able to detect the subtle effects that food have on our body will be highly useful, functional and valuable for nutritionists. With this idea in mind, we propose to analyze the effect of the intervention locally for each different type of individuals that are involved in the study. Integrative Multiview Clustering methodology is proposed in order to first model the types of persons that are involved in the study. The Trajectory analysis between the intervention, the initial and final state of individuals allows locally evaluating both the adherence to the intervention and the effects of the intervention in each trajectory.In this analysis, the relationships between changes in biomarker, health condition as well as gene expressions, w.r.t changes and effects in prescribed diet by the intervention are analyzed. In addition to the complexity of analyzing this kind of data, a second problem arises due to the interdisciplinarity of this study: the transmission of the result. This thesis is also focused on contributing to the automatic interpretation of results that provides new knowledge useful to support further decision making. This field of automatic interpretation has not been exploited and which, however, is crucial for the effective knowledge transfer between professionals from different disciplines such as, in this case, artificial intelligence and nutrition. The performance and applicability of this proposal is evaluated on a real data set coming from a particular pre-post study about the Mediterranean diet and olive oil effect, considering the characteristics of the persons involved, their health condition, genetic information and habits like physical exercise. Experts assessed the reliability and utility of the proposal. They outlined that the proposal is useful and finds out difficult patterns and behaviors of the individuals, regarding the intervention. The results have shown to be useful to them for analyzing the pre-post intervention studies, and for making decisions based on that analysis.
A día de hoy, ya está ampliamente aceptado que los hábitos de vida, como la dieta o el ejercicio, y la genética están estrechamente relacionados con el desarrollo de un gran número de enfermedades tales como las cardiovasculares, diabetes, cáncer o la obesidad. Gracias a los grandes avances en genética en los últimos años, la genómica nutricional ha emergido con la idea de personalizar la dieta en base a las necesidades particulares de cada persona y, así, mantener su salud y poder prevenir o retrasar ciertas enfermedades. Con el objetivo de estudiar la relación entre los genes, nutrientes y la salud, se diseñan ensayos clínicos clásicos y estudios de pre-post de intervención dietética. Por medio de estos estudios, se puede comparar el estado inicial contra el estado final de los individuos después de haber seguido un cierto patrón dietético durante un determinado periodo, observando las diferentes reacciones en éstos. Este tipo de estudios tiene una alta complejidad debido a diversos factores: i) gran número de atributos; ii) atributos con orígenes diferentes; iii) la relación entre la alimentación y la salud es compleja y bidireccional, depende de los genes, las interacciones entre los propios nutrientes y de múltiples factores externos. Esta ecuación se complica cuando se incluyen las condiciones de salud. Actualmente, no existe una metodología para analizar problemas con esta estructura. La mayoría de los resultados se reducen a pruebas estadísticas clásicas que evalúan dos factores. En algunos de estos estudios se ha encontrado que no todos los atributos juegan el mismo papel. La principal idea de esta tesis es la construcción de una metodología híbrida adecuada para evaluar el efecto de la intervención en estos estudios mediante la integración de técnicas de la Inteligencia Artificial y de la estadística en una nueva metodología de minería de datos. Los estudios de este tipo tienen una estructura diferente a los problemas típicos abordados por la AI. Nuestra propuesta es la construcción de un modelo que incorpore la complejidad de tales interacciones, incluyendo múltiples factores externos y, sobre todo, sea capaz de detectar los efectos sutiles que tienen los alimentos en nuestro cuerpo. Esta metodología es útil, funcional y valiosa para los nutricionistas. Con esta idea, nos proponemos estudiar el efecto de la intervención dietética de forma local en cada uno de los diferentes tipos de personas involucradas en el estudio. Para ello, la metodología Integrative Multiview Clustering se propone con el fin de, primero, modelar los tipos de individuos. El Análisis de Trayectorias para comparar el estado inicial y final de los individuos y, así, evaluando tanto la adhesión a la intervención como los efectos de ésta. Además de la complejidad de analizar este tipo de datos, surge un segundo problema debido a la interdisciplinaridad de este estudio: la transferencia de los resultados. Por tanto, esta tesis se centra también en contribuir a la interpretación automática de los resultados proporcionando nuevos conocimientos para dar soporte a la futura toma de decisiones Esta campo de la interpretación automática no ha sido explotado y, sin embargo, es crucial para la transferencia efectiva del conocimiento entre profesionales de diferentes disciplinas como son, en este caso, la inteligencia artificial y la nutrición- El rendimiento y la aplicabilidad de esta propuesta se ha evaluado con un datos reales provenientes de un estudio sobre el efecto de la dieta Mediterránea y del aceite de oliva, teniendo en cuenta las características de los participantes, estado de salud, información genética y sus hábitos. Los expertos han evaluado la fiabilidad y utilidad de la propuesta. Subrayan que la metodología propuesta es adecuada para el descubrimiento de difíciles patrones y comportamientos de los participantes en relación a la intervención.
004 - Informática
Àrees temàtiques de la UPC::Informàtica
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.