Computational approaches and resources to support translational research in human diseases

Author

Piñero González, Janet

Director

Furlong, Laura I.

Date of defense

2015-12-17

Legal Deposit

B 29982-2015

Pages

171 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

In the last two decades, the volume and variety of biomedical data has dramatically increased. The data is heterogeneous and scattered across many resources. This produces bottlenecks in the analysis and extraction of knowledge from this sea of information. To overcome this hurdle, better catalogs that integrate different data types, offer easy access to users, and support automatic workflows, are needed. With this in mind, we have developed DisGeNET, a discovery platform that contains information on more than 17,000 genes related to over 14,000 diseases. We have used DisGeNET to study the properties of disease genes in the context of protein interaction networks. To produce an accurate analysis of the mesoscale properties of the human interactome, we first compared the network partitions generated by two popular clustering algorithms, to assess how this would impact the follow-up biological analysis. Using the best performing algorithm we then explored the network properties of disease genes. Then we evaluated the relationship between the network properties of different groups of disease genes and their tolerance to likely deleterious germline variants across human populations. Finally, we have developed a new network medicine approach to study disease comorbidities, and applied it to the analysis of COPD comorbidities.


Los avances tecnológicos de las últimas dos décadas han producido un incremento dramático en la cantidad y la diversidad de datos biomédicos disponibles. Este proceso ha ocurrido de manera fragmentada, y en consecuencia los datos se encuentran almacenados en distintos repositorios, lo cual impone barreras a la hora de integrarlos, analizarlos y extraer conocimiento a partir de ellos. Para superar estas barreras, es necesario contar con recursos computacionales que integren esta información, y ofrezcan un fácil acceso a la misma, permitiendo al mismo tiempo su análisis automatizado. En respuesta a esta necesidad hemos desarrollado DisGeNET, una plataforma orientada a la exploración de las causas genéticas de las enfermedades humanas, que contiene actualmente información sobre más de 14.000 enfermedades y 17.000 genes. En esta tesis, describimos el uso de DisGeNET para el estudio de las propiedades de los genes asociados a enfermedades en el contexto de redes de interacción entre proteínas. Para ello, evaluamos previamente cómo la utilización de distintos algoritmos de reconocimiento de comunidades en redes afecta a los resultados de los análisis e influencia su interpretación biológica. A continuación, caracterizamos las propiedades de redes de los genes asociados a enfermedades como conjunto y también en sub-grupos, empleando diferentes criterios de clasificaciones de las enfermedades. Posteriormente, evaluamos cómo estas propiedades están relacionadas con la tolerancia a mutaciones posiblemente deletéreas en distintos grupos de genes, mediante el análisis de datos generados por las nuevas tecnologías de secuenciación. Finalmente, desarrollamos una nueva metodología de medicina de sistemas para explorar los mecanismos moleculares de la comorbilidades, y la aplicamos al estudio de las comorbilidades de la enfermedad pulmonar obstructiva crónica

Keywords

Bioinformàtica; Genètica; Bases de dades; Genòmica; Bioinformatics; Genetics; Enfermedades; Base de datos; Genómica; Malalties

Subjects

575 - General genetics. General cytogenetics

Documents

tjpg.pdf

3.446Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)