Universitat Autònoma de Barcelona. Programa de Doctorat en Bioinformàtica
Les malalties cardiovasculars (CVDs) són la principal causa de mortalitat global i tenen mecanismes fisiopatològics complexos que encara no es comprenen completament. Aquesta tesi investiga les bases genètiques i moleculars de les CVDs, centrant-se en les proteïnes de coagulació com a fenotips intermedis clau. Mitjançant enfocaments genòmics i transcriptòmics complementaris, s’han identificat noves variants genètiques, vies reguladores i alteracions en l’expressió gènica associades al desenvolupament de les CVDs. També s’han explorat mecanismes comuns i relacions pleiotròpiques que expliquen com vies biològiques compartides influeixen en múltiples afeccions cardiovasculars. Aquest treball amplia la comprensió dels mecanismes biològics d’aquestes malalties. Aquesta tesi es basa en la hipòtesi que la implementació d’aquestes metodologies òmiques en la investigació de fenotips intermedis permetrà descobrir nous loci i vies relacionades amb múltiples CVDs, avançant així en la comprensió dels mecanismes compartits d’aquestes malalties. Els objectius de la investigació van ser: primer, aprofundir en el coneixement de l’arquitectura genètica complexa de les CVDs integrant dades genòmiques i transcriptòmiques, amb un enfocament en la identificació de nous mecanismes reguladors que influeixen en la susceptibilitat a les malalties; segon, explorar el paper dels fenotips intermedis en la regulació genètica i transcriptòmica de les CVDs, particularment a través de l’estudi de les proteïnes de coagulació sanguínia; i tercer, identificar mecanismes reguladors pleiotròpics que subjauen a la fisiopatologia de múltiples CVDs mitjançant el descobriment i la caracterització de loci genètics i vies de senyalització compartides. Per al primer objectiu, la integració de dades genòmiques i transcriptòmiques de consorcis com CHARGE, INVENT, MEGASTROKE, CARDIoGRAMplusC4D i GTEx ha permès una millor comprensió de l’arquitectura genètica de les CVDs. Entre els descobriments destacats hi ha quatre nous loci associats amb els nivells d’antitrombina (GCKR, BAZ1B, HP/TXNL4B, FCGRT), dos amb la proteïna S (ORM1/ORM2, MYL7) i un amb la proteïna C (GOLM2). A més, es van identificar quatre nous loci (XXYLT1, KNG1, SUGP1/MAU2, TBL2/MLXIPL) que regulen proteïnes hemostàtiques i CVDs, simultàniament. En mostres d’aneurisma aòrtic abdominal (AAA), es van detectar 3.002 gens diferencialment expressats, corregint l’efecte del temps isquèmic, dels quals 1.425 eren nous. El segon objectiu es va centrar en investigar el paper dels fenotips intermedis en el risc cardiovascular, especialment de les proteïnes de coagulació. L’anàlisi va identificar loci associats amb nivells de proteïnes anticoagulants i risc de CVDs, com SERPINC1 per al tromboembolisme venós (VTE), GCKR per a la malaltia arterial coronària (CAD) i CELSR2/BAZ1B per a la malaltia arterial perifèrica (PAD). A més, molts loci pleiotròpics identificats suggereixen mecanismes mediats per fenotips intermedis, com la coagulació o els lípids. Els gens diferencialment expressats en mostres d’AAA també s’associen a fenotips intermedis com la inflamació, la resposta immune, la regulació del calci intracel·lular i el metabolisme mitocondrial. Pel que fa al tercer objectiu, s’han identificat mecanismes reguladors específics vinculats al desenvolupament de diverses CVDs. Els resultats confirmen que els nivells de proteïna C són un factor de risc causal per a VTE i CAD. També es va identificar el locus pleiotròpic MYRF/TEMEM258/FADS1/FADS2, prèviament associat a CAD i VTE, com un factor de risc per a l’ictus isquèmic (IS). A més, vies associades amb l’AAA han estat relacionades amb el desenvolupament de CAD, VTE, IS i PAD en estudis transcriptòmics anteriors. Aquests descobriments suggereixen possibles dianes terapèutiques per a intervencions clíniques futures. En conclusió, aquesta tesi il·lustra l'eficàcia d'integrar dades genòmiques i transcriptòmiques per descobrir nous loci i loci pleiotròpics que regulen les CVDs i els seus fenotips intermedis. Els resultats proporcionen una base sòlida per a futures investigacions transnacionals, facilitant el desenvolupament d’estratègies clíniques preventives.
Las enfermedades cardiovasculares (CVDs) son la principal causa de mortalidad global y presentan mecanismos fisiopatológicos complejos que aún no se comprenden completamente. Esta tesis investiga las bases genéticas y moleculares de las CVDs, centrándose en proteínas de la coagulación como fenotipos intermedios clave. Mediante enfoques genómicos y transcriptómicos complementarios, se han identificado nuevas variantes genéticas, vías reguladoras y alteraciones en la expresión génica asociadas al desarrollo de las CVDs. También se han explorado mecanismos comunes y relaciones pleiotrópicas que explican cómo vías biológicas compartidas influyen en múltiples afecciones cardiovasculares. Este trabajo amplía la comprensión de los mecanismos biológicos de estas enfermedades. Esta tesis se basa en la hipótesis de que la implementación de estas metodologías ómicas en la investigación de fenotipos intermedios permitirá descubrir nuevos loci y vías relacionadas con múltiples CVDs, avanzando así en la comprensión de los mecanismos compartidos de estas enfermedades. Los objetivos de la investigación fueron: primero, profundizar en el conocimiento de la arquitectura genética compleja de las CVDs integrando datos genómicos y transcriptómicos, con un enfoque en la identificación de nuevos mecanismos reguladores que influyen en la susceptibilidad a las enfermedades; segundo, explorar el papel de los fenotipos intermedios en la regulación genética y transcriptómica de las CVDs, particularmente a través del estudio de las proteínas de la coagulación sanguínea; y tercero, identificar mecanismos reguladores pleiotrópicos que subyacen a la fisiopatología de múltiples CVDs mediante el descubrimiento y la caracterización de loci genéticos y vías de señalización compartidas. Para el primer objetivo, la integración de datos genómicos y transcriptómicos de consorcios como CHARGE, INVENT, MEGASTROKE, CARDIoGRAMplusC4D y GTEx ha permitido una mejor comprensión de la arquitectura genética de las CVDs. Entre los hallazgos destacados se incluyen cuatro nuevos loci asociados con niveles de antitrombina (GCKR, BAZ1B, HP/TXNL4B, FCGRT), dos con la proteína S (ORM1/ORM2, MYL7) y uno con la proteína C (GOLM2). Además, se identificaron cuatro nuevos loci (XXYLT1, KNG1, SUGP1/MAU2, TBL2/MLXIPL) que regulan proteínas hemostáticas y CVDs. En muestras de aneurisma aórtico abdominal (AAA), se detectaron 3.002 genes diferencialmente expresados, corrigiendo el efecto del tiempo isquémico, de los cuales 1.425 eran nuevos. El segundo objetivo se centró en investigar el papel de los fenotipos intermedios en el riesgo cardiovascular, especialmente de las proteínas de la coagulación. El análisis identificó loci asociados con niveles de proteínas anticoagulantes y riesgo de CVDs, como SERPINC1 para el tromboembolismo venoso (VTE), GCKR para la enfermedad arterial coronaria (CAD) y CELSR2/BAZ1B para la enfermedad arterial periférica (PAD). Además, muchos loci pleiotrópicos identificados sugieren mecanismos mediados por fenotipos intermedios, como la coagulación o los lípidos. Los genes diferencialmente expresados en muestras de AAA también se asocian a fenotipos intermedios como la inflamación, la respuesta inmune, la regulación del calcio intracelular y el metabolismo mitocondrial. En cuanto al tercer objetivo, se han identificado mecanismos reguladores específicos vinculados al desarrollo de diversas CVDs. Los resultados confirman que los niveles de proteína C son un factor de riesgo causal para VTE y CAD. También se identificó el locus pleiotrópico MYRF/TEMEM258/FADS1/FADS2, previamente asociado a CAD y VTE, como un factor de riesgo para el ictus isquémico (IS). Además, vías asociadas con el AAA han sido relacionadas con el desarrollo de CAD, VTE, IS y PAD en estudios transcriptómicos anteriores. Estos hallazgos sugieren posibles objetivos para futuras intervenciones clínicas. En conclusión, esta tesis ilustra la eficacia de integrar datos genómicos y transcriptómicos para descubrir nuevos loci y loci pleiotrópicos que regulan las CVDs y sus fenotipos intermedios. Los resultados proporcionan una base sólida para futuras investigaciones traslacionales, facilitando el desarrollo de estrategias clínicas preventivas.
Cardiovascular diseases (CVDs) are the leading cause of global mortality and involve complex pathophysiological mechanisms that are not yet fully understood. This thesis investigates the genetic and molecular basis of CVDs, focusing on coagulation proteins as key intermediate phenotypes. Through complementary genomic and transcriptomic approaches, new genetic variants, regulatory pathways, and gene expression alterations associated with CVD development have been identified. Common mechanisms and pleiotropic relationships explaining how shared biological pathways influence multiple cardiovascular conditions have also been explored. This work expands the understanding of the biological mechanisms underlying these diseases. This thesis is based on the hypothesis that implementing these omics methodologies in the study of intermediate phenotypes will enable the discovery of new loci and pathways related to multiple CVDs, thereby advancing the understanding of shared mechanisms of these diseases. The research objectives were: first, to deepen the understanding of the complex genetic architecture of CVDs by integrating genomic and transcriptomic data, with a focus on identifying new regulatory mechanisms influencing disease susceptibility; second, to explore the role of intermediate phenotypes in the genetic and transcriptomic regulation of CVDs, particularly through the study of blood coagulation proteins; and third, to identify pleiotropic regulatory mechanisms underlying the pathophysiology of multiple CVDs through the discovery and characterization of shared genetic loci and signaling pathways. For the first objective, the integration of genomic and transcriptomic data from consortia such as CHARGE, INVENT, MEGASTROKE, CARDIoGRAMplusC4D, and GTEx have improved the understanding of the genetic architecture of CVDs. Key findings include four new loci associated with antithrombin levels (GCKR, BAZ1B, HP/TXNL4B, FCGRT), two with protein S (ORM1/ORM2, MYL7), and one with protein C (GOLM2). Additionally, four new loci (XXYLT1, KNG1, SUGP1/MAU2, TBL2/MLXIPL) were identified that regulate hemostatic proteins and CVDs, simultaneously. In abdominal aortic aneurysm (AAA) samples, 3,002 differentially expressed genes were detected after correcting for ischemic time, 1,425 of which were novel. The second objective focused on investigating the role of intermediate phenotypes in cardiovascular risk, particularly coagulation proteins. The analysis identified loci associated with anticoagulant protein levels and CVD risk, such as SERPINC1 for venous thromboembolism (VTE), GCKR for coronary artery disease (CAD), and CELSR2/BAZ1B for peripheral artery disease (PAD). Furthermore, many pleiotropic loci identified suggest mechanisms mediated by intermediate phenotypes such as coagulation or lipids. Differentially expressed genes in AAA samples were also associated with intermediate phenotypes such as inflammation, immune response, intracellular calcium regulation, and mitochondrial metabolism. Regarding the third objective, specific regulatory mechanisms associated with the development of various CVDs were identified. The findings confirm that protein C levels are a causal risk factor for VTE and CAD. Additionally, the pleiotropic locus MYRF/TEMEM258/FADS1/FADS2, previously associated with CAD and VTE, was identified as a risk factor for ischemic stroke (IS). Furthermore, pathways associated with AAA have been associated with the development of CAD, VTE, IS, and PAD in previous transcriptomic studies. These findings suggest potential targets for future clinical interventions. In conclusion, this thesis demonstrates the effectiveness of integrating genomic and transcriptomic data to uncover new loci and pleiotropic loci regulating CVDs and their intermediate phenotypes. The results provide a solid foundation for future translational research, facilitating the development of preventive clinical strategies.
Genòmica; Genomics; Genómica; Transcriptòmica; Transcriptomics; Transcriptómica; Malalties cardiovasculars; Cardiovascular diseases; Enfermedades cardiovasculares
57 - Biological sciences
Ciències de la Salut