A Multivariate approach to study the genetic determinants of phenotypic traits

Author

Garrido Martín, Diego

Director

Guigó Serra, Roderic

Calvo, Miquel (Calvo Llorca)

Date of defense

2020-01-30

Pages

194 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

We have developed an efficient and reproducible pipeline for the identification of genetic variants affecting splicing (splicing quantitative trait loci or sQTLs), based on an approach that captures the intrinsically multivariate nature of this phenomenon. We employed it to study the multi-tissue transcriptome GTEx dataset, generating a comprehensive catalogue of sQTLs in the human genome. Downstream analyses of this catalogue provide novel insights into the mechanisms underlying alternative splicing regulation and its contribution to human complex traits and diseases. To facilitate the visualization of splicing events in GTEx and other large-scale RNA-seq studies, we developed a software to generate sashimi plots, which supports the aggregated representation of hundreds of samples. Given the growing interest in efficient methods to identify genetic effects on multiple traits, we extended the statistical framework employed for sQTL mapping (Anderson test) to accommodate any quantitative multivariate phenotype and experimental design. We derived the limiting distribution of the test statistic, allowing to compute asymptotic p values. We further demonstrated the advantages and applicability of our approach to GWAS and QTL mapping analyses using simulated and real datasets.


Hemos desarrollado un método computacional eficiente y reproducible, que permite la identificación de variantes genéticas que afectan al splicing (splicing quantitative trait loci o sQTLs), y que es capaz de capturar la naturaleza multivariante de este fenómeno. Lo hemos empleado para estudiar el conjunto de datos GTEx, que contiene información sobre el transcriptoma en múltiples tejidos, generando un catálogo completo de sQTLs en el genoma humano. El análisis de dicho catálogo proporciona nuevos conocimientos sobre los mecanismos que subyacen a la regulación del splicing alternativo, así como sobre su contribución a los rasgos complejos y enfermedades humanas. Con el objetivo de facilitar la visualización de eventos de splicing en GTEx y otros estudios de secuenciación de ARN a gran escala, hemos desarrollado un software para generar gráficos de tipo sashimi, que permite la representación agregada de cientos de muestras. En vista del creciente interés por métodos capaces de analizar efectos genéticos en múltiples rasgos de manera eficiente, hemos extendido el marco estadístico empleado para la identificación de sQTLs (test de Anderson) para acomodar cualquier fenotipo multivariante cuantitativo y diseño experimental. Hemos derivado la distribución límite del estadístico, lo que nos permite calcular p valores asintóticos. Además, demostramos las ventajas y la aplicabilidad de nuestro método en GWAS y análisis de QTLs, empleando conjuntos de datos tanto simulados como reales.

Keywords

Multivariate analysis; Data visualization; Alternative splicing; Quantitative trait loci; Genome-wide association studies; Análisis multivariante; Visualización de datos; Splicing alternativo; Loci de caracteres cuantitativos; Estudios de asociación del genoma completo

Subjects

575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny

Documents

tdgm.pdf

6.612Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)