Universitat de Girona. Departament d'Informàtica, Matemàtica Aplicada i Estadística (2013-)
Programa de Doctorat en Tecnologia
The present thesis is a compendium of three research articles produced between 2015 and 2019. The three articles are different contributions based on compositional statistical methodology and statistical inference of genetic 2/2 relatedness. In the first work of this thesis, we review the classical graphical methods used to detect relatedness and introduce the analysis of Compositional Data for relatedness research. In the second article, we propose the analysis of identity by state genotype sharing data instead of the classical identity by state allele sharing data. The third article finishes the thesis with the development of the likelihood ratio approach to infer three-quarter siblings in genetic databases. To illustrate all the results of this doctoral thesis we use genetic markers from worldwide human population projects such as the Human Genome Diversity Project and the 1000 Genomes Project, as well as from a local prospective human cohort of the Genomes of Catalonia (GCAT)
Aquesta tesi doctoral és un compendi de tres articles de recerca produïts entre el 2015-2019. Els tres articles són aportacions diferents basades en la metodologia de les dades composicionals i en la inferència estadística de relacions familiars. En el primer treball d'aquesta tesi, revisem els mètodes gràfics clàssics utilitzats per detectar relacions familiars i introduïm l'anàlisi de les dades composicionals per a la investigació de relacions familiars. En el segon, es proposa l'anàlisi de dades de genotips compartits idèntics per estat en lloc de les clàssiques dades d'al·lels compartits. El tercer article finalitza la tesi amb l'elaboració de la raó de versemblances per inferir tres quarts germans en bases de dades genètiques. Per il·lustrar els resultats, s'utilitzen marcadors genètics de projectes de població humana com el Projecte de la Diversitat del Genoma Humà, el Projecte 1000 Genomes i una cohort humana prospectiva local dels genomes de Catalunya (GCAT)
Anàlisi de dades composicionals; Análisis de datos composicionales; Compositional data analysis; Relacions familiars; Relaciones familiares; Family relationships; Parentiu; Parentesco; Relatedness; Genotips compartits; Genotipos compartidos; Genotype sharing; Raó de versemblança; Razón de verosimilitud; Likelihood ratio; Marcadors genètics; Marcadores genéticos; Genetic markers; Three quarter siblings; Inferència estadística; Inferencia estadística; Statistical inference
004 - Computer science; 311 - Statistics; 51 - Mathematics; 519.1 - Combinatorial analysis. Graph theory; 575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny