Large-scale evolutionary analysis of polymorphic inversions in the human genome

Autor/a

Giner Delgado, Carla

Director/a

Cáceres Aguilar, Mario

Data de defensa

2017-12-19

ISBN

9788449077944

Pàgines

197 p.



Departament/Institut

Universitat Autònoma de Barcelona. Departament de Genètica i de Microbiologia

Resum

Les inversions cromosòmiques són variants estructurals on un fragment de genoma s'inverteix sense canviar-ne el contingut, i durant anys, els seus efectes subtils però importants han fascinat els biòlegs evolutius. De fet, les inversions van ser descobertes per primer cop fa cent anys en mosques de la fruita, i aviat es va fer evident la seva associació a processos evolutius com l'adaptació local i l'especiació. Tot i així, en el moment en què vivim de la genòmica i el big data, les inversions tendeixen a quedar fora de l'abast de les tecnologies més comunes i encara se sap poc d'elles. Durant els últims anys, el Projecte InvFEST ha tingut com a objectiu ampliar el nostre coneixement sobre les inversions humanes mitjançant la validació i genotipació d'una gran part de les inversions predites. En concret, aquest projecte ha generat un recurs molt útil format per 45 inversions comunes (d'entre 83 pb i 415 kpb) amb genotips d'alta qualitat per a un total de 550 individus de set poblacions diverses. En aquesta tesi s'utilitzen les dades poblacionals generades, junt amb les seqüències del Projecte 1000 Genomes, per a realitzar la primera anàlisi detallada de les propietats evolutives de les inversions polimòrfiques humanes. Per aconseguir-ho, s'han fet servir diferents mètodes que combinen models teòrics, simulacions i comparacions amb altres tipus de mutacions. A part d'obtenir una caracterització completa de les dades, els resultats confirmen que hi ha diferències importants entre inversions generades per diferents mecanismes. La distribució de freqüències de les 21 inversions creades per mecanismes no homòlegs (NH) és semblant a l'esperada per a variants neutres si es controlen els biaixos en la detecció, indicant que no es troben sota una forta selecció negativa. La recombinació s'inhibeix en tota la longitud de la inversió, sense que s'observi cap intercanvi de variants entre orientacions, i la inhibició podria estendre's alguna kilobase més enllà dels punts de trencament. Com a resultat, els nivells de variació genòmica es veuen força afectats per les inversions NH, tal i com prediuen les simulacions realitzades. Mentre que les inversions antigues i a freqüències intermèdies augmenten la variació nucleotídica, les inversions més recents poden crear l'efecte contrari. En canvi, la majoria de les inversions creades per recombinació homòloga no al·lèlica (NAHR) (19/24) han aparegut múltiples vegades de manera independent en diferents haplotips de la mostra. Els elevats nivells de recurrència es reflecteixen en diferents mesures: aquestes inversions estan enriquides en freqüències intermèdies, comparteixen polimorfismes nucleotídics entre orientacions, i es troben en baix desequilibri de lligament amb variants properes, dificultant-ne la seva detecció indirecta amb variants correlacionades. Finalment, per tal de trobar aquelles inversions candidates a tenir efectes funcionals, s'han explorat diverses senyals de selecció natural a partir de freqüències, diferenciació poblacional i patrons de variació nucleotídica. S'han identificat deu inversions candidates, tres d'elles de més de 1.5 milions d'anys i mantingudes a freqüències intermèdies, possiblement per selecció equilibradora, una d'elles també es troba a genomes d'hominins antics. Altres candidates sembla que han augmentat ràpidament de freqüència en algunes poblacions, que és consistent amb selecció positiva. Cal destacar que més de la meitat de candidates estan situades en regions gèniques, el qual suggereix que poden tenir un efecte funcional. Per tant, aquest treball ofereix una visió global de la dinàmica de les inversions i el seu paper com modificadors genòmics, obrint noves línies d'investigació.


Chromosomal inversions are structural variants that invert a fragment of the genome without usually modifying its content, and their subtle but powerful effects in natural populations have fascinated evolutionary biologists for a long time. Discovered a century ago in fruit flies, their association with different evolutionary processes, such as local adaptation and speciation, was soon evident in several species. However, in the current era of genomics and big data, inversions frequently escape the grasp of current technologies and remain largely overlooked in humans. During the last few years, the InvFEST Project has aimed to address the missing knowledge about human inversions by validating and genotyping a large fraction of predicted polymorphisms. In particular, it has generated one of the most useful data sets on human inversions, consisting of 45 common inversions (with sizes from 83 bp to 415 kbp) genotyped at high-quality in 550 individuals of seven populations of diverse ancestry. This thesis takes advantage of the available population-scale information, combined with whole-genome sequences available from the 1000 Genomes Project, to carry out the first detailed analysis of the evolutionary properties of human polymorphic inversions. The methods used combine theoretical models, simulations and empirical comparisons with other mutation types. Besides the complete characterization of the data set, the results confirm fundamental differences between inversions created by different mechanisms. The frequency distribution of the 21 inversions originated by non-homologous mechanisms (NH) is similar to that expected for neutral variants when controlling for detection biases, which indicates that they are not subjected to strong negative selection. Recombination is completely inhibited across the whole inversion length, with no clear genetic exchange found, and possibly over a few kbp beyond the breakpoints. As a result, NH inversions strongly affect local genome variation levels, as predicted by computer simulations, with older inversions increasing total nucleotide diversity, while younger ones at very high frequency could have the opposite effect. In contrast, most inversions created by non-allelic homologous recombination (NAHR) (19/24) have appeared independently in different haplotypes in the sample. These high recurrence levels are reflected in several measures: they are enriched in intermediate frequencies, share multiple nucleotide polymorphisms between orientations, and have little linkage disequilibrium with neighbouring variants, which limits their detection by tag SNP strategies. Finally, in order to find inversions that are functional candidates, different signatures of selection on inversions were explored based on their frequencies, population differentiation and sequence variation patterns. Ten candidates were revealed, with three of them found to be >1.5 million years old and maintained at intermediate frequencies, possibly by balancing selection. One of these was also found in archaic hominins. Other candidates seem to have reached high frequencies in a short period of time in some populations, consistent with positive selection. Notably, over half of the candidates are located within gene regions, which suggests that they may have functional effects. Thus, this work offers an overview of inversion dynamics and their role as genomic modifiers, opening interesting avenues of investigation.

Paraules clau

Genoma huma; Genoma humano; Human genome; Inversions cromosòmiques; Inversiones cromosómicas; Chromosomal inversions; Bioinformàtica evolutiva; Bioinformática evolutiva; Evolutionary bioinformatics

Matèries

575 - Genètica general. Citogenètica general. Immunogenètica. Evolució. Filogènia

Àrea de coneixement

Ciències Experimentals

Documents

cgd1de1.pdf

6.288Mb

 

Drets

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Aquest element apareix en la col·lecció o col·leccions següent(s)