Development of a high-quality annotated reference genome and evolutionary genomics analysis of chromosomal inversions in Drosophila subobscura

Author

Karageorgiou, Charikleia

Director

Rodríguez-Trelles Astruga, Francisco Jose

Tarrío Fernández, Rosa Maria

Date of defense

2022-09-29

Pages

112 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Genètica

Abstract

Drosophila subobscura és una espècie del grup obscura, un dels deu grups d'espècies coneguts del subgènere Sophophora, gènere Drosophila. Originàriament endèmica de la regió paleàrtica, l'espècie va colonitzar recentment Amèrica del Nord i del Sud. El sistema d'inversions cromosòmiques de D. subobscura representa un dels models més interessants per a investigar l'evolució d'aquesta mena de rearranjaments estructurals del genoma, ja que i) mostra nivells inusualment elevats de polimorfisme; i ii) s'ha detectat que està implicat en l'adaptació de l'espècie a l'escalfament global. La falta d'un genoma de referència per a l'espècie ha suposat un obstacle important per al seu estudi. Per a superar aquesta limitació hem abordat un assemblat de novo del genoma de D. subobscura utilitzant la tecnologia de "long-reads" PacBio. Els "long-reads" sense processar de PacBio es van assemblar utilitzant l'assemblador Canu. Per a avaluar la qualitat dels "contigs" i el "scaffolding" del genoma, es va desenvolupar un protocol semiautomàtic. A continuació, els "contigs" generats per Canu obtenint-se 186 "scaffolds" amb un N50 d'aproximadament 6Mb. L'assignació cromosòmica, l'ordre i l'orientació dels "scaffolds" van donar com a resultat sis pseudocromosomes, un per cadascun dels sis cromosomes de D. subobscura. Es van predir un total de 13.939 gens codificadors de proteïnes, i es va estimar que el 13% del genoma de l'espècie consisteix en seqüències repetitives. Finalment, es van determinar i van caracteritzar els punts de trencament de les inversions fixades entre D. subobscura i D. guanche. Els resultats obtinguts indiquen que l'evolució de l'estructura del genoma en D. subobscura és una conseqüència indirecta dels efectes de supressió de la recombinació de les inversions en el manteniment de conjunts d'al·lels adaptatius enfront del flux gènic D. subobscura està experimentant actualment un ràpid reemplaçament d'inversions de latituds altes per inversions de latituds baixes associat amb l'escalfament global. No totes les inversions de latituds baixes segueixen aquesta pauta, la qual cosa suggereix que les seves freqüències no depenen només de la temperatura. Un dels exemples més ben documentats és la inversió O7, la recerca de la qual s'ha vist obstaculitzada pel desconeixement de les seqüències dels seus punts de trencament genòmic. Per a abordar aquesta limitació, generem un assemblat del genoma a escala cromosòmica a partir d'una línia isogénica O3+4+7 utilitzant tecnologia de PacBio i seguint el protocol descrit anteriorment. Per a aïllar la seqüència completa d'O7 es va utilitzar una anàlisi de conservació de sintenia amb el genoma de referència. La inversió O7 es va originar mitjançant un mecanisme complex que va implicar múltiples trencaments associats amb motius d'ADN no-B, formació d'una microinversió i reparació ectòpica en trans amb els dos cromosomes homòlegs. Les nostres troballes recolzen que els punts de trencament de la inversió O7 tenien una història de fragilitat anterior a l'origen de la inversió, incloent-hi una inserció seguida d'una transposició amb una duplicació invertida d'un gen d'immunitat de la família de les atacinas. Respecte a alteracions gèniques, la inversió O7 va reubicar el principal gen del subgrup O (foxo) de senyalització de la insulina, acostant-lo al seu regulador antagònic, la serina/treonina-proteïna quinasa B (Akt1). A més, el seu punt de trencament distal va interrompre l'evolució concertada dels dos duplicats invertits de la atacina, connectant-los a elements potenciadors de dFOXO. Aquests descobriments suggereixen que O7 exerceix efectes pleiotrópicos antagònics sobre la reproducció i la immunitat, la qual cosa aporta un marc per a comprendre la seva relació amb el canvi climàtic. Les nostres troballes tenen implicacions generals per a les teories actuals sobre els mecanismes moleculars de formació de les inversions i el paper relatiu del trencament i la reparació en la formació dels seus punts de trencament.


Drosophila subobscura es una especie del grupo obscura, uno de los diez grupos de especies conocidos del subgénero Sophophora, género Drosophila. Originariamente endémica de la región paleártica, la especie colonizó recientemente América del Norte y del Sur. El sistema de inversiones cromosómicas de D. subobscura representa uno de los modelos más interesantes para investigar la evolución de este tipo de rearreglos estructurales del genoma, ya que i) muestra niveles inusualmente elevados de polimorfismo y ii) se ha detectado que está implicado en la adaptación de la especie al calentamiento global. Sin embargo la falta de un genoma de referencia para la especie ha supuesto un obstáculo importante para su estudio. Para superar esta limitación hemos abordado un ensamblado de novo del genoma de D. subobscura utilizando la tecnología de "long-reads" PacBio. Los "long-reads" se ensamblaron utilizando el ensamblador Canu. Para evaluar la calidad de los "contigs" y el "scaffolding" del genoma, se desarrolló un protocolo semiautomático. Los "contigs" generados por Canu obteniéndose 186 "scaffolds" con un N50 de aproximadamente 6Mb. La asignación cromosómica, el orden y la orientación de los "scaffolds" dieron como resultado seis pseudocromosomas, uno por cada uno de los seis cromosomas de D. subobscura. Se predijeron un total de 13.939 genes codificadores de proteínas, y se estimó que el 13% del genoma de la especie consiste en secuencias repetitivas. Finalmente, se determinaron y caracterizaron los puntos de rotura de las inversiones fijadas entre D. subobscura y D. guanche. Los resultados obtenidos indican que la evolución de la estructura del genoma en D. subobscura es una consecuencia indirecta de los efectos de supresión de la recombinación de las inversiones en el mantenimiento de conjuntos de alelos adaptativos frente al flujo génico. D. subobscura está experimentando actualmente un rápido reemplazamiento de inversiones de latitudes altas por inversiones de latitudes bajas asociado con el calentamiento global. No todas las inversiones de latitudes bajas siguen esta pauta, lo que sugiere que sus frecuencias no dependen solo de la temperatura. Uno de los ejemplos mejor documentados es la inversión O7, cuya investigación se ha visto obstaculizada por el desconocimiento de las secuencias de sus puntos de rotura genómica. Para abordar esta limitación, generamos un ensamblado del genoma a escala cromosómica a partir de una línea isogénica O3+4+7 utilizando tecnología de PacBio. Para aislar la secuencia completa de O7 se utilizó un análisis de conservación de sintenia con el genoma de referencia. La inversión O7 se originó mediante un mecanismo complejo que implicó múltiples roturas asociadas con motivos de ADN no-B, formación de una microinversión y reparación ectópica en trans con los dos cromosomas homólogos. Nuestros hallazgos respaldan que los puntos de rotura de la inversión O7 tenían una historia de fragilidad anterior al origen de la inversión, incluyendo una inserción seguida de una transposición con una duplicación invertida de un gen de inmunidad de la familia de las atacinas. Con respecto a alteraciones génicas, la inversión O7 reubicó el principal gen del subgrupo O (foxo) de señalización de la insulina, acercándolo a su regulador antagónico, la serina/treonina-proteína quinasa B (Akt1). Además, su punto de rotura distal interrumpió la evolución concertada de los dos duplicados invertidos de la atacina, conectándolos a elementos potenciadores de dFOXO. Estos descubrimientos sugieren que O7 ejerce efectos pleiotrópicos antagónicos sobre la reproducción y la inmunidad, lo cual aporta un marco para comprender su relación con el cambio climático. Nuestros hallazgos tienen implicaciones generales para las teorías actuales sobre los mecanismos moleculares de formación de las inversiones y el papel relativo de la rotura y la reparación en la formación de sus puntos de rotura.


Drosophila subobscura belongs to the obscura species group, which is one of the known ten species groups of the subgenus Sophophora of the genus Drosophila. Originally endemic from the Palearctic region, it has recently colonized North and South America. The chromosomal inversion system of D. subobscura represents one of the most interesting models to investigate the evolution of this type of genome rearrangement, because i) it shows extremely high levels of polymorphism, exhibiting inversions of all kinds regarding length and chromosomal location; and ii) it has been identified to be involved in the species' adaptation to contemporary global climate warming. The lack of a reference genome for the species has, however, stood as a major obstacle to its study. To overcome this limitation, here we have tackled a de novo assembly of the genome of D. subobscura using PacBio long-read technology. Raw PacBio reads were assembled using the Canu assembler. A semi-automated pipeline for assessing the quality of the contigs and scaffolding the genome has been developed that combined both synteny information from previously assembled genomes of D. melanogaster and D. pseudoobscura, and published data from 560 genetic markers derived from in situ hybridization experiments and genetic linkage analyses. Canu assembled contigs were then scaffolded resulting in 186 scaffolds with a N50 of approximately 6Mb. Chromosomal assignment, ordering and orientation of the scaffolds resulted in six pseudochromosomes, one for each of the six D. subobscura chromosomes. A total of 13,939 protein-coding genes were predicted, and 13% of the species genome was found to consist of repetitive sequences. Finally, the amounts of genome rearrangement between D. subobscura, D. guanche, D. melanogaster and D. pseudoobscura was assessed. The breakpoints of the fixed inversions between D. subobscura and D. guanche were determined and characterized. Here we illustrate that genome structure evolution in D. subobscura is driven indirectly, through the inversions' recombination-suppression effects in maintaining sets of adaptive alleles together in the face of gene flow. Presently, D. subobscura is experiencing a rapid replacement of high-latitude by low-latitude inversions associated with global warming. However, not all low-latitude inversions are correlated with the secular warming trend. The mixed behavior of O7 inversion across components of the ambient temperature suggests that it is driven by selective factors other than temperature alone. Research into this question has been hindered by lacking knowledge of the genomic breakpoint sequences of the inversion. To tackle this limitation, we generated a PacBio long read-based chromosome-scale genome assembly, from an O3+4+7 isogenic line. The complete continuous sequence of O7 was isolated using synteny analysis with the reference genome. Inversion O7 was shown to stretch 9.936 Mb, containing over 1,000 annotated genes. We illustrate that inversion O7 had a complex origin, involving multiple breaks associated with non-B DNA motifs, formation of a microinversion, and ectopic repair in trans with the two homologous chromosomes. Our findings support that inversion O7 breakpoints carry a pre-inversion record of fragility, including a sequence insertion, and transposition with later inverted duplication of an Attacin immunity gene. The O7 inversion was found to have relocated the major insulin signaling forkhead box subgroup O (foxo) gene bringing it in tight linkage with its antagonistic regulatory partner serine/threonine-protein kinase B (Akt1). Further, its distal breakpoint disrupted concerted evolution of the two inverted Attacin duplicates, reattaching them to dFOXO metabolic enhancers. We suggest that O7 exerts antagonistic pleiotropic effects on reproduction and immunity, setting a framework to understand its relationship with climate change. Our findings have general implications for current theories on the molecular mechanisms of formation of inversions and the contribution of breakage versus repair in shaping inversion-breakpoint junctions.

Keywords

Adaptació; Adaptación; Adaptation; Inversions; Inversiones; Inversions; Genoma; Genome

Subjects

575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny

Knowledge Area

Ciències Experimentals

Documents

chka1de1.pdf

9.324Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/

This item appears in the following Collection(s)