Design and application of genomic and bioinformatic tools in almond breeding

Autor/a

Pérez De los Cobos Arnao, Felipe

Director/a

Uduardo Muñoz, Iban

Batlle Caravaca, Ignacio

Tutor/a

Casacuberta i Suñer, Josep M., 1962-

Data de defensa

2023-11-24

Pàgines

137 p.



Programa de doctorat

Universitat Autònoma de Barcelona. Programa de Doctorat en Biologia i Biotecnologia Vegetal

Resum

El principal objectiu d'aquesta tesi fou el diseny i l'aplicación d'eines genòmiques i bioinformàtiques i d'altres aproximacions, aplicades a la millora genètica de l'ametller. Inicialment es va dur a terme una anàlisi de la genealogia de 220 introduccions de 9 països diferents per tal d'estudiar les tendències de la millora genètica de l'ametller en els darrers 50 anys. Els resultats detectaren dos línies principals de millora: una la línea europea, basada principalmente en les varietats 'Tuono' i 'Cristomorto', com a fundadors i la línia Californiana-Australiana, basada principalment en la varietat 'Nonpareil'. Així, l'ús freqüent d'aquetes tres varietats i el seus genotips relacionats, va donar lloc a una pèrdua de variabilitat genètica i a l'increment de la consanguinitat en la millora genètica de l'ametller. També es va trobar que l'ús de la varietat 'Tuono', com a font d'autocompatibilitat, ha estat una pràctica comuna en la majoria dels programes de millora, originant un efecte de coll d'ampolla. S'ha dut a terme un mapeig de QTL de trets qualitat de l'ametlla en una població F1 derivada de l'encreuament 'Marcona' x 'Marinada'. Tot i que que aquesta tècnica ja s'ha aplicat a la millora de l'ametller durant dècades, encara hi ha espai per a noves aproximacions i millores, tal com s'ha pogut comprovar en aquesta tesi. Així l'ús d'un ensamblatge de 60K de SNP combinat amb nous protocols bioinformàtics ha permès construir un mapa molt saturat d'elevada qualitat. També, l'elevada correlació trobada entre caràcters mesurats convencionalment i mitjançant mètodes d'analisi d'imatges i el fet que els mateixos QTLs es van trobar, indiquen la precissió del mètodes de dades d'imatge com una nova eina de fenotipat. Es varen utilizar noves eines i protocols tals com els d'analisis d'imatges i la seva transformació en dades Ismean. Una altra innovació important desenvolupada en el capítol 2, va ser l'ús de dades Ismean en lloc de dades fenotípiques sense processar. Aquesta és una aproximació principal en altres anàlisis de dades caràcter-loci tal com GWAS, però que mai s'havia aplicat en mapeig de QTL. Finalment, els QTLs referits en aquest treball, permetran la implementació d'estratègies eficients SAM aplicades als caràcters de qualitat de de l'ametlla. D'altra banda, es va realitzar una anàlisi d'estructura genètica i dades no aditives GWAS en un grup de diferents introduccions de 20 països. Els resultats argumenten la subdivisió d'aquestes introduccions en cinc grups ancestrals. Cada grup està format per introduccions amb un origen geogràfic comú, d'acord amb les evidències arqueològiques i històriques que separen l'ametller en cinc etapes l'Asiàtica, la Mediterrania, la Californiàna i la de l'hemisferi sud. A través d'una anàlisi d'homozigositat, es van detectar nivells baixos de consanguinitat en la majoria d'introduccions estudiades. En canvi, es van detectar alts nivells de consanguinitat en varietats millorades, d'acord amb els resultats obtinguts en l'anàlisi de genealogia, on es va poder concloure, que les pràctiques de millora poden augmentar la consanguinitat en l'ametller. També es van trobar senyals de domesticació als cromosomes, un, quatre i cinc. Entre els 13 QTLs detectats únicament un mostrava efectes additius. Això indica que els efectes no additius poden ser la font primària de les interaccions genotip per fenotip en l'ametller i d'altres espècies de Prunus. Finalment, l'ús de GCN de presseguer desenvolupades en aquesta tesi, permetrà proposar quatre gens candidats pels principals QTLs mapats. Finalment, es va crear una nova eina per predir la funció de gens que pot utilizar qualsevol millorador o investigador de Prunus. Per això, es varen construir quatre GNCs a partir de dades de RNA-Seq disponibles públicament, i es va avaluar el comportament de cada GNC i finalment es varen validar les GNCs amb el millor rendiment.


El principal objetivo de esta tesis ha sido el diseño y aplicación de herramientas y enfoques genómicos y bioinformáticos aplicados en la mejora genética del almendro. Por ello, realizamos un análisis de pedigrí de 220 accesiones de 9 países con el objetivo de estudiar las tendencias de mejora durante los últimos 50 años. Nuestros resultados detectaron dos líneas genéticas principales a nivel mundial: una línea europea, basada principalmente en 'Tuono' y 'Cristomorto' como fundadores y la línea californiana-australiana, basada principalmente en 'Nonpareil'. De hecho, el uso repetido de estos tres fundadores y sus genotipos relacionados resultó en una pérdida de variabilidad genética y un aumento de la endogamia en el almendro. Además, descubrimos que el uso de la variedad 'Tuono' como fuente de autocompatibilidad ha sido una práctica común en la mayoría de los programas de mejoramiento, creando un efecto de cuello de botella. También realizamos un mapeo de QTL de rasgos de calidad del grano en una población F1 proveniente del cruce 'Marcona' x 'Marinada'. Aunque esta técnica se ha aplicado en el mejoramiento del almendro durante décadas, todavía hay espacio para nuevos enfoques y mejoras, como se ha demostrado en esta tesis. El uso de la matriz de 60 mil SNPs combinada con protocolos bioinformáticos novedosos nos permitió construir un mapa de ligamiento altamente saturado y de alta calidad. Además, la alta correlación encontrada entre los caracteres medidos con métodos convencionales y de análisis de imágenes y el hecho de que se encontraran los mismos QTL indica la precisión de los métodos de análisis de imágenes como una nueva herramienta de fenotipado. Utilizamos nuevas herramientas y protocolos como el análisis de imágenes y la transformación de datos fenotípicos a datos medios. Otra innovación importante llevada a cabo en el capítulo 2 fue el uso de datos modelados en lugar de datos fenotípicos sin procesar. Este es un enfoque que ya es común en otros carácter-loci análisis como GWAS, pero que nunca antes se había aplicado en el mapeo de QTL. Finalmente, los QTL reportados aquí permitirán la implementación de estrategias de SAM eficientes aplicadas a los caracteres de calidad de la pepita. Además, llevamos a cabo un análisis de estructura genética y GWAS no aditivo en un conjunto de diferentes accesiones de almendras de 20 países. Nuestros resultados apoyaron firmemente la subdivisión de estas accesiones en cinco grupos ancestrales. Cada grupo estuvo formado por accesiones con un origen geográfico común, coincidiendo con la evidencia arqueológica e histórica que separa la diseminación del almendro en cuatro fases: asiática, mediterránea, californiana y hemisferio sur. A través de un análisis de homocigosidad, detectamos bajos niveles de endogamia en la mayoría de las accesiones bajo estudio. Sin embargo, se detectaron altos niveles de endogamia en algunas variedades provenientes de programas de mejora, lo que coincide con los resultados encontrados en nuestro análisis de pedigrí, donde concluimos que las prácticas de mejoramiento podrían estar aumentando la endogamia en el almendro. Además, se detectaron señales de domesticación en los cromosomas uno, cuatro y cinco. Entre los 13 QTL detectados, sólo uno tuvo un efecto aditivo. Esto indica que los efectos no aditivos podrían ser la principal fuente de interacciones genotipo-fenotipo en almendros y otras especies de Prunus. Finalmente, el uso de la PeachGCN, desarrollada en esta tesis, nos permitió proponer cuatro genes candidatos para los principales QTL mapeados. Finalmente, creamos una nueva herramienta para predecir la función genética que puede ser utilizada por cualquier mejorador o investigador de Prunus. Para ello, construimos cuatro GCN a partir de datos de RNA-Seq disponibles públicamente, evaluamos el rendimiento de cada GCN y, finalmente, validamos la GCN con el mejor rendimiento.


The main objective of this thesis was the designing and application of genomic and bioinformatic tools and approaches applied in almond breeding. We performed a pedigree analysis of 220 accessions from 9 countries with the objective of study breeding tendencies in the last 50 years of almond breeding. Our results detected two worldwide mainstream breeding lines: one European line, based mainly in 'Tuono' and 'Cristomorto' as founders and the Californian-Australian line, based primarily in 'Nonpareil'. Indeed, the repeated use of these three founders and their related genotypes resulted in a loss of genetic variability and an increase of inbreeding in almond breeding. Additionally, we found out that the use of the cultivar 'Tuono' as a source of self-compatibility has been a common practice in most breeding programs, creating a bottleneck effect. We also performed a QTL mapping of kernel quality traits in a F1 population coming from the cross 'Marcona' x 'Marinada'. Even if this technique have been applied in almond breeding for decades, there is still room for new approaches and improvements, as it has been proved in this thesis. The use of the almond 60K SNP array combined with novel bioinformatic protocols allowed us to build a high quality and highly saturated linkage map. Additionally, the high correlation found between traits measured with conventional and image analysis methods and the fact that the same QTLs were found indicating the accuracy of image data methods as a new phenotyping tool. We used new tools and protocols such as image analysis and the phenotypic data transformation to lsmean data. Another important innovation carried out in chapter 2 was the use of lsmean data instead of raw phenotypic data. This is an approach already mainstream in other trait-loci analyses such as GWAS, but never applied in QTL mapping before. Finally, the QTLs reported here, will allow the implementation of efficient MAS strategies applied to kernel quality traits. Additionally, we carried out a genetic structure analysis and non-additive GWAS in a set of different almond accessions from 20 countries. Our results strongly supported the subdivision of these accessions into five ancestral groups. Each group was formed by accessions with a common geographical origin, agreeing with the archaeological and historical evidence that separate almond dissemination into four phases: Asiatic, Mediterranean, Californian and southern hemisphere. Through a homozygosity analysis, we detected low levels of inbreeding in most of the accessions under study. However, high levels of inbreeding were detected in some breeding cultivars, agreeing with the results found in our pedigree analysis, where we concluded that breeding practices could be increasing inbreeding in almond. Also, signals of domestication were detected in chromosomes one, four and five. Among the 13 QTLs detected, only one had an additive effect. This indicated that non-additive effects could be the main source of genotype-phenotype interactions in almond and other Prunus species. Finally, the use of the peachGCN, developed in this thesis, allowed us to propose four candidate genes for the main QTLs mapped. Finally, we created a new tool for predicting gene function that can be used for any Prunus breeder or researcher. For that, we constructed four GCNs from publicly available RNA-Seq data, we evaluated the performance of every GCN and finally, we validated the GCN with the best performance. To validate the performance of the GCN, we selected two well-characterized genes responsible for fruit flesh softening in peach, the endopolygalacturonases PpPG21 and PpPG22. The Melting Flesh (MF) subnetwork, constituted by the genes coexpressing with PpPG21 and PpPG22, was mainly formed by genes involved in cell wall organization and biogenesis, with expression regulated by ripening-related phytohormones such as ethylene, auxin and

Paraules clau

Ametlle; Almond; Almendro

Matèries

633 - Cultius i produccions

Àrea de coneixement

Ciències Experimentals

Documents

fpdlca1de1.pdf

5.700Mb

 

Drets

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Aquest element apareix en la col·lecció o col·leccions següent(s)