Proteomic and peptidomic analyses of flower development in Arabidopsis

Autor/a

Álvarez Urdiola, Raquel

Director/a

Riechmann Fernandez, Jose Luis

Matus Picero, Jose Tomas

Tutor/a

Riechmann Fernandez, Jose Luis

Data de defensa

2023-12-14

Pàgines

326 p.



Programa de doctorat

Universitat Autònoma de Barcelona. Programa de Doctorat en Biologia i Biotecnologia Vegetal

Resum

L'inici de la formació floral i el posterior desenvolupament de les flors són paradigmes excel·lents en l'estudi del desenvolupament de plantes, ja que es regeixen per complexes xarxes de regulació. Gràcies a anàlisis genètiques extensives directes i inverses ha sigut possible identificar gens reguladors clau en aquets processos que formen part d'aquestes xarxes de regulació. Actualment, hi ha una sèrie de factors addicionals que s'estan caracteritzant a nivell del genoma gràcies a mètodes d'integració de diferents òmiques. La caracterització a nivell del genoma global es clau per a entendre, i eventualment, manipular les bases del desenvolupament i la fisiologia de les plantes. Tanmateix, la visió actual i dinàmica d'aquets processos de desenvolupament manca d'un component fonamental: el proteoma. Els mètodes actuals d'espectrometria de masses permetran explorar en profunditat la composició d'un proteoma en la seva expressió i complexitat, la seva relació amb el transcriptoma, les modificacions postraduccionals dinàmiques i, fins i tot, la seva composició general. Als últims anys s'ha posat de manifest que existeix una part substancial dels proteomes eucariotes que està composta per pèptids i proteïnes sense caracteritzar (peptidoma 'no convencional'), amb funcions encara desconegudes. Diversos repositoris públics han recogut informació sobre el transcriptoma d'Arabidopsis i la seva modulació durant el desenvolupament, descriuen també la seva plasticitat en resposta a l'ambient. En canvi, la caracterització del seu proteoma ha sigut molt menys exhaustiva. En aquest sentit, és possible integrar l'espectrometria de masses i la seqüenciació de RNA. En aquesta Tesi, el sistema d'inducció floral pAP1:AP1-GR ap1 cal ha sigut utilitzat per caracteritzar l'expressió gènica a nivell de proteoma al llarg del desenvolupament floral inicial d'Arabidopsis, i la seva correlació amb dades d'expressió del transcriptoma. S'han combinat mètodes de seqüenciació de proteïnes (LC-MS/MS) i experiments d'anotació de transcriptoma (RNA-seq) a una sèrie temporal durant els cinc dies posteriors a l'activació del programa de desenvolupament floral. Es van identificar ~9000 proteïnes i ~23000 gens, dels quals, 2037 proteïnes i 8125 gens van mostrar canvis significatius en la seva abundància. Aquets experiments han permès ampliar la mida de la col·lecció de gens coneguts per tenir canvis al seus nivells d'expressió al llarg dels estadis primerencs del desenvolupament floral; identificar parelles RNA-proteïna a les que ambdues molècules mostraven un canvi als seus nivells d'expressió similars o oposats i que estan involucrades a diferents processos, com la fotosíntesi, el metabolisme d'àcids grassos o la biosíntesi d'aminoàcids; i, gràcies a l'anàlisi combinat d'aquets nous dades de transcriptòmica i dades prèviament publicats sobre la unió d'AP1 a tot el genoma, identificar possibles dianes d'AP1 noves. Els genomes eucariotes contenen molts marcs de lectura oberts corts (sORFs) que, localitzats a diferents tipus de molècules de RNA, inclouen RNA llargs no codificants (lncRNAs), poden codificar pèptids biològicament funcionals. Part d'aquesta Tesi està enfocada a la caracterització del peptidoma floral d'Arabdopsis, fent servir els mutants homeòtics de floració apetala1, apetala2, apetala3, pistillata i agamous en comparació amb les plantes de tipus silvestre. Per identificar pèptids, es va crear una extensa base de dades que va incloure potencial pèptids codificats en sORFs (SEPs) en regions intergèniques, UTRs, RNAs "no codificants" i altres transcrits. Es van identificar 1874 pèptids, dels quals 132 van ser seleccionats com candidats per altres anàlisis (a més, es va predir que 60 d'aquets estarien expressats específicament, o almenys enriquits, en algun dels tipus d'òrgans florals). Aproximadament 25% dels nous SEPs pertanyen a una possible família gènica en Arabidopsis, i 103 té possibles homòlegs en altres especies de plantes. A més, es van trobar diferents patrons d'expressió per molts dels pèptids candidats. La majoria presentava expressió específica als estams durant el desenvolupament floral.


El inicio de la formación floral y el desarrollo de las flores son paradigmas excelentes para estudiar el desarrollo en plantas, ya que se rigen por complejas redes de regulación. Gracias a análisis genéticos extensivos directos e inversos ha sido posible identificar genes reguladores clave para estos procesos que forman partes de dichas redes de regulación. Actualmente, hay una serie de factores adicionales que se están caracterizando a nivel del genoma gracias a métodos de integración de diferentes ómicas ('multi-omics'). La caracterización de las redes de regulación a nivel del genoma global es clave para entender las bases del desarrollo y la fisiología de las plantas. Sin embargo, la visión global y dinámica del proceso de desarrollo floral carece de un componente fundamental: el proteoma. Los métodos actuales de espectrometría de masas permiten explorar en profundidad la composición de un proteoma en su expresión y complejidad, su relación con el transcriptoma e incluso sus modificaciones postraduccionales. En los últimos años se ha puesto de manifiesto que existe una parte sustancial de los proteomas eucariotas que está compuesta por péptidos y proteínas sin caracterizar (peptidoma 'no convencional'), con funciones todavía por descubrir. Diversos repositorios públicos han recogido información acerca del transcriptoma de Arabidopsis y su modulación a lo largo del desarrollo, describiendo también su plasticidad en respuesta al ambiente. En cambio, la caracterización de su proteoma ha sido menos exhaustiva. Es posible integrar la espectrometría de masas y la secuenciación de RNA. En esta Tesis, el sistema de inducción floral pAP1:AP1-GR ap1 cal se ha utilizado para caracterizar la expresión génica a nivel de proteoma a lo largo del desarrollo floral temprano de Arabidopsis, y su correlación con datos de expresión del transcriptoma. Se han combinado métodos de secuenciación de proteínas (LC-MS/MS) y experimentos para la anotación del transcriptoma (RNA-seq) siguiendo una serie temporal de los cinco días posteriores a la activación del programa de desarrollo floral. Se identificaron ~9000 proteínas y ~23000 genes, de los cuales, 2037 proteínas y 8125 genes mostraron cambios significativos de abundancia. Estos experimentos han permitido ampliar el tamaño de la colección de genes conocidos por tener cambios en sus niveles de expresión a lo largo de los estadios tempranos del desarrollo floral; identificar parejas RNA-proteína con patrones de abundancias similares u opuestos para ambas moléculas y que están involucrados en diferentes procesos, como la fotosíntesis o el metabolismo de ácidos grasos; y, gracias al análisis combinado de estos nuevos datos transcriptómicos y datos previamente publicados sobre la unión de AP1 en todo el genoma, identificar posibles dianas de AP1 nuevas. Los genomas eucariotas contienen marcos de lectura abiertos cortos (sORFs) que, localizados en diferentes tipos de moléculas de RNA, pueden codificar y producir péptidos biológicamente funcionales. Parte de esta Tesis está enfocada a la caracterización del peptidoma floral de Arabidopsis, utilizando los mutantes homeóticos de floración apetala1, apetala2, apetala3, pistillata y agamous en comparación con las plantas de tipo silvestre. Para identificar péptidos por LC-MS/MS, se creó una extensa base de datos que incluye posibles péptidos codificados en sORFs (SEPs) en regiones intergénicas, UTRs, RNAs "no codificantes", y otros transcritos. En total se identificaron 1874 péptidos hipotéticos, de los cuales 132 fueron seleccionados como candidatos para otros análisis (60 podrían estar expresados específicamente en alguno de los órganos florales). Alrededor del 25% de los 132 candidatos pertenecía a una posible familia génica en Arabidopsis, y 103 tenían homólogos en otras especies de plantas. Además, se encontraron diferentes patrones de expresión para muchos de los péptidos candidatos. La mayoría mostró expresión específica en los estambres a lo largo del desarrollo floral.


The onset of flower formation and the process of flower development are excellent paradigms for developmental studies in plants as they are governed by complex regulatory networks. Extensive forward and reverse genetic analyses have led to the identification of many key regulatory genes that form part of these networks. Additional factors are now being characterized at the genome-wide level using multi-omics integrative methods. The genome-wide characterization of regulatory networks is key to understand, and eventually manipulate, the basis of plant development and physiology. However, and despite these advances, the emergent global, dynamic view of flower developmental processes is lacking an important component: the proteome. Current mass spectrometry methods now allow exploring in depth the composition of a proteome in its expression and complexity, its relationship with the transcriptome and even its dynamic posttranslational modifications. In recent years, it has also become evident that there is a substantial and still uncharted fraction of eukaryotic proteomes that is mainly composed of small, unannotated proteins and peptides (the 'non-conventional' peptidome), with functions yet to be discovered. The Arabidopsis genome was sequenced 20 years ago. Since then, there have been plenty of public data concerning transcriptomes and their modulation throughout organ development, while also describing its plasticity in response to the environment. Conversely, the Arabidopsis proteome is far less comprehensively characterized. To fulfil this gap, a promising approach is the use of mass spectrometry methods for integrating its data with RNA sequencing. In this Thesis, the pAP1:AP1-GR ap1 cal Arabidopsis floral induction system was used to characterize genome expression at the proteome level throughout early Arabidopsis flower development, and its correlation to unbiased transcript expression data. Shotgun proteomic procedures (LC-MS/MS) and transcript profiling experiments (RNA-seq) were performed following a temporal series of five subsequent days after the activation of the flower developmental program. Almost 9,000 proteins and around 23,000 transcripts were identified, of which 2,037 proteins and 8,125 transcripts showed significant abundance changes throughout the time-course. These experiments allowed to substantially expand the size or scope of the transcriptome (i.e., collection of genes) previously known to change its expression during the early stages of flower development; to identify RNA-protein pairs in which RNA and protein showed similar (correlated) or opposite (anti-correlated) expression trajectories and that are involved in different processes, such as photosynthesis, fatty acid metabolic processes, or amino acid biosynthesis; and, through the combined analysis of this novel transcriptomic dataset and previously published AP1 genome-wide binding data (ChIP-seq), identify novel putative AP1 direct targets. Eukaryotic genomes contain many unannotated short open reading frames (sORFs) that, localized in different types of RNA molecules, including in long non-coding RNAs (lncRNAs), may encode and produce biologically functional peptides. Part of this Thesis is focused on the characterization of the Arabidopsis flower peptidome, using the floral homeotic mutants apetala1, apetala2, apetala3, pistillata, and agamous in comparison to the wild type. For peptide identification by LC-MS/MS, an extensive database of hypothetical novel Arabidopsis peptides was created. It comprised putative surf-encoded peptides (SEPs) from intergenic regions, UTRs, 'non-coding' RNAs and other transcripts. In total, 1,874 hypothetical peptides were detected by mass spectrometry, from which, 132 peptides were selected as candidates for further studies (60 of them were also predicted to be specifically expressed, or at least enriched, in one type of floral organ). Around 25% of the 132 peptide candidates belong to putative gene families in A. thaliana, and 103 have possible homologs in other plant species. In addition, different gene expression patterns for several peptide candidates were identified, with many of them showing specific expression in stamens during flower development.

Paraules clau

Proteòmica; Proteomics; Proteómica; Desenvolupament floral; Flower development; Desarrollo floral; Arabidopsis

Matèries

57 - Biologia

Àrea de coneixement

Ciències Experimentals

Documents

Aquest document conté fitxers embargats fins el dia 13-12-2025

Drets

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Aquest element apareix en la col·lecció o col·leccions següent(s)