Universitat Autònoma de Barcelona. Programa de Doctorat en Biologia i Biotecnologia Vegetal
La regulació de l'expressió gènica a eucariotes és un procés complexa amb diversos tipus de regulació que se solapen, el que fa possible el desenvolupament d'estructures corporals sofisticades i la ràpida resposta a canvis mediambientals. En ser immòbils, les plantes requereixen exercir un control precís de l'expressió de gens codificants, i de coordinar les transicions en el seu desenvolupament amb els estímuls del medi. Davant de tal complexitat, el paper dels factors de transcripció en la modulació de l'activitat de la polimerasa d'ARN II és insuficient, per tant, s'ha de tenir en consideració la presència addicional de mecanismes no-codificants i epigenètics tals com ARN no-codificants, l'accessibilitat de la cromatina, la metilació de l'ADN, i les modificacions d'histones. Recentment, aquests processos han estat objecte d'estudi extensiu en plantes. Tot i això, allò que sabem del paper de la transcripció no codificant i de la seva importància encara roman incomplet. Per tal de contribuir al coneixement en aquest camp, en aquest treball de tesis he implementat mètodes que permeten l'estudi de la dinàmica de la transcripció no-codificant i de l'accessibilitat de la cromatina durant el desenvolupament, fent servir com a model d'estudi la transició de llavor a plàntula en l'espècie Arabidopsis thaliana. Fent ús de tècniques d'alta sensibilitat com són el "capped-small RNA sequencing (csRNA-seq)" i l'"Assay for Transposase-Accessible Chromatin with sequencing (ATAC-seq)", he aconseguit demostrar que la transcripció no-codificant és més prevalent del que s'estimava amb anterioritat. A més he aconseguit associar i validar experimentalment canvis en la transcripció de gens codificants a regions reguladores de tipus "enhancer" transcripcional, les quals mostren evidència de transcripció no-codificant, exposant així una característica de la regulació transcripcional en plantes que abans es pensava era exclusiva de metazous. Els mètodes aplicats en aquest treball m'han permès identificar milers de potencials enhancers transcripcionals a Arabidopsis. No obstant això, el mostreig de teixits complets, que contenen diversos tipus cel·lulars, limita la capacitat d'entendre la regulació mediada per enhancers a nivell espacial, temporal, o a cèl·lules individuals. Per superar aquesta limitació, he explorat la possibilitat d'integrar dades de csRNA-seq amb mètodes de detecció d'ARN a escala de cèl·lules individuals. Fent servir dades de csRNA-seq d'arrel d'Arabidopsis, i comparant-les amb dades públiques d'expressió d'ARN i d'accessibilitat de cromatina a escala de nuclis individuals ("single-nucleus Multiome,snMultiome"; exploració simultània d'ARN i d'accessibilitat de cromatina), he aconseguit demostrar que el gen EXTENSIN3 i el seu putatiu enhancer són actius i co-accessibles específicament a cèl·lules de tricoblasts, demostrant d'aquesta manera una potencial regulació específica d'aquest gen únicament en aquest tipus cel·lular. Finalment, l'ús intensiu del mètode ATAC-seq m'ha dut a crear una eina especialitzada pel control de qualitat i filtratge de lectures de seqüències alineades, ja que els mètodes disponibles són ineficients i no consideren característiques específiques d'espècies vegetals. Aquesta nova eina "quaqc: Quick ATAC-seq Quality Control" és més ràpida, utilitza menys recursos, i és capaç de processar dades provinents de plantes i d'altres organismes sense necessitat de fer ajustos addicionals. El mètode va acompanyat d'un paquet de R per a l'ús interactiu i la possibilitat de representar dades de control de qualitat, cosa que permet provar ràpidament i iterativament l'efecte de paràmetres de filtratge específics sobre la qualitat de les dades obtingudes. En els últims anys, l'aplicació a plantes de tècniques moleculars avançades com ho són les emprades en el present treball han permès que el nostre coneixement de la regulació de l'expressió gènica s'acosti als nivells als quals s'ha arribat en metazous. La continuïtat de l'aplicació d'aquest tipus de tecnologies portarà les bases fundacionals necessàries per a aconseguir el control precís de l'expressió gènica a espècies vegetals d'interès agronòmic.
La regulación de la expresión génica en eucariotas es un proceso complejo con múltiples modos de regulación solapantes, haciendo posible el desarrollo de sofisticadas estructuras corporales y la ágil respuesta a cambios medioambientales. Al ser sésiles, las plantas necesitan ejercer un preciso control de la expresión de sus genes codificantes de proteínas, coordinando sus transiciones de desarrollo con los estímulos del medio. Frente a esta complejidad, la función de factores de transcripción en la modulación actividad de la polimerasa de ARN II resulta insuficiente, por eso deben considerarse además los mecanismos no-codificantes y epigenéticos como son los ARNs no-codificantes, la accesibilidad de la cromatina, la metilación del ADN, y las modificaciones de histonas. Estos procesos han sido estudiados extensivamente en plantas en años recientes. Sin embargo, nuestro entendimiento del rol y el alcance de la transcripción no-codificante permance ampliamente incompleto. Para avanzar en esta área, en este trabajo de tesis he implementado métodos que permiten estudiar la dinámica de la transcripción no-codificante y la accesibilidad de la cromatina en el transcurso del desarrollo, utilizando como modelo la transición de semilla a plántula en la especie Arabidopsis thaliana. Utilizando técnicas altamente sensibles como son el “capped-small RNA sequencing (csRNA-seq)” y el “Assay for Transposase-Accessible Chromatin with sequencing (ATAC-seq)”, he podido revelar que la importancia de la transcripción no-codificante es más prevalente de lo que se estimaba. Es más, he logrado asociar y validar experimentalmente cambios en la transcripción de genes codificante con regiones regulatorias del tipo “enhnacers” transcripcionales, las cuales muestran evidencia de transcripción no-codificante, confirmando así una característica de la regulación transcripcional de plantas que antes se pensaba exclusiva de metazoos. Los métodos aplicados en este trabajo me han permitido identificar miles de potenciales enhancers transcripcionales en Arabidopsis. Sin embargo, el muestreo de tejidos enteros, conteniendo mezclas de múltiples células, limita la capacidad de entender la regulación mediada por enhancers a nivel espacial, temporal, o de células individuales. Para sobrellevar este límite, he explorado la posibilidad de integrar datos de csRNA-seq con métodos que detectan ARNs a nivel de células individuales. Utilizando datos de csRNA-seq generados en raíces de Arabidopsis, y comparándolos con datos publicados de expresión de ARNs y accesibilidad de cromatina a nivel de núcleos individuales (“single-nucleus Multiome,snMultiome”; exploración simultánea de ARN y accesibilidad de cromatina), he logrado demostrar que el gen EXTENSIN3 y su putativo enhancer son activos y co-accesibles específicamente en células de tricoblastos, revelando así una potencial regulación específica de este gen sólo en este tipo de células. Finalmente, el uso intensivo del método ATAC-seq me ha motivado a crear una herramienta especializada para el control de calidad y filtrado de lecturas de secuencias alineadas, ya que los métodos disponibles son ineficientes y no tienen en cuenta características específicas de especies vegetales. Esta nueva herramienta “quaqc: Quick ATAC-seq Quality Control” es más rápida, requiere menos memoria, y puede procesar datos provenientes de plantas o de otros organismos sin necesidad de ajustes adicionales. El método va acompañado de un paquete de R para el uso interactivo y la posibilidad de graficar datos de control de calidad, permitiendo el testeo rápido e iterativo de los efectos de parámetros de filtrado específicos en la calidad de los datos obtenidos. En años recientes, la aplicación en plantas de técnicas moleculares avanzadas como las utilizadas en el presente trabajo ha permitido que nuestro conocimiento de la regulación de la expresión génica se aproxime a los niveles alcanzados en metazoos. La continuidad de la aplicación de este tipo de tecnologías brindará las bases fundacionales para la lograr el preciso control de la expresión génica en especies vegetales de interés agronómico.
Eukaryotic gene transcription is a highly complex process with multiple overlapping modes of regulation, which has allowed for the development of highly varied body plans and flexibility in responding to changes in the environment. Plants, as sessile organisms, are especially under pressure to properly regulate transcription of their protein coding genes to time developmental transitions in coordination with environmental cues. As a result, the classical model of transcriptional regulation where transcription factors bind the promoters of genes to influence the activity of RNA polymerase II is insufficient, and consistently fails to wholly explain transcription dynamics. To better understand this process, additional layers of regulation must also be considered, including a host of non-coding and epigenetic mechanisms such as non-coding RNAs, chromatin accessibility, DNA methylation, and histone methylation. In recent years these processes have been extensively studied in plants, though our understanding of them remains largely incomplete, such as with regards to the role and extent of non-coding transcription in regulating protein coding gene expression. To further our understanding in this area, I comprehensively profiled non-coding transcription and chromatin accessibility dynamics during the seed-to-seedling transition of the plant Arabidopsis thaliana as a model system. Using highly sensitive molecular techniques such as capped-small RNA sequencing (csRNA-seq) and Assay for Transposase-Accessible Chromatin with sequencing (ATAC-seq), I revealed that the extent of non-coding transcription during this transition is an order of magnitude more prevalent than previously known. Additionally, many changes in protein coding transcription were associated with nearby regions showing evidence of non-coding RNA transcription and changes in chromatin accessibility, which were successfully experimentally validated. These regulatory regions likely serve as enhancers of protein coding expression, confirming a feature of plant transcriptional regulation that once was believed to be unique to metazoans. While this approach successfully identified thousands of potential active regulatory regions in Arabidopsis thaliana, the sampling of bulk tissues limits our understanding of the cell type-specific spatiotemporal regulation of plant genes by enhancers. To solve this limitation, I performed an in-depth exploration of the csRNA-seq method for the detection of transcriptionally active enhancers in plants and integrated it with single cell methods. Using Arabidopsis thaliana roots as a model system, I analyzed optimal parameters for detecting genome-wide non-coding transcription and matched the resulting data with a published single-nucleus Multiome (snMultiome; profiling both RNA and chromatin accessibility simultaneously) dataset of root tips. Starting from root-enriched pairs of associated non-coding regulatory elements and protein coding genes identified from csRNA-seq data, I showed that the extensin gene EXTENSIN3 and an associated upstream enhancer are specifically co-accessible in trichoblast cells, revealing a potential cell type-specific mode of regulation for this gene. Finally, my use of ATAC-seq data motivated me to create a specialized tool for quality control and filtering of aligned reads, as currently available solutions are computationally inefficient and do not account for plant-specific differences in the data. This tool, quaqc: Quick ATAC-seq Quality Control, is several times faster and requires much less memory than the current next best solution. It also natively handles both plant and non-plant data without needing to perform additional manipulations to the former. An accompanying R package provides functions for interactive use and plotting of quality control data, allowing for fast iterative testing of the effects of specific filtering parameters on data quality. In recent years the application of advanced molecular techniques in plants such as those presented in this thesis and by others have brought our understanding of gene regulation in plants closer to the level achieved in metazoans. Further application of these methods will provide the foundation for the successful engineering of gene expression in agronomically important plants.
Epigenètica; Epigenetics; Epigenética; Regulació transcripcional; Transcriptional regulation; Regulación transcripcional; Desenvolupament de les plantes; Plant development; Desarrollo en plantas
57 - Biological sciences
Ciències Experimentals
ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.