Understanding the transcriptional landscape of non-coding genome in mammals

Author

Bogu, Gireesh K.

Director

Guigó Serra, Roderic

Marti-Renom, Marc A.,

Date of defense

2017-01-13

Pages

95 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Doctorate programs

Programa de doctorat en Biomedicina

Abstract

Widespread transcription in mammals revealed unexpected discovery of non-coding elements like long noncoding RNAs (lncRNAs) and repetitive elements. First, lncRNAs were previously identified in limited number of tissues or cell lines in mouse and the discovery of lncRNAs was still pending in many other tissues in mouse. To address this, we applied a computational pipeline that discovered 2,803 highconfidence novel lncRNAs by mapping and de novo assembling billions of RNA-Seq reads in eight tissues and a primary cell line in mouse. Further, we integrated this catalog of lncRNAs with chromatin state maps and found many regulatory lncRNAs (promoter-associated and enhancer-associated lncRNAs). Second, more than half of the human genome contains repetitive elements. However, it is not clear how they are expressed across all mammalian tissues. To address this, as a part of Genotype- Tissue Expression (GTEx) project, we profiled repetitive elements using 8,551 poly-A RNA-Seq datasets from 53 tissues across 550 individuals and found various repeat families transcribed across multiple human tissues in a tissue-specific manner. In summary, to understand the transcriptional landscape of non-coding genome, we mainly analyzed RNA-Seq datasets across many tissues in mammals and show that the non-coding elements like lncRNA and repetitive elements are not only transcribed but also tissue-specific. Together, this thesis work defines a unique collection of non-coding elements that are transcribed and tissue-specific in mammalian tissues.


Una gran parte del genoma de mamiefores se expresa en forma de ARNs y se conoce hoy en dia que una gran parte de estos transcritos son no codificantes llamados lncRNAs y que contienen elementos repetitivos. En ratones, estos han sido identificados recientemente en un número limitado de tejidos y líneas celulares. Esta tesis presenta un trabajo exhaustivo de estudio de lnRNAs en ratón en ocho tejidos y una línea celular. En este trabajo se descubrieron 2803 nuevos lncRNAs a los cuáles se les asignó una función reguladora (asociados a promotores o activadores “enhancers”) en el genoma usando datos del estado de la cromatina. Asimismo, más de la mitad del genoma humano contiene elementos repetitivos. Desafortunadamente no se conoce el patrón de expresión de estos elementos repetitivos en los tejidos mamíferos. Como miembros del proyecto GTEx (GenotypeviTissue Expression), analizamos la expresión de estos elementos repetitivos en 8,551 muestras de polyA RNA-Seq en 53 tejidos de 550 individuos. Encontramos que muchas familias de elementos repetitivos son expresadas en tejidos específicos en varios individuos, y representan una característica peculiar de la identidad de cada tejido en humanos.

Keywords

lncRNAs (Long noncoding RNAs); TEs (Transposable elements)

Subjects

575 - General genetics. General cytogenetics

Documents

tgkb.pdf

7.326Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)