Computational framework to decipher the role of spatio-temporal epigenome organization in gene transcription

Author

Tomás Daza, Laureano

Director

Javierre Martínez, Biola María

null null, null

Tutor

Casillas Viladerrams, Sònia

Date of defense

2024-10-23

Pages

194 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Bioinformàtica

Abstract

L'organització tridimensional de la cromatina exerceix un paper crucial en la regulació de l'expressió gènica. Comprendre les interaccions de llarg abast entre els promotors de gens i els elements reguladors és essencial per a entendre el control transcripcional i com la seva alteració pot conduir a malalties, incloent-hi les neoplàsies hematològiques. No obstant això, els mètodes convencionals per a estudiar les interaccions de la cromatina requereixen grans quantitats de material de partida, limitant la seva aplicació en escenaris clínics i poblacions cel·lulars rares. Per a abordar aquesta limitació, desenvolupem Low Input Capture Hi-C (liCHi-C), un mètode rendible i flexible que permet el mapatge i la comparació d'alta resolució de interactomas de promotors utilitzant tan sols 50.000 cèl·lules. Per a facilitar l'anàlisi de dades d'interacció de la cromatina, creem HiCaptuRe, un paquet de R que simplifica el processament, la integració i la visualització de dades de Capture Hi-C. Aquesta eina millora l'accessibilitat i interpretabilitat de dades complexes d'interaccions de la cromatina. Apliquem liCHi-C per a investigar l'hematopoesi humana tant normal com maligna utilitzant mostres clíniques. La nostra anàlisi va revelar que l'arquitectura dels promotors és dinàmica durant l'hematopoesi, ajudant a identificar rutes de desenvolupament i canvis transcripcionales durant el compromís cel·lular. A més, desenvolupem un atles multi-ómico de la diferenciació de cèl·lules B humanes, integrant liCHi-C amb dades d'RNA-seq, ATAC-seq i CUT\&RUN a través de múltiples etapes del desenvolupament de cèl·lules B. Aquest enfocament integrat proporciona coneixements sense precedents sobre el panorama regulador que governa el desenvolupament de les cèl·lules B. liCHi-C va demostrar ser valuós per a identificar tipus cel·lulars, gens i rutes rellevants per a malalties potencialment afectades per alteracions no codificants en elements reguladors distals. A més, vam demostrar el potencial de liCHi-C per a descobrir variants estructurals, determinar els seus punts de ruptura i inferir els seus possibles efectes patogènics. El nostre mètode optimitzat liCHi-C, juntament amb el paquet d'anàlisi HiCaptuRe i la integració multi-ómica, expandeix enormement l'exploració de l'organització tridimensional de la cromatina en poblacions cel·lulars escasses. Aquest enfocament integral ofereix noves oportunitats per a descobrir factors clau i xarxes reguladores involucrades en el desenvolupament normal i la patogènesi de malalties, particularment en el context de l'hematopoesi i la biologia de les cèl·lules B.


La organización tridimensional de la cromatina desempeña un papel crucial en la regulación de la expresión génica. Comprender las interacciones de largo alcance entre los promotores de genes y los elementos reguladores es esencial para entender el control transcripcional y cómo su alteración puede conducir a enfermedades, incluyendo las neoplasias hematológicas. Sin embargo, los métodos convencionales para estudiar las interacciones de la cromatina requieren grandes cantidades de material de partida, limitando su aplicación en escenarios clínicos y poblaciones celulares raras. Para abordar esta limitación, desarrollamos Low Input Capture Hi-C (liCHi-C), un método rentable y flexible que permite el mapeo y la comparación de alta resolución de interactomas de promotores utilizando tan solo 50.000 células. Para facilitar el análisis de datos de interacción de la cromatina, creamos HiCaptuRe, un paquete de R que simplifica el procesamiento, la integración y la visualización de datos de Capture Hi-C. Esta herramienta mejora la accesibilidad e interpretabilidad de datos complejos de interacciones de la cromatina. Aplicamos liCHi-C para investigar la hematopoyesis humana tanto normal como maligna utilizando muestras clínicas. Nuestro análisis reveló que la arquitectura de los promotores es dinámica durante la hematopoyesis, ayudando a identificar rutas de desarrollo y cambios transcripcionales durante el compromiso celular. Además, desarrollamos un atlas multi-ómico de la diferenciación de células B humanas, integrando liCHi-C con datos de RNA-seq, ATAC-seq y CUT\&RUN a través de múltiples etapas del desarrollo de células B. Este enfoque integrado proporciona conocimientos sin precedentes sobre el panorama regulatorio que gobierna el desarrollo de las células B. liCHi-C demostró ser valioso para identificar tipos celulares, genes y rutas relevantes para enfermedades potencialmente afectadas por alteraciones no codificantes en elementos reguladores distales. Además, demostramos el potencial de liCHi-C para descubrir variantes estructurales, determinar sus puntos de ruptura e inferir sus posibles efectos patogénicos. Nuestro método optimizado liCHi-C, junto con el paquete de análisis HiCaptuRe y la integración multi-ómica, expande enormemente la exploración de la organización tridimensional de la cromatina en poblaciones celulares escasas. Este enfoque integral ofrece nuevas oportunidades para descubrir factores clave y redes reguladoras involucradas en el desarrollo normal y la patogénesis de enfermedades, particularmente en el contexto de la hematopoyesis y la biología de las células B.


The three-dimensional organization of chromatin plays a crucial role in regulating gene expression. Understanding long-range interactions between gene promoters and regulatory elements is essential for comprehending transcriptional control and how its disruption can lead to diseases, including hematopoietic malignancies. However, conventional methods for studying chromatin interactions require large amounts of starting material, limiting their application to clinical scenarios and rare cell populations. To address this limitation, we developed Low Input Capture Hi-C (liCHi-C), a cost-effective and flexible method that enables high-resolution mapping and comparison of promoter interactomes using as few as 50,000 cells. To facilitate the analysis of chromatin interaction data, we created HiCaptuRe, an R package that streamlines the processing, integration, and visualization of Capture Hi-C data. This tool enhances the accessibility and interpretability of complex chromatin interaction datasets. We applied liCHi-C to investigate both normal and malignant human hematopoietic hierarchy using clinical samples. Our analysis revealed the dynamic architecture of promoters during human hematopoiesis, helping identify developmental pathways and transcriptional changes during cellular fate commitment. Furthermore, we developed a comprehensive multi-omic roadmap of human B-cell differentiation, integrating liCHi-C with RNA-seq, ATAC-seq, and CUT\&RUN data across multiple B-cell developmental stages. This integrated approach provided unprecedented insights into the regulatory landscape governing B-cell development. liCHi-C proved valuable in pinpointing disease-relevant cell types, genes, and pathways potentially affected by non-coding alterations in distal regulatory elements. Additionally, we demonstrated liCHi-C's potential in uncovering genome-wide structural variants, determining their breakpoints, and inferring their potential pathogenic effects. Our optimized liCHi-C method, coupled with the HiCaptuRe analysis package and multi-omic integration, greatly expands the exploration of 3D chromatin organization in scarce cell populations. This comprehensive approach offers new opportunities to discover key factors and regulatory networks involved in normal development and disease pathogenesis, particularly in the context of hematopoiesis and B-cell biology.

Keywords

Cromatina; Chromatin; Low input capture HI-C; Epigenètica; Epigenetics; Epigenética; Bioinformàtica; Bioinformatics; Bioinformática

Subjects

575 - General genetics. General cytogenetics. Immunogenetics. Evolution. Phylogeny

Knowledge Area

Ciències de la Salut

Documents

ltd1de1.pdf

49.18Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

This item appears in the following Collection(s)