Detection of selection signals on regulatory units across human cancers

Author

Rodríguez Galindo, Miguel ORCID

Director

Weghorn, Donate ORCID

Date of defense

2023-11-13

Pages

345 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Medicina i Ciències de la Vida

Doctorate programs

Programa de Doctorat en Biomedicina

Abstract

Tumor progression is dominated by two evolutionary forces: first mutagenesis, which provides the heritable variability where, secondly, natural selection acts. The main challenge of cancer genomics is to identify the somatic mutations that drive the tumorigenesis, the drivers, from the vast majority of neutral variation, the passengers. A decade of careful surveying of tumor DNA has revealed a multitude of protein-coding drivers, several of which have been used as therapeutic targets. However, many tumors do not exhibit any of these known exonic driver events, leaving a gap in our knowledge. Recently, large efforts have been made querying the remaining non-coding part of the genome. Intriguingly, the role of non-coding somatic mutations still remains largely less well understood than its protein-coding counterpart. These regions are specially challenging: poorly annotated, dominated by abnormal mutational processes that act as confounders, and with a broader mutational target than coding regions. To address these specific challenges, I developed an approach that identifies selection in regulatory regions. Regulatory units are tested as a whole to increase the statistical power, and the impact of mutations is evaluated through biophysical models for transcription factor binding sites. Finally, a mutational model accounts for mutation rate variability at several scales. With this approach I find known and new putative cancer drivers on a harmonized cohort of 7586 whole cancer genomes and conclude that non-coding selection is ubiquitous in cancer evolution.


L'evolució dels tumors està dominada per dues forces evolutives: la primera és la mutagènesi, que proveeix la variabilitat heretable on, segon, actua la selecció natural. El principal repte de la genòmica del càncer és identificar i separar les mutacions somàtiques que impulsen la progressió tumoral, les mutacions drivers, de l'immensa variació neutra que resta, les mutacions passengers. Una dècada d'escrutini de l'ADN tumoral ha revelat multitud de mutacions drivers a gens codificants de protenes i moltes d'elles s'han utilitzat com a diana terapèutica. D'altra banda, molts tumors no mostren cap d'aquestes mutacions als exons i, per tant, ens indica una llacuna del nostre coneixement. Més recentment, hi ha hagut grans esforços per avaluar la porció no codificant de proteïnes del genoma humà, però curiosament el paper de les mutacions en regions no codificants encara és desconegut comparat amb les codificants. Aquestes regions són especialment complicades: es troben poc anotades, dominades per processos mutacionals anormals que confonen les metodologies i són una diana mutacional molt més extensa que les regions codificants.\newline Per superar aquestes dificultats, he desenvolupat una metodologia que busca senyals selecció a regions reguladores. Les unitats reguladores són escanejades conjuntament per incrementar el poder estadístic i l'impacte de les mutacions s'avalua mitjançant un model biofísic per llocs d'unió a l'ADN de factors de transcripció. Per acabar, un model mutacional té en compte la variabilitat en la taxa de mutació a diferents escales. Amb aquesta aproximació hem trobat senyals de selecció relacionades amb gens drivers, tant coneguts com nous, en un grup de fins a 7586 genomes complets de càncer. La conclusió que se n'extreu és que la selecció en regions no codificants és ubíqua en l'evolució tumoral.

Keywords

Selection inference; Somatic evolution; Mutational processes; Cancer; Tumor; Non-coding selection; Somatic variants; Càncer; Genòmica; Inferencia de selecció; Evolució somàtica; Processos mutacionals; Tumors

Subjects

575 - General genetics. General cytogenetics

Documents

This document contains embargoed files until 2025-11-13

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)