Highly accurate variant detection for identification of tumor mutations and mosaic variants

Autor/a

Muyas Remolar, Francesc

Director/a

Ossowski, Stephan

Guigó Serra, Roderic

Fecha de defensa

2019-12-20

Páginas

151 p.



Departamento/Instituto

Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut

Programa de doctorado

Programa de doctorat en Biomedicina

Resumen

The rapid development of high-throughput sequencing technologies pushed forward the fields of medical genomics and precision medicine, creating many new applications for diagnostics and clinical studies that require high quality data and highly accurate analysis methods. Distinguishing errors from real variants in Next Generation Sequencing data is a challenge when systematic errors, random sequencing errors, germline variants or somatic variants at very low allele frequency are present in the same data. In the first part of this thesis, we developed a genotype callability filter (ABB) able to identify systematic variant calling errors that were not found by state-of-the art methods. This tool cleans false positive calls from somatic and germline variant callsets, as well as detects false gene-disease associations in case-control studies. Secondly, we developed a set of novel methods able to distinguish and correct sequencing and PCR errors with the use of molecular barcodes, permitting us to build error rate models for the detection of somatic mutations at extremely low allele frequencies in liquid biopsies. As final part of this thesis, we characterized mosaic mutations in a multi-tissue, multi-individual study using a cohort of thousands of samples from hundreds of healthy individuals.


El ràpid desenvolupament de les tecnologies de seqüenciació d’alt rendiment ha impulsat els camps de la genòmica mèdica i la medicina d’alta precisió, creant una gran varietat de noves aplicacions, les quals requereixen dades d’una qualitat excel·lent i mètodes d’anàlisi altament precisos. La distinció entre errors i variants reals en dades de seqüenciació de propera generació (NGS) és un repte quan hi ha errors sistemàtics o aleatoris mesclats amb variants germinals o somàtiques a freqüències al·lèliques molt baixes. En la primera part d'aquesta tesi, hem desenvolupat un filtre per al genotipatge de variants (ABB) capaç d'identificar errors sistemàtics durant el procés de detecció de variants que altres mètodes convencionals no poden trobar. Aquesta eina filtra falsos positius del conjunt de variants finals en estudis de variacions somàtiques i germinals, així com també detecta falses associacions de malalties gèniques en estudis de casos-controls. En segon lloc, hem desenvolupat un conjunt de nous mètodes capaços de distingir i corregir els errors de seqüenciació i PCR amb l’ús d’identificadors moleculars. Aquests ens permeten modelar les taxes d’error i conseqüentment detectar mutacions somàtiques a freqüències al·lèliques extremadament baixes en l’anàlisi de biòpsies líquides. Per finalitzar aquesta tesi, hem caracteritzat les mutacions mosaiques en un estudi multi-teixit multi-individu utilitzant una cohort de centenars d'individus sans amb milers de mostres.

Palabras clave

Systematic error; Liquid biopsy; Unique molecular barcode; Somatic mutation; Mosaicism; Error sistemàtic; Biòpsia líquida; Codi molecular únic; Mutació somàtica; Mosaicisme

Materias

616 - Patología. Medicina clínica. Oncología

Documentos

tfmr.pdf

4.224Mb

 

Derechos

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Este ítem aparece en la(s) siguiente(s) colección(ones)