Highly accurate variant detection for identification of tumor mutations and mosaic variants

dc.contributor
Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
dc.contributor.author
Muyas Remolar, Francesc
dc.date.accessioned
2020-01-21T16:48:56Z
dc.date.available
2021-12-20T00:00:22Z
dc.date.issued
2019-12-20
dc.identifier.uri
http://hdl.handle.net/10803/668325
dc.description.abstract
The rapid development of high-throughput sequencing technologies pushed forward the fields of medical genomics and precision medicine, creating many new applications for diagnostics and clinical studies that require high quality data and highly accurate analysis methods. Distinguishing errors from real variants in Next Generation Sequencing data is a challenge when systematic errors, random sequencing errors, germline variants or somatic variants at very low allele frequency are present in the same data. In the first part of this thesis, we developed a genotype callability filter (ABB) able to identify systematic variant calling errors that were not found by state-of-the art methods. This tool cleans false positive calls from somatic and germline variant callsets, as well as detects false gene-disease associations in case-control studies. Secondly, we developed a set of novel methods able to distinguish and correct sequencing and PCR errors with the use of molecular barcodes, permitting us to build error rate models for the detection of somatic mutations at extremely low allele frequencies in liquid biopsies. As final part of this thesis, we characterized mosaic mutations in a multi-tissue, multi-individual study using a cohort of thousands of samples from hundreds of healthy individuals.
en_US
dc.description.abstract
El ràpid desenvolupament de les tecnologies de seqüenciació d’alt rendiment ha impulsat els camps de la genòmica mèdica i la medicina d’alta precisió, creant una gran varietat de noves aplicacions, les quals requereixen dades d’una qualitat excel·lent i mètodes d’anàlisi altament precisos. La distinció entre errors i variants reals en dades de seqüenciació de propera generació (NGS) és un repte quan hi ha errors sistemàtics o aleatoris mesclats amb variants germinals o somàtiques a freqüències al·lèliques molt baixes. En la primera part d'aquesta tesi, hem desenvolupat un filtre per al genotipatge de variants (ABB) capaç d'identificar errors sistemàtics durant el procés de detecció de variants que altres mètodes convencionals no poden trobar. Aquesta eina filtra falsos positius del conjunt de variants finals en estudis de variacions somàtiques i germinals, així com també detecta falses associacions de malalties gèniques en estudis de casos-controls. En segon lloc, hem desenvolupat un conjunt de nous mètodes capaços de distingir i corregir els errors de seqüenciació i PCR amb l’ús d’identificadors moleculars. Aquests ens permeten modelar les taxes d’error i conseqüentment detectar mutacions somàtiques a freqüències al·lèliques extremadament baixes en l’anàlisi de biòpsies líquides. Per finalitzar aquesta tesi, hem caracteritzat les mutacions mosaiques en un estudi multi-teixit multi-individu utilitzant una cohort de centenars d'individus sans amb milers de mostres.
en_US
dc.format.extent
151 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Systematic error
en_US
dc.subject
Liquid biopsy
en_US
dc.subject
Unique molecular barcode
en_US
dc.subject
Somatic mutation
en_US
dc.subject
Mosaicism
en_US
dc.subject
Error sistemàtic
en_US
dc.subject
Biòpsia líquida
en_US
dc.subject
Codi molecular únic
en_US
dc.subject
Mutació somàtica
en_US
dc.subject
Mosaicisme
en_US
dc.title
Highly accurate variant detection for identification of tumor mutations and mosaic variants
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
616
en_US
dc.contributor.authoremail
fmuyasremolar@gmail.com
en_US
dc.contributor.director
Ossowski, Stephan
dc.contributor.director
Guigó Serra, Roderic
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Biomedicina


Documentos

tfmr.pdf

4.224Mb PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)