Study of the components that determine the applicability of pathogenicity predictors in the clinical setting

Autor/a

Aguirre Gómez, Josu

Director/a

Cruz Montserrat, Francisco Javier de la

Tutor/a

Abril Ferrando, Josep Francesc, 1970-

Fecha de defensa

2020-07-14

Páginas

208 p.



Departamento/Instituto

Universitat de Barcelona. Departament de Genètica, Microbiologia i Estadística

Resumen

The translation of Next Generation Sequencing (NGS) technologies from the research field to the clinical setting and, specifically, the results obtained in terms of diagnostic yield remain far from expected. This situation is due to our present inability to solve the “variant interpretation problem”, which consists in establishing whether a sequence variant is either pathogenic or neural. In this thesis we have focused on how this problem is addressed by pathogenicity predictors, studying the components that determine the applicability of these tools in the clinical setting. First, we have developed a novel approach to assess pathogenicity predictors in terms of both their performance and their suitability for clinical applications. We present a cost framework for assessing and comparing in silico tools, inspired on the use of cost models applied in different fields, from clinical tests to credit assessment in finance. A virtue of this cost framework is that it takes into account the consequences of downstream medical decisions in a simple fashion. Second, we have studied one of the most important factors limiting the performance of pathogenicity predictors: genetic background. In this part, we have studied the relationship between molecular impact and disease severity in hemophilias A and B, for a specific type of sequence variants: compensated pathogenic deviations (CPDs). We have established, studying a dataset of variants in coagulation factors FVIII and FIX, that the disruptive impact of a mutation is not enough to explain the associated phenotype. In parallel, we have characterized the genetic background of these proteins,describing at the molecular level its potential to generate phenotypic variability. Finally, we have characterized the contribution of in silico pathogenicity predictors to the variants identified in gene sequencing panels, using as a model a panel designed for Primary Immunodeficiency Disease (PID), developed in the Immunology and Autoinflammatory diseases’ groups, at the Vall d’Hebron University Hospital. The results obtained illustrate the limits of in silico tools and also a new way to take genetic background into consideration.


La traslación de las tecnologías de secuenciación de última generación (NGS) del ámbito de la investigación al entorno clínico, y más en concreto, los resultados obtenidos en su rendimiento diagnóstico, continúan lejos de lo esperado. Esta situación se debe a nuestra incapacidad para resolver el “problema de interpretación de las variantes”, que consiste en establecer si la variante de una secuencia es patogénica o neutra. En esta tesis nos hemos centrado en cómo se resuelve este problema mediante los predictores de patogenicidad, estudiando los componentes que determinan la aplicabilidad de estas herramientas en el entorno clínico. En primer lugar, hemos desarrollado una nueva aproximación para evaluar los predictores de patogenicidad en términos de su rendimiento y su idoneidad para aplicaciones clínicas. Presentamos un marco de coste para evaluar y comparar los métodos in silico, inspirados en el uso de modelos de coste en diferentes campos, desde los ensayos clínicos hasta la evaluación del crédito en las finanzas. Una virtud de este marco de coste es que contempla las consecuencias de las decisiones médicas finales de una forma sencilla. En segundo lugar, hemos estudiado uno de los factores más importantes que limitan el rendimiento de los predictores de patogenicidad: el entorno genético. En esta parte, hemos estudiado la relación entre el impacto molecular y la severidad de las hemofilias A y B en unas variantes de secuencia específicas: las variantes patogénicas compensadas (CPD). Estudiando un conjunto de datos de variantes en los factores de coagulación FVIII y FIX, hemos establecido que el impacto disruptivo de una mutación no es suficiente para explicar el fenotipo asociado. En paralelo, hemos caracterizado el entorno genético de estas proteínas, describiendo a nivel molecular su potencial para generar variabilidad fenotípica. Finalmente, hemos caracterizado la contribución de los predictores de patogenicidad in silico en las variantes identificadas en los paneles génicos de secuenciación, usando como modelo un panel diseñado para la Inmunodeficiencia Primaria (IDP), desarrollado en los grupos de Inmunología y Enfermedades Autoinflamatorias, en el Hospital Universitario Vall d’Hebron. Los resultados obtenidos ilustran las limitaciones de las herramientas in silico y también una nueva forma de tener en cuenta el entorno genético.

Palabras clave

Bioinformàtica; Bioinformática; Bioinformatics; Genòmica; Genómica; Genomics; Genètica humana; Genética humana; Human genetics; Laboratoris clínics; Laboratorios clínicos; Clinical laboratories

Materias

575 - Genética general. Citogenética general. Inmunogenética. Evolución. Filogenia

Área de conocimiento

Ciències Experimentals i Matemàtiques

Nota

Programa de Doctorat en Genètica / Tesi realitzada a Vall d'Hebron Institut de Recerca

Documentos

JAG_PhD_THESIS.pdf

19.44Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)