Deep Learning Solutions for Clinical Data Challenges in End-Stage Renal Disease

Author

Macias Toro, Edwar Hernando

Director

Morell Pérez, Antoni

Serrano García, Javier

López Vicario, José

Date of defense

2022-06-16

Pages

127 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Enginyeria Electrònica i de Telecomunicació

Abstract

A l’era de l’aprenentatge profund (DL), és possible generar models d’aprenentatge que explotin relacions complexes a partir de dades. La integració de tècniques de DL podria accelerar el canvi de paradigma de la medicina basada en l’evidència a la medicina basada en dades per donar suport a les decisions mèdiques en un entorn clínic. Les metodologies de DL poden abordar reptes relacionats amb la millora dels models predictius, l’imputació d’informació que falta i qüestions relacionades amb el volum d’informació en les tasques d’aprenentatge. Pretenem oferir solucions basades en DL per a aquests reptes. En primer lloc, utilitzem tècniques d’aprenentatge automàtic per abordar la mortalitat dels pacients amb malaltia renal en fase terminal (ESRD). Les característiques es troben automàticament i després es comparen amb grups de variables escollides per personal expert. S’utilitzen models DL especialitzats per explotar les dependències temporals de les dades. La integració d’un enfocament de DL va permetre millorar significativament els models d’aprenentatge d’aquesta patologia. També va explorar com funcionen les característiques que es presenten automàticament per als models d’aprenentatge. Aleshores, proposem una alternativa que integra la imputación múltiple amb la representació latent mitjana, l’anomenat codi mitjà. La reconstrucció millora notablement. Aquest enfocament es valida en quatre conjunts de dades clíniques, posant l’accent en el conjunt de dades relacionat amb la mortalitat de pacients amb malaltia renal aguda (IRA). El mètode proposat es va avaluar en altres dos conjunts de dades àmpliament utilitzats a la literatura com a punts de referència i va presentar una millor capacitat de reconstrucció en la majoria dels escenaris proposats. Finally, low volume and the class imbalance in ESRD is addressed. We offer a transfer learning solution. It consists of two approaches for increasing samples and the feature space for ESRD data. Latent spaces of autoencoders as an information bridge between target and source domain. AKI data is used as the source domain. As a result, it is obtained that the proposed mechanisms individually improve the prediction models, but when they are combined sequentially, they suppose a much more significant improvement.


En la era del aprendizaje profundo (DL), es posible generar modelos de aprendizaje que explotan relaciones complejas a partir de datos. La integración de las técnicas de DL podría acelerar el cambio de paradigma de la medicina basada en la evidencia a la medicina basada en datos para respaldar las decisiones médicas en un entorno clínico. Las metodologías de DL pueden abordar desafíos relacionados con la mejora de los modelos predictivos, la imputación de información faltante y cuestiones relacionadas con el volumen de información en las tareas de aprendizaje. Nuestro objetivo es proporcionar soluciones basadas en DL para tales desafíos. En primer lugar, utilizamos técnicas de aprendizaje automático para abordar la mortalidad de los pacientes con enfermedad renal terminal (ESRD). Las características se encuentran automáticamente y luego se comparan con grupos de variables elegidos por personal experto. Los modelos DL especializados se utilizan para explotar las dependencias temporales en los datos. La integración de un enfoque de DL permitió mejorar significativamente los modelos de aprendizaje para esta patología. También exploró cómo funcionan las características encontradas presentadas automáticamente para los modelos de aprendizaje. Luego, proponemos una alternativa que integra la imputación múltiple con la representación latente promedio, el llamado código promedio. La reconstrucción mejora significativamente. Este enfoque se valida en cuatro conjuntos de datos clínicos, con énfasis en el conjunto de datos relacionado con la mortalidad de los pacientes con enfermedad renal aguda (IRA). El método propuesto se evaluó sobre otros dos conjuntos de datos ampliamente utilizados en la literatura como puntos de referencia y presentó una mejor capacidad de reconstrucción en la mayoría de los escenarios propuestos. Finalmente, se aborda el bajo volumen y el desequilibrio de clases en ESRD. Ofrecemos una solución de transferencia de aprendizaje. Consta de dos enfoques para aumentar las muestras y el espacio de características para los datos de ESRD. Espacios latentes de autocodificadores como puente de información entre el dominio de destino y el de origen. Los datos de AKI se utilizan como dominio de origen. Como resultado se obtiene que los mecanismos propuestos individualmente mejoran los modelos de predicción, pero cuando se combinan secuencialmente suponen una mejora mucho más significativa.


In the deep learning (DL) era, it is possible to generate learning models that exploit complex relationships from data. Integrating DL techniques could accelerate the paradigm shift from evidence-based medicine to data-driven medicine to support medical decisions in a clinical setting. The DL methodologies may address challenges related to improving predictive models, imputation of missing information and issues related to the volume of information in learning tasks. We aim to provide DL-based solutions to such challenges. First, we use machine learning techniques to address the mortality of patients in end-stage renal disease (ESRD). Features are found automatically and then compared with groups of variables chosen by expert staff. Specialized DL models are used to exploit temporal dependencies in the data. The integration of a DL approach made it possible to improve the learning models for this pathology significantly. It also explored how the features encountered automatically presented perform for the learning models. Then, we propose an alternative that integrates multiple imputation with the average latent representation, the so-called average code. The reconstruction significantly improves. This approach is validated on four clinical datasets, emphasizing the dataset related to the mortality of patients with acute kidney disease (AKI). The proposed method was evaluated on two other datasets widely used in the literature as benchmarks, and presented a better reconstruction capacity in most of the proposed scenarios. Finally, low volume and the class imbalance in ESRD is addressed. We offer a transfer learning solution. It consists of two approaches for increasing samples and the feature space for ESRD data. Latent spaces of autoencoders as an information bridge between target and source domain. AKI data is used as the source domain. As a result, it is obtained that the proposed mechanisms individually improve the prediction models, but when they are combined sequentially, they suppose a much more significant improvement.

Keywords

Aprenentatge automàtic; Aprendizaje automático; Machine learning; Atenció sanitària; Atención sanitaria; Healthcare

Subjects

00 - Prolegomena. Fundamentals of knowledge and culture. Propaedeutics

Knowledge Area

Ciències de la Salut

Documents

ehmt1de1.pdf

10.30Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/

This item appears in the following Collection(s)