Data-driven models for type 1 diabetes using generative deep learning

Author

Mujahid, Omer

Director

Vehí, Josep

Contreras, Ivan

Tutor

Vehí, Josep

Date of defense

2023-09-19

Pages

89 p.



Department/Institute

Universitat de Girona. Departament d'Enginyeria Elèctrica, Electrònica i Automàtica

Institut d'Informàtica i Aplicacions

Doctorate programs

Programa de Doctorat en Tecnologia

Abstract

Modeling biological systems has always been challenging given the complexity of the processes involved in them. Experts have been employing physiological models to approximate the dynamics of biological systems; however, these models are constrained by the limitations of mathematical techniques that can only encompass part of the physical phenomena behind a biological system. Mathematical physiological models of the human glucose-insulin system are considered the gold standard of simulators in type 1 diabetes (T1D) healthcare. Though accurate to a certain degree, these models are not capable of simulating scenarios that could fully capture the real-life dynamics of a T1D patient. The underlying cause for this phenomenon could be attributed to the numerous hidden factors that are ignored during physiological modeling because of increasing model complexity or hurdles in their representation. This work was carried out with a focus on accurate model approximation in T1D. The rationale is built on the hypothesis that generic function approximators such as deep neural networks (DNNs) have the ability to learn all that from data that cannot be modeled mathematically. Since deep generative models (DGMs) are implemented using DNNs, they are capable of learning the underlying probability distribution of a data set. This thesis presents several methodologies based on data-driven models using DGMs for improved model approximation in T1D. Firstly, a systematic review of data-driven models for predicting hypoglycemia is conducted. After that, a methodology for data augmentation in a hypoglycemia classifier using a generative adversarial network (GAN) is developed as part of this thesis. The next work in this series focuses on the conditional synthesis of realistic BG profiles of T1D patients. Finally, building on the work performed thus far, a T1D simulation environment is developed using a sequence-to-sequence GAN (S2S GAN) that is capable of synthesizing realistic patients with T1D. The results obtained from these methods show the efficacy of DGMs for model formation in T1D. It has been demonstrated through these results that a highly precise approximation of the glucose-insulin system of patients with T1D can be obtained from data with the help of DGMs. Moreover, these models have been shown to generate novel data that is statistically similar to real data for all the standardized glycemic metrics. Furthermore, the causal synthesis of realistic T1D data has been shown in the work presented in this thesis.


Modelar sistemes biològics sempre ha estat un desafiament atesa la complexitat dels processos involucrats en ells. Actualment, la implementació de models fisiològics és l’estàndard per aproximar-se a la dinàmica dels sistemes biològics; aquests models, però, estan restringits per les limitacions de les tècniques matemàtiques, que només poden abastar una part dels fenòmens físics darrere d’un sistema biològic. Els models fisiològics matemàtics del sistema de glucosa-insulina humà es consideren el model de referència dels simuladors en la cura de la salut de la diabetis tipus 1 (T1D). Tot i que són necessaris fins a cert punt, aquests models no són capaços de simular escenaris que puguin capturar completament la dinàmica de la vida real d’un pacient amb T1D. La causa subjacent d’aquest fenomen podria atribuir-se als nombrosos factors ocults que s’ignoren durant el modelatge fisiològic a causa de la complexitat creixent del model o dels obstacles en la seva representació. Aquest treball s’ha dut a terme centrant-se en una aproximació precisa del model a T1D. La justificació es basa en la hipòtesi que els aproximadors de funcions genèriques, com les xarxes neuronals profundes (DNN), tenen la capacitat d’aprendre tot allò de les dades que no es pot modelar matemàticament. Com que els models generatius profunds (DGM) s’implementen mitjançant DNN, aquests són capaços d’aprendre la distribució de probabilitat subjacent d’un conjunt de dades. Aquesta tesi presenta diverses metodologies basades en models basats en dades que fan servir DGM per millorar l’aproximació del model a T1D. En primer lloc, es fa una revisió sistemàtica dels models basats en dades per predir la hipoglucèmia. Posteriorment, com a part d’aquesta tesi, es desenvolupa una metodologia per a l’augment de dades en un classificador d’hipoglucèmia utilitzant una xarxa generativa antagònica (GAN). El següent treball se centra en la síntesi condicional de perfils realistes de glucosa a la sang de pacients amb T1D usant xarxes generatives condicionals. Finalment, sobre la base del treball fet fins ara, es desenvolupa un entorn de simulació de pacients amb T1D utilitzant una GAN de seqüència a seqüència (S2S GAN). Els resultats obtinguts d’aquests mètodes mostren l’eficàcia dels DGM per a la generació de models a la T1D. Aquesta tesi demostra que les DGM són capaces d’aconseguir una aproximació molt precisa del sistema glucosa-insulina de pacients amb T1D. D’altra banda, s’ha demostrat que aquests models generen dades inèdites que són estadísticament similars a les dades reals per a totes les mètriques de glucèmia estàndard. A més a més, el treball presentat en aquesta tesi ha demostrat la síntesi causal de dades realistes en pacients amb T1D.

Keywords

Diabetis tipus 1; Type 1 diabetes; Diabetes tipo 1; Pacients virtuals; Virtual patients; Pacientes virtuales; Simuladors de Diabetis tipus 1; Type 1 diabetes simulators; Simuladores de diabetes tipo 1; síntesi causal de dades de glucosa a la sang; Causal blood glucose data synthesis; Síntesis causal de glucosa en la sangre; Síntesi condicional de dades de glucosa a la sang; Conditional blood glucose data synthesis; Síntesis condicional de dades de glucosa en la sangre; Models generatius profunds; Deep generative models; Modelos generativos profundos; Models basats en dades; Data-driven models; Modelos basados en datos

Subjects

616.4 - Pathology of the lymphatic system, haemopoietic (haematopoietic) organs, endocrines; 621.3 Electrical engineering

Documents

tom_20230919.pdf

5.462Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.