AI with care: Integrating machine learning with expert knowledge for In Vitro Fertilization

Autor/a

Correa Mañas, Nuria

Director/a

Arcos, Josep Lluís

Vassena , Rita

Cerquides Bueno, Jesús

Tutor/a

Arcos, Josep Lluís

Data de defensa

2023-07-24

Pàgines

161 p.



Programa de doctorat

Universitat Autònoma de Barcelona. Programa de Doctorat en Informàtica

Resum

Després de gairebé 45 anys del naixement de Lousie Brown, el primer nadó nascut després de la fecundació in vitro (FIV), les taxes de gestació per a aquest tractament segueixen al voltant del 30%, amb un 20% de possibilitats de part. Encara que és molt millor que les possibilitats que tenien aquests pacients sense la FIV, lògicament hi ha esforços constants per comprendre la realitat biològica de la fertilitat per tal de perfeccionar les tecnologies de reproducció artificial (TRA). Paral·lelament als avenços tècnics aconseguits pels professionals de la TRA, la intel·ligència artificial (IA) també ha progressat a un ritme notable. La seva capacitat per tractar bases de dades d'altes dimensions i detectar relacions de dades ocultes ha portat els investigadors a explorar la seva aplicació en l'àmbit de la salut. Hi ha diversos processos en la TRA, i concretament en la FIV, on actualment s'estan aplicant mètodes d'IA. En aquesta tesi, l'enfocament principal se centra en la selecció de la primera dosi de l'hormona fol·liculoestimulant (FSH per les seves sigles en anglès) per a l'hiperestimulació ovàrica controlada (HOC). La HOC és el primer pas d'un tractament de FIV, on l'objectiu és obtenir un nombre òptim d'òvuls madurs de l'ovari. Els resultats de la HOC són decisius per al èxit del tractament de FIV. Els protocols clínics estàndard per a la selecció de la primera dosi de FSH no són perfectes i porten una part considerable dels pacients a resultats subòptims. En aquesta tesi, fem servir mètodes d'IA amb dades històriques de tractaments anteriors de HOC per obtenir una política de dosificació òptima de FSH. Els conjunts de dades històrics o observacionals sovint presenten biaixos i tenen poca variabilitat a causa de l'alta adherència dels metges als protocols estàndard. En aquest context, els mètodes d'IA convencionals no tenen prou informació per aprendre models de dosificació que millorin la pràctica estàndard, ni tan sols que siguin coherents amb la realitat fisiològica subjacent. Per tant, la introducció del coneixement de domini en el procés de formació és clau per obtenir models clínics robustos a partir de dades observacionals. Per aconseguir-ho, proposem construir el model de dosificació al voltant de l'assumpció que la relació de resposta a la dosi entre la FSH i el nombre d'òvuls recuperats és monotònica. A més, ja que l'avaluació del rendiment dels models de dosificació generalment es realitza a través d'intervencions clíniques prospectives, hem dissenyat una puntuació de rendiment ad hoc per avaluar les dosis (reals o contrafacturals) en un entorn preclínic. Aquesta puntuació, basada en el coneixement expert, pot determinar si una dosi és adequada en funció del resultat real, expressat com el nombre d'òvuls madurs recuperats. Utilitzant aquest mètode, hem aconseguit una millora estadísticament significativa en comparació amb la pràctica clínica estàndard. També s'ha provat un mètode generalitzat per a problemes de dosificació similars, anomenat IDoser, en el cas d'ús de la FSH, comparant-lo amb la pràctica clínica i un conjunt de literatura, i s'ha trobat una millora significativa un cop més. Una primera aproximació de l'aplicació d'IDoser a la selecció del nombre d'embrions per a la transferència en la FIV també ha obtingut resultats positius amb potencial de millora. Finalment, les solucions impulsades per IA, especialment en entorns de salut com la selecció de dosis de medicaments, han de ser gestionades amb cura, ja que la salut dels pacients està en joc. A més, han de guanyar la confiança dels metges. La confiança s'aconsegueix mitjançant la millora clínica i l'adhesió demostrable al coneixement disponible en el camp.


Después de casi 45 desde el nacimiento del primer bebé concebido mediante fertilización in vitro (FIV), las tasas de embarazo para este tratamiento siguen rondando el 30%, con un 20% de posibilidades de éxito en el parto. Aunque estas cifras son mucho mejores que las de los pacientes sin FIV, es lógico que existan constantes esfuerzos por comprender la realidad biológica de la fertilidad con el fin de mejorar las tecnologías de reproducción asistida (TRA). Paralelamente a los avances técnicos logrados por los profesionales de la TRA, la inteligencia artificial (IA) también ha progresado a un ritmo notable. Su capacidad para manejar bases de datos de alta dimensionalidad y detectar relaciones ocultas entre los datos ha llevado a los investigadores a explorar su aplicación en el ámbito de la salud. Existen varios procesos en la TRA, y específicamente en la FIV, donde actualmente se están aplicando métodos de IA. En esta tesis, el enfoque principal se centra en la selección de la primera dosis de hormona estimulante del folículo (FSH) para la hiperestimulación ovárica controlada (HOC). La HOC es el primer paso de un tratamiento de FIV, cuyo objetivo es obtener un número óptimo de óvulos maduros del ovario. Los resultados de la HOC son fundamentales para el éxito del tratamiento de FIV. Los protocolos clínicos estándar para la selección de la primera dosis de FSH no son perfectos y llevan a una parte considerable de los pacientes a obtener resultados subóptimos. En esta tesis, utilizamos métodos de IA con datos históricos de tratamientos anteriores de HOC para obtener una política de dosificación óptima de FSH. Los conjuntos de datos históricos u observacionales a menudo presentan sesgos y tienen poca variabilidad debido a la alta adherencia de los médicos a los protocolos estándar. En este contexto, los métodos de IA convencionales no tienen suficiente información para aprender modelos de dosificación que mejoren la práctica estándar, ni siquiera para ser consistentes con la realidad fisiológica subyacente. Por lo tanto, la introducción del conocimiento del dominio en el proceso de entrenamiento es clave para obtener modelos de dosificación clínicamente robustos a partir de datos observacionales. Para lograr esto, proponemos construir el modelo de dosificación en base a la suposición de que la relación dosis-respuesta entre la FSH y el número de óvulos recuperados es monótona. Además, dado que la evaluación del rendimiento de los modelos de dosificación generalmente se logra a través de intervenciones clínicas prospectivas, hemos diseñado un puntaje de rendimiento ad hoc para evaluar las dosis (reales o contrafactuales) en un entorno preclínico. Este puntaje, basado en el conocimiento experto, puede evaluar si una dosis es adecuada en función del resultado verdadero, expresado como el número de óvulos maduros recuperados. Utilizando este método, hemos logrado una mejora estadísticamente significativa en comparación con la práctica clínica estándar. También se ha probado un método generalizado para problemas de dosificación similares, llamado IDoser, en el caso de uso de la FSH, comparándolo con la práctica clínica y un conjunto de literatura, y nuevamente se ha encontrado una mejora significativa. Una primera aproximación de la aplicación de IDoser a la selección del número de embriones para la transferencia en la FIV también ha arrojado resultados positivos con potencial de mejora. Finalmente, las soluciones impulsadas por IA, especialmente en entornos de atención médica como la selección de dosis de medicamentos, deben ser manejadas con cuidado, ya que la salud de los pacientes está en juego. Además, deben ganarse la confianza de los médicos. La confianza se obtiene a través de la mejora clínica y la adhesión comprobable al conocimiento disponible en el campo.


After almost 45 years from the birth of Lousie Brown, the first baby born after in vitro fertilization (IVF), pregnancy rates for this treatment remain around 30%, with a 20% chance of delivery. Even if it is much better than the chances than those patients had without IVF, logically, there are constant endeavours to gain insight into the biological reality behind fertility in order to refine artificial reproduction technologies (ART). In parallel to the technical advances achieved by ART professionals, artificial intelligence (AI) has also progressed at a remarkable pace. Its ability to deal with high dimensional databases and detect hidden data relationships has led researchers to investigate its application to healthcare. There are several processes in ART, and specifically, IVF, where AI methods are currently being applied. In this thesis, the main focus is on the selection of the first dose of follicle-stimulating hormone (FSH) for controlled ovarian hyperstimulation (COH). COH is the first step of an IVF treatment, where the objective is to retrieve an optimal number of mature oocytes from the ovary. Its results are critical for the success of the IVF treatment. Standard clinical protocols to select the first dose of FSH are not perfect, and lead a sizable portion of patients to suboptimal results. Here, we use AI methods with historical data from past COH treatments to obtain an optimized FSH dosing policy. Historical or observational datasets are often biased and prone to low variability due to the high adherence of clinicians to standard protocols. In this context, out-of-the-box AI methods do not have enough information to learn dosing models that improve standard practice, or even show consistency with the underlying physiological reality. Hence, the introduction of domain knowledge in the training process is key to obtain clinically robust models from observational data. To achieve this, we propose building the dosing model around the assumption that the dose-response relationship between FSH and the number of oocytes retrieved is monotonic. Further, since insight on the performance of dosing models is generally achieved through prospective clinical intervention, we designed an ad-hoc performance score to evaluate doses (real or counterfactual) pre-clinically. This score, based on expert knowledge, can evaluate whether a dose is appropriate depending on the ground truth outcome, expressed as the number of mature oocytes retrieved. Using this method, we were able to ascertain a statistically significant improvement versus standard clinical practice. A generalized method for similar dosing problems, called IDoser, was also tested in the FSH use case against clinical practice and a benchmark of literature, finding again significant improvement. A first approach of the application of IDoser to the selection of the number of embryos for transfer in IVF also returned positive results with potential for improvement. Finally, AI driven solutions, especially for healthcare settings like drug dose selection, are to be handled with care, as the patients’ health is at stake. Not only that, they need to gain the trust of their intended users, in this case, clinicians. Trust is gained through clinical improvement and easy-to-prove adherence to already available field knowledge. The first can be achieved through pre-clinical analysis, but especially through randomized controlled trials (RCTs) where the models are tested against standard practice. The second, as proposed in this thesis, can be achieved through interpretable implementations of domain knowledge into the creation and training of dosing models. This leads to clinically robust dosing models that achieve better pre-clinical results.

Paraules clau

COH; AI; IA; FSH; IVF; FIV

Matèries

004 - Informàtica; 618 - Ginecologia. Obstetricia

Àrea de coneixement

Ciències de la Salut; Tecnologies

Documents

Aquest document conté fitxers embargats fins el dia 23-07-2025

Drets

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/

Aquest element apareix en la col·lecció o col·leccions següent(s)