dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Rafael-Palou, Xavier
dc.date.accessioned
2021-12-16T11:51:03Z
dc.date.available
2022-04-20T02:00:19Z
dc.date.issued
2021-10-22
dc.identifier.uri
http://hdl.handle.net/10803/672964
dc.description.abstract
Nowadays, lung cancer assessment is a complex and tedious task mainly per-
formed by radiological visual inspection of suspicious pulmonary nodules, using computed tomography
(CT) scan images taken to patients over time.
Several computational tools relying on conventional artificial intelligence and computer vision
algorithms have been proposed for supporting lung cancer de- tection and classification. These
solutions mostly rely on the analysis of indi- vidual lung CT images of patients and on the use of
hand-crafted image de- scriptors. Unfortunately, this makes them unable to cope with the complexity
and variability of the problem. Recently, the advent of deep learning has led to a major
breakthrough in the medical image domain, outperforming conven- tional approaches. Despite recent
promising achievements in nodule detection, segmentation, and lung cancer classification, radiologists are still reluctant to
use these solutions in their day-to-day clinical practice. One of the main rea- sons is that
current solutions do not provide support to automatic analysis of the temporal evolution of lung
tumours. The difficulty to collect and annotate longitudinal lung CT cases to train models may
partially explain the lack of deep learning studies that address this issue.
In this dissertation, we investigate how to automatically provide lung can- cer assessment through
deep learning algorithms and computer vision pipelines, especially taking into consideration the
temporal evolution of the pulmonary nodules. To this end, our first goal consisted on obtaining
accurate methods for lung cancer assessment (diagnostic ground truth) based on individual lung CT
images. Since these types of labels are expensive and difficult to collect
(e.g. usually after biopsy), we proposed to train different deep learning models, based on 3D
convolutional neural networks (CNN), to predict nodule malig- nancy based on radiologist visual
inspection annotations (which are reasonable to obtain). These classifiers were built based on
ground truth consisting of the nodule malignancy, the position and the size of the nodules to
classify. Next, we evaluated different ways of synthesizing the knowledge embedded by the nodule
malignancy neural network, into an end-to-end pipeline aimed to detect pul- monary nodules and
predict lung cancer at the patient level, given a lung CT image. The positive results confirmed the
convenience of using CNNs for mod- elling nodule malignancy, according to radiologists, for the
automatic prediction of lung cancer.
Next, we focused on the analysis of lung CT image series. Thus, we first faced the problem of
automatically re-identifying pulmonary nodules from dif- ferent lung CT scans of the same patient.
To do this, we present a novel method based on a Siamese neural network (SNN) to rank similarity
between nodules, overpassing the need for image registration. This change of paradigm avoided
introducing potentially erroneous image deformations and provided computa- tionally faster results.
Different configurations of the SNN were examined, in- cluding the application of transfer
learning, using different loss functions, and the combination of several feature maps of different
network levels. This method obtained state-of-the-art performances for nodule matching both in an
isolated manner and embedded in an end-to-end nodule growth detection pipeline.
Afterwards, we moved to the core problem of supporting radiologists in the longitudinal management
of lung cancer. For this purpose, we created a novel end-to-end deep learning pipeline, composed of
four stages that completely au- tomatize from the detection of nodules to the classification of
cancer, through the detection of growth in the nodules. In addition, the pipeline integrated a
novel approach for nodule growth detection, which relies on a recent hierarchi- cal probabilistic
segmentation network adapted to report uncertainty estimates. Also, a second novel method was
introduced for lung cancer nodule classification, integrating into a two stream 3D-CNN the
estimated nodule malignancy prob- abilities derived from a pre-trained nodule malignancy network.
The pipeline was evaluated in a longitudinal cohort and the reported outcomes (i.e. nodule
detection, re-identification, growth quantification, and malignancy prediction)
were comparable with state-of-the-art work, focused on solving one or a few of
the functionalities of our pipeline.
Thereafter, we also investigated how to help clinicians to prescribe more accurate tumour
treatments and surgical planning. Thus, we created a novel method to forecast nodule growth given a
single image of the nodule. Partic- ularly, the method relied on a hierarchical, probabilistic and
generative deep neural network able to produce multiple consistent future segmentations of the
nodule at a given time. To do this, the network learned to model the mul- timodal posterior
distribution of future lung tumour segmentations by using variational inference and injecting the
posterior latent features. Eventually, by applying Monte-Carlo sampling on the outputs of the
trained network, we esti- mated the expected tumour growth mean and the uncertainty associated with
the prediction.
Although further evaluation in a larger cohort would be highly recommended, the proposed methods
reported accurate results to adequately support the ra- diological workflow of pulmonary nodule
follow-up. Beyond this specific appli- cation, the outlined innovations, such as the methods for
integrating CNNs into computer vision pipelines, the re-identification of suspicious regions over
time based on SNNs, without the need to warp the inherent image structure, or the proposed deep
generative and probabilistic network to model tumour growth considering ambiguous images and label
uncertainty, they could be easily appli- cable to other types of cancer (e.g. pancreas), clinical
diseases (e.g. Covid-19)
or medical applications (e.g. therapy follow-up).
en_US
dc.description.abstract
Avui en dia, l’avaluació del càncer de pulmó ´es una tasca complexa i tediosa, principalment realitzada per inspecció visual radiològica de nòduls pulmonars sospitosos, mitjançant imatges de tomografia computada (TC) preses als pacients al llarg del temps.
Actualment, existeixen diverses eines computacionals basades en intel·ligència artificial i algorismes de visió per computador per donar suport a la detecció i classificació del càncer de pulmó. Aquestes solucions es basen majoritàriament en l’anàlisi d’imatges individuals de TC pulmonar dels pacients i en l’ús de descriptors d’imatges fets a mà. Malauradament, això les fa incapaces d’afrontar completament la complexitat i la variabilitat del problema. Recentment, l’aparició de l’aprenentatge profund ha permès un gran avenc¸ en el camp de la imatge mèdica. Malgrat els prometedors assoliments en detecció de nòduls, segmentació i classificació del càncer de pulmó, els radiòlegs encara són reticents a utilitzar aquestes solucions en el seu dia a dia. Un dels principals motius ´es que les solucions actuals no proporcionen suport automàtic per analitzar l’evolució temporal dels tumors pulmonars. La dificultat de recopilar i anotar cohorts longitudinals de TC pulmonar poden explicar la manca de treballs d’aprenentatge profund que aborden aquest problema.
En aquesta tesi investiguem com abordar el suport automàtic a l’avaluació del càncer de pulmó, construint algoritmes d’aprenentatge profund i pipelines de visió per ordinador que, especialment, tenen en compte l’evolució temporal dels nòduls pulmonars. Així doncs, el nostre primer objectiu va consistir a obtenir mètodes precisos per a l’avaluació del càncer de pulmó basats en imatges de CT pulmonar individuals. Atès que aquests tipus d’etiquetes són costoses i difícils d’obtenir (per exemple, després d’una biòpsia), vam dissenyar diferents xarxes neuronals profundes, basades en xarxes de convolució 3D (CNN), per predir la malignitat dels nòduls basada en la inspecció visual dels radiòlegs (més senzilles de recol.lectar). A continuació, vàrem avaluar diferents maneres de sintetitzar aquest coneixement representat en la xarxa neuronal de malignitat, en una pipeline destinada a proporcionar predicció del càncer de pulmó a nivell de pacient, donada una imatge de TC pulmonar. Els resultats positius van confirmar la conveniència d’utilitzar CNN per modelar la malignitat dels nòduls, segons els radiòlegs, per a la predicció automàtica del càncer de pulmó.
Seguidament, vam dirigir la nostra investigació cap a l’anàlisi de sèries d’imatges de TC pulmonar. Per tant, ens vam enfrontar primer a la reidentificació automàtica de nòduls pulmonars de diferents tomografies pulmonars. Per fer-ho, vam proposar utilitzar xarxes neuronals siameses (SNN) per classificar la similitud entre nòduls, superant la necessitat de registre d’imatges. Aquest canvi de paradigma va evitar possibles pertorbacions de la imatge i va proporcionar resultats computacionalment més ràpids. Es van examinar diferents configuracions del SNN convencional, que van des de l’aplicació de l’aprenentatge de transferència, utilitzant diferents funcions de pèrdua, fins a la combinació de diversos mapes de característiques de diferents nivells de xarxa. Aquest mètode va obtenir resultats d’estat de la tècnica per reidentificar nòduls de manera aïllada, i de forma integrada en una pipeline per a la quantificació de creixement de nòduls.
A més, vam abordar el problema de donar suport als radiòlegs en la gestió longitudinal del càncer de pulmó. Amb aquesta finalitat, vam proposar una nova pipeline d’aprenentatge profund, composta de quatre etapes que s’automatitzen completament i que van des de la detecció de nòduls fins a la classificació del càncer, passant per la detecció del creixement dels nòduls. A més, la pipeline va integrar un nou enfocament per a la detecció del creixement dels nòduls, que es basava en una recent xarxa de segmentació probabilística jeràrquica adaptada per informar estimacions d’incertesa. A més, es va introduir un segon mètode per a la classificació dels nòduls del càncer de pulmó, que integrava en una xarxa 3D-CNN de dos fluxos les probabilitats estimades de malignitat dels nòduls derivades de la xarxa pre-entrenada de malignitat dels nòduls. La pipeline es va avaluar en una cohort longitudinal i va informar rendiments comparables a l’estat de la tècnica utilitzats individualment o en pipelines però amb menys components que la proposada.
Finalment, també vam investigar com ajudar els metges a prescriure de forma més acurada tractaments tumorals i planificacions quirúrgiques més precises. Amb aquesta finalitat, hem realitzat un nou mètode per predir el creixement dels nòduls donada una única imatge del nòdul. Particularment, el mètode es basa en una xarxa neuronal profunda jeràrquica, probabilística i generativa capaç de produir múltiples segmentacions de nòduls futurs consistents del nòdul en un moment determinat. Per fer-ho, la xarxa aprèn a modelar la distribució posterior multimodal de futures segmentacions de tumors pulmonars mitjançant la utilització d’inferència variacional i la injecció de les característiques latents posteriors. Finalment, aplicant el mostreig de Monte-Carlo a les sortides de la xarxa, podem estimar la mitjana de creixement del tumor i la incertesa associada a la predicció.
Tot i que es recomanable una avaluació posterior en una cohort més gran, els mètodes proposats en aquest treball han informat resultats prou precisos per donar suport adequadament al flux de treball radiològic del seguiment dels nòduls pulmonars. Més enllà d’aquesta aplicació especifica, les innovacions presentades com, per exemple, els mètodes per integrar les xarxes CNN a pipelines de visió per ordinador, la reidentificació de regions sospitoses al llarg del temps basades en SNN, sense la necessitat de deformar l’estructura de la imatge inherent o la xarxa probabilística per modelar el creixement del tumor tenint en compte imatges ambigües i la incertesa en les prediccions, podrien ser fàcilment aplicables a altres tipus de càncer (per exemple, pàncrees), malalties clíniques (per exemple, Covid-19) o aplicacions mèdiques (per exemple, seguiment de la teràpia).
en_US
dc.format.extent
194 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Lung cancer prediction
en_US
dc.subject
Nodule detection
en_US
dc.subject
Nodule segmentation
en_US
dc.subject
Nodule characterization
en_US
dc.subject
Nodule malignancy estimation
en_US
dc.subject
Nodule follow-up
en_US
dc.subject
Nodule re-identification
en_US
dc.subject
Nodule growth forecasting
en_US
dc.subject
Uncertainty modelling and quantification
en_US
dc.subject
Convolutional neural networks
en_US
dc.subject
Variational autoencoders
en_US
dc.subject
Siamese neural networks
en_US
dc.subject
Generative networks
en_US
dc.subject
Transfer learning
en_US
dc.subject
Computer vision
en_US
dc.subject
Deep learning
en_US
dc.subject
Machine learning
en_US
dc.subject
Predicció del càncer de pulmó
en_US
dc.subject
Detecció de nòduls
en_US
dc.subject
Segmentació de nòduls
en_US
dc.subject
Caracterització de nòduls
en_US
dc.subject
Predicció de malignitat de nòduls
en_US
dc.subject
Seguiment de nòduls
en_US
dc.subject
Re-identificació de nòduls
en_US
dc.subject
Creixement de nòduls
en_US
dc.subject
Modelatge i quantificació de la malignitat
en_US
dc.subject
Xarxes neuronals convolucionals
en_US
dc.subject
Autoencoders variacional
en_US
dc.subject
Xarxes neuronals siameses
en_US
dc.subject
Xarxes generatives
en_US
dc.subject
Aprenentatge per transferència
en_US
dc.subject
Pipelines
en_US
dc.subject
Visió per computador
en_US
dc.subject
Aprenentatge profund
en_US
dc.subject
Aprenentatge automàtic
en_US
dc.title
Detection, quantification, malignancy prediction and growth forecasting of pulmonary nodules using deep learning in follow-up CT scans
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
xavi.rafael@gmail.com
en_US
dc.contributor.director
González Ballester, Miguel Ángel
dc.contributor.director
Piella Fenoy, Gemma
dc.contributor.director
Ribas Ripoll, Vicent Jordi
dc.embargo.terms
6 mesos
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions