Propuesta metodológica para el análisis de supervivencia con eventos recurrentes en estudios epidemiológicos cuando el número de eventos previos es desconocido

dc.contributor.author
Hernández Herrera, Gilma Norela
dc.date.accessioned
2021-03-19T19:25:19Z
dc.date.available
2021-03-19T19:25:19Z
dc.date.issued
2021-01-20
dc.identifier.uri
http://hdl.handle.net/10803/671165
dc.description.abstract
Introducció: En molts estudis clínics, epidemiològics i de salut pública, l'esdeveniment d'interès es presenta sovint més d'una vegada i els temps entre ocurrències poden estar correlacionats. Per a aquest tipus de situacions, es requereix comptar amb mètodes estadístics específics que permetin donar resposta a preguntes relacionades amb la probabilitat d'ocurrència de nous esdeveniments i l'impacte de les covariables afegides. Quan hi ha recurrència d'esdeveniments, l'experiència ha mostrat que es pot presentar dependència d'esdeveniment i heterogeneïtat individual que obliguen a pensar en mètodes d'anàlisi més enllà del model de Cox estàndard. En aquest tipus d'anàlisi, la censura a l'esquerra juga un paper determinant, però, la història prèvia sovint és desconeguda i és important establir estratègies per al seu maneig. Objectiu: Proposar una alternativa d'anàlisi de supervivència per a esdeveniments recurrents amb dependència d'esdeveniment quan es desconeix el nombre d'episodis previs a l'inici de l'seguiment per part (o tots) els subjectes de la mostra. Metodologia: Es van dur a terme dues fases. La primera va incloure la revisió de mètodes per al tractament de dades mancants i la identificació d'un mètode adequat per imputar aquestes dades quan la variable és de re-compte, a través d'un estudi de simulació que permetés comparar diferents mètodes basats en la distribució Poisson i generalitzacions d'aquesta distribució; tenint en compte a més diferents escenaris de dispersió i diferents percentatges de dades mancants. La segona fase va incloure la revisió de models disponibles per a l'anàlisi de supervivència quan hi ha esdeveniments recurrents amb dependència d'esdeveniment i heterogeneïtat individual i es va desenvolupar un estudi de simulació que permetés identificar el millor model per ajustar a dades d'esdeveniments recurrents amb aquestes característiques, imputant la informació prèvia (censura a esquerra) amb el mètode trobat a la primera simulació. Resultats: En la primera fase, es va trobar que el model adequat per imputar aquesta variable, quan hi ha sobredispersió, equidispersión, infradispersión o excés de zeros és la imputació múltiple basada en la distribució COMPoisson. En la segona fase, es va trobar que els models PWP-CP i PWP-GT incloent el component de fragilitat, estratificant segons si s'havia estat a risc previ, i imputant els episodis previs mostraba el millor rendiment. Addicional als dos estudis de simulació, es va construir un paquet en R miRecSurv posat a disposició de la comunitat científica per al seu ús. Conclusions Per a la imputació de dades mancants quan es té una variable de re-compte, la decisió de l'mètode es basa en l'anàlisi de dispersió de la variable i en el percentatge de dades perdudes. Segons els resultats de simulació en aquest estudi, el model COMPoisson es comporta bé per a la imputació de variable discreta ja que és flexible pel que fa a l'ús d'aquesta variable amb característiques de sobre i subdispersión, així com amb equidispersión. La proposta de model realitzada en aquesta tesi sembla funcionar raonablement bé per a la majoria de situacions estudiades, en general molt millor que l'alternativa de l'ús de models amb risc basal comú. Si el fenomen d'interès es genera a partir de funcions de risc constants, i quan tots els subjectes de la mostra han estat a risc de l'esdeveniment abans de l'inici de l'seguiment, el model proposat en la seva formulació gap time sembla ser el més adequat. I si el fenomen d'interès es genera a partir de funcions de risc no constants, el model més adequat és el proposat amb formulació counting process, al menys fins al 50% de subjectes a risc previ a l'inici de l'seguiment.
en_US
dc.description.abstract
Introducción En muchos estudios clínicos, epidemiológicos y de salud pública, el evento de interés se presenta a menudo más de una vez y los tiempos entre ocurrencias pueden estar correlacionados. Para este tipo de datos, se requiere contar con métodos estadísticos específicos que permitan dar respuesta a preguntas relacionadas con la probabilidad de ocurrencia de nuevos eventos y el impacto de las covariables añadidas. Cuando hay recurrencia de eventos, se ha mostrado que se puede presentar dependencia de evento y heterogeneidad individual que conllevan a pensar en métodos de análisis más allá del modelo de Cox estándar. En este tipo de análisis, la censura a la izquierda juega un papel determinante, sin embargo, la historia previa a menudo es desconocida y es importante establecer estrategias para su manejo. Objetivo Proponer una alternativa de análisis de supervivencia para eventos recurrentes con dependencia de evento cuando se desconoce el número de episodios previos al inicio del seguimiento para parte (o todos) los sujetos de la muestra. Metodología Se llevaron a cabo dos fases. La primera incluyó la revisión de métodos para el tratamiento de datos faltantes y la identificación de un método adecuado para imputar estos datos cuando la variable fuese de conteo, a través de un estudio de simulación que permitiera comparar diferentes métodos basados en la distribución Poisson y generalizaciones de esta, teniendo en cuenta diferentes escenarios de dispersión y diferentes porcentajes de datos faltantes. La segunda fase incluyó la revisión de modelos disponibles para el análisis de supervivencia cuando hay eventos recurrentes con dependencia de evento y heterogeneidad individual y se desarrolló estudio de simulación para identificar el mejor modelo de ajuste a datos de eventos recurrentes con estas características, imputando la información previa (censura a izquierda) con el método encontrado. Resultados En la primera fase, se encontró que el modelo adecuado para imputar variable discreta, cuando hay sobredispersión, equidispersión, infradispersión o exceso de ceros es la imputación múltiple usando la distribución COMPoisson. En la segunda fase, se encontró que los modelos PWP-CP y PWP-GT incluyendo el componente de fragilidad, estratificando según si se había estado a riesgo previo e imputando los episodios previos mostraron mejor rendimiento. Para la implementación del modelo propuesto se construyó un paquete en R miRecSurv puesto a disposición de la comunidad científica para su uso. Conclusiones Para la imputación de datos faltantes cuando se tiene una variable de conteo, el modelo COMPoisson se comporta bien ya que es flexible en cuanto al manejo de esta variable con características de sobre y subdispersión, así como con equidispersión. La propuesta de modelo realizada en esta tesis parece funcionar razonablemente bien para la mayoría de situaciones estudiadas, en general, con mejor comportamiento que la alternativa del uso de modelos con riesgo basal común. Si el fenómeno de interés se genera a partir de funciones de riesgo constantes, y cuando todos los sujetos de la muestra han estado a riesgo del evento antes del inicio del seguimiento, el modelo propuesto en su formulación gap time parece ser el más adecuado. Si el fenómeno de interés se genera a partir de funciones de riesgo no constantes, el modelo más adecuado es el propuesto con formulación counting process, al menos hasta el 50 % de sujetos a riesgo previo al inicio del seguimiento
en_US
dc.description.abstract
Introduction In many clinical, epidemiological, and public health studies, the event of interest often occurs more than once, and the times between occurrences may be correlated. For this type of data, it is required to have specific statistical methods that allow answering questions that arise in epidemiological investigations related to the probability of occurrence of new events and the impact of the additional covariates. When there is a recurrence of events, experience has shown that event dependence and individual heterogeneity are very common, leading to the need of analysis methods that go beyond the standard Cox model. In this type of analysis, left censorship plays a determining role. However, the previous history is often unknown and it is important to establish strategies for its management. Objective Propose an alternative survival analysis for recurrent events with event dependence when the number of episodes prior to the start of follow-up is unknown for part (or all) of the subjects in the sample. Methodology: To fulfill the main objective of this study, two phases were carried out. The first included the review of methods for the treatment of missing data and the identification of an adequate method to impute these data when the variable was discrete, through a simulation study that allowed the comparison of different methods based on the Poisson distribution and generalizations of this distribution, also taking into account different dispersion scenarios and different percentages of missing data. The second phase included the review of models available for survival analysis when there are recurrent events with event dependence and individual heterogeneity and a simulation study was developed to identify the best model to adjust data from recurrent events with these characteristics, imputing the previous information (left censorship) with the method found in the first phase. Results: In the first phase, it was found that the appropriate model to impute this variable, when there is over-dispersion, equidispersion, under-dispersion or excess of zeros is multiple imputation using the COMPoisson distribution. In the second phase, it was found that the PWP-CP and PWP-GT models including the frailty component, stratifying according to whether they had been at previous risk, and imputing the previous episodes, showed better performance. In addition to the two simulation studies, and taking into account the need for available software for this type of analysis, a package was built in R miRecSurv and made available to the scientific community for its use. Conclusions For the imputation of missing data when dealing with a count variable, the decision of the optimal method is based on the dispersion analysis of the variable and on the percentage of missing data. According to the simulation results in this study, the COMPoisson model behaves well for the imputation of the counting variable since it is flexible in terms of handling variables showing over and sub-dispersion, as well as with equidispersion. The model proposal made in this thesis seems to work reasonably well for most of the situations studied, in general much better than the alternative of using models with common baseline risk. If the phenomenon of interest is generated from constant risk functions, and when all the subjects in the sample have been at risk of the event before the start of the follow-up, the model proposed in its gap time formulation seems to be the more appropriate. And if the phenomenon of interest is generated from non-constant risk functions, the most appropriate model is the one proposed with a counting process formulation, at least up to 50% of subjects at risk prior to the start of follow-up.
en_US
dc.format.extent
167 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
spa
en_US
dc.publisher
Universitat Autònoma de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Esdeveniments recurrents
en_US
dc.subject
Eventos recurrentes
en_US
dc.subject
Recurrent events
en_US
dc.subject
Dependència d'esdeveniment
en_US
dc.subject
Dependencia de evento
en_US
dc.subject
Dependence event
en_US
dc.subject
Imputació
en_US
dc.subject
Imputación
en_US
dc.subject
Imputation
en_US
dc.subject.other
Ciències de la Salut
en_US
dc.title
Propuesta metodológica para el análisis de supervivencia con eventos recurrentes en estudios epidemiológicos cuando el número de eventos previos es desconocido
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
311
en_US
dc.contributor.authoremail
gilmah@yahoo.com
en_US
dc.contributor.director
Navarro Giné, Albert
dc.contributor.director
Moriña Soler, David
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Universitat Autònoma de Barcelona. Programa de Doctorat en Metodologia de la Recerca Biomèdica i Salut Pública


Documentos

gnhh1de1.pdf

4.586Mb PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)