Aportacions als mètodes estadístics per a modelar dades agregades amb correlació espacial

Author

Abellana Sangrà, Rosa Maria

Director

Ascaso Terrén, Carlos

Date of defense

2003-07-28

ISBN

8468927252

Legal Deposit

B.31914-2005



Department/Institute

Universitat de Barcelona. Departament de Salut Pública

Abstract

L'objectiu d'aquesta tesi ha estat estudiar i millorar les tècniques utilitzades en el modelatge de la variabilitat geogràfica del risc de patir o morir d'una determinada malaltia al llarg d'una àrea. Donat que aquestes dades sovint presenten correlació espacial, una metodologia adequada per modelar-les són els models lineals generalitzats mixtos. L'estimació d'aquests models es pot realitzar mitjançant dos perspectives: la bayesiana i la frequentista Des d'un punt de vista bayesià el procediment d'estimació és la fully bayesian y des de la frequentista el mètode més utilitzat és la quasiversosimilitut penalitzada. <br/>El primer objectiu de la tesis ha estat comparar aquests dos procediments. Aquesta comparació s'ha realitzat en termes de biaix i precisió mitjançant un estudi de simulació. La principal conclusió que s'ha obtingut es que els dos procediments no presenten grans diferències tot i que en situacions d'un nombre petit de regions i de casos esperats les estimacions fully bayesian presenten uns resultats més consistents i en canvi amb moltes regions i casos esperats el procediment quasiversemblança penalitzada presenta més precisió en les estimacions. <br/>El segon objectiu ha estat millorar la convergència de l'algoritme de maximització utilitzat en el procediment de la quasiversosimilitud penalitzada quan es modelen dades amb correlació espacial. Aquesta millora s'ha aconseguit reparametritzant la matriu de variàncies i covariàncies dels efectes aleatoris. <br/>El tercer objectiu ha estat buscar mètodes per testar la absència d'un patró geogràfic, és a dir, la existència d'independència espacial. Per això s'han avaluat diverses proves per contrastar aquesta hipòtesis com: el test de Wald, el quocient de versemblances, el Score test, i el AKAIKE information criterion i a més s'ha estudiat el comportament del coeficient de concordança entre matrius. Els principals resultats que s'han obtingut són: el score test es la prova que presenta un millor equilibri entre l'error de tipus I i potència i el coeficient de concordança entre matrius és una mesura útil per prendre decisions sobre independència espacial, sobretot en aquells casos on el nombre de regions, casos esperats i la variància dels efectes aleatoris són petites.<br/>Finalment, s'ha il·lustrat la metodologia presentada al llarg de la tesi mitjançant una aplicació sobre el risc de diabetis tipus I a Catalunya durant els anys 1989 i 1998.


<i>The main objective of this thesis has been to study and to improve the techniques used in the analysis of the geographical variability of the disease risk across a region. In these studies the data are spatial correlated. The useful methodology to analyze this kind of data is the generalized linear mixed models. The estimation of these models can be carried out by two point of view: bayesian and frequentist. From a bayesian point of view, the estimation is done by fully bayesian and from frequentist the approach more used is the penalized quasi likelihood. <br/>The first objective of this thesis has been to compare both approaches. The comparison has been performed in terms of bias and precision by a study of simulation. The main conclusion has been that both approaches don't present great differences but when the number of regions and expected counts are small the Fully Bayesian gives a more consistent results. However when the number of regions and expected counts are large the estimates by the penalized quasilikelihood are more precise. <br/>The second objective has been to improve the convergence of the maximization algorithm used with the approach of the penalized quasi likelihood when the data are spatial correlated. The improvement has been obtained by a reparameterization of the variance and covariance matrix of the random effects. <br/>The third objective has been to introduce the concordance coefficient between matrixes as a useful approach to evaluate the hypothesis of spatial independence. In addition, its performance has been compared to the Wald test, the score test, the likelihood ratio test and the AKAIKE information criterion. The main conclusions have been: the concordance coefficient has been shown to be a useful measure to decide spatial independence, mainly in those cases in which the region number, expected counts and the random effects variance are small and the score test is the test which presents a better balance between type I error and power. <br/>Finally, the results of this thesis has been applied to the Insulin-Dependent Diabetes type I data from Catalonia. </i>

Keywords

Estadística aplicada; Variabilitat geogràfica; Models lineals; Correlació espacial

Subjects

614 - Public health and hygiene. Accident prevention

Knowledge Area

Ciències de la Salut

Documents

TESI_RM_ABELLANA.pdf

2.576Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)