Modelos lineales generalizados geoestadísticos basados en distancias

dc.contributor
Universitat de Barcelona. Departament d'Estadística
dc.contributor.author
Melo Martínez, Oscar Orlando
dc.date.accessioned
2013-12-13T08:42:52Z
dc.date.available
2013-12-13T08:42:52Z
dc.date.issued
2013-07-23
dc.identifier.uri
http://hdl.handle.net/10803/127219
dc.description.abstract
En esta tesis se hace una mezcla del método de distancias con los modelos lineales generalizados mixtos tanto en lo espacial como en lo espacio-temporal. Con el empleo de las distancias se logran buenas predicciones y menores variabilidades en el espacio o espacio-tiempo de la región de estudio, provocando todo esto que se tomen mejores decisiones en los diferentes problemas de interés. Se propone un método alternativo para ajustar una variable respuesta tipo beta con dispersión variable usando distancias euclidianas entre los individuos. Se emplea el método de máxima verosimilitud para estimar los parámetros desconocidos del modelo propuesto y se presentan las principales propiedades de estos estimadores. Además, se realiza la inferencia estadística sobre los parámetros utilizando las aproximaciones obtenidas a partir de la normalidad asintótica del estimador de máxima verosimilitud; se desarrolla el diagnóstico y predicción de una nueva observación, y se estudia el problema de datos faltantes utilizando la metodología propuesta. Posteriormente, se propone una solución alterna para resolver problemas como el de prevalencia de Loa loa utilizando distancias euclidianas entre individuos; se describe un modelo lineal generalizado espacial mixto incorporando medidas generales de distancia o disimilaridad que se pueden aplicar a variables explicativas. En este caso, los parámetros involucrados en el modelo propuesto se estiman utilizando máxima verosimilitud mediante el método de Monte Carlo vía cadenas de Markov (MCMC). También se formula un modelo lineal beta espacial mixto con dispersión variable utilizando máxima verosimilitud mediante el método MCMC. El método propuesto se utiliza en situaciones donde la variable respuesta es una razón o proporción que esta relacionada con determinadas variables explicativas. Para este fin, se desarrolla una aproximación utilizando modelos lineales generalizados espaciales mixtos empleando la transformación Box-Cox en el modelo de precisión. Por lo tanto, se realiza el proceso de optimización de los parámetros tanto para modelo espacial de media como para el modelo espacial de dispersión variable. Además, se realiza la inferencia estadística sobre los parámetros utilizando las aproximaciones obtenidas a partir de la normalidad asintótica del estimador de máxima verosimilitud. También se desarrolla el diagnóstico del modelo y la predicción de nuevas observaciones. Por último, el método se ilustra a través de los contenidos de arcilla y magnesio. Adicionalmente, se describe el modelo basado en distancias para la predicción espacio-temporal usando modelos lineales generalizados. Se realiza el proceso de estimación de los parámetros involucrados en el modelo propuesto, mediante el método de ecuaciones de estimación generalizada y la inferencia estadística sobre los parámetros empleando las aproximaciones obtenidas a partir de la normalidad asintótica del estimador de máxima verosimilitud. Además, se desarrolla el diagnóstico del modelo y la predicción de nuevas observaciones. Se realiza una aplicación de la metodología propuesta para el número de acciones armadas estandarizada por cada 1000 km2 de los grupos irregulares FARC-EP y ELN en los diferentes departamentos de Colombia entre los años 2003 a 2009. Finalmente, se presenta un modelo autorregresivo espacial lineal generalizado mixto utilizando el método basado en distancias. Este modelo incluye retrasos tanto espaciales como temporales entre vectores de variables de estado estacionarias. Se utiliza la dinámica espacial de los datos econométricos tipo panel para estimar el modelo propuesto; los parámetros involucrados en el modelo se estiman utilizando el método MCMC mediante máxima verosimilitud. Además, se discute en este capítulo la interacción entre estacionariedad temporal y espacial, y se derivan las respuestas al impulso para el modelo propuesto, lo cual naturalmente depende de la dinámica temporal y espacial del modelo.
spa
dc.description.abstract
In the context of regression with a beta-type response variable, we propose a new method that links two methodologies: a distance-based model, and a beta regression with variable dispersion. The proposed model is useful for those situations where the response variable is a rate, a proportion or parts per million. This variable is related with a mixture between continuous and categorical explanatory variables. We present its main statistical properties and some measures for selection of the most predictive dimensions in the model. Furthermore, the prediction of a new observation and the problem of missing data are also developed. Using the proposed model, the mutual funds are analyzed employing the Gower distance for both the mean model and the variable dispersion model. Also, we present a new method based on distances, which allows the modeling of continuous and non-continuous random variables through distance-based spatial generalized linear mixed models (SGLMMs). The parameters are estimated using Markov chain Monte Carlo (MCMC) maximum likelihood. The method is illustrated through the analysis of the variation in the prevalence of Loa loa among a sample of village residents in Cameroon, where the explanatory variables included elevation, together with maximum normalized-difference vegetation index (NDVI) and the standard deviation of NDVI calculated from repeated satellite scans over time. Additionally, we propose a beta spatial linear mixed model with variable dispersion using MCMC. An approach to the SGLMMs using the Box-Cox transformation in the precision model is developed. Thus, the parameter optimization process is made for both the spatial mean model as the spatial variable dispersion model. Statistical inference over the parameters is performed using approximations obtained from the asymptotic normality of the maximum likelihood estimator. Diagnosis and prediction of a new observation are also developed. This model is illustrated through of the clay and magnesium contents. On the other hand, we present a solution to problems where the response variable is a count, a rate or a binary (dichotomous) using a refined distance-based generalized linear space-time-autoregressive model with space-time-autoregressive disturbances. This model may also contain additional spatial exogenous variables as well as time exogenous variables. The parameter estimation process is done by the space-time generalized estimating equations (GEE) method, and a measure of goodness-of-fit is presented. Also, the best linear unbiased predictor for prediction purposes is presented. An application for the standardized number of armed actions per 1000 km2 of rebel groups FARC-EP and ELN in different departments of Colombia from 2003 to 2009 is employed to illustrate the proposed methodology. Finally, a spatial generalized linear mixed autoregressive model using distance-based is defined including spatial as well as temporal lags between vectors of stationary state variables. Although the structural parameters are not fully identified in this model, contemporaneous spatial lag coefficients may be identified by exogenous state variables. Dynamic spatial panel data econometrics is used to estimate our proposed model. In this way, the parameters are estimated using MCMC maximum likelihood. We also discuss the interaction between temporal and spatial stationarity, and we derive the impulse responses for our model, which naturally depend upon the temporal and spatial dynamics of the model.
eng
dc.format.extent
245 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
spa
cat
dc.publisher
Universitat de Barcelona
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Models lineals (Estadística)
cat
dc.subject
Modelos lineales (Estadística)
cat
dc.subject
Linear models (Statistics)
cat
dc.subject
Equacions
cat
dc.subject
Ecuaciones
cat
dc.subject
Equations
cat
dc.subject
Mètode de Montecarlo
cat
dc.subject
Método de Montecarlo
cat
dc.subject
Monte Carlo method
cat
dc.subject
Processos de Markov
cat
dc.subject
Procesos de Markov
cat
dc.subject
Markov processes
cat
dc.subject.other
Ciències Experimentals i Matemàtiques
cat
dc.title
Modelos lineales generalizados geoestadísticos basados en distancias
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
311
cat
dc.contributor.director
Mateu, Jorge
dc.contributor.tutor
Oller i Sala, Josep Maria
dc.embargo.terms
cap
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.dl
B. 29307-2013
cat


Documents

OOMM_TESIS.pdf

12.11Mb PDF

Aquest element apareix en la col·lecció o col·leccions següent(s)