La imputación múltiple y su aplicación a series temporales financieras

Author

Cano Berlanga, Sebastian

Director

Borrell Vidal, Máximo

Tutor

Pelez Lacasata, Maria Jose

Date of defense

2013-11-19

Legal Deposit

T.76-2014

Pages

197 p.



Department/Institute

Universitat Rovira i Virgili. Departament d'Economia

Abstract

Cuando una base de datos presenta valores no disponibles (NA ó missings), su análisis es imposible hasta que no se decida lo que hacer con ellos. A tal efecto, la literatura ha desarrollado distintos enfoques para enfrentarse a este problema. Los primero métodos fueron los basados en regresión (Yates [1933]), y posteriormente se utilizaron algoritmos basados en la función de verosimilitud (algoritmo EM). Rubin [1987] estudia el problema de los NA y pone de manifiesto que los algoritmos mencionados son de imputación única y, entre sus inconvenientes más importantes, destaca la omisión de la incertidumbre que causa la presencia de los missings en el ulterior análisis. Para tal fin, Rubin [1987] propone la imputación múltiple, cuyo objetivo es la medición de la incertidumbre omitida por los métodos de imputación única, lo que se consigue mediante dos herramientas: algoritmos MCMC y la inferencia de Rubin. La imputación múltiple se ha utilizado únicamente en el campo de los datos de sección cruzada, y esta Tesis pretende extender su aplicación al campo de la series temporales financieras. Para tal fin, se estudian las técnicas que sobre las que se fundamentan los métodos MCMC, la inferencia de Rubin y los modelos heteroscedásticos condicionados. El resultado es la imputación mediante separación, que consigue adaptar la técnica de imputación múltiple a las series temporales financieras mediante la combinación de un filtro asimétrico, un método Bootstrap y el conocido algoritmo GibbsSampling. La Tesis se extiende con un librería programada en lenguaje R, de próxima incorporación en el cuerpo de librerías contribuidas en el portal oficial del citado lenguaje, que implementa el método propuesto.


When a database contains missing values, the forthcoming analysis becomes impossible until one decides how to deal with them. That is the reason why the literature has developed different ways to solve problems associated with NA values. The first methods of this specific literature were regression-based (Yates [1933]), but later more sophisticated algorithms were available (EM algorithm). Rubin [1987] makes a deep analysis on the topic and develops Multiple Imputation, a Monte Carlo technique in which the missing values are replaced by m>1 simulated versions, where m is typically small (e.g. 3-10). In Rubin's method for `repeated imputation' inference, each of the simulated complete datasets is analyzed by standard methods, and the results are combined to produce estimates and confidence intervals that incorporate missing-data uncertainty. Multiple Imputation has been widely used in cross section studies but not in time series. This doctoral thesis aims to extend Multiple Imputation to longitudinal studies, specifically to financial time series. To do so, we propose a method based on an asymmetric filter which splits the original time series in conditional variance and innovations. This procedure allows us to generate plausible values combining the algorithms Gibbs Sampling and Approximate Bayesian Bootstrap. The validity of the proposed method is discussed through extensive tests on different financial time series (firms and market indices). The analysis of empirical tests displays that, after imputing the data, they maintain its individual characteristics. Furthermore, results exhibit high precision in the shape parameter of the conditional distribution of returns, and densities of both conditional variance and innovations.

Keywords

Econometría; Múltiple Imputation; MCMC; Missing Data

Subjects

311 - Statistics as a science. Statistical theory; 33 - Economics. Economic science

Documents

tesisTDX.pdf

3.543Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)