Thompson sampling and noisy decision-making

dc.contributor
Universitat Pompeu Fabra. Departament d'Economia i Empresa
dc.contributor.author
Mauersberger, Felix
dc.date.accessioned
2018-09-19T11:44:59Z
dc.date.available
2019-12-24T02:00:10Z
dc.date.issued
2018-06-27
dc.identifier.uri
http://hdl.handle.net/10803/659084
dc.description.abstract
En esta tesis estudio cómo los agentes económicos forman creencias en situaciones de interacción estratégica repetida. En economía, los modelos de formación de creencias suelen ser deterministas en el sentido de que las creencias son una función determinista de los datos presentados al responsable de la toma de decisiones. En esta tesis, propongo en cambio considerar las creencias como estocásticas. La estocasticidad se ha introducido en una amplia gama de teorías económicas en forma de shocks exógenos. Sin embargo, experimentos de laboratorio han demostrado que el nivel de aleatoriedad varía considerablemente entre entornos y en el tiempo. Por lo tanto, propongo el uso del muestreo de Thompson, un modelo que proviene de la literatura del problema del bandido. En el muestreo de Thompson los agentes actualizan sus distribuciones de probabilidad subjetivas de forma bayesiana, pero en lugar de hacer un uso óptimo de la distribución a posteriori, realizan una extracción aleatoria de la misma. Dado el resulto de la extracción, los agentes eligen la acción óptima. Dado que la aleatoriedad se rige por la distribución a posteriori y que ésta se actualíza con la incorporación de nueva información, el muestreo de Thompson ayuda a explicar la evolución endógena de la aleatoriedad. En el primer capítulo, muestro que el muestreo de Thompson es consistente con la evidencia experimental en una multitud de escenarios, incluyendo juegos simples de 2x2 con información perfecta y concursos de belleza sin conocimiento estructural. En el segundo capítulo (conjuntamente con Rosemarie Nagel), mostramos que el muestreo de la distribución bayesiana a posteriori puede explicar la dinámica en un mercado oligopólico de vendedores de periódicos, utilizando los datos de Nagel y Vriend (1999). En el tercer capítulo, presento un diseño experimental basado en el modelo neokeynesiano para investigar cómo la política monetaria influye en la formación de expectativas. Además, con los datos provenientes de dicho experimento, demuestro que el método de Thompson puede explicar la dinámica de las distintas variables macroeconómicas bajo diferentes reglas de política monetaria.
en_US
dc.description.abstract
In this thesis, I study how economic agents form beliefs in situations of repeated strategic interaction. Models of belief formation in economics are usually deterministic in the sense that beliefs are a deterministic function of the data presented to the decision-maker. In this thesis, I propose instead considering beliefs as stochastic. Stochasticity has been introduced to a wide range of economic theories in the form of exogenous shocks. However, laboratory experiments have shown that the amount of randomness varies considerably across environments and over time. Therefore, I propose the use of Thompson Sampling, a model originating from the bandit literature. Thompson Sampling means that agents update their subjective probability distributions in a Bayesian way, but instead of making optimal use of the posterior, they make a random draw from the posterior. Conditionally on that random draw, agents choose the optimal action. Since randomness is thus governed by the posterior, being updated as new information becomes available, Thompson Sampling helps explain endogenously evolving randomness. In the first chapter, I show that Thompson Sampling is consistent with experimental evidence in a variety of settings, including simple 2x2 games with perfect information and beauty-contest type of games without structural knowledge. In the second chapter (co-authored with Rosemarie Nagel), we show that sampling from the Bayesian posterior can explain the dynamics in an oligopolistic newsvendor market, using the data of Nagel and Vriend (1999). In the third chapter, I introduce an experimental design based on the New-Keynesian model to investigate how monetary policy influences expectation formation. Using this experimental dataset, I show that Thompson Sampling can explain the dynamics of the macroeconomic variables under different monetary policy rules.
en_US
dc.format.extent
112 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Método de Thompson
en_US
dc.subject
Thompson sampling
en_US
dc.title
Thompson sampling and noisy decision-making
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
33
en_US
dc.contributor.authoremail
felix.mauersberger@upf.edu
en_US
dc.contributor.director
Nagel, Rosemarie
dc.embargo.terms
18 mesos
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Economia, Finances i Empresa


Documents

tfm.pdf

1.174Mb PDF

Aquest element apareix en la col·lecció o col·leccions següent(s)