Thompson sampling and noisy decision-making

Mauersberger, Felix

Thompson sampling and noisy decision-making

dc.contributor

Universitat Pompeu Fabra. Departament d'Economia i Empresa

dc.contributor.author

Mauersberger, Felix

dc.date.accessioned

2018-09-19T11:44:59Z

dc.date.available

2019-12-24T02:00:10Z

dc.date.issued

2018-06-27

dc.identifier.uri

http://hdl.handle.net/10803/659084

dc.description.abstract

En esta tesis estudio cómo los agentes económicos forman creencias en situaciones de interacción estratégica repetida. En economía, los modelos de formación de creencias suelen ser deterministas en el sentido de que las creencias son una función determinista de los datos presentados al responsable de la toma de decisiones. En esta tesis, propongo en cambio considerar las creencias como estocásticas. La estocasticidad se ha introducido en una amplia gama de teorías económicas en forma de shocks exógenos. Sin embargo, experimentos de laboratorio han demostrado que el nivel de aleatoriedad varía considerablemente entre entornos y en el tiempo. Por lo tanto, propongo el uso del muestreo de Thompson, un modelo que proviene de la literatura del problema del bandido. En el muestreo de Thompson los agentes actualizan sus distribuciones de probabilidad subjetivas de forma bayesiana, pero en lugar de hacer un uso óptimo de la distribución a posteriori, realizan una extracción aleatoria de la misma. Dado el resulto de la extracción, los agentes eligen la acción óptima. Dado que la aleatoriedad se rige por la distribución a posteriori y que ésta se actualíza con la incorporación de nueva información, el muestreo de Thompson ayuda a explicar la evolución endógena de la aleatoriedad. En el primer capítulo, muestro que el muestreo de Thompson es consistente con la evidencia experimental en una multitud de escenarios, incluyendo juegos simples de 2x2 con información perfecta y concursos de belleza sin conocimiento estructural. En el segundo capítulo (conjuntamente con Rosemarie Nagel), mostramos que el muestreo de la distribución bayesiana a posteriori puede explicar la dinámica en un mercado oligopólico de vendedores de periódicos, utilizando los datos de Nagel y Vriend (1999). En el tercer capítulo, presento un diseño experimental basado en el modelo neokeynesiano para investigar cómo la política monetaria influye en la formación de expectativas. Además, con los datos provenientes de dicho experimento, demuestro que el método de Thompson puede explicar la dinámica de las distintas variables macroeconómicas bajo diferentes reglas de política monetaria.

en_US

dc.description.abstract

In this thesis, I study how economic agents form beliefs in situations of repeated strategic interaction. Models of belief formation in economics are usually deterministic in the sense that beliefs are a deterministic function of the data presented to the decision-maker. In this thesis, I propose instead considering beliefs as stochastic. Stochasticity has been introduced to a wide range of economic theories in the form of exogenous shocks. However, laboratory experiments have shown that the amount of randomness varies considerably across environments and over time. Therefore, I propose the use of Thompson Sampling, a model originating from the bandit literature. Thompson Sampling means that agents update their subjective probability distributions in a Bayesian way, but instead of making optimal use of the posterior, they make a random draw from the posterior. Conditionally on that random draw, agents choose the optimal action. Since randomness is thus governed by the posterior, being updated as new information becomes available, Thompson Sampling helps explain endogenously evolving randomness. In the first chapter, I show that Thompson Sampling is consistent with experimental evidence in a variety of settings, including simple 2x2 games with perfect information and beauty-contest type of games without structural knowledge. In the second chapter (co-authored with Rosemarie Nagel), we show that sampling from the Bayesian posterior can explain the dynamics in an oligopolistic newsvendor market, using the data of Nagel and Vriend (1999). In the third chapter, I introduce an experimental design based on the New-Keynesian model to investigate how monetary policy influences expectation formation. Using this experimental dataset, I show that Thompson Sampling can explain the dynamics of the macroeconomic variables under different monetary policy rules.

en_US

dc.format.extent

112 p.

en_US

dc.format.mimetype

application/pdf

dc.language.iso

eng

en_US

dc.publisher

Universitat Pompeu Fabra

dc.rights.license

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

dc.source

TDX (Tesis Doctorals en Xarxa)

dc.subject

Método de Thompson

en_US

dc.subject

Thompson sampling

en_US

dc.title

Thompson sampling and noisy decision-making

en_US

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.subject.udc

en_US

dc.contributor.authoremail

felix.mauersberger@upf.edu

en_US

dc.contributor.director

Nagel, Rosemarie

dc.embargo.terms

18 mesos

en_US

dc.rights.accessLevel

info:eu-repo/semantics/openAccess

dc.description.degree

Programa de doctorat en Economia, Finances i Empresa

Documents

tfm.pdf

1.174Mb PDF

Aquest element apareix en la col·lecció o col·leccions següent(s)

Programa de Doctorat en Economia, Finances i Empresa [325]