Tourism Surveying from Social Media: The Validity of User-Generated Content (UGC) for the Characterization of Lodging Rankings

Author

Martín Fuentes, Eva

Director

Fernàndez Camon, César

Date of defense

2018-07-18

Pages

169 p.



Department/Institute

Universitat de Lleida. Departament d'Informàtica i Enginyeria Industrial

Abstract

L'objectiu d'aquesta investigació consisteix en determinar si el contingut generat pels usuaris en llocs webs relacionats amb la indústria de l'allotjament valida els sistemes de classificació de qualsevol establiment i plataforma d'allotjament per crear un sistema internacional de classificació d'hotels que pugui servir també per categoritzar qualsevol tipus d'allotjament. Aquesta memòria presenta el treball dut a terme a través de la descàrrega i l'anàlisi de prop de quaranta milions de ressenyes sobre hotels de tot el món descarregades des de TripAdvisor i Booking.com. D’una banda, s’analitza les valoracions dels usuaris sobre establiments d'allotjament per comparar les seves puntuacions i determinar que la posició que ocupen els hotels en el rànquing està molt relacionada entre TripAdvisor i Booking.com. De l'altra, la investigació consisteix en l'anàlisi dels sistemes de classificació d'hotels, demostrant que hi ha una relació entre les valoracions dels usuaris i les categories d'hotels a tot el món, de tal manera que les categories es poden predir a partir del contingut generat pels usuaris a internet, entre d'altres paràmetres. Finalment, a través de tècniques d'aprenentatge automàtic, es crea un model per classificar els establiments d'allotjament siguin tradicionals o plataformes d'allotjament col·laboratiu, com ara Airbnb, per a què convergeixin els diferents sistemes de classificació de tot el món.


El objetivo de esta investigación consiste en determinar si el contenido generado por los usuarios en webs relacionadas con la industria del alojamiento valida los sistemas de clasificación de cualquierestablecimiento y plataforma de alojamiento para crear un sistema internacional de clasificación de hoteles que pueda servir también para categorizar cualquier tipo de alojamiento. Esta memoria presenta el trabajo llevado a cabo a través de la descarga y el análisis de cerca de cuarenta millones de reseñas sobre hoteles de todo el mundo descargadas desde TripAdvisor y Booking.com. Por un lado, esta investigación se centra en analizar la información brindada por los usuarios con sus valoraciones sobre establecimientos de alojamiento para comparar sus puntuaciones y determinar que la posición que ocupan los hoteles en el ranking está muy relacionada entre TripAdvisor y Booking.com. Por el otro, la investigación consiste en el análisis de los sistemas de clasificación de hoteles, demostrando que existe una relación entre las valoraciones de los usuarios y las categorías de hoteles en todo el mundo, de tal manera que las categorías se pueden predecir a partir del contenido generado por los usuarios en internet, entre otros parámetros. Finalmente, a través de técnicas de aprendizaje automático, esta tesis crea un modelo que permite clasificar los establecimientos de alojamiento ya sean tradicionales o plataformas de alojamiento colaborativo, como Airbnb, para que converjan los diferentes sistemas de clasificación de todo el mundo.


The aim of this research is to determine whether online User-Generated Content (UGC) about the lodging industry validates the ranking system of any accommodation property or platform in order to create an international hotel classification system that may also serve to categorize any type of accommodation. This thesis presents the work carried out following the collection and analysis of nearly 40 million reviews of hotels worldwide downloaded from TripAdvisor and Booking.com. On the one hand, this research focuses on the analysis of information provided by users, and specifically their reviews of accommodation properties, to compare their scores and to determine whether the position of a hotel in both ranking systems is closely related. On the other hand, the research consists of the analysis of hotel classification systems. It demonstrates that although international classification systems are not unified, there is a relationship between users’ ratings and hotel categories worldwide. Consequently, categories can be predicted from UGC on the Internet, among other parameters. Finally, through machine learning, this thesis creates a model that allows accommodation properties, whether on traditional or collaborative hosting platforms (e.g., Airbnb), to be classified in such a way that different classification systems worldwide are consistent.

Keywords

Turisme; Boca en boca digital; Classificació hotelera; Turismo; Clasificación hotelera; Tourism; Electronic word of mouth; Hotel classification

Subjects

338 - Economic situation. Economic policy. Management of the economy. Economic planning. Production. Services. Tourism. Prices

Knowledge Area

Organització d'Empreses

Documents

Temf1de1.pdf

3.070Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)