dc.contributor
Universitat Autònoma de Barcelona. Departament de Ciències de la Computació
dc.contributor.author
Ferrer Aran, Xavier
dc.date.accessioned
2017-09-14T13:59:49Z
dc.date.available
2017-09-14T13:59:49Z
dc.date.issued
2017-06-07
dc.identifier.isbn
978844907172277
dc.identifier.uri
http://hdl.handle.net/10803/405665
dc.description.abstract
Milions de persones interactuen i comparteixen informació cada dia a la Web. Des de
converses intranscendents fins a comentaris sobre productes en tendes online, el contingut
generat per les persones a la Web és enorme i divers. I entre aquests continguts n’hi ha un
particularment interessant: les experiències. La gent escolta, llegeix i considera les
experiències d’altri abans de prendre decisions, com per exemple comprar-se una càmera
digital o anar de viatge a algun lloc exòtic. I quan aquestes experiències estan guardades a la
Web, són accessibles per un gran nombre de persones.
Malauradament, aquest contingut no és fàcilment accessible: Una persona interessada en
anar-se’n de vacances a un hotel probablement llegirà unes quantes experiències d’altra gent
que ha anat prèviament a aquest hotel per descobrir que n’opinen, però segurament no podrà
llegir-les totes. D’aquesta manera ignorarà informació i experiències d’altra gent que li haurien
estat profitoses de cara al seu viatge. Així doncs, considerem que hi ha una clara necessitat
d’un anàlisis més profund d’aquesta informació continguda en les experiències de persones,
per facilitar-ne el seu ús.
El nostre enfocament es troba en el context de la Web de les Experiències, i es basa en
extreure i adquirir coneixement pràctic d’experiències individuals respecte entitats del món real
expressades en forma textual. A més a més, aquest coneixement han de ser tractat i
representat de manera que permeti la seva reutilització per altres persones amb diferents
interessos i preferències. Aquest procés està dividit en tres parts: Primer, extraiem les paraules
més important utilitzades en les experiències de les diferents persones per descriure opinions
sobre entitats. Seguidament, utilitzant el conjunt de paraules extretes, les agrupem en
conceptes i creem un vocabulari de conceptes, que ens ajuda a descobrir els aspectes més
importants de cada entitat segons les experiències viscudes per cada individu. Finalment,
utilitzant el vocabulari de conceptes, creem els aplecs d’arguments de cada entitat. Els aplecs
d’arguments caracteritzen els pros i els cons de cada entitat, i agreguen el coneixement pràctic
extret de les experiències escrites per cada individu. A més amés, demostrem que els aplecs
d’arguments, a part de ser útils per a representar el coneixement pràctic de les experiències,
permeten fer inferència sobre quina entitat és la més adequada per cada individual, considerant
el conjunt de preferències de cada individu.
En aquesta tesi avaluem els aplecs d’arguments amb les puntuacions dels productes d’Amazon
i les caracteritzacions de les càmeres de Dpreview, una web especialitzada en càmeres
digitals. Demostrem com els arguments pro i con dels nostres aplecs d’arguments són molt
semblants als presentats a Dpreview, fet que demostra la qualitat dels aplecs creats. Finalment,
demostrem que les classificacions (rankings) de productes obtinguts amb la nostra
implementació i els de Dpreview són molt semblants, mentre que la classificació donada per
Amazon no s’assembla a cap de les altres dues.
dc.description.abstract
Millions of people interact and share interesting information every day in the Social Web. From
daily conversations to comments about products in e-commerce sites, the content generated by
people in these sites is huge and diverse. Among the wide diversity of user-contributed content
on the web, there is a particular kind that has the potential of being put to good use by intelligent
systems: human experiences. People very often use other people's experiences before making
decisions, and when these kind of human experiences are expressed and recorded on the web,
they can be shared with by large number of people.
Nevertheless sometimes this content is not easily accessible, so a person trying to book a hotel
may read a few reviews over a few hotels - but cannot possibly read them all. There is a clear
need for an in-depth analysis of this kind of information, based on textual expressions of human
particular experiences.
Our approach, in the framework of the Web of Experiences, aims at acquiring practical
knowledge from individual experiences with entities in the real world expressed in textual form.
Moreover, this knowledge has to be represented in a way that facilitates the reuse of the
experiential knowledge by other individuals with different preferences. Our approach has three
stages: First, we extract the most salient set of aspects used by the individuals to describe their
experiences with the entities in a domain. Second, using the set of extracted aspects, we group
them in concepts to create a concept vocabulary that models the set of issues addressed in the
reviews. Third, using the vocabulary of concepts, we create a bundle of arguments for each
entity. An argument bundle characterizes the pros and cons of an entity, aggregating practical
knowledge from judgments written by individuals with different biases and preferences.
Moreover, we show how argument bundles allow us to define the notions of user query and the
satisfaction degree of a bundle by a user query, proving that argument bundles are not only
capable of representing practical knowledge but they are also useful to perform inference given
a set of user preferences specified in a query.
We evaluate the argument bundles of our approach with the Amazon score ratings and the
camera characterizations of Dpreview. We show that pro and con arguments are very close to
those listed in Dpreview. Evaluating entity rankings, we show that Dpreview and our approach
give congruent rankings, while Amazon's is not congruent neither with Dpreview's or ours.
dc.format.mimetype
application/pdf
dc.publisher
Universitat Autònoma de Barcelona
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Web de les experiències
dc.subject
Web de las experiencias
dc.subject
Experience web
dc.subject
Intel·ligència artificial
dc.subject
Inteligencia artificial
dc.subject
Artificial inteliigence
dc.subject
Anàlisi del sentiment
dc.subject
Análisis del sentimiento
dc.subject
Sentiment analysis
dc.subject.other
Tecnologies
dc.title
Concept discovery and argument bundles in the web of experiences
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
xferrer@iiia.csic.es
dc.contributor.director
Plaza, Enric, 1957-
dc.contributor.tutor
Toledo Morales, Ricardo
dc.rights.accessLevel
info:eu-repo/semantics/openAccess