Exploración de procedimientos semiautomáticos para el proceso de indexación en el entorno web

dc.contributor
Universitat Pompeu Fabra. Departament de Comunicació
dc.contributor.author
Vàllez Letrado, Mari
dc.date.accessioned
2016-02-25T13:03:02Z
dc.date.available
2016-06-19T05:45:10Z
dc.date.issued
2015-12-22
dc.identifier.uri
http://hdl.handle.net/10803/359393
dc.description.abstract
La ingente cantidad de información que existe actualmente hace necesario el desarrollo de herramientas, métodos y procesos que faciliten el acceso a la misma. Especialmente, se requieren sistemas de información que sean eficientes y precisos. Las técnicas de indexación cuentan con una larga tradición en este ámbito. Sin embargo, su aplicación a gran escala y en el contexto de la Web no siempre es viable por la magnitud y la heterogeneidad de la información presente en ella. En esta tesis se presentan dos propuestas para facilitar el proceso de indexación de documentos en Internet. La primera se caracteriza por el uso de técnicas de indexación semiautomáticas basadas en aspectos de posicionamiento web, que se aplican a través de una herramienta propia denominada DigiDoc MetaEdit. La segunda propone un modelo para la actualización de vocabularios controlados a partir del procesamiento de los logs de las búsquedas formuladas por los usuarios en los buscadores.
dc.description.abstract
La ingent quantitat d'informació que hi ha actualment fa necessari el desenvolupament d'eines, mètodes i processos que facilitin l'accés a la mateixa. Especialment, es requereixen sistemes d'informació que siguin eficients i precisos. Les tècniques d'indexació compten amb una llarga tradició en aquest àmbit. No obstant això, la seva aplicació a gran escala i en el context de la web no sempre és viable per la magnitud i heterogeneïtat de la informació present en ella. En aquesta tesi es presenten dues propostes per a facilitar el procés d'indexació de documents a Internet. La primera es caracteritza per l'ús de tècniques d'indexació semiautomàtiques basades en aspectes de posicionament web, i que s'apliquen a través d'una eina pròpia anomenada DigiDoc MetaEdit. La segona proposa un model per a l'actualització de vocabularis controlats a partir del processament dels logs de les cerques formulades pels usuaris als cercadors.
dc.description.abstract
The vast amount of information that currently exists necessitates the development of tools, methods and processes that facilitate access to it. In particular, information systems that are efficient and accurate are required. Indexing techniques have a long tradition of promoting the improvement of these systems. However, its application on a large scale and in the context of the Web is not always feasible because of the magnitude and diversity of the information in it. This thesis presents two proposals to facilitate the process of indexing documents on the Internet. The first is characterized by the use of semi-automatic indexing techniques based on aspects of SEO, and applied through a proprietary tool called DigiDoc MetaEdit. The second proposes a model for updating controlled vocabularies from the processing of logs of searches made by users on search engines.
dc.format.extent
135 p.
dc.format.mimetype
application/pdf
dc.language.iso
spa
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/3.0/es/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-nd/3.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Indexación
dc.subject
Anotación semántica
dc.subject
Vocabulario controlado
dc.subject
Web semántica
dc.subject
Metadatos
dc.subject
Recuperación de información
dc.subject
Logs de consultas
dc.subject
Palabras clave
dc.title
Exploración de procedimientos semiautomáticos para el proceso de indexación en el entorno web
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
dc.contributor.authoremail
mari.vallez@upf.edu
dc.contributor.director
Pedraza, Rafael
dc.contributor.director
Rovira, Cristòfol
dc.embargo.terms
cap
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Comunicació


Documents

tmv.pdf

4.176Mb PDF

This item appears in the following Collection(s)