Exploiting verb similarity for event modelling

Author

Gil Vallejo, Lara

Director

Coll-Florit, Marta

Castellón Masalles, Irene

Date of defense

2020-03-20

Pages

169 p.



Department/Institute

Universitat Oberta de Catalunya. Internet Interdisciplinary Institut (IN3)

Abstract

Aquest treball s'emmarca en l'àmbit del processament del llenguatge natural. Té l'objectiu d'explorar el potencial de la similitud verbal i, més concretament, de les classificacions verbals, a l'hora de capturar i modelitzar la informació bàsica relacionada amb l'expressió d'esdeveniments en espanyol. La tesi s'articula entorn de dos estudis que examinen la capacitat que té la similitud verbal de modelitzar la informació relativa als participants en esdeveniments. En primer lloc, elaborem una anàlisi de la similitud verbal amb relació a l'estructura argumental. Amb aquesta finalitat, partim de tres perspectives que tracten aquest tema: la lingüística teòrica, la lingüística de corpus i la psicolingüística, i analitzem com cadascuna defineix la similitud entre els verbs. Aquesta anàlisi ens serveix per a definir un conjunt de característiques lingüístiques i configuracions que s'apliquen en el segon estudi. Aquest estudi consisteix en la creació d'una classificació automàtica de sentits verbals amb l'ús d'un algorisme de clusterització (clustering). L'objectiu d'aquesta classificació és capturar l'estructura argumental dels verbs i reflectir-la en les classes, de tal manera que permeti modelitzar els participants en els esdeveniments expressats pels verbs. Les troballes ens permeten afirmar que la classificació verbal organitza la informació de manera que és capaç d'acomodar diferents aspectes de l'estructura argumental.


Este trabajo se enmarca dentro del ámbito del procesamiento del lenguaje natural. Su objetivo es explorar el potencial de la similitud verbal y, más concretamente, de las clasificaciones verbales, a la hora de capturar y modelizar la información básica relacionada con la expresión de acontecimientos en español. La tesis se articula en torno a dos estudios que examinan la capacidad de la similitud verbal para modelizar la información relativa a los participantes en acontecimientos. En primer lugar, elaboramos un análisis de la similitud verbal con relación a la estructura argumental. Para ello tomamos tres perspectivas que tratan este tema: la lingüística teórica, lingüística de corpus y la psicolingüística, y analizamos de qué modo cada una de ellas define la similitud entre los verbos. Este análisis nos sirve para definir un conjunto de características lingüísticas y configuraciones que se aplican en el segundo estudio. Este estudio consiste en la creación de una clasificación automática de sentidos verbales usando un algoritmo de agrupamiento (clustering). El objetivo de esta clasificación es capturar la estructura argumental de los verbos y reflejarla en las clases, de tal manera que permita modelizar a los participantes en los acontecimientos expresados por los verbos. Los hallazgos nos permiten afirmar que la clasificación verbal organiza la información de manera que es capaz de acomodar diferentes aspectos de la estructura argumental.


This paper aims to explore the potential of verb similarity, and more specifically of verb classifications, when it comes to capturing and modelling basic information related to events expressed in Spanish. The research is based on two studies that examine verb similarity's ability to model event participant information. We first perform a study of verb similarity with respect to argument structure, looking at its relevant characteristics through the lens of three different perspectives: linguistic theory, corpus linguistics and psycholinguistics. Based on this analysis, we choose the features and configurations to be explored in order to create an automatic classification of verb senses using a clustering algorithm. The aim of this automatic classification is to capture the argument structure of the verbs and apply it to the classifications in a way that allows us to adequately model the participants in the events expressed by those verbs. The evaluations carried out for this verb classification confirm automatic classifications' ability to capture and infer relevant information related to participants in events.

Keywords

verbs; estructura argumental; rols semàntics; similitud; verbos; estructura argumental; roles semánticos; similitud; verbs; argument structure; semantic roles; similarity

Subjects

00 – Science and knowledge. Research. Culture. Humanities

Knowledge Area

Lingüística

Documents

tesis_Lara_Gil.pdf

14.18Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)