Collocation and collocation error processing in the context of second language learning

Author

Rodríguez Fernández, Sara

Director

Wanner, Leo

Date of defense

2018-03-19

Pages

165 p.



Department/Institute

Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions

Doctorate programs

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Abstract

Suele admitirse que las colocaciones en el sentido de coocurrencias idiosincráticas de palabras son un reto en el aprendizaje de lenguas. Los estudiantes producen frecuentemente combinaciones “agramaticales”' como *dar una sugerencia o *hacer un paseo. Herramientas computacionales avanzadas de ayuda al aprendizaje de colocaciones serían altamente deseables. Sin embargo, los correctores actuales solo detectan posibles errores y ofrecen como correcciones listas de colocaciones de la base cuya semántica suele ser ignorada. Para abordar estas limitaciones proponemos técnicas de extracción y classificación semántica de colocaciones, que devuelven el(los) colocativo(s) para una base y significado dados y técnicas de detección y clasificación de errores colocacionales. Dado el pequeño tamaño de nuestro corpus de aprendices, también se proponen técnicas para generar un corpus artificial de errores colocacionales para el español.


It is generally acknowledged that collocations in the sense of idiosyncratic word cooccurrences are a challenge in the context of second language learning. Learners often produce “ungrammatical” combinations such as *give a suggestion or *make a walk. Advanced computational tools able to aid L2 learners with collocations are thus highly desirable. However, state-of-the-art “collocation checkers” are merely able to detect a possible miscollocation and offer as correction suggestion a list of collocations of the given keyword whose semantics is often ignored. In order to address these shortcomings we propose techniques for collocation retrieval and semantic classification that retrieve, for a given base and the intended meaning, the actual collocate lexeme(s), and techniques for collocation error detection and classification. Given the small size of our learner corpora, we also provide an algorithm for the generation of an artificial collocation error corpus for Spanish.

Keywords

Colocaciones; Errores colocacionales; Detección de colocaciones (y errores); Clasificación de colocaciones (y errores); Aprendizaje de lenguas asistido por ordenador; Generación de corpus artificial; Collocation; Collocation errors; Collocation (error) detection; Collocation (error) classification; Computer assisted language learning; Artificial corpus generation

Subjects

62 - Engineering

Documents

tsrf.pdf

1.560Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)