Collocation and collocation error processing in the context of second language learning

Autor/a

Rodríguez Fernández, Sara

Director/a

Wanner, Leo

Fecha de defensa

2018-03-19

Páginas

165 p.



Departamento/Instituto

Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions

Programa de doctorado

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Resumen

Suele admitirse que las colocaciones en el sentido de coocurrencias idiosincráticas de palabras son un reto en el aprendizaje de lenguas. Los estudiantes producen frecuentemente combinaciones “agramaticales”' como *dar una sugerencia o *hacer un paseo. Herramientas computacionales avanzadas de ayuda al aprendizaje de colocaciones serían altamente deseables. Sin embargo, los correctores actuales solo detectan posibles errores y ofrecen como correcciones listas de colocaciones de la base cuya semántica suele ser ignorada. Para abordar estas limitaciones proponemos técnicas de extracción y classificación semántica de colocaciones, que devuelven el(los) colocativo(s) para una base y significado dados y técnicas de detección y clasificación de errores colocacionales. Dado el pequeño tamaño de nuestro corpus de aprendices, también se proponen técnicas para generar un corpus artificial de errores colocacionales para el español.


It is generally acknowledged that collocations in the sense of idiosyncratic word cooccurrences are a challenge in the context of second language learning. Learners often produce “ungrammatical” combinations such as *give a suggestion or *make a walk. Advanced computational tools able to aid L2 learners with collocations are thus highly desirable. However, state-of-the-art “collocation checkers” are merely able to detect a possible miscollocation and offer as correction suggestion a list of collocations of the given keyword whose semantics is often ignored. In order to address these shortcomings we propose techniques for collocation retrieval and semantic classification that retrieve, for a given base and the intended meaning, the actual collocate lexeme(s), and techniques for collocation error detection and classification. Given the small size of our learner corpora, we also provide an algorithm for the generation of an artificial collocation error corpus for Spanish.

Palabras clave

Colocaciones; Errores colocacionales; Detección de colocaciones (y errores); Clasificación de colocaciones (y errores); Aprendizaje de lenguas asistido por ordenador; Generación de corpus artificial; Collocation; Collocation errors; Collocation (error) detection; Collocation (error) classification; Computer assisted language learning; Artificial corpus generation

Materias

62 - Ingeniería. Tecnología

Documentos

tsrf.pdf

1.560Mb

 

Derechos

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

Este ítem aparece en la(s) siguiente(s) colección(ones)