Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
Programa de doctorat en Tecnologies de la Informació i les Comunicacions
Suele admitirse que las colocaciones en el sentido de coocurrencias idiosincráticas de palabras son un reto en el aprendizaje de lenguas. Los estudiantes producen frecuentemente combinaciones “agramaticales”' como *dar una sugerencia o *hacer un paseo. Herramientas computacionales avanzadas de ayuda al aprendizaje de colocaciones serían altamente deseables. Sin embargo, los correctores actuales solo detectan posibles errores y ofrecen como correcciones listas de colocaciones de la base cuya semántica suele ser ignorada. Para abordar estas limitaciones proponemos técnicas de extracción y classificación semántica de colocaciones, que devuelven el(los) colocativo(s) para una base y significado dados y técnicas de detección y clasificación de errores colocacionales. Dado el pequeño tamaño de nuestro corpus de aprendices, también se proponen técnicas para generar un corpus artificial de errores colocacionales para el español.
It is generally acknowledged that collocations in the sense of idiosyncratic word cooccurrences are a challenge in the context of second language learning. Learners often produce “ungrammatical” combinations such as *give a suggestion or *make a walk. Advanced computational tools able to aid L2 learners with collocations are thus highly desirable. However, state-of-the-art “collocation checkers” are merely able to detect a possible miscollocation and offer as correction suggestion a list of collocations of the given keyword whose semantics is often ignored. In order to address these shortcomings we propose techniques for collocation retrieval and semantic classification that retrieve, for a given base and the intended meaning, the actual collocate lexeme(s), and techniques for collocation error detection and classification. Given the small size of our learner corpora, we also provide an algorithm for the generation of an artificial collocation error corpus for Spanish.
Colocaciones; Errores colocacionales; Detección de colocaciones (y errores); Clasificación de colocaciones (y errores); Aprendizaje de lenguas asistido por ordenador; Generación de corpus artificial; Collocation; Collocation errors; Collocation (error) detection; Collocation (error) classification; Computer assisted language learning; Artificial corpus generation
62 - Engineering