Interpreting the learning dynamics of language models

Weber, Lucas

Interpreting the learning dynamics of language models

Autor/a

Weber, Lucas

Director/a

Hupkes, Dieuwke

Bruni, Elia

Fecha de defensa

2024-05-03

Páginas

208 p.

Departamento/Instituto

Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge

Programa de doctorado

Programa de Doctorat en Traducció i Ciències del Llenguatge

Resumen

Language models (LMs) have evolved to become remarkably capable yet similarly complex and intransparant systems. Our ability to understand how they achieve their outstanding traits – i.e. making them interpretable – can be achieved from different angles. In this dissertation, I analyse the learning dynamics of LMs and seek to understand the relationship between the properties of training data and the models’ generalization behaviours. I introduce a framework that links generalisation with conceptual knowledge, specifically linguistic theory, which can be used for model analysis or model-driven hypothesis testing. This approach is applied to analyze the pre-training process of LMs. Furthermore, I delve into the dynamics of new learning paradigms, such as in-context learning, contributing to our understanding of their inconsistent prediction behaviour. Recognizing that the analysis of complex systems often demands holistic methods, this dissertation emphasizes and employs innovative and systematic methodologies for interpretability.

Els models de llenguatge (MLs) han evolucionat per esdevenir notablement capac¸os, però al mateix temps són sistemes complexos i poc transparents. La nostra capacitat per entendre com aconsegueixen aquestes característiques destacades – és a dir, fent-los interpretables – es pot aconseguir des de diferents punts de vista. En aquesta dissertació, analitzo la dinàmica d’aprenentatge dels MLs. Introdueixo un marc que enllaça la generalització amb el coneixement conceptual, específicament la teoria lingüística, que pot ser utilitzat per a l’anàlisi del model o per a la prova d’hipòtesis dirigida pel model. Aquest enfocament s’aplica per analitzar el procés de pre-entrenament dels MLs. A més, m’endinso en la dinàmica de nous paradigmes d’aprenentatge, com ara el in-context learning, il·luminant les raons del seu comportament de predicció inconsistent. Reconèixer que l’anàlisi de sistemes complexos sovint exigeix mètodes holístics, aquesta dissertació emfatitza i utilitza metodologies innovadores i sistemàtiques per a la interpretabilitat.

Palabras clave

Language models; Models de llenguatge

Materias

81 - Lingüística y lenguas

Documentos

tlw.pdf

8.916Mb

Exportar

DIDL MARC MARC_CCUC METS OAI_DC ORE QDC RDF

Derechos

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Programa de Doctorat en Traducció i Ciències del Llenguatge [314]

Interpreting the learning dynamics of language models

Autor/a

Director/a

Fecha de defensa

Páginas

Compartir

Departamento/Instituto

Programa de doctorado

Resumen

Palabras clave

Materias

Documentos

Exportar

Derechos

Este ítem aparece en la(s) siguiente(s) colección(ones)