Large Language Models: Language abilities and limitations

Dentella, Vittoria

Large Language Models: Language abilities and limitations

dc.contributor

Universitat Rovira i Virgili. Departament d'Estudis Anglesos i Alemanys

dc.contributor.author

Dentella, Vittoria

dc.date.accessioned

2024-11-14T11:40:28Z

dc.date.issued

2024-09-20

dc.identifier.uri

http://hdl.handle.net/10803/692537

dc.description.abstract

Els models de llenguatge massiu (LLM) s’utilitzen en aplicacions que generen cadenes de text molt semblants al llenguatge natural. Sobre aquesta base, s’ha dotat els LLM de capacitats similars a les humanes, com la comprensió, el raonament i la intel·ligència. A més a més, cada cop es reclama més la seva adopció com a teories cognitives capaces d’explicar el processament del llenguatge en humans. No obstant això, una mirada més atenta revela que els resultats lingüístics dels LLM estan plens d’inconsistències i continguts que cap humà neurotípic produiria, la qual cosa posa en dubte la similitud del coneixement lingüístic que codifiquen amb el llenguatge humà. En aquesta tesi, (1) es descriu de manera general el coneixement sobre morfosintaxi, semàntica i pragmàtica que s’atribueix als LLM; (2) es proporcionen proves experimentals que les similituds entre els resultats dels LLM i el llenguatge natural són només superficials i, per tant, no són qualitativament comparables; i (3) es planteja el debat sobre la tria dels mètodes utilitzats per avaluar les capacitats lingüístiques dels LLM.

dc.description.abstract

Los modelos de lenguaje masivo (LLM) se utilizan en aplicaciones que generan cadenas de texto muy parecidas al lenguaje natural. Sobre esta base, se ha dotado a los LLM de capacidades similares a las humanas, como la comprensión, el razonamiento y la inteligencia. Además, cada vez se reclama más su adopción como teorías cognitivas capaces de explicar el procesamiento del lenguaje en humanos. Sin embargo, una mirada más atenta revela que los resultados lingüísticos de los LLMs están repletos de inconsistencias y contenidos que ningún humano neurotípico produciría, lo que pone en duda la semejanza del conocimiento lingüístico que codifican con el lenguaje humano. En esta tesis, (1) se describe de forma general el conocimiento sobre morfosintaxis, semántica y pragmática que se atribuye a los LLM; (2) se aportan pruebas experimentales de que las similitudes entre los resultados de los LLM y el lenguaje natural son sólo superficiales y, por lo tanto, no son cualitativamente comparables; y (3) se plantea el debate sobre la elección de los métodos utilizados para evaluar las capacidades lingüísticas de los LLM.

dc.description.abstract

Large Language Models (LLMs) are recruited in applications that generate strings of text that closely resemble natural language. On this basis, LLMs have been invested with human-like capabilities such as understanding, reasoning, and intelligence. Additionally, their adoption as cognitive theories capable of explaining language processing in humans is increasingly called for. However, a closer look reveals that the language outputs of LLMs are replete with inconsistencies and content no neurotypical human would produce, casting doubt on the human-likeness of the linguistic knowledge they encode. In this thesis, (1) an outline is drawn of the knowledge over morphosyntax, semantics and pragmatics that LLMs are attributed with; (2) experimental evidence is provided that similarities between LLMs’ outputs and natural language hold only superficially and thus, the two are not qualitatively comparable; and (3) a discussion is offered on the choice of methods used to evaluate the linguistic abilities of LLMs.

dc.format.extent

118 p.

dc.language.iso

eng

dc.publisher

Universitat Rovira i Virgili

dc.rights.license

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

dc.source

TDX (Tesis Doctorals en Xarxa)

dc.subject

models de llenguatge massiu

dc.subject

llenguatge natural

dc.subject

morfosintaxi

dc.subject

modelos de lenguaje masivo

dc.subject

lenguaje natural

dc.subject

large language models

dc.subject

natural language

dc.subject

morphosyntax

dc.subject.other

Arts i humanitats

dc.title

Large Language Models: Language abilities and limitations

dc.type

info:eu-repo/semantics/doctoralThesis

dc.type

info:eu-repo/semantics/publishedVersion

dc.subject.udc

004

dc.subject.udc

159.9

dc.subject.udc

dc.contributor.director

Leivada, Evangelia

dc.contributor.codirector

Oltra Massuet, Maria Isabel

dc.embargo.terms

24 mesos

dc.date.embargoEnd

2026-09-20T02:00:00Z

dc.rights.accessLevel

info:eu-repo/semantics/embargoedAccess

Documentos

Este documento contiene ficheros embargados hasta el dia 20-09-2026

Este ítem aparece en la(s) siguiente(s) colección(ones)

Departament d'Estudis Anglesos i Alemanys [53]

Àrea de contingut