GLU - A Gradient Model for Language Universals. A Computational Revisitation of Greenberg Universals

Author

Brosa Rodríguez, Antoni

Director

Jiménez López, Dolores

Date of defense

2024-04-12

Pages

660 p.



Department/Institute

Universitat Rovira i Virgili. Departament de Filologies Romàniques

Abstract

Aquesta tesi doctoral se situa en l'àmbit de la tipologia lingüística i proposa un enfocament innovador per a classificar els universals tipològics, centrant-se en la presència d'excepcions. S'utilitza la lògica difusa per a entendre la universalitat com un continu, i es presenta una aproximació computacional als universals de Greenberg. La justificació de la recerca es basa en la revolució en la tipologia lingüística introduïda per Greenberg. Al llarg del temps, diversos lingüistes van intentar millorar els resultats de Greenberg, però l'interès va disminuir a finals del segle XX. No obstant això, en l'última dècada, l'auge de la lingüística computacional i l'accés a corpus lingüístics han revitalitzat l'estudi dels universals tipològics. La metodologia adoptada implica la formalització dels universals de Greenberg i la seva verificació en 143 llengües utilitzant Universal Dependencies. S'empra la lògica difusa per a una classificació gradual de la universalitat. A més, s'utilitza la sintaxi de Grew-Match i les etiquetes de UD per a la formalització i cerca.


Esta tesis doctoral se sitúa en el ámbito de la tipología lingüística y propone un enfoque innovador para clasificar los universales tipológicos, centrándose en la presencia de excepciones. Se utiliza la lógica difusa para entender la universalidad como un continuo, y se presenta una aproximación computacional a los universales de *Greenberg. La justificación de la investigación se basa en la revolución en la tipología lingüística introducida por *Greenberg. A lo largo del tiempo, varios lingüistas intentaron mejorar los resultados de *Greenberg, pero el interés disminuyó a finales del siglo XX. Sin embargo, en la última década, el auge de la lingüística computacional y el acceso a corpus lingüísticos han revitalizado el estudio de los universales tipológicos. La metodología adoptada implica la formalización de los universales de *Greenberg y su verificación en 143 lenguas utilizando Universal *Dependencies. Se emplea la lógica difusa para una clasificación gradual de la universalidad. Además, se utiliza la sintaxis de Grew-Match y las etiquetas de UD para la formalización y búsqueda.


This doctoral thesis is situated in Linguistic Typology and proposes an innovative approach to classify typological Universals, focusing on the presence of exceptions. Fuzzy Logic is used to understand Universality as a continuum, and a computational approach to Greenberg Universals is presented. The problem addressed concerns exceptions to Universals and the need for more clarity in relevance and gradual transition in statistical Universals. The justification for the research is based on the revolution in Linguistic Typology introduced by Greenberg. Linguists tried to improve on Greenberg's results, but interest waned at the end of the 20th century. Recently, however, the rise of Computational Linguistics and access to linguistic corpora have revitalized the study of typological Universals. The methodology adopted involves formalizing Greenberg Universals and verifying them in 143 languages using Universal Dependencies. Fuzzy Logic is employed for a classification of Universality. In addition, Grew-Match syntax and UD labels are used for formalization and structure search in linguistic corpora.

Keywords

Universals en el llenguatge; Lògica difusa; Lingüística computacional; Universales en el lenguaje; Language Universals; Fuzzy Logic; Computational Linguistics

Subjects

004 - Computer science and technology. Computing. Data processing; 80 - General questions relating to both linguistics and literature. Philology; 81 - Linguistics and languages

Knowledge Area

Arts i Humanitats

Documents

This document contains embargoed files until 2026-04-12

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)