Edat, sexe i llengua inicial en l’elaboració de perfils lingüístics forenses d’adolescents en català

Author

Giménez García, Roser

Director

Vila i Moreno, F. Xavier (Francesc Xavier)

Queralt Estevez, Sheila

Tutor

Payrató, Lluís, 1960-

Date of defense

2022-05-26

Pages

592 p.



Department/Institute

Universitat de Barcelona. Facultat de Filologia

Abstract

La lingüística forense s’ha definit, en sentit ampli, com la interfície entre la llengua i el dret i, en sentit restrictiu, com l’aplicació de la sociolingüística a processos judicials i investigacions policials i privades. Actualment, aquesta branca de la lingüística aplicada es troba en expansió a molts països, inclosos els territoris de parla catalana. La perfilació sociolingüística de mostres dubitades és una de les aplicacions de la lingüística a contextos forenses que es poden sol·licitar en el marc de processos judicials o d’investigacions policials i privades. Per a l'elaboració de perfils sociolingüístics fiables, calen estudis empírics sobre les varietats contemporànies de la llengua. Aquesta tesi sorgeix d'una necessitat específica de la perfilació sociolingüística de mostres dubitades en català: comptar amb estudis que descriguin les varietats col·loquials utilitzades per parlants adolescents i que correlacionin els trets lingüístics d'aquestes varietats amb variables socials, com l'edat, el sexe i la llengua inicial dels parlants. La revisió bibliogràfica realitzada en aquesta investigació mostra que, en el cas del català, encara no existeixen estudis que cobreixin aquesta necessitat, ja que tant els que s'ocupen de la variació com els que tracten l'ús de la llengua que fan els parlants adolescents presenten diverses limitacions importants per a la seva aplicació en la perfilació lingüística relacionades amb les dades utilitzades (per exemple, per la seva antiguitat, mida o localització geogràfica, massa específica). En aquest estudi s’analitza un corpus de parla adolescent de 69 informants de dues localitats catalanes des del plantejament metodològic de la sociolingüística de la variació, al qual es dona l'enfocament pràctic de la lingüística forense per investigar la pregunta de recerca ¿hi ha variables lingüístiques que permeten identificar l'edat, el sexe i la llengua inicial més probable en el discurs d'un parlant adolescent en català? Per respondre-la, s’analitzen 22 variables lingüístiques en relació amb l’edat, el sexe i la llengua inicial dels informants mitjançant diverses tècniques estadístiques: l’Anàlisi de Components Principals, la prova dels rangs amb signe de Wilcoxon, la prova U de Mann-Whitney i la prova de Kruskal-Wallis. En total, catorze variables lingüístiques es correlacionen de forma significativa amb l’edat, deu amb la llengua inicial i sis amb el sexe. Des de la perspectiva inversa, s’utilitza una tècnica inferencial de mineria de dades (arbres de classificació) per caracteritzar els grups d’edat, sexe i llengua inicial a partir de les variables lingüístiques. El percentatge de classificació correcta per als grups d’edat arriba al 85,5 %, per als grups de sexe, al 78,3 % i, en el cas de la llengua inicial, al 70,3 %. Per tant, es conclou que aquests resultats són aplicables a la perfilació sociolingüística de produccions anònimes en català comparables al corpus analitzat i que l’explotació de la sociolingüística de la variació ofereix un gran ventall d’oportunitats per a l’impuls de la lingüística forense catalana.


Forensic linguistics has been broadly defined as the intersection of language and the law and, in a more restricted sense, as the application of sociolinguistics to legal processes and police or private investigations. Currently, this area of applied linguistics is expanding in many countries, including the Catalan-speaking areas. Linguistic profiling of questioned samples is one of the applications of linguistics to forensic contexts that may be requested as part of legal processes for investigative purposes. The preparation of reliable linguistic profiles relies on preexisting empirical studies on contemporary language varieties. This research arises from a specific need in the linguistic profiling of questioned samples in Catalan, namely, to have studies which describe informal varieties used by adolescent speakers and which correlate the linguistic features of these varieties with social variables, such as speakers’ age, sex and first language. The literature reviewed carried out in this study shows that no works meet this need for the Catalan language yet, since both studies on language variation and those on adolescent speech present limitations in their applicability to linguistic profiling due to sampling issues (e.g., the samples were collected too long ago, their size is insufficient, or the generalizability of the results is limited to a very specific geographical area). This study anlyzes a sample of the speech of 69 adolescent speakers from two Catalan cities through the lens of variationist sociolinguistics and the hands-on approach of forensic linguistics and examines the research question ‘are there linguistic variables that may be used to identify the most likely age, sex and first language in adolescent speech in Catalan?’. To answer this question, this study analyzes 22 linguistic variables in relation to the informants’ age, sex and first language by means of several statistical techniques: Principal Component Analysis, the Wilcoxon signed-rank test, the Mann–Whitney U test and the Kruskal– Wallis test by ranks. In total, fourteen linguistic variables show a statistically significant correlation with age, ten with first language and six with sex. From the opposite perspective, a data mining technique (classification trees) is used to characterize the groups of informants by age, sexe and first language on the basis of their use of the linguistic variables. The model reaches a correct classification rate of 85.5% for speakers’ age, 78.3% for sex, and 70.3% for first language. Thus, it is concluded that the results obtained are applicable to the linguistic profiling of questioned samples comparable to the one used in this study and that variationist sociolinguistics offers a wide range of possibilities to boost forensic linguistics in Catalan.

Keywords

Sociolingüística; Sociolinguistics; Lingüística forense; Forensic linguistics; Català; Catalán; Catalan language

Subjects

81 - Lingüística i llengües

Knowledge Area

Ciències Humanes i Socials

Note

Programa de Doctorat en Estudis Lingüístics, Literaris i Culturals

Documents

RGG_TESI.pdf

164.1Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)