Desenvolupament d'un sistema de traducció automàtica estadística cap a la llengua de signes catalana : el paper dels morfemes lligats i altres fenòmens simultanis de la llengua de signes

dc.contributor
Universitat Pompeu Fabra. Departament de Traducció i Ciències del llenguatge
dc.contributor.author
Massó Sanabre, Guillem
dc.date.accessioned
2013-01-09T11:03:17Z
dc.date.available
2013-01-09T11:03:17Z
dc.date.issued
2012-09-18
dc.identifier.uri
http://hdl.handle.net/10803/97048
dc.description.abstract
L’objectiu d’aquesta tesi és doble: d’una banda, millorar un sistema de traducció automàtica estadística mitjançant la incorporació d’informació lingüística, i de l’altra, ampliar la descripció d’alguns trets de la llengua de signes catalana (LSC). La descripció ha anat associada al procés d’anotació del corpus, i han pres especial rellevància els adverbis bucals, dels quals no hem trobat cap classificació que s’adeqüés a les nostres dades. Els experiments portats a terme tenen en compte aquests adverbis, però també morfemes manuals i marques de tòpic en LSC. Els textos en català inclouen informació de lema i categoria gramatical. A més, considerem la puntuació ortogràfica en totes dues llengües. L’avaluació dels resultats, complementada per una anàlisi estadística, mostra que la informació de l’LSC i la puntuació milloren significativament la traducció, mentre que els factors del català no semblen rellevants.
cat
dc.description.abstract
The aim of this thesis is twofold: on the one hand, to improve a statistical machine translation system by incorporating linguistic information, and on the other hand, to extend the description of some features of Catalan Sign Language (LSC). The description has been associated with the corpus annotation process, where mouth adverbs have taken special relevance, since we did not found any classification that matches our data. The experiments carried out take into account these adverbs, but also manual morphemes and topic markers in LSC. The Catalan texts include lemma and part of speech information. Furthermore, we consider orthographic punctuation in both languages. The evaluation of results, complemented by a statistical analysis, shows that the information in LSC and punctuation significantly improve the translation, while the Catalan factors do not seem relevant.
eng
dc.format.extent
239 p.
cat
dc.format.mimetype
application/pdf
dc.language.iso
cat
cat
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Llenguatge de signes català
cat
dc.subject
Traducció automàtica
cat
dc.title
Desenvolupament d'un sistema de traducció automàtica estadística cap a la llengua de signes catalana : el paper dels morfemes lligats i altres fenòmens simultanis de la llengua de signes
cat
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
81
cat
dc.contributor.authoremail
guillem.masso@upf.edu
cat
dc.contributor.director
Badia i Cardús, Antoni
dc.embargo.terms
cap
cat
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.identifier.dl
B. 1374-2013
cat
dc.description.degree
Programa de doctorat en Traducció i Ciències del Llenguatge


Documents

tgms.pdf

4.644Mb PDF

This item appears in the following Collection(s)