Mining arguments in scientific abstracts: Application to argumentative quality assessment

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Accuosto, Pablo
dc.date.accessioned
2021-11-30T15:53:48Z
dc.date.available
2021-11-30T15:53:48Z
dc.date.issued
2021-11-26
dc.identifier.uri
http://hdl.handle.net/10803/672856
dc.description.abstract
Argument mining consists in the automatic identification of argumentative structures in natural language, a task that has been recognized as particularly challenging in the scientific domain. In this work we propose SciARG, a new annotation scheme, and apply it to the identification of argumentative units and relations in abstracts in two scientific disciplines: computational linguistics and biomedicine, which allows us to assess the applicability of our scheme to different knowledge fields. We use our annotated corpus to train and evaluate argument mining models in various experimental settings, including single and multi-task learning. We investigate the possibility of leveraging existing annotations, including discourse relations and rhetorical roles of sentences, to improve the performance of argument mining models. In particular, we explore the potential offered by a sequential transfer-learning approach in which supplementary training tasks are used to fine-tune pre-trained parameter-rich language models. Finally, we analyze the practical usability of the automatically-extracted components and relations for the prediction of argumentative quality dimensions of scientific abstracts.
dc.description.abstract
La mineria d’arguments consisteix en la identificació automàtica d’estructures argumentatives en el llenguatge natural, una tasca considerada com a especialment complexa en textos científics. En aquest treball proposem SciARG, un nou esquema d’anotació, i l’apliquem a la identificació d’unitats i relacions argumentatives en resums científics en dues disciplines: lingüística computacional i biomedicina, la qual cosa ens permet avaluar l’aplicabilitat del nostre esquema en diferents camps del coneixement. Utilitzem el nostre corpus per entrenar i avaluar models de mineria d’arguments en diversos contextos experimentals, entrenant cada tasca per separat i en un entorn multitasca. Investiguem la possibilitat d’aprofitar anotacions existents, incloent relacions de discurs i funcions retòriques d’oracions, per millorar el rendiment dels models de mineria de arguments. En particular, explorem el potencial que ofereix un enfocament d’aprenentatge per transferència en el qual s’utilitzen tasques d’entrenament suplementàries per afinar models lingüístics pre-entrenats. Finalment, analitzem l’´us pràctic dels components i relacions extretes automàticament dels textos per la predicció de diversos aspectes de la qualitat argumentativa de resums científics.
dc.format.extent
276 p.
dc.format.mimetype
application/pdf
dc.language.iso
eng
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Argument meaning
dc.subject
Argumentative quality assessment
dc.subject
Annotation scheme
dc.subject
Scientific discourse
dc.subject
Machine learning
dc.subject
Transfer learning
dc.subject
BERT
dc.subject
Scholarly publications
dc.subject
Mineria d’arguments
dc.subject
Avaluació de la qualitat argumentativa
dc.subject
Esquema d’anotacions
dc.subject
Discurs científic
dc.subject
Aprenentatge automàtic
dc.subject
Aprenentatge per transferència
dc.subject
Publicacions acadèmiques
dc.title
Mining arguments in scientific abstracts: Application to argumentative quality assessment
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
dc.contributor.authoremail
pablo.accuosto@upf.edu
dc.contributor.director
Saggion, Horacio
dc.embargo.terms
cap
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documents

tpa.pdf

18.80Mb PDF

This item appears in the following Collection(s)