Data-driven pitch content description of choral singing recordings

dc.contributor
Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
dc.contributor.author
Cuesta, Helena
dc.date.accessioned
2022-03-28T14:55:30Z
dc.date.available
2022-03-28T14:55:30Z
dc.date.issued
2022-03-21
dc.identifier.uri
http://hdl.handle.net/10803/673924
dc.description.abstract
Ensemble singing is a well-established practice across cultures, found in a great diversity of forms, languages, and levels. However, it has not been widely studied in the field of Music Information Retrieval (MIR), likely due to the lack of appropriate data. In this dissertation, we first address the data scarcity by building new open, multi-track datasets of ensemble singing. Then, we address three main research problems: multiple F0 estimation and streaming, voice assignment, and the characterization of vocal unisons, all in the context of four-part vocal ensembles. Hence, the first contribution of this thesis is the development and release of four multi-track datasets of vocal ensembles: Choral Singing Dataset, Dagstuhl ChoirSet, ESMUC Choir Dataset, and Cantoría Dataset, all of them with audio recordings and accompanying annotations. The second contribution is a set of deep learning models for multiple F0 estimation, streaming, and voice assignment of vocal quartets, mainly based on convolutional neural networks designed leveraging music domain knowledge. Finally, we propose two methods to characterize vocal unison performances in terms of pitch dispersion.
en_US
dc.description.abstract
Cantar en un conjunt vocal és una activitat arrelada a moltes cultures i que es desenvolupa en diversos formats, idiomes i nivells. Tanmateix, la falta de les dades adequades ha fet que no s’hagi estudiat extensivament en el camp de la Recuperació de la Informació Musical (MIR). En aquesta tesi, primer abordem l’escassetat de dades creant noves bases de dades obertes amb gravacions multi-pista de conjunts vocals. Tot seguit, ens centrem principalment en tres tasques d'investigació: estimació i seguiment de múltiples valors de F0, assignació de veus i modelat d’unísons, totes en el context de grups vocals a quatre veus. Per tant, la primera aportació d’aquesta tesi és la publicació de quatre bases de dades amb enregistraments de conjunts vocals: Choral Singing Dataset, Dagstuhl ChoirSet, ESMUC Choir Dataset i Cantoría Dataset, totes amb enregistraments d’àudio multi-pista i anotacions. La segona aportació d’aquesta tesi és un conjunt de models d’aprenentatge profund per l’estimació i el seguiment de múltiples valors de F0 i per l’assignació de veus en quartets vocals, principalment basats en xarxes neuronals convolucionals dissenyades per incorporar coneixement musical. Finalment, proposem dos mètodes per modelar i caracteritzar unísons vocals en termes de dispersió d’altura tonal (pitch).
en_US
dc.format.extent
275 p.
en_US
dc.format.mimetype
application/pdf
dc.language.iso
eng
en_US
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri
http://creativecommons.org/licenses/by-nc-sa/4.0/
*
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Singing
en_US
dc.subject
Choral singing
en_US
dc.subject
Vocal music
en_US
dc.subject
Multi-pitch estimation
en_US
dc.subject
Voice assignment
en_US
dc.subject
Open data
en_US
dc.subject
Unison
en_US
dc.subject
MIR
en_US
dc.subject
Automatic music transcription
en_US
dc.subject
Cant
en_US
dc.subject
Cant coral
en_US
dc.subject
Música vocal
en_US
dc.subject
Estimació de múltiples freqüències
en_US
dc.subject
Assignació de veus
en_US
dc.subject
Dades obertes
en_US
dc.subject
Uníson
en_US
dc.subject
Transcripció automàtica de música
en_US
dc.title
Data-driven pitch content description of choral singing recordings
en_US
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.subject.udc
62
en_US
dc.contributor.authoremail
helenacuesta.hcm@gmail.com
en_US
dc.contributor.director
Gómez Gutiérrez, Emilia
dc.embargo.terms
cap
en_US
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Tecnologies de la Informació i les Comunicacions


Documentos

thc.pdf

45.52Mb PDF

Este ítem aparece en la(s) siguiente(s) colección(ones)