Automatic assessment of singing voice pronunciation: a case study with Jingju music

Gong, Rong

Automatic assessment of singing voice pronunciation: a case study with Jingju music

Author

Gong, Rong

Director

Serra, Xavier

Date of defense

2018-11-23

Pages

235 p.

Department/Institute

Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions

Doctorate programs

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Abstract

Online learning has altered music education remarkable in the last decade. Large and increasing amount of music performing learners participate in online music learning courses due to the easy-accessibility and boundless of time-space constraints. Singing can be considered the most basic form of music performing. Automatic singing voice assessment, as an important task in Music Information Retrieval (MIR), aims to extract musically meaningful information and measure the quality of learners' singing voice. Singing correctness and quality is culture-specific and its assessment requires culture-aware methodologies. Jingju (also known as Beijing opera) music is one of the representative music traditions in China and has spread to many places in the world where there are Chinese communities. Our goal is to tackle unexplored automatic singing voice pronunciation assessment problems in jingju music, to make the current eurogeneric assessment approaches more culture-aware, and in return, to develop new assessment approaches which can be generalized to other musical traditions.

El aprendizaje en línea ha cambiado notablemente la educación musical en la pasada década. Una cada vez mayor cantidad de estudiantes de interpretación musical participan en cursos de aprendizaje musical en línea por su fácil accesibilidad y no estar limitada por restricciones de tiempo y espacio. Puede considerarse el canto como la forma más básica de interpretación. La evaluación automática de la voz cantada, como tarea importante en la disciplina de Recuperación de Información Musical (MIR por sus siglas en inglés) tiene como objetivo la extracción de información musicalmente significativa y la medición de la calidad de la voz cantada del estudiante. La corrección y calidad del canto son específicas a cada cultura y su evaluación requiere metodologías con especificidad cultural. La música del jingju (también conocido como ópera de Beijing) es una de las tradiciones musicales más representativas de China y se ha difundido a muchos lugares del mundo donde existen comunidades chinas.Nuestro objetivo es abordar problemas aún no explorados sobre la evaluación automática de la voz cantada en la música del jingju, hacer que las propuestas eurogenéticas actuales sobre evaluación sean más específicas culturalmente, y al mismo tiempo, desarrollar nuevas propuestas sobre evaluación que puedan ser generalizables para otras tradiciones musicales.

Keywords

MIR; Music information retrieval; CompMusic; Data-driven; Computational model; Singing voice; Automatic assessment; Jingju; Beijing opera; Pronunciation; Syllable and phoneme segmentation; Mispronunciation detection; Pronunciation similarity; Deep learning; Neural networks; CNNs; RNNs; Siamese networks; Acoustic embedding,; Hidden Markov model; HMM; HSMM; Recuperación de información musical; Modelo computacional basado en datos; Voz de canto; Eevaluación automática; Pronunciación; Segmentación de sílabas y fonemas; Detección de falsa pronunciación; Similitud de pronunciación; Aprendizaje profundo; Redes neuronales; Redes neuronales recurrentes; Incrustación acústica; Modelo oculto de Markov

Subjects

62 - Engineering

Documents

trg.pdf

4.619Mb

Export

DIDL MARC MARC_CCUC METS OAI_DC ORE QDC RDF

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)

Programa de Doctorat en Tecnologies de la Informació i les Comunicacions [408]

Automatic assessment of singing voice pronunciation: a case study with Jingju music

Author

Director

Date of defense

Pages

Share

Department/Institute

Doctorate programs

Abstract

Keywords

Subjects

Documents

Export

Rights

This item appears in the following Collection(s)