Structural analysis and segmentation of music signals

Author

Ong, Bee Suan

Director

Serra, Xavier

Date of defense

2007-02-21

ISBN

9788469117569

Legal Deposit

B.5219-2008



Department/Institute

Universitat Pompeu Fabra. Departament de Tecnologia

Doctorate programs

Programa de doctorat en Tecnologies de la Informació i les Comunicacions

Abstract

Con la reciente explosión cuantitativa de bibliotecas y colecciones de música en formato<br/>digital, la descripción del contenido desempeña un papel fundamental para una gestión y<br/>búsqueda eficientes de archivos de audio. La presente tesis doctoral pretende hacer un<br/>análisis automático de la estructura de piezas musicales a partir del análisis de una<br/>grabación, es decir, extraer una descripción estructural a partir de señales musicales<br/>polifónicas. En la medida en que la repetición y transformación de la estructura de la<br/>música genera una identificación única de una obra musical, extraer automáticamente<br/>esta información puede vincular entre sí descripciones de bajo y alto nivel de una señal<br/>musical y puede proporcionar al usuario una manera más efectiva de interactuar con un<br/>contenido de audio. Para algunas aplicaciones basadas en contenido, encontrar los límites<br/>de determinados segmentos de una grabación resulta indispensable. Así pues, también se<br/>investiga la segmentación temporal de audio a nivel semántico, al igual que la<br/>identificación de extractos representativos de una señal musical que pueda servir como<br/>resumen de la misma. Para ello se emplea una técnica de análisis a un nivel de<br/>abstracción más elevado que permite obtener una mejor división en segmentos. Tanto<br/>desde el punto de vista teórico como práctico, esta investigación no sólo ayuda a<br/>incrementar nuestro conocimiento respecto a la estructura musical, sino que también<br/>proporciona una ayuda al examen y a la valoración musical.


With the recent explosion in the quantity of digital audio libraries and databases, content<br/>descriptions play an important role in efficiently managing and retrieving audio files.<br/>This doctoral research aims to discover and extract structural description from<br/>polyphonic music signals. As repetition and transformations of music structure creates a<br/>unique identity of music itself, extracting such information can link low-level and higherlevel<br/>descriptions of music signal and provide better quality access plus powerful way of<br/>interacting with audio content. Finding appropriate boundary truncations is indispensable<br/>in certain content-based applications. Thus, temporal audio segmentation at the semantic<br/>level and the identification of representative excerpts from music audio signal are also<br/>investigated. We make use of higher-level analysis technique for better segment<br/>truncation. From both theoretical and practical points of view, this research not only<br/>helps in increasing our knowledge of music structure but also facilitates in time-saving<br/>browsing and assessing of music.

Keywords

identification of representative music excerpts; audio segmentation; music structural analysis; music content description; identificación de fragmentos musicales; segmentación de audio; análisis estructural de la música; descripción de contenido musical

Subjects

004 - Computer science and technology. Computing. Data processing; 531/534 - Mechanics; 78 - Music

Documents

tbso.pdf

3.131Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)