Universitat Pompeu Fabra. Departament de Tecnologies de la Informació i les Comunicacions
Programa de doctorat en Tecnologies de la Informació i les Comunicacions
This thesis introduces a novel situated interactive composition system called the SMuSe (for Situated Music Server) that is grounded on principles of modern cognitive science, provides perceptual control of sound synthesis and includes emotional feedback. It illustrates both a new music composition paradigm and a synthetic psychology approach to the study of music perception, emotion and cognition. The SMuSe is composed of cognitively plausible modules implemented as a hierarchy of musical agents and relies on distributed control, parallelism, emergence and embodiment. By interacting with its environment, which provides feedback via multiple sensors, the system generates complex adaptive affective musical structures. Focusing on the micro-level of sound generation, we present two complementary techniques that give high-level perceptual control over low-level sound synthesis parameters. In a first implicit approach, a support vector machine algorithm learns to automatically map perceptual features such as loudness, pitch and brightness onto additive synthesis parameters. In a second approach, a physically-inspired synthesis model provides explicit access to perceptual and physical parameters such as pitch, loudness, brightness, attack time, inharmonicity and damping. Moving from the study of music generation and control towards the study of the musical experience itself, we then evaluate how the music generated by the SMuSe influences the listeners' emotional responses. A first psychoacoustics experiment shows the significant influence of structural (scale, register, harmony), expressive (velocity, tempo, articulation) and timbre (brightness, attack time, spectral flux) parameters on the emotional scales of valence, arousal and dominance. An additional large scale experiment involving dementia patients (an illness known to induce cognitive and affective deficits) shows that specific sound features (e.g. low loudness, low brightness) provoke specific emotional responses within the patients (e.g. low stress). Moreover, the patients' emotional responses differ from the age-matched control group, and the analysis shows an increased emotional sensitivity to sounds as the severity of the disease increases. These results suggest that sound-based therapy and diagnosis for dementia are possible. Finally, the maturity and flexibility of the SMuSe music system are demonstrated by a series of real-world applications including the sonification of a mixed-reality space, a study on physiologically-based musical interaction, a neurofeedback musical interface, a closed loop system based on reinforcement learning of emotional feedback, and a large scale multimedia performance using brain-computer interfaces. A situated, perceptive, emotive and cognitive approach to the design of musical systems paves the way for new applications for therapy but also for interactive gaming and novel physiologically-based instruments. Our approach provides a well-grounded paradigm to develop advanced synthetic aesthetics system that can inform our understanding of the psychological processes on which they rely.
Esta tesis introduce un nuevo sistema de composición situada e interactiva llamado SMuSe (por Situated Music Server). Dicho sistema está basado en principios extraídos de la ciencia cognitiva moderna, proporciona control perceptual sobre la síntesis sonora e incluye feedback emocional. Por lo tanto, ilustra tanto un paradigma nuevo para la composición musical, como un sintético enfoque psicológico al estudio de la percepción musical, las emociones y la cognición. SMuSe consta de diversos modulos, plausibles desde un punto de vista cognitivo, implementados como una jerarquía de agentes. El funcionamiento de SMuSe explota los principios de control distribuido, paralelismo, emergencia y embodiment. En función del feedback obtenido por la interacción con el entorno, el sistema genera complejas estructuras musicales afectivas. En concreto, a nivel de generación de sonido, presentamos dos técnicas complementarias que proporcionan un control perceptivo de alto nivel sobre parámetros concretos de síntesis sonora. En un primer método implícito, un algoritmo de support vector machine aprende a traducir automáticamente características perceptuales, como volumen, tono y brillo en parámetros de síntesis aditiva. En el segundo método, un modelo físico de síntesis proporciona explícitamente acceso a parámetros perceptivos y físicos, tales como tono, volumen, brillo, tiempo de ataque, inarmonía y factor de amortiguamiento. En lo que respecta al estudio de la experiencia musical en sí misma, evaluamos la influencia de la música generada por SMuSe en las respuestas emocionales del sujeto. Un primer experimento psicoacústico muestra la influencia significativa que tienen parámetros estructurales (escala,registro, armonía), expresivos (velocidad, tempo, articulación) y de timbre (brillo, ataque, flujo espectral) en la escalas emocionales de valencia, activacíon y dominancia. Adicionalmente, un experimento de gran escala realizado con pacientes de demencia, una patología que asociada a déficits afectivos y cognitivos, demuestra que los pacientes responden emocionalmente a rasgos específicos del sonido (e.g. bajo volumen y brillo inducen poca tensión). Además, la respuesta emocional de los pacientes difiere si se compara con la mostrada por un grupo de control con la misma edad media. De tal manera, una mayor respuesta emocional aparece asociada a un mayor grado de demencia. Estos resultados sugieren que sería posible desarrollar técnicas basadas en el uso de música tanto para el tratamiento de la demencia como para su diagnóstico. Para concluir, la madurez y flexibilidad de SMuSe se demuestra con una serie de aplicaciones que incluyen la sonificación de un espacio de realidad mixta, un estudio acerca de la interacción musical mediante datos fisiológicos, un interfaz musical basado en feedback neurológico, un sistema basado en aprendizaje por refuerzo del feedback emocional, y una performance multimedia de gran escala controlada mediante interfaces cerebro-máquina. Este enfoque situado, perceptivo, emocional y cognitivo al diseño de sistemas musicales abre la posibilidad de desarrollar aplicaciones no sólo terapéuticas sino también para los juegos interactivos y nuevos interfaces que empleen fisiología. Nuestra propuesta proporciona un sólido paradigma para el desarrollo de sistemas de síntesis de estéticas avanzadas, que puedan servir para entender los procesos psicológicos subyacentes
Interactive music system; situated cognition; perceptual sound synthesis; emotional feedback; music therapy; sistema musical interactivo; cognición situada; biofeedback; terapia musical; interfaz cerebromáquina
78 - Music
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.