Entrenamiento Disciminativo de Modelos Ocultos de Markov de Unidad Subléxica para su Aplicación a Sistemas de Reconocimiento Automático del Habla Continua


Author

Nogueiras Rodríguez, Albino

Director

Mariño Acebal, José B. (José Bernardo)

Date of defense

1999-11-22

ISBN

9788469271438

Legal Deposit

B.45334-2009



Department/Institute

Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions

Abstract

En esta tesis se aborda el entrenamiento discriminativo de unidades subléxicas utilizando bases de datos de propósito geneal. Las unidades subléxicas son la base de funcionamiento de los sistemas de reconocimiento de grandes vocabularios en habla continua, los cuales constituyen uno de los retos de máxima actualidad y la puerta de acceso a otras propuestas aún más ambiciosas como el dictado automático o los sistemas de diálogo.<br/><br/>Por su parte, el entrenamiento discriminativo ha demostrado ser una herramienta sumamente potente en el modelado acústico de sistemas de reconocimiento del habla. Su funcionamiento se basa en aumentar la probabilidad de que el sistema reconozca la frase correcta aplicando, más o menos, la misma regla de decisión empleada en condiciones reales de reconocimiento. Una limitación habitual de los sistemas de entrenamiento discriminativo propuestos hasta la fecha es la necesidad de bases de datos formadas por material específico de la tarea a reconocer.<br/><br/>En la primera parte de la tesis se presenta la propuesta propia de esta tesis para la aplicación de entrenamiento discriminativo a unidades subléxicas para su aplicación a tareas de reconocimiento del habla continua: el entrenamiento de mínima confusibilidad en segmentos acústicos de longitud limitada.<br/>Se proponen dos variantes. En la primera, el conocimiento del lenguaje de la tarea a reconocer es aprovechado para minimizar el número de errores de posible comisión en la tarea, utilizando segmentos acústicos extraídos de una base de datos de propósito general. A continuación, esta misma idea se extiende al caso en que la tarea es desconocida,obteniéndose modelos acústicos de propósito general. Se muestran resultados experimentales en el reconocimiento de las cadenas de dígitos en inglés TIDIGITS utilizando modelos de fonema y semifonema entrenados con TIMIT.

Keywords

unidades subléxicas; habla continua; modelado acústico; entrenamiento discriminativo; reconocimiento automático del habla

Subjects

621.3 Electrical engineering

Documents

TANR.pdf

2.494Mb

 

Rights

ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)