Reconocimiento de emociones en el habla
QRCode
Share this
Date
2008-12-07Publisher
Instituto Tecnológico Metropolitano (ITM)Citation
Metadata
Show full item recordPDF Documents
Abstract
Se presenta en este trabajo una metodología para la caracterización de la señal de voz aplicada al reconocimiento de estados emocionales. Son estudiadas cuatro emociones primarias (alegría, enojo, sorpresa y tristeza) y un estado neutral. Se realizó un análisis en el dominio temporal y un análisis acústico empleando los MFCC (Mel Frequency Cepstral Coefficients). Las pruebas comprueban la efectividad de la metodología en el reconocimiento de las emociones superando el reconocimiento realizado por un grupo de personas. Se obtiene un porcentaje de 94.00% de acierto en el reconocimiento de emociones trabajando sobre la base de SES (Spanish emotional speech).
Abstract
A methodology of feature extraction in emotional speech for emotion recognition is proposed. Four primary human emotions, including happiness, anger, surprise and sadness are investigated. In order to recognize emotional states, acoustic MFCC (Mel frequencycepstral coefficients) and time representation features are extracted from voice recordings. Experiments indicate that emotion recognition effectiveness comparable to human listeners can be achieved. Recognition accuracy of 94.00% for emotion detection was obtained from database SES (Spanish emotional speech).
Collections
- Num. 21 (2008) [13]