Detección de eventos sonoros en señales de música usando procesos Gaussianos

Alvarado-Durán, Pablo A.; Álvarez-López, Mauricio A.; Orozco-Gutiérrez, Álvaro A.

dc.contributor.author	Alvarado-Durán, Pablo A.
dc.contributor.author	Álvarez-López, Mauricio A.
dc.contributor.author	Orozco-Gutiérrez, Álvaro A.
dc.date.accessioned	2019-07-18T14:10:15Z
dc.date.accessioned	2019-08-20T15:44:40Z
dc.date.available	2019-07-18T14:10:15Z
dc.date.available	2019-08-20T15:44:40Z
dc.date.issued	2011-11-30
dc.identifier	https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108
dc.identifier	10.22430/22565337.108
dc.identifier.uri	http://hdl.handle.net/20.500.12622/918
dc.description.abstract	En este artículo se propone una metodología para detectar eventos sonoros en señales de música usando procesos Gaussianos. En el algoritmo presentado, las señales de audio de entrada son transformadas a un espacio tiempo-frecuencia utilizando la Transformada de Tiempo Corto de Fourier para obtener el espectrograma, cuya dimensión es posteriormente reducida pasando de la frecuencia en escala lineal en Hertz a la escala logarítmica en Mel por medio de un banco de filtros triangulares. Finalmente, se clasifica entre “evento” y “no evento” cada uno de los espectros de tiempo corto contenidos en el espectrograma en escala Mel por medio de un clasificador binario basado en procesos Gaussianos. Como parte del proceso de evaluación, se compara el desempeño de la metodología propuesta con el desempeño de algunas técnicas ampliamente utilizadas para detectar eventos en este tipo de señales. Para tal fin, se implementa en MATLAB® cada una de estas técnicas y se ponen a prueba utilizando dos bases de datos compuestas por segmentos de audio de diferente complejidad; definida por el tipo y cantidad de instrumentos tocados al mismo tiempo. Los resultados indican que la metodología propuesta supera el desempeño de las técnicas hasta ahora planteadas, presentando un mejoramiento en la medida F de 1,66 % para la base de datos uno y de 0,45 % para la base de datos dos.	spa
dc.format.mimetype	application/pdf
dc.language.iso	spa
dc.publisher	Instituto Tecnológico Metropolitano (ITM)	spa
dc.relation	https://revistas.itm.edu.co/index.php/tecnologicas/article/view/108/108
dc.rights	Copyright (c) 2017 Tecno Lógicas	spa
dc.source	2256-5337
dc.source	0123-7799
dc.source	TecnoLógicas; Num. 31 (2013); 93-122	eng
dc.source	TecnoLógicas; Num. 31 (2013); 93-122	spa
dc.subject	Clasificación con procesos Gaussianos	spa
dc.subject	aprendizaje de máquina supervisado	spa
dc.subject	espectrograma	spa
dc.subject	detección de eventos	spa
dc.subject	señales de música.	spa
dc.title	Detección de eventos sonoros en señales de música usando procesos Gaussianos	spa
dc.title.alternative	Sound event detection for music signals using gaussian processes
dc.subject.keywords	Gaussian processes classification	eng
dc.subject.keywords	supervised machine learning	eng
dc.subject.keywords	spectrogram	eng
dc.subject.keywords	event detection	eng
dc.subject.keywords	music signals.	eng
dc.type	info:eu-repo/semantics/article
dc.type	info:eu-repo/semantics/publishedVersion
dc.type	Research Papers	eng
dc.type	Artículos de investigación	spa
dc.relation.ispartofjournal	TecnoLógicas
dc.description.abstractenglish	In this paper we present a new methodology for detecting sound events in music signals using Gaussian Processes. Our method firstly takes a time-frequency representation, i.e. the spectrogram, of the input audio signal. Secondly the spectrogram dimension is reduced translating the linear Hertz frequency scale into the logarithmic Mel frequency scale using a triangular filter bank. Finally every short-time spectrum, i.e. every Mel spectrogram column, is classified as “Event” or “Not Event” by a Gaussian Processes Classifier. We compare our method with other event detection techniques widely used. To do so, we use MATLAB® to program each technique and test them using two datasets of music with different levels of complexity. Results show that the new methodology outperforms the standard approaches, getting an improvement by about 1.66 % on the dataset one and 0.45 % on the dataset two in terms of F-measure.	eng
dc.rights.accessrights	info:eu-repo/semantics/openAccess
dc.type.coar	http://purl.org/coar/resource_type/c_6501

Ficheros en el ítem

Nombre:: 108-Manuscrito-198-1-10-201702 ...
Tamaño:: 703.0Kb
Formato:: PDF

Ver/

Este ítem aparece en la(s) siguiente(s) colección(ones)

Num. 31 (2013) [12]

Mostrar el registro sencillo del ítem