Reconocimiento de emociones en el habla
Se presenta en este trabajo una metodología para la caracterización de la señal de voz aplicada al reconocimiento de estados emocionales. Son estudiadas cuatro emociones primarias (alegría, enojo, sorpresa y tristeza) y un estado neutral. Se realizó un análisis en el dominio temporal y un análisis a...
- Autores:
-
Echeverry-Correa, Julián D.
Morales-Pérez, Mauricio
- Tipo de recurso:
- Article of journal
- Fecha de publicación:
- 2008
- Institución:
- Instituto Tecnológico Metropolitano
- Repositorio:
- Repositorio ITM
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.itm.edu.co:20.500.12622/809
- Acceso en línea:
- https://revistas.itm.edu.co/index.php/tecnologicas/article/view/256
http://hdl.handle.net/20.500.12622/809
- Palabra clave:
- Reconocimiento de emociones
procesamiento señal de voz
MFCC.
Emotion recognition
signal speech processing
MFCC.
- Rights
- License
- Copyright (c) 2017 Tecno Lógicas
id |
RepoITM2_60f7e0581bfaaa0a44b59abaad10932d |
---|---|
oai_identifier_str |
oai:repositorio.itm.edu.co:20.500.12622/809 |
network_acronym_str |
RepoITM2 |
network_name_str |
Repositorio ITM |
repository_id_str |
|
spelling |
Echeverry-Correa, Julián D.Morales-Pérez, Mauricio2019-07-18T14:11:14Z2019-08-16T16:20:57Z2019-07-18T14:11:14Z2019-08-16T16:20:57Z2008-12-07https://revistas.itm.edu.co/index.php/tecnologicas/article/view/25610.22430/22565337.256http://hdl.handle.net/20.500.12622/809Se presenta en este trabajo una metodología para la caracterización de la señal de voz aplicada al reconocimiento de estados emocionales. Son estudiadas cuatro emociones primarias (alegría, enojo, sorpresa y tristeza) y un estado neutral. Se realizó un análisis en el dominio temporal y un análisis acústico empleando los MFCC (Mel Frequency Cepstral Coefficients). Las pruebas comprueban la efectividad de la metodología en el reconocimiento de las emociones superando el reconocimiento realizado por un grupo de personas. Se obtiene un porcentaje de 94.00% de acierto en el reconocimiento de emociones trabajando sobre la base de SES (Spanish emotional speech).A methodology of feature extraction in emotional speech for emotion recognition is proposed. Four primary human emotions, including happiness, anger, surprise and sadness are investigated. In order to recognize emotional states, acoustic MFCC (Mel frequencycepstral coefficients) and time representation features are extracted from voice recordings. Experiments indicate that emotion recognition effectiveness comparable to human listeners can be achieved. Recognition accuracy of 94.00% for emotion detection was obtained from database SES (Spanish emotional speech).application/pdfspaInstituto Tecnológico Metropolitano (ITM)https://revistas.itm.edu.co/index.php/tecnologicas/article/view/256/262TecnoLógicasCopyright (c) 2017 Tecno Lógicashttp://purl.org/coar/access_right/c_abf22256-53370123-7799TecnoLógicas; Num. 21 (2008); 113-130TecnoLógicas; Num. 21 (2008); 113-130Reconocimiento de emocionesprocesamiento señal de vozMFCC.Emotion recognitionsignal speech processingMFCC.Reconocimiento de emociones en el hablaReconocimiento de emociones en el hablainfo:eu-repo/semantics/articleArticlesArtículoshttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85PublicationORIGINAL256-Manuscrito-416-1-10-20170214.pdf256-Manuscrito-416-1-10-20170214.pdfapplication/pdf588543https://dspace-itm.metabuscador.org/bitstreams/ecb0be85-7de9-4f03-ba07-4245cb92ed35/download09e0c74faf4efdfe0042fefad71ba88cMD51trueAnonymousREADTHUMBNAIL256-Manuscrito-416-1-10-20170214.pdf.jpg256-Manuscrito-416-1-10-20170214.pdf.jpgGenerated Thumbnailimage/jpeg4498https://dspace-itm.metabuscador.org/bitstreams/7442bfbe-2e2a-44da-a259-28df1ac1e366/download436faf7597630f4f89adec315b7edc11MD52falseAnonymousREADTEXT256-Manuscrito-416-1-10-20170214.pdf.txt256-Manuscrito-416-1-10-20170214.pdf.txtExtracted texttext/plain30086https://dspace-itm.metabuscador.org/bitstreams/52641927-fb19-4acf-9817-8df44ba4ecbb/downloada5cb85549ad33900cad11f435d6cec16MD53falseAnonymousREAD20.500.12622/809oai:dspace-itm.metabuscador.org:20.500.12622/8092025-06-24 09:23:21.737open.accesshttps://dspace-itm.metabuscador.orgRepositorio Instituto Tecnológico Metropolitano de Medellínbdigital@metabiblioteca.com |
dc.title.spa.fl_str_mv |
Reconocimiento de emociones en el habla |
dc.title.alternative.none.fl_str_mv |
Reconocimiento de emociones en el habla |
title |
Reconocimiento de emociones en el habla |
spellingShingle |
Reconocimiento de emociones en el habla Reconocimiento de emociones procesamiento señal de voz MFCC. Emotion recognition signal speech processing MFCC. |
title_short |
Reconocimiento de emociones en el habla |
title_full |
Reconocimiento de emociones en el habla |
title_fullStr |
Reconocimiento de emociones en el habla |
title_full_unstemmed |
Reconocimiento de emociones en el habla |
title_sort |
Reconocimiento de emociones en el habla |
dc.creator.fl_str_mv |
Echeverry-Correa, Julián D. Morales-Pérez, Mauricio |
dc.contributor.author.none.fl_str_mv |
Echeverry-Correa, Julián D. Morales-Pérez, Mauricio |
dc.subject.spa.fl_str_mv |
Reconocimiento de emociones procesamiento señal de voz MFCC. |
topic |
Reconocimiento de emociones procesamiento señal de voz MFCC. Emotion recognition signal speech processing MFCC. |
dc.subject.keywords.eng.fl_str_mv |
Emotion recognition signal speech processing MFCC. |
description |
Se presenta en este trabajo una metodología para la caracterización de la señal de voz aplicada al reconocimiento de estados emocionales. Son estudiadas cuatro emociones primarias (alegría, enojo, sorpresa y tristeza) y un estado neutral. Se realizó un análisis en el dominio temporal y un análisis acústico empleando los MFCC (Mel Frequency Cepstral Coefficients). Las pruebas comprueban la efectividad de la metodología en el reconocimiento de las emociones superando el reconocimiento realizado por un grupo de personas. Se obtiene un porcentaje de 94.00% de acierto en el reconocimiento de emociones trabajando sobre la base de SES (Spanish emotional speech). |
publishDate |
2008 |
dc.date.issued.none.fl_str_mv |
2008-12-07 |
dc.date.accessioned.none.fl_str_mv |
2019-07-18T14:11:14Z 2019-08-16T16:20:57Z |
dc.date.available.none.fl_str_mv |
2019-07-18T14:11:14Z 2019-08-16T16:20:57Z |
dc.type.none.fl_str_mv |
info:eu-repo/semantics/article |
dc.type.eng.fl_str_mv |
Articles |
dc.type.spa.fl_str_mv |
Artículos |
dc.type.coar.fl_str_mv |
http://purl.org/coar/resource_type/c_2df8fbb1 |
dc.type.coarversion.fl_str_mv |
http://purl.org/coar/version/c_970fb48d4fbd8a85 |
dc.type.coar.none.fl_str_mv |
http://purl.org/coar/resource_type/c_6501 |
format |
http://purl.org/coar/resource_type/c_6501 |
dc.identifier.none.fl_str_mv |
https://revistas.itm.edu.co/index.php/tecnologicas/article/view/256 10.22430/22565337.256 |
dc.identifier.uri.none.fl_str_mv |
http://hdl.handle.net/20.500.12622/809 |
url |
https://revistas.itm.edu.co/index.php/tecnologicas/article/view/256 http://hdl.handle.net/20.500.12622/809 |
identifier_str_mv |
10.22430/22565337.256 |
dc.language.iso.none.fl_str_mv |
spa |
language |
spa |
dc.relation.none.fl_str_mv |
https://revistas.itm.edu.co/index.php/tecnologicas/article/view/256/262 |
dc.relation.ispartofjournal.none.fl_str_mv |
TecnoLógicas |
dc.rights.spa.fl_str_mv |
Copyright (c) 2017 Tecno Lógicas |
dc.rights.coar.fl_str_mv |
http://purl.org/coar/access_right/c_abf2 |
rights_invalid_str_mv |
Copyright (c) 2017 Tecno Lógicas http://purl.org/coar/access_right/c_abf2 |
dc.format.mimetype.none.fl_str_mv |
application/pdf |
dc.publisher.spa.fl_str_mv |
Instituto Tecnológico Metropolitano (ITM) |
dc.source.none.fl_str_mv |
2256-5337 0123-7799 |
dc.source.eng.fl_str_mv |
TecnoLógicas; Num. 21 (2008); 113-130 |
dc.source.spa.fl_str_mv |
TecnoLógicas; Num. 21 (2008); 113-130 |
institution |
Instituto Tecnológico Metropolitano |
bitstream.url.fl_str_mv |
https://dspace-itm.metabuscador.org/bitstreams/ecb0be85-7de9-4f03-ba07-4245cb92ed35/download https://dspace-itm.metabuscador.org/bitstreams/7442bfbe-2e2a-44da-a259-28df1ac1e366/download https://dspace-itm.metabuscador.org/bitstreams/52641927-fb19-4acf-9817-8df44ba4ecbb/download |
bitstream.checksum.fl_str_mv |
09e0c74faf4efdfe0042fefad71ba88c 436faf7597630f4f89adec315b7edc11 a5cb85549ad33900cad11f435d6cec16 |
bitstream.checksumAlgorithm.fl_str_mv |
MD5 MD5 MD5 |
repository.name.fl_str_mv |
Repositorio Instituto Tecnológico Metropolitano de Medellín |
repository.mail.fl_str_mv |
bdigital@metabiblioteca.com |
_version_ |
1837096888892915712 |