Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz

RESUMEN : Los desórdenes neurodegenerativos como las enfermedades de Parkinson o de Huntington afectan las funciones normales del cuerpo como el habla, el movimiento, el equilibrio, entre otros. Específicamente el deterioro del habla se produce por la pérdida del control de los músculos encargados d...

Full description

Autores:
López Santander, Diego Alexander
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2022
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/33159
Acceso en línea:
https://hdl.handle.net/10495/33159
Palabra clave:
Disartria
Dysarthria
Enfermedad de Parkinson
Parkinson Disease
Enfermedad de Huntington
Huntington Disease
Habla
Speech
Aprendizaje profundo
Deep Learning
Redes Neuronales Convolucionales
Redes Neuronales Recurrentes
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
id UDEA2_e55caf2b9e5068b4d2e80a7bc4c08f63
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/33159
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
title Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
spellingShingle Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
Disartria
Dysarthria
Enfermedad de Parkinson
Parkinson Disease
Enfermedad de Huntington
Huntington Disease
Habla
Speech
Aprendizaje profundo
Deep Learning
Redes Neuronales Convolucionales
Redes Neuronales Recurrentes
title_short Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
title_full Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
title_fullStr Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
title_full_unstemmed Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
title_sort Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
dc.creator.fl_str_mv López Santander, Diego Alexander
dc.contributor.advisor.none.fl_str_mv Orozco Arroyave, Juan Rafael
dc.contributor.author.none.fl_str_mv López Santander, Diego Alexander
dc.contributor.researchgroup.spa.fl_str_mv Grupo de Investigación en Telecomunicaciones Aplicadas (GITA)
dc.subject.decs.none.fl_str_mv Disartria
Dysarthria
Enfermedad de Parkinson
Parkinson Disease
Enfermedad de Huntington
Huntington Disease
Habla
Speech
Aprendizaje profundo
Deep Learning
topic Disartria
Dysarthria
Enfermedad de Parkinson
Parkinson Disease
Enfermedad de Huntington
Huntington Disease
Habla
Speech
Aprendizaje profundo
Deep Learning
Redes Neuronales Convolucionales
Redes Neuronales Recurrentes
dc.subject.proposal.spa.fl_str_mv Redes Neuronales Convolucionales
Redes Neuronales Recurrentes
description RESUMEN : Los desórdenes neurodegenerativos como las enfermedades de Parkinson o de Huntington afectan las funciones normales del cuerpo como el habla, el movimiento, el equilibrio, entre otros. Específicamente el deterioro del habla se produce por la pérdida del control de los músculos encargados de la producción del lenguaje oral, esta condición se denomina disartria. Teniendo en cuenta que la disartria está ligada con frecuencia a la progresión de estas enfermedades y que cada una provoca distintos tipos de disartria (disartria hipocinética e hipercinética para Parkinson y Huntington respectivamente), es posible desarrollar sistemas de evaluación automática a partir de señales de voz para apoyar a los profesionales de la salud en el diagnóstico y toma de decisiones para el tratamiento temprano de pacientes de enfermedades neurodegenerativas como el Parkinson y Huntington. El enfoque propuesto en el presente trabajo consiste en desarrollar una arquitectura basada en redes neuronales convolucionales de una dimensión (CNNs) seguidas de redes neuronales recurrentes (RNN) para la clasificación del habla patológica, considerando que esta configuración es típicamente usada para el modelamiento de información secuencial, como es el caso de una señal de audio en el dominio del tiempo. Particularmente, en este trabajo se realizó la clasificación de la disartria hipocinética vs. habla sana, disartria hipercinética vs. habla sana y disartria hipocinética vs disartria hipercinética. El modelo desarrollado fue entrenado y evaluado usando dos bases de datos con diferentes tareas de habla realizadas por hablantes nativos checos. Además, se comparó el rendimiento del modelo implementado con métodos clásicos, es decir, sin el uso de herramientas de aprendizaje profundo. En general los resultados alcanzados con la arquitectura de aprendizaje profundo propuesta no superaron los resultados obtenidos usando características clásicas de articulación y prosodia, sin embargo, se desarrolló un marco de trabajo sistemático con el potencial para evaluar y optimizar modelos de aprendizaje profundo.
publishDate 2022
dc.date.issued.none.fl_str_mv 2022
dc.date.accessioned.none.fl_str_mv 2023-01-18T18:31:04Z
dc.date.available.none.fl_str_mv 2023-01-18T18:31:04Z
dc.type.spa.fl_str_mv Tesis/Trabajo de grado - Monografía - Pregrado
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_7a1f
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/TP
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_b1a7d7d4d402bcce
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/bachelorThesis
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/draft
format http://purl.org/coar/resource_type/c_7a1f
status_str draft
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/33159
url https://hdl.handle.net/10495/33159
dc.language.iso.spa.fl_str_mv spa
language spa
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc-sa/4.0/
http://creativecommons.org/licenses/by-nc-nd/2.5/co/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 43
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Universidad de Antioquia
dc.publisher.place.spa.fl_str_mv Medellín - Colombia
dc.publisher.faculty.spa.fl_str_mv Facultad de Ingeniería. Ingeniería Electrónica
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/201841f5-1b59-4b22-8d07-e39eed5b2118/download
https://bibliotecadigital.udea.edu.co/bitstreams/77c54b47-0f3c-4fe2-8b5e-53059adef312/download
https://bibliotecadigital.udea.edu.co/bitstreams/b13ca95f-0fb8-4f7e-8c1f-00f32f2a6c49/download
https://bibliotecadigital.udea.edu.co/bitstreams/9716a973-d94d-4510-ab74-594cfc1a8c2e/download
https://bibliotecadigital.udea.edu.co/bitstreams/c7247ab1-a6dc-48ff-8a8b-57a61c74e0f8/download
bitstream.checksum.fl_str_mv b88b088d9957e670ce3b3fbe2eedbc13
01eb09f68f541a4a7a379855f36aebac
8a4605be74aa9ea9d79846c1fba20a33
f506d08b8ac06b13fee3a2002d6fab26
e861007c214383e17f4bb4f9af1df216
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052604298100736
spelling Orozco Arroyave, Juan RafaelLópez Santander, Diego AlexanderGrupo de Investigación en Telecomunicaciones Aplicadas (GITA)2023-01-18T18:31:04Z2023-01-18T18:31:04Z2022https://hdl.handle.net/10495/33159RESUMEN : Los desórdenes neurodegenerativos como las enfermedades de Parkinson o de Huntington afectan las funciones normales del cuerpo como el habla, el movimiento, el equilibrio, entre otros. Específicamente el deterioro del habla se produce por la pérdida del control de los músculos encargados de la producción del lenguaje oral, esta condición se denomina disartria. Teniendo en cuenta que la disartria está ligada con frecuencia a la progresión de estas enfermedades y que cada una provoca distintos tipos de disartria (disartria hipocinética e hipercinética para Parkinson y Huntington respectivamente), es posible desarrollar sistemas de evaluación automática a partir de señales de voz para apoyar a los profesionales de la salud en el diagnóstico y toma de decisiones para el tratamiento temprano de pacientes de enfermedades neurodegenerativas como el Parkinson y Huntington. El enfoque propuesto en el presente trabajo consiste en desarrollar una arquitectura basada en redes neuronales convolucionales de una dimensión (CNNs) seguidas de redes neuronales recurrentes (RNN) para la clasificación del habla patológica, considerando que esta configuración es típicamente usada para el modelamiento de información secuencial, como es el caso de una señal de audio en el dominio del tiempo. Particularmente, en este trabajo se realizó la clasificación de la disartria hipocinética vs. habla sana, disartria hipercinética vs. habla sana y disartria hipocinética vs disartria hipercinética. El modelo desarrollado fue entrenado y evaluado usando dos bases de datos con diferentes tareas de habla realizadas por hablantes nativos checos. Además, se comparó el rendimiento del modelo implementado con métodos clásicos, es decir, sin el uso de herramientas de aprendizaje profundo. En general los resultados alcanzados con la arquitectura de aprendizaje profundo propuesta no superaron los resultados obtenidos usando características clásicas de articulación y prosodia, sin embargo, se desarrolló un marco de trabajo sistemático con el potencial para evaluar y optimizar modelos de aprendizaje profundo.ABSTRACT : Neurodegenerative disorders such as Parkinson's or Huntington's disease affect normal body functions such as speech, movement, balance, among others. Specifically, speech deterioration is caused by the loss of proper control of the muscles responsible for oral language production, this condition is called dysarthria. Considering that dysarthria is often linked to the progression of these diseases and that each causes different types of dysarthria (hypokinetic and hyperkinetic dysarthria for Parkinson's and Huntington's disease respectively), it is possible to develop automatic evaluation systems based on speech signals to support healthcare professionals in diagnosing and making decisions for early treatment of patients with neurodegenerative diseases such as Parkinson's and Huntington's disease. The approach proposed in this work consists of developing an architecture based on one dimensional convolutional neural networks (CNNs) followed by recurrent neural networks (RNNs) for pathological speech classification, considering that this configuration is typically used for modeling sequential information, such as an audio signal in the time domain. Particularly, the experiments performed in this work were: the classification of hypokinetic dysarthria vs. healthy speech, hyperkinetic dysarthria vs. healthy speech and hypokinetic dysarthria vs. hyperkinetic dysarthria. The developed model was trained and evaluated using two databases with different speech tasks performed by Czech native speakers. In addition, the performance of the implemented model was compared with classical methods, i.e., without the use of deep learning tools. Overall, the results achieved with the proposed deep learning architecture did not outperform the results obtained using classical articulation and prosody features, however, the systematic framework developed throughout the research has the potential to evaluate and optimize other deep learning models.PregradoIngeniero Electrónico43application/pdfspaUniversidad de AntioquiaMedellín - ColombiaFacultad de Ingeniería. Ingeniería Electrónicahttps://creativecommons.org/licenses/by-nc-sa/4.0/http://creativecommons.org/licenses/by-nc-nd/2.5/co/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de vozTesis/Trabajo de grado - Monografía - Pregradohttp://purl.org/coar/resource_type/c_7a1fhttps://purl.org/redcol/resource_type/TPhttp://purl.org/coar/version/c_b1a7d7d4d402bcceinfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/draftDisartriaDysarthriaEnfermedad de ParkinsonParkinson DiseaseEnfermedad de HuntingtonHuntington DiseaseHablaSpeechAprendizaje profundoDeep LearningRedes Neuronales ConvolucionalesRedes Neuronales RecurrentesPublicationCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8823https://bibliotecadigital.udea.edu.co/bitstreams/201841f5-1b59-4b22-8d07-e39eed5b2118/downloadb88b088d9957e670ce3b3fbe2eedbc13MD53falseAnonymousREADORIGINALLopezDiego_2022_RedesNeuronalesDisartria.pdfLopezDiego_2022_RedesNeuronalesDisartria.pdfTrabajo de grado de pregradoapplication/pdf1307191https://bibliotecadigital.udea.edu.co/bitstreams/77c54b47-0f3c-4fe2-8b5e-53059adef312/download01eb09f68f541a4a7a379855f36aebacMD51trueAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/b13ca95f-0fb8-4f7e-8c1f-00f32f2a6c49/download8a4605be74aa9ea9d79846c1fba20a33MD54falseAnonymousREADTEXTLopezDiego_2022_RedesNeuronalesDisartria.pdf.txtLopezDiego_2022_RedesNeuronalesDisartria.pdf.txtExtracted texttext/plain72395https://bibliotecadigital.udea.edu.co/bitstreams/9716a973-d94d-4510-ab74-594cfc1a8c2e/downloadf506d08b8ac06b13fee3a2002d6fab26MD55falseAnonymousREADTHUMBNAILLopezDiego_2022_RedesNeuronalesDisartria.pdf.jpgLopezDiego_2022_RedesNeuronalesDisartria.pdf.jpgGenerated Thumbnailimage/jpeg7491https://bibliotecadigital.udea.edu.co/bitstreams/c7247ab1-a6dc-48ff-8a8b-57a61c74e0f8/downloade861007c214383e17f4bb4f9af1df216MD56falseAnonymousREAD10495/33159oai:bibliotecadigital.udea.edu.co:10495/331592025-03-27 00:55:52.423https://creativecommons.org/licenses/by-nc-sa/4.0/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=