Arquitectura de aprendizaje profundo usando CNNs y RNNs para la clasificación de la enfermedad de Parkinson y Huntington a partir de señales de voz
RESUMEN : Los desórdenes neurodegenerativos como las enfermedades de Parkinson o de Huntington afectan las funciones normales del cuerpo como el habla, el movimiento, el equilibrio, entre otros. Específicamente el deterioro del habla se produce por la pérdida del control de los músculos encargados d...
- Autores:
-
López Santander, Diego Alexander
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2022
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/33159
- Acceso en línea:
- https://hdl.handle.net/10495/33159
- Palabra clave:
- Disartria
Dysarthria
Enfermedad de Parkinson
Parkinson Disease
Enfermedad de Huntington
Huntington Disease
Habla
Speech
Aprendizaje profundo
Deep Learning
Redes Neuronales Convolucionales
Redes Neuronales Recurrentes
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc-sa/4.0/
| Summary: | RESUMEN : Los desórdenes neurodegenerativos como las enfermedades de Parkinson o de Huntington afectan las funciones normales del cuerpo como el habla, el movimiento, el equilibrio, entre otros. Específicamente el deterioro del habla se produce por la pérdida del control de los músculos encargados de la producción del lenguaje oral, esta condición se denomina disartria. Teniendo en cuenta que la disartria está ligada con frecuencia a la progresión de estas enfermedades y que cada una provoca distintos tipos de disartria (disartria hipocinética e hipercinética para Parkinson y Huntington respectivamente), es posible desarrollar sistemas de evaluación automática a partir de señales de voz para apoyar a los profesionales de la salud en el diagnóstico y toma de decisiones para el tratamiento temprano de pacientes de enfermedades neurodegenerativas como el Parkinson y Huntington. El enfoque propuesto en el presente trabajo consiste en desarrollar una arquitectura basada en redes neuronales convolucionales de una dimensión (CNNs) seguidas de redes neuronales recurrentes (RNN) para la clasificación del habla patológica, considerando que esta configuración es típicamente usada para el modelamiento de información secuencial, como es el caso de una señal de audio en el dominio del tiempo. Particularmente, en este trabajo se realizó la clasificación de la disartria hipocinética vs. habla sana, disartria hipercinética vs. habla sana y disartria hipocinética vs disartria hipercinética. El modelo desarrollado fue entrenado y evaluado usando dos bases de datos con diferentes tareas de habla realizadas por hablantes nativos checos. Además, se comparó el rendimiento del modelo implementado con métodos clásicos, es decir, sin el uso de herramientas de aprendizaje profundo. En general los resultados alcanzados con la arquitectura de aprendizaje profundo propuesta no superaron los resultados obtenidos usando características clásicas de articulación y prosodia, sin embargo, se desarrolló un marco de trabajo sistemático con el potencial para evaluar y optimizar modelos de aprendizaje profundo. |
|---|
