Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients

La enfermedad de Alzheimer es un desorden neurodegenerativo-progresivo que afecta la producción de lenguaje y las capacidades de pensamiento de los pacientes. La integridad del cerebro es destruida con el paso del tiempo por interrupciones en las interacciones entre neuronas y células, requeridas pa...

Full description

Autores:
Guerrero-Cristancho, Juan S.
Vásquez-Correa, Juan C.
Orozco-Arroyave , Juan R.
Tipo de recurso:
Article of journal
Fecha de publicación:
2020
Institución:
Instituto Tecnológico Metropolitano
Repositorio:
Repositorio ITM
Idioma:
eng
OAI Identifier:
oai:repositorio.itm.edu.co:20.500.12622/4610
Acceso en línea:
https://revistas.itm.edu.co/index.php/tecnologicas/article/view/1387
http://hdl.handle.net/20.500.12622/4610
Palabra clave:
Enfermedad de Alzheimer
procesamiento de lenguaje natural
minería de texto
clasificación
aprendizaje de máquina
Alzheimer's Disease
Natural Language Processing
Text Mining
Classification
Machine Learning
Rights
License
Copyright (c) 2019 TecnoLógicas
id RepoITM2_b1f431e1a4f866c2ff431de2e241bb63
oai_identifier_str oai:repositorio.itm.edu.co:20.500.12622/4610
network_acronym_str RepoITM2
network_name_str Repositorio ITM
repository_id_str
dc.title.spa.fl_str_mv Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
dc.title.alternative.eng.fl_str_mv Detección de desórdenes de lenguaje de pacientes con enfermedad de Alzheimer usando embebimientos de palabras y características gramaticales
title Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
spellingShingle Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
Enfermedad de Alzheimer
procesamiento de lenguaje natural
minería de texto
clasificación
aprendizaje de máquina
Alzheimer's Disease
Natural Language Processing
Text Mining
Classification
Machine Learning
title_short Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
title_full Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
title_fullStr Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
title_full_unstemmed Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
title_sort Word-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease Patients
dc.creator.fl_str_mv Guerrero-Cristancho, Juan S.
Vásquez-Correa, Juan C.
Orozco-Arroyave , Juan R.
dc.contributor.author.none.fl_str_mv Guerrero-Cristancho, Juan S.
Vásquez-Correa, Juan C.
Orozco-Arroyave , Juan R.
dc.subject.spa.fl_str_mv Enfermedad de Alzheimer
procesamiento de lenguaje natural
minería de texto
clasificación
aprendizaje de máquina
topic Enfermedad de Alzheimer
procesamiento de lenguaje natural
minería de texto
clasificación
aprendizaje de máquina
Alzheimer's Disease
Natural Language Processing
Text Mining
Classification
Machine Learning
dc.subject.keywords.eng.fl_str_mv Alzheimer's Disease
Natural Language Processing
Text Mining
Classification
Machine Learning
description La enfermedad de Alzheimer es un desorden neurodegenerativo-progresivo que afecta la producción de lenguaje y las capacidades de pensamiento de los pacientes. La integridad del cerebro es destruida con el paso del tiempo por interrupciones en las interacciones entre neuronas y células, requeridas para su funcionamiento normal. La enfermedad incluye el deterioro de habilidades comunicativas por un habla deficiente, que usualmente contiene información inservible, baja densidad de ideas y habilidades gramaticales. Adicionalmente, los pacientes presentan dificultades para encontrar palabras apropiadas y así estructurar oraciones. Por lo anterior, hay investigaciones en curso que buscan detectar la enfermedad considerando el deterioro de la producción de lenguaje. Así mismo, se están usando técnicas de procesamiento de lenguaje natural para detectar patrones y reconocer las discapacidades del lenguaje de los pacientes. Por su parte, este artículo se enfoca en el uso de características basadas en embebimiento y frecuencia de palabras, además de hacer una nueva aproximación con características gramaticales para clasificar la enfermedad de Alzheimer. Para ello, se consideraron transcripciones de 98 pacientes con Alzheimer y 98 controles sanos del Pitt Corpus incluido en la base de datos Dementia-Bank. Un total de 1200 características de embebimientos de palabras, 1408 características de frecuencia de término inverso vs. frecuencia en documentos, y 8 características gramaticales fueron calculadas. Tres modelos fueron propuestos, basados en la extracción de dichos conjuntos de características por separado y un cuarto modelo fue basado en una estrategia de fusión temprana de los tres conjuntos de características. Los modelos fueron optimizados usando la estrategia de validación cruzada Leave-One-Out. Se alcanzaron tasas de aciertos de hasta 81.7 % usando la fusión temprana de todas las características. Además, se encontró que un pequeño conjunto de características gramaticales logró una tasa de acierto del 72.8 %. Así, los resultados indican que estas características son adecuadas para clasificar de manera efectiva entre pacientes de Alzheimer y controles sanos.
publishDate 2020
dc.date.issued.none.fl_str_mv 2020-01-30
dc.date.accessioned.none.fl_str_mv 2021-04-21T16:55:18Z
dc.date.available.none.fl_str_mv 2021-04-21T16:55:18Z
dc.type.none.fl_str_mv info:eu-repo/semantics/article
dc.type.eng.fl_str_mv Articles
dc.type.coar.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.coarversion.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.spa.spa.fl_str_mv Artículos
dc.type.coar.none.fl_str_mv http://purl.org/coar/resource_type/c_6501
format http://purl.org/coar/resource_type/c_6501
dc.identifier.none.fl_str_mv https://revistas.itm.edu.co/index.php/tecnologicas/article/view/1387
10.22430/22565337.1387
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.12622/4610
url https://revistas.itm.edu.co/index.php/tecnologicas/article/view/1387
http://hdl.handle.net/20.500.12622/4610
identifier_str_mv 10.22430/22565337.1387
dc.language.iso.none.fl_str_mv eng
language eng
dc.relation.none.fl_str_mv https://revistas.itm.edu.co/index.php/tecnologicas/article/view/1387
10.22430/22565337.1387
dc.relation.ispartofjournal.none.fl_str_mv TecnoLógicas
dc.rights.spa.fl_str_mv Copyright (c) 2019 TecnoLógicas
http://creativecommons.org/licenses/by-nc-sa/4.0
dc.rights.coar.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv Copyright (c) 2019 TecnoLógicas
http://creativecommons.org/licenses/by-nc-sa/4.0
http://purl.org/coar/access_right/c_abf2
dc.format.mimetype.none.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Instituto Tecnológico Metropolitano - ITM
dc.source.none.fl_str_mv 2256-5337
0123-7799
dc.source.eng.fl_str_mv TecnoLógicas; Vol. 23 No. 47 (2020); 63-75
dc.source.spa.fl_str_mv TecnoLógicas; Vol. 23 Núm. 47 (2020); 63-75
institution Instituto Tecnológico Metropolitano
repository.name.fl_str_mv Repositorio Instituto Tecnológico Metropolitano de Medellín
repository.mail.fl_str_mv bdigital@metabiblioteca.com
_version_ 1837096888731435008
spelling Guerrero-Cristancho, Juan S.Vásquez-Correa, Juan C.Orozco-Arroyave , Juan R.2021-04-21T16:55:18Z2021-04-21T16:55:18Z2020-01-30https://revistas.itm.edu.co/index.php/tecnologicas/article/view/138710.22430/22565337.1387http://hdl.handle.net/20.500.12622/4610La enfermedad de Alzheimer es un desorden neurodegenerativo-progresivo que afecta la producción de lenguaje y las capacidades de pensamiento de los pacientes. La integridad del cerebro es destruida con el paso del tiempo por interrupciones en las interacciones entre neuronas y células, requeridas para su funcionamiento normal. La enfermedad incluye el deterioro de habilidades comunicativas por un habla deficiente, que usualmente contiene información inservible, baja densidad de ideas y habilidades gramaticales. Adicionalmente, los pacientes presentan dificultades para encontrar palabras apropiadas y así estructurar oraciones. Por lo anterior, hay investigaciones en curso que buscan detectar la enfermedad considerando el deterioro de la producción de lenguaje. Así mismo, se están usando técnicas de procesamiento de lenguaje natural para detectar patrones y reconocer las discapacidades del lenguaje de los pacientes. Por su parte, este artículo se enfoca en el uso de características basadas en embebimiento y frecuencia de palabras, además de hacer una nueva aproximación con características gramaticales para clasificar la enfermedad de Alzheimer. Para ello, se consideraron transcripciones de 98 pacientes con Alzheimer y 98 controles sanos del Pitt Corpus incluido en la base de datos Dementia-Bank. Un total de 1200 características de embebimientos de palabras, 1408 características de frecuencia de término inverso vs. frecuencia en documentos, y 8 características gramaticales fueron calculadas. Tres modelos fueron propuestos, basados en la extracción de dichos conjuntos de características por separado y un cuarto modelo fue basado en una estrategia de fusión temprana de los tres conjuntos de características. Los modelos fueron optimizados usando la estrategia de validación cruzada Leave-One-Out. Se alcanzaron tasas de aciertos de hasta 81.7 % usando la fusión temprana de todas las características. Además, se encontró que un pequeño conjunto de características gramaticales logró una tasa de acierto del 72.8 %. Así, los resultados indican que estas características son adecuadas para clasificar de manera efectiva entre pacientes de Alzheimer y controles sanos.Alzheimer's Disease (AD) is a progressive neurodegenerative disorder that affects the language production and thinking capabilities of patients. The integrity of the brain is destroyed over time by interruptions in the interactions between neuron cells and associated cells required for normal brain functioning. AD comprises deterioration of the communicative skills, which is reflected in deficient speech that usually contains no coherent information, low density of ideas, and poor grammar. Additionally, patients exhibit difficulties to find appropriate words to structure sentences. Multiple ongoing studies aim to detect the disease considering the deterioration of language production in AD patients. Natural Language Processing techniques are employed to detect patterns that can be used to recognize the language impairments of patients. This paper covers advances in pattern recognition with the use of word-embedding and word-frequency features and a new approach with grammar features. We processed transcripts of 98 AD patients and 98 healthy controls in the Pitt Corpus of the Dementia-Bank database. A total of 1200 word-embedding features, 1408 Term Frequency—Inverse Document Frequency features, and 8 grammar features were extracted from the selected transcripts. Three models are proposed based on the separate extraction of such feature sets, and a fourth model is based on an early fusion strategy of the proposed feature sets. All the models were optimized following a Leave-One-Out cross validation strategy. Accuracies of up to 81.7 % were achieved using the early fusion of the three feature sets. Furthermore, we found that, with a small set of grammar features, accuracy values of up to 72.8 % were obtained. The results show that such features are suitable to effectively classify AD patients and healthy controls.application/pdfengInstituto Tecnológico Metropolitano - ITMhttps://revistas.itm.edu.co/index.php/tecnologicas/article/view/138710.22430/22565337.1387TecnoLógicasCopyright (c) 2019 TecnoLógicashttp://creativecommons.org/licenses/by-nc-sa/4.0http://purl.org/coar/access_right/c_abf22256-53370123-7799TecnoLógicas; Vol. 23 No. 47 (2020); 63-75TecnoLógicas; Vol. 23 Núm. 47 (2020); 63-75Enfermedad de Alzheimerprocesamiento de lenguaje naturalminería de textoclasificaciónaprendizaje de máquinaAlzheimer's DiseaseNatural Language ProcessingText MiningClassificationMachine LearningWord-Embeddings and Grammar Features to Detect Language Disorders in Alzheimer’s Disease PatientsDetección de desórdenes de lenguaje de pacientes con enfermedad de Alzheimer usando embebimientos de palabras y características gramaticalesArtículosinfo:eu-repo/semantics/articleArticleshttp://purl.org/coar/resource_type/c_6501http://purl.org/coar/resource_type/c_2df8fbb1http://purl.org/coar/version/c_970fb48d4fbd8a85Publication20.500.12622/4610oai:dspace-itm.metabuscador.org:20.500.12622/46102025-06-20 16:13:33.374metadata.onlyhttps://dspace-itm.metabuscador.orgRepositorio Instituto Tecnológico Metropolitano de Medellínbdigital@metabiblioteca.com