Sistema de búsqueda personalizada y recomendación de documentación científica

RESUMEN: La sobrecarga de información ha sido un problema ampliamente tratado entre la comunidad científica de las áreas de recuperación y filtrado de información. Un investigador que se encuentre buscando a través de la Web se enfrenta a dicho problema cuando se encuentra reuniendo información y ar...

Full description

Autores:
Salazar Girón, Erika Johana
Ortega Lobo, Oscar
Tipo de recurso:
Article of investigation
Fecha de publicación:
2006
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/38346
Acceso en línea:
https://hdl.handle.net/10495/38346
Palabra clave:
Agrupamiento de términos
Terms clustering
Dispositivos de acierto
Recall devices
Recuperación de información
Information retrieval
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Búsquedas bibliográficas
Searching, bibliographical
Servicios de alerta
Current awareness services
Usuarios de información
Information users
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc/4.0/
Description
Summary:RESUMEN: La sobrecarga de información ha sido un problema ampliamente tratado entre la comunidad científica de las áreas de recuperación y filtrado de información. Un investigador que se encuentre buscando a través de la Web se enfrenta a dicho problema cuando se encuentra reuniendo información y artículos para la generación de un estado del arte en sus temas específicos de investigación. Las fuentes de información electrónica especializada a consultar son diversas y los documentos obtenidos a partir de ellas son tan numerosos que deben ser examinados uno a uno por los investigadores con el fin de filtrar aquellos que representan la información más relevante y actualizada. Como solución al problema, han surgido los llamados sistemas de recomendación y filtrado de información, los cuales, aunque aplicados con mayor frecuencia en sitios comerciales de ventas en línea, se han planteado como una posibilidad de apoyo a los usuarios en sus búsquedas de información, ayudando en la localización y filtrado automático de documentos interesantes. Sin embargo, sistemas como estos son poco comunes, más allá de aplicaciones experimentales o de comercio electrónico, y son poco conocidos por la comunidad de usuarios en general. En el presente artículo se presenta el desarrollo de un sistema de búsqueda y recomendación automática de documentos, dirigido hacia los usuarios investigadores de una comunidad académica con intereses de información documental especializada. El sistema cuenta con varios módulos. Un módulo de generación de consultas, encargado de extraer y transformar en consultas los términos más importantes contenidos en los perfiles de cada usuario; un módulo de búsqueda y descarga de documentos, encargado de enviar las consultas a un conjunto de buscadores de documentos científicos en la Web y luego descargarlos; un módulo de agrupamiento, encargado de procesar y almacenar los documentos obtenidos a partir de las búsquedas; y un módulo de filtrado, recomendación y retroalimentación, encargado de filtrar los subconjuntos de documentos relevantes para ser recomendados a los usuarios y de ajustar los perfiles de dichos usuarios a partir de los valores de calificación que ellos suministran, ya sea implícita o explícitamente, a los documentos que les son recomendados. Las recomendaciones producidas por el sistema desarrollado fueron evaluadas según el cambio en la calidad de las mismas a lo largo del tiempo para un conjunto de usuarios. Dicha calidad se midió usando el área bajo la curva ROC, la cual debía aumentar a lo largo del tiempo en que es usado el sistema, indicando un aprendizaje y mejora en los resultados de recomendación presentados a los usuarios. Aunque durante la evaluación se obtuvo un buen desempeño y el área bajo la curva ROC demostró un aumento en la calidad de los resultados de recomendación a lo largo del tiempo, dicho aumento fue mucho mayor al comienzo de los experimentos que al final de los mismos. Por lo tanto, para establecer las causas de tales variaciones, se plantearon nuevas hipótesis estableciendo la importancia que tiene la frecuencia de generación de recomendaciones en el desempeño del sistema y la necesidad de realizar experimentación mucho más extensa y detallada.