Sistema de búsqueda personalizada y recomendación de documentación científica

RESUMEN: La sobrecarga de información ha sido un problema ampliamente tratado entre la comunidad científica de las áreas de recuperación y filtrado de información. Un investigador que se encuentre buscando a través de la Web se enfrenta a dicho problema cuando se encuentra reuniendo información y ar...

Full description

Autores:
Salazar Girón, Erika Johana
Ortega Lobo, Oscar
Tipo de recurso:
Article of investigation
Fecha de publicación:
2006
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/38346
Acceso en línea:
https://hdl.handle.net/10495/38346
Palabra clave:
Agrupamiento de términos
Terms clustering
Dispositivos de acierto
Recall devices
Recuperación de información
Information retrieval
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Búsquedas bibliográficas
Searching, bibliographical
Servicios de alerta
Current awareness services
Usuarios de información
Information users
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc/4.0/
id UDEA2_8d4627f69c99bf035f762a52be735651
oai_identifier_str oai:bibliotecadigital.udea.edu.co:10495/38346
network_acronym_str UDEA2
network_name_str Repositorio UdeA
repository_id_str
dc.title.spa.fl_str_mv Sistema de búsqueda personalizada y recomendación de documentación científica
dc.title.translated.spa.fl_str_mv System for personalized search and distribution of scientific documentation
title Sistema de búsqueda personalizada y recomendación de documentación científica
spellingShingle Sistema de búsqueda personalizada y recomendación de documentación científica
Agrupamiento de términos
Terms clustering
Dispositivos de acierto
Recall devices
Recuperación de información
Information retrieval
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Búsquedas bibliográficas
Searching, bibliographical
Servicios de alerta
Current awareness services
Usuarios de información
Information users
title_short Sistema de búsqueda personalizada y recomendación de documentación científica
title_full Sistema de búsqueda personalizada y recomendación de documentación científica
title_fullStr Sistema de búsqueda personalizada y recomendación de documentación científica
title_full_unstemmed Sistema de búsqueda personalizada y recomendación de documentación científica
title_sort Sistema de búsqueda personalizada y recomendación de documentación científica
dc.creator.fl_str_mv Salazar Girón, Erika Johana
Ortega Lobo, Oscar
dc.contributor.author.none.fl_str_mv Salazar Girón, Erika Johana
Ortega Lobo, Oscar
dc.contributor.researchgroup.spa.fl_str_mv Simulación de Comportamientos de Sistemas (SICOSIS)
dc.subject.lemb.none.fl_str_mv Agrupamiento de términos
Terms clustering
Dispositivos de acierto
Recall devices
Recuperación de información
Information retrieval
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Búsquedas bibliográficas
Searching, bibliographical
Servicios de alerta
Current awareness services
Usuarios de información
Information users
topic Agrupamiento de términos
Terms clustering
Dispositivos de acierto
Recall devices
Recuperación de información
Information retrieval
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Búsquedas bibliográficas
Searching, bibliographical
Servicios de alerta
Current awareness services
Usuarios de información
Information users
description RESUMEN: La sobrecarga de información ha sido un problema ampliamente tratado entre la comunidad científica de las áreas de recuperación y filtrado de información. Un investigador que se encuentre buscando a través de la Web se enfrenta a dicho problema cuando se encuentra reuniendo información y artículos para la generación de un estado del arte en sus temas específicos de investigación. Las fuentes de información electrónica especializada a consultar son diversas y los documentos obtenidos a partir de ellas son tan numerosos que deben ser examinados uno a uno por los investigadores con el fin de filtrar aquellos que representan la información más relevante y actualizada. Como solución al problema, han surgido los llamados sistemas de recomendación y filtrado de información, los cuales, aunque aplicados con mayor frecuencia en sitios comerciales de ventas en línea, se han planteado como una posibilidad de apoyo a los usuarios en sus búsquedas de información, ayudando en la localización y filtrado automático de documentos interesantes. Sin embargo, sistemas como estos son poco comunes, más allá de aplicaciones experimentales o de comercio electrónico, y son poco conocidos por la comunidad de usuarios en general. En el presente artículo se presenta el desarrollo de un sistema de búsqueda y recomendación automática de documentos, dirigido hacia los usuarios investigadores de una comunidad académica con intereses de información documental especializada. El sistema cuenta con varios módulos. Un módulo de generación de consultas, encargado de extraer y transformar en consultas los términos más importantes contenidos en los perfiles de cada usuario; un módulo de búsqueda y descarga de documentos, encargado de enviar las consultas a un conjunto de buscadores de documentos científicos en la Web y luego descargarlos; un módulo de agrupamiento, encargado de procesar y almacenar los documentos obtenidos a partir de las búsquedas; y un módulo de filtrado, recomendación y retroalimentación, encargado de filtrar los subconjuntos de documentos relevantes para ser recomendados a los usuarios y de ajustar los perfiles de dichos usuarios a partir de los valores de calificación que ellos suministran, ya sea implícita o explícitamente, a los documentos que les son recomendados. Las recomendaciones producidas por el sistema desarrollado fueron evaluadas según el cambio en la calidad de las mismas a lo largo del tiempo para un conjunto de usuarios. Dicha calidad se midió usando el área bajo la curva ROC, la cual debía aumentar a lo largo del tiempo en que es usado el sistema, indicando un aprendizaje y mejora en los resultados de recomendación presentados a los usuarios. Aunque durante la evaluación se obtuvo un buen desempeño y el área bajo la curva ROC demostró un aumento en la calidad de los resultados de recomendación a lo largo del tiempo, dicho aumento fue mucho mayor al comienzo de los experimentos que al final de los mismos. Por lo tanto, para establecer las causas de tales variaciones, se plantearon nuevas hipótesis estableciendo la importancia que tiene la frecuencia de generación de recomendaciones en el desempeño del sistema y la necesidad de realizar experimentación mucho más extensa y detallada.
publishDate 2006
dc.date.issued.none.fl_str_mv 2006
dc.date.accessioned.none.fl_str_mv 2024-02-26T16:46:55Z
dc.date.available.none.fl_str_mv 2024-02-26T16:46:55Z
dc.type.spa.fl_str_mv Artículo de investigación
dc.type.coar.spa.fl_str_mv http://purl.org/coar/resource_type/c_2df8fbb1
dc.type.redcol.spa.fl_str_mv https://purl.org/redcol/resource_type/ART
dc.type.coarversion.spa.fl_str_mv http://purl.org/coar/version/c_970fb48d4fbd8a85
dc.type.driver.spa.fl_str_mv info:eu-repo/semantics/article
dc.type.version.spa.fl_str_mv info:eu-repo/semantics/publishedVersion
format http://purl.org/coar/resource_type/c_2df8fbb1
status_str publishedVersion
dc.identifier.citation.spa.fl_str_mv Salazar G., E. J., & Ortega L., O. (2006).Sistema de búsqueda personalizada y recomendación de documentación científica. Revista Iberoamericana de Inteligencia Artificial, 10(30), 25-42.
dc.identifier.issn.none.fl_str_mv 1137-3601
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/10495/38346
dc.identifier.eissn.none.fl_str_mv 1988-3064
identifier_str_mv Salazar G., E. J., & Ortega L., O. (2006).Sistema de búsqueda personalizada y recomendación de documentación científica. Revista Iberoamericana de Inteligencia Artificial, 10(30), 25-42.
1137-3601
1988-3064
url https://hdl.handle.net/10495/38346
dc.language.iso.spa.fl_str_mv spa
language spa
dc.relation.ispartofjournalabbrev.spa.fl_str_mv Intel. Artif.
dc.relation.citationendpage.spa.fl_str_mv 42
dc.relation.citationissue.spa.fl_str_mv 30
dc.relation.citationstartpage.spa.fl_str_mv 25
dc.relation.citationvolume.spa.fl_str_mv 10
dc.relation.ispartofjournal.spa.fl_str_mv Inteligencia Artificial
dc.rights.uri.spa.fl_str_mv https://creativecommons.org/licenses/by-nc/4.0/
dc.rights.uri.*.fl_str_mv http://creativecommons.org/licenses/by-nc/2.5/co/
dc.rights.accessrights.spa.fl_str_mv info:eu-repo/semantics/openAccess
dc.rights.coar.spa.fl_str_mv http://purl.org/coar/access_right/c_abf2
rights_invalid_str_mv https://creativecommons.org/licenses/by-nc/4.0/
http://creativecommons.org/licenses/by-nc/2.5/co/
http://purl.org/coar/access_right/c_abf2
eu_rights_str_mv openAccess
dc.format.extent.spa.fl_str_mv 19 páginas
dc.format.mimetype.spa.fl_str_mv application/pdf
dc.publisher.spa.fl_str_mv Sociedad Iberoamericana de Inteligencia Artificial
dc.publisher.place.spa.fl_str_mv Valencia, España
institution Universidad de Antioquia
bitstream.url.fl_str_mv https://bibliotecadigital.udea.edu.co/bitstreams/c28fe074-08c4-469a-98ac-d5f31e824ce4/download
https://bibliotecadigital.udea.edu.co/bitstreams/d4b381bb-cc86-4ffa-8bb7-77a504e92fee/download
https://bibliotecadigital.udea.edu.co/bitstreams/c2ac9d1d-ff16-4cbf-b33b-d131cb936af5/download
https://bibliotecadigital.udea.edu.co/bitstreams/036ad269-e83f-48a3-9f73-d0fffad1da58/download
https://bibliotecadigital.udea.edu.co/bitstreams/1705f4a1-514d-43ce-b777-5fb55ca4186a/download
bitstream.checksum.fl_str_mv c0c92b0ffc8b7d22d9cf56754a416a76
8a4605be74aa9ea9d79846c1fba20a33
4fa7f1c5b12a530dc91efdb5bfb8954c
71aa971f32113f29ca5ff222fde33385
71e90c950d34f16b2f6efb15b0db7f16
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
MD5
MD5
MD5
repository.name.fl_str_mv Repositorio Institucional de la Universidad de Antioquia
repository.mail.fl_str_mv aplicacionbibliotecadigitalbiblioteca@udea.edu.co
_version_ 1851052276749172736
spelling Salazar Girón, Erika JohanaOrtega Lobo, OscarSimulación de Comportamientos de Sistemas (SICOSIS)2024-02-26T16:46:55Z2024-02-26T16:46:55Z2006Salazar G., E. J., & Ortega L., O. (2006).Sistema de búsqueda personalizada y recomendación de documentación científica. Revista Iberoamericana de Inteligencia Artificial, 10(30), 25-42.1137-3601https://hdl.handle.net/10495/383461988-3064RESUMEN: La sobrecarga de información ha sido un problema ampliamente tratado entre la comunidad científica de las áreas de recuperación y filtrado de información. Un investigador que se encuentre buscando a través de la Web se enfrenta a dicho problema cuando se encuentra reuniendo información y artículos para la generación de un estado del arte en sus temas específicos de investigación. Las fuentes de información electrónica especializada a consultar son diversas y los documentos obtenidos a partir de ellas son tan numerosos que deben ser examinados uno a uno por los investigadores con el fin de filtrar aquellos que representan la información más relevante y actualizada. Como solución al problema, han surgido los llamados sistemas de recomendación y filtrado de información, los cuales, aunque aplicados con mayor frecuencia en sitios comerciales de ventas en línea, se han planteado como una posibilidad de apoyo a los usuarios en sus búsquedas de información, ayudando en la localización y filtrado automático de documentos interesantes. Sin embargo, sistemas como estos son poco comunes, más allá de aplicaciones experimentales o de comercio electrónico, y son poco conocidos por la comunidad de usuarios en general. En el presente artículo se presenta el desarrollo de un sistema de búsqueda y recomendación automática de documentos, dirigido hacia los usuarios investigadores de una comunidad académica con intereses de información documental especializada. El sistema cuenta con varios módulos. Un módulo de generación de consultas, encargado de extraer y transformar en consultas los términos más importantes contenidos en los perfiles de cada usuario; un módulo de búsqueda y descarga de documentos, encargado de enviar las consultas a un conjunto de buscadores de documentos científicos en la Web y luego descargarlos; un módulo de agrupamiento, encargado de procesar y almacenar los documentos obtenidos a partir de las búsquedas; y un módulo de filtrado, recomendación y retroalimentación, encargado de filtrar los subconjuntos de documentos relevantes para ser recomendados a los usuarios y de ajustar los perfiles de dichos usuarios a partir de los valores de calificación que ellos suministran, ya sea implícita o explícitamente, a los documentos que les son recomendados. Las recomendaciones producidas por el sistema desarrollado fueron evaluadas según el cambio en la calidad de las mismas a lo largo del tiempo para un conjunto de usuarios. Dicha calidad se midió usando el área bajo la curva ROC, la cual debía aumentar a lo largo del tiempo en que es usado el sistema, indicando un aprendizaje y mejora en los resultados de recomendación presentados a los usuarios. Aunque durante la evaluación se obtuvo un buen desempeño y el área bajo la curva ROC demostró un aumento en la calidad de los resultados de recomendación a lo largo del tiempo, dicho aumento fue mucho mayor al comienzo de los experimentos que al final de los mismos. Por lo tanto, para establecer las causas de tales variaciones, se plantearon nuevas hipótesis estableciendo la importancia que tiene la frecuencia de generación de recomendaciones en el desempeño del sistema y la necesidad de realizar experimentación mucho más extensa y detallada.COL001613919 páginasapplication/pdfspaSociedad Iberoamericana de Inteligencia ArtificialValencia, Españahttps://creativecommons.org/licenses/by-nc/4.0/http://creativecommons.org/licenses/by-nc/2.5/co/info:eu-repo/semantics/openAccesshttp://purl.org/coar/access_right/c_abf2Sistema de búsqueda personalizada y recomendación de documentación científicaSystem for personalized search and distribution of scientific documentationArtículo de investigaciónhttp://purl.org/coar/resource_type/c_2df8fbb1https://purl.org/redcol/resource_type/ARThttp://purl.org/coar/version/c_970fb48d4fbd8a85info:eu-repo/semantics/articleinfo:eu-repo/semantics/publishedVersionAgrupamiento de términosTerms clusteringDispositivos de aciertoRecall devicesRecuperación de informaciónInformation retrievalSistemas de almacenamiento y recuperación de informaciónInformation storage and retrieval systemsBúsquedas bibliográficasSearching, bibliographicalServicios de alertaCurrent awareness servicesUsuarios de informaciónInformation usersIntel. Artif.42302510Inteligencia ArtificialPublicationCC-LICENSElicense_rdflicense_rdfapplication/rdf+xml; charset=utf-8933https://bibliotecadigital.udea.edu.co/bitstreams/c28fe074-08c4-469a-98ac-d5f31e824ce4/downloadc0c92b0ffc8b7d22d9cf56754a416a76MD52falseAnonymousREADLICENSElicense.txtlicense.txttext/plain; charset=utf-81748https://bibliotecadigital.udea.edu.co/bitstreams/d4b381bb-cc86-4ffa-8bb7-77a504e92fee/download8a4605be74aa9ea9d79846c1fba20a33MD53falseAnonymousREADORIGINALSalazarErika_2006_SistemaBusquedaPersonalizada.pdfSalazarErika_2006_SistemaBusquedaPersonalizada.pdfArtículo de investigaciónapplication/pdf404995https://bibliotecadigital.udea.edu.co/bitstreams/c2ac9d1d-ff16-4cbf-b33b-d131cb936af5/download4fa7f1c5b12a530dc91efdb5bfb8954cMD51trueAnonymousREADTEXTSalazarErika_2006_SistemaBusquedaPersonalizada.pdf.txtSalazarErika_2006_SistemaBusquedaPersonalizada.pdf.txtExtracted texttext/plain72507https://bibliotecadigital.udea.edu.co/bitstreams/036ad269-e83f-48a3-9f73-d0fffad1da58/download71aa971f32113f29ca5ff222fde33385MD54falseAnonymousREADTHUMBNAILSalazarErika_2006_SistemaBusquedaPersonalizada.pdf.jpgSalazarErika_2006_SistemaBusquedaPersonalizada.pdf.jpgGenerated Thumbnailimage/jpeg6670https://bibliotecadigital.udea.edu.co/bitstreams/1705f4a1-514d-43ce-b777-5fb55ca4186a/download71e90c950d34f16b2f6efb15b0db7f16MD55falseAnonymousREAD10495/38346oai:bibliotecadigital.udea.edu.co:10495/383462025-03-26 19:44:50.664https://creativecommons.org/licenses/by-nc/4.0/open.accesshttps://bibliotecadigital.udea.edu.coRepositorio Institucional de la Universidad de Antioquiaaplicacionbibliotecadigitalbiblioteca@udea.edu.coTk9URTogUExBQ0UgWU9VUiBPV04gTElDRU5TRSBIRVJFClRoaXMgc2FtcGxlIGxpY2Vuc2UgaXMgcHJvdmlkZWQgZm9yIGluZm9ybWF0aW9uYWwgcHVycG9zZXMgb25seS4KCk5PTi1FWENMVVNJVkUgRElTVFJJQlVUSU9OIExJQ0VOU0UKCkJ5IHNpZ25pbmcgYW5kIHN1Ym1pdHRpbmcgdGhpcyBsaWNlbnNlLCB5b3UgKHRoZSBhdXRob3Iocykgb3IgY29weXJpZ2h0Cm93bmVyKSBncmFudHMgdG8gRFNwYWNlIFVuaXZlcnNpdHkgKERTVSkgdGhlIG5vbi1leGNsdXNpdmUgcmlnaHQgdG8gcmVwcm9kdWNlLAp0cmFuc2xhdGUgKGFzIGRlZmluZWQgYmVsb3cpLCBhbmQvb3IgZGlzdHJpYnV0ZSB5b3VyIHN1Ym1pc3Npb24gKGluY2x1ZGluZwp0aGUgYWJzdHJhY3QpIHdvcmxkd2lkZSBpbiBwcmludCBhbmQgZWxlY3Ryb25pYyBmb3JtYXQgYW5kIGluIGFueSBtZWRpdW0sCmluY2x1ZGluZyBidXQgbm90IGxpbWl0ZWQgdG8gYXVkaW8gb3IgdmlkZW8uCgpZb3UgYWdyZWUgdGhhdCBEU1UgbWF5LCB3aXRob3V0IGNoYW5naW5nIHRoZSBjb250ZW50LCB0cmFuc2xhdGUgdGhlCnN1Ym1pc3Npb24gdG8gYW55IG1lZGl1bSBvciBmb3JtYXQgZm9yIHRoZSBwdXJwb3NlIG9mIHByZXNlcnZhdGlvbi4KCllvdSBhbHNvIGFncmVlIHRoYXQgRFNVIG1heSBrZWVwIG1vcmUgdGhhbiBvbmUgY29weSBvZiB0aGlzIHN1Ym1pc3Npb24gZm9yCnB1cnBvc2VzIG9mIHNlY3VyaXR5LCBiYWNrLXVwIGFuZCBwcmVzZXJ2YXRpb24uCgpZb3UgcmVwcmVzZW50IHRoYXQgdGhlIHN1Ym1pc3Npb24gaXMgeW91ciBvcmlnaW5hbCB3b3JrLCBhbmQgdGhhdCB5b3UgaGF2ZQp0aGUgcmlnaHQgdG8gZ3JhbnQgdGhlIHJpZ2h0cyBjb250YWluZWQgaW4gdGhpcyBsaWNlbnNlLiBZb3UgYWxzbyByZXByZXNlbnQKdGhhdCB5b3VyIHN1Ym1pc3Npb24gZG9lcyBub3QsIHRvIHRoZSBiZXN0IG9mIHlvdXIga25vd2xlZGdlLCBpbmZyaW5nZSB1cG9uCmFueW9uZSdzIGNvcHlyaWdodC4KCklmIHRoZSBzdWJtaXNzaW9uIGNvbnRhaW5zIG1hdGVyaWFsIGZvciB3aGljaCB5b3UgZG8gbm90IGhvbGQgY29weXJpZ2h0LAp5b3UgcmVwcmVzZW50IHRoYXQgeW91IGhhdmUgb2J0YWluZWQgdGhlIHVucmVzdHJpY3RlZCBwZXJtaXNzaW9uIG9mIHRoZQpjb3B5cmlnaHQgb3duZXIgdG8gZ3JhbnQgRFNVIHRoZSByaWdodHMgcmVxdWlyZWQgYnkgdGhpcyBsaWNlbnNlLCBhbmQgdGhhdApzdWNoIHRoaXJkLXBhcnR5IG93bmVkIG1hdGVyaWFsIGlzIGNsZWFybHkgaWRlbnRpZmllZCBhbmQgYWNrbm93bGVkZ2VkCndpdGhpbiB0aGUgdGV4dCBvciBjb250ZW50IG9mIHRoZSBzdWJtaXNzaW9uLgoKSUYgVEhFIFNVQk1JU1NJT04gSVMgQkFTRUQgVVBPTiBXT1JLIFRIQVQgSEFTIEJFRU4gU1BPTlNPUkVEIE9SIFNVUFBPUlRFRApCWSBBTiBBR0VOQ1kgT1IgT1JHQU5JWkFUSU9OIE9USEVSIFRIQU4gRFNVLCBZT1UgUkVQUkVTRU5UIFRIQVQgWU9VIEhBVkUKRlVMRklMTEVEIEFOWSBSSUdIVCBPRiBSRVZJRVcgT1IgT1RIRVIgT0JMSUdBVElPTlMgUkVRVUlSRUQgQlkgU1VDSApDT05UUkFDVCBPUiBBR1JFRU1FTlQuCgpEU1Ugd2lsbCBjbGVhcmx5IGlkZW50aWZ5IHlvdXIgbmFtZShzKSBhcyB0aGUgYXV0aG9yKHMpIG9yIG93bmVyKHMpIG9mIHRoZQpzdWJtaXNzaW9uLCBhbmQgd2lsbCBub3QgbWFrZSBhbnkgYWx0ZXJhdGlvbiwgb3RoZXIgdGhhbiBhcyBhbGxvd2VkIGJ5IHRoaXMKbGljZW5zZSwgdG8geW91ciBzdWJtaXNzaW9uLgo=