Implementación de un sistema Web SCRAPING

Este proyecto fue realizado con el propósito de desarrollar un prototipo funcional de un software para extraer automáticamente información de títulos de artículos usando palabras clave. La fuente de datos es el repositorio virtual de la Universidad Antonio José Camacho, y se emplea la técnica de Web...

Full description

Autores:
Andrade Hernández, John Fernando
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Institución Universitaria Antonio Jose Camacho
Repositorio:
Repositorio Uniajc
Idioma:
spa
OAI Identifier:
oai:repositorio.uniajc.edu.co:uniajc/2391
Acceso en línea:
https://repositorio.uniajc.edu.co/handle/uniajc/2391
Palabra clave:
Repositorio
Automatizado
Uniajc
Web scraping
Python
Repository
Automated
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:Este proyecto fue realizado con el propósito de desarrollar un prototipo funcional de un software para extraer automáticamente información de títulos de artículos usando palabras clave. La fuente de datos es el repositorio virtual de la Universidad Antonio José Camacho, y se emplea la técnica de Web Scraping para reducir los tiempos de búsqueda de antecedentes perteneciente a la institución. Además, se realizó una investigación para aclarar los puntos relacionados con el tema. El programa se implementó en Python, específicamente utilizando la librería BeautifulSoup. Cabe mencionar que, al utilizar esta técnica de extracción, es importante considerar las leyes relacionadas con la vulneración de derechos de autor.