Implicaciones legales del web scraping en el entrenamiento de modelos de inteligencia artificial generativa

El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artí...

Full description

Autores:
Pacheco Chaparro , Juan Manuel
Barrero Ramírez, Laura
Tipo de recurso:
Article of journal
Fecha de publicación:
2024
Institución:
Universidad Externado de Colombia
Repositorio:
Biblioteca Digital Universidad Externado de Colombia
Idioma:
spa
OAI Identifier:
oai:bdigital.uexternado.edu.co:001/26285
Acceso en línea:
https://bdigital.uexternado.edu.co/handle/001/26285
https://doi.org/10.18601/16571959.n38.07
Palabra clave:
Data,
Web Scraping,
Artificial Intelligence,
Terms of Service (ToS),
Privacy,
Intellectual Property,
Public Domain
datos,
web scraping,
inteligencia artificial,
términos de servicio (ToS),
privacidad,
propiedad intelectual,
dominio público
Rights
openAccess
License
Juan Manuel Pacheco Chaparro , Laura Barrero Ramírez - 2024
Description
Summary:El web scraping es una técnica que se usa para recopilar datos en Internet y almacenarlos en una base de datos. Ese proceso se usa, entre otras cosas, para entrenar modelos de inteligencia artificial generativa y ha generado controversia alrededor del mundo debido a sus riesgos legales. En este artículo se analizará la viabilidad legal del uso de técnicas de web scraping y se abordarán tensiones relacionadas con asuntos contractuales de los términos de servicio de las páginas web, los riesgos legales que se desprenden de estas técnicas y, en particular, del uso de obras protegidas en el entrenamiento de modelos de inteligencia artificial generativa, de protección de datos personales y de implicaciones penales; las licencias open source, open access y de Creative Commons, así como también los datos de dominio público y en cabeza del Estado colombiano. Este artículo pretende ser un marco teórico inicial para la discusión del web scraping en modelos de inteligencia artificial generativa, dado que, a la fecha de elaboración de este artículo, el desarrollo normativo y jurisprudencial sobre este tema es aún incipiente.