Implementación de modelos de lenguaje de gran escala y procesamiento de lenguaje natural en transformación de bases de datos no estructuradas
Las opiniones de los usuarios son valiosas para las empresas, ya que reflejan sus experiencias auténticas con productos, marcas y servicios. Sin embargo, al presentarse como datos no estructurados, su procesamiento directo es complejo. En este contexto, el uso de modelos de lenguaje de gran tamaño,...
- Autores:
-
Díaz Pérez, Sara Milena
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2025
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/45984
- Acceso en línea:
- https://hdl.handle.net/10495/45984
- Palabra clave:
- Lingüística computacional
Computational linguistics
Aprendizaje profundo (Aprendizaje automático)
Deep learning (Machine learning)
Aprendizaje por transferencia (Aprendizaje automático)
Transfer learning (Machine learning)
Sistemas de clasificación de aprendizaje
Learning classifier systems
Análisis de sentimiento
Sentiment analysis
Aprendizaje automático
Machine learning
Procesamiento del lenguaje natural
Natural language processing
Minería de datos
Data mining
Inteligencia artificial
Artificial intelligence
Modelos de lenguaje de gran escala
Bases de datos no estructuradas
http://aims.fao.org/aos/agrovoc/c_49834
http://aims.fao.org/aos/agrovoc/c_77881e5c
http://aims.fao.org/aos/agrovoc/c_eb9cea5d
http://aims.fao.org/aos/agrovoc/c_27064
http://id.loc.gov/authorities/subjects/sh85077224
http://id.loc.gov/authorities/subjects/sh2021006947
http://id.loc.gov/authorities/subjects/sh2021001274
http://id.loc.gov/authorities/subjects/sh2009000319
http://id.loc.gov/authorities/subjects/sh2020008029
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
| Summary: | Las opiniones de los usuarios son valiosas para las empresas, ya que reflejan sus experiencias auténticas con productos, marcas y servicios. Sin embargo, al presentarse como datos no estructurados, su procesamiento directo es complejo. En este contexto, el uso de modelos de lenguaje de gran tamaño, conocidos por sus siglas en inglés LLMs (Large Language Models), y de técnicas de procesamiento de lenguaje natural, conocidas como NLP (Natural Language Processing) desempeña un papel central, permitiendo transformar la información disponible en un formato adecuado para análisis estadísticos, sin forzar a los usuarios a opciones cerradas. En este proceso se plantean dos enfoques. El primero es un modelo supervisado, fundamentado en métricas de similitud como Levenshtein y similitud de coseno, en conjunto con técnicas de NLP que exploran coincidencias léxicas. El segundo enfoque es no supervisado y emplea el modelo LLaMA (Large Language Model Meta AI, modelo de inteligencia artificial de la empresa Meta/Facebook) junto con herramientas como LangChain, Chroma y GROC, además de plataformas como Hugging Face, todas integradas en Python. Este conjunto permite desarrollar un sistema con funciones específicas para reclasificar las respuestas de los usuarios en categorías generales basadas en similitudes semánticas. La implementación se llevó a cabo utilizando bases de datos reales proporcionadas por la empresa donde se realizaron las prácticas académicas. |
|---|
