Estrategia computacional para predecir la calidad del café tostado a partir de variables del proceso utilizando algoritmos de machine learning

Este proyecto se enfoca en el análisis de datos del proceso de tostión de café y propone un modelo computacional para predecir la calidad final del producto utilizando estrategias de machine learning, específicamente algoritmos de clustering y regresión. El análisis de datos inicia con la recopilaci...

Full description

Autores:
Ascanio Herrera, Yulieth Vanessa
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2025
Institución:
Corporación Universitaria Remington
Repositorio:
Repositorio institucional Uniremington
Idioma:
spa
OAI Identifier:
oai:repositorio.uniremington.edu.co:123456789/7564
Acceso en línea:
https://repositorio.uniremington.edu.co/handle/123456789/7564
Palabra clave:
Café tostado
Calidad sensorial
Machine learning
Regresión
Clustering
K-Means
DBSCAN
Tostión
Procesamiento de café
Predicción de calidad
Café
Aprendizaje automático (Inteligencia artificial)
Industria del café
Rights
openAccess
License
Atribución-NoComercial-SinDerivadas 4.0 Internacional (CC BY-NC-ND 4.0)
Description
Summary:Este proyecto se enfoca en el análisis de datos del proceso de tostión de café y propone un modelo computacional para predecir la calidad final del producto utilizando estrategias de machine learning, específicamente algoritmos de clustering y regresión. El análisis de datos inicia con la recopilación de información relevante del proceso productivo, incluyendo variables como temperatura, tiempo de tostión, humedad del grano, tipo de café y perfil de tueste. La información obtenida es sometida a un proceso de limpieza, transformación y normalización con el objetivo de garantizar la calidad, homogeneidad y confiabilidad de los datos. Posteriormente, se aplican algoritmos de clustering como K-Means y DBSCAN, con el propósito de segmentar los lotes de café en grupos con características de cocción similares, lo cual permite entender los patrones de tostado más frecuentes y eficientes. A partir de estos segmentos homogéneos, se desarrollan modelos predictivos que estiman la calidad sensorial del café (fragancia, sabor, acidez y cuerpo), clasificando el producto en categorías como bueno, regular o deficiente. La calidad del modelo se evalúa mediante métricas como el silhouette score para validar la coherencia de los clusters, y el R² o MAE en el caso de modelos de regresión. Los resultados demuestran que la combinación de análisis estadístico con algoritmos de machine learning permite optimizar el proceso de tostión, mejorar la estandarización del producto final y tomar decisiones informadas en tiempo real, lo cual aporta significativamente al control de calidad en el sector cafetero.