Aplicación web para entrenar y predecir datos financieros, basado en algoritmos supervisados de clasificación y regresión (PredictLab)
RESUMEN : El presente trabajo, también llamado PredictLab, desarrolla un programa interactivo basado en una interfaz web que permite a los usuarios realizar análisis predictivo supervisado de manera eficiente. Facilita la carga del conjunto de datos, el preprocesamiento personalizado y la selección...
- Autores:
-
Gómez Vahos, Jhonatan Stick
Saldarriaga Arias, Sebastián
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2024
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/44466
- Acceso en línea:
- https://hdl.handle.net/10495/44466
- Palabra clave:
- Aprendizaje automático (inteligencia artificial)
Machine learning
Análisis de regresión
Regression analysis
Clasificación (computadores electrónicos)
Sorting (electronic computers)
- Rights
- openAccess
- License
- https://creativecommons.org/licenses/by-nc-sa/4.0/
| Summary: | RESUMEN : El presente trabajo, también llamado PredictLab, desarrolla un programa interactivo basado en una interfaz web que permite a los usuarios realizar análisis predictivo supervisado de manera eficiente. Facilita la carga del conjunto de datos, el preprocesamiento personalizado y la selección del modelo de predicción que mejor se ajusta a los datos en función de métricas específicas. El enfoque se centra exclusivamente en modelos supervisados de clasificación binaria y regresión. Para la clasificación, se consideran algoritmos como regresión logística, random forest, máquinas de soporte vectorial (SVM), KNN y clasificadores de Bayes ingenuo como GaussianNB y BernoulliNB. En el caso de regresión, se evalúan regresión lineal, ridge, random forest, AdaBoost y gradient boosting. Los parámetros de estos modelos son personalizables y se optimizan mediante un proceso de búsqueda de rejillas (grid search) (Scikit-learn Developers, 2023). La selección del modelo óptimo se basa en el puntaje F1 para tareas de clasificación y el error absoluto medio (MAE) para regresión. Algunos de los resultados más representativos se obtuvieron al entrenar los conjuntos de datos, “Bank Marketing” obtenido desde UCI Machine Learning Repository (2014) para clasificación y “Credit Card Limit Prediction” disponible en Kaggle (s.f.) para regresión. En el caso de clasificación se obtuvo el mejor puntaje F1 de 0.92 para máquinas de soporte vectorial (SVM).En el caso de la regresión, se obtuvo el mejor valor en el error absoluto medio (MAE) de -0.006 para regresión logística y ridge, -0.02. Estos resultados fueron alcanzados sin configuraciones avanzadas ni depuración previa de los datos, teniendo en cuenta que dichos resultados se obtuvieron cargando los datos tal y como están en los repositorios y con la configuración por defecto de PredictLab. Palabras clave: Clasificación, regresión, búsqueda de rejillas, puntaje F1, error absoluto medio (MAE). |
|---|
