Análisis de retención de clientes en instituciones bancarias basada en datos de tarjetas de crédito para predecir la lealtad del cliente

RESUMEN : La precisa clasificación de clientes a partir del análisis de movimientos en tarjetas de crédito reviste vital importancia en el panorama financiero actual. La creciente dependencia de las transacciones con tarjetas de crédito desafía a los bancos a identificar clientes de manera efectiva,...

Full description

Autores:
Agudelo, Hadys Osbaldo
Tipo de recurso:
Tesis
Fecha de publicación:
2023
Institución:
Universidad de Antioquia
Repositorio:
Repositorio UdeA
Idioma:
spa
OAI Identifier:
oai:bibliotecadigital.udea.edu.co:10495/37837
Acceso en línea:
https://hdl.handle.net/10495/37837
https://github.com/osvalcode/Seminario
Palabra clave:
Aprendizaje automático (inteligencia artificial)
Machine learning
Comportamiento del consumidor
Consumer behavior
Tarjetas de crédito
Credit cards
Análisis financiero
Financial analysis
Técnicas de predicción
Forecasting techniques
Modelado predictivo
Clasificación de clientes
Análisis de datos financieros
Rights
openAccess
License
https://creativecommons.org/licenses/by-nc-sa/4.0/
Description
Summary:RESUMEN : La precisa clasificación de clientes a partir del análisis de movimientos en tarjetas de crédito reviste vital importancia en el panorama financiero actual. La creciente dependencia de las transacciones con tarjetas de crédito desafía a los bancos a identificar clientes de manera efectiva, considerando su capacidad económica, hábitos de gastos y perfiles de riesgo. Así, resulta crucial desarrollar técnicas avanzadas para esta clasificación, permitiendo a los bancos tomar decisiones informadas, gestionar riesgos y mejorar la experiencia del cliente. En este contexto, se implementaron diversas técnicas de ML utilizando un conjunto de datos de Kaggle, con el objetivo de discriminar el estado de deserción y fidelidad del cliente con las entidades bancarias según el historial reportado en las tarjetas de crédito. La metodología empleada abordó la limpieza y tratamiento de datos, el análisis y la extracción de características, así como el modelado con diversos algoritmos de aprendizaje automático, seguido del ajuste de hiperparámetros específicos para cada modelo. La evaluación del rendimiento se llevó a cabo mediante diversas métricas, que incluyeron accuracy, precisión, recall, F1 score y el área bajo la curva ROC (AUC ROC). A pesar de los desafíos computacionales asociados con la optimización de hiperparámetros, se logró un rendimiento del 96% con el modelo Random Forest mediante la técnica de validación cruzada K-Fold. Este resultado se atribuye posiblemente a la capacidad del modelo para capturar relaciones no lineales, gestionar grandes volúmenes de datos y aplicar técnicas avanzadas de regularización y optimización. Por lo tanto, destaca su habilidad para distinguir entre clientes propensos a abandonar el banco y aquellos propensos a permanecer, proporcionando así una perspectiva sólida sobre la problemática basada en los datos.