Detección de fraudes en empresas de servicios públicos domiciliarios utilizando ciencia de datos y análisis geoespaciales

Uno de los grandes retos de cualquier empresa de distribución y comercialización de servicios públicos domiciliarios en el mundo es el control de perdidas, estas tienen diversas causas que suelen clasificarse como técnicas (propias de la operación del negocio y que se deben tener controladas) y no t...

Full description

Autores:
Pachón Rodríguez, Willian Antonio
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2023
Institución:
Universidad Distrital Francisco José de Caldas
Repositorio:
RIUD: repositorio U. Distrital
Idioma:
OAI Identifier:
oai:repository.udistrital.edu.co:11349/33141
Acceso en línea:
http://hdl.handle.net/11349/33141
Palabra clave:
Analisis de Datos
Analisis Geoespacial
Detección de Fraudes
Ciencias de la Información
Servicios Públicos
Pérdidas No Técnicas
Maestría en Ciencias de la Información y las Comunicaciones -- Tesis y disertaciones académicas
Protección de datos
Análisis de datos
Servicios públicos domiciliarios -- Medidas de seguridad
Mineria de datos
Datos espaciales
Data Analyses
Geoespatial Analysis
Fraud Detection
Data Science
Utilities
Non Technical losses
Rights
License
Attribution-NonCommercial-NoDerivatives 4.0 Internacional
Description
Summary:Uno de los grandes retos de cualquier empresa de distribución y comercialización de servicios públicos domiciliarios en el mundo es el control de perdidas, estas tienen diversas causas que suelen clasificarse como técnicas (propias de la operación del negocio y que se deben tener controladas) y no técnicas (asociadas a fraudes), afectando en mayor o menor grado temas como; inversiones para la expansión y mantenimiento de las redes, la rentabilidad de los accionistas e incluso la continuidad del servicio. Esta investigación propone una metodología para la detección de fraudes, clasificados como perdidas NO técnicas común a cualquier empresa de servicios públicos domiciliarios, basada en analítica de datos sobre información propia del negocio enriquecida con datos de terceros a través de análisis geoespaciales a partir de su ubicación geográfica y una segmentación por mercados, que permiten encontrar patrones sobre situaciones anómalas a través de modelos de machine learning supervisado y no supervisado. La metodología se implementó en una empresa de distribución de gas natural en Colombia y se contrasto contra metodologías propuestas por otros autores para empresas de distribución de energía eléctrica de otros países, que consideran que el problema debe ser abordado a partir de análisis de históricos de consumo y sus desviaciones. Los resultados obtenidos con la metodología propuesta mejoran la precisión y sensibilidad de los modelos en más del 20% y disminuyen los falsos negativos en el mismo porcentaje, facilitando la verificación y normalización de clientes en situaciones anómalas y/o fraudulentas.