Generación sintética de datos faltantes en parámetros de diseño en celdas solares de tercera generación utilizando inteligencia artificial.

Las celdas solares de perovskita han avanzado considerablemente en poco tiempo, alcanzando una eficiencia de aproximadamente 22% en menos de 15 años. Estos avances, impulsados por hallazgos empíricos de celdas experimentales, han llevado a un incremento en los costos y la mano de obra para su desarr...

Full description

Autores:
Castañeda Pico, Carlos Oswaldo
Tipo de recurso:
Trabajo de grado de pregrado
Fecha de publicación:
2024
Institución:
Universidad Francisco de Paula Santander
Repositorio:
Repositorio Digital UFPS
Idioma:
spa
OAI Identifier:
oai:repositorio.ufps.edu.co:ufps/9690
Acceso en línea:
https://repositorio.ufps.edu.co/handle/ufps/9690
Palabra clave:
Celdas solares
Perovskita
Machine Learning
Imputación de datos
Análisis de datos
Rights
closedAccess
License
Derechos Reservados - Universidad Francisco de Paula Santander, 2024
Description
Summary:Las celdas solares de perovskita han avanzado considerablemente en poco tiempo, alcanzando una eficiencia de aproximadamente 22% en menos de 15 años. Estos avances, impulsados por hallazgos empíricos de celdas experimentales, han llevado a un incremento en los costos y la mano de obra para su desarrollo. Aprovechando estos hallazgos experimentales, es posible realizar predicciones más precisas mediante algoritmos de regresión y machine learning. No obstante, una dificultad importante es la pérdida de información en las bases de datos, ya sea por falta de datos proporcionados o por pérdida durante el proceso de minería de datos. Este estudio explora algoritmos de machine learning para realizar imputaciones múltiples en variables categóricas y numéricas de parámetros de fabricación de celdas de perovskita, con el objetivo de obtener una base de datos completa y robusta. La metodología incluye la selección de variables, ingeniería de características, selección y evaluación de modelos. Los resultados indican que los modelos de imputación mantienen la distribución de los datos sin desviaciones significativas en densidad, media y mediana, con una precisión en variables categóricas superior al 90% y errores absolutos porcentuales medios (MAPE) inferiores al 10% en variables numéricas.