Generación sintética de datos faltantes en parámetros de diseño en celdas solares de tercera generación utilizando inteligencia artificial.
Las celdas solares de perovskita han avanzado considerablemente en poco tiempo, alcanzando una eficiencia de aproximadamente 22% en menos de 15 años. Estos avances, impulsados por hallazgos empíricos de celdas experimentales, han llevado a un incremento en los costos y la mano de obra para su desarr...
- Autores:
-
Castañeda Pico, Carlos Oswaldo
- Tipo de recurso:
- Trabajo de grado de pregrado
- Fecha de publicación:
- 2024
- Institución:
- Universidad Francisco de Paula Santander
- Repositorio:
- Repositorio Digital UFPS
- Idioma:
- spa
- OAI Identifier:
- oai:repositorio.ufps.edu.co:ufps/9690
- Acceso en línea:
- https://repositorio.ufps.edu.co/handle/ufps/9690
- Palabra clave:
- Celdas solares
Perovskita
Machine Learning
Imputación de datos
Análisis de datos
- Rights
- closedAccess
- License
- Derechos Reservados - Universidad Francisco de Paula Santander, 2024
| Summary: | Las celdas solares de perovskita han avanzado considerablemente en poco tiempo, alcanzando una eficiencia de aproximadamente 22% en menos de 15 años. Estos avances, impulsados por hallazgos empíricos de celdas experimentales, han llevado a un incremento en los costos y la mano de obra para su desarrollo. Aprovechando estos hallazgos experimentales, es posible realizar predicciones más precisas mediante algoritmos de regresión y machine learning. No obstante, una dificultad importante es la pérdida de información en las bases de datos, ya sea por falta de datos proporcionados o por pérdida durante el proceso de minería de datos. Este estudio explora algoritmos de machine learning para realizar imputaciones múltiples en variables categóricas y numéricas de parámetros de fabricación de celdas de perovskita, con el objetivo de obtener una base de datos completa y robusta. La metodología incluye la selección de variables, ingeniería de características, selección y evaluación de modelos. Los resultados indican que los modelos de imputación mantienen la distribución de los datos sin desviaciones significativas en densidad, media y mediana, con una precisión en variables categóricas superior al 90% y errores absolutos porcentuales medios (MAPE) inferiores al 10% en variables numéricas. |
|---|
