Arquitectura cloud desde la ciencia de datos: cómo el conocimiento en infraestructura de almacenamiento mejora el análisis de datos para la toma de decisiones
En los últimos años, la generación de datos ha crecido de forma exponencial. Sectores como la salud, la economía, el medio ambiente y prácticamente todos los ámbitos del conocimiento producen información valiosa que, si se analiza correctamente, puede influir significativamente en la toma de decisio...
- Autores:
-
Sánchez Ortega, Juan Manuel
Balbuena Franco, Catherine
- Tipo de recurso:
- Tesis
- Fecha de publicación:
- 2025
- Institución:
- Universidad de Antioquia
- Repositorio:
- Repositorio UdeA
- Idioma:
- spa
- OAI Identifier:
- oai:bibliotecadigital.udea.edu.co:10495/46649
- Acceso en línea:
- https://hdl.handle.net/10495/46649
- Palabra clave:
- Data warehousing
Almacenes de datos
Sistemas de almacenamiento y recuperación de información
Information storage and retrieval systems
Administración industrial - toma de decisiones
Industrial management - decision making
Data Lake
http://id.loc.gov/authorities/subjects/sh97003695
- Rights
- openAccess
- License
- http://creativecommons.org/licenses/by-nc-sa/4.0/
| Summary: | En los últimos años, la generación de datos ha crecido de forma exponencial. Sectores como la salud, la economía, el medio ambiente y prácticamente todos los ámbitos del conocimiento producen información valiosa que, si se analiza correctamente, puede influir significativamente en la toma de decisiones de empresas, gobiernos y otras organizaciones. En este contexto, la ciencia de datos cumple un rol fundamental al convertir estos grandes volúmenes de datos en información clara, comprensible y útil para los tomadores de decisiones. Sin embargo, entre las fuentes de datos y los análisis que permiten tomar decisiones estratégicas, hay un componente clave: la forma en que los datos son almacenados, organizados y preparados para su uso. La eficiencia y escalabilidad de los sistemas de almacenamiento influyen directamente en la calidad del análisis final. Aunque estas tareas son desarrolladas principalmente por los ingenieros de datos, comprenderlas es esencial para cualquier científico de datos, ya que impactan su trabajo diario. Este artículo, aborda el contenido del curso “Data Management and Storage in the Cloud” de Google, profundizando en conceptos como almacenamiento eficiente, modelos de datos, normalización y desnormalización, gobernanza de datos, y buenas prácticas que optimizan los proyectos de ciencia de datos. En este sentido un buen diseño en la estructuración del almacenamiento no solo mejora el rendimiento de los sistemas, sino que permite a los científicos de datos generar análisis más precisos, relevantes y confiables, fortaleciendo así la toma de decisiones en cualquier campo de aplicación. |
|---|
