¿Qué es una arquitectura de Data Warehouse?
El diseño estructural que define cómo se organizan y manejan los componentes de un Data Warehouse.
¿Qué es Business Intelligence?
Un conjunto de tecnologías y procesos utilizados para analizar datos y presentar información útil para la toma de decisiones.
¿Qué significa la fase de "Extracción" en un proceso ETL?
El proceso de recopilar datos de diversas fuentes.
¿Qué es una dimensión en un Data Warehouse?
Un atributo o conjunto de atributos que describe el contexto de los datos en los hechos.
¿Qué es un Data Warehouse?
Un sistema que almacena datos integrados de múltiples fuentes para análisis y toma de decisiones.
¿Qué es una capa de staging en un Data Warehouse?
Un área temporal donde los datos se almacenan y preparan antes de ser cargados en el Data Warehouse final.
¿Qué es un dashboard en el contexto de BI?
Una interfaz gráfica que muestra KPIs y métricas clave para monitorear el rendimiento de un negocio.
¿Qué sucede en la fase de "Transformación" en un proceso ETL?
Los datos se limpian, formatean y transforman para cumplir con los requisitos del Data Warehouse.
¿Qué es un hecho en un Data Warehouse?
Una medición cuantitativa que se analiza y se almacena en una tabla de hechos.
¿Qué significa ETL en el contexto de Data Warehousing?
Extract, Transform, Load.
¿Qué es Big Data y cómo se relaciona con los Data Warehouses?
Big Data se refiere a conjuntos de datos extremadamente grandes y complejos que requieren tecnologías avanzadas para su procesamiento; a menudo, los Data Warehouses se integran con soluciones de Big Data para análisis.
¿Qué es un KPI en el contexto de BI?
Key Performance Indicator, una métrica clave que mide el rendimiento de un proceso o área de negocio
¿Qué significa "Cargar" en un proceso ETL?
Insertar los datos transformados en el Data Warehouse.
¿Cuál es la diferencia entre un esquema en estrella y un esquema en copo de nieve?
Un esquema en estrella tiene una tabla de hechos central con dimensiones directamente relacionadas, mientras que un esquema en copo de nieve normaliza las dimensiones en subtablas
¿Cuál es la diferencia principal entre un Data Warehouse y una base de datos transaccional?
Un Data Warehouse está diseñado para análisis y toma de decisiones, mientras que una base de datos transaccional está diseñada para el procesamiento de transacciones diarias.
¿Qué es el procesamiento en paralelo masivo (MPP) y cómo beneficia a los Data Warehouses?
MPP es una arquitectura de procesamiento que divide grandes tareas de computación en subprocesos que se ejecutan en paralelo; mejora el rendimiento y la escalabilidad de los Data Warehouses.
Menciona una herramienta popular de BI.
Tableau, Power BI, o QlikView.
Menciona una herramienta comúnmente utilizada para realizar procesos ETL.
Talend, Informatica PowerCenter, Apache Nifi, Microsoft Integration Services, python
Define qué es una tabla de hechos agregada.
Una tabla de hechos que contiene datos pre-sumados o pre-calculados para mejorar la velocidad de las consultas.
¿Qué es OLAP y cómo se relaciona con los Data Warehouses?
Online Analytical Processing, una tecnología que permite realizar consultas multidimensionales rápidas en un Data Warehouse.
¿Qué es un Data Lake y cómo se diferencia de un Data Warehouse?
Un Data Lake es un repositorio que almacena grandes cantidades de datos en su formato nativo o bruto, mientras que un Data Warehouse organiza y estructura los datos para análisis específicos. El Data Lake es más flexible y capaz de manejar datos no estructurados, pero el Data Warehouse es más eficiente para consultas analíticas y reportes.
Explica la diferencia entre un reporte ad hoc y un reporte estándar en BI.
Un reporte ad hoc es creado para una necesidad específica y puntual, mientras que un reporte estándar es predefinido y regularmente actualizado.
¿Cuál es un desafío común al diseñar procesos ETL?
Manejar la complejidad de las transformaciones de datos mientras se asegura la integridad y consistencia de los datos cargados.
Explica qué es la granularidad en un Data Warehouse y su importancia.
La granularidad se refiere al nivel de detalle de los datos almacenados; es importante porque afecta el tamaño del Data Warehouse y la capacidad para realizar análisis detallados.
Menciona dos beneficios de utilizar un Data Warehouse en una organización.
Mejora en la toma de decisiones y acceso rápido a datos históricos.