Este tipo de repositorio puede almacenar datos estructurados, semiestructurados y no estructurados.
Data Lake
Herramienta muy adecuada para almacenar millones de fotos y videos que suben usuarios en plataformas como Instagram
AWS S3
Esta arquitectura combina lo mejor del Data Lake y del Data Warehouse en un solo entorno.
Lakehouse
En este enfoque, los datos se almacenan en su formato original y su estructura se define hasta el momento en que se consultan o analizan.
Schema-on-read
Este es el principal propósito de un Data Warehouse.
Soportar análisis e inteligencia empresarial
Una de las ventajas de un Data Lake es que permite esto al reunir datos de muchas fuentes en un solo lugar.
Facilitar la exploración y el análisis
Herramienta recomendada para analizar ventas mensuales y generar dashboards para la gerencia.
Snowflake
En el Lakehouse, esta capa es conocida como el “cerebro” porque organiza, indexa y aplica gobernanza sobre los datos.
Capa de metadatos
En este enfoque, los datos se estructuran y organizan antes de almacenarse, para que luego puedan consultarse de forma más rápida y consistente.
Schema-on-write
Este es un componente típico de un Data Warehouse.
Base de datos relacional
Este enfoque significa que los datos se almacenan primero y se estructuran después, al momento de analizarlos.
Schema-on-read
Herramienta conveniente para una startup que está comenzando y espera crecer rápido gracias a su escalabilidad en la nube.
Snowflake
Este es uno de los principales problemas del modelo híbrido donde lake y warehouse están separados: se paga doble por almacenamiento y procesamiento.
Duplicidad de costos o de infraestructura
Cuando una organización necesita dashboards ejecutivos y reportes con Power BI, esta arquitectura sirve como fuente central de datos limpios y consolidados.
Data Warehouse
Proceso fundamental que extrae, transforma y carga datos para dejarlos listos para reportes.
Qué es ETL
Los Data Lakes suelen considerarse más flexibles y baratos porque almacenan los datos en su formato original y usan este tipo de almacenamiento.
Almacenamiento escalable en la nube
Herramienta apropiada para entornos empresariales que necesitan trabajar con inventario, pedidos y entregas apoyados en análisis estructurado.
Oracle Warehouse
Databricks abrió una oficina regional en este país, mostrando el avance del Lakehouse en la región.
Costa Rica
Una ventaja de usar Data Warehouse en dashboards ejecutivos, en vez de conectarse directo a sistemas transaccionales, es esta: mejora consistencia y evita cargar el sistema operativo del negocio.
Evitar sobrecargar sistemas transaccionales
Nombre que recibe un Data Warehouse alojado en infraestructura cloud, con acceso remoto y escalabilidad.
Data Warehouse en la nube
Tipo de proyectos donde un Data Lake suele ser especialmente útil por manejar grandes volúmenes de datos crudos.
IA y machine learning
Herramienta muy usada cuando una empresa trabaja con grandes volúmenes de datos para inteligencia artificial o machine learning
Hadoop
Ejemplo regional de adopción del Lakehouse para personalizar la experiencia del cliente.
BAC Latam
Esta arquitectura es ideal cuando una empresa necesita almacenamiento masivo de múltiples fuentes y análisis exploratorio.
Data Lake
Este tipo de usuarios obtiene mayor valor de un Data Warehouse porque necesita consultas, reportes y análisis estructurados.
Analistas de negocio