AWS
Strategy
Concepts
Benefits
Usage
100

Plataforma mediante la cual accedemos a AWS

Bifrost

100

¿El Data Lake se puede utilizar por toda la empresa?

100

¿Qué es un SQL query/consulta?

Instrucciones que se envían a una base de datos para recuperar, cambiar o manipular datos.

100

¿Nuestro AWS Data Lake se puede conectar a Salesforce?

Sí.

100

Dame las instrucciones para descargar un archivo en Athena.

Abrir Athena y hacer una query, una vez que se vean los resultados hacer click en Descargar. 

200

¿Puede cualquier rol dentro de una cuenta en AWS acceder a todos los servicios existentes; bases de datos, almacenamiento, etc.?

Falso. Para acceder a cualquier servicio o poder accionar dentro del mismo, un rol debe tener los permisos para acceder al servicio y permitirle las acciones correspondientes.

200

Menciona 1 objetivo de la estrategia de datos.

Disponibilidad de los datos de BP.

200

¿Es Athena un Data Lake?

Falso. Athena es un servicio server less para hacer queries, nos da acceso al Data Lake, pero NO ES el data lake.

200

¿Es un AWS Data Lake más barato de operar que un sistema tradicional ON-PREM?

Sí, en general los sistemas en la nube son más baratos de operar porque son ON-DEMAND, se suele pagar por uso y no por solo tener los sistemas existiendo, como pasa en sistemas ON-PREM.

200

¿Cómo abrir Bifrost?

1. Pego el enlace en el navegador.

2. Escribo mi correo corporativo y contraseña.

3. Busco el código de autentificación en la aplicación del celular y lo pego.

4. Click en acceder.

300

¿Qué servicio de AWS se usa para almacenar los datos?

S3 (Simple Storage Service) sirve para almacenar los objetos dentro de AWS (archivos CSV, parquet, json, etc.)

300

Menciona 2 miembros del equipo de datos.

.

300

¿Qué es la Nube?

"La nube" hace referencia a los servidores a los que se accede a través de Internet, y al software y bases de datos que se ejecutan en esos servidores. Los servidores de la nube están ubicados en centros de datos por todo el mundo. 

300

Menciona 3 usos que le puedes dar a un data lake.

Hacer queries en Athena

Obtener insights con la información de un sistema

Descargar datos de BP para su uso posterior

Visualizar dashboards

300

Escribe la query para seleccionar todos los récords de la tabla de BUSINESS_PARTNER en Athena dentro de curated.

SELECT *

FROM curated.BUSINESS_PARTNER

400

¿Cuántos ambientes tenemos en AWS?

DEV - DEVELOPMENT

INT - INTEGRATION

CONS - CONSOLIDATION

PROD - PRODUCTION

400

¿Qué hace el equipo de datos?

Plantear las mejores soluciones de manejo de los datos de una empresa, para facilitar y promover su uso de modo que creen un impacto en el negocio.

Permitir que todas las áreas de la empresa se beneficien del superpoder de los datos...

400

¿Qué es un data lake?

Un data lake proporciona una plataforma escalable y segura que permite a las empresas transferir datos desde cualquier sistema para almacenarlos para el uso posterior de toda la empresa para generar información valiosa que le permita obtener ventajas competitivas. 

400

Menciona 3 beneficios de una arquitectura tipo Data Lake.

Flexible, escalable, rápida, compatible, económica, compatible.

400

Escribe la query para seleccionar todos los récords de la tabla de BUSINESS_PARTNER de las personas que no tengan dependientes en curated.


"haveDependants"

SELECT *

FROM curated.BUSINESS_PARTNER

WHERE haveDependants='false'

500

Menciona 2 servicios de AWS que se usen en el Data Lake.

S3, Athena, Glue, DYNAMODB, SNS, SQS, Lambda, MWAA, etc.

500

Menciona la diferencia entre el data lake y el proyecto de customer 360.

La arquitectura del Data Lake dentro de AWS (la nube) es para toda la empresa, busca sentar las bases para que más áreas y proyectos incluyan sus datos en el futuro.

Customer360 es el primer proyecto para migrar los datos de BP, que nos permitió iniciar el desarrollo y primer uso del Data Lake.


500

Diferencias entre usuario y rol en AWS.

Un usuario es una entidad que representa a una persona o app, tiene credenciales y permisos específicos asociados, como roles, para controlar el acceso, se asocian a credenciales a largo plazo. 

Mientras que unr ol de AWS IAM es una identidad dentro de una cuenta con permisos específicos que determinan lo que la identidad puede y no puede hacer.

500

Menciona un ejemplo de inteligencia artificial que se podría realizar a través del Data Lake. 

Hacer predicciones con los datos.

Correr modelos estadísticos.


500

Escribe la query para seleccionar solo 10 récords de la tabla de BUSINESS_PARTNER de las personas que no tengan dependientes en curated.


"haveDependants"

SELECT *

FROM curated.BUSINESS_PARTNER

WHERE haveDependants='false'

ORDER BY year DESC

LIMIT 10