A
B
C
D
E
100

Proporciona un sistema de procesamiento de datos

Mapa reducido

100

¿Que significa Yarm?

otro negociador de recursos

100

Hadoop esta formado por dos componentes básicos cuales son?

Datos y procesamiento

100

¿Cómo se maneja la arquitectura lambda?

Por lotes y streaming

100

¿Qué es un framework?

Esquema de trabajo utilizado por programadores para el desarrollo de software

200

¿Qué es Hadoop?

Es un framework de codigo abierto usa modelos sencillos de programacion para almacenar y procesar volumenes de datos

200

Qué programas contiene la distribución anaconda:

Araña, R, Júpiter, Pycharm

200

Herramienta diseñada para transferir datos masivos desde hadoop a otros entornos como bases de datos relacionales 

Apache Sqoop

200

Definir que es Data Governance

Disciplina de gestión de datos

200
¿Qué es Parquet?

Formato de archivo de código abierto para proyectos en Hadoop

300

¿Qué relación existe entre Big Data y la visualización de datos?


Busca definir la mejor interpretación y visualización en grandes cúmulos de datos y sus relaciones

300

¿Cuáles son los principales tipos de datos que se representan con pandas?

1.DATOS TABULADORES CON COLUMNAS DE TIPO HETEROGENEO CON ETIQUETAS EN COLUMNAS Y FILAS 

2.SERIE TEMPORALES 

300

¿En que consiste una arquitectura de Big Data?

Consiste en tratar de analizar grandes volúmenes de datos que no pueden ser gestionados de manera convencional.

300

¿Qué herramientas se utilizan en la arquitectura hadoop para el almacenamiento de datos?

APACHE CASSANDRA, CLOUDERA

300

¿En que consiste las tecnologías DLP (Data Leak Prevention)?

Ofrecen protección en transito o movimiento en el sentido que son capaces de detectar si se esta intentando enviar información confidencial fuera de la organización.

400

¿En que consisten el IRM (Information Rights Management)?

Permite la encriptación de la información y así impedir que personas externas al control de la empresa accedan a estos datos.

400
¿Cuál es la diferencia entre las arquitecturas Lambda y Kappa?

El flujo de tratamiento de datos.

400

¿Cuáles son los tres estados del dato?

Información en reposo.

Información en transito o movimiento.

Información en uso.

400

Funciones Yarm:

MULTI ALQUILER

CONTENEDORES DOCKER

UTILIZACION DE CLUSTERS

400

¿Por que la ciberseguridad es un factor importante en el proceso de Big Data?

La vulnerabilidad de esta enorme cantidad de datos almacenados es el objetivo de los nuevos ciberataques.

500

¿Cuáles son las fuentes de datos compatibles con Apache Sqoop?

Las diferentes fuentes de datos de varias aplicaciones compatibles con Apache Sqoop son las siguientes:

Colmena

HBase

HDFS

HCatalog

Acumulo

500

¿De que se encargan las capas por lotes (batch layer)?

Almacenar el conjunto de datos maestro que es inmutable y crece constantemente, crea vistas desde un conjunto de datos.

500

¿Cuáles son los procesos MapReduce?

Los procesos son los siguientes: 

Input (Ficheros u Objetivos)

Split (Clave / Valor)

Map (Proceso)

Shuffle ( Agrupación )

Reduce (Reduce del resultado) y resultado final.


500

¿Cuáles son las principales ventajas de Python para Big Data?

Permite desarrollar soluciones usando menos líneas de código, gran capacidad de visualización, como también permite manipular sencillamente los procesos de modelado de datos. 

500

Digita en código Python, llenar los valores "na" con la media de las columnas.

df.fillna(df.mean())

M
e
n
u