¿Cuáles son los tipos de datos?
Estructurado,No estructurados,Semiestructurados
Es una libreria de python especializada en el calculo numerico y puede trabajar con matrices
numpy
¿En que se especializa la arquitectura Z?
resuelve problemas de arquitectura tradicionales en relación con la continuidad del negocio y el uso
eficiente de los recursos.
NameNode
DataNode
Servicio de análisis de datos de Microsoft con visualizaciones interactivas y capacidades de Inteligencia empresarial con una interfaz simple como para que todos los usuarios, puedan crear paneles.
Power BI
¿Qué es la visualización de datos?
Es la representación gráfica de información y datos.
Cuales son los formatos que pandas permite leer ?
cvs, excel, bases SQL
¿Cuantas capas existen en la arquitectura Lambda?,menciona el nombre de cada capa.
Existen 3, Capa por lotes(Batch), Capa de velocidad(Speed), Capa proveedor(Serving)
Fase Map
Fase Shuffle
Fase Reduce
Lenguaje de programación de alto nivel interpretado, que facilita el desarrollo de código, utilizado principalmente por profesionistas de cualquier ámbito que necesitan hacer desarrollos para analitica de datos.
Python
¿Qué es la Minería Datos?
Proceso de extraer información, buscar patrones al conjunto de datos, normalmente muy grandes y heterogéneos.
Son funciones que se definen como una línea que ejecuta una sola expresión, pueden tomar cualquier número de argumentos, pero solo pueden tener una expresión.
Funciones Lambda
Cierto o Falso.
La arquitectura kappa no combina el procesamiento por lotes ni el procesamiento en tiempo real, sino mejora la tolerancia a fallos.
Falso
La arquitectura kappa combina el procesamiento por lotes y el procesamiento en tiempo real con el fin de solucionar los posibles puntos “débiles” de la Arquitectura Lambda.
Resource Manager
Node Manager
Application Master
Container
Sistema de base de datos NoSQL, orientado a documentos y de código abierto. Guarda estructuras de datos BSON con un esquema dinámico, haciendo que la integración de los datos en ciertas aplicaciones sea más fácil y rápida.
Mongo DB
¿Cómo funciona la Arquitectura Centralizada?
mantiene a las aplicaciones y a los mismos datos en su lugar mientras se construye la tecnología a su alrededor
Es un archivo que contiene instrucciones y definiciones de (variables,funciones,…) y se guarda con la extensión .py
modulos
¿Que funcion tiene serving leyer?
Es el encargado de indexar y exponer
las vistas (de sólo lectura) para que puedan
ser consultadas.
Importar, extraer y exportar datos
Es una base de datos distribuida NoSQL de código abierto en la que confían miles de empresas por su escalabilidad y alta disponibilidad sin comprometer el rendimiento. La escalabilidad lineal y la tolerancia a fallas probada en hardware básico o infraestructura en la nube la convierten en la plataforma perfecta para datos de misión critica.
Cassandra
¿ A que se refiere la Arquitectura Distribuida?
los procedimientos se dividen entre los distintos nodos
Es un framework escrito en Python que permite crear aplicaciones web rápidamente y con un mínimo numero de líneas de código.
Flask
Cierto o Falso
Cuando hablamos de procesamiento batch hace referencia a la hora de recibir y tratar continuamente los datos sin tener un fin, mientras que el procesamiento streaming interviene en cada conjunto de datos, tiene un inicio y un fin en el tiempo.
Falso
batch hace referencia a un procesamiento que interviene en un conjunto de datos y que tienen un inicio y un fin en el tiempo mientras que el procesamiento de este tipo streaming esta continuamente recibiendo y tratando nueva información según vaya llegando sin tener un fin.
Server
Client
Leader
Follower
Entorno de trabajo para software, bajo licencia libre, para programar aplicaciones distribuidas que manejen grandes volúmenes de datos. Permite a las aplicaciones trabajar con miles de nodos en red y Petabytes de datos.
HADOOP