Interpretación
Tableau (visualización)
Excel (limpieza, descriptivos y gráficos)
Python (limpieza, descriptivos y gráficos)
Conceptos Teóricos
100

Observa la serie de tiempo de ventas mensuales (2020–2025). ¿Qué patrones se identifican en los datos?

Tendencia: Se observa una tendencia creciente clara: las ventas comienzan cerca de 100 mil en 2020 y llegan aproximadamente a 300 mil en 2025.

Estacionalidad: El gráfico muestra un patrón que se repite cada 12 meses. Se identifican picos en ciertos meses (como fin de año) y caídas en los primeros meses del siguiente año. Esto corresponde a una estacionalidad anual.

100

**Una vez cargada la base limpia en Tableau, Genera el gráfico es más adecuado para mostrar el total de ventas por Categoría

ver tableau (1)

100

¿Con qué funciones obtienes la mediana en Excel? menciona almenos 3

Estadistica descriptiva, 

Con la fórmula =MEDIANA(rango)

Con tabla inteligente lista de totales 

Con la fórmula =CUARTIL(rango,2)

100

¿Qué librería se usa con frecuencia para análisis de datos en Python y cómo la llamas para usar una función?

Pandas as pd

100

¿Qué es una escala de medición nominal? e indica un ejemplo 

Clasifica datos en categorías sin orden (ej. colores, género).

200

Un histograma de “ventas mensuales” muestra que el 70% de los datos se concentran entre 8,000 y 12,000 unidades. ¿Qué significa que la media esté en 11,500 y la mediana en 9,800?

Que los datos están sesgados a la derecha; hay valores altos que elevan la media.

200

**Mostrar las ventas promedio por ciudad en un mapa

Ver tableau (2)

200

¿Qué tipo de gráfico es más adecuado para analizar la distribución de frecuencias? y ¿cómo lo obtienes en Excel?

Un histograma. 

Con análisis de datos o intertar un gráfico

200

¿Qué instrucción usas para leer un archivo CSV en Python?

pd.read_csv("archivo.csv").

200

¿Qué es el análisis exploratorio de datos (EDA)?

El proceso inicial de analizar y visualizar datos para detectar patrones, errores o anomalías. 

300

En un boxplot de “tiempos de entrega” (en días):

Mediana = 3   |   Q1 = 2  |  Q3 = 5

Aparece un punto en 14 días.

¿Qué nos dice este boxplot sobre los tiempos de entrega, el promedio y los datos atípicos?

La mayoría de los pedidos se entregan entre 2 y 5 días.

La mediana (3) indica que al menos la mitad se entrega en ≤3 días.

La media es mayor que la mediana, lo que sugiere ligera asimetría a la derecha.

El valor de 14 días es un outlier: un caso extremo de entrega tardía.

300

**Mostrar qué nombre (cliente) genera más ventas en cada Categoría, ¿qué tipo de gráfico es recomendable?

ver tableau (3)

300

**Abre la base de datos, limpia la data, detarmina cuál es el promedio de la venta total para Puebla

Cd de Mexico 4450 

Guadalajara 5600 

Monterrey 14850 

Puebla 16850 

Tijuana 7550 

Zapopan 24000 

Total general 73300

300

¿Qué significa df.describe() en Python?

Genera estadísticas descriptivas de un DataFrame (media, mediana, cuartiles, etc.).

300

¿Por qué se dice que la analítica de datos es un activo estratégico?

Porque transforma datos en conocimiento útil para la toma de decisiones.

400

Resumen de precios por región (en USD):

Norte:  Media = 120   DesvEst = 15

Sur:    Media = 80   DesvEst = 30 

¿Qué región muestra mayor variabilidad relativa  (Coeficiente de variación) en los precios?

La región Sur, porque su coeficiente de variación es más alto (37.5%). vs Norte con 12.5%

400

**Genera un gráfico de pastel, con aquella categoría que sea la adecuada para este tipo de grafico, coloca las equiquetas y explica porqué

Ver tableau (4)

400

**Genera un histograma para categoria con mayor Frecuencia  y dertermina: media, Q1, Q2, Q3 y si hay dato atípico

atipico 4000

q1= 800

q2= 1000

q3= 1500

media=1320.8

400

Tienes un DataFrame llamado df con una columna "Categoria" que contiene valores como "Farmacia", "Ropa" y "Electrónicos".
¿Qué función de pandas usarías para ver las categorías de esa variable y cuántas veces aparece cada una?

Para ver las categorías únicas: df["Categoria"].unique()


Para ver la frecuencia: df["Categoria"].value_counts()

400

¿Qué diferencia hay entre un patrón estacional y un ciclo económico, y cómo se relacionan con la toma de decisiones en los negocios? Da un ejemplo para cada uno de ellos

El patrón estacional se repite de forma regular en periodos cortos y previsibles (por ejemplo, cada año en diciembre aumentan las ventas).

El ciclo económico son fluctuaciones de largo plazo, menos predecibles y ligadas a la economía global.

Identificar ambos permite a las empresas planear inventarios y estrategias de inversión con mayor precisión.

500

Media = 55, Mediana = 50,
Q1 = 40, Q3 = 65, Rango intercuartílico (IQR) = 25,
Valores atípicos: 10, 15 y 120

Dibuja el boxplot e indica ¿Qué nos dice este boxplot sobre las ventas mensuales?

El 50% central de las ventas está entre 40 y 65 mil (rango intercuartílico).

La media (55) es un poco mayor que la mediana (50), lo que indica ligera asimetría positiva.

Los outliers bajos (10 y 15) sugieren meses con ventas excepcionalmente bajas.

El outlier alto (120) indica un mes extraordinario de ventas muy superiores al patrón.

La dispersión es considerable, lo que implica volatilidad en los ingresos mensuales.

500

**Genera un diagrama de árbol para los nombres de los clientes que muestre sus ventas, venta en % y recuento 

Ver tabelau (5)

500

**Genera un Histograma desde gráficas e indica cual es el intervalo con mayor frecuenta en ventas en general y cuál en Puebla

general de 500 a 1500

Puebla 750 a 2050

500

En la base df tienes las columnas "Ciudad" y "Ventas".
Si quieres calcular el promedio de ventas por cada ciudad, ¿qué método de pandas deberías usar y cómo se vería el código?

Método: groupby() junto con una función estadística.

df.groupby("Ciudad")["Ventas"].mean()

500

¿Qué información aporta la desviación estándar en un análisis descriptivo, cómo se interpreta un valor alto, y a cuántos desvíos estándar se encuentra el 95% de los datos?

Mide la dispersión de los datos respecto a la media. Un valor alto indica que los datos están muy dispersos y no son homogéneos. 

2 desviaciones estándar de la media