Observa la serie de tiempo de ventas mensuales (2020–2025). ¿Qué patrones se identifican en los datos?
Tendencia: Se observa una tendencia creciente clara: las ventas comienzan cerca de 100 mil en 2020 y llegan aproximadamente a 300 mil en 2025.
Estacionalidad: El gráfico muestra un patrón que se repite cada 12 meses. Se identifican picos en ciertos meses (como fin de año) y caídas en los primeros meses del siguiente año. Esto corresponde a una estacionalidad anual.
**Una vez cargada la base limpia en Tableau, Genera el gráfico es más adecuado para mostrar el total de ventas por Categoría
ver tableau (1)
¿Con qué funciones obtienes la mediana en Excel? menciona almenos 3
Estadistica descriptiva,
Con la fórmula =MEDIANA(rango)
Con tabla inteligente lista de totales
Con la fórmula =CUARTIL(rango,2)
¿Qué librería se usa con frecuencia para análisis de datos en Python y cómo la llamas para usar una función?
Pandas as pd
¿Qué es una escala de medición nominal? e indica un ejemplo
Clasifica datos en categorías sin orden (ej. colores, género).
Un histograma de “ventas mensuales” muestra que el 70% de los datos se concentran entre 8,000 y 12,000 unidades. ¿Qué significa que la media esté en 11,500 y la mediana en 9,800?
Que los datos están sesgados a la derecha; hay valores altos que elevan la media.
**Mostrar las ventas promedio por ciudad en un mapa
Ver tableau (2)
¿Qué tipo de gráfico es más adecuado para analizar la distribución de frecuencias? y ¿cómo lo obtienes en Excel?
Un histograma.
Con análisis de datos o intertar un gráfico
¿Qué instrucción usas para leer un archivo CSV en Python?
pd.read_csv("archivo.csv").
¿Qué es el análisis exploratorio de datos (EDA)?
El proceso inicial de analizar y visualizar datos para detectar patrones, errores o anomalías.
En un boxplot de “tiempos de entrega” (en días):
Mediana = 3 | Q1 = 2 | Q3 = 5
Aparece un punto en 14 días.
¿Qué nos dice este boxplot sobre los tiempos de entrega, el promedio y los datos atípicos?
La mayoría de los pedidos se entregan entre 2 y 5 días.
La mediana (3) indica que al menos la mitad se entrega en ≤3 días.
La media es mayor que la mediana, lo que sugiere ligera asimetría a la derecha.
El valor de 14 días es un outlier: un caso extremo de entrega tardía.
**Mostrar qué nombre (cliente) genera más ventas en cada Categoría, ¿qué tipo de gráfico es recomendable?
ver tableau (3)
**Abre la base de datos, limpia la data, detarmina cuál es el promedio de la venta total para Puebla
Cd de Mexico 4450
Guadalajara 5600
Monterrey 14850
Puebla 16850
Tijuana 7550
Zapopan 24000
Total general 73300
¿Qué significa df.describe() en Python?
Genera estadísticas descriptivas de un DataFrame (media, mediana, cuartiles, etc.).
¿Por qué se dice que la analítica de datos es un activo estratégico?
Porque transforma datos en conocimiento útil para la toma de decisiones.
Resumen de precios por región (en USD):
Norte: Media = 120 DesvEst = 15
Sur: Media = 80 DesvEst = 30
¿Qué región muestra mayor variabilidad relativa (Coeficiente de variación) en los precios?
La región Sur, porque su coeficiente de variación es más alto (37.5%). vs Norte con 12.5%
**Genera un gráfico de pastel, con aquella categoría que sea la adecuada para este tipo de grafico, coloca las equiquetas y explica porqué
Ver tableau (4)
**Genera un histograma para categoria con mayor Frecuencia y dertermina: media, Q1, Q2, Q3 y si hay dato atípico
atipico 4000
q1= 800
q2= 1000
q3= 1500
media=1320.8
Tienes un DataFrame llamado df con una columna "Categoria" que contiene valores como "Farmacia", "Ropa" y "Electrónicos".
¿Qué función de pandas usarías para ver las categorías de esa variable y cuántas veces aparece cada una?
Para ver las categorías únicas: df["Categoria"].unique()
Para ver la frecuencia: df["Categoria"].value_counts()
¿Qué diferencia hay entre un patrón estacional y un ciclo económico, y cómo se relacionan con la toma de decisiones en los negocios? Da un ejemplo para cada uno de ellos
El patrón estacional se repite de forma regular en periodos cortos y previsibles (por ejemplo, cada año en diciembre aumentan las ventas).
El ciclo económico son fluctuaciones de largo plazo, menos predecibles y ligadas a la economía global.
Identificar ambos permite a las empresas planear inventarios y estrategias de inversión con mayor precisión.
Media = 55, Mediana = 50,
Q1 = 40, Q3 = 65, Rango intercuartílico (IQR) = 25,
Valores atípicos: 10, 15 y 120
Dibuja el boxplot e indica ¿Qué nos dice este boxplot sobre las ventas mensuales?
El 50% central de las ventas está entre 40 y 65 mil (rango intercuartílico).
La media (55) es un poco mayor que la mediana (50), lo que indica ligera asimetría positiva.
Los outliers bajos (10 y 15) sugieren meses con ventas excepcionalmente bajas.
El outlier alto (120) indica un mes extraordinario de ventas muy superiores al patrón.
La dispersión es considerable, lo que implica volatilidad en los ingresos mensuales.
**Genera un diagrama de árbol para los nombres de los clientes que muestre sus ventas, venta en % y recuento
Ver tabelau (5)
**Genera un Histograma desde gráficas e indica cual es el intervalo con mayor frecuenta en ventas en general y cuál en Puebla
general de 500 a 1500
Puebla 750 a 2050
En la base df tienes las columnas "Ciudad" y "Ventas".
Si quieres calcular el promedio de ventas por cada ciudad, ¿qué método de pandas deberías usar y cómo se vería el código?
Método: groupby() junto con una función estadística.
df.groupby("Ciudad")["Ventas"].mean()
¿Qué información aporta la desviación estándar en un análisis descriptivo, cómo se interpreta un valor alto, y a cuántos desvíos estándar se encuentra el 95% de los datos?
Mide la dispersión de los datos respecto a la media. Un valor alto indica que los datos están muy dispersos y no son homogéneos.
2 desviaciones estándar de la media