Fundamentos
FE
Regresión Lineal
Regularización
Regresión Logística
100

¿Qué significa "generalización" en Machine Learning?

La capacidad de funcionar bien en datos nuevos no vistos

100

¿Porqué un outlier puede ser informativo para el negocio?

Porque podría representar eventos raros como fraude

100

En una regresión lineal simple, “lineal” significa:

Los parámetros β aparecen elevados a la primera potencia.

100

¿Por qué la regresión Lasso puede realizar la selección de características?

Porque la regularización L1 puede reducir algunos coeficientes exactamente a cero

100

¿Cuál es el rango de la función logística?

(0, 1)

200

De acuerdo a Tom Mitchell un programa “aprende” si mejora su rendimiento "P" en una tarea "T" utilizando...

Experiencia  "E"

200

¿Qué técnica de FE centra los datos con media=0 y varianza=1?

Estandarización

200

¿Qué significa homocedasticidad?

La varianza de ui es constante en todos los Xi

200

¿Qué tipo de regularización utiliza la regresión Ridge?

L2

200

¿Cómo se interpreta π(x) en regresión logística?

La probabilidad condicional de que Y=1 dado X E(Y=1|X) 

300

¿Cuál es el objetivo principal de mantener una sección de la base de datos para Test?

Estimar el desempeño fuera de muestra antes de producción

300

¿Porqué one-hot-encoding aumenta la dimensionalidad de los features?

Porque reemplaza una única columna categórica con múltiples columnas nuevas donde cada nueva columna representa una categoría única.

300

En regresión múltiple, Y=β01X12X2+⋯+βpXp+ε, ¿qué interpretación tiene β2?

El cambio en Y cuando X2 cambia, manteniendo constantes todos los demás predictores

300

¿Cómo se selecciona habitualmente el parámetro λ en LASSO o Ridge?

A través de Cross-Validation

300

¿Qué método se utiliza para estimar los parámetros en regresión logística?

Máxima verosimilitud

400

¿Qué es K-Fold Cross-Validation?

Partir en K folds y rotar el conjunto de test para estimar generalización

400

¿Qué codificación puede inducir relaciones falsas si no hay orden real?

Ordinal Encoding

400

¿Qué indica un valor AIC más bajo al comparar modelos de regresión con el mismo R2?

El modelo con el AIC más bajo es más parsimonioso, es decir, logra el mismo nivel de ajuste a los datos con menos parámetros.

400

¿Qué diferencias existen entre la regularización LASSO y la regularización Ridge?

  • Penalización: LASSO (L1) / Ridge (L2).
  • Selección de variables: LASSO puede forzar los coeficientes a ser exactamente cero, eliminándolas del modelo. Ridge solo reduce los coeficientes cerca de cero, por lo que mantiene todas las variables en el modelo.
  • Multicolinealidad: Ridge es más estable y eficaz en la gestión de la multicolinealidad, manteniendo todas las variables, pero con coeficientes más pequeños. LASSO solo elimina variables al azar por lo que puede ser inestable si hay correlación entre ellas. 
400

El área bajo la curva ROC (AUC) mide…

La probabilidad del modelo de clasificar correctamente entre clases positivas y negativas

500

Si la métrica de desempeño mejora mucho en train pero cae en test, probablemente…

Se está presentando sobreajustaste

500

¿Cómo se define un outlier mediante IQR?

x < Q1−1.5·IQR o x > Q3+1.5·IQR

500

En el análisis de regresión, ¿qué indica un valor p menor que 0.05 para un coeficiente?

Hay evidencia estadística sólida de que ese coeficiente es diferente de cero.

500

¿Qué significa el acrónimo LASSO?

Least Absolute Shrinkage and Selection Operator

500

En una matriz de confusión, ¿qué significa FN (False Negative)?

Predecir 0 cuando en realidad es 1