¿Qué significa "generalización" en Machine Learning?
La capacidad de funcionar bien en datos nuevos no vistos
¿Porqué un outlier puede ser informativo para el negocio?
Porque podría representar eventos raros como fraude
En una regresión lineal simple, “lineal” significa:
Los parámetros β aparecen elevados a la primera potencia.
¿Por qué la regresión Lasso puede realizar la selección de características?
Porque la regularización L1 puede reducir algunos coeficientes exactamente a cero
¿Cuál es el rango de la función logística?
(0, 1)
De acuerdo a Tom Mitchell un programa “aprende” si mejora su rendimiento "P" en una tarea "T" utilizando...
Experiencia "E"
¿Qué técnica de FE centra los datos con media=0 y varianza=1?
Estandarización
¿Qué significa homocedasticidad?
La varianza de ui es constante en todos los Xi
¿Qué tipo de regularización utiliza la regresión Ridge?
L2
¿Cómo se interpreta π(x) en regresión logística?
La probabilidad condicional de que Y=1 dado X E(Y=1|X)
¿Cuál es el objetivo principal de mantener una sección de la base de datos para Test?
Estimar el desempeño fuera de muestra antes de producción
¿Porqué one-hot-encoding aumenta la dimensionalidad de los features?
Porque reemplaza una única columna categórica con múltiples columnas nuevas donde cada nueva columna representa una categoría única.
En regresión múltiple, Y=β0+β1X1+β2X2+⋯+βpXp+ε, ¿qué interpretación tiene β2?
El cambio en Y cuando X2 cambia, manteniendo constantes todos los demás predictores
¿Cómo se selecciona habitualmente el parámetro λ en LASSO o Ridge?
A través de Cross-Validation
¿Qué método se utiliza para estimar los parámetros en regresión logística?
Máxima verosimilitud
¿Qué es K-Fold Cross-Validation?
Partir en K folds y rotar el conjunto de test para estimar generalización
¿Qué codificación puede inducir relaciones falsas si no hay orden real?
Ordinal Encoding
¿Qué indica un valor AIC más bajo al comparar modelos de regresión con el mismo R2?
El modelo con el AIC más bajo es más parsimonioso, es decir, logra el mismo nivel de ajuste a los datos con menos parámetros.
¿Qué diferencias existen entre la regularización LASSO y la regularización Ridge?
El área bajo la curva ROC (AUC) mide…
La probabilidad del modelo de clasificar correctamente entre clases positivas y negativas
Si la métrica de desempeño mejora mucho en train pero cae en test, probablemente…
Se está presentando sobreajustaste
¿Cómo se define un outlier mediante IQR?
x < Q1−1.5·IQR o x > Q3+1.5·IQR
En el análisis de regresión, ¿qué indica un valor p menor que 0.05 para un coeficiente?
Hay evidencia estadística sólida de que ese coeficiente es diferente de cero.
¿Qué significa el acrónimo LASSO?
Least Absolute Shrinkage and Selection Operator
En una matriz de confusión, ¿qué significa FN (False Negative)?
Predecir 0 cuando en realidad es 1