Semana 3
Regresión Logística y NLP
Regresión logística, procesamiento de texto con TF-IDF, regularización y validación cruzada.
1
Vectorización TF-IDF
Convierte texto en números: frecuencia de términos ponderada por su rareza en el corpus.
TFIDFVectorizaciónLey de Zipf
2
Probabilidad y Momios (Odds)
La regresión logística predice probabilidades. Los momios son otra forma de interpretarlas.
SigmoideOddsLog-OddsCoeficientes
3
Regularización Ridge (L2)
Penaliza coeficientes grandes para evitar el sobre-ajuste cuando hay muchas features.
RegularizaciónNorma L2LambdaCoeficientes
4
Validación Cruzada (K-Fold)
Divide los datos en K partes para obtener una evaluación robusta del modelo.
K-FoldData LeakageEvaluación robusta
5
Grid Search
Búsqueda exhaustiva de la mejor combinación de hiperparámetros.
HiperparámetrosBúsqueda exhaustivaOptimización