ML Simulatorv1.0
Semana 2
Semana 2 · Módulo 4

Umbral de Decisión

Mueve el umbral de clasificación para priorizar el tipo de error que más le conviene a tu negocio.

conceptos clave

Umbral de Decisión y Matriz de Confusión

Umbral de probabilidadPrecisionRecallF1-ScoreMatriz de confusión

Un clasificador probabilístico no predice directamente una clase — produce una probabilidad. El umbral (por defecto 0.5) convierte esa probabilidad en una decisión binaria: si P ≥ umbral → clase positiva.

Mover el umbral redistribuye los errores entre cuatro categorías (la matriz de confusión):

  • Verdaderos Positivos (TP) — detectados correctamente
  • Falsos Positivos (FP) — alarmas falsas. Controlados por Precision = TP/(TP+FP)
  • Falsos Negativos (FN) — casos perdidos. Controlados por Recall = TP/(TP+FN)
  • Verdaderos Negativos (TN) — rechazados correctamente

En medicina, bajar el umbral (más sensibilidad) es preferible porque perder un caso positivo tiene consecuencias graves. En detección de spam, subir el umbral (más precisión) evita que emails legítimos terminen en la carpeta de spam.

No existe el modelo perfecto

No existe un umbral universalmente óptimo. La elección correcta depende del costo asimétricode cada tipo de error en tu contexto específico de negocio.

Simulador de Umbral de Decision

Ajusta el umbral de clasificacion y observa como cambian las metricas segun el contexto de negocio

Contexto de negocio

Detectar transacciones fraudulentas

Umbral de decision0.50

Distribuciones de probabilidad

Matriz de confusion

Pred. Neg
Pred. Pos
Real Neg
TN: 240
FP: 10
Real Pos
FN: 10
TP: 240

Metricas

Precision
96.0%
Recall
96.0%
F1-Score
96.0%
Accuracy
96.0%

Impacto en negocioFraude bancario

Umbral moderado: balance razonable entre detectar fraude y no molestar a clientes legitimos.

No existe el modelo perfecto

No hay un umbral universal correcto. En medicina, preferimos alto recall (no perder enfermos). En spam, preferimos alta precision (no perder correos importantes). El contexto de negocio define la metrica prioritaria.

Verificación de conocimiento

1 / 3

En detección de fraude, ¿qué tipo de error es más costoso?