Figura 2: Función de activación sigmoideaSi ‘Z’ llega al infinito, Y(predicted) se convertirá en 1 y si ‘Z’ llega al infinito negativo, Y(predicted) se convertirá en 0.
Análisis de la hipótesis
La salida de la hipótesis es la probabilidad estimada. Esto se utiliza para inferir cómo de seguro puede ser el valor predicho el valor real cuando se da una entrada X. Considere el siguiente ejemplo,
X = =
Basado en el valor x1, digamos que obtuvimos la probabilidad estimada para ser 0,8. Esto nos dice que hay un 80% de posibilidades de que un correo electrónico sea spam.
Matemáticamente esto se puede escribir como,
Esto justifica el nombre de «regresión logística». Los datos se ajustan a un modelo de regresión lineal, sobre el que luego actúa una función logística que predice la variable dependiente categórica objetivo.
Tipos de regresión logística
1. Regresión logística binaria
La respuesta categórica tiene sólo dos 2 resultados posibles. Ejemplo: Spam o No
2. Regresión Logística Multinomial
Tres o más categorías sin ordenar. Ejemplo: Predecir qué comida se prefiere más (Veg, No-Veg, Vegano)
3. Regresión Logística Ordinal
Tres o más categorías con ordenación. Ejemplo: Valoración de películas del 1 al 5
Límite de decisión
Para predecir a qué clase pertenece un dato, se puede establecer un umbral. En base a este umbral, la probabilidad estimada obtenida se clasifica en clases.
Por ejemplo, si valor_previsto ≥ 0,5, entonces clasifica el correo electrónico como spam, si no, como no spam.
El límite de decisión puede ser lineal o no lineal. Se puede aumentar el orden polinómico para obtener un límite de decisión complejo.
Función de coste