No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

¿Cuándo usar regresión logística?

3/17
Recursos

Aportes 10

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

La Regresión logistica se utiliza en los siguientes casos:

Clasificación binaria: la regresión logística se utiliza para clasificar la observación en dos categorías distintas, como “sí” o “no”, “éxito” o “fracaso”, “compra” o “no compra”, etc.

Datos de entrada no lineales: la regresión logística puede manejar datos de entrada no lineales y se puede utilizar para modelar la relación entre variables predictoras y variables de respuesta no lineales.

Datos con valores atípicos: la regresión logística es robusta a los valores atípicos y no se ve afectada significativamente por los puntos de datos que se desvían de la tendencia general.

Problemas de clasificación multiclase: si bien la regresión logística es una técnica de clasificación binaria, también se puede utilizar para problemas de clasificación multiclase mediante la técnica “uno contra todos”.

La regresión logística es un modelo estadístico utilizado para predecir la probabilidad de un evento binario (sí/no, éxito/fracaso) en función de una o más variables independientes. Aquí te presento algunos ejemplos en los que se podría utilizar la regresión logística:

En marketing: La regresión logística se puede utilizar para predecir la probabilidad de que un cliente realice una compra en función de su historial de compras anteriores, el tiempo que ha pasado desde su última compra, su ubicación geográfica, etc.

En salud: La regresión logística se puede utilizar para predecir la probabilidad de que un paciente desarrolle una enfermedad en función de sus antecedentes familiares, su edad, su género, su dieta, etc.

En finanzas: La regresión logística se puede utilizar para predecir la probabilidad de que un cliente deje de pagar sus deudas en función de su historial crediticio, su ingreso, su edad, etc.

En ciencias sociales: La regresión logística se puede utilizar para predecir la probabilidad de que un individuo vote por un determinado partido político en función de su edad, su género, su nivel educativo, etc.

En investigación de mercado: La regresión logística se puede utilizar para predecir la probabilidad de que un producto tenga éxito en el mercado en función de su precio, su diseño, su marca, etc.

En general, la regresión logística se puede utilizar en cualquier situación en la que se quiera predecir la probabilidad de un evento binario en función de variables independientes.

Ventajas

  • Fácil de implementar: Con sklearn es muy sencillo
  • Coeficientes interpretables: Puedo entender los coeficientes y ver cómo se aplican.
  • Inferencia: Puedes utilizar distintos features para ver cuál tiene más importancia para predecir tu variable dependiente.
  • **Clasificación en porcentajes: **No dice Sí y no, te da el porcentaje exacto de confianza {0,100}

Desventajas

  • Asume la linealidad: Asume que todas las relaciones son lineales y no siempre es así.
  • Overfitting: Si pongo muchas features, este se aprende el patrón de entrenamiento en lugar de predecirlo.
  • Multicolinealidad: Dos características que tienen el mismo comportamiento
  • Datasets grandes: necesita datasets muy grandes para ser precisos.
La regresión logística es un método estadístico que se utiliza para predecir la probabilidad de una variable dependiente categórica, basada en una o más variables independientes. Se utiliza ampliamente para la clasificación binaria, por ejemplo, predecir si un email es spam o no. **Ventajas:** * **Interpretabilidad:** Los coeficientes del modelo pueden ser interpretados como cambios en el logaritmo de las probabilidades por cada unidad de cambio en la variable independiente, lo que facilita entender la importancia de cada predictor. * **Eficiencia:** Es relativamente simple y rápido de implementar, y requiere menos recursos computacionales en comparación con otros algoritmos de clasificación. * **Buen rendimiento con variables categóricas:** Puede manejar fácilmente variables categóricas que representan diferentes categorías o niveles. **Desventajas:** * **Suposición de linealidad:** Asume una relación lineal entre las variables independientes y el logit de la variable dependiente, lo que puede no ser adecuado para todas las relaciones entre variables. * **Sensibilidad a datos desbalanceados:** Su rendimiento puede verse afectado negativamente por conjuntos de datos donde las clases son muy desiguales. * **Limitación a la clasificación binaria o multinomial:** Principalmente se utiliza para clasificación binaria, aunque puede extenderse a multinomial, no es tan flexible como otros algoritmos para diferentes tipos de tareas de clasificación. **Cuándo usarla:** * **Clasificación binaria:** Ideal para problemas donde el objetivo es predecir una de dos posibles categorías, como sí/no, verdadero/falso, éxito/fracaso. * **Probabilidad de eventos:** Cuando se necesita conocer la probabilidad de ocurrencia de un evento en lugar de solo la clasificación. * **Datos con relación lineal:** En situaciones donde se espera que las variables independientes tengan una relación lineal con el logit de la variable dependiente. **Diferencia entre regresión lineal y logística:** * **Tipo de variable dependiente:** La regresión lineal se utiliza para predecir valores continuos (por ejemplo, precio de una casa), mientras que la regresión logística se utiliza para predecir la probabilidad de ocurrencia de un evento categorizado (por ejemplo, si un email es spam o no). * **Función de enlace:** La regresión lineal utiliza una función de identidad, lo que significa que la salida es una combinación lineal de las entradas. La regresión logística utiliza una función logística (o sigmoide) para asegurar que las predicciones estén en el rango de 0 a 1, interpretándose como probabilidades. * **Interpretación de resultados:** En la regresión lineal, los coeficientes representan el cambio en la variable dependiente por cada unidad de cambio en una variable independiente. En la regresión logística, representan el cambio en el logaritmo de odds (odds ratio) para cada unidad de cambio en una variable independiente. La elección entre regresión lineal y logística depende fundamentalmente del tipo de variable que se está intentando predecir (continua vs. categórica) y del objetivo del análisis (predecir un valor exacto vs. la probabilidad de pertenencia a una categoría).

La “regresión logística” es una técnica en el campo de la estadística y el aprendizaje automático que se utiliza principalmente para problemas de clasificación, no para problemas de regresión, a pesar de su nombre. A menudo, se utiliza en situaciones en las que deseas predecir una variable categórica o discreta, como sí/no, verdadero/falso, clases de objetos, etc. Aquí hay un resumen de su utilidad y aplicación:
*

  1. Clasificación Binaria: La regresión logística se utiliza comúnmente para problemas de clasificación binaria, donde el objetivo es asignar una de dos categorías posibles a una observación. Por ejemplo, puede utilizarse en la detección de spam (correo electrónico es spam o no), diagnóstico médico (presencia o ausencia de una enfermedad) o detección de fraude (transacción fraudulenta o legítima).

  2. Clasificación Multiclase: La regresión logística puede extenderse para abordar problemas de clasificación multiclase, donde hay más de dos categorías posibles. En este caso, se utilizan técnicas como la “regresión logística multinomial” o la “regresión logística ordinal” para manejar múltiples clases.

  3. Probabilidad de Clase: La regresión logística calcula la probabilidad de que una observación pertenezca a una clase particular. Esto puede ser útil para comprender la confianza del modelo en su predicción.

  4. Interpretación de Características: La regresión logística permite evaluar la importancia relativa de las características o atributos utilizados para realizar la clasificación. Puedes examinar los coeficientes de las características para comprender cómo cada característica contribuye a la predicción.

  5. Modelos Lineales Generalizados: La regresión logística es un ejemplo de un modelo lineal generalizado (GLM) que permite modelar relaciones no lineales entre las variables de entrada y la probabilidad de una clase.

  6. Amplia Aplicabilidad: Se utiliza en diversas áreas, como marketing (predicción de compras de productos), biología (clasificación de especies), finanzas (evaluación crediticia), entre otras.

En resumen, la regresión logística es una herramienta versátil y ampliamente utilizada en el aprendizaje automático para abordar problemas de clasificación. Aunque su nombre contiene “regresión”, se utiliza principalmente para clasificar datos en categorías discretas en lugar de predecir valores continuos.

Es la primera vez que veo un aporte vaciooo!!!. No puedo tolerarlooo. Que tendrá esta clase???

La sintaxis de sklearn permite configurar la distribucion de probabilidad o el metodo para resolver el problema

https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression

No pense que la regresion logistica tuviera esa funcion. La de predecir con probabilidad. Ahora veo porque me exigian que aprenda probabilidad. Era para esto.

Se pude usar esta libreria para balancear datos: ```python from imblearn.over_sampling import RandomOverSampler ```from imblearn.over\_sampling import RandomOverSampler
<
import numpy as np
import matplotlib.pyplot as plt

x = np.linspace(-10, 10, 100)
y = 1 / (1 + np.exp(-x))
plt.plot(x, y)  # Use plt.plot to create the plot
plt.show()
>