Evaluación de modelos de machine learning para decisiones de negocio

Clase 20 de 21Curso de Ciencia de Datos para Análisis de Negocio

Resumen

El machine learning puede sonar difícil, pero su valor es claro: modelos que aprenden de tus datos para predecir, clasificar y tomar mejores decisiones. Aquí verás cómo encaja en el negocio, su ciclo de vida, las métricas clave y cómo evaluar si un caso como el churn amerita acción.

¿Qué es machine learning y por qué importa para el negocio?

El machine learning es un enfoque de la inteligencia artificial donde, en lugar de programar reglas, das datos y el modelo aprende patrones. Funciona cuando tienes suficiente información y relaciones entre variables.

  • Ejemplos de uso: churn, recomendaciones, detección de fraude, precios dinámicos.
  • Resultado esperado: modelos que predicen o clasifican con sentido para el negocio.

¿Cuáles son los tipos de aprendizaje de machine learning?

  • Aprendizaje supervisado: aprendes con datos etiquetados. Sabes quién se fue y quién se quedó.
  • No supervisado: no hay etiquetas. El modelo explora y agrupa para segmentar clientes por comportamiento.
  • Aprendizaje por refuerzo: un agente decide por prueba y error. Ejemplos: robots que caminan o sistemas que juegan videojuegos.

¿Cómo es el ciclo de vida de un proyecto de machine learning?

No es magia: hay un proceso claro para llegar a producción y capturar valor. La clave es alinear variables, entrenamiento, validación y despliegue con el objetivo del negocio.

¿Qué implica la ingeniería de características?

Es decidir qué variables alimentan el modelo, también llamado feature engineering.

  • Selección de variables relevantes: tipo de plan, ciudad, número de reclamos.
  • Preparación de datos: que el modelo reciba señales útiles.

¿Cómo se entrenan, validan y despliegan los modelos?

  • Entrenamiento: el modelo aprende con datos donde ya conoces la respuesta.
  • Validación: verificas si generaliza o solo memoriza.
  • Despliegue: pones el modelo en producción para predecir en tiempo real o en lotes.

¿Qué métricas y riesgos determinan el éxito del modelo?

No basta con “acierta 85%”. Cada métrica responde preguntas distintas y se complementan para decidir con criterio.

¿Qué miden accuracy, precisión, AUC y recall?

  • Accuracy: de todas las predicciones, cuántas fueron correctas.
  • Precisión: de lo que predijo como positivo, cuántos realmente eran positivos. Útil para saber si vale la pena intervenir a quienes marcaste como riesgo.
  • AUC: mide la capacidad de distinguir entre clases; ideal para clasificación binaria.
  • Recall: de los que se iban, cuántos detectaste correctamente.

¿Por qué el overfitting afecta al negocio?

El overfitting es sobreajuste: el modelo se aprende de memoria el pasado y falla con datos nuevos.

  • Señal técnica: funciona perfecto en histórico, falla al generalizar.
  • Impacto de negocio: promociones mal asignadas. Campañas que no retienen. Recursos desperdiciados.

¿Cómo evaluar el caso de churn con criterios de negocio?

Plantea las preguntas correctas antes de actuar sobre clientes en riesgo.

  • ¿El modelo es supervisado o no supervisado?: el churn con datos históricos y etiquetas es supervisado.
  • ¿Qué métrica priorizar: accuracy, precisión o recall?: si te importa no dejar ir clientes valiosos, prioriza recall para capturar más casos reales de fuga, y precisión para no gastar de más en quienes no se iban.
  • ¿Qué decisión tomar con los detectados?: define intervenciones solo si la precisión sugiere que no malgastas recursos; usa el recall para dimensionar el alcance.

¿Tú cómo priorizarías precisión y recall en tu contexto de churn? Deja tu respuesta en los comentarios y revisa la caja de recursos para continuar la discusión.