Evaluación de modelos de machine learning para decisiones de negocio
Clase 20 de 21 • Curso de Ciencia de Datos para Análisis de Negocio
Resumen
El machine learning puede sonar difícil, pero su valor es claro: modelos que aprenden de tus datos para predecir, clasificar y tomar mejores decisiones. Aquí verás cómo encaja en el negocio, su ciclo de vida, las métricas clave y cómo evaluar si un caso como el churn amerita acción.
¿Qué es machine learning y por qué importa para el negocio?
El machine learning es un enfoque de la inteligencia artificial donde, en lugar de programar reglas, das datos y el modelo aprende patrones. Funciona cuando tienes suficiente información y relaciones entre variables.
- Ejemplos de uso: churn, recomendaciones, detección de fraude, precios dinámicos.
- Resultado esperado: modelos que predicen o clasifican con sentido para el negocio.
¿Cuáles son los tipos de aprendizaje de machine learning?
- Aprendizaje supervisado: aprendes con datos etiquetados. Sabes quién se fue y quién se quedó.
- No supervisado: no hay etiquetas. El modelo explora y agrupa para segmentar clientes por comportamiento.
- Aprendizaje por refuerzo: un agente decide por prueba y error. Ejemplos: robots que caminan o sistemas que juegan videojuegos.
¿Cómo es el ciclo de vida de un proyecto de machine learning?
No es magia: hay un proceso claro para llegar a producción y capturar valor. La clave es alinear variables, entrenamiento, validación y despliegue con el objetivo del negocio.
¿Qué implica la ingeniería de características?
Es decidir qué variables alimentan el modelo, también llamado feature engineering.
- Selección de variables relevantes: tipo de plan, ciudad, número de reclamos.
- Preparación de datos: que el modelo reciba señales útiles.
¿Cómo se entrenan, validan y despliegan los modelos?
- Entrenamiento: el modelo aprende con datos donde ya conoces la respuesta.
- Validación: verificas si generaliza o solo memoriza.
- Despliegue: pones el modelo en producción para predecir en tiempo real o en lotes.
¿Qué métricas y riesgos determinan el éxito del modelo?
No basta con “acierta 85%”. Cada métrica responde preguntas distintas y se complementan para decidir con criterio.
¿Qué miden accuracy, precisión, AUC y recall?
- Accuracy: de todas las predicciones, cuántas fueron correctas.
- Precisión: de lo que predijo como positivo, cuántos realmente eran positivos. Útil para saber si vale la pena intervenir a quienes marcaste como riesgo.
- AUC: mide la capacidad de distinguir entre clases; ideal para clasificación binaria.
- Recall: de los que se iban, cuántos detectaste correctamente.
¿Por qué el overfitting afecta al negocio?
El overfitting es sobreajuste: el modelo se aprende de memoria el pasado y falla con datos nuevos.
- Señal técnica: funciona perfecto en histórico, falla al generalizar.
- Impacto de negocio: promociones mal asignadas. Campañas que no retienen. Recursos desperdiciados.
¿Cómo evaluar el caso de churn con criterios de negocio?
Plantea las preguntas correctas antes de actuar sobre clientes en riesgo.
- ¿El modelo es supervisado o no supervisado?: el churn con datos históricos y etiquetas es supervisado.
- ¿Qué métrica priorizar: accuracy, precisión o recall?: si te importa no dejar ir clientes valiosos, prioriza recall para capturar más casos reales de fuga, y precisión para no gastar de más en quienes no se iban.
- ¿Qué decisión tomar con los detectados?: define intervenciones solo si la precisión sugiere que no malgastas recursos; usa el recall para dimensionar el alcance.
¿Tú cómo priorizarías precisión y recall en tu contexto de churn? Deja tu respuesta en los comentarios y revisa la caja de recursos para continuar la discusión.