Modelos en producción: qué es MLOps

Curso de Ciencia de Datos para Análisis de Negocio

Contenido del curso

No sé dónde empezar

Fundamentos y Estrategía

Cultura y Gobernanza

Herramientas y Roles

Análisis de Negocio

Machine Learning y Operación

Tomar examen

Modelos en producción: qué es MLOps

Resumen

El verdadero valor de un modelo de machine learning no aparece en el Jupyter Notebook, aparece cuando se despliega en producción y empieza a tomar decisiones reales. Aquí vas a entender cómo opera un modelo en el mundo real, qué es MLOps y por qué el deep learning no siempre es la respuesta, todo pensado para quien lidera con datos sin necesariamente ser ingeniero.

¿Qué es el deep learning y cuándo conviene usarlo?

El deep learning es una rama del machine learning que usa redes neuronales profundas para aprender representaciones muy complejas de los datos. Suena técnico, pero la idea es simple: son modelos que destacan en tareas específicas y bastante particulares.

Funciona muy bien cuando necesitas:

Reconocimiento de imágenes a gran escala.
Procesamiento de lenguaje natural sobre grandes volúmenes de texto.
Análisis de audio y video.

Ahora, si tu trabajo gira en torno a tablas, métricas, encuestas o datos tradicionales de clientes, probablemente no necesites algo tan sofisticado. Y aquí viene una idea que vale oro: saber cuándo no complicarte también es inteligencia de negocio.

¿Cuándo usar deep learning en un negocio? Cuando trabajas con imágenes, voz, video o grandes volúmenes de texto. Para datos tabulares y métricas, modelos más simples suelen ser suficientes y más mantenibles.

¿Qué significa desplegar un modelo en producción?

Desplegar un modelo es sacarlo del laboratorio y ponerlo a trabajar. Es el momento en el que sus decisiones empiezan a afectar el negocio de verdad.

Un modelo desplegado puede, por ejemplo, detectar fraude mientras ocurre, recomendar productos en tiempo real, clasificar tickets en cuanto entran o predecir la rotación de clientes cada semana. El despliegue puede ocurrir de dos formas:

En tiempo real, con respuestas en segundos.
En batch, ejecutándose por ejemplo cada noche.

Lo importante es que ya no estás en modo experimento. El modelo está activo y sus salidas se traducen en acciones operativas.

¿Qué es MLOps y por qué importa?

Así como en desarrollo de software existe DevOps para automatizar y mantener sistemas, en machine learning existe MLOps, el conjunto de prácticas que asegura que los modelos:

Se desplieguen correctamente.
Se monitoreen en producción.
Se actualicen cuando los datos cambian.
Puedan revertirse si algo falla.

MLOps no es solo un equipo técnico, es una mentalidad. Si un modelo va a tomar decisiones importantes, hay que operarlo con el mismo cuidado que cualquier sistema crítico de la empresa.

¿Qué puede salir mal sin una buena operación del modelo?

La lista es larga, y por eso conviene anticiparse. Algunos riesgos comunes cuando un modelo vive en producción sin la operación adecuada son:

Que se haya entrenado con datos viejos y deje de funcionar bien con nuevos comportamientos.
Que empiece a dar falsos positivos y dañe la experiencia del cliente.
Que falle sin que nadie se entere por falta de monitoreo.
Que se despliegue sin un plan B y no haya forma de volver atrás rápido.

Para evitar estos escenarios existen tres prácticas que vale la pena tener claras. Los Service Level Objectives son métricas que indican si el modelo está cumpliendo con lo esperado. El retraining consiste en volver a entrenar el modelo con datos nuevos cuando la realidad cambia. Y el rollback es la capacidad de regresar a una versión anterior si algo sale mal.

¿Qué es rollback en machine learning? Es la capacidad de regresar el sistema a una versión anterior del modelo cuando la nueva versión falla, evitando interrumpir el servicio o tomar malas decisiones automatizadas.

Un ejemplo claro: detección de fraude en un banco

Imagina un banco que lanza un modelo de deep learning para detectar fraudes en tiempo real. Suena increíble, pero piensa qué pasaría si empieza a marcar como fraude compras legítimas, si los patrones de fraude cambian cada mes o si se cae el servicio y no se pueden validar las transacciones.

Ahí es donde entra la operación inteligente. Lo técnico ya se hizo; ahora toca operarlo como parte viva del negocio.

¿Cómo se construye un checklist mínimo para operar un modelo?

Antes de dar por terminado un despliegue, conviene tener respuestas concretas a cuatro preguntas operativas:

¿Cuáles son las tres métricas clave de monitoreo del modelo?
¿Con qué frecuencia se actualizará?
¿Qué se hace si se detectan errores?
¿Qué áreas deben ser notificadas si algo falla?

Responder esto convierte un modelo bonito en un modelo confiable. Y esa confianza es lo que permite que el negocio se apoye en él para decisiones importantes.

¿Qué es MLOps en pocas palabras? Es el conjunto de prácticas para desplegar, monitorear, actualizar y revertir modelos de machine learning en producción, con la misma disciplina con la que se opera cualquier sistema crítico.

¿Qué sigue después de aprender a liderar con datos?

Liderar con datos no es solo dominar una herramienta, es una forma de pensar: cuestionar mejor, estructurar hipótesis, buscar patrones reales y cruzar lo que pasa con lo que la gente dice. No necesitas un nuevo título ni una certificación para empezar.

Necesitas leer mejor una tabla que tienes enfrente, entregar contexto a un equipo antes que métricas y entender que muchos problemas no se resuelven con más reuniones, sino con mejores datos. Si quieres ir más al fondo, el siguiente paso natural es profundizar en los fundamentos de inteligencia artificial y machine learning.

¿Qué modelo crees que tu equipo necesita poner en producción primero? Cuéntame en los comentarios cómo lo monitorearías.

Carlos Mario Agudelo Castrillon

Estudiante

Modelo: Predicción de churn (supervisado, prioridad en RECALL)

Contexto operativo:

El modelo predice diariamente qué clientes tienen alta probabilidad de abandono (score > 0.7).
Las predicciones alimentan una campaña automática de retención.
Equipo responsable: Data Science + Marketing + CRM + Atención al Cliente.

3 métricas clave de monitoreo

#MétricaFórmulaFrecuenciaUmbral de alerta

Estabilidad del score

Desviación estándar del score promedio por cohorte

Quincenal

CV > 20% (cambios bruscos en distribución)

📊 Métricas de negocio (monitoreo paralelo):

Métrica de negocioFórmulaFrecuencia

Tasa de recuperación

Clientes retenidos / total detectados

Semanal

ROI de campaña

(Ingreso recuperado - inversión) / inversión

Mensual

Churn observado vs predicho

Diferencia entre churn real y esperado

Quincenal

Frecuencia de actualización del modelo

Estrategia híbrida:

Tipo de actualizaciónFrecuencia¿Qué se actualiza?Responsable

Reentrenamiento programado

Cada 30 días

Modelo completo con nuevos datos históricos

Data Science

Actualización de predictores

Diario

Variables de entrada (R, F, M, días desde última compra, etc.)

Automatizado (ETL)

Revisión de umbrales

Cada 15 días

Ajuste del score cutoff (>0.7, >0.8, etc.)

Data Science + Marketing

Retraining extraordinario

Cuando recall < 70%

Modelo completo

Data Science (urgente)

Calendario mensual típico:

text

Semana 1 → Reentrenamiento (lunes) + validación (martes) + despliegue (miércoles)
Semana 2 → Monitoreo de métricas + ajuste de umbrales
Semana 3 → Revisión de estabilidad + reporte a negocio
Semana 4 → Evaluación de impacto de negocio + preparación próximo ciclo

Qué hacer si detectas errores

Escenario 1: Recall bajo (< 70%)

SíntomaEl modelo no detecta suficientes churn reales. Muchos falsos negativos.

Causas posibles

Datos desactualizados, cambio en comportamiento post-pandemia, nueva competencia.

Acción inmediata

Pausar automatización (no enviar campañas). Revisar features recientes.

Acción correctiva

Reentrenar con últimos 60 días. Ajustar umbral de score a 0.65.

Escalación

Notificar a Marketing (cambiar mensajes) y a Producto (posible fuga masiva).

Tiempo de resolución

48 horas.

Escenario 2: Precisión baja (< 50%)

SíntomaEl modelo etiqueta muchos clientes como "churn" pero no lo son (falsos positivos).

Causas posibles

Ruido en etiquetas, clientes estacionales mal clasificados.

Acción inmediata

Reducir alcance de campaña (solo top 10% score). Aumentar umbral a 0.85.

Acción correctiva

Limpiar etiquetas históricas (redefinir qué es "abandono" para el negocio).

Escalación

Notificar a CRM (evitar saturar clientes).

Tiempo de resolución

5 días hábiles.

Escenario 3: Deriva del modelo (score inestable)

SíntomaLa distribución de probabilidades cambió drásticamente (CV > 20%).

Causas posibles

Cambio en la base de clientes, nuevas variables, error en ETL.

Acción inmediata

Validar pipeline de datos (features). Comparar distribuciones vs entrenamiento.

Acción correctiva

Recalcular percentiles de score. Reentrenar con datos más recientes.

Escalación

Notificar a Data Engineering (posible falla en ingestión).

Tiempo de resolución

24 horas.

Qué áreas deben ser notificadas

Matriz de comunicación por incidente:

ÁreaResponsable Cuándo notificarCanalFrecuencia de reporte regular

Data Science

Líder de ML

Cualquier alerta de métricas

Slack #modelo-churn-alerts + Email

Diario (automático)

Marketing

Head de CRM

Recall < 75% o Precision < 50%

Email + reunión semanal

Semanal

CRM / Automation

Campaign Manager

Cambio en umbrales o pausa de campaña

Slack + Jira ticket

Inmediato (si hay cambio)

Atención al Cliente

Supervisor CX

Si falsos positivos > 20% (clientes molestos)

Email + brief semanal

Semanal

Producto

Product Manager

Si el modelo detecta fuga masiva (>15% clientes en riesgo)

Reunión ejecutiva

Mensual

Ejecutivos

CMO / CDAO

Resumen mensual de desempeño del modelo

Dashboard ejecutivo + PPT mensual

Mensual

Ejemplo de alerta automática (Slack / Email):

markdown

ALERTA MODELO DE CHURN - URGENTE 

Modelo: Predicción churn v2.3
Fecha: 2025-09-15

RECALL: 62% (umbral: 75%)
PRECISION: 48% (umbral: 50%)

Acción sugerida:
- Pausar campaña automática
- Revisar etiquetas históricas
- Reentrenar con últimos 60 días

Áreas notificadas:
Data Science
Marketing (pendiente acción)
CRM (pausa solicitada)

Tiempo estimado de resolución: 48h

Checklist resumen (para imprimir / slide final)

text

CHECKLIST DE MONITOREO – MODELO DE CHURN
━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━

MÉTRICAS CLAVE (3):
   [ ] Recall ≥ 75%
   [ ] Precision ≥ 50%
   [ ] Score estable (CV < 20%)

FRECUENCIA:
   [ ] Monitoreo diario (automático)
   [ ] Reentrenamiento: cada 30 días
   [ ] Revisión umbrales: cada 15 días

PLAN DE ERRORES:
   [ ] Recall bajo → pausar campaña + reentrenar urgente
   [ ] Precisión baja → ajustar umbral + limpiar etiquetas
   [ ] Deriva de score → validar ETL + recalibrar

NOTIFICACIONES:
   [ ] Data Science → alertas diarias
   [ ] Marketing → reporte semanal
   [ ] CRM → cambios operativos inmediatos
   [ ] Ejecutivos → dashboard mensual

PRÓXIMA REVISIÓN:
   Fecha: _____________
   Responsable: _____________

Kesmish Daniel Ramirez Duarte

Guillermo Alomia Monjaraz

Jackssuriss Tatiana Herrera Florez

Gabriel Obregón

Aaron Mainero

IVAN CARAPIA BARAJAS

Esteban Bastías B.

yina nuñez

Carlos Andres Prieto Garavito

Mauricio Antonio Rios David

Gilberto Barrón López

Hugo Ocampo

JHON JAIRO GIL MAYA

Karen Lizeth Quiñones

Claudia Cecilia Ruiz Duque

•

Claudia Suárez

Felipe Martínez

Maria Antonietta Osorio Perez

Modelos en producción: qué es MLOps

Fundamentos y Estrategía

Ciencia de datos para negocios sin programar

Diferencias entre Business Intelligence, Data Science y Machine Learning

Palancas de valor con análisis de datos

Las 5 V del big data explicadas

Cómo construir un árbol de KPIs eficaz

Diferencias entre BI, Analytics y Big Data para empresas

Cultura y Gobernanza

Cómo construir una cultura orientada al dato

Calidad y gobernanza de datos en tu empresa

Minimización y consentimiento en datos personales

Sesgos invisibles que arruinan tus datos

Herramientas y Roles

Roles y matriz RACI en equipos de datos

SQL, Python o R: cuál usar y cuándo

Cómo leer SQL sin saber programar

SQL para ventas: del filtro al insight

Análisis de Negocio

Storytelling con datos para convencer ejecutivos

Hipótesis de negocio con criterios SMART

Segmentación RFM para retener clientes en Excel

Minería de texto para leer a tus clientes

Análisis de quejas con datos combinados

Machine Learning y Operación

Cómo evaluar un modelo de machine learning

Modelos en producción: qué es MLOps

Resumen