Roles y RACI en equipos de datos

Cursos Empresas Blog Live Conf Precios

Contenido del curso

Fundamentos y Estrategía

Cultura y Gobernanza

Herramientas y Roles

Análisis de Negocio

Machine Learning y Operación

Tomar examen

Roles y RACI en equipos de datos

Resumen

¿Quién hace qué en un proyecto de datos? Esa pregunta, aparentemente simple, define si tu equipo entrega valor o se queda atrapado en reuniones eternas. Aquí vas a entender los roles clave en un equipo de datos, cómo distribuir responsabilidades con la matriz RACI y qué stack tecnológico elegir según el problema que estés resolviendo.

Muchos proyectos no fracasan por falta de talento ni de presupuesto. Fracasan porque nadie sabe quién toma decisiones, quién ejecuta y quién solo debería estar enterado. Vamos a poner orden.

¿Cuáles son los roles clave en un equipo de datos?

Cada perfil aporta algo distinto y, cuando entiendes qué hace cada uno, dejas de pedirle peras al olmo.

Analista de datos: trabaja con datos que ya existen, genera reportes y dashboards, y responde preguntas del negocio.
Data scientist: va más allá del reporte. Crea modelos predictivos, identifica patrones complejos y experimenta con nuevas fuentes de datos.
Machine learning engineer: toma esos modelos y los lleva a producción. Se asegura de que funcionen en la vida real, no solo en el notebook.
MLOps: hace que todo lo anterior escale. Automatiza, monitorea y mantiene los sistemas funcionando de forma continua.
Data steward: cuida la calidad, definición y documentación de los datos. Es quien te dice qué significa cada columna, de dónde viene y cómo se usa.
Product owner: define la visión del proyecto, prioriza y alinea con negocio. No necesita dominar todo lo técnico, pero sí debe tener claro qué problema estás resolviendo.

¿Cuál es la diferencia entre un data scientist y un machine learning engineer? El data scientist construye y experimenta con modelos predictivos. El machine learning engineer se encarga de que esos modelos funcionen en producción, de manera estable y escalable [02:15].

¿Por qué ningún rol trabaja solo?

Los proyectos de datos son colaborativos por naturaleza. El analista necesita al data steward para validar fuentes, el data scientist necesita al ingeniero de ML para llevar el modelo a producción, y todos necesitan al product owner para no perder de vista el problema de negocio. Cuando esa colaboración no tiene reglas claras, se vuelve caos.

¿Cómo aplicar la matriz RACI en proyectos de datos?

La matriz RACI es una herramienta sencilla que asigna responsabilidades sin ambigüedad. Cada letra representa un tipo de involucramiento en una tarea o decisión.

R de Responsable: quien hace el trabajo.
A de Aprobador: quien toma la decisión final.
C de Consultado: quien debe opinar antes de ejecutar.
I de Informado: a quien solo hay que mantener al tanto.

Imagina que estás creando un dashboard de churn. El analista de datos es el responsable de construirlo, el product owner es quien lo aprueba, el data steward es consultado para validar las fuentes y alguien del equipo de ventas queda informado del resultado. Así, nadie pisa el trabajo del otro y nadie se entera tarde.

¿Para qué sirve la matriz RACI? Sirve para definir, en cada tarea de un proyecto, quién ejecuta, quién aprueba, quién opina y quién recibe información. Evita duplicidades, cuellos de botella y decisiones tomadas por la persona equivocada [03:10].

¿Cómo armar tu propia matriz RACI?

Lista las tareas principales del proyecto en filas y los roles en columnas. Para cada tarea, asigna una sola R y una sola A, y todas las C e I que necesites. Si una tarea tiene tres responsables, en realidad no tiene ninguno.

¿Qué stack de datos necesitas según el proyecto?

El stack es el conjunto de tecnologías que vas a usar. No hay una receta única, pero sí hay patrones que se repiten según el tipo de trabajo.

Data warehouse: almacena grandes volúmenes de datos históricos bien estructurados. Es la base para análisis y reportes a escala.
Notebooks como Jupyter: ideales para explorar, limpiar datos y construir modelos. Espacio natural del trabajo técnico y experimental.
Herramientas de Business Intelligence como Power BI o Tableau: visualizan resultados y permiten que el negocio tome decisiones sin saber código.

Elegir el stack no es solo una decisión técnica, es estratégica. Pregúntate: ¿necesitas velocidad o profundidad? ¿Exploración o automatización? ¿Visualización o modelado puro? La respuesta define qué herramientas tienen sentido para ti.

¿Qué pasa si eliges mal el stack?

Terminas pagando por capacidades que no usas o, peor, peleando con herramientas que no resuelven tu problema. Un equipo que solo necesita reportes mensuales no necesita un pipeline de MLOps. Un equipo que entrena modelos en tiempo real no se conforma con un dashboard estático.

¿Cuál es el reto práctico de esta clase?

De la clase 10 a la 20 vas a construir entregables conectados entre sí, que culminan en un dashboard o un reporte estratégico. El contexto es este: trabajas como analista de negocio en una empresa de servicios digitales y el churn, es decir, el abandono de clientes, ha aumentado en los últimos meses.

Tu reto específico ahora es:

Crea un mapa rápido de los roles que hay en tu organización o en un proyecto donde estés trabajando.
Asigna responsabilidades usando el modelo RACI: quién decide, quién ejecuta, quién es consultado y quién es informado.
Si no tienes un equipo real, imagina el equipo ideal para liderar un proyecto de análisis de clientes.

Puedes subir tu tabla RACI como imagen o copiarla en los comentarios. Cuéntame cómo distribuiste los roles y qué decisiones te costaron más definir.

Comentarios

Hugo Ocampo

Estudiante

Renato Puello Pereira

Estudiante

Gracias Hugo!

Gabriel Obregón

Estudiante

📌Roles, RACI y Stack de Datos

👥 Roles del equipo de datos

🔹 Analista de datos → reportes, dashboards, responder al negocio.

🔹 Data scientist → modelos predictivos, patrones, experimentación.

🔹 Machine learning engineer → lleva modelos a producción.

🔹 MLOps → escalado, automatización, monitoreo continuo.

🔹 Data steward → calidad, definiciones claras, documentación.

🔹 Product owner → visión, prioridades, conexión con negocio.

🎯 Matriz RACI

📍 R = Responsable → ejecuta.

📍 A = Aprobador → decide.

📍 C = Consultado → opina.

📍 I = Informado → solo recibe noticias.

✨ Ejemplo (dashboard):

R = analista
A = product owner
C = data steward
I = ventas

👉 Pasos prácticos:

✅ Mapea roles → Asigna R, A, C, I → Diseña equipo ideal → Comparte tu RACI.

🛠️ Stack de datos

💾 Data warehouse → históricos estructurados.

📓 Notebooks (Jupyter, etc.) → explorar, limpiar, modelar.

📊 BI Tools (Power BI, Tableau) → visualizar y decidir.

🔍 Preguntas clave:

¿Velocidad o profundidad?
¿Exploración o automatización?
¿Visualización o solo modelado?
¿Qué pide el negocio?

🚀 Misión práctica

🎯 Caso: churn (abandono de clientes) en empresa digital. Debes:

Diagnosticar con datos.
Presentar con claridad.
Proponer acciones concretas.

💻 Herramientas para elegir

🗂️ SQL → consultas, transformación de datos.

🐍 Python → análisis, ML, automatización.

📈 R → estadística y visualización avanzada.

JULIO CÉSAR HERNÁNDEZ MEMBREÑO

Estudiante

Gracias ChatGPT

Aaron Mainero

Estudiante

Neyron Zapata

Estudiante

Jhon Sebastián Atará López

Estudiante

Gente el documento de "proyecto integrador" tiene un pequeño error en la parte de la Clase 11 ya que los roles R y A están invertidos, en el documento dice que el R es quien toma las decisiones y que el A es quien ejecuta, pero realmente es al contrario.

yina nuñez

Estudiante

Isabel Montoya

Estudiante

•

Es preciso aclarar que para cada proyecto se cuenta con diferentes fases o etapas, y dependiendo de la fase o etapa que se encuentre, las responsabilidades RACI van a variara para cada rol.

Alveiro Mejia Lopez

Estudiante

Hola a todos:

Este es mi aporte para el ejercicio de churn, agradecería mucho sus comentarios.

Esteban Bastías B.

Estudiante

Alejandra Cornejo

Estudiante

De que web sacas esa información compañero?

Esteban Bastías B.

Estudiante

¡Propia! :-)

Alejandro Guerrero

Estudiante

!What are the major data roles and what do they do?

Esteban Bastías B.

Estudiante

Juan Diego

Estudiante

Gilberto Barrón López

Estudiante

En la clase 21 se da la explicación de MLOps:

¿Qué es MLOps y cómo reduce riesgos en el despliegue?

Así como DevOps en software, MLOps reúne prácticas para que los modelos se desplieguen correctamente, se monitoreen en producción, se actualicen cuando cambian los datos y puedan revertirse si algo falla. No es solo un equipo: es una mentalidad operativa para sistemas críticos.

Riesgo 1: entrenar con datos viejos y fallar con comportamientos nuevos.
Riesgo 2: falsos positivos que dañan la experiencia del cliente.
Riesgo 3: fallas invisibles por falta de monitoreo.
Riesgo 4: sin plan B, no hay forma de volver atrás rápido.

Para operar con confianza, sirven prácticas como:

Service level objectives: métricas para saber si el modelo está cumpliendo.
Retraining: reentrenar con datos nuevos cuando el entorno cambia.
Rollback: regresar a una versión anterior si algo sale mal.

Ejemplo claro: un banco lanza un modelo de deep learning para fraude en tiempo real. Puede sonar increíble, pero sin operación inteligente podrían aparecer falsos positivos, cambios de patrón constantes o caídas del servicio que impidan validar transacciones. Lo técnico ya se hizo; ahora hay que operarlo como parte del negocio.

Gloria Alexandra Hernández Acosta

Estudiante

Sebastián Alejandro Arce García

Estudiante

Hola a todos! Una duda respecto a los roles. En este contexto como interviene el data engineer?

saludos

Witiman Andrés Canacue Ortiz

Estudiante

¿Por qué separar MLOps y Data Science?

Piensa en el Data Scientist como un chef de alta cocina que experimenta con ingredientes para crear la receta perfecta en su cocina de pruebas. Su objetivo es la precisión y el descubrimiento. Sin embargo, si le pides a ese mismo chef que cocine ese plato para 10,000 personas al mismo tiempo y lo entregue caliente, el sistema colapsará.

Ahí entra MLOps (Machine Learning Operations). Es el ingeniero de la fábrica que diseña la línea de ensamblaje automatizada. Separar estos roles es vital porque requieren mentalidades opuestas: el científico busca innovación y exactitud en entornos controlados (como un Jupyter Notebook), mientras que MLOps busca estabilidad, escalabilidad y monitoreo continuo en el mundo real. Si obligas a un científico a mantener servidores, perderás su capacidad analítica; si dejas que un modelo viva solo en un entorno de pruebas, la empresa nunca verá el retorno de inversión.

Carlos Andres Prieto Garavito

Estudiante

Claudia Cecilia Ruiz Duque

Estudiante

Negocio define problema
Data analyst extrae y analiza
Data scientist modela
Stakeholder aprueba

HERVER ALONSO RAMIREZ FIGUEROA

Estudiante

El Product Owner manda en decisiones, no el técnico
El analista conecta todo (datos ↔ negocio)
El Data Scientist descubre el “por qué” profundo
Marketing es quien realmente reduce el churn

Carlos Mario Agudelo Castrillon

Estudiante

abordo este problema de churn con un enfoque estructurado: primero entender la magnitud, luego segmentar a los clientes que se van, identificar causas raíz y finalmente proponer acciones priorizadas.

solucion

Perfil tipo del que se va:

Contrató hace 2-5 meses.
No ha usado el centro de ayuda ni webinars.
Abrió 3+ tickets de soporte en las últimas 2 semanas (todos sin resolución).
Ha visto la página de cancelación al menos una vez.
Análisis cualitativo (entrevistas a 15 clientes que se fueron)

“El sistema empezó a fallar justo cuando más lo necesitábamos, y el soporte solo respondía con enlaces a artículos genéricos.” “Nos dimos cuenta de que pagábamos el doble que con [competidor] por menos funcionalidades.” “Cambiaron el dashboard y nadie nos avisó; perdimos 2 días reconfigurando todo.”### Acciones estratégicas (90 días)* Modelo predictivo de churn (machine learning con 10+ features: uso de features, tickets, logins, etc.) para intervenir antes de que cancelen.

Programa de embajadores (clientes fieles → descuentos por referidos).

Revisión de pricing (introducir plan intermedio con las features más demandadas).

Fundamentos y Estrategía

Ciencia de datos para decisiones de negocio

Diferencias entre Business Intelligence, Data Science y Machine Learning

Datos como ventaja competitiva en negocios

Os 5 V do Big Data explicados

De datos crudos a decisiones con KPI Tree

Diferencias entre BI, Analytics y Big Data para empresas

Cultura y Gobernanza

Cómo construir una cultura orientada al dato en tu organización

Calidad y gobernanza de datos sin caos

Minimización y consentimiento en datos personales

Sesgos invisibles en datos y sistemas de inteligencia artificial

Herramientas y Roles