Roles en Data Science e Inteligencia Artificial
Clase 4 de 15 • Guía para Empezar una Carrera en Data Science e Inteligencia Artificial
Resumen
Dentro de la industria de Data Science existen varios roles diferenciados, pero esto no siempre fue de esta forma. En el pasado las empresas usaban el término Data Scientist para la persona que se encargaba de todas las tareas de datos en general.
Con el tiempo se fueron creando nuevos términos para referirse a las personas que se encargaban de ciertos procesos dentro del flujo o proceso de la Data.
Además, dentro de una compañía no se puede iniciar a implementar modelos de Machine Learning en conjunto con el producto sin antes tener una cultura Data-Driven para poderlo hacer.
De esta forma se origina la pirámide de las necesidades de Data Science.
Pirámide de necesidades de Data Science
La pirámide de necesidades de Data Science nos explica cuál es el orden de las etapas que las empresas deben seguir para su desarrollo en la cultura Data-Driven.

Esta nos define que dichas etapas tienen el siguiente orden:
- Recolección de datos
- Instrumentación
- Logging (creación de cuentas de los usuarios)
- Sensores
- Datos externos
- Contenido generado por el usuario
- Movimiento y Almacenamiento
- Exploración y transformación
- Limpieza.
- Detección de anomalías
- Preparación
- Agregaciones y etiquetado
- Estadísticas
- Métricas (son como las medidas de una actividad en concreto)
- Segmentación
- Agregaciones
- Características
- Entrenamiento de datos
- Aprendizaje y optimización
- Pruebas A/B
- Experimentación
- Algoritmos simples ML
- Inteligencia artificial
- Deep Learning
Roles en la industria Data Science
A las etapas anteriores se les añaden los roles que se van a encargar de hacer las tareas y actividades correspondientes para que los datos sigan su curso. Algunos de estos roles suelen tener un enfoque, ya sea con el negocio o con la ingeniería.
Data Engineer
Es la persona encargada de construir y mantener todo el ambiente sobre el que habitarán los datos. Por lo que se encuentra en la base de la pirámide y está más enfocada en la ingeniería.
Data Scientist
Este rol se encarga de ejecutar los métodos necesarios e indicados para analizar la etapa actual, como también hacer predicciones del futuro por medio de modelos de Machine Learning, con el fin de encontrar información valiosa para crear estrategias y productos que beneficien al consumidor.
Data Analyst
Se encarga de estar en una constante búsqueda de necesidades de información que tengan las distintas áreas del negocio, para poder investigarlas y dar respuesta que sea útil para la resolución de problemas y mejoramiento de procesos.
A diferencia del rol de Data Scientist, este solamente analiza el presente.
Research Scientist
Es un rol reciente en la industria, que trata sobre servir de traductor de los diferentes hallazgos que se encuentren en el equipo de data, como también a la hora de traducir las necesidades del negocio para el equipo de data.
Machine Learning Engineer
Se ocupa de evaluar y dar seguimiento a los modelos de Machine Learning planteados, el rol de Data Scientist, como también de comunicarse con el equipo de developers, para la correcta y eficiente implementación de los modelos y el producto.
Developer
El rol se encuentra dentro de un equipo de ingeniería dedicado a desarrollar el producto de la empresa.
Ya sea en el backend o en el frontend, debe hacer parte de la implementación de los modelos de Machine Learning con el producto.
Ahora ya conoces la jerarquía de necesidades del mundo de data science
De esta manera, queda clara que los roles más importantes en la industria de la Data son:
- Data Engineer
- Data Scientist
- Data Analyst
- Research Scientist
- ML Engineer (Machine Learning Engineer)
Eso no quita que existan otros aún más especializados, que demanden las empresas con alto desarrollo de la cultura Data-Driven. Construye tu carrera en Data Science con Platzi.
Contribución creada por: Ismael H.