¡Genial! Piramide de Maslow pero en Data Science
Importancia y usos de data science e inteligencia artificial
Oportunidades laborales en Data Science e inteligencia artificial
Glosario para entender el mundo de Data Science e inteligencia artificial
¿Qué es Data Science?
¿Qué es inteligencia artificial? ¿Cuál es su diferencia con Data Science?
¿Qué es Big Data? ¿Cuál es su diferencia con Data Science?
¿Qué NO es Data Science? ¿Por qué aprenderla?
Áreas de aplicación de Data Science e inteligencia artificial
Roles en la industria: cómo funcionan los equipos de datos e inteligencia artificial
Quiz: Importancia y usos de data science e inteligencia artificial
Data Analyst
¿Qué hace una Data Analyst?
Herramientas y tecnologías para Data Analysts
La experiencia de un Data Analyst: entrevista a Demian Arenas
Quiz: Data Analyst
Data Scientist
¿Qué hace una Data Scientist?
Herramientas y tecnologías para Data Scientists
La experiencia de una Data Scientist: entrevista a Nazly Santos
Quiz: Data Scientist
Data Engineer
¿Qué hace una Data Engineer?
Herramientas y tecnologías para Data Engineers
La experiencia de un Data Engineer: entrevista a Alexis Araujo
Quiz: Data Engineer
Machine Learning Engineer
¿Qué hace una Machine Learning Engineer?
Herramientas y tecnologías para Machine Learning Engineers
La experiencia de un Machine Learning Engineer: entrevista a Gerson Perdomo
Quiz: Machine Learning Engineer
Ser profesional en el mundo de los datos e IA
Soft skills para Data Science
¡En sus marcas, listos, fuera!
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Dentro de la industria de Data Science existen varios roles diferenciados, pero esto no siempre fue de esta forma. En el pasado las empresas usaban el término Data Scientist para la persona que se encargaba de todas las tareas de datos en general.
Con el tiempo se fueron creando nuevos términos para referirse a las personas que se encargaban de ciertos procesos dentro del flujo o proceso de la Data.
Además, dentro de una compañía no se puede iniciar a implementar modelos de Machine Learning en conjunto con el producto sin antes tener una cultura Data-Driven para poderlo hacer.
De esta forma se origina la pirámide de las necesidades de Data Science.
La pirámide de necesidades de Data Science nos explica cuál es el orden de las etapas que las empresas deben seguir para su desarrollo en la cultura Data-Driven.
Esta nos define que dichas etapas tienen el siguiente orden:
A las etapas anteriores se les añaden los roles que se van a encargar de hacer las tareas y actividades correspondientes para que los datos sigan su curso. Algunos de estos roles suelen tener un enfoque, ya sea con el negocio o con la ingeniería.
Es la persona encargada de construir y mantener todo el ambiente sobre el que habitarán los datos. Por lo que se encuentra en la base de la pirámide y está más enfocada en la ingeniería.
Este rol se encarga de ejecutar los métodos necesarios e indicados para analizar la etapa actual, como también hacer predicciones del futuro por medio de modelos de Machine Learning, con el fin de encontrar información valiosa para crear estrategias y productos que beneficien al consumidor.
Se encarga de estar en una constante búsqueda de necesidades de información que tengan las distintas áreas del negocio, para poder investigarlas y dar respuesta que sea útil para la resolución de problemas y mejoramiento de procesos.
A diferencia del rol de Data Scientist, este solamente analiza el presente.
Es un rol reciente en la industria, que trata sobre servir de traductor de los diferentes hallazgos que se encuentren en el equipo de data, como también a la hora de traducir las necesidades del negocio para el equipo de data.
Se ocupa de evaluar y dar seguimiento a los modelos de Machine Learning planteados, el rol de Data Scientist, como también de comunicarse con el equipo de developers, para la correcta y eficiente implementación de los modelos y el producto.
El rol se encuentra dentro de un equipo de ingeniería dedicado a desarrollar el producto de la empresa.
Ya sea en el backend o en el frontend, debe hacer parte de la implementación de los modelos de Machine Learning con el producto.
De esta manera, queda clara que los roles más importantes en la industria de la Data son:
Eso no quita que existan otros aún más especializados, que demanden las empresas con alto desarrollo de la cultura Data-Driven.
Contribución creada por: Ismael H.
Aportes 224
Preguntas 28
¡Genial! Piramide de Maslow pero en Data Science
Creo que es fundamental educar a las pymes y emprendedores para que conozcan la importancia de crear, mantener y actualizar una base de datos.
Que gran ayuda sería contar con todo la información bien almacenada y organizada para poder para más tarde analizarla y obtener insights valiosos para el negocio.
Voy a comenzar en Data Analyst y luego voy a seguir aprendiendo.
JERARQUÍA DE NECESIDADES DE DATA SCIENCE
1. Etapa de recolección de los datos: Los datos pueden venir de diversas fuentes dependiendo de la industria (páginas web, sensores, instrumentación…)
2. Etapa de Almacenamiento/Movimiento: Los datos se deben movilizar y almacenar a través de una infraestructura o un pipeline.
3. Etapa de Exploración y transformación: Se deben limpiar los datos, detectar errores y anomalías y prepararlos para un posterior análisis.
4. Etapa de Análisis: Se buscan métricas, segmentaciones, agregaciones y distintas características para convertir los datos en información y posteriormente en conocimiento.
5. Etapa de IA: Se generan predicciones y se visualiza el futuro de la organización.
Les comparto mis apuntes
Machine Engineer es la ruta que seguire.
Roles de la industria:
Data science
Data analysis
Data engineer
Machín learning engineer.
Data engineer:
Ingesta de datos
Validación de datos
Preparación de datos
Recolección, transformación, limpieza y almacenamiento de base de datos
Data Scientist:
Primeras personas en crear modelos de ML e interactuar con los modelos. Entrenan, evalúan y validan los modelos.
Data analyst:
Toman los datos de las base de datos que los data engineer prepararon y los analizan para encontrar información de valor.
Insights que las personas del negocio puedan usar para tomar estrategias y acciones.
ML Engineer:
Trabaja de la mano con data scientist. Robustece el modelo y pone en producción. Despliega el modelo con ayuda de developers para que funcione en una aplicación y puedan ser utilizados en una interfaz por usuarios.
Developers: Ingenieros de software que trabajan con ML engineers.
Research scientis: Estudia nuevos algoritmos y nuevos usos de IA.
Resumen: El proceso tanto de data science (y si se quiere ir más allá con inteligencia artificial) tienen unos pasos delimitados; recolección, almacenamiento, transformación, agregación, aprendizaje y producción. Cada etapa superior es dependiente de la anterior. Los roles de data science se caracterizan por gestionar cada asunto. Data engineer; recolección y limpieza de datos, data scientist; creación de un modelo, data analyst; extrae información de valor de las bases datos para ayudar a los miembros de la organización tomar decisiones y ML engineer se encarga con ayuda de un ingeniero de software mejorar y robustecer un modelo para lanzarlo a producción. El research scientist busca nuevos algoritmos y formas de implementar inteligencia artificial
Yo vengo por el ML engineer
Data Analyst y Data Scientist me interesan 😁
Como complemento a esta clase, pueden ver este video de un Data Scientist que explica a detalle su función y despeja muchas dudas. Tienen que verlo!
https://www.youtube.com/watch?v=xC-c7E5PK0Y
MACHINE LEARNIIIING A TOPEEEEEEE!!!
Vengo y mi objetivo es formarme como Data Scientist
Me gustatia el rol de ML engineer ya que trabajan a la mano con developer y buenp yo soy fullstack web developer asi que complemento mi profesion y no estoy iniciando una profesion nueva hahahah
Me interesa mucho el llegar a construir modelos de predicción de eventos, esto lo haría por ejemplo para evaluar riesgos en inversiones financieras.
Sin embargo para llegar a esos niveles, entiendo que debería empezar como Data engineer para aprender a tener datos confiables y “limpios” para tener como resultado información de valor. Luego de esto pasaría a Data Analyst porque me interesa el llevar esto a los negocios para toma de decisiones y de estrategias empresariales, teniendo en cuenta que las pymes necesitarán mucho de esto para diferenciarse, veo esto como un futuro negocio.
Data Engineer y Data Analyst, son los roles que me interesan!!
Yo me ubico actualmente como data analys, estoy en contacto con el negocio, aunque me inclino mas por la parte developer y de ML me parece interesante ser un enlace entre los datos y el diseño web
ROLES
Data analyst primero, a ver si luegome animo a más
Empezare con Data Analyst 😄
Me ha gustado mucho el data science, pero creo que mejor seria empezar por el data Analyst para empezar a entender este gran mundo de los datos. ¿ que creen ustedes?
Comenzaré como Data Analyst y despúes trataré de llevarlo a Data Scientist
Unir la piramide con los pasos es muy interesante!
Por que se va observando los perfiles a tener para hacer ciencia de datos.
Estoy entre Data Analyst y Data Scientist, creo que voy a comenzar primero con Data Analyst y de ahí seguir hacia Data Scientist
La ciencia de datos será el futuro, pero necesitamos ver lo a nivel global
Machine Learning Engineer es mi camino a seguir.
Pasos y roles del flujo de trabajo de Data Science
Me quedo con el rol de Data Scientis!
Muchas gracias por explicarlo claramente
Me parece muy interesante el Data analyst.
Vamos a empezar con Data Analyst 😃
Aunque los nombres de los cargos han sido diferentes, según la funcionalidad he tenido la experiencia de ser Data Engineer y Data Analyst, no me disgusta ninguna pero me parece muy interesante participar en el Rol de ML Engineer
super
Me gusta la parte de Data engineer para limpiar los datos y Data Analysut para analizarlos
Me gustaría iniciar con el data Engineer , porque me gusta el tema de curar los datos para así tener buenos modelos de análisis, igual un Reseach Scientist, ese role te mantiene en constante cambio.
Le voy a caer al ML engineer o al Data engineer
Roles y pasos en el flujo de trabajo de data science.
Jerarquía de necesidades del data science.
Roles en la industria: equipos de datos e IA.
Muy importante y práctica la clase.
muy interesante:)
quiero aprender a sacar informaciñon de secuenciación de tumores (trascriptomica, genomica, metiloma) de pacientes para poder encontrar las suceptibilidades de sus tumores y poder generar reportes de medicina de presicion que apunte a encontrar cual es el mejor tratamiento individualizado… seria como un data scientist en bioinformatica. 😃
a mi me gustaría ser data scientist y a ustedes?
que les gustaria ser
🤗 cuando le tienes que hacer de todo para sacar adelante tu proyecto con tus compañeros, ver la beta es fantastico 😎
Data scientist, es lo que quiero 😃
Antes queria ser ML engineer! pero ahora quiero ser Research scientist :heart
Quiero ser un data science pero antes sere data Analist
Me gustaría deselvolverme en el rol de Data analyst, ya que siempre he tenido ese gusto y entretenimiento para organizar datos, estructurarlos y analizarlos de tal forma que sea más práctico su entendimiento y así se pueda sacar información valiosa para la toma de decisiones.
Iniciaré con Data Analysis. Iré estudiando y mejorando para ir creciendo.
🤔 Debido a mi background en negocios, creo que me iré por Data Analyst
Data Analyst y Data Scientist sucesivamente. Sigamos aprendiendo
data scientst
En la secuencia de eventos, me parecen súper importantes los roles del data engineer, el data scientist y el ml engineer.
El Data Analyst es por lo que estoy estudiando en la Escuela de Data Science e Inteligencia Artficial pero, como en Platzi nunca se para de aprender, después del Data Analyst seguiré con las otras rutas. Mi meta es estudiar toda la escuela de Data Science.
La jerarquía de las necesidades de data science: 1. Recolección 2. Movimiento/Almacenamiento 3. Exploración/Transformación 4. Agregaciones /Etiquetados 5. Aprendizaje/ Optimización
**_La jerarquía de necesidades de data science
empezamos desde lo mas básico_**
Roles en el Data Science
Elegiría el rol de Data Scientist al poder implementar los diferentes modelos de Machine Learning como los que encontré investigando más.
tomado de: https://www.aprendemachinelearning.com/7-pasos-machine-learning-construir-maquina/
Interesante el flujo de trabajo explicado ya que permite conocer de acuerdo al feeling donde queremos especializarnos
data analyst
Poe fin comprendí, los perfiles no necesariamente tienen que trabajar sobre un mismo proyecto, uno después del otro:
Luego del data engineer pueden trabajar en simultaneo el data scientist para predecir y el data analyst para tomar decisiones en la actualidad.
Por otro lado el machine learning engineer no es un perfil que si o si tenga que estar en una empresa… pero de estar se encargaría de de validar el modelo del data scientist, perfeccionarlo y luego si reunirse con la parte de software para que salga a producción
Me parece mas interesante y me gustaría especializarme en Data analyst.
Hay 3 roles que me llamaron mucho la atención ya que son los que de un modo indirecto he entrado en interacción con ellos los cuales son:
-Data Engineer
-Developer
-Data Analyst
Hola yo quiero ser Data Analyst, quiero ser capaz de dar consultoria a pequeñas empresas para que puedan tomar decisiones bien informadas haciendo uso de los datos y de la tecnologia disponible.
_no soy ingeniero,pero me gustaria aplicar en esa rama y en la de negocios _
Interesante información y genial que se incluyan gráficos. Les sugiero revisar los enlaces propuestos al final del texto.
Pues creo que empezaria con data analyst y de ahi con data science para luego tomar machine learning y deep learning digo para asegurar bases pero machines y deep learnig me interesan mas pero con las bases de data analyst y data science creo que si lo logro.
¿Debería ir a Data Analyst? Me gusta ver gráficas que cuenten información.
Por mi formación académica y en el área laboral en la que me desempeño creo que algo entre Data Analyst y Data Scientist por el momento está mas que bien.
En la industria de la inteligencia artificial y la ciencia de datos, suelen trabajar equipos multidisciplinarios que incluyen personas con diferentes habilidades y conocimientos. Algunos de los roles más comunes en estos equipos incluyen:
Ingeniero en aprendizaje automático: Diseña y desarrolla sistemas de aprendizaje automático para mejorar el rendimiento de las computadoras.
Científico de datos: Utiliza técnicas de análisis de datos para extraer información valiosa de conjuntos de datos masivos.
Investigador en inteligencia artificial: Realiza investigaciones en áreas como el aprendizaje profundo y el procesamiento del lenguaje natural para desarrollar nuevas técnicas de IA.
Analista de datos: Utiliza herramientas de análisis de datos para ayudar a las empresas a tomar decisiones basadas en datos.
Consultor en inteligencia artificial: Ayuda a las empresas a implementar soluciones de IA en sus operaciones diarias.
En general, los equipos de datos e inteligencia artificial suelen estar formados por una variedad de profesionales con habilidades en diferentes áreas, como la ciencia de la computación, las matemáticas y la estadística. Los miembros del equipo trabajan juntos para desarrollar y mejorar sistemas de inteligencia artificial y utilizar técnicas de ciencia de datos para extraer información valiosa de conjuntos de datos.
Soy nueva en esto, así que primero quiero enfocarme en Data Analyst. La verdad que todos los roles son muy interesantes, yo creo que con el transcurso del tiempo y a medida que avance en mis aprendizajes pueda continuar con Data Scientist.
ml developer
En definitiva me gustaría desempeñarme en el rol de Data Analyst ya que por mi experiencia y profesión estoy más enfocada a areas de toma de decisiones para logro de resultados.
Sin embargo todos los roles son muy interesantes y estoy dispuesta a aprender de todos sé que esto complementara y afianzara todo lo aprendido.
Data analyst, luego donde me lleve el camino, para de aprender no es una opcion 😃
Data Science hierarchy of needs (Jerarquía de necesidades de Data Science).
Roles en la industria Data Science
Quiero ser Data Analyst!
Deseo tener un perfil como data analyst porque me gusta y además le veo mucha utilidad en lo laboral. Me encanta investigar, solucionar problemas y mejorar los procesos.
Roles de la industria:
Pasos y roles en el flujo de trabajo
-----Ingenieria-----
Data engineer
Ingesta de datos, validacion y preparacion de datos
Data scientist
Entrenamiento del modelo
2.1 ML enginner —> Dev (Quien despliega el modelo)
Evaluacion y validacion del modelo
-----Negocio-----
El rol que me gustaría desempeñarme seria Research Scientist.
Data Analyst
Durante mi desarrollo profesional como economista siempre he tenido curiosidad por expresar mis ideas a través de la información que puedo obtener de los datos, por esta razón me interesa el rol de data analyst explicado en el esquema de pasos y roles mostrado en esta clase.
Yo empezaría por Data Analyst, luego pensaría en Data Scientist
la utilizacion y conocimiento de todos los roles y gerarquias de la inteligencia artificial son importantes y hay que conocerlos.
Investigaré sobre Data engineer y sobre los derivados de esta
El data analyst junto con el research scientist serian para mi lo roles más interesantes. O por los que empezar y después seguir avanzando y creciendo.
en lo personal me parece mas interesante el research scientist, sugun entendi es el que le da la direccion al uso de los datos
Siento miedo al ver tan claramente que quiero ser Data Analyst ❤️
Mi meta es ser un data analyst y de ahí buscar otras opciones.
voy descubirendo nueva informacion
Empezando mi ruta como ML engeneer banda, animos!
Resumen propuesto=> Diferencia en
Data analyst, Research scientist, ml engineer, data scientist y data engineer.
Creo que me identifico entre un data scientist y un ml engineer
Basado en el video de la clase, y en ambos gráficos, estas fueron mis notas.
Recolección: Es el proceso de recolectar la información/datos que ocurren dentro de los procesos que realizan los colaboradores de la empresa.
**Movimiento / Almacenamiento: **Es almacenar los datos recolectados en infraestructuras de software seguras antes pérdidas de datos. Los datos podrían ser estructurados (es decir que ya están ordenados y organizados), o bien datos no estructurados que estén distribuidos aleatoriamente.
**Exploración y Transformación: **Es la fase de limpiar los datos, llenar datos faltantes, eliminar los datos que no se puedan limpiar porque no se puede conseguir la data histórica, encontrar y solucionar datos que tengan anomalías, estructurar los datos de manera óptima que facilite el análisis posterior.
**Agregaciones/etiquetado: **Consiste en los procesos de análisis de la información, puede aplicarse el establecer métricas numéricas para clasificar una actividad o proceso, la segmentación de datos, agregaciones y otras características para comenzar el entrenamiento de datos. En esta fase es donde se crean dashboard con gráficas y tablas para mostrar los resultados del análisis y que así la empresa tome decisiones importantes basadas en ese análisis.
Aprendizaje / Automatización: En esta fase ya se comienza a implementar desde pequeños algoritmos simples de Machines Learning, realizando experimentaciones con los datos analizados, consiguiendo predicciones, evaluándolas, hasta el punto donde se puede implementar Deep Learning para crear software que automatice estas tareas para facilitar el análisis, y que poco a poco se retroalimente de toda esta información mientras la empresa vaya creciendo con más data.
**Pasos y Roles de trabajo de Data Science (Design Patterns in Machine Learning)
**
**Data Engineer: **Es parte del equipo de ingeniería. Es el encargado de automatizar la extracción, la transformación (validación y preparación), y la carga de datos al sistema o infraestructura indicada por el Data Scientist, comúnmente una base de datos.
**Data Scientist: **Es parte del equipo de ingeniería. Es el encargado de crear el modelo algorítmico de entrenamiento, y es el primero que lo perfecciona. Ejecuta el análisis de los datos que el data engineer le proveyó, junto con la información del presente que le brinda el Data Analyst, para encontrar las predicciones del futuro implementando Machine Learning, y así obtener información valiosa que ayudará a la organización. En síntesis, el Data Scientist estudia el presente y el futuro de una organización. El Data Scientis tiene comunicación directa con todos los integrantes del equipo (data engineer, data analyst, research scientist, machine learning engineer, e incluso con el ingeniero de software).
**Data Analyst: **Es parte del equipo de negocio, se encarga de estudiar el presente de la organización, investiga información de las distintas áreas del negocio, analizando los datos que proveyó el Data Engineer. Al encontrar información valiosa que implique en la mejora de procesos, o en la creación de nuevas estrategias para lograr los objetivos de la organización, le comunica esta información al Data Scientist. En síntesis, el Data Analyst solamente estudia el presente de la organización.
**Research Scientist: **Es parte del equipo de negocio. Es el encargado de investigar nuevos algoritmos de Machine Learning que se puedan implementar en la organización para mejorar los procesos de análisis, esta información le es brindada al Data Scientist.
ML Engineer: Es parte del equipo de ingeniería. Se encarga de ayudar al Data Scientist a la evaluación y validación del modelo de Machine Learning, específicamente para robustecer el modelo. Tiene comunicación directa con el ingeniero de software para asegurar que se implemente correctamente el modelo de Machine Learning en el producto de software.
**Developer: **Es parte del equipo de ingeniería, es el encargado de crear y actualizar el producto de software, adaptado al modelo de Machine Learning que el Data Scientist y el Machine Learning Engineer les proporcione.
Interesante los roles que existen en data science
¡Me interesa el camino del rol ML Engineer!
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.