76

Roles que puedes desempeñar en Ciencia de Datos

15392Puntos

hace 4 años

Términos como Data Science, Inteligencia Artificial, redes neuronales, Big Data, Machine Learning y demás han estado en boca de todos los segmentos económicos durante últimos años. Y no es para menos, actualmente economías muy diversas tienen en común el uso de los datos para traer beneficios ya sean económicos o estratégicos.

Aunque para algunos las ciencias de datos suenan a ciencia ficción, la realidad es que su aplicación es más común de lo que crees. Por ejemplo en la industria de alimentos, se usan las ciencias de datos para optimizar el manejo de insumo en el procesamiento de alimentos. La industria cinematográfica tiene un gran aliado con los datos porque conocen nuestros gustos y pueden crear contenidos similares.

Por su lado los bancos y la empresas de seguros crean modelos de evaluación de riesgos, detección de fraude o creación de nuevos productos financieros orientados a mercados específicos; y por supuesto, la industria tecnológica, en donde distintas startups dejan su crecimiento en manos de los datos.

Ahora bien, si el Data Science es la disciplina encargada de crear valor con los datos, ser data scientist (científico de datos) implica estar encargado de llevar esto a cabo con fuertes conocimientos en programación, conocimiento del negocio y habilidades matemáticas.

A menudo se dice que un data scientist debe tener conocimientos en SQL, Python para data science, R, estadística, álgebra, cálculo multivariable, web scraping, docker, computación en la nube, machine learning, deep learning, visualización de datos, pensamiento estrategico, etc. En resumen, si un data scientist luchara contra el crimen, sería algo asi como Batman.

batman4.jpg

A medida que crecía la demanda, las industrias empezaron a notar que conseguir una persona con fuertes conocimientos en matematicas, programación y negocio era una tarea demasiado complicada. ¿Dónde conseguir un perfil con estas características? Primero, conozcamos los roles y características de los perfiles en ciencias de datos.

Roles de un "data scientist"

Está bien saber todo lo que mencionamos anteriormente pero la realidad en el campo laboral es que las empresas empezaron a aprender que se necesitan personas que sepan solo una parte. Como consecuencia se han ido consolidando distintas disciplinas o roles para solucionar los problemas a la medida.

Estos roles están ligados a las 3 grandes ramas que trabaja el data scientist:

Matemáticas, Programación y Manejo de negocio (Encontrarás al menos 50 versiones de este diagrama de venn)

venn.png

Data Analysts o Analistas de Datos

Un analista de datos es la persona que a través del entendimiento e interpretación de datos optimiza la toma de decisiones y estrategias de una empresa.

Consideramos que el perfil de business intelligence (inteligencia de negocios) está sobrepuesto en el perfil del analista. Las personas más afines con este perfil provienen de carreras como economía y ciencias puras como estadística o matemáticas.

Los analistas de datos tienen las habilidades suficientes para extraer y consultar datos. Suelen usar lenguajes tipo SQL y python para procesar y tabular datos. Sus bases en matemáticas y estadística son muy sólidas, esto permite que sus análisis exploratorios y predictivos sean muy asertivos, incluso mejor que aquellos perfiles especializados solo en inteligencia de negocios.

Los analistas de datos dominan diferentes metodologías de análisis y minado de datos incluyendo métodos básicos de ML (Machine Learning) para extraer insights (ideas importantes) y usarlos en toma de decisiones.

Lee también: diferencias entre inteligencia artificial y data science.

La presentación de los resultados encontrados es una área dónde la capacidad creativa y de visualización es extremadamente valorada; en general la visualización abarca un área densa en dónde simplificar las conclusiones e interpretarlas para crear reportes se vuelve esencial para la toma de decisiones de cualquier compañía.

En esta línea profesional la máxima habilidad es aquella de transformar la información para hacerla comprensible y fácil de entender, en sí ser un excelente “storyteller”. De esta forma en negocios los datos se transforman en la mayor autoridad a la hora de tomar decisiones, para muchos analistas el "storytelling" se considera un arte de la persuasión en época de la transformación digital.

Data Engineers o Ingenieros de Datos

Un perfil afín para aquellas personas que tienen disciplinas base como ingeniería informática o de software es el de data engineer. El ingeniero de datos es una persona con fuertes conocimientos en arquitectura de datos, programación estructurada, programación orientada a objetos, manejo de bases de datos SQL y NoSQL, BI, manejo de cloud computing (PaaS,SaaS), modelamiento en bases de datos transaccionales o data warehouse, manejo de ETL, y procesamiento de grandes volúmenes de datos con big data.Esta persona es la encargada de la recolección, filtrado, limpieza, persistencia y presentación de los distintos repositorios de datos útiles para la organización.

Usando distintas técnicas el data engineer garantiza el acceso a la información para otros perfiles como ML engineer o data analyst o incluso para alimentar dashboards o distintos canales de presentación de datos y así entregar valor a la organización.

Uno de los retos más grandes de este rol es poder recibir, procesar , almacenar y entregar la basta cantidad de datos que se procesan actualmente en esta economía, cabe resaltar que esta cantidad tiene un crecimiento exponencial año tras año y para ello el data engineer debe recurrir a técnicas de procesamiento de Big data y modelos como map reduce para sacarle el mayor provecho a los datos.

La tarea de un data engineer en el mundo de data science es vital, en cualquier modelo de datos o análisis existe un dicho, “Si basura entra, basura sale” y es el trabajo del data engineer garantizar que el insumo de datos para cualquier análisis tenga desde su origen el mayor valor posible; mejorar día a día los modelos de procesamiento de datos es una tarea de inmenso valor para la humanidad. Ejemplo de ello son las redes neuronales, este concepto data de los años 50, pero no fue hasta que la capacidad de procesamiento llegó a niveles como los que conocemos actualmente que se logró aprovechar el valor de esta tecnología y aplicarlo en diversas áreas de la sociedad.

Machine Learning Engineers (también conocidos como ML Engineers)

Este es probablemente el perfil más afín para personas que vienen de la academia (especialmente de las ciencias naturales como Matemáticas y Física o de carreras como Ciencias de la computación) y que tienen un conocimiento sólido tanto en matemáticas como en programación, de esta manera tiene la capacidad no solo de consumir modelos de Machine Learning pre-construidos sino también de entender la manera como el modelo funciona por dentro.

Los profesionales más avanzados dentro de este perfil eventualmente tienen la capacidad de proponer sus propios modelos y crear nuevos paradigmas de modelamiento y algoritmos de aprendizaje.

En la industria existen muchos profesionales que son buenos implementando modelos y entrenando redes neuronales para tareas específicas, pero caen en el problema de que no siempre tienen claro porque funciona un modelo para situaciones específicas, esto ha creado una creciente preocupación en la industria porque no se pueden interpretar los resultados de un modelo con el detalle que una decisión de negocio requiere.

Es por eso, que este perfil debe ser para alguien que tiene tanto la capacidad de implementar como de entender un modelo de Machine Learning. Un Machine Learning engineer avanzado tiene un conocimiento suficiente de Deep Learning o aprendizaje profundo que es un conjunto de algoritmos de Machine Learning que están basados en arquitecturas de Redes Neuronales.

¿Que puede hacer un ML Engineer en la industria? En general, un profesional con este perfil puede diseñar y construir algoritmos con la capacidad de identificar patrones a partir de ciertos conjuntos de datos, patrones que pueden ser usados para generar recomendaciones como sucede con Netflix o Spotify, para clasificar objetos en imágenes cómo se usa en los sistemas de vigilancia de hoy en día, o incluso para identificar ideas principales o significados en cadenas de texto, como sucede con los chatbots o asistentes virtuales tipo Siri o Alexa.

Dentro de este perfil, el Deep Learning es una de las áreas de conocimiento más atractivas por los recientes avances que se han logrado en materia de investigación dirigida a inteligencia artificial. Los avances en esta área han permitido construir sistemas de navegación para autos autónomos, modelos de predicción en Economía y finanzas mucho más precisos y versátiles, algoritmos que pueden identificar tumores malignos en imágenes diagnósticas, sistemas de traducción automáticos o que convierten voz a texto y viceversa.

Aún más, las arquitecturas de redes neuronales más sofisticadas y recientes son capaces de crear música, texto, imágenes y videos que parecen reales, a un nivel que incluso ha generado preocupaciones respecto a las implicaciones éticas de estos desarrollos.

Adáptate al mercado aprendiendo de Ciencias de Datos

Data science es un tema en auge, más y más segmentos de negocio en la economía mundial están adoptando estrategias basadas en datos por lo tanto la demanda de los perfiles antes mencionados sigue creciendo y existen muy pocas personas que quieran afrontar los retos que exige convertirte en un data scientist o alguno de sus sub roles, por fortuna en Platzi tenemos lo necesario para ayudarte a iniciar este camino, así que mira hacia el futuro y nunca pares de aprender.

Descubre nuestra Escuela para construir una carrera online en ciencia de datos

Estos son los cursos que te recomiendo seguir en Platzi basados en los roles:

Data Engineer:

Fundamentos de Bases de Datos - https://platzi.com/clases/bd/

Curso de PostgreSQL Aplicado a Ciencia de Datos - https://platzi.com/clases/postgresql-datos/

Curso de Ingeniería de Datos con Python - https://platzi.com/clases/ingenieria-datos/

Machine Learning Engineer:

Curso de Fundamentos de Estadística y Análisis de Datos con Python - https://platzi.com/clases/estadistica-python/

Curso de Álgebra Lineal Aplicada para Machine Learning - https://platzi.com/clases/algebra-ml/

Curso de Machine Learning Aplicado con Python - https://platzi.com/clases/scikit/

Data Analyst:

Curso de Introducción a Business Intelligence con Power BI - https://platzi.com/clases/business-intelligence/

Curso de Introducción al Pensamiento Probabilístico - https://platzi.com/clases/probabilistica/

Curso de Storytelling - https://platzi.com/clases/storytelling/

Cuéntame en los comentarios qué te gustaría aprender sobre ciencias de datos en Platzi o si tienes alguna duda sobre empleabilidad. Recuerda: Nunca Pares De Aprender.

Alarcon7a
Alarcon7a
alarcon7a

15392Puntos

hace 4 años

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
4
229707Puntos

Muchas gracias!!!, No sabia lo interesante que era la ciencia de datos, lo que mas me llama la atención es el Data Analyst, y el Machine Learning Engineer

2
15392Puntos
4 años

Hay muchas salidas en el mercado de los datos esos dos perfiles que dices están siendo muy demandados actualemente

3
8077Puntos

Muchas gracias por el texto, muy interesante, aunque estoy muy interesado en la parte de la programacion , creo que la parte de interpretacion se me da mejor y podria empezar por ahi.
Gracias

2
15392Puntos
4 años

Gracias a ti por participar, data analysts es un perfil muy demandado en este momento y apoya mucha la parte estratégica

1
8077Puntos
4 años

Muchas gracias, segui investigando el perfil de Data analyst y me encanto, seguire con los cursos que mencionas. Muchas gracias , GRAN post.

2
2508Puntos

Informativo e interesante post. Ahora entiendo la importancia de los roles de un “data scientist”.

1
15392Puntos
4 años

Que bueno que te haya sido de ayuda

2
3590Puntos

Muy buen contenido @alarcon7a

2
24636Puntos

Muchas gracias! Yo estoy siguiendo la carrera de Data Science y ya estoy preparando mi perfil como Data Analyst! Creo que pronto haré el curso de Google Data Studio

2
15392Puntos
4 años

Es un muy buen curso, GCP trae muchísimas herramientas para trabajar con datos.

2
21435Puntos

Gracias muy buen post, sería bueno hacer un curso más avanzado de power BI como complementó, ya que el que está actualmente es introductorio, igual con el de R.

1
15392Puntos
4 años

Claro que si, lo tendremos en cuenta!

2
52252Puntos

Nuestra sociedad produce datos a un nivel exorbitante y abrumador. Crear valor con los datos es una necesidad para todas las industrias. Necesitamos transformar la información para hacerla comprensible y fácil de entender.

Existen muchos datos, pero no sabemos usarlos y la Ciencia de Datos es la respuesta. En este momento el activo más importante de las organizaciones de todos los tamaños es la información; más valioso que el oro.

Gracias @alarcon7a por tus recomendaciones, es una excelente ruta de aprendizaje.

1
15392Puntos
4 años

Que bueno que te sirva 😃

2
10170Puntos

Excelente Carlos! Justo lo que andaba buscando justo ahora que inicio mi camino en Ciencia de Datos en Platzi! Tengo 3 años trabajando como analista y cuando supe que había un más allá en esta industria me motivé mucho a estudiar!

3
15392Puntos
4 años

Muchas gracias, y que bueno que quieras ir mas allá, acá estamos para apoyarte 😃

1
2026Puntos

me gustaria aprender cendiencia de datos para predecir los precios de un actico finaciero en los mercados bursatiles y tanbien ayudar en la toma deciciones de impresa aydando tambien a su palneacion estrategica

1
840Puntos

Carlos Andrés, gracias por tu publicación y por darnos más luces a quienes queremos introducirnos en este mundo de los datos

1
15392Puntos
4 años

Que bueno que te sea util … hay todo un mundo detras de los datos

1
6519Puntos

Excelente! Me atrapaste con la referencia de Batman.

1
6875Puntos

Que buen post. Actualmente estoy en proceso de grado como administrador de empresas, en mi ha despertado una pasión por los datos, tanto que he iniciado la carrera de data cience en Platzi.

Crees que mi estudio universitario podrá agregar valor al momento de aplicar a un cargo relacionado con los datos?

Que me recomiendas para mostrar lo que se, si aun no tengo experiencia laboral?

Saludos,

1
15392Puntos
4 años

Claro que si, ademas con la demanda que existe y los cambios en la cultura de muchas empresas el titulo no define en donde te puedes desempeñar, te recomiendo tener un repositorio en github con los proyectos que tengas y que refleje cuanto sabes del tema, en el ambito laboral puedes presentar ese repositorio y tine mucho peso.

2
6875Puntos
4 años

Bueno creo que el curso profesional de github debe ser añadido a mi ruta de aprendizaje de inmediato.

1
18584Puntos

Siempre he visto la Cienza de Datos como algo inalcanzable, quizás sea solo el nombre, pero me pareció interesante este post, sin embargo, considero que es una rama muy dura de la tecnología. 👍👊💥🚀🎖💯🤯👨🏻‍💻

1
15392Puntos
4 años

cada paso lo hace mas alcanzable … el reto esta en nunca parar de aprender 😃

0
36Puntos

Soy de pocos recursos hay alguna forma de ingresar con una beca o algo similar?