Seguramente te has preguntado qué hace un data scientist o científico de datos. La ruta de aprendizaje de Big Data y Data Science de Platzi es el primer paso para aprender ciencia de datos y adentrarte en un mundo con muchísimas oportunidades laborales. A continuación te contamos los diferentes enfoques de esta área y qué funciones tiene cada uno de sus profesionales:
Funciones: Se encarga de tomar los datos disponibles y procesarlos de tal forma que se puedan tomar mejores decisiones y mejorar los procesos de la compañía. Generalmente esta persona se encarga de limpiar y transformar bases de datos para luego utilizarlas en el entrenamiento y evaluación de distintos algoritmos de machine learning.
Habilidades: Programación, visualización y comunicación de datos, análisis estadístico, Machine Learning.
Tu ruta de estudios: Debes tener bases sólidas en matemáticas, álgebra lineal, estadística y ciencias de la computación. Igualmente, debes tener buenas bases de ingeniería de software y programación, incluyendo conocimientos en algoritmos y manejo de bases de datos (en especial SQL). También debes entender y poder implementar algoritmos de machine learning.
Funciones: Se encarga de crear y mantener la infraestructura de software que permite el procesamiento de grandes conjuntos de datos (Big Data). Un ingeniero o ingeniera de datos a menudo trabaja como parte de un equipo de Data Science y proporciona datos limpios y listos para usar a los científicos de datos.
Habilidades: Programación, arquitectura de software, bases de datos, Data Warehousing, Hadoop, Spark, AWS, operating systems.
Tu ruta de estudios: Aprende sobre ingeniería de datos, aprende un lenguaje de programación general (Java, C++, Python) y aprende al menos un lenguaje de scripting como Bash. También, adquiere conocimientos sólidos en bases de datos, especialmente SQL. Entiende conceptos sobre computación distribuida y practica tus habilidades en Spark y/o Hadoop.
Funciones: Recopilación de datos y preparación para el análisis y la resolución de preguntas. Análisis exploratorio de la información por medio de gráficas y estadísticas descriptivas. Interpretación de los datos, análisis de resultados y reporte de resultados.
Habilidades: Limpieza de datos, análisis exploratorio de datos, visualización y reporte de resultados y minería de datos.
Tu ruta de estudios: Aprende a usar algún software de análisis estadístico como SAS, SPSS, STATA, Excel, entre otros. Practica tus habilidades con herramientas de visualización de datos como Tableau, PowerBI y Qlik. Aprende sobre minería de datos y nociones de machine learning.
Funciones: Se encarga de crear las bases de datos de tu empresa. Su función principal es diseñar y planear una arquitectura de datos eficiente que cumpla con los requisitos que su compañía necesita en términos de acceso y procesamiento de información.
Habilidades: Soluciones de Data Warehousing, conocimientos profundos de arquitectura de bases de datos, habilidades en extracción, transformación y carga de información (ETL), desarrollo de software y modelación de datos.
Tu ruta de estudios: Aprende sobre ingeniería de bases de datos, aprende un lenguaje de programación general (Java, C++, Python). También, adquiere conocimientos sólidos en bases de datos, de tipo relacional (SQL) y no relacionales (MongoDB, por ejemplo). Entiende conceptos sobre computación distribuida y practica tus habilidades en Spark y/o Hadoop.
Funciones: Recopilación de datos y preparación para el análisis y la resolución de preguntas en un contexto de negocio. Análisis exploratorio de la información por medio de gráficas y estadísticas descriptivas. Interpretación de los datos, análisis de resultados y reporte de resultados. Habilidades para hablar en público y de crear historias a partir de datos (data storytelling).
Habilidades: Limpieza de datos, análisis exploratorio de datos, visualización y reporte de resultados y minería de datos. Amplio conocimiento del sector y/o industria. Capacidad de innovación estratégica a partir de análisis de datos.
Tu ruta de estudios: Aprende a usar algún software de análisis estadístico como SAS, SPSS, STATA, Excel, entre otros. Practica tus habilidades con herramientas de visualización de datos como Tableau, PowerBI y Qlik. Aprende sobre minería de datos y nociones de machine learning. Conoce a fondo tu negocio y comienza a resolver problema de tu organización teniendo en cuenta tu experiencia y el contexto de la industria.
Ahora que conoces todas las posibilidades que te ofrece la ciencia de datos, anímate a tomar esta ruta de aprendizaje en Platzi y conviérte en un profesional de esta área.
Ciencia de Datos: Área de conocimiento que busca agregar valor a los datos por medio de la confluencia de análisis estadísticos, métodos computacionales y visualización de información.
Big Data: Conjunto de información cuya longitud (número de registros), variedad (número de características por cada registro) y frecuencia (ritmo con el cual se actualiza la información) impiden que los métodos de procesamiento de datos convencionales sean suficientes para su manejo.
Bases de datos: Las bases de datos son contenedores o repositorios digitales en los que se almacenan de manera estructurada y organizada datos que comparten un mismo contexto para su posterior procesamiento y consulta.
Keyword: Se refiere a la palabra clave que atrae al mayor número de seguidores a través de buscadores. Cuando tienes claro cuáles son las keywords que definen tu contenido puedes posicionarlo de manera orgánica o paga lo cual influye en el número de búsquedas y las conversiones.
Machine Learning: Rama de la inteligencia artificial que se encarga del estudio de métodos automatizados por medio de algoritmos y estadística, para generar modelos matemáticos que permitan resolver tareas de forma tal que sea el software quien descifre por sí mismo como resolver dicho problema.