Contenido del curso
Data Analyst
Data Scientist
Data Engineer
Ser profesional en el mundo de los datos y machine learning
Qué es Data Science y cómo funciona
Resumen
Data Science es el proceso de usar datos para obtener insights valiosos que permiten tomar mejores decisiones de negocio y construir productos basados en inteligencia artificial. Si estás explorando esta disciplina, aquí entenderás en qué consiste, cuáles son sus pasos y qué áreas de conocimiento necesitas dominar para empezar.
¿Qué es Data Science y para qué sirve?
Data Science es un proceso que transforma datos en conocimiento útil. Su valor está en que conecta información cruda con decisiones reales que mueven a una empresa.
Tiene dos objetivos principales que conviene tener claros desde el inicio:
- Tomar decisiones y crear estrategias de negocio para maximizar el potencial de una compañía.
- Crear productos basados en inteligencia artificial que lleguen al usuario final.
¿Qué es Data Science en pocas palabras? Es el proceso de recolectar, limpiar y analizar datos para obtener insights que ayuden a decidir mejor o a construir productos con IA.
¿Cuáles son los pasos del proceso de Data Science?
Como todo proceso, Data Science sigue una secuencia ordenada. Cada paso se apoya en el anterior y, si uno falla, el resultado final pierde fuerza.
¿Cómo se recolectan, limpian y analizan los datos?
Los primeros tres pasos son la base del trabajo y, para muchas empresas, suficientes para responder sus preguntas con datos históricos.
- Recolectar datos a través de mediciones directas, encuestas o fuentes como Internet [00:34].
- Transformar y limpiar los datos, porque suelen llegar incompletos o en formatos incorrectos [00:48].
- Explorar y analizar los datos para identificar patrones, tendencias y insights que se presentan a los stakeholders mediante visualizaciones o reportes claros [00:56].
Hasta aquí ya tienes una historia que contar con datos. Y esto, para muchos equipos, ya cambia la forma de operar el negocio.
¿Cómo se usan los modelos de machine learning en Data Science?
Cuando una empresa necesita ir más allá de lo histórico, el proceso suma dos pasos enfocados en predicción y producto.
- Usar modelos de machine learning para predecir información a partir de los datos disponibles [01:20].
- Escalar esos modelos y ponerlos a disposición del usuario final mediante productos de software basados en inteligencia artificial [01:30].
¿Qué hace un modelo de machine learning en este proceso? Aprende de datos pasados para predecir resultados futuros, como demanda, riesgo o comportamiento de usuarios.
El alcance del proceso depende del proyecto y de la compañía. No todas las empresas llegan al paso cinco, y eso está bien.
¿Por qué Data Science se basa en el método científico?
El paso más importante no es técnico: es tener muy clara la pregunta o el caso de negocio que quieres resolver. Sin esa pregunta, los datos no llevan a ningún lado.
Por eso decimos que Data Science se apoya en el método científico. Defines una pregunta, recolectas evidencia, analizas y validas. Y además es un ciclo, porque vas a regresar a cada paso según cambien las necesidades de la empresa.
¿Por dónde empieza un proyecto de Data Science? Por la pregunta de negocio. Primero defines qué quieres responder y después eliges los datos y métodos adecuados.
¿Qué áreas de conocimiento necesitas para trabajar en Data Science?
Data Science vive en la intersección de tres áreas: ciencias de la computación, conocimiento de dominio y matemáticas. La profundidad con la que aprendes cada una depende del rol que quieras tomar.
Para cualquier persona que trabaje con datos, hay un piso mínimo recomendable:
- En ciencias de la computación, aprender a programar.
- En matemáticas, dominar estadística descriptiva y, por ejemplo, las medidas de tendencia central.
- En conocimiento de industria, mantenerte actualizado del sector donde quieres trabajar, ya sea entretenimiento, educación, finanzas u otro.
La estadística descriptiva te da herramientas para resumir un conjunto de datos: promedios, medianas y modas que cuentan, en pocos números, cómo se comporta tu información. El conocimiento de dominio es el que te permite traducir esos números en decisiones que tienen sentido para el negocio.
Y aquí viene lo interesante: nadie domina las tres áreas al mismo nivel. Tu perfil se define por dónde decides poner más peso. ¿En cuál de las tres te gustaría profundizar primero? Cuéntame en los comentarios.