2

¿Cómo empezar en el mundo de los datos?

Al descubrir que quería aprender ciencia de datos y profundizar mi conocimiento en este campo, me di la tarea de investigar los cursos que se encontraban en la escuela y mientras más bajaba más me fascinaba el saber que a lo largo del tiempo podría saber todo eso, aunque empezaron a surgir muchas dudas, por eso comencé por tomar este curso y quiero enseñarte lo que aprendí.

¿Qué es Data Science?

Ciencia de datos o data science en inglés, es un proceso en el cual se busca tomar desiciones basadas en datos, crear estrategias de negocio y productos de software inteligentes y funcionales, en otras palabras cuando se tienen datos puedes usarlos para tu beneficio, el de tu empresa, organización o cliente.
Este proceso consiste en obtener datos, transformarlos y limpiarlos, usar modelos de ML e integrar datos e IA a productos de software.

¿Qúe es Inteligencia Artificial?

También conocida como Artificial Intelligence o AI por sus siglas en inglés, son algoritmos (serie de pasos para realizar algun cómputo, procesar datos o resolver problemas) que emulan la cognición humana y encuentran patrones en grandes cantidades de datos o big data.

Algunas de sus ramas son:

  • Machine Learning.
  • Deep Learning.
  • RPA (Robotic Process Automation).
  • Visión artificial.
  • Procesamiento de lenguaje natural.
  • Robótica.

Inteligencia Artificial NO es lo mismo que Data Science, IA es una de las múltiples herramientas que se utlizan en el proceso de la ciencia de datos y no siempre es necesario usarla. Descubre nuestra ruta de cursos para ser data scientist.

inteligencia-artificial-770x400.jpg

¿Qué es Big Data?

Hay una definición que me gustó mucho y es que cuando excel se bloquea ya tenemos big data, no hay una cantidad exacta para poder decir que lo es pero lo que sabemos es que tiene que ser una cantidad masiva de datos y que cumpla con las 5Vs, que son:

1.- Volúmen: Como la palabra lo dice, que ocupe un gran espacio.
2.- Valor: Si los datos no aportan algun valor entonces no sirven.
3.- Variedad Tienen que venir de múltiples fuentes para poder ser considerados como big data.
4.- Velocidad: Estos datos son producidos en tiempo real y deben ser procesados a la par.
5.- Veracidad: Deben ser datos de calidad y confianza.

what-is-big-data.png

Jerarquía de necesidades de Data Science

Existe una jerarqía por una razón, si no se realiza un nivel no podrás realizar el siguiente, una forma más sencilla de verlo es como si fueran una serie de pasos y son los siguentes:

  • Recolección
  • Movimiento/Almacenamiento
  • Exploración/Transformación
  • Agregaciónes/Etiquetado
  • Aprendizaje/Automatización

Roles de la industria

Existen 4 principales roles que se sitúan en los diferentes pasos del proceso de data science, los cuales son:

  • Data engineer
    Su principal funcion consiste en extraer datos que no han sido procesados, los toma, limpia, procesa y almacena en bases de datos, se habla mucho de que son los que se “ensuician las manos” al ser los que preparan y nos dejan todo ordenado y completo para su análisis.
  • Data Analyst
    Extrae datos recolectados, los analiza y reporta sus resultados.
    El propósito de este rol es utilizar los datos para poder obtener insighs o información de valor, también se centran más en el presente y pasado.
  • Data Scientist
    Su propósito es tomar desiciones basadas en datos y crear productos de software.
    Lo que hace es extraer información ya sea interna o externa a la organización, los utiliza para crear servicios de ML y encontrar insighs.
    Una duda muy común es saber la <ins>diferencia</ins> entre el rol de Data Analyst y Data Scientist y es que el Data Scientist utiliza más IA que el Data Analyst.
  • Machine Learning Engineer
    Es el que recibe el modelo creado por el Data Scientist para poder despegarlo a producción, en otras palabras es el rol final en el proceso de Data Science que recibe el producto (modelo de ML) y lo pone en funcionamiento.
data-science-1400x933.jpg

Por último te invito a que tomes el curso para que puedas profundizar tus conocimientos y asi estes listo para emprender tu camino en el fascinante mundo de los datos, muchísima suerte y nunca pares de aprender.

Escribe tu comentario
+ 2