Al descubrir que quería aprender ciencia de datos y profundizar mi conocimiento en este campo, me di la tarea de investigar los cursos que se encontraban en la escuela y mientras más bajaba más me fascinaba el saber que a lo largo del tiempo podría saber todo eso, aunque empezaron a surgir muchas dudas, por eso comencé por tomar este curso y quiero enseñarte lo que aprendí.
Ciencia de datos o data science en inglés, es un proceso en el cual se busca tomar desiciones basadas en datos, crear estrategias de negocio y productos de software inteligentes y funcionales, en otras palabras cuando se tienen datos puedes usarlos para tu beneficio, el de tu empresa, organización o cliente.
Este proceso consiste en obtener datos, transformarlos y limpiarlos, usar modelos de ML e integrar datos e IA a productos de software.
También conocida como Artificial Intelligence o AI por sus siglas en inglés, son algoritmos (serie de pasos para realizar algun cómputo, procesar datos o resolver problemas) que emulan la cognición humana y encuentran patrones en grandes cantidades de datos o big data.
Algunas de sus ramas son:
Inteligencia Artificial NO es lo mismo que Data Science, IA es una de las múltiples herramientas que se utlizan en el proceso de la ciencia de datos y no siempre es necesario usarla. Descubre nuestra ruta de cursos para ser data scientist.
Hay una definición que me gustó mucho y es que cuando excel se bloquea ya tenemos big data, no hay una cantidad exacta para poder decir que lo es pero lo que sabemos es que tiene que ser una cantidad masiva de datos y que cumpla con las 5Vs, que son:
1.- Volúmen: Como la palabra lo dice, que ocupe un gran espacio.
2.- Valor: Si los datos no aportan algun valor entonces no sirven.
3.- Variedad Tienen que venir de múltiples fuentes para poder ser considerados como big data.
4.- Velocidad: Estos datos son producidos en tiempo real y deben ser procesados a la par.
5.- Veracidad: Deben ser datos de calidad y confianza.
Existe una jerarqía por una razón, si no se realiza un nivel no podrás realizar el siguiente, una forma más sencilla de verlo es como si fueran una serie de pasos y son los siguentes:
Existen 4 principales roles que se sitúan en los diferentes pasos del proceso de data science, los cuales son:
Por último te invito a que tomes el curso para que puedas profundizar tus conocimientos y asi estes listo para emprender tu camino en el fascinante mundo de los datos, muchísima suerte y nunca pares de aprender.