37

¿Por qué aprender estadística para data science?

7790Puntos

hace 2 años

Con frecuencia nos preguntamos por qué necesitamos conocimientos estadísticos para trabajar con datos. La respuesta es sencilla:

  1. La estadística nos va a dar la base para decidir cómo manipular nuestros datos.
  2. La estadística nos ayuda a interpretar los resultados y a tomar decisiones.

En particular, la estadística, al igual que la ciencia de datos, busca extraer conocimiento e ideas de la información.

El objetivo principal del machine learning es crear modelos predictivos a partir de un histórico y, para ello, se apoya de la inferencia. A su vez, el objetivo principal de la estadística como tal es inferir y, con ello, también llegar a predicciones.

machine-learning.png

¿Necesito conocimientos de estadística para la ciencia de datos?

Puedes indagar y profundizar tanto como gustes en los diferentes campos de la estadística. Sin embargo, en la mayoría de los trabajos no vas a requerir la teoría más avanzada sobre esta.

También es importante que en el momento de elegir el sector en el que quieres trabajar pienses en el rigor o el tipo de análisis que se va a esperar del equipo técnico.

Por lo general, más que modelos matemáticamente complejos que demoren tiempo en desarrollarse, las empresas buscan análisis que se resuelvan de manera pragmática, es decir, relativamente rápido y de manera aplicada.

Para hacer un buen análisis se requiere de fundamentos en estadística, de conocimiento de varias herramientas o modelos y, finalmente, de un razonamiento lógico que permita interpretar y explicar los resultados. Puedes conocerlo mejor a continuación.

Fundamentos

Son aquellos conceptos de la estadística que nos ayudarán a entender y analizar mejor la información. Por ejemplo, las distribuciones (i.e. desviaciones), estimaciones (i.e. intervalos de confianza), probabilidad (i.e. teorema central del límite) e inferencia (i.e. valor p).

Modelos

Son las herramientas que nos ayudarán a enfrentar los problemas que queramos resolver como, por ejemplo, modelos lineales, regresiones, correlaciones, modelos de machine learning, entre otros.

Razonamiento lógico

Después de usar los fundamentos y los modelos para llegar a un fin, el razonamiento es el que nos hará las preguntas críticas para cuestionarnos si el resultado obtenido tiene sentido, para poder validar que el proceso no tenga sesgos a partir de las condiciones y suposiciones correctas.

Aprender estadística descriptiva e inferencial

La estadística se divide en dos grandes partes: descriptiva e inferencial. Para comenzar con la parte descriptiva te invito a tomar el Curso de Matemáticas para Data Science: Estadística Descriptiva.

Una vez que hayas dominado esta parte es momento de aprender el lado inferencial. Para ello toma el Curso de Estadística Inferencial para Data Science e Inteligencia Artificial, en el que tengo el gusto de ser tu profesora y con el cual puedes certificarte como Data Scientist.

En ambos cursos utilizarás Python como lenguaje de programación y aprenderás los fundamentos y el razonamiento lógico que necesitas para data science. 🐍🌟

Sílvia
Sílvia
arizasilvia

7790Puntos

hace 2 años

Todas sus entradas
Escribe tu comentario
+ 2
Ordenar por:
2

Como estudiante de la Escuela de Data Science me encantaron los dos cursos sobre estadística que hizo Francisco “Pacho” Camacho … hay tanto valor allí dentro!!.. Y pues si, la estadística te enseña de alguna manera el camino de los datos… como se comportan y donde buscar información que ellos te quieren mostrar …,. Hay un montón de datos allá afuera!!! … Sólo hay que saber buscarlos…

2
14280Puntos

De nuevo muchas gracias por tan valioso post 💛 soy nuevo casi completamente en esto mundo de la Ciencia de Datos. Apreciaría mucho un consejo de su parte profesora. Por ejemplo, ¿Qué rutas debo tomar?. Gracias de antemano 😊

1
14280Puntos
2 años

Wow muchas gracias profesor Miguel 🤩 ya lo agregué y lo tomaré ASAP 🚀💛 aprecio mucho su ayuda. Son los mejores 🤓😎

1
5316Puntos

Excelente explicación detallada y concisa para comprender, cual es la base de aplicación que se puede realizar con la Estadistica al momento de desarrollar Ciencia de Datos.

1
54087Puntos

Great

1
43289Puntos

Muchísimas gracias, deseando aprender a programar para comenzar con tu curso. Felicidades.