¡Increíble curso!
Fui tomando los apuntes del curso en Deepnote, aquí se los comparto: Notas del curso
Además, está habilitada la opción por si los quieren duplicar a su dashboard 💚
¿Para qué sirve la estadística descriptiva?
Estadística descriptiva vs. inferencial
Flujo de trabajo en data science
Plan del curso
Estadística descriptiva para analítica
¿Cómo usar Deepnote?
Tipos de datos
Medidas de tendencia central
Metáfora de Bill Gates en un bar
Medidas de tendencia central en Python
Medidas de dispersión
Desviación estándar
Medidas de dispersión en Python
Exploración visual de los datos
Diagramas de dispersión en el análisis de datos
Estadística en la ingesta de datos
Pipelines de procesamiento para variables numéricas
Transformación no lineal
Procesamiento de datos numéricos en Python
Pipelines de procesamiento para variables categóricas
Procesamiento para variables categóricas con Python
Correlaciones
Matriz de covarianza
Proyecto de aplicación
Cálculo de valores propios de una matriz
PCA: análisis de componentes principales
Reducción de dimensionalidad con PCA
Despedida
Conclusiones
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Aportes 68
Preguntas 4
¡Increíble curso!
Fui tomando los apuntes del curso en Deepnote, aquí se los comparto: Notas del curso
Además, está habilitada la opción por si los quieren duplicar a su dashboard 💚
Visión de la estadística descriptiva: Resumir información con números y con visualizaciones
La estadística descriptiva nos permite trabajar con 2 bloques fundamentales de la ciencia de datos:
¿Por qué es tan importante el procesamiento de datos? El procesamiento de datos es muy importante para que todo tenga un formato estandarizado para que sea de fácil entendimiento para un modelo de Machine Learning. Sabiendo eso, las correlaciones son fundamentales para ver que variables tienen una alta relación y de ahí evidenciar que puede haber variables que pueden resultan redundantes para el modelo
Y como conclusión final vimos la técnica PCA: el análisis de componentes principales es una técnica utilizada para describir un conjunto de datos en términos de nuevas variables no correlacionadas.
Me pareció brutal este curso, mucho más de lo que esperaba, y esta última parte de PCA lejos lo mejor, gran profesor Francisco Camacho
me di cuenta que mi tesis (se la cual estaba bien orgulloso) tiene varios errores estadísticos. ups!
el curso es muy fácil de seguir sin embargo considero que debe ir mejor ubicado en la ruta de aprendizaje debería ir después de cursos relacionados con el algebra lineal, por que de nada sirve saber taclear si no comprendemos adecuadamente que se esta haciendo, por ejemplo todo el tema de PCA, se queda perdido si uno no sabe algebra lineal.
Excelente curso, la parte que faltaba para aprender Machine Learning, nada que envidiar a las universidades
Excelente curso, les dejo mis apuntes en Github.
Apuntes curso Estadísticas descriptivas
Francisco tiene una cualidad fundamental que tendría que tener todo profesor : Habilidad para estructurar la información a través de pasos sencillos. Una idea guarda relación con la siguiente, pequeñas piezas de un gran rompecabezas que él se encarga de ir encajando y explicando para que todo tome coherencia … Hasta si nos ponemos a pensar aplica de cierta forma el término de Correlación del que tanto se habla acá en el curso al ir encadenando conocimientos tras conocimientos que guardan entre si eso mismo … Correlación!
En lo personal este curso me gusto mucho. Antes había tomado el curso de probabilidad de Pacho, pero la verdad me fui muy difícil entender los últimos módulos. Sentía que le hablaba más a gente con amplios conocimientos de matemáticas gracias a su carrera que a aquellos que están empezando a dar sus primeros pasos en Data Science y ML. Pero este curso fue muy diferente y la verdad se ve el crecimiento de Pacho como maestro. Espero que saque más cursos así en el futuro.
Por fin llego a entender para que realmente se utiliza PCA. Creía que era un método para seleccionar variables (feature selection), pero lo que realmente busca son aquellas variables que más información brindan entre un conjunto de variables correlacionadas. Excelente curso!!!.
Buenas ! hice un proyecto con todo lo que fuimos viendo y practicando a la par, tiene la teoriaa complemento igual 😃
si alguien quiere sumar algo o verlo, aca está 😄
https://deepnote.com/project/Estadisticas-2022or-Teoria-or-Practica-hvm4HMEXQhWdq0iAcSjFxQ/%2FEstadistica Descriptiva.ipynb
Se nota cuando un profesor domina los conceptos que explica, dando como resultado un curso excelente!!!
Me parece un curso excelente y muy bien explicado, desde el inicio se plantearon los objetivos y durante las clases no se perdía ese scope general, muchas gracias Francisco por el empeño y dedicación!
Excelente profesor, excelente curso…!!!Muy bien explicados los conceptos a tal punto que la única opción era querer continuar hasta el final.
De locos este curso.
Magnifico, quedé un poco choqueado con las formulas y debo reforzar mucho con los cursos de matemáticas pero la verdad está super bueno.
¡Gran curso! Lamentablemente solo pude seguir bien hasta la mitad, de allí me perdí, posiblemente porque lo primero ya lo había llevado en la universidad.
No entendí para nada la última parte ni su importancia, porque sé hace, su razón de hacer todo me perdí completamente
Me pareció un buen curso, no excepcional pero tampoco se queda con una debajo del promedio. Había tomado casi la mitad del curso por el Datacademy y precisamente los temas que seleccionaron fueron los más entendibles y digeribles. Después de esto, en la Estadística en la Ingesta de Datos, se perdió mucho el hilo: el contenido se fue de más, dejando un hueco que puede ser cubierto en algún otro curso (Fundamentos de Estadística?). Me incluyo, vengo de alguien que vengo de 0 en el Data Science y que hasta este momento iba bien hasta tomar estos temas. El profesor Camacho muestra un amplio dominio del tema, me gustaría que fuera más conciso en su lenguaje, como Facundo.
Les dejo mi apuntes del curso, le dedique mucho carino, que lo disfruten
https://deepnote.com/@carlos-mazzaroli/Estadistica-Descriptiva-para-Ciencias-de-Datos-b8622ee2-5fb0-44f3-8791-96915665574e
Para los colegas interesados en el mundo crypto y junto con los excelentes conocimientos que aporta este curso, me enteré que se pueden consolidar y subir estadísticas con gráficas en el sitio Dune Analytics.
y tiene razón, quizá lo usabas pero no sabias que estabas haciendo… el ultimo tema de PCA casi me hizo “explotar la cabeza” toda esa álgebra lineal ahora cobra sentido y utilidad XD. muy buen profesor, es de los mejores en platzi, el y Facundo hasta ahora son mis favoritos
Muy buen curso! Mis felicitaciones al profesor y al equipo Platzi!
Inclusive me pareció mejor que cursos de maestría en los que participe en una universidad.
Es curso de alto nivel, excelente profesor, excelente contenido!
Muy buen curso de Estadistica Descriptiva orientado a Data Science y ML, excelente contenido para volver a verlo.
Soy el unico que le parecio uno de los mejores cursos de platzi?
Excelente curso y gran profesor, explica tan bien los conceptos estadísticos que son fáciles de digerir y aparte nos da una entrada para poder agarrar datos, prepararlos y tenerlos listos para pasarlos a un modelo. Me encanto, ahora a practicar y a seguir estudiando para poder montar mis propios modelos de ML.
Un curso espectacular ya que no solo es algo simple en estadística si no se enfoca en muchos mas puntos y te impulsa a tener un nivel mejor
Excelente curso gracias a un excelente profesor como lo es Francisco Camacho, esto me dio una motivación para nunca parar de aprender y convertirme en un data scientist.
¡Un gran curso!
👽 estoy empezando con ML y este curso está brutal, excelente el profe.
me encanto el curso, todo fue facil de digerir gracias a las explicaciones sencillas
Excelente curso.
Excelente curso
Excelente curso, muy claro, muy preciso, muy motivador. Ojalá sigan sacando cursos con este excelente profesor. Felicitaciones
Excelente curso, me motivo a aprender más por mi cuenta
Muy buen profesor!
Estuvo muy completo este curso, excelente profesor!!!
Gracias, muy buen curso, espero terminar toda la escuela de matemáticas, antes de iniciar las escuelas enfocadas al desarrollo web, muy buen contenido, y lo mejor inclusión de herramientas tecnológicas.
Les dejo los resultados de un proyecto usando algo de lo aprendido en éste curso: ejemplo de escalamiento de datos con la funcion tanh
Increíble, ha sido toda una experiencia este curso, de hecho todos los conceptos ya los di en la carrera pero aquí he podido añadir practicidad a toda la teoría que había aprendido.
Muy mágico!!
La verdad todo un crack, buen curso
¡Gran curso!, aunque estoy estudiando matemáticas jamás lleve un curso de estadística descriptiva y aprendí un montón de esto.
Es un buen curso con un excelente profesor, sin embargo, hay cuertas cosas que no se han visto en otros cursos en la ruta de Data Science y que considero no ayudan en la coheción de implementar ciertas funciones de pandas y seaborn. Tendré que tomarlo de nuevo, porque toda la parte teorica vale la pena reforzarla.
El curso estuvo genial, pero claramente está ubicado muy arriba, terminos como el PCA, no los entendí en lo absoluto, debería estar despues de los cursos de algebra lineal etc. Porque quizá te hace creer que no eres capaz y abandones la ruta.
examAnswers
Resumen
1.
¿La estadística descriptiva puede ser subjetiva en la definición de sus métricas?
Verdadero
2.
¿En qué etapa del flujo de trabajo de un proyecto de Data Science se usa la estadística descriptiva?
En la preparación y entrenamiento del modelo
3.
Un ejemplo de dato categórico es:
Género
4.
Un ejemplo de dato numérico es:
Precio
5.
Un diagrama de frecuencia nos sirve para:
Ver todos los posibles valores de un dato y cada cuánto aparecen.
6.
La media es una excelente medida de tendencia central cuando tenemos outliers en nuestro conjunto de datos. Este enunciado es:
Falso
7.
Para calcular la mediana de un dato en nuestro dataset lo hacemos con:
df[‘name’].median()
¿Cuál de estas visualizaciones es muy útil para presentar los intercuatiles?
Diagrama de caja
9.
La desviación estándar se puede dividir por:
Población y muestra
10.
El rango de un dato que describe la altura en un conjunto de datos se puede calcular como:
df[‘height’].max() - df[‘height’].min()
Un diagrama de dispersión nos sirve para:
Contrastar dos variables de nuestro set de datos.
12.
Una de las razones por las que realizamos escalamientos es:
Para que los optimizadores de nuestros modelos funcionen mejor.
13.
Las transformaciones no lineales nos sirven para tipos de datos:
Fuertemente sesgados y no simétricos
14.
Un tipo de mapeo numérico que causa una representación compacta es el:
Dummy
15.
El preprocesamiento por mapeo se puede aplicar tanto a variables categóricas y numéricas:
Verdadero
16.
Cuando el coeficiente de correlación es alto:
Los datos en nuestro diagrama de dispersión se agrupan con una pendiente positiva.
17.
Una matriz de covarianza nos sirve para:
Comparar la varianza y covarianza de todos nuestros datos en una matriz.
18.
El análisis de componentes principales es un proceso de:
Reducción de dimensionalidad
Muchas gracias por este curso, en serio lo disfruté, ya que de toda la ruta este es el primero que se adentra y tiene que ver más que ver con el entorno real de un científico de datos.
Este curso me hizo sentir que ya estoy entrando en materia.
¡Excelente curso!
El curso es bueno. Pero creo esta mal diseñado la ruta de analisis de datos con python. Primero tuvo que haber un curso de algebra lineal con los temas que presento el profe, y despues recien va este curso.
Muchas gracias, que buen curso!
definitivamente este curso lo volveré a tomar
me duele el cerebro, que gran cantidad de información de calidad, muchas gracias
Gran curso…
muchas gracias =D , es la mejor base para continuar aprendiendo.
Curso con conceptos avanzadso explicados muy rapidamente y con insuficiencia, asi que es confuso.
Gracias por el curso. Muy interesante
Información resumida de esta clase
#EstudiantesDePlatzi
Felicidades mereces una vida mejor 😃
Aprendimos mucho y es importante practicar
La estadística descriptiva la necesitamos para el análisis exploratorio de la información y el procesamiento de dicha información
Es importante aprender a utilizar la técnica del análisis de componentes principales y aprender sobre otras técnicas para la reducción de datos
**** Es un muy buen curso aprendí demasiado, y este método que Platzi tiene para enseñarle a sus alumnos, se hace fácil las matemáticas.
Gracias el profesor FRANCISCO CAMACHO es un gran educador, hasta la próxima profe
Tenia planeado tomar este curso en dos días estudiando 4 horas cada día, y termine tardándome 5 días, además de tomar varias notas de libros y videos que ver, fue muy difícil y aun siento que tengo que repasar algunos conceptos, pero este curso me encanto, va subiendo la dificultad y justificando la importancia de lo que aprendemos
Un curso genial. El profesor maneja muy bien el tema, y su síntesis matemática es excelente. Fue mucho más conciso y útil que lo que vi en la universidad.
Excelente curso, pone en contexto de una manera general y sencilla el flujo de datos en data science y como aplicar la estadística en cada etapa. Gracias Francisco esperando seguir aprendiendo contigo la evaluación del modelo, modelo en producción para cerrar la interacción usuario final con un caso de negocio.
Excelente curso!
De los mejores cursos de Platzi.
Me encanto el cursos, buen profesor Francisco, una metodología clara, nos va llevando de lo general a lo especifico y nos da las pautas para hacer un correcto uso de ese primer momento de los datos, para hacer un buen análisis con ML, tan claro como en esta conclusión bien explicada lo que debemos conocer para profundizar luego
Excelente profesor
Fue muy genial el curso, dio una nocion muy especifica del uso de la estadistica y AL para data science
Excelente muchas gracias
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.