Muchas felicidades al equipo de Platzi por la calidad de este curso, en definitiva, de los mejores cursos que he tomado en la plataforma 💚
Introducción al análisis exploratorio de datos
¿Qué es y para qué sirve el análisis exploratorio de datos?
¿Cómo hacer un análisis exploratorio de datos?
Tipos de análisis de datos
Tipos de datos y análisis de variables
Herramientas de software para el análisis exploratorio de datos
Conociendo nuestros datos: palmerpenguins
Recolección de datos, limpieza y validación
Ejercicio de validación de datos
Quiz: Introducción al análisis exploratorio de datos
Análisis univariado
Explorando una variable categórica: conteos y proporciones
Estadística descriptiva aplicada: medidas de tendencia central
Estadística descriptiva aplicada: medidas de dispersión
Ejercicio de obtención de medidas de dispersión
Estadística descriptiva aplicada: distribuciones
Estadística descriptiva aplicada: funciones de densidad de probabilidad
Bonus: Teorema del límite central
Quiz: Análisis univariado
Análisis bivariado
Estableciendo relaciones: gráficos de puntos
Estableciendo relaciones: gráficos de violín y boxplots
Estableciendo relaciones: matrices de correlación
Limitantes de los coeficientes de correlación lineal
Estableciendo relaciones: análisis de regresión simple
Limitaciones del análisis de regresión simple
Quiz: Análisis bivariado
Análisis multivariado
Análisis de regresión múltiple
Visualización del análisis de regresión múltiple
Análisis de regresión logística
Paradoja de Simpson
¿Qué hacer cuando tengo muchas variables?
Quiz: Análisis multivariado
Conclusiones
Diversidad de gráficas al explorar datos
Continúa aprendiendo sobre EDA
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Convierte tus certificados en títulos universitarios en USA
Antes: $249
Paga en 4 cuotas sin intereses
Termina en:
Jesús Vélez Santiago
Nombre del curso: Curso de Análisis Exploratorio de Datos
Dean: Sebastián Delmont
Faculty Manager: Ricardo Celis
Profesor: Jesús Vélez Santiago
Dirección: Jeniffer Cruz y Miguel Torres
Producción OPS: Lizeth Cáceres y Rocío Martínez.
Creación audiovisual: Susana Pinilla y César Pinilla
Edición de video: Karol Hincapié
Postproducción de audio: Jorge Torres
Diseño gráfico: Amelia Amórtegui y Carolina Baquero
Coordinación General: Andrés Arizmendy, Daniel Gutierrez, Carol Baquero, Carlos Céspedes, Sura Cedeño y Sara Hernández
Revisión: Axel Yaguana, Joalin Pineda
Aportes 45
Preguntas 1
Muchas felicidades al equipo de Platzi por la calidad de este curso, en definitiva, de los mejores cursos que he tomado en la plataforma 💚
El curso es bueno, sin embargo podría haber sido mucho mejor al desarrollar el curso con datasets mucho más complejos. Desde mi punto de vista, deberían lanzar un curso de EDA avanzado.
Bueno gente, les tiro un trucazo, en un codigo corran este codigo
import palmerpenguins
import pandas as pd
import pandas_profiling as pp
df = palmerpenguins.load_penguins()
pp.ProfileReport(df)
Tira un reporte general de los datos bastante bueno para el principio del EDA
Suscribo a los comentarios previos. Disfruté mucho este curso y le encontré mucha utilidad. Genial el profe y el contenido.
Definitivamente, las preguntas son la fuente de toda exploración.
Gracias Platzi por atender las observaciones sobre el anterior curso de EDA. Se valora en este curso el seguimiento de una única fuente de datos.
Definitivamente un excelente curso, espero que hayan más como este 😃
Resumen
1.
¿En qué orden de complejidad y tiempo se encuentra los distintos tipos de analítica de datos?
Descriptiva, Diagnóstica, Predictiva, Prescriptiva
2.
Las variables ordinales y nominales pertenecen a las variables de tipo ____.
Categórico
3.
¿Cuáles son 3 de los tipos de análisis de variables que podemos realizar?
Análisis univariado, Análisis bivariado, Análisis multivariado
¿Qué busca analizar el análisis univariado?
Busca analizar a cada variable por separado; entender qué la define en sí misma.
5.
¿Puedes realizar análisis exploratorios de datos en la nube?
Verdadero
6.
¿Qué es la validación de datos?
El proceso de asegurar la consistencia y precisión dentro de un conjunto de datos.
7.
¿Cuál es una consecuencia de no limpiar y validar nuestros datos?
Si los datos no son precisos desde el comienzo, los resultados definitivamente no serán precisos.
¿Cuál de los siguientes comandos puede ayudarte a conocer cuántas variables de cada tipo existen en tus datos?
df.dtypes.value_counts()
9.
¿Cuál de las siguientes opciones te permite obtener una descripción de valores únicos y frecuencias únicamente de tus variables categóricas?
df.describe(include=[object, “category”])
10.
¿Cuál de los siguientes elementos no es una medida de tendencia central?
rango
11.
¿Cuál de los siguientes elementos no es una medida de dispersión?
Moda
¿Por qué es importante jugar con el número de bins de nuestros histogramas al momento de explorar con nuestros datos?
Jugar con el número de bins de nuestros histogramas permite descubrir picos o bajadas de datos en ciertas zonas qué podrían ser de interés. A su vez, puede permitir reducir el ruido al incrementar los bins y tener un vistazo general.
La función inversa de la Función de Distribución Acumulada para los valores 0.25 y 0.75 sería equivalente a ____.
Obtener los valores de los cuantiles 1 y 3 de nuestro diagrama de cajas.
14.
¿Qué es el teorema del límite central?
La media de las muestras tiende aproximadamente a una distribución normal.
15.
¿Cuál de las siguientes opciones no es recomentable al realizar una gráfica de puntos con gran densidad?
Modificar la transparencia de los puntos.
REPASAR CLASE
16.
¿Qué significa un valor alpha de 1/30 en una gráfica de puntos?
El alpha indica que son necesarios 30 puntos para obtener el color original sin transparencia.
17.
Realizaste una gráfica de puntos y observas que los puntos forman patrones de bandas, ¿cuál de las siguientes opciones podría ser una alternativa de visualización?
Convertilo en un diagrama stripplot.
REPASAR CLASE
18.
Te encuentras realizando un análisis de correlación de Pearson entre dos variables y obtienes como resultado una correlación de 0. ¿Qué no podrías concluir de este resultado?
No existe ninguna correlación entre las dos variables observadas.
19.
La regresión simple únicamente puede manejar relaciones lineales.
Verdadero
20.
¿Qué es la Paradoja de Simpson?
Fenómeno en el cual es posible concluir dos cosas totalmente opuestas a partir de los mismos datos, dependiendo el cómo se clasifican estos.
Falto algo importante en este EDA y fueron las conclusiones.
Definitivamente un gran curso, de los mejores cursos en la carrera de data science que he tomado hasta ahota ❤️
ha sido un curso muy largo, fue algo bastante intenso pero creo que en su mayoría logré adquirir mucho conocimiento, buen curso y comunidad tan positiva de compartir sus resultados en los comentarios.
Tremendo curso, muchomejor que el anterior.
excelente me encanto este curso, muy bueno
Excelente curso!, gran profesor, con explicaciones muy didácticas, a pesar del ser un nivel básico cubre muchos puntos importantes. También muy agradecida con Platzi .
Es importante tener en cuenta que el análisis exploratorio de datos no es un proceso lineal y puede requerir múltiples iteraciones para refinar y mejorar los resultados. Además, es fundamental tener en cuenta el contexto y la naturaleza de los datos para seleccionar las técnicas y herramientas adecuadas.
<h5>En resumen, la exploración y análisis de datos es una parte fundamental del proceso de análisis de datos y puede proporcionar información valiosa para tomar decisiones informadas y desarrollar modelos precisos y efectivos.</h5>
Excelente curso, con buena pedagogía, entendible para todos, gracias…
Excelente Curso, Siempre hay algo nuevo que aprender, La calidad del curso es Muy buena, Muy recomendado
Gran actualización para este curso, ha estado más allá de las expectativas 🚀🔥
No me he equivocado a elegir a Platzi como mi centro de formación para ser Data Scientist 😎🥇
Es ha sido uno de los mejores cursos que he tomado, el nivel de profundidad es muy bueno!!! gracias
De los mejores cursos en la ruta de Data, no me caben dudas. Muchísimas gracias, Jesús, por tus grandes conocimientos y tu excelente docencia para compartirlos nosotros!
💻 Librerías de PYTHON para EDA (Exploratory Data Analysis = Análisis Exploratorio de Datos) 📊📈
https://www.youtube.com/watch?v=shcDnxhP12c
Calificacion 8.5/10
Los quiz no fueron bien creados, eran muy contradictorios.
por lo demas, todo bien.
Creo que este curso es bastante util, sin embargo considero que no se explican muchas cosas que considero necesario
Esperando con ansias el avanzado
Muy bueno, esperamos el avanzado pronto.
Coincido con todos los comentarios de esta clase, de todos los cursos de la carrera, este ha sido el que más me ha gustado y al que más le he sacado provecho, espero haya muchos más cursos así por no decir que todos. Gracias, Platzi
Me gusto mucho el curso , lo unico es que todo el codigo lo tube que hacer en Jupyter notebook en vex de deepnote…
¡Excelente calidad de curso, material e instructor!
Lo disfrute bastante.
Este es mi archivo deepnote con la programacion que ha hecho el profe en la clase:
click aqui
Excelente profesor, gracias Jesús por compartir tu conocimiento.
muchas gracias , aprendi demasiado.
Es el curso que más disfruté en Platzi hasta ahora, gracias por eso profe y pues es una lástima que no pueda calificar con 5 estrellas ya que di mi examen desde el cel y cuando hago eso al parecer no puedo calificar 😦
Le quedo muy agradecida y puesta implementar todo lo aprendido, con esto ya puedo ir empezando mi portafolio 😄
⋆⋆⋆⋆⋆ 😄
El profesor Jesús Vélez es muy buen profesor!
Amigos de Platzi me tomó un mes terminar este curso, me siento satisfecho! Gracias y a seguir aprendiendo!
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?