Introducción al análisis exploratorio de datos

1

¿Qué es y para qué sirve el análisis exploratorio de datos?

2

¿Cómo hacer un análisis exploratorio de datos?

3

Tipos de análisis de datos

4

Tipos de datos y análisis de variables

5

Herramientas de software para el análisis exploratorio de datos

6

Conociendo nuestros datos: palmerpenguins

7

Recolección de datos, limpieza y validación

8

Ejercicio de validación de datos

Quiz: Introducción al análisis exploratorio de datos

Análisis univariado

9

Explorando una variable categórica: conteos y proporciones

10

Estadística descriptiva aplicada: medidas de tendencia central

11

Estadística descriptiva aplicada: medidas de dispersión

12

Ejercicio de obtención de medidas de dispersión

13

Estadística descriptiva aplicada: distribuciones

14

Estadística descriptiva aplicada: funciones de densidad de probabilidad

15

Bonus: Teorema del límite central

Quiz: Análisis univariado

Análisis bivariado

16

Estableciendo relaciones: gráficos de puntos

17

Estableciendo relaciones: gráficos de violín y boxplots

18

Estableciendo relaciones: matrices de correlación

19

Limitantes de los coeficientes de correlación lineal

20

Estableciendo relaciones: análisis de regresión simple

21

Limitaciones del análisis de regresión simple

Quiz: Análisis bivariado

Análisis multivariado

22

Análisis de regresión múltiple

23

Visualización del análisis de regresión múltiple

24

Análisis de regresión logística

25

Paradoja de Simpson

26

¿Qué hacer cuando tengo muchas variables?

Quiz: Análisis multivariado

Conclusiones

27

Diversidad de gráficas al explorar datos

28

Continúa aprendiendo sobre EDA

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Prepárate para tu próximo empleo comprando hoy a precio especial

Antes: $249

Currency
$209
Suscríbete

Termina en:

8 Días
2 Hrs
0 Min
47 Seg

Continúa aprendiendo sobre EDA

28/28
Recursos

Nombre del curso: Curso de Análisis Exploratorio de Datos

Dean: Sebastián Delmont

Faculty Manager: Ricardo Celis

Profesor: Jesús Vélez Santiago

Dirección: Jeniffer Cruz y Miguel Torres

Producción OPS: Lizeth Cáceres y Rocío Martínez.

Creación audiovisual: Susana Pinilla y César Pinilla

Edición de video: Karol Hincapié

Postproducción de audio: Jorge Torres

Diseño gráfico: Amelia Amórtegui y Carolina Baquero

Coordinación General: Andrés Arizmendy, Daniel Gutierrez, Carol Baquero, Carlos Céspedes, Sura Cedeño y Sara Hernández

Revisión: Axel Yaguana, Joalin Pineda

Aportes 41

Preguntas 1

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Muchas felicidades al equipo de Platzi por la calidad de este curso, en definitiva, de los mejores cursos que he tomado en la plataforma 💚

El curso es bueno, sin embargo podría haber sido mucho mejor al desarrollar el curso con datasets mucho más complejos. Desde mi punto de vista, deberían lanzar un curso de EDA avanzado.

Bueno gente, les tiro un trucazo, en un codigo corran este codigo

import palmerpenguins
import pandas as pd
import pandas_profiling as pp

df = palmerpenguins.load_penguins()

pp.ProfileReport(df)

Tira un reporte general de los datos bastante bueno para el principio del EDA

  • Las preguntas son la fuente de toda exploracion. Asegurate de definir qué quieres encontrar y quien necesita consultar los resultados desde un comienzo del EDA.
  • Es fundamental identificar el tipo de analisis de datos y variables que se requieren. Explora las dimensiones de tu conjunto de datos y qué tipo de variables contienen.
  • Siempre visualiza los estadisticos. Todos los conjuntos de datos son diferentes, concelos mas alla de sus numeros de resumen
  • Visualiza una o varias variables de distintas maneras. La diversidad de graficas te permitira conocer a detalle los matices de los datos

Suscribo a los comentarios previos. Disfruté mucho este curso y le encontré mucha utilidad. Genial el profe y el contenido.

Definitivamente un excelente curso, espero que hayan más como este 😃

Resumen
1.
¿En qué orden de complejidad y tiempo se encuentra los distintos tipos de analítica de datos?
Descriptiva, Diagnóstica, Predictiva, Prescriptiva
2.
Las variables ordinales y nominales pertenecen a las variables de tipo ____.
Categórico
3.
¿Cuáles son 3 de los tipos de análisis de variables que podemos realizar?
Análisis univariado, Análisis bivariado, Análisis multivariado

¿Qué busca analizar el análisis univariado?
Busca analizar a cada variable por separado; entender qué la define en sí misma.
5.
¿Puedes realizar análisis exploratorios de datos en la nube?
Verdadero
6.
¿Qué es la validación de datos?
El proceso de asegurar la consistencia y precisión dentro de un conjunto de datos.
7.
¿Cuál es una consecuencia de no limpiar y validar nuestros datos?
Si los datos no son precisos desde el comienzo, los resultados definitivamente no serán precisos.

¿Cuál de los siguientes comandos puede ayudarte a conocer cuántas variables de cada tipo existen en tus datos?
df.dtypes.value_counts()
9.
¿Cuál de las siguientes opciones te permite obtener una descripción de valores únicos y frecuencias únicamente de tus variables categóricas?

df.describe(include=[object, “category”])
10.
¿Cuál de los siguientes elementos no es una medida de tendencia central?
rango
11.
¿Cuál de los siguientes elementos no es una medida de dispersión?
Moda

¿Por qué es importante jugar con el número de bins de nuestros histogramas al momento de explorar con nuestros datos?
Jugar con el número de bins de nuestros histogramas permite descubrir picos o bajadas de datos en ciertas zonas qué podrían ser de interés. A su vez, puede permitir reducir el ruido al incrementar los bins y tener un vistazo general.

La función inversa de la Función de Distribución Acumulada para los valores 0.25 y 0.75 sería equivalente a ____.
Obtener los valores de los cuantiles 1 y 3 de nuestro diagrama de cajas.
14.
¿Qué es el teorema del límite central?
La media de las muestras tiende aproximadamente a una distribución normal.
15.
¿Cuál de las siguientes opciones no es recomentable al realizar una gráfica de puntos con gran densidad?
Modificar la transparencia de los puntos.
REPASAR CLASE
16.
¿Qué significa un valor alpha de 1/30 en una gráfica de puntos?

El alpha indica que son necesarios 30 puntos para obtener el color original sin transparencia.
17.
Realizaste una gráfica de puntos y observas que los puntos forman patrones de bandas, ¿cuál de las siguientes opciones podría ser una alternativa de visualización?
Convertilo en un diagrama stripplot.

REPASAR CLASE
18.
Te encuentras realizando un análisis de correlación de Pearson entre dos variables y obtienes como resultado una correlación de 0. ¿Qué no podrías concluir de este resultado?
No existe ninguna correlación entre las dos variables observadas.
19.
La regresión simple únicamente puede manejar relaciones lineales.
Verdadero
20.
¿Qué es la Paradoja de Simpson?
Fenómeno en el cual es posible concluir dos cosas totalmente opuestas a partir de los mismos datos, dependiendo el cómo se clasifican estos.

Falto algo importante en este EDA y fueron las conclusiones.

Definitivamente un gran curso, de los mejores cursos en la carrera de data science que he tomado hasta ahota ❤️

Definitivamente, las preguntas son la fuente de toda exploración.
Gracias Platzi por atender las observaciones sobre el anterior curso de EDA. Se valora en este curso el seguimiento de una única fuente de datos.

A mí me emociona este tipo de cursos en donde uno crea tantas cosas. Y pensar que el nivel es basico! No me imagino las habilidades que tienen los expertos en Data.
Dejo aquí un dataset donde practico algunas cosas de este curso 😃, espero su feedback.
Pd: Gracias al profe por la excelente explicación de todos los temas.

https://deepnote.com/workspace/sebastian-giraldo-ea6cde3a-b12e-4f3b-a9cf-9e19cbc64aa7/project/Diabetesproject-294c26da-9b2e-4c0d-ba05-a8537c491390

ha sido un curso muy largo, fue algo bastante intenso pero creo que en su mayoría logré adquirir mucho conocimiento, buen curso y comunidad tan positiva de compartir sus resultados en los comentarios.

Tremendo curso, muchomejor que el anterior.

excelente me encanto este curso, muy bueno

Excelente curso!, gran profesor, con explicaciones muy didácticas, a pesar del ser un nivel básico cubre muchos puntos importantes. También muy agradecida con Platzi .

Es importante tener en cuenta que el análisis exploratorio de datos no es un proceso lineal y puede requerir múltiples iteraciones para refinar y mejorar los resultados. Además, es fundamental tener en cuenta el contexto y la naturaleza de los datos para seleccionar las técnicas y herramientas adecuadas.

<h5>En resumen, la exploración y análisis de datos es una parte fundamental del proceso de análisis de datos y puede proporcionar información valiosa para tomar decisiones informadas y desarrollar modelos precisos y efectivos.</h5>

Excelente curso, con buena pedagogía, entendible para todos, gracias…

Excelente Curso, Siempre hay algo nuevo que aprender, La calidad del curso es Muy buena, Muy recomendado

Gran actualización para este curso, ha estado más allá de las expectativas 🚀🔥
No me he equivocado a elegir a Platzi como mi centro de formación para ser Data Scientist 😎🥇

Es ha sido uno de los mejores cursos que he tomado, el nivel de profundidad es muy bueno!!! gracias

De los mejores cursos en la ruta de Data, no me caben dudas. Muchísimas gracias, Jesús, por tus grandes conocimientos y tu excelente docencia para compartirlos nosotros!

Excelente curso. Equilibra muy bien la teoría con la práctica.
¡Soy más feliz que antes de haber tomado este curso! En esta ruta sentía que me estaba estancando y que mis habilidades eran teóricas pero no estaba pudiendo llegar a hacer cosas reales. Este curso me permitió sentir que voy por buen camino y que esto tiene un potencial impresionante. ¡Gracias al profesor por ser tan excelente!

💻 Librerías de PYTHON para EDA (Exploratory Data Analysis = Análisis Exploratorio de Datos) 📊📈
https://www.youtube.com/watch?v=shcDnxhP12c

Grandioso este curso, felicito al profesor por todos los conocimientos que posee y que comparte con nosotros!

Calificacion 8.5/10
Los quiz no fueron bien creados, eran muy contradictorios.
por lo demas, todo bien.

Hace falta un curso práctico con un proyecto de EDA "real"
Yo revisando los aportes esperando unos buenos apuntes del Excelente curso!
Tremendo curso! Muy profundo, super didactico, el profe un crack total que se nota sabe mucho y aplicó muchos años lo que enseña. Realmente de los mejores que he tomado en Platzi y eso que tomé muchos! :)

Creo que este curso es bastante util, sin embargo considero que no se explican muchas cosas que considero necesario

Esperando con ansias el avanzado

Muy bueno, esperamos el avanzado pronto.

Coincido con todos los comentarios de esta clase, de todos los cursos de la carrera, este ha sido el que más me ha gustado y al que más le he sacado provecho, espero haya muchos más cursos así por no decir que todos. Gracias, Platzi

Me gusto mucho el curso , lo unico es que todo el codigo lo tube que hacer en Jupyter notebook en vex de deepnote…

¡Excelente calidad de curso, material e instructor!
Lo disfrute bastante.

Este es mi archivo deepnote con la programacion que ha hecho el profe en la clase:
click aqui

Excelente profesor, gracias Jesús por compartir tu conocimiento.

muchas gracias , aprendi demasiado.

Es el curso que más disfruté en Platzi hasta ahora, gracias por eso profe y pues es una lástima que no pueda calificar con 5 estrellas ya que di mi examen desde el cel y cuando hago eso al parecer no puedo calificar 😦
Le quedo muy agradecida y puesta implementar todo lo aprendido, con esto ya puedo ir empezando mi portafolio 😄
⋆⋆⋆⋆⋆ 😄

El profesor Jesús Vélez es muy buen profesor!

Amigos de Platzi me tomó un mes terminar este curso, me siento satisfecho! Gracias y a seguir aprendiendo!