Introducción al análisis exploratorio de datos

1

¿Qué es y para qué sirve el análisis exploratorio de datos?

2

¿Cómo hacer un análisis exploratorio de datos?

3

Tipos de análisis de datos

4

Tipos de datos y análisis de variables

5

Herramientas de software para el análisis exploratorio de datos

6

Conociendo nuestros datos: palmerpenguins

7

Recolección de datos, limpieza y validación

8

Ejercicio de validación de datos

Quiz: Introducción al análisis exploratorio de datos

Análisis univariado

9

Explorando una variable categórica: conteos y proporciones

10

Estadística descriptiva aplicada: medidas de tendencia central

11

Estadística descriptiva aplicada: medidas de dispersión

12

Ejercicio de obtención de medidas de dispersión

13

Estadística descriptiva aplicada: distribuciones

14

Estadística descriptiva aplicada: funciones de densidad de probabilidad

15

Bonus: Teorema del límite central

Quiz: Análisis univariado

Análisis bivariado

16

Estableciendo relaciones: gráficos de puntos

17

Estableciendo relaciones: gráficos de violín y boxplots

18

Estableciendo relaciones: matrices de correlación

19

Limitantes de los coeficientes de correlación lineal

20

Estableciendo relaciones: análisis de regresión simple

21

Limitaciones del análisis de regresión simple

Quiz: Análisis bivariado

Análisis multivariado

22

Análisis de regresión múltiple

23

Visualización del análisis de regresión múltiple

24

Análisis de regresión logística

25

Paradoja de Simpson

26

¿Qué hacer cuando tengo muchas variables?

Quiz: Análisis multivariado

Conclusiones

27

Diversidad de gráficas al explorar datos

28

Continúa aprendiendo sobre EDA

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Tipos de análisis de datos

3/28
Recursos

Aportes 16

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

De acuerdo con la historia del vídeo, tipos de analítica de datos:

DESCRIPTIVA: Es el análisis más básico. Permite dar una vista general de las propiedades, dimensiones y comportamiento de un fenómeno desde la mera descripción de los datos.

DIAGNÓSTICA: Es aplicar unos criterios diferenciales a los datos descriptivos para identificar una situación problemática. Permite establecer relaciones entre variables y crear hipótesis sobre las posibles causas de su comportamiento actual.

PREDICTIVA: Utiliza datos para explicar un posible comportamiento de las variables de interés si se siguen las tendencias actuales o si estas cambian. Permite determinar si la situación problemática identificada puede representar mayor o menor riesgo en el futuro.

PRESCRIPTIVA: Utiliza datos para apoyar la toma de decisiones, con base en eventos del pasado. Propone soluciones basadas en evidencia. Igualmente, la etapa prescriptiva también puede hacer iniciar el ciclo de nuevo, ya que monitorear la solución también da pie a procesos nuevos de descripción y diagnóstico de ese monitoreo, volviendo a iniciar el ciclo una vez más.

Tipos de Analisis de Datos

Se dividen en 4 partes:

  1. Analítica Descriptiva: Que sucedió? Provee de ideas sobre eventos del pasado
  2. Analítica Diagnostica: Porque sucedió? Profundiza para encontrar las causas del evento
  3. Analítica Predictiva: Que podría pasar si? Utiliza los datos del pasado para predecir un futuro evento
  4. Analítica Prescriptiva: Que debería hacerse? Analiza decisiones y eventos del pasado para estimar la probabilidad de diferentes resultados.

Todas las analíticas se van construyendo una sobre la otra por lo que lleva tiempo, es decir, no puedes pasar de la Descriptiva a la Predictiva sin antes pasar por la Diagnostica

A medida que vas pasando de una analitica a otra tambien incrementa la complejidad ya que necesitas entender los datos a un nivel mas preciso conforme vayas avanza

El analisis de datos pasados puede ser Descriptivo o Diagnostico, si es decirptivo te preguntas que fue lo pque paso y te dedicas a investigar lo que ya ocurrio, si es Diagnostico, te dedicas a encontrar los Por qué de la situacion. Si nos dedicamos ahora a trabajar en el futuro, nos preguntamos Que podria pasar?, y que deberiamos hacer para obtener resultados esperados

Hay varios tipos de análisis de datos que se pueden aplicar dependiendo de los objetivos y los datos disponibles. Algunos de los tipos de análisis de datos más comunes incluyen:

Análisis descriptivo:

  • Este tipo de análisis se enfoca en describir y resumir los datos. Incluye estadísticas básicas como los medios, la desviación estándar, el rango y la distribución, así como gráficos como histogramas, gráficos de barras y de dispersión.

Análisis inferencial:

  • Este tipo de análisis se enfoca en hacer inferencias acerca de una población a partir de una muestra de datos. Incluye técnicas como la regresión, la conexión y los análisis de varianza.

Análisis predictivo:

  • Este tipo de análisis se enfoca en utilizar los datos históricos para hacer predicciones sobre el futuro. Incluye técnicas como la regresión lineal, la regresión logística, el análisis de series temporales y los algoritmos de aprendizaje automático.

Análisis de clustering:

  • Este tipo de análisis se enfoca en identificar grupos o clusters similares en los datos. Incluye técnicas como el agrupamiento por k-medias y la agrupación jerárquica.

Análisis de componentes principales:

  • Este tipo de análisis se enfoca en reducir la dimensionalidad de los datos y extraer las características más importantes. Incluye técnicas como los componentes principales y el análisis de componentes independientes.

Análisis de asociación:

  • Este tipo de análisis se enfoca en identificar las relaciones entre las variables en los datos. Incluye técnicas como la regla de asociación de Apriori y la minería de datos.

Análisis de segmentación:

  • Este tipo de análisis se enfoca en segmentar a una población en grupos más pequeños y similares. Incluye técnicas como la segmentación de clientes y la segmentación de mercado.

Cabe destacar que estos tipos de análisis no son excluyentes ya menudo se combinan y utilizan en combinación para lograr una comprensión más completa de los datos.

Jesús: No podrías pasar a preescrivir el problema sin siquiera haber descritó…

Los Doctores del seguro en México

Es EXELENTE el ejemplo del doctor para explicar cuando alguien nos pregunta “que hacen, que es el analisis de datos?” ya que como un doctor contempla las variables (en este caso las posibles enfermedades de la persona y como podria afectar segun cada enfermedad) nosotros tambien contemplamos las variables dentro de una empresa y todas las posibilidades de porque los datos nos muestran lo que vemos.
De nuevo. Brillante ejemplo.

La palabra en español para “Ancestría” es ascendencia.

Tipos de Analítica de datos. -Descriptiva se basa en el PASADO ¿Qué sucedió? Eventos que ya ocurrieron -Diagnostica se basa en el PASADO Entender las causas que llevaron a sentirse mal, ¿por qué pasó? -Predictiva prevé FUTURO ¿Qué podría pasar si?... Utiliza los datos del pasado para predecir un evento futuro. -Prescriptiva prevé FUTURO ¿qué debería hacerse? Analizar decisiones dle pasado para mejorar el futuro. Si no sabes que existe un problema, si no está detectado, no puedes llegar a la etapa prescriptiva.  Conforme vas avanzando aumenta la complejidad

Tipos de Análisis: -Descriptiva, responde al ¿que sucedio? para saber que pasó -Diagnostica, responde al ¿por que sucedio? Obtiene más información del evento -Predictiva, responde al ¿que podría pasar sí? Intenta predecir el futuro con datos pasador -prescriptiva, responde al ¿que debería hacerse? Analiza decisiones de eventos pasados para encontrar probabilidades de eventos futuros.

3. Tipos de análisis de datos

Descriptiva

Diagnóstica

Predictiva

Prescriptiva

De acuerdo a los tipos de análisis de datos, les comparto la siguiente analogía con respecto a mi trabajo realizado como ingeniero de procesos en una planta manufacturera sobre un problema de maquinados desfazados:

  • Análisis Descriptivo: Se recolectaron datos de medición, información en bitácoras, eventos ocurridos al redor del problema etc. Y se analizaron.
  • Análisis de Diagnóstico: De acuerdo a la información revisada se encontró que la maquina había chocado por un error de código, pero este no fue el problema ya que producción tiene establecido en su estándar que al momento de presentarse una colisión ellos tenían que validar tres piezas consecutivas para confirmar que la maquina repitiera el dato OK, de lo cual solo validaron una pieza y continuaron produciendo, como conclusión la causa raíz del problema fue una omisión al estándar.
  • Análisis Predictivo: se revisó la magnitud del problema que podría generar en el siguiente proceso (ensamble) y se revisó con el departamento de diseño para conocer la magnitud de problema con el cliente final, por suerte no generaba nada grabe y se pudo liberar el producto en esa condición.
  • Análisis Prescriptivo: Como contramedida de contención se le dio aviso al encargado del siguiente proceso (ensamble) para que estuvieran al tanto en caso de que generara algún problema avisaran lo más pronto posible, se colocó punto de control posterior a la estación de colisión hasta que se corrigiera el problema y como contramedida definitiva se realizó una capacitación al personal de producción que realizo la omisión al estándar en caso de colisión y también a los responsables sus respectivas sanciones.

Espero que esta pequeña analogía con respecto a mi trabajo les pueda servir.

Tipos de análisis de datos:

Analítica descriptiva: Como lo dice su nombre, describe lo que ya sucedió, eventos del pasado que ya están definidos como las propiedades o comportamientos de determinados elementos.

Analítica diagnostica: Después de aplicar la analítica descriptiva, usamos esos datos para profundizar en las causas de aquellos eventos.

Analítica predictiva: Utilizando los datos del pasado para predecir posibles eventos del futuro, como el comportamiento de cierta variable o evento.

Analítica prescriptiva: Ya teniendo todo este proceso, pasamos a preguntarnos qué debemos hacer y analizar qué decisión deberíamos tomar en base a las decisiones del pasado

Cada etapa de la analítica se construye una después de otra, es decir que siguen este orden, puesto que en cada etapa requerimos del análisis de la etapa anterior.