Bienvenida e introducción

1

Todo lo que aprenderás sobre el lenguaje R

2

Programación y Data Science

3

R y proyecto economía naranja.

4

Instalando nuestras herramientas

Variables, tipos de datos y estructuras

5

Los primeros cálculos con R y variables

6

Tipos de datos

7

Estructura del dataset del proyecto

8

Vectores

9

Matrices

10

Ejercicios con matrices

11

Operadores para comparar y ubicar datos

12

Factores, listas y echar un vistazo al dataset

EDA: Exploratory data analysis

13

Qué es EDA: Exploratory Data Analysis

14

Gráficas de dispersión e histogramas.

15

Box Plot y su interpretación

16

EDA con dataset proyecto - Gráficas de dispersión.

17

EDA con histogramas.

18

EDA con dataset proyecto - histogramas - ggplot2

19

EDA con box plot- ggplot2

20

EDA con dataset proyecto - box plot- ggplot2 - dplyr

21

EDA con gráficas de dispersión con más de dos variables - ggplot2

22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly

La estadística de los datos

23

Buscando correlaciones con pairs

24

Confirmando correlaciones con la función cor

25

Buscando correlaciones con pairs en dataset proyecto

26

Confirmando correlaciones con la función cor en dataset proyecto.

27

Protegiéndonos de los peligros del promedio.

28

Eliminando los NA's para hacer los cálculos.

29

Estadística y visualización aplicada a análisis de datos de mercadeo.

Ajustando los datos

30

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 1

31

Generando tablas, filtrando y seleccionando datos - dplyr-Parte 2

Mejorando la visualización

32

Viendo más información con facet wrap - Parte 1

33

Viendo más información con facet wrap - Parte 2

Organizar visualizaciones y código con R Markdown

34

Conociendo R Markdown y organizando los hallazgos del análisis en un documento PDF.

Conclusiones Finales

35

Invitación a continuar recorriendo el mundo del data science.

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Gráficas de dispersión e histogramas.

14/35
Recursos

Existen varios tipos de gráficas para visualizar la información al momento de hacer EDA:

  • Histograma: sirve para ver la distribución de las frecuencias de una variable, es diferente a la gráfica de barras.
  • Gráfica de dispersión: los ejes solamente pueden ser valores numéricos y los puntos no se pueden unir.
  • Box plot: nos muestra elementos como el mínimo, el máximo, el primer cuartil, la mediana y el tercer cuartil.

Aportes 17

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Creo que hay que aclarar la diferencia entre ScatterPlot y la gráfica de líneas.

La principal diferencia entre un ScatterPlot y una grafica de líneas es que la ScatterPlot nos muestra la **relación **entre dos variables pero estas no necesariamente siguen una secuencia o evolución, es decir, no por que ordemos los datos de menor a mayor significa que así fueron recolectados.

En cambio la gráfica de líneas se parece más a una serie de tiempo, en esta sí podemos unir los puntos porque estos muestran una evolución o secuencia.

Bastante interesante, sin embargo siempre he pensado que Platzi debería crear un curso solamente de Visualización de Datos independientemente de la herramienta de software que se utilice.

GRÁFICAS DE DISPERSIÓN E HISTOGRAMAS
.

.
GRÁFICA DE DISPERSIÓN
Los ejes solamente pueden ser valores numéricos y los puntos no se pueden unir.

.
HISTOGRAMA
Sirve para ver la distribución de las frecuencias de una variable, es diferente a la gráfica de barras.
.
Las barras van pegadas
El orden en el EJE X es ascendente (de menor < a > mayor)
Es TAL CUAL como se presenta la distribuciòn de las frecuencias
Se ve lo que HAY y lo que NO hay

.
BOXPLOT
Nos muestra elementos como el mínimo, el máximo, el primer cuartil, la mediana y el tercer cuartil.

Me parece que lo lei en un comentario, pero estaría bueno un curso de pura y exclusivamente todos gráficos con diferentes librerias de R y python

Video para entender Box-plot

https://www.youtube.com/watch?v=vdvO6SJyVmA

Comparto notas de clase sobre las gráficas:

  • Scarletplot
  • Histograma
  • Boxplot

El diagrama de barras (o gráfico de barras) es un gráfico que se utiliza para representar datos de variables cualitativas o discretas. Está formado por barras rectangulares cuya altura es proporcional a la frecuencia de cada uno de los valores de la variable.

SCATTER PLOT
Es el gráfico de los valores de una variable sobre otra. Viene a sugerir una relación entre dos variables, para comprobar una relación lineal o cuadratica, o ayudarnos a identificar patrones o clusters en los datos.

Pregunta: Cómo podríamos medir el tiempo que espera una persona en una fila para cada nº de caja?

Me salió plot(Cjas). lo puede ver en el siguiente enlace.
https://drive.google.com/file/d/1-rARhDevA2CYv9xnnZw9Uc2opBIat8E4/view?usp=sharing.

me salió plot(Cjas).

explicacion cajas, bigotes histogramas de lo que consta

Ejemplo básico con ScatterPlot donde se tiene el peso de los autos vs los caballos de potencia
como se observa vemos solo datos dispersos.

Pero que pasaría si colocáramos los países y con diferentes colores.

aca veo con mas claridad que Japón y usa tienen el mayor caballo de potencia y también observo que no existe autos de caballo de potencia demasiada baja en usa.

Gráficas de Dispersión e histogramas.
ScatterPlot: Mezclamos o cruzamos variables continuas o datos numéricas.
Gráfica de linea: unimos los puntos
Histograma: distribución de las frecuencias de una variable, barras pegadas, orden en el eje ejes de menor a mayor.
Gráficas de barras: Simplemente graficamos lo que hay, no importa el orden.
Box-plot: 5 elementos importantes en estadistica descriptiva:

Como lo entendí es que en el ScatterPlot como un resultado es separado al anterior y por eso no nos muestra un patron secuencial, si no que cada elemento es un experimiento independiente.

interesante!

La gráfica de dispersión puede ser en 3 dimensiones?