Programación y Data Science
Clase 2 de 35 • Curso de Fundamentos de R
Contenido del curso
- 13

Qué es EDA: Exploratory Data Analysis
04:46 - 14

Gráficas de dispersión e histogramas.
04:31 - 15

Box Plot y su interpretación
07:08 - 16

EDA con dataset proyecto - Gráficas de dispersión.
08:09 - 17

EDA con histogramas.
10:37 - 18

EDA con dataset proyecto - histogramas - ggplot2
07:20 - 19

EDA con box plot- ggplot2
11:29 - 20

EDA con dataset proyecto - box plot- ggplot2 - dplyr
11:36 - 21

EDA con gráficas de dispersión con más de dos variables - ggplot2
07:48 - 22

EDA con dataset proyecto usando gráficas de dispersión con más de dos variables - ggplot2 - plotly
10:41
- 23

Buscando correlaciones con pairs
13:49 - 24

Confirmando correlaciones con la función cor
05:08 - 25

Buscando correlaciones con pairs en dataset proyecto
07:20 - 26

Confirmando correlaciones con la función cor en dataset proyecto.
07:35 - 27

Protegiéndonos de los peligros del promedio.
08:02 - 28

Eliminando los NA's para hacer los cálculos.
08:01 - 29

Estadística y visualización aplicada a análisis de datos de mercadeo.
01:45
La ciencia de datos es muy útil para cualquier área laboral. Actualmente estamos viviendo la cuarta revolución industrial gracias a la masiva cantidad de datos que generamos día a día, las empresas con estos datos buscan satisfacer de mejor forma nuestras necesidades, aquí nace el Big Data.
Big Data se compone de tres componentes claves:
- Volumen: tiene una cantidad de datos mucho mayor a la soportada dentro de un Excel.
- Velocidad: mayor a la acostumbrada con anterioridad.
- Variedad: se manejan datos estructurados y no estructurados como fotos, mensajes, etc.
Un científico de datos necesita tener los conocimientos de:
- Matemáticas y estadística.
- Programación.
- Conocimiento del negocio o contexto.
- Habilidad para visualizar los datos y capacidad para comunicarlos.