¿Qué es pandas?
Clase 1 de 28 • Curso de Manipulación y Análisis de Datos con Pandas y Python
Contenido del curso
Funcionalidades básicas y esenciales de pandas
Aplicando pandas
- 11

Funciones matemáticas
09:29 min - 12

Funciones más complejas y lambdas
07:09 min - 13

Múltiples índices
12:44 min - 14
Cómo trabajar con variables tipo texto en Pandas
02:08 min - 15

Concatenación de DataFrames: concat y append
10:51 min - 16

Merge de DataFrames
08:43 min - 17
¿Cómo lidiar con datos faltantes en tus DataFrames?
01:52 min - 18

Group by
11:58 min - 19
Cómo lidiar con datos duplicados en Pandas
01:04 min - 20

Aggregation y groupby
14:52 min - 21

Group By: extraer valor con variables categóricas
07:29 min - 22

Tablas dinámicas con Pivot Table
05:29 min - 23

Series de Tiempo
10:51 min - 24

Series de Tiempo: variables nulas
08:16 min - 25

Visualización y graficación de datos
12:50 min
Contenido extra
Resumen
El término Pandas viene de Panel Datas - Pan (Paneles) - Da (Datos). Es una librería de datos creada en 2008 por Wes McKinney. Los paneles de datos son estructuras de datos organizados por categorías, en las que podemos tener los siguientes tipos de variables:
- Texto
- Booleano
- Numérico
Características de Pandas
Es la librería o módulo más utilizado por todos los científicos de datos. Sus áreas de empleo principal son:
- Analítica
- Estadística
- Economía
- Análisis de lenguaje, entre otras.
La forma en que se manipulan los datos permite extraer de forma muy simple gran valor de los mismos.
Historia
- Librería creada por Wes McKinney en 2008
- Necesidad que da origen a la iniciativa: manejo de volúmenes de datos en mercados financieros
Ventajas de Pandas
- Reduce líneas de código a diferencia de Java o C
- Diseñada especialmente para análisis de matrices de datos en 2D
- API fácil y concisa
-Múltiples funciones
Desventajas de Pandas
- Incompatibilidad con manejo de matrices de datos en 3D (se recomienda usar NumPy o Numba)
- Curva de aprendizaje lenta
Aporte creado por: Daniela Zuleta