¿Qué es pandas?
Clase 1 de 28 • Curso de Manipulación y Análisis de Datos con Pandas y Python
Resumen
El término Pandas viene de Panel Datas - Pan (Paneles) - Da (Datos). Es una librería de datos creada en 2008 por Wes McKinney. Los paneles de datos son estructuras de datos organizados por categorías, en las que podemos tener los siguientes tipos de variables:
- Texto
- Booleano
- Numérico
Características de Pandas
Es la librería o módulo más utilizado por todos los científicos de datos. Sus áreas de empleo principal son:
- Analítica
- Estadística
- Economía
- Análisis de lenguaje, entre otras.
La forma en que se manipulan los datos permite extraer de forma muy simple gran valor de los mismos.
Historia
- Librería creada por Wes McKinney en 2008
- Necesidad que da origen a la iniciativa: manejo de volúmenes de datos en mercados financieros
Ventajas de Pandas
- Reduce líneas de código a diferencia de Java o C
- Diseñada especialmente para análisis de matrices de datos en 2D
- API fácil y concisa
-Múltiples funciones
Desventajas de Pandas
- Incompatibilidad con manejo de matrices de datos en 3D (se recomienda usar NumPy o Numba)
- Curva de aprendizaje lenta
Aporte creado por: Daniela Zuleta