¿Qué es pandas?

1/28
Recursos

El término Pandas viene de Panel Datas - Pan (Paneles) - Da (Datos). Es una librería de datos creada en 2008 por Wes McKinney. Los paneles de datos son estructuras de datos organizados por categorías, en las que podemos tener los siguientes tipos de variables:

  • Texto
  • Booleano
  • Numérico

Características de Pandas

Es la librería o módulo más utilizado por todos los científicos de datos. Sus áreas de empleo principal son:

  • Analítica
  • Estadística
  • Economía
  • Análisis de lenguaje, entre otras.

La forma en que se manipulan los datos permite extraer de forma muy simple gran valor de los mismos.

Historia

  • Librería creada por Wes McKinney en 2008
  • Necesidad que da origen a la iniciativa: manejo de volúmenes de datos en mercados financieros

Ventajas de Pandas

  • Reduce líneas de código a diferencia de Java o C
  • Diseñada especialmente para análisis de matrices de datos en 2D
  • API fácil y concisa
    -Múltiples funciones

Desventajas de Pandas

  • Incompatibilidad con manejo de matrices de datos en 3D (se recomienda usar NumPy o Numba)
  • Curva de aprendizaje lenta

Aporte creado por: Daniela Zuleta

Aportes 42

Preguntas 6

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Muchachos acabo de agregar en la pestaña de tutoriales, un análisis exploratorio de los datos de fifa 19. para quienes esten interesados en profundizar en sus conocimientos.espero pueda ser de alguna ayuda.

¿Qué es PanDas?

Pan (Paneles) - Da (Datos)

Los paneles de datos son estructuras de datos organizados por categorías en donde se puede tener las siguiente tipos de variables:

  • Texto
  • Booleano
  • Numérico

Características

La librería o módulo más utilizado por todos los científicos de datos.
Áreas de empleo: analitica, estadística, economía, análisis de lenguaje, etc.
La forma en que se manipula los datos permite extraer de forma muy simple gran valor de los datos

Historia

Librería creada por Wes McKinney en 2008
Necesidad que da origen a iniciativa: Manejo de volúmenes de datos en mercados financieros

Ventajas

  • Reduce líneas de código a diferencia de Java o C
  • Diseñada especialmente para análisis de matrices de datos en 2D
  • API fácil y concisa
  • Múltiples funciones

Desventajas.

  • Incompatibilidad con manejo de matrices de datos en 3D (se recomienda usar NumPy o Numba)
  • Curva de aprendizaje lenta

Excelente,
¿Qué es pandas?
En Computación y Ciencia de datos, pandas es una biblioteca de software escrita como extensión de Numpy para manipulación y análisis de datos para el lenguaje de programación Python. En particular, ofrece estructuras de datos y operaciones para manipular tablas numéricas y series temporales.

Las características de la biblioteca son:

El tipo de datos son DataFrame para manipulación de datos con indexación integrada. Tiene herramientas para leer y escribir datos entre estructuras de dato en memoria y formatos de archivos variados
Permite la alineación de dato y manejo integrado de datos fallantes, la reestructuración y segmentación de conjuntos de datos, la segmentación vertical basada en etiquetas, indexación elegante, y segmentación horizontal de grandes conjuntos de datos, la inserción y eliminación de columnas en estructuras de datos.
Puedes realizar cadenas de operaciones, dividir, aplicar y combinar sobre conjuntos de datos, la mezcla y unión de datos.
Permite realizar indexación jerárquica de ejes para trabajar con datos de altas dimensiones en estructuras de datos de menor dimensión, la funcionalidad de series de tiempo: generación de rangos de fechas y conversión de frecuencias, desplazamiento de ventanas estadísticas y de regresiones lineales, desplazamiento de fechas y retrasos.
Como podemos ver, se trata de una herramienta realmente eficaz con multiplicidad de usos, lo que la convierte en excelente para el tratamiento de datos, y dada su sencillez, también es apta para usuarios poco expertos en la programación, lo que ha convertido a Python en un lenguaje de programación muy usado y muy demandado.

Otro profe físico jajaja saludos colega, también soy físico, afinando algunas cosillas con el curso de pandas.



Encontré jupyter notebooks en el VSCode 😍

Panel Data la libreria mas usadas por los Data Science en el mundo.

Un curso muy importante en la carrera de ciencia de datos.

Este es uno de esos cursos que se viene con todo y hay que saber aprovechar.

al fiiiiin

Wow ! , Sí Pandas !!

Here we go!!!

Que emoción estuve esperando mucho por este curso!!!..

Aqui empieza mi camino de Data Sciencie =)

Mucho gusto y muchas David y con mucho entusiamo iniciando este curso

Tengo las mejores expectativas en este curso

  • Pandas significa PANeles de DAtos. Fue inventada en 2008 para analizar grandes volúmenes de datos financieros.
  • Reduce líneas de código
  • Para datos multidimensionales, es preferible trabajar con una librería como NumPy

En este curso vemos muchos, muchos conceptos. Recomiendo practicar, es bastante importante, pero lo más probable es que se nos olviden.
.
Recomiendo que vean estos tutoriales de el compañero @antony_manotoa
.
vayan practicando poco a poco, este curso es un pilar bastante fundamental para lo que se viene en el futuro

👾

https://www.dataquest.io/blog/python-vs-r/

Pandas o R, segun la preferencia de cada uno

Here we go!

El nombre PANDAS deriva del término “datos de panel”, término de econometría que designa datos que combinan una dimensión temporal con otra dimensión transversal (Columnas x Filas).

A seguir aprendiendo

Estuve esperando este curso por un largo tiempo

Hacia falta este curso!
Cada vez se tiene más cursos cubriendo el pipeline de ML o DS.

Pandas, Pandas.

cool…

Se hizo del rogar este curso pero por fin salió

Uno de los cursos mas importantes para data Science

super

Espero aprender mucho, estoy muy emocionado!

perrfecto

Pandas pandas wiiiiiiiiiii

Pandas la veo desde que comencé en el análisis de datos.
La verdad es que nunca tomé un curso y solo veía código y que es lo que hacía, espero aprender mucho en este curso 😄

Para visualizar los resultado y poder compartirlos se puede hacer uso de la librería voila
voila.readthedocs.io

Pandas es nombre tan bonito que nunca me pregunte el porque se llamaba así y sin embargo puedo relacionarlo fácilmente con Panel Data.

Miren ese potencial

¿Añadirán en algún momento clases de manipulación de datos geográficos con OGR o con Geopandas?
Gracias.

Se nota el poder del curso

Emocionado por Comenzar, a darle!

Muchas expectativas con este curso no paremos de aprender

¡Que bien! 😃