No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Pandas

13/20
Recursos

Aportes 29

Preguntas 8

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Hola Chicos! 馃槃
PANDAS

  • Es una de las librerias mas utilizadas en python y nos sirven para analizar y manipular datos de archivos duros

Activar anbiente del proyecto

source env/bin/activate

Verificar

which python3

Ver que hay dentro del archivo en el cual se evidencia que no hay pandas

cat reqruirements.txt

Agregar nueva libreria

pip3 install pandas

Verificar librerias instaladas

pip3 freeze

Actualizar el documento que contiene las librerias

pip3 freeze > requirements.txt

Si est谩s en VS Code y te aparece un error o el 鈥樷榳arning鈥欌: <import pandas could not be resolved from source pylance (reportmissingmodulesource)> Te puede funcionar esto:

1.- Presiona Ctrl+Shift+P, luego busca 鈥淧ython: Select Interpreter鈥.

2.- Haz click en 鈥淓nter interpreter path鈥 y sigue con 鈥淔ind鈥︹.

3.- Encuentra en tu proyecto la carpeta del entorno virtual.

4.- Haz click en bin y despu茅s en Python3 para seleccionarlo como int茅rprete.

Unos segundos despu茅s deja de aparecer el error o la advertencia.

Me paso un frio interesante por la espalda en el momento que Nicolas dijo que hay curso especificos para pandas y matplotlib.
Osea, son tan grande, que requieren su propio curso.
Estoy emocionado por verlos.

Un curso que se base en esto ser铆a genial: automatizaci贸n de entornos de trabajo en python. Pruebas est谩ticas como el linter pylint junto con el formateador black que son los m谩s usados. Configuraci贸n de estos de acuerdo al framework utilizado (Django, Flask, FastAPI).
.
Automatizaci贸n de paquetes con librer铆as que usan en autom谩tico un ambiente virtual y actualizan en requirements.txt como pipres. Librer铆as de como pre-commits para evitar errores antes de hacer commits o configuraci贸n manual con bash dentro de git.

CODIGO CON COMENTARIOS PARA COPIAR Y PEGAR EN SU VSCODE

import utils
import read_csv
import charts
import pandas as pd

def run():
  
  #C贸digo para generar el pie chart sin usar PANDAS
  '''
  data = read_csv.read_csv('data.csv')
  data = list(filter(lambda item : item['Continent'] == 'South America',data))

  countries = list(map(lambda x: x['Country'], data))
  percentages = list(map(lambda x: x['World Population Percentage'], data))
  charts.generate_pie_chart(countries, percentages)
  '''
  # #C贸digo equivalente usando PANDAS
  
  # df(dataframe) 
  df = pd.read_csv("data.csv")  # Nos ahorramos el m茅todo creado read_csv.py
  df = df[df['Continent'] == 'South America']  
  # Equivalente a -> data = list(filter(lambda item : item['Continent'] == 'South America',data))
  countries = df['Country'].values
  # Equivalente a -> countries = list(map(lambda x: x['Country'], data))
  percentages = df['World Population Percentage'].values
  # Equivalente a -> percentages = list(map(lambda x: x['World Population Percentage'], data))
  charts.generate_pie_chart(countries, percentages)


  data = read_csv.read_csv('data.csv')
  country = input('Type Country => ')
  print(country)

  result = utils.population_by_country(data, country)

  if len(result) > 0:
    country = result[0]
    print(country)
    labels, values = utils.get_population(country)
    charts.generate_bar_chart(country['Country'], labels, values)

if __name__ == '__main__':
  run()

Bueno aqui vamos, lento pero seguro jejeje

Si les sale el siguiente error al guardar requirements

bash: requirements.txt: cannot overwrite existing file

usen el siguiente comando

pip freeze | tee requirements.txt

Usando ; pueden ejecutar comando de manera sincr贸nica, as铆 podr谩n instalar un paquete y luego actualizarlo en el requirements.txt

 pip3 install pandas==1.4.0 ; pip3 freeze > requirements.txt

Es importante comentar que desde vscode se recomienda seleccionar el ambiente virtual creado, de otra manera los m茅todos y funciones de pandas no los reconoce si se ejecuta desde el ide (a煤n cuando x bash si funciona).

Una buena pr谩ctica, o al menos para m铆, es enumerar los dataframes por jerarqu铆a, por ejemplo:

df = pd.read_csv('data.csv')
df2 = df[df['Continent'] == '<continente>']

As铆 sabes que el df2 es derivado del df.

Pandas es una biblioteca de Python que proporciona herramientas de an谩lisis y manejo de datos de manera r谩pida y eficiente. La biblioteca est谩 dise帽ada para hacer que sea f谩cil trabajar con datos tabulares y estructurados en Python. Algunas de las cosas que puedes hacer con pandas son:

  • Leer y escribir diferentes formatos de archivo de datos, como CSV, Excel, JSON y SQL.

  • Limpiar y preparar datos para el an谩lisis.

  • Filtrar, agrupar y transformar datos de manera sencilla.

  • Calcular estad铆sticas y hacer gr谩ficos para visualizar los datos.

Pandas es una herramienta muy 煤til para cualquiera que tenga que trabajar con datos en Python. Si est谩s interesado en el an谩lisis de datos, es muy probable que encuentres la biblioteca pandas muy 煤til.

Ojal谩 hubiera explicado mejor la l贸gica de pandas. Intente usarla en la otra function y nada, ya ser谩 despu茅s cuando aprenda la librer铆a

actualmente me encuentro trabajando con la version 3.11 de python y para las instalaciones no hace falta porner pip3, simplemente con pip install paquete lo hace.

Pandas!!!

Una de las mejores librerias de python!!!

Mi fork del proyecto:
https://github.com/Cervantes21/curso-python-pip

馃槃 Saludos!! Regreso el follow

驴hay alguien que me pueda explicar por qu茅 hay tantos dataframe para hacer un filtro? `dataframe = pd.read_csv('world_population.csv')聽 聽 ` `dataframe = dataframe[dataframe['Continent'] == 'Africa'] #confuse!` `countries = dataframe['Country/Territory'].values聽 聽 percentages = dataframe['World Population Percentage'].values聽 聽 ` `charts.graph_piechart(countries, percentages)` No hay una mejor forma de diferenciar qu茅 hace qu茅

Que nostalgia el volver a utilizar pandas en este proyecto. Se nota que esta libreria nos simplifica mucho el codigo y a su vez nos permite mejorar mas nuestra capacidad como programadores.

Interesante

13. Pandas

  • Cada vez que se instala una librer铆a se debe actualizar el archivo requirements.txt
  • Es buena pr谩ctica no reinventar la rueda

Importante recordar el paso 2 siempre que se realice el paso 1:
1 - Realizamos la instalaci贸n de la dependencia en cuesti贸n:

pip install pandas

2 - Agregamos la librer铆a instalada a nuestro archivo requirements.txt junto con las dem谩s dependencias necesarias para el correcto funcionamiento del proyecto:

pip freeze > requirements.txt

Podemos en Linux guardar el comando pip3 freeze > requirements.txt bajo un alias que nos permitir谩 ejecutarlo de manera m谩s r谩pida:

  1. Usen el comando sudo nano ~/.bashrc para entrar al archivo donde se guardan todos los alias de Python

  2. Al final del archivo pueden agregar su alias personalizado de la siguiente manera:

#Custom aliases
requirements='pip3 freeze > requirements.txt'
  1. Ahora usan Ctrl + O y Enter para guardar el archivo, y luego Ctrl + X para salir.

  2. Usan el comando source ~/.bashrc para cargar nuestro nuevo alias

  3. Finalmente, pueden usar el comando alias y hasta el final deber铆a aparecer nuestro nuevo comando.

Esto lo pueden hacer con cualquier comando en Linux, como los comandos de git, y si quieren saber m谩s al respecto les recomiendo el curso de terminal.

Hola buena tarde, me gustaria dar un aporte de un roblema que tenia pero ya solucione, el problema era este mensaje:
IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!

Importing the numpy c-extensions failed. This error can happen for
different reasons, often due to issues with your setup.

entoces que fue lo que hice,desinstale e instale todas las librerias de nuevo,la desisale conla consola usando

<pip3 uninstall pandas> 

y las instale, en mi caso como uso pycharn las instale manualmente con la seccion de ajustes->python interprete,pero creo que tambie se soluciona si las instalan con la consola y el texto donde guardan las librerias

En resumen, al parecer quedaron mal instaladas y por eso daba error.

Usando los apuntes de Yuli y la magia de ChatGPT:

隆Hola, chicos! 馃槃 Hoy aprenderemos sobre una biblioteca muy 煤til en Python llamada Pandas, que nos ayuda a analizar y manipular datos.

Pandas

Pandas es una biblioteca muy popular en Python que nos permite trabajar con datos de archivos como hojas de c谩lculo y bases de datos. Imagina que tienes una tabla llena de datos, como las calificaciones de todos tus compa帽eros de clase. Pandas hace que sea f谩cil organizar, analizar y manipular esos datos en Python.

Antes de comenzar, aseg煤rate de tener activado el entorno virtual de tu proyecto:

bash
Copy code
source env/bin/activate
Verifica que est茅s usando el Python correcto dentro del entorno virtual:

bash
Copy code
which python3
Ahora, vamos a verificar el contenido del archivo requirements.txt. Este archivo contiene la lista de bibliotecas que nuestro proyecto necesita:

bash
Copy code
cat requirements.txt
Para agregar la biblioteca Pandas a nuestro entorno virtual, ejecutamos el siguiente comando:

Copy code
pip3 install pandas
Despu茅s de instalar Pandas, verifica las bibliotecas instaladas en tu entorno virtual con el siguiente comando:

Copy code
pip3 freeze
Por 煤ltimo, actualiza el archivo requirements.txt para incluir la nueva biblioteca que acabamos de instalar. De esta manera, cualquier persona que trabaje en el proyecto sabr谩 que necesita instalar Pandas:

Copy code
pip3 freeze > requirements.txt
隆Y eso es todo! Ahora has instalado y configurado correctamente la biblioteca Pandas en tu proyecto. Con Pandas, podr谩s analizar y manipular datos de manera m谩s eficiente y sencilla. 隆Disfruta explorando todo lo que Pandas tiene para ofrecer! 馃槃

Para sus apuntes y su entendimiento:
.
驴Te acuerdas el proyecto que hab铆amos hecho en el curso de python; comprehensions, manejo de errores? esto es una forma de hacerlo m谩s f谩cil con Pandas:
.

.
-Explicaci贸n del c贸digo:
.

.

Interesante aprender como funciona, pero el funcionamiento de pandas ahorra mucho el proceso de an谩lisis de datos