No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

No se trata de lo que quieres comprar, sino de quién quieres ser. Invierte en tu educación con el precio especial

Antes: $249

Currency
$209

Paga en 4 cuotas sin intereses

Paga en 4 cuotas sin intereses
Suscríbete

Termina en:

11 Días
19 Hrs
9 Min
46 Seg

Pandas

13/20
Recursos

Aportes 32

Preguntas 9

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Hola Chicos! 😄
PANDAS

  • Es una de las librerias mas utilizadas en python y nos sirven para analizar y manipular datos de archivos duros

Activar anbiente del proyecto

source env/bin/activate

Verificar

which python3

Ver que hay dentro del archivo en el cual se evidencia que no hay pandas

cat reqruirements.txt

Agregar nueva libreria

pip3 install pandas

Verificar librerias instaladas

pip3 freeze

Actualizar el documento que contiene las librerias

pip3 freeze > requirements.txt

Si estás en VS Code y te aparece un error o el ‘‘warning’’: <import pandas could not be resolved from source pylance (reportmissingmodulesource)> Te puede funcionar esto:

1.- Presiona Ctrl+Shift+P, luego busca “Python: Select Interpreter”.

2.- Haz click en “Enter interpreter path” y sigue con “Find…”.

3.- Encuentra en tu proyecto la carpeta del entorno virtual.

4.- Haz click en bin y después en Python3 para seleccionarlo como intérprete.

Unos segundos después deja de aparecer el error o la advertencia.

Me paso un frio interesante por la espalda en el momento que Nicolas dijo que hay curso especificos para pandas y matplotlib.
Osea, son tan grande, que requieren su propio curso.
Estoy emocionado por verlos.

Un curso que se base en esto sería genial: automatización de entornos de trabajo en python. Pruebas estáticas como el linter pylint junto con el formateador black que son los más usados. Configuración de estos de acuerdo al framework utilizado (Django, Flask, FastAPI).
.
Automatización de paquetes con librerías que usan en automático un ambiente virtual y actualizan en requirements.txt como pipres. Librerías de como pre-commits para evitar errores antes de hacer commits o configuración manual con bash dentro de git.

CODIGO CON COMENTARIOS PARA COPIAR Y PEGAR EN SU VSCODE

import utils
import read_csv
import charts
import pandas as pd

def run():
  
  #Código para generar el pie chart sin usar PANDAS
  '''
  data = read_csv.read_csv('data.csv')
  data = list(filter(lambda item : item['Continent'] == 'South America',data))

  countries = list(map(lambda x: x['Country'], data))
  percentages = list(map(lambda x: x['World Population Percentage'], data))
  charts.generate_pie_chart(countries, percentages)
  '''
  # #Código equivalente usando PANDAS
  
  # df(dataframe) 
  df = pd.read_csv("data.csv")  # Nos ahorramos el método creado read_csv.py
  df = df[df['Continent'] == 'South America']  
  # Equivalente a -> data = list(filter(lambda item : item['Continent'] == 'South America',data))
  countries = df['Country'].values
  # Equivalente a -> countries = list(map(lambda x: x['Country'], data))
  percentages = df['World Population Percentage'].values
  # Equivalente a -> percentages = list(map(lambda x: x['World Population Percentage'], data))
  charts.generate_pie_chart(countries, percentages)


  data = read_csv.read_csv('data.csv')
  country = input('Type Country => ')
  print(country)

  result = utils.population_by_country(data, country)

  if len(result) > 0:
    country = result[0]
    print(country)
    labels, values = utils.get_population(country)
    charts.generate_bar_chart(country['Country'], labels, values)

if __name__ == '__main__':
  run()

Bueno aqui vamos, lento pero seguro jejeje

Si les sale el siguiente error al guardar requirements

bash: requirements.txt: cannot overwrite existing file

usen el siguiente comando

pip freeze | tee requirements.txt

Usando ; pueden ejecutar comando de manera sincrónica, así podrán instalar un paquete y luego actualizarlo en el requirements.txt

 pip3 install pandas==1.4.0 ; pip3 freeze > requirements.txt

Es importante comentar que desde vscode se recomienda seleccionar el ambiente virtual creado, de otra manera los métodos y funciones de pandas no los reconoce si se ejecuta desde el ide (aún cuando x bash si funciona).

Una buena práctica, o al menos para mí, es enumerar los dataframes por jerarquía, por ejemplo:

df = pd.read_csv('data.csv')
df2 = df[df['Continent'] == '<continente>']

Así sabes que el df2 es derivado del df.

Pandas es una biblioteca de Python que proporciona herramientas de análisis y manejo de datos de manera rápida y eficiente. La biblioteca está diseñada para hacer que sea fácil trabajar con datos tabulares y estructurados en Python. Algunas de las cosas que puedes hacer con pandas son:

  • Leer y escribir diferentes formatos de archivo de datos, como CSV, Excel, JSON y SQL.

  • Limpiar y preparar datos para el análisis.

  • Filtrar, agrupar y transformar datos de manera sencilla.

  • Calcular estadísticas y hacer gráficos para visualizar los datos.

Pandas es una herramienta muy útil para cualquiera que tenga que trabajar con datos en Python. Si estás interesado en el análisis de datos, es muy probable que encuentres la biblioteca pandas muy útil.

Ojalá hubiera explicado mejor la lógica de pandas. Intente usarla en la otra function y nada, ya será después cuando aprenda la librería

actualmente me encuentro trabajando con la version 3.11 de python y para las instalaciones no hace falta porner pip3, simplemente con pip install paquete lo hace.

Pandas!!!

Una de las mejores librerias de python!!!

Mi fork del proyecto:
https://github.com/Cervantes21/curso-python-pip

😄 Saludos!! Regreso el follow

Hola tengo un problema al momento de ejecutar el script de app ya sea por consola o por visual Studio Code, lo ejecuto en el ambiente virtual creado con el comando python, que es el que está relacionado en el ambiente virtual ![](https://static.platzi.com/media/user_upload/image-f0cbd77a-d922-4934-8498-f548b89c6702.jpg) El error que me sale es este: ![](https://static.platzi.com/media/user_upload/image-196a11d6-ad5c-4872-8f48-a123a968a9c7.jpg) Me pueden ayudar por favor
De aquí derechito para el curso de Python para ciencia de datos, que antes se llamaba Curso de Pandas y Numpy.
### 5 Razones para Usar la Librería **Pandas**: 1. **Manipulación de Datos Fácil y Rápida**: Pandas facilita la limpieza, transformación y análisis de datos, permitiéndote manipular grandes conjuntos de datos con unas pocas líneas de código. 2. **Estructuras de Datos Potentes**: Proporciona dos estructuras de datos principales, DataFrame y Series, que son extremadamente útiles para trabajar con datos tabulares, similares a una hoja de cálculo o una tabla en una base de datos. 3. **Funciones de Análisis Integradas**: Pandas incluye muchas funciones para realizar estadísticas básicas, agrupamiento, agregación, y resumen de datos, lo que es útil para análisis exploratorio de datos. 4. **Soporte para Datos de Diferentes Fuentes**: Puedes leer datos desde archivos CSV, Excel, bases de datos SQL, y más, directamente en Pandas, lo que facilita la integración de diferentes fuentes de datos en tu análisis. 5. **Visualización Rápida**: Pandas se integra bien con bibliotecas de visualización como Matplotlib, permitiéndote crear gráficos y visualizaciones rápidas de los datos. ### 3 Razones por las que **Pandas** es Diferente a **Requests**: 1. **Propósito Diferente**: Pandas se utiliza para la manipulación y análisis de datos, mientras que Requests se utiliza para enviar y recibir solicitudes HTTP a través de la web. Pandas es para trabajar con datos en tu máquina, Requests es para comunicarse con sitios web o APIs. 2. **Manejo de Datos vs. Comunicación Web**: Pandas se enfoca en cómo organizar, limpiar y analizar datos en Python. Requests, en cambio, se enfoca en cómo conectar tu código con servidores en la web para obtener o enviar información. 3. **Entorno de Uso**: Pandas es principalmente para uso en entornos de análisis de datos (como análisis financiero, científico, etc.), mientras que Requests es más común en el desarrollo de aplicaciones web o automatización de tareas que requieren interacción con internet.
Pandas es una de las librerías más usadas para data science, es muy poderosa al momento de manejar datos, que emoción!!!
¿hay alguien que me pueda explicar por qué hay tantos dataframe para hacer un filtro? `dataframe = pd.read_csv('world_population.csv')    ` `dataframe = dataframe[dataframe['Continent'] == 'Africa'] #confuse!` `countries = dataframe['Country/Territory'].values    percentages = dataframe['World Population Percentage'].values    ` `charts.graph_piechart(countries, percentages)` No hay una mejor forma de diferenciar qué hace qué

Que nostalgia el volver a utilizar pandas en este proyecto. Se nota que esta libreria nos simplifica mucho el codigo y a su vez nos permite mejorar mas nuestra capacidad como programadores.

13. Pandas

  • Cada vez que se instala una librería se debe actualizar el archivo requirements.txt
  • Es buena práctica no reinventar la rueda

Importante recordar el paso 2 siempre que se realice el paso 1:
1 - Realizamos la instalación de la dependencia en cuestión:

pip install pandas

2 - Agregamos la librería instalada a nuestro archivo requirements.txt junto con las demás dependencias necesarias para el correcto funcionamiento del proyecto:

pip freeze > requirements.txt

Podemos en Linux guardar el comando pip3 freeze > requirements.txt bajo un alias que nos permitirá ejecutarlo de manera más rápida:

  1. Usen el comando sudo nano ~/.bashrc para entrar al archivo donde se guardan todos los alias de Python

  2. Al final del archivo pueden agregar su alias personalizado de la siguiente manera:

#Custom aliases
requirements='pip3 freeze > requirements.txt'
  1. Ahora usan Ctrl + O y Enter para guardar el archivo, y luego Ctrl + X para salir.

  2. Usan el comando source ~/.bashrc para cargar nuestro nuevo alias

  3. Finalmente, pueden usar el comando alias y hasta el final debería aparecer nuestro nuevo comando.

Esto lo pueden hacer con cualquier comando en Linux, como los comandos de git, y si quieren saber más al respecto les recomiendo el curso de terminal.

Hola buena tarde, me gustaria dar un aporte de un roblema que tenia pero ya solucione, el problema era este mensaje:
IMPORTANT: PLEASE READ THIS FOR ADVICE ON HOW TO SOLVE THIS ISSUE!

Importing the numpy c-extensions failed. This error can happen for
different reasons, often due to issues with your setup.

entoces que fue lo que hice,desinstale e instale todas las librerias de nuevo,la desisale conla consola usando

<pip3 uninstall pandas> 

y las instale, en mi caso como uso pycharn las instale manualmente con la seccion de ajustes->python interprete,pero creo que tambie se soluciona si las instalan con la consola y el texto donde guardan las librerias

En resumen, al parecer quedaron mal instaladas y por eso daba error.

Usando los apuntes de Yuli y la magia de ChatGPT:

¡Hola, chicos! 😄 Hoy aprenderemos sobre una biblioteca muy útil en Python llamada Pandas, que nos ayuda a analizar y manipular datos.

Pandas

Pandas es una biblioteca muy popular en Python que nos permite trabajar con datos de archivos como hojas de cálculo y bases de datos. Imagina que tienes una tabla llena de datos, como las calificaciones de todos tus compañeros de clase. Pandas hace que sea fácil organizar, analizar y manipular esos datos en Python.

Antes de comenzar, asegúrate de tener activado el entorno virtual de tu proyecto:

bash
Copy code
source env/bin/activate
Verifica que estés usando el Python correcto dentro del entorno virtual:

bash
Copy code
which python3
Ahora, vamos a verificar el contenido del archivo requirements.txt. Este archivo contiene la lista de bibliotecas que nuestro proyecto necesita:

bash
Copy code
cat requirements.txt
Para agregar la biblioteca Pandas a nuestro entorno virtual, ejecutamos el siguiente comando:

Copy code
pip3 install pandas
Después de instalar Pandas, verifica las bibliotecas instaladas en tu entorno virtual con el siguiente comando:

Copy code
pip3 freeze
Por último, actualiza el archivo requirements.txt para incluir la nueva biblioteca que acabamos de instalar. De esta manera, cualquier persona que trabaje en el proyecto sabrá que necesita instalar Pandas:

Copy code
pip3 freeze > requirements.txt
¡Y eso es todo! Ahora has instalado y configurado correctamente la biblioteca Pandas en tu proyecto. Con Pandas, podrás analizar y manipular datos de manera más eficiente y sencilla. ¡Disfruta explorando todo lo que Pandas tiene para ofrecer! 😄

Para sus apuntes y su entendimiento:
.
¿Te acuerdas el proyecto que habíamos hecho en el curso de python; comprehensions, manejo de errores? esto es una forma de hacerlo más fácil con Pandas:
.

.
-Explicación del código:
.

.

Interesante aprender como funciona, pero el funcionamiento de pandas ahorra mucho el proceso de análisis de datos