Contenido del curso
PIP y Entornos Virtuales
Práctica
Python en contenedores de Docker
Próximos pasos
Pandas
Contenido del curso
Pandas
Yuli Alexandra Pulido Castañeda
EstudianteJeinfferson Bernal G
EstudianteJoaquin Romero Flores
EstudianteEduardo Blanco
EstudianteJose Villarroel
EstudianteChanel Mariannis Paredes Sánchez
EstudianteMichelle Verano
EstudianteEduardo Peña Ramos
EstudianteAnabel Chavez Berumen
EstudianteCarlos Rodríguez
EstudianteJuan Castro
ProfesorCarlos Rodríguez
EstudianteMANUEL ALEJANDRO CHAVEZ CARDONA
EstudianteNicolas Cardenas Camelo
EstudianteJose Alejandro Pantoja Giraldo
EstudianteDiego Vergara
EstudianteJorge Miguel Diaz
EstudianteMauricio Bustos
EstudianteJuan Betancur
EstudiantePablo Alejandro Figueroa
EstudianteHiram Jiménez
EstudianteMichael Nassee Buritica Ortega
EstudianteCamilo Mejía
EstudianteJhon Freddy Tavera Blandon
EstudianteRuddy Ramos
EstudianteLuis Magallanes
EstudianteNicolas Alpargatero
Estudiantejhon velasque
EstudianteFernando Jesús Núñez Valdez
EstudianteEugenio Ramón Yennerich
EstudianteEugenio Ramón Yennerich
Estudianteivan irigoyen
EstudiantePaola Alapizco
EstudianteLuis Cerén
EstudianteLeandro Tenjo
EstudiantePablo Alejandro Figueroa
EstudianteMauricio Combariza
EstudianteAndres Cervantes
EstudianteHola Chicos! :D PANDAS
Activar anbiente del proyecto
source env/bin/activate
Verificar
which python3
Ver que hay dentro del archivo en el cual se evidencia que no hay pandas
cat reqruirements.txt
Agregar nueva libreria
pip3 install pandas
Verificar librerias instaladas
pip3 freeze
Actualizar el documento que contiene las librerias
pip3 freeze > requirements.txt
Gracias Yuli por el aporte!
Gracias Yuli! por tomarte el tiempo por compartir en todas las clases.
Si estás en VS Code y te aparece un error o el ''warning'': <import pandas could not be resolved from source pylance (reportmissingmodulesource)> Te puede funcionar esto:
1.- Presiona Ctrl+Shift+P, luego busca "Python: Select Interpreter".
2.- Haz click en "Enter interpreter path" y sigue con "Find..".
3.- Encuentra en tu proyecto la carpeta del entorno virtual.
4.- Haz click en bin y después en Python3 para seleccionarlo como intérprete.
Unos segundos después deja de aparecer el error o la advertencia.
Excelente! Justo tenía ese error. Gracias.
Muchas gracias!!
Me paso un frio interesante por la espalda en el momento que Nicolas dijo que hay curso especificos para pandas y matplotlib. Osea, son tan grande, que requieren su propio curso. Estoy emocionado por verlos.
Así es, es un muy buen curso, te recomiendo estos dos:
https://platzi.com/cursos/pandas-numpy/ https://platzi.com/cursos/matplotlib-seaborn/
Saludos!
y están muy buenos la verdad.
Un curso que se base en esto sería genial: automatización de entornos de trabajo en python. Pruebas estáticas como el linter pylint junto con el formateador black que son los más usados. Configuración de estos de acuerdo al framework utilizado (Django, Flask, FastAPI).
.
Automatización de paquetes con librerías que usan en automático un ambiente virtual y actualizan en requirements.txt como pipres. Librerías de como pre-commits para evitar errores antes de hacer commits o configuración manual con bash dentro de git.
Estoy haciendo todo lo posible para que muy pronto tengamos un curso de buenas prácticas en Python donde estudiemos herramientas como pep8, pylint y black. Las demás ideas también suenan muy bien. Gracias por la recomendación. :green_heart:
Btw, en este mismo curso más adelante también aprendemos a hacer ciertas automatizaciones con Docker para trabajar tanto con herramientas de Data Science como de Desarrollo Web. Igual se puede profundizar más, pero se módulo final te va a gustar. :D
Genial profe @juandc
CODIGO CON COMENTARIOS PARA COPIAR Y PEGAR EN SU VSCODE
import utils import read_csv import charts import pandas as pd def run(): #Código para generar el pie chart sin usar PANDAS ''' data = read_csv.read_csv('data.csv') data = list(filter(lambda item : item['Continent'] == 'South America',data)) countries = list(map(lambda x: x['Country'], data)) percentages = list(map(lambda x: x['World Population Percentage'], data)) charts.generate_pie_chart(countries, percentages) ''' # #Código equivalente usando PANDAS # df(dataframe) df = pd.read_csv("data.csv") # Nos ahorramos el método creado read_csv.py df = df[df['Continent'] == 'South America'] # Equivalente a -> data = list(filter(lambda item : item['Continent'] == 'South America',data)) countries = df['Country'].values # Equivalente a -> countries = list(map(lambda x: x['Country'], data)) percentages = df['World Population Percentage'].values # Equivalente a -> percentages = list(map(lambda x: x['World Population Percentage'], data)) charts.generate_pie_chart(countries, percentages) data = read_csv.read_csv('data.csv') country = input('Type Country => ') print(country) result = utils.population_by_country(data, country) if len(result) > 0: country = result[0] print(country) labels, values = utils.get_population(country) charts.generate_bar_chart(country['Country'], labels, values) if __name__ == '__main__': run()
Gracias amigo, no se que le pasaba al mio que no me guardaba los graficos de barras, pero con el tuyo ya me guarda todo
Bueno aqui vamos, lento pero seguro jejeje
Si les sale el siguiente error al guardar requirements
bash: requirements.txt: cannot overwrite existing file
usen el siguiente comando
pip freeze | tee requirements.txt
Gracias buen hombre!
sabía que iba a encontrar la solución en los comentarios
Usando ; pueden ejecutar comando de manera sincrónica, así podrán instalar un paquete y luego actualizarlo en el requirements.txt
pip3 install pandas==1.4.0 ; pip3 freeze > requirements.txt
Hola!
con ; si no se instala pandas igual se ejecuta el freeze
con && se ejecutará el freeze solo si se instaló pandas
Es importante comentar que desde vscode se recomienda seleccionar el ambiente virtual creado, de otra manera los métodos y funciones de pandas no los reconoce si se ejecuta desde el ide (aún cuando x bash si funciona).
Tengo el inconveniente que no me aparece el entorno virtual ese del interpreter
Una buena práctica, o al menos para mí, es enumerar los dataframes por jerarquía, por ejemplo:
df = pd.read_csv('data.csv') df2 = df[df['Continent'] == '<continente>']
Así sabes que el df2 es derivado del df.
Pandas es una biblioteca de Python que proporciona herramientas de análisis y manejo de datos de manera rápida y eficiente. La biblioteca está diseñada para hacer que sea fácil trabajar con datos tabulares y estructurados en Python. Algunas de las cosas que puedes hacer con pandas son:
Leer y escribir diferentes formatos de archivo de datos, como CSV, Excel, JSON y SQL.
Limpiar y preparar datos para el análisis.
Filtrar, agrupar y transformar datos de manera sencilla.
Calcular estadísticas y hacer gráficos para visualizar los datos.
Pandas es una herramienta muy útil para cualquiera que tenga que trabajar con datos en Python. Si estás interesado en el análisis de datos, es muy probable que encuentres la biblioteca pandas muy útil.
Gracias por el aporte.
actualmente me encuentro trabajando con la version 3.11 de python y para las instalaciones no hace falta porner pip3, simplemente con pip install paquete lo hace.
Ojalá hubiera explicado mejor la lógica de pandas. Intente usarla en la otra function y nada, ya será después cuando aprenda la librería
de que curso crearon eso de leer los archivos con lambda ?
Esta es la clase en específico y este es el Curso de Python Comprehensions, Funciones y Manejo de Errores!!
Hola. Me sale el siguiente error luego de instalar pandas: "Import 'pandas' could not be resolved from source ' Sin embargo, me sigue ejecutando el script con normalidad. Mi miedo es a la hora de empaquetar todo. Gracias!
SOLUCIONADO
iNSTALAR DE LA SIGUIENTE FORMA DENTRO DEL ENTORNO :
sudo pip3 install pandas
No puedo visualizar los gráficos ya que luego de escribir el país en el "Type country" me sale el error "KeyError: 'Country'" proveniente de la línea de código: def population_by_country(data, country): result = list(filter(lambda item: item["Country"] == country, data)) return result Ya chequie que en "Data.csv" la columna se llame así y no "Country/Territory". Si alguien me lo soluciona me haría muy feliz
Hola Ivan :D a mi me pasó lo mismo, lo que hice fue cambiar "Country" por "Country/Territory" como esta en el archivo .csv . Pero también puedes hacerlo al revez y cambiar el nombre de la columna en el .csv, de "Country/Territory" a solo "Country". . Con ambas alternativas funciona :D
En algunos casos tratando de instalar los paquetes se me ha ido un "pip" a secas en vez del "pip3". De igual manera se ejecuta el comando. Alguien me podria explicar por que corren los dos y si hay alguna diferencia.
Python tuvo un cambio grande de estructura entre la version 2 y la version 3.
…
La idea era que todos migrara a Python 3, pero pues no todos pueden hacer el cambio tan rápido. Entonces durante ese tiempo se usaba el comando python para referirse a la version 2 de python y python3 para la version 3.
.
Lo mismo pasaba con el comando pip y pip3
…
Pero eso paso ya hace bastante tiempo. Incluso los sistemas operativos ya usan python por defecto.
.
Puedes usar los comandos los siguientes comandos para verificar que binario usa cada uno.
which python which pyhton3
. y los siguientes comandos para ver que version de python usa cada binario.
python3 -V python -V
Probablemente ambos usen la misma version de python3; si es así, no te preocupes. .
Espero haberte dado un poco de luz. Cuanto más aprendes, más en control te sientes.
Nunca pares de aprender 💚
Pandas!!!!
Una de las mejores librerias de python!!!
Mi fork del proyecto: https://github.com/Cervantes21/curso-python-pip
:D Saludos!! Regreso el follow