Platzi
Platzi

¡Invierte en ti y celebremos! Adquiere un plan Expert o Expert+ a precio especial.

Antes: $349
$259
Currency
Antes: $349
Ahorras: $90
COMIENZA AHORA
Termina en: 9D : 5H : 34M : 40S

Debes iniciar sesión

Para ver esta clase crea una cuenta sin costo o inicia sesión

Indexado y manejo de archivos CSV

5/29

Cuando David usa el operador % en la celda 2 este hace referencia a una magic command, hice este pequeño articulo/tutorial que espero ayude a agregar mas herramientas a sus cinturones de batman.

https://platzi.com/tutoriales/1794-pandas/6960-ipython-magics-commands/

La libreria de google

from google.colab import drive
drive.mount('/content/drive')

Crear nuevo directorio

dir_pandas = '/content/drive/My Drive/db/{}'.format('test.csv')

El data frame de la anterior clase,no se olviden importar numpy


dict_data = {
    'edad': [10,9,13,14,12,11,12],
    'cm': [115,110,130,155,125,120,125],
    'pais':['co','mx','co','mx','mx','ch','ch'],
    'genero':['M','F','F','M','M','M','F'],
    'Q1':[5,10,8,np.nan,7,8,3],
    'Q2':[7,9,9,8,8,8,9]
}

Solo como agregado. Si les marca error al hacer el directorio, recuerden que en el chunck anterior, nos movimos hacia la carpeta de Colab Notebooks, por lo que basta con hacer el

!mkdir db
para que quede.

Para revisar en que ruta se esta posicionado, se puede ejecutar
!pwd

Que sencillo se hace exportar hacia csv en python a partir de un dataframe mediante la sentence to_csv , incluyendo el separados , si se quiere o no indices , ext.

Para los compañeros, que trabajan con Jupiter, les comparto este tutorial, de 30 minutos, que me ha servido mucho.https://www.youtube.com/watch?v=8ASjvOIyyl8

Hasta el momento un excelente curso 😃

Por si a alguien le sirve :

que lindo hubiera sido saber lo de especificar el separador antes jajajaja

Excelente explicación!

Eliminar el indice de tu Dataframe en el csv

Guardar DataFrame

Hola compañeros, espero se encuentren muy bien, les comparto el diccionario para hacerlo de una forma dinámica, espero les ayude.

n_records = 20
dict_data = {"age": np.random.randint(10,16,n_records),
            "cm" : np.random.randint(100,161,n_records),
            "country": np.random.choice(["col","arg","mex","ch"],n_records),
            "gender": np.random.choice(["F","M"],n_records),
            "Q1": np.random.randint(1,11,n_records).astype(float),
            "Q2": np.random.randint(1,11,n_records).astype(float) }

dict_data["Q1"][np.random.randint(0,19,2)] = np.nan
df = pd.DataFrame(dict_data)

Convertí las columnas “Q1” y “Q2” a flotantes en caso de que queramos introducir NaNs arbitrariamente.

Saludos!!

Hola, a mi no me deja crear la carperta db como lo muestran en el video pero solo le agregue unas comitas y ya me dejo

<!mkdir  '/content/drive/MyDrive/Colab Notebooks'/db > 

Para importar datos desde los archivos de tu computador:

from google.colab import files
files.upload()

#Seleccionamos el archivo y luego:

nombrearchivo = pd.read_csv("nombrearchivo.csv")

Les comparto el Notebook que hice explicando paso a paso lo visto en clase. Espero que les sea de alguna utilidad:

https://colab.research.google.com/github/bl00p1ng/Curso-analisis-de-datos-con-Pandas-y-Python/blob/main/save_and_load.ipynb

Para guardar en JUPITER con Windows seria:

dir_pandas='E:\Programas\python\Pandas\{}'.format('prueba.csv')
df.to_csv (dir_pandas)

o

df.to_csv (r’E:\Programas\python\Pandas\prueba.csv’)

o cuando se desea guardar en la misma carpeta del Notebook

df.to_csv('example.csv')

Buenas noches compañeritos, para los que estén usando jupyter , y quieran guardar el archivo CSV de forma local, la manera es la siguiente :

df.to_csv(r’/home/user/Documentos/Python/Pandas/test.csv’)

despues de r’ se debe espeficar la ruta,cerrando con la comilla al final de la ruta '.

de igual manera si queremos eliminar el index:

df.to_csv(r’/home/user/Documentos/Python/Pandas/test.csv’, index=False)

Pd. Yo uso Linux, para las personas que usan windows la ruta debe ser algo como :

df.to_csv (r’C:\Users…’)

from google.colab import drive

drive.mount(’/content/drive’

%cd ‘/content/drive/My Drive/Colab Notebooks’

!ls

!mkdir /content/drive/My\ Drive/Colab\ Notebooks/db

df.to_csv(<file_path>, sep=’|’, index=False) ⇒ the default value to sep is ‘,’

pd.read_csv(<file_path>, sep=’|’)

Excelente clase y excelente profesor, que buena herramienta es pandas, yo ando trabajando en jupyter notebooks y solo cree un nuevo directorio en mi pc

Que gran curso, cada paso explicado a detalle.

Muy vacano no sabia que existia esta maravilla de ayuda que nos brinda google colaboratory ya que cuando trabajaba por VS Code se demora mucho en ejecutar cada acción.

Crear un directorio (folder, carpeta) con espacios en el nombre

Guardar CSVs en distintos formatos

Leer un csv con un separador distinto a una coma

Leer CSV como dataframe

😮 Interesante. No sabía que usar {} permitía reemplazar elementos, lo aprendí aquí 🤓

"Hola {}".format("bla bla bla bla") 

Esto reemplaza el “{}” con “bla bla bla”

La verdad que me parece de los mejores cursos de platzi hasta el momentos, brindan mucho tips y trucos

Si les marca error al poner
!ls /content/drive/My Drive/Colab Notebooks/db

solo pongan ls o !ls porque recuerden que ya estan en la carpeta db

Tambien pueden usar la funciona .format() de esta forma.

dir_pandas = f"/content/drive/My Drive/Pandas/db/{'test.csv'}"

Tengo años usando R y me negaba a usar Python y pandas para datos. Pero con este curso estoy fascinado!

La creación del directorio la pueden hacer directamente desde Python. Un ejemplo de esto sería:

import os

dir_pandas = './db'


try:
    os.mkdir(dir_pandas)
except FileExistsError:
    print('Directory already exists')


df.to_csv(f'{dir_pandas}/test.csv')

Por favor alguien me ayuda con este errorCaptura.JPG

Me encanta este curso

interesante

Cuando David usa el operador % en la celda 2 este hace referencia a una magic command, hice este pequeño articulo/tutorial que espero ayude a agregar mas herramientas a sus cinturones de batman.

https://platzi.com/tutoriales/1794-pandas/6960-ipython-magics-commands/

La libreria de google

from google.colab import drive
drive.mount('/content/drive')

Crear nuevo directorio

dir_pandas = '/content/drive/My Drive/db/{}'.format('test.csv')

El data frame de la anterior clase,no se olviden importar numpy


dict_data = {
    'edad': [10,9,13,14,12,11,12],
    'cm': [115,110,130,155,125,120,125],
    'pais':['co','mx','co','mx','mx','ch','ch'],
    'genero':['M','F','F','M','M','M','F'],
    'Q1':[5,10,8,np.nan,7,8,3],
    'Q2':[7,9,9,8,8,8,9]
}

Solo como agregado. Si les marca error al hacer el directorio, recuerden que en el chunck anterior, nos movimos hacia la carpeta de Colab Notebooks, por lo que basta con hacer el

!mkdir db
para que quede.

Para revisar en que ruta se esta posicionado, se puede ejecutar
!pwd

Que sencillo se hace exportar hacia csv en python a partir de un dataframe mediante la sentence to_csv , incluyendo el separados , si se quiere o no indices , ext.

Para los compañeros, que trabajan con Jupiter, les comparto este tutorial, de 30 minutos, que me ha servido mucho.https://www.youtube.com/watch?v=8ASjvOIyyl8

Hasta el momento un excelente curso 😃

Por si a alguien le sirve :

que lindo hubiera sido saber lo de especificar el separador antes jajajaja

Excelente explicación!

Eliminar el indice de tu Dataframe en el csv

Guardar DataFrame

Hola compañeros, espero se encuentren muy bien, les comparto el diccionario para hacerlo de una forma dinámica, espero les ayude.

n_records = 20
dict_data = {"age": np.random.randint(10,16,n_records),
            "cm" : np.random.randint(100,161,n_records),
            "country": np.random.choice(["col","arg","mex","ch"],n_records),
            "gender": np.random.choice(["F","M"],n_records),
            "Q1": np.random.randint(1,11,n_records).astype(float),
            "Q2": np.random.randint(1,11,n_records).astype(float) }

dict_data["Q1"][np.random.randint(0,19,2)] = np.nan
df = pd.DataFrame(dict_data)

Convertí las columnas “Q1” y “Q2” a flotantes en caso de que queramos introducir NaNs arbitrariamente.

Saludos!!

Hola, a mi no me deja crear la carperta db como lo muestran en el video pero solo le agregue unas comitas y ya me dejo

<!mkdir  '/content/drive/MyDrive/Colab Notebooks'/db > 

Para importar datos desde los archivos de tu computador:

from google.colab import files
files.upload()

#Seleccionamos el archivo y luego:

nombrearchivo = pd.read_csv("nombrearchivo.csv")

Les comparto el Notebook que hice explicando paso a paso lo visto en clase. Espero que les sea de alguna utilidad:

https://colab.research.google.com/github/bl00p1ng/Curso-analisis-de-datos-con-Pandas-y-Python/blob/main/save_and_load.ipynb

Para guardar en JUPITER con Windows seria:

dir_pandas='E:\Programas\python\Pandas\{}'.format('prueba.csv')
df.to_csv (dir_pandas)

o

df.to_csv (r’E:\Programas\python\Pandas\prueba.csv’)

o cuando se desea guardar en la misma carpeta del Notebook

df.to_csv('example.csv')

Buenas noches compañeritos, para los que estén usando jupyter , y quieran guardar el archivo CSV de forma local, la manera es la siguiente :

df.to_csv(r’/home/user/Documentos/Python/Pandas/test.csv’)

despues de r’ se debe espeficar la ruta,cerrando con la comilla al final de la ruta '.

de igual manera si queremos eliminar el index:

df.to_csv(r’/home/user/Documentos/Python/Pandas/test.csv’, index=False)

Pd. Yo uso Linux, para las personas que usan windows la ruta debe ser algo como :

df.to_csv (r’C:\Users…’)

from google.colab import drive

drive.mount(’/content/drive’

%cd ‘/content/drive/My Drive/Colab Notebooks’

!ls

!mkdir /content/drive/My\ Drive/Colab\ Notebooks/db

df.to_csv(<file_path>, sep=’|’, index=False) ⇒ the default value to sep is ‘,’

pd.read_csv(<file_path>, sep=’|’)

Excelente clase y excelente profesor, que buena herramienta es pandas, yo ando trabajando en jupyter notebooks y solo cree un nuevo directorio en mi pc

Que gran curso, cada paso explicado a detalle.

Muy vacano no sabia que existia esta maravilla de ayuda que nos brinda google colaboratory ya que cuando trabajaba por VS Code se demora mucho en ejecutar cada acción.

Crear un directorio (folder, carpeta) con espacios en el nombre

Guardar CSVs en distintos formatos

Leer un csv con un separador distinto a una coma

Leer CSV como dataframe

😮 Interesante. No sabía que usar {} permitía reemplazar elementos, lo aprendí aquí 🤓

"Hola {}".format("bla bla bla bla") 

Esto reemplaza el “{}” con “bla bla bla”

La verdad que me parece de los mejores cursos de platzi hasta el momentos, brindan mucho tips y trucos

Si les marca error al poner
!ls /content/drive/My Drive/Colab Notebooks/db

solo pongan ls o !ls porque recuerden que ya estan en la carpeta db

Tambien pueden usar la funciona .format() de esta forma.

dir_pandas = f"/content/drive/My Drive/Pandas/db/{'test.csv'}"

Tengo años usando R y me negaba a usar Python y pandas para datos. Pero con este curso estoy fascinado!

La creación del directorio la pueden hacer directamente desde Python. Un ejemplo de esto sería:

import os

dir_pandas = './db'


try:
    os.mkdir(dir_pandas)
except FileExistsError:
    print('Directory already exists')


df.to_csv(f'{dir_pandas}/test.csv')

Por favor alguien me ayuda con este errorCaptura.JPG

Me encanta este curso

interesante