Platzi
Platzi

¡Invierte en ti y celebremos! Adquiere un plan Expert o Expert+ a precio especial.

Antes: $349
$259
Currency
Antes: $349
Ahorras: $90
COMIENZA AHORA
Termina en: 9D : 6H : 31M : 12S

Debes iniciar sesión

Para ver esta clase crea una cuenta sin costo o inicia sesión

Series e Indexación y selección de datos

3/29

aun cuando no se ha mencionado como hacer filtrado de los datos, es muy útil para complementar este ejercicio de la serie sr.

  • sr.isnull().any() esta funcion adicionalmente nos regresa un booleano indicandonos si existe (TRUE) o no existe (FALSE) algun nan
  • si hacemos sr[sr.notnull()] nos regresa los valores de la serie que “NO” son nulos.

import pandas as pd

sr = pd.Series(<list>) ⇒ crear una serie

sr = pd.Series(dic, index=<list_of_indexes>) ⇒ crea una Serie con índices específicos.

sr.values ⇒ obtener los valores de la serie

sr.index ⇒ obtener los índices de la serie

sr.shape ⇒ obtener la dimensión

sr[<index>] ⇒ obtener un elemento de la serie a través de un índice

sr[<list_of_indexes>] ⇒ obtener valores a través de una lista índices.

sr.isnull() ⇒ Lista con True cuando el valor es nulo

sr.notnull() ⇒ Lista con True cuando el valor es no nulo

entretenido y emocionado

Con la funcion index de la seria podemos acceder a un iterator con los indeces de la serie, ej:

import pandas as pd
my_series = pd.Series([‘a’,‘b’,‘c’])
for series_index in my_series.index:
print(series_index)
Me va a iterar sobre los index de la serie de pandas… Genial 😄

Los índices son como la dirección de nuestro registro. Por el índice podemos acceder o llegar hasta el registro o registros que buscamos

Con pandas tambien podemos asignar como index a valores float, y accederlos a ellos como un diccionario

>>> import pandas as pd
>>> sr = pd.Series([1,2,3,4], index=[1.1, 1.2, 1.3, 1.4])

>>> sr[1.2]
> 2 # que corresponde al indice 1.2

Lo hice con los nulos con ayuda de pandas.

df[df.isnull()]

para mostrar solo los nulos

df[df.isnull()]

y los no nulos

df[df.notnull()]

¿En en este caso se hace uso de las reglas generales del codigo python?, es decir, los espacios, los # hashtag, las minusuculas, los guiones bajos “_”.

Hasta los momentos muy satisfecho con el desarrollo del curso

Y nosotros que?

dic_data={"Ven":845,"Ecu":768,"Per":986,"Bol":864,"Chl":1020}```

Quien siente que lo excluyeron de la lista del diccionario?

dic_data={"Ven":845,"Ecu":768,"Per":986,"Bol":864,"Chl":1020}```

excelente, lo había dejado en stand by, pero estoy de regreso

<h3>What’s a Serie?</h3>

Technically, Pandas Series is a one-dimensional labeled array capable of holding any data type. So, in terms of Pandas DataStructure, A Series represents a single column in memory, which is either independent or belongs to a Pandas DataFrame.

Cuando tenía muchos datos y quería filtrar rápido, intenté de todo, ahora se que algo útil es simplemente usar “[ cualquier condición ]” justo después de la variable.

esto va genial
me pregunto si existe una forma de en lugar hacerse desde el navegador se puede hacer desde un visual studio code o algo similar a una terminal pues me gustaria solo con oprimir la flecha hacia arriba usar el ultimo input como sucede en la terminal

super

Para los diccionarios, también podemos llamar únicamente los valores o tanto su llave como su valor:

dict_data.values() # Muestra los valores.

dict_data.items() # Muestro la llave y sus valores.

El curso no me parece para nada malo pero, considero solamente que son muchos comandos y códigos en una sola clase. Aunque de igual manera, es excelente.

Hice un Notebook en colab con apuntes paso a paso de esta clase, explicando que hace cada método visto en clase. Se los comparto en caso de que les sea de utilidad

https://colab.research.google.com/github/bl00p1ng/Curso-analisis-de-datos-con-Pandas-y-Python/blob/main/series_indexacion_seleccion_de_datos.ipynb

Tengo la sensación que …isnull() en su momento me sacará de muchos aprietos. 😃

Dejo el link para la documentación de Pandas en la clase Series.

excelente

aun cuando no se ha mencionado como hacer filtrado de los datos, es muy útil para complementar este ejercicio de la serie sr.

  • sr.isnull().any() esta funcion adicionalmente nos regresa un booleano indicandonos si existe (TRUE) o no existe (FALSE) algun nan
  • si hacemos sr[sr.notnull()] nos regresa los valores de la serie que “NO” son nulos.

import pandas as pd

sr = pd.Series(<list>) ⇒ crear una serie

sr = pd.Series(dic, index=<list_of_indexes>) ⇒ crea una Serie con índices específicos.

sr.values ⇒ obtener los valores de la serie

sr.index ⇒ obtener los índices de la serie

sr.shape ⇒ obtener la dimensión

sr[<index>] ⇒ obtener un elemento de la serie a través de un índice

sr[<list_of_indexes>] ⇒ obtener valores a través de una lista índices.

sr.isnull() ⇒ Lista con True cuando el valor es nulo

sr.notnull() ⇒ Lista con True cuando el valor es no nulo

entretenido y emocionado

Con la funcion index de la seria podemos acceder a un iterator con los indeces de la serie, ej:

import pandas as pd
my_series = pd.Series([‘a’,‘b’,‘c’])
for series_index in my_series.index:
print(series_index)
Me va a iterar sobre los index de la serie de pandas… Genial 😄

Los índices son como la dirección de nuestro registro. Por el índice podemos acceder o llegar hasta el registro o registros que buscamos

Con pandas tambien podemos asignar como index a valores float, y accederlos a ellos como un diccionario

>>> import pandas as pd
>>> sr = pd.Series([1,2,3,4], index=[1.1, 1.2, 1.3, 1.4])

>>> sr[1.2]
> 2 # que corresponde al indice 1.2

Lo hice con los nulos con ayuda de pandas.

df[df.isnull()]

para mostrar solo los nulos

df[df.isnull()]

y los no nulos

df[df.notnull()]

¿En en este caso se hace uso de las reglas generales del codigo python?, es decir, los espacios, los # hashtag, las minusuculas, los guiones bajos “_”.

Hasta los momentos muy satisfecho con el desarrollo del curso

Y nosotros que?

dic_data={"Ven":845,"Ecu":768,"Per":986,"Bol":864,"Chl":1020}```

Quien siente que lo excluyeron de la lista del diccionario?

dic_data={"Ven":845,"Ecu":768,"Per":986,"Bol":864,"Chl":1020}```

excelente, lo había dejado en stand by, pero estoy de regreso

<h3>What’s a Serie?</h3>

Technically, Pandas Series is a one-dimensional labeled array capable of holding any data type. So, in terms of Pandas DataStructure, A Series represents a single column in memory, which is either independent or belongs to a Pandas DataFrame.

Cuando tenía muchos datos y quería filtrar rápido, intenté de todo, ahora se que algo útil es simplemente usar “[ cualquier condición ]” justo después de la variable.

esto va genial
me pregunto si existe una forma de en lugar hacerse desde el navegador se puede hacer desde un visual studio code o algo similar a una terminal pues me gustaria solo con oprimir la flecha hacia arriba usar el ultimo input como sucede en la terminal

super

Para los diccionarios, también podemos llamar únicamente los valores o tanto su llave como su valor:

dict_data.values() # Muestra los valores.

dict_data.items() # Muestro la llave y sus valores.

El curso no me parece para nada malo pero, considero solamente que son muchos comandos y códigos en una sola clase. Aunque de igual manera, es excelente.

Hice un Notebook en colab con apuntes paso a paso de esta clase, explicando que hace cada método visto en clase. Se los comparto en caso de que les sea de utilidad

https://colab.research.google.com/github/bl00p1ng/Curso-analisis-de-datos-con-Pandas-y-Python/blob/main/series_indexacion_seleccion_de_datos.ipynb

Tengo la sensación que …isnull() en su momento me sacará de muchos aprietos. 😃

Dejo el link para la documentación de Pandas en la clase Series.

excelente