Sereies con tipo de dato
series_test = pd.Series([100,200,300],dtype=float)
series_test
Introducción
Qué aprenderás sobre la ingeniería de datos
Archivos del curso y Slides
¿Qué es la Ciencia e Ingeniería de Datos?
Roles
Configuración del ambiente
Jupyter Notebooks
Profundizando en tipos de datos
Tipos de datos
Fuentes de datos
ETL
Web scraping
Introducción a las tecnologías web
Realizar solicitudes HTTP con Python
¿Cómo trabajar con un documento HTML?
Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping
Solicitudes a la web: Requests
Implementando nuestro web scrapper: Configuración
Implementando nuestro web scrapper: Obteniendo enlaces del front page
Implementando nuestro web scrapper: Obteniendo artículos
Obtención de datos del Artículo
Persistiendo la información "scrapeada"
Pandas
Introducción a Pandas
Estructura de datos: Series
Estructura de datos: DataFrames
Índices y selección
Data wrangling con Pandas
Creación de la receta: preparando la automatización
¿Cómo trabajar con datos faltantes?
Operaciones con Series y DataFrames
Limpiando detalles adicionales
Limpiando detalles en nuestro proyecto
Enriquecimiento de los datos
Valores duplicados en Jupyter
Valores duplicados en Python
Visualización de datos
Intro a Sistemas de Datos
Introducción a los sistemas de datos
Automatización del Pipeline
Cargando datos a SQLite
Contenido Bonus
¿Por qué usar la nube?
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Series es un vector unidimensional, para poder acceder a esta lista podemos usar posiciones o labels, siendo este último el preferido para manipular las series. Una diferencia importante sobre las listas de Python es que los datos son homogéneos, es decir solo podemos tener un tipo de dato por cada Serie.
Las Series se pueden crear a partir de cualquier secuencia(listas, tuplas, arrays de numpy y diccionarios).
En Python tenemos la filosofía del Duck Typing, si se ve como un pato y hace cuac
, a ese animal le llamamos pato, si una serie se comporta una lista, se accede como una lista en principio deberíamos llamarla lista, pero esto no es así.
Una mejor aproximación para inicializar Series es utilizar diccionarios.
Aportes 38
Preguntas 5
Sereies con tipo de dato
series_test = pd.Series([100,200,300],dtype=float)
series_test
otra forma de instertar series:
series_test3 = pd.Series([11,13,17,19],
index = ['a','b','c','d'])
series_test3
PANDAS, una libreria de codigo abierto usada para analisis de datos en Pyton, su nombre se deriva del termino PANel Data
pd es la convención de pandas
el tipo de formato de la serie si es numerica por defecto es integer
Excelente explicacion y sesion de clases
En Pandas son muy importantes los indices de las Series, por eso es conveniente siempre crear las Series basadas en diccionarios.
Qué buena forma de entender los diccionarios en Python.
No entiendo, porque sale este error, me explican por favor
Pandas fue utilizado para normalizar todos los datos recolectados de varios telescopios para construir la primer imagen de un hoyo negro.
<Series
import pandas as pd
series_test = pd.Series([100, 200, 300])
series_test
import pandas as pd
series_test = pd.Series([100, 200, 300])
series_test
0 100
1 200
2 300
dtype: int64
series_test2 = pd.Series({1999: 48,
2000: 65,
2001: 89})
series_test2
1999 48
2000 65
2001 89
dtype: int64>```
Series es un vector unidimensional
Las Series se pueden crear a partir de cualquier secuencia
import pandas as pd
series_test = pd.Series({‘a’: 100, ‘b’: 200, ‘c’: 300})
#La mejor forma de otorgar significado es agregando labels
Loving Pandas
Pandas es una libreria muy interesante.-
Excelente explicacion
series_test2 = pd.Series({1999: 48,
2000: 65,
2001: 89})
series_test2```
Muy práctico este paquete
import pandas as pd
esta_es_my_serie = pd.Series([30,80,90,200])
esta_es_my_serie
0 30
1 80
2 90
3 200
dtype: int64
Tengo una duda con el modulo donde persistimos la data scrapeada, cuando quise abrir el csv estaba vació!
Pandas lo es todo. 😄
Buena explicación David!
<import pandas as pd
series_test = pd.Series([100,200,300])
series_test
series_test2 = pd.Series({1999:57,2000:75,2001:89})
series_test2>
interesante!
Otra forma de inicializar series
esto_es_otra_serie = pd.Series(range(2,21,2))
(esto_es_otra_serie)
0 2
1 4
2 6
3 8
4 10
5 12
6 14
7 16
8 18
9 20
dtype: int64
Me gusta Pandas…
Para que les salga tipo float
import pandas as pd
series1 = pd.Series([100.0,200.0,300.0])
print(series1)
0 100.0
1 200.0
2 300.0
dtype: float64```
Se entendio perfecto
descender = pd.Series(range(10,0,-1))
descender
0 10
1 9
2 8
3 7
4 6
5 5
6 4
7 3
8 2
9 1
dtype: int64
aqui el resultado de las series…
import pandas as pd
series_test = pd.Series([100, 200, 300])
series_test
series_test2 = pd.Series({1999:48,
2000:65,
2001:89})
¡A darle! sigo super emocinado con este curso.
Bien para comenzar
Acá esta la documentacion de las series de pandas:
En ella explican las series y que puedes realizar con ellas, además de los parámetros que les puedes pasar:
series_test = pd.Series([100, 200, 300], dtype=float, name='test')
series_test
output
0 100.0
1 200.0
2 300.0
Name: test, dtype: float64
Podemos notar como cambia el dtype en la salida porque la cambiamos y el nombre de la serie es test.
El indice es sumamente importante, porque si yo hago esto:
pd.Series(['Manzana','Banana','Pomelo'],[0,1,2], dtype=str)
Luego voy a poder ingresar al valor ‘Banana’ llamando al valor del indice 1
pd.Series(['Manzana','Banana','Pomelo'],[0,1,2], dtype=str)[0]```
Codigo
import pandas as pd
lista = [100,200,300]
series_test = pd.Series(lista)
print(series_test)
diccionario = {1999:48, 2000:65, 2001:89}
series_test2 = pd.Series(diccionario)
print(series_test2)
Gracias, sencilla explicación
Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.