Qué es Series en Pandas y cómo crearlas

Curso de Ingeniería de Datos con Python

Contenido del curso

Introducción

Web scraping

Pandas

Intro a Sistemas de Datos

Contenido Bonus

38
¿Por qué usar la nube?
04:05 min

Tomar examen

Qué es Series en Pandas y cómo crearlas

Resumen

Domina Series en Pandas con ejemplos claros y buenas prácticas. Aquí verás cómo crear un vector unidimensional con datos homogéneos, usar labels para acceder con sentido semántico y entender cómo Pandas infiere el tipo de datos. Ideal para ciencia de datos donde el índice y el significado importan.

¿Qué es Series en Pandas y por qué importa?

Una Series es un vector unidimensional con un índice asociado. A diferencia de las listas de Python, las Series contienen datos homogéneos: todos del mismo tipo (strings, enteros, booleanos o floats). Puedes acceder por posición o por label, siendo este último el método preferido cuando buscas significado en tus datos.

Compuesta por valores, índice y tipo de dato.
Acceso por posición o por label semántico.
Datos homogéneos por diseño.
Inferencia automática del tipo de dato.
Cuidado mental si vienes de listas en Python.
Idea de duck typing: si parece lista y se usa como lista, no por eso es lista.

¿Cómo crear Series con listas, tuplas, arrays y diccionarios?

Puedes crear Series desde cualquier secuencia: listas, tuplas, arrays de NumPy y diccionarios. Pasar solo una lista crea un índice posicional por defecto. Si quieres labels significativos, conviene usar un diccionario o un parámetro opcional como “columns” según se menciona, para inicializar con etiquetas explícitas.

¿Cómo crear una Series desde una lista en Pandas?

import pandas as pd

series_test = pd.Series([100, 200, 300])
series_test

Índice posicional: 0, 1, 2.
Valores: 100, 200, 300.
Tipo inferido: int64.
Clave práctica: Pandas infiere el tipo por los datos.

¿Cómo inicializar con un diccionario y labels explícitos?

import pandas as pd

ventas_por_anio = pd.Series({
    1999: 48000,
    2000: 65000,
    2001: 89000
})
ventas_por_anio

Índice con significado: 1999, 2000, 2001.
Acceso por label: ventas_por_anio[2000].
Semántica clara: representa ventas por año.
Mejora la lectura y el análisis en ciencia de datos.

¿Cómo leer el índice, los labels y el tipo de datos?

Al imprimir una Series, observa sus tres piezas clave: valores, índice e int64 (u otro dtype). El índice posicional surge al pasar una lista; los labels aparecen al usar diccionarios o al definirlos explícitamente. En análisis, los labels aportan significado, no solo ubicación.

Índice posicional: útil para pruebas rápidas.
Labels semánticos: mejor para análisis reales.
Tipo de dato homogéneo: toda la Series comparte dtype.
Conversión posible: puedes cambiar el dtype si lo necesitas.
Convención del namespace en ciencia de datos: usar pd para Pandas.
Contexto: al usar solo listas, recuerda la tentación del duck typing. Series no es lista, aunque se parezca.

¿Te quedó alguna duda, tienes comentarios sobre el código o formas distintas de inicializar Series con otras secuencias? Compártelo en los comentarios y conversemos sobre tus hallazgos.

Qué es Series en Pandas y cómo crearlas

Introducción

Pipelines automatizados con Python para ingeniería de datos

Archivos del curso y Slides

¿Qué es la ciencia de datos?

Por qué fallan los equipos de ciencia de datos

Configuración del ambiente

Jupyter Notebooks

Tipos de datos en ciencia de datos

Tipos de datos

Fuentes de datos

ETL: extract, transform y load explicado

Web scraping

Web scraping para data engineers: HTML y metadatos

Cómo hacer solicitudes HTTP con Python Requests

¿Cómo trabajar con un documento HTML?

Analizando un sitio web para encontrar las directivas a utilizar al hacer un web scrapping

Page Object Pattern para web scrapers

Implementando nuestro web scrapper: Configuración

Page Objects para extraer vínculos de noticias

Implementando nuestro web scrapper: Obteniendo artículos

Obtención de datos del Artículo

Persistiendo la información "scrapeada"

Pandas

Series vs DataFrame en Pandas