Qué es Series en Pandas y cómo crearlas

Clase 22 de 38Curso de Ingeniería de Datos con Python

Contenido del curso

Web scraping

Pandas

Resumen

Domina Series en Pandas con ejemplos claros y buenas prácticas. Aquí verás cómo crear un vector unidimensional con datos homogéneos, usar labels para acceder con sentido semántico y entender cómo Pandas infiere el tipo de datos. Ideal para ciencia de datos donde el índice y el significado importan.

¿Qué es Series en Pandas y por qué importa?

Una Series es un vector unidimensional con un índice asociado. A diferencia de las listas de Python, las Series contienen datos homogéneos: todos del mismo tipo (strings, enteros, booleanos o floats). Puedes acceder por posición o por label, siendo este último el método preferido cuando buscas significado en tus datos.

  • Compuesta por valores, índice y tipo de dato.
  • Acceso por posición o por label semántico.
  • Datos homogéneos por diseño.
  • Inferencia automática del tipo de dato.
  • Cuidado mental si vienes de listas en Python.
  • Idea de duck typing: si parece lista y se usa como lista, no por eso es lista.

¿Cómo crear Series con listas, tuplas, arrays y diccionarios?

Puedes crear Series desde cualquier secuencia: listas, tuplas, arrays de NumPy y diccionarios. Pasar solo una lista crea un índice posicional por defecto. Si quieres labels significativos, conviene usar un diccionario o un parámetro opcional como “columns” según se menciona, para inicializar con etiquetas explícitas.

¿Cómo crear una Series desde una lista en Pandas?

import pandas as pd series_test = pd.Series([100, 200, 300]) series_test
  • Índice posicional: 0, 1, 2.
  • Valores: 100, 200, 300.
  • Tipo inferido: int64.
  • Clave práctica: Pandas infiere el tipo por los datos.

¿Cómo inicializar con un diccionario y labels explícitos?

import pandas as pd ventas_por_anio = pd.Series({ 1999: 48000, 2000: 65000, 2001: 89000 }) ventas_por_anio
  • Índice con significado: 1999, 2000, 2001.
  • Acceso por label: ventas_por_anio[2000].
  • Semántica clara: representa ventas por año.
  • Mejora la lectura y el análisis en ciencia de datos.

¿Cómo leer el índice, los labels y el tipo de datos?

Al imprimir una Series, observa sus tres piezas clave: valores, índice e int64 (u otro dtype). El índice posicional surge al pasar una lista; los labels aparecen al usar diccionarios o al definirlos explícitamente. En análisis, los labels aportan significado, no solo ubicación.

  • Índice posicional: útil para pruebas rápidas.
  • Labels semánticos: mejor para análisis reales.
  • Tipo de dato homogéneo: toda la Series comparte dtype.
  • Conversión posible: puedes cambiar el dtype si lo necesitas.
  • Convención del namespace en ciencia de datos: usar pd para Pandas.
  • Contexto: al usar solo listas, recuerda la tentación del duck typing. Series no es lista, aunque se parezca.

¿Te quedó alguna duda, tienes comentarios sobre el código o formas distintas de inicializar Series con otras secuencias? Compártelo en los comentarios y conversemos sobre tus hallazgos.