Domina Series en Pandas con ejemplos claros y buenas prácticas. Aquí verás cómo crear un vector unidimensional con datos homogéneos, usar labels para acceder con sentido semántico y entender cómo Pandas infiere el tipo de datos. Ideal para ciencia de datos donde el índice y el significado importan.
¿Qué es Series en Pandas y por qué importa?
Una Series es un vector unidimensional con un índice asociado. A diferencia de las listas de Python, las Series contienen datos homogéneos: todos del mismo tipo (strings, enteros, booleanos o floats). Puedes acceder por posición o por label, siendo este último el método preferido cuando buscas significado en tus datos.
Compuesta por valores, índice y tipo de dato.
Acceso por posición o por label semántico.
Datos homogéneos por diseño.
Inferencia automática del tipo de dato.
Cuidado mental si vienes de listas en Python.
Idea de duck typing: si parece lista y se usa como lista, no por eso es lista.
¿Cómo crear Series con listas, tuplas, arrays y diccionarios?
Puedes crear Series desde cualquier secuencia: listas, tuplas, arrays de NumPy y diccionarios. Pasar solo una lista crea un índice posicional por defecto. Si quieres labels significativos, conviene usar un diccionario o un parámetro opcional como “columns” según se menciona, para inicializar con etiquetas explícitas.
¿Cómo crear una Series desde una lista en Pandas?
import pandas as pd
series_test = pd.Series([100,200,300])series_test
Índice posicional: 0, 1, 2.
Valores: 100, 200, 300.
Tipo inferido: int64.
Clave práctica: Pandas infiere el tipo por los datos.
¿Cómo inicializar con un diccionario y labels explícitos?
import pandas as pd
ventas_por_anio = pd.Series({1999:48000,2000:65000,2001:89000})ventas_por_anio
Índice con significado: 1999, 2000, 2001.
Acceso por label: ventas_por_anio[2000].
Semántica clara: representa ventas por año.
Mejora la lectura y el análisis en ciencia de datos.
¿Cómo leer el índice, los labels y el tipo de datos?
Al imprimir una Series, observa sus tres piezas clave: valores, índice e int64 (u otro dtype). El índice posicional surge al pasar una lista; los labels aparecen al usar diccionarios o al definirlos explícitamente. En análisis, los labels aportan significado, no solo ubicación.
Índice posicional: útil para pruebas rápidas.
Labels semánticos: mejor para análisis reales.
Tipo de dato homogéneo: toda la Series comparte dtype.
Conversión posible: puedes cambiar el dtype si lo necesitas.
Convención del namespace en ciencia de datos: usar pd para Pandas.
Contexto: al usar solo listas, recuerda la tentación del duck typing. Series no es lista, aunque se parezca.
¿Te quedó alguna duda, tienes comentarios sobre el código o formas distintas de inicializar Series con otras secuencias? Compártelo en los comentarios y conversemos sobre tus hallazgos.