Domina la creación de data frames: tablas con filas y columnas etiquetadas, ideales para organizar datos de forma bidimensional. Aprende a inicializarlos desde listas, tuplas o diccionarios, cuándo usar series y cómo el parámetro opcional columns añade labels claros y útiles.
¿Qué es un data frame y en qué se diferencia de una serie?
Un data frame es una tabla bidimensional: filas y columnas con etiquetas. Si solo tienes una dimensión, eso es una serie, no un data frame. Al construir con un diccionario de Python, las llaves se convierten en nombres de columnas. Si no usas diccionario u otro data frame con labels, puedes definirlos con el parámetro opcional columns.
Estructura bidimensional: requiere una matriz, no un vector.
Índice por defecto: permite acceder a filas con facilidad.
Llaves del diccionario: se vuelven labels de columnas.
Diferencia clave: una dimensión es series; dos dimensiones es data frame.
¿Cómo inicializar un data frame con diccionario?
La forma más directa es usar el namespacepd y el constructor de data frame. Al usar diccionario, cada llave es una columna y cada valor debe ser una lista; de lo contrario, estarías creando una series.
import pandas as pd
frame_test = pd.DataFrame({2000:[139,38,24],2001:[139,38,24]})
Valores como listas: garantizan la forma bidimensional.
Índice automático: filas numeradas para acceso posicional.
Columnas con labels: años como nombres de columna.
¿Qué aporta el índice y los labels en la tabla?
Navegación clara: índice para filas y labels para columnas.
Lectura natural: como en una hoja de cálculo.
Abstracción familiar: si vienes de Excel, la tabla se entiende al instante.
¿Cómo crear un data frame con lista de listas y usar columns?
Con una lista de listas, obtendrás inicialmente índices posicionales para filas y columnas. Para nombrar columnas, utiliza el keywordcolumns como segundo argumento del constructor.
data =[[139,38],[24,38],[139,24]]frame_test2 = pd.DataFrame(data, columns=[2000,2001])
Lista de listas: cada lista interna es una fila.
Sin columns: columnas con índice numérico por defecto.
Con columns: asignas labels explícitos a las columnas.
¿Cómo añadir celdas rápidamente en el entorno de trabajo?
Comando B: inserta celda below.
Comando A: inserta celda above.
¿Qué otras estructuras sirven para inicializar?
Lista de tuplas: alternativa válida para la matriz.
Otro data frame: reutiliza estructuras con labels ya definidos.
Diccionario: control directo de nombres de columna.
¿Te gustaría ver más ejemplos de inicialización o manipulación de estas tablas? Comparte tus dudas o casos de uso en los comentarios.