Creación y gestión de tablas particionadas en bases de datos

Resumen

¿Qué son las particiones y por qué son importantes en un proyecto?

Las particiones son fundamentales para la optimización y eficiencia de las bases de datos al manejar grandes volúmenes de información. Cuando se maneja mucha información en una sola tabla, las consultas pueden volverse lentas y el acceso a los datos puede ser ineficiente. Las particiones ayudan a superar esta limitación al dividir físicamente los datos en segmentos más pequeños, pero manteniendo la misma estructura lógica de la tabla original. Este proceso permite almacenar partes de una tabla en diferentes espacios de disco, lo que puede incluir incluso discos separados.

¿Cómo funcionan las particiones en una base de datos?

El uso de particiones permite crear tablas más manejables al dividir los datos en rangos lógicos. Por ejemplo, puedes crear una partición basada en fechas, donde cada segmento de la tabla se asocia a un rango específico de fechas. Esto significa que si realizas una consulta para buscar datos de una fecha específica, solo se accede al segmento relevante de la tabla, acelerando enormemente el tiempo de respuesta.

Cuando se manejan sistemas con consultas frecuentes y volúmenes de datos variables, las particiones no solo mejoran el rendimiento de las consultas, sino que también previenen que las tablas se saturen debido a un alto número de consultas simultáneas o modificaciones frecuentes.

¿Cómo crear una tabla particionada en PostgreSQL?

Ahora vamos a simular cómo crear una tabla particionada en PostgreSQL, teniendo en cuenta los conceptos mencionados. Aquí te presento un ejemplo simplificado:

-- Creamos la tabla principal que será particionada
CREATE TABLE viajes (
  id SERIAL PRIMARY KEY,
  fecha DATE NOT NULL
) PARTITION BY RANGE (fecha);

-- Agregamos las particiones con base en el rango de fechas
CREATE TABLE viajes_2023_01 PARTITION OF viajes
FOR VALUES FROM ('2023-01-01') TO ('2023-02-01');

CREATE TABLE viajes_2023_02 PARTITION OF viajes
FOR VALUES FROM ('2023-02-01') TO ('2023-03-01');

Consideraciones al trabajar con tablas particionadas

Elección de campos de partición: La selección del campo sobre el cual se hace la partición es crucial. En este caso, usar fechas es común, pero podría ser cualquier otro campo que tenga sentido dividir lógicamente.
Nombres de tablas de partición: Es recomendable seguir un estándar en la nomenclatura para las tablas de partición. Por ejemplo, incluir el año y el mes facilita la identificación de la partición correspondiente.
Limitaciones: No se pueden usar llaves primarias en tablas particionadas, ya que estas están divididas. En lugar de ello, las referencias deben hacerse a las tablas que mantienen estas llaves.
Rangos de partición: Al definir los rangos, asegúrate de que son correctos y adecuados para las consultas que esperarías hacer en el futuro.

¿Cómo realizar consultas y modificaciones en tablas particionadas?

Las consultas en tablas particionadas se ejecutan de manera muy similar a las tablas regulares, con la diferencia de que el motor de base de datos solo busca en la partición relevante, lo que resulta en tiempos de respuesta más rápidos.

-- Ejemplo de inserción en tabla particionada
INSERT INTO viajes (fecha) VALUES ('2023-01-15');

-- Ejemplo de consulta en tabla particionada
SELECT * FROM viajes WHERE fecha = '2023-01-15';

Prueba de inserción y límites

Intentar insertar datos fuera del rango definido en las particiones resultará en un error, ya que el sistema no encontrará un espacio adecuado para el nuevo registro. Esto nos ayuda a mantener los datos organizados y dentro de los rangos esperados.

Recomendaciones para el uso de particiones

Si sabes que tu aplicación manejará un volumen significativo de datos históricos, considera implementar particiones desde el inicio. Esto no solo mejorará el rendimiento de tus consultas, sino que también hará que el sistema sea más escalable y fácil de administrar.

Crear particiones es ideal para manejar bitácoras u otras formas de almacenamiento de datos masivos. Así, siempre estarás un paso adelante en la optimización de tu sistema de bases de datos. ¡Anímate a probar esta técnica y verás cómo transformará la eficiencia de tus consultas en bases de datos grandes!

Antonio Rafael González Ferrer

student•

Ese color rojo me causa un tremendo conflicto interno ... 😅

Omar Daniel Centeno

student•

Pensé que no lo dejaría pues había dicho que era incómodo jajaja

Billy Raquec

student•

Es incómodo pero cuando estás trabajando sobre una base de datos de producción te mantiene más alerta ya que no ejecutas querys sin revisarlos dos veces.

Isay Humberto Lucas Hernandez

student•

Otra de las ventajas de las tablas particionadas es que puedes utilizar la sentencia TRUNCATE, la cual elimina toda la información de una tabla, pero a nivel partición. Es decir, si tienes una tabla con 12 particiones (1 para cada mes del año) y deseas eliminar toda la información del mes de Enero; con la sentencia ALTER TABLE tabla TRUNCATE PARTITION enero; podrías eliminar dicha información sin afectar el resto.

José Rodrigo Arana Hi

student•

el comando que mencionas no me funcionó. El que sí fue

truncate <tabla particionada>;

gracias por la luz.

Saludos.

Patricio Sánchez Fernández

student•

Excelente

Abril Darynka Tapia Sosa

student•

Creando particiones ![](

Omar Daniel Centeno

student•

Que buena imagen.

Jorge Ayala

student•

Gran aporte, lo voy a agregar a mi Notion

Vicente Fernandez

student•

Hola, creo que hay un error en las fechas... La partición debería ser en enero del mismo año 2010... No de 2010 a 2019. De resto todo bien!

Nicolás Bejarano

student•

Justo me ocurrio lo mismo al correr el Query con la fecha... Si la almaceno en la tabla particionada, en el video simplemente corrio todo el script por eso fallo, pero en efecto el primer ejemplo no debio ser de 9 años.

Francisco Murillo

student•

no lo habia notado, pero no lo hice asi😅😅😅

Jeisson Espinosa

student•

Información resumida de esta clase #EstudiantesDePlatzi

Las particiones consisten en la separación física de datos conservando la estructura lógica, esto ayuda a acelerar nuestras consultas
Si la tabla que vamos a crear es particionada debemos indicarlo en la pestaña general
No es posible crear llaves primarias en tablas particionadas

Angel de Jesus Quintero Pereira

student•

Es importante recalcar que en la fecha final de nuestro rango de días el motor de bases de datos excluye el valor de nuestro último día es decir, si el mes termina en 31 entonces en nuestro rango debe terminar en 32

Jorge Trad

student•

Hola, Ángel... Gracias por tu comentario... ¿Podría poner el día 1 del siguiente mes y año en lugar de poner el día 32?

Alex Padilla

student•

Muchas gracias, en ese caso lo correcto sería que termine en el primer día del siguiente mes :D

Boris Vargas Paucara

student•

Particiones
- Separacion fisica de datos
- Estructura logica

-- Tabla bitacora_viaje
CREATE TABLE public.bitacora_viaje(
    id serial,
    id_viaje integer,
    fecha date
) PARTITION BY RANGE (fecha) WITH (OIDS = FALSE);
ALTER TABLE public.bitacora_viaje OWNER to postgres;

-- Vamos a crear la particion
CREATE TABLE bitacora_viaje201001 PARTITION OF public.bitacora_viaje
FOR VALUES FROM ('2010-01-01') TO  ('2020-04-24');

-- Insertamos un dato --&gt; ERROR antes de crear la particions
INSERT INTO public.bitacora_viaje(id_viaje, fecha)
VALUES(1, '2010-01-01');

-- Mostramos los valores de la tabla bitacora_viaje
SELECT * FROM bitacora_viaje;

-- eliminamos la tabla bitacora_viaje y se eliminara la particion igualmente
DROP TABLE bitacora_viaje;```

Ramón Ruiz

student•

No conocía la partición de tablas. Ni que podíamos asignar un rango a nuestros querys

Isay Humberto Lucas Hernandez

student•

HolaM

¡Comparto mi script de creación de tablas así como una imagen de mi modelo resultante!

1.- Modelo resultante

2.- Script de creación de tablas

/* SE CREA TABLA DE ESTACION */
CREATE TABLE public.estacion(id_estacion    BIGSERIAL PRIMARY KEY,
                             nombre         CHARACTER VARYING,
                             direccion      CHARACTER VARYING);

/* SE CREA TABLA DE TREN */
CREATE TABLE public.tren(id_tren    BIGSERIAL PRIMARY KEY,
                         modelo     CHARACTER VARYING,
                         capacidad  INTEGER);

/* SE CREA TABLA DE PASAJERO */
CREATE TABLE public.pasajero(id_pasajero BIGSERIAL PRIMARY KEY,
                             nombre      CHARACTER VARYING,
                             direccion   CHARACTER VARYING,
                             fecha       DATE);


/* SE CREA TABLA DE TRAYECTO */
CREATE TABLE public.trayecto(id_trayecto    BIGSERIAL PRIMARY KEY,
                             id_estacion    BIGINT,
                             id_tren        BIGINT,
                             nombre         CHARACTER VARYING);

/* SE AGREGA LLAVE FORANEA ESTACION-TRAYECTO */
ALTER TABLE public.trayecto
    ADD CONSTRAINT estacion_trayecto_FK FOREIGN KEY (id_estacion) REFERENCES public.estacion(id_estacion);

/* SE AGREGA LLAVE FORANEA TREN-TRAYECTO */
ALTER TABLE public.trayecto
    ADD CONSTRAINT tren_trayecto_FK FOREIGN KEY (id_tren)   REFERENCES public.tren(id_tren);

/* SE CREA TABLA DE VIAJE */
CREATE TABLE public.viaje(id_viaje    BIGSERIAL PRIMARY KEY,
                          id_pasajero BIGINT,
                          id_trayecto BIGINT,
                          inicio      DATE,
                          fin         DATE);

/* SE AGREGA LLAVE FORANEA PASAJERO-VIAJE */
ALTER TABLE public.viaje
    ADD CONSTRAINT pasajero_viaje_FK FOREIGN KEY (id_pasajero) REFERENCES public.pasajero(id_pasajero);

/* SE AGREGA LLAVE FORANEA TRAYECTO-VIAJE */
ALTER TABLE public.viaje
    ADD CONSTRAINT trayecto_viaje_FK FOREIGN KEY (id_trayecto) REFERENCES public.trayecto(id_trayecto);

Carlos Chavez

student•

Muy bueno su aporte. Me podrá informar con que sofware realizó las tablas de entidades relación.Se ven muy bien

Julián Cárdenas

student•

Excelente

Nicolas de Fex

student•

Para los que vengan llegando, en las nuevas versiones se debe agregar comillas dobles al nombre de la tabla a la cual se esta particionando, si no tendran un Error que dice

error relation bitacora_viajes does not exist

AQUI la solucion:

CREATE TABLE BITACORA_VIAJES201001 PARTITION OF "BITACORA_VIAJES"
FOR VALUES FROM ('2010-01-01') TO ('2010-01-31');

Clara Savelli Betancourt

student•

Gracias!

KEVIN DAVID TRUJILLO ARBELAEZ

student•

Capo :clap:

Jessica Andrea Aquino Torrez

student•

Para realizar la creación de la partición, tuve que hacerlo de la siguiente forma:

CREATE TABLE public.bitacora_viajes
(
    id serial,
    id_viaje integer,
    fecha date
) PARTITION BY RANGE (fecha);

ALTER TABLE IF EXISTS public.bitacora_viajes
    OWNER to postgres;

--PARTICION DE bitacora_viajes

CREATE TABLE bitacora_viajes_201001 PARTITION OF bitacora_viajes
FOR VALUES FROM ('2010-01-01') TO ('2010-02-01');

A diferencia del profesor, corregí el año al 2010, ya que esta tabla solo almacena información de ese mes; y puse la fecha hasta el primero de febrero puesto a que si intentabamos insertar información del 31 de enero, nos daba error.

Fabianini PRZ®

student•

En la clase el profe comete un error con las fechas del rango, al momento de poner 2010-01-01 to 2019-01-31, debería ser en realidad 2010-01-01 to 2010-01-31, por eso al momento en el que dice que la inserción del registro con la fecha 2012-01-01 va a fallar, no falla y muestra otro error que es el de la creación de la tabla particionada, en el que dice que la tabla ya existe. Espero que sirva de aclaración.

Jhins Ledys Cárdenas Pardo

student•

Ah ok. yo si decia porque no insertaba la fecha con 02 si en el rango establecido en el ejemplo, estan todos los meses ya que es un rando de 9 años. Gracias por la observación.

Ismael Danilo Herrera Sánchez

student•

A mí no me funcionó la partición hasta que no le puse comillas al nombre de la bitácora.

CREATE TABLE "Bitacora_viajes201001" PARTITION OF "Bitacora_viajes"
FOR VALUES FROM ('2010-01-01') TO ('2010-01-31');

Édgar Bolívar Solano Solís

student•

Buenisima, me funciono Muchas gracias!!!!!

Daniel Choxin

student•

Salvavidas, el comentario que estaba buscando

Platzi Team

student•

Particiones en PostgreSQL

Las particiones en PostgreSQL son una forma de dividir una tabla en múltiples partes lógicas, cada una con una estructura de datos y un almacenamiento separados

💽 Las particiones se utilizan para mejorar el rendimiento y la escalabilidad de la base de datos al permitir que los datos se dividan y distribuyan en varios nodos o discos.

Hay varios tipos de particiones en PostgreSQL, incluyendo:

Particiones por rango: En esta estrategia, los datos se dividen en partes basadas en un rango de valores en una columna clave.
Particiones por lista: En esta estrategia, los datos se dividen en partes basadas en una lista específica de valores en una columna clave.
Particiones por valor hash: En esta estrategia, los datos se dividen en partes basadas en el resultado de una función hash en una columna clave.
Particiones por fecha y hora: En esta estrategia, los datos se dividen en partes basadas en fechas o intervalos de tiempo en una columna clave.

El uso de particiones en PostgreSQL requiere una planificación cuidadosa y una buena comprensión de la estructura de los datos y las operaciones que se realizarán en la base de datos. Sin embargo, puede ser muy útil para mejorar el rendimiento y la escalabilidad de la base de datos en aplicaciones con grandes cantidades de datos y un alto nivel de actividad.

Creamos la tabla donde se alogaran los datos de la particion:

CREATE TABLE public.bitacora_viaje
(
    id serial,
    id_viaje integer,
    fecha date
) PARTITION BY RANGE (fecha);

ALTER TABLE IF EXISTS public.bitacora_viaje
    OWNER to postgres;

Creamos la particion de la tabla bitacora_viaje

CREATE TABLE FECHA_202302 PARTITION OF "FECHA" 
FOR VALUES FROM ('2023-02-01') TO ('2023-02-28');

Juan Diego Rodríguez Rodríguez

student•

Llegué un poco tarde, pero a los que no les salga la opción de partición deben hacer esto

Miguel Angel Reyes Moreno

student•

Hay errores muy grandes en este vídeo. Desde la creación del script con un rango de 9 años, hasta la ejecución del mismo, donde no se seleccionan los pedazos correctos y se ejecutan otros distintos a los explicados.

Eli Riera

student•

Viene mal este curso hasta ahora, informacion con imprecisiones, poco dinamismo e interactividad. Nada que ver con el curso de Fundamentos de Bases de Datos que fue un 10/10

Deiby Johany Avila Gutierrez

student•

En que casos es recomendado usar el particionamiento de tablas?

Oswaldo Rodríguez González

teacher•

En principio debes particionar tablas que tengan un alto movimiento de datos, muchas inserciones y consultas. Pero al final, si el proyecto llega a durar lo suficiente, terminarás con una cantidad enorme de datos que te obligarán a pariticionar casi todas las tablas de tu base de datos.

Omar Daniel Centeno

student•

¿Las particiones están también para MySQL o es algo propio de PostgreSQL?

Marlon Iván De León Pérez

student•

Sí se puede realizar particiones en MySQL, te invito a leer este artículo :D

Omar Daniel Centeno

student•

¡Oh! está bastante bueno el artículo, muchas gracias.

Andres Luque

student•

¿Existe alguna forma que las particiones se creen dinamicamente en el momento que van ingresando nuevos datos?

Oswaldo Rodríguez González

teacher•

Nosotros lo hacemos desde un cron, que llegando al último día del mes crea las particiones del mes siguiente, pero lo puedes hacer de muchas formas, por ejemplo, en un trigger.

Angel de Jesus Quintero Pereira

student•

La tabla se divide internamente en pequeñas partes o tablas en rangos o listas definido, que pueden ser: fechas u objetos. Existen dos tipos de particiones Particionamiento de rango (Range Partitioning) y Particionamiento de lista (List Partitioning)