Inserción Masiva de Datos en Bases de Datos con Mockaroo
Clase 17 de 32 • Curso de PostgreSQL
Resumen
¿Cómo insertar datos masivos en una base de datos usando Mockaroo?
Cuando trabajamos con bases de datos, es crucial contar con datos suficientes para realizar consultas avanzadas y probar nuestras aplicaciones. Aquí entra en juego Mokaroo, una herramienta poderosa que nos permite generar datos masivos automáticamente. En este contexto, te explicaremos cómo usarla para poblar diferentes tablas de manera eficiente.
¿Qué es Mockaroo y cómo funciona?
Mockaroo es una herramienta basada en la web que genera datos falsos de manera rápida y sencilla. Nos permite especificar el tipo de datos que queremos y genera un archivo con la información deseada. Así evitamos el tedioso proceso de inventar manualmente cada dato.
Para empezar, debemos indicar a Mockaroo qué tipo de datos queremos insertar en nuestras tablas. Como por ejemplo, en la tabla de estaciones podría ser:
- Nombre de la estación: Podemos usar un generador que proporcione nombres comunes.
- Dirección: Opciones como "Street Address" nos ofrecen direcciones completas y aleatorias.
Podemos crear un archivo que contenga el script de inserción para estas columnas y personalizarlo para que refleje la estructura de nuestra base de datos.
-- Ejemplo de script de inserción generado por Mockaroo
INSERT INTO estacion (nombre, direccion) VALUES ('Word', 'Ruta 123');
¿Cómo trabajar con tablas relacionadas?
Para tablas que dependen de otras, como "trayecto" o "viajes", necesitamos un enfoque distinto, pues no podemos generar datos aleatorios sin continuidad. Es aquí donde definimos las relaciones entre tablas.
- Trayecto: Esta tabla tiene relaciones con "estacion" y "tren". Necesitamos asegurar que las IDs insertadas ya existan en aquellas tablas.
Mockaroo nos permite generar ID aleatorios en un rango específico para mantener coherencia:
-- Generación de valores en un rango
SELECT id FROM estacion WHERE id BETWEEN 1 AND 102;
Así, al obtener los últimos valores insertados, podemos definir el rango para los IDs relacionados.
¿Cómo asegurar el formato de datos correcto?
Otra consideración importante es el formato de datos, especialmente con fechas. Es vital que el formato coincida con el utilizado en nuestra base de datos.
Para asegurarnos, podemos realizar una consulta para comprobar el formato actual de la fecha en la base de datos y ajustar los datos generados por Mockaroo en consecuencia:
SELECT CURRENT_DATE; -- Verifica el formato de fecha actual
Sugerencias para avanzar en tus proyectos
- Explora otras opciones de Mockaroo: Además de nombres y direcciones, puedes explorar opciones como nombres de negocios, productos, correos electrónicos, entre otros.
- Valida siempre las relaciones: Antes de insertar datos en tablas relacionadas, valida que los IDs referidos existan.
- Testea con diferentes volúmenes de datos: Inicia con menos datos y aumenta progresivamente para evaluar la performance de tu base de datos.
- Integra diferentes tipos de datos: No solo confíes en datos de texto, explora la inserción de datos numéricos, booleanos, o de otros tipos.
Por último, te animo a que pruebes todo lo aprendido insertando datos en la tabla de viajes, que depende de las tablas de pasajeros y trayectos. ¡Comparte tus experiencias en los comentarios y sigue aprendiendo!