Creación y Optimización de Tablas SQL con GitHub Copilot

Clase 2 de 17 • Curso de Herramientas de Inteligencia Artificial para Equipos de Datos

Contenido del curso

IA en equipos de data

1
Uso de IA para Clasificación de Imágenes con Redes Neuronales
05:04 min

Manejo de bases de datos

Procesamiento de datos

Visualización y análisis

Generación de datos

16
Generación de Datos con GPT-4 para Modelos de IA
07:15 min

Aprendizaje y formación

17
Uso de Chatbots para Aprender Estadística y Ciencia de Datos
03:44 min

Tomar examen

Resumen

El éxito en la ingeniería de datos con frecuencia depende de la capacidad de adaptarse a nuevas herramientas que agilicen los procesos de trabajo diarios. Una tarea fundamental en este campo es la creación y definición de estructuras de tablas para bases de datos SQL, algo que, aunque esencial, puede resultar repetitivo y, en ocasiones, tedioso. Afortunadamente, con el avance de la inteligencia artificial y herramientas como GitHub Copilot, podemos optimizar este proceso de una manera impresionante. Vamos a explorar cómo estos modelos de inteligencia artificial, específicamente los grandes modelos de lenguaje (LLM), pueden transformar la manera en que los ingenieros de datos manejan y estructuran sus bases de datos.

¿Qué es GitHub Copilot y cómo puede ayudar en la creación de tablas SQL?

GitHub Copilot es una herramienta de inteligencia artificial, desarrollada por GitHub en colaboración con OpenAI, que asiste en la escritura de código a través de sugerencias inteligentes. Funciona dentro de un entorno de desarrollo integrado (IDE) como Visual Studio Code y se basa en LLMs para ofrecer sugerencias de código de manera contextuada.

¿Cómo se utiliza GitHub Copilot para estructurar bases de datos?

Al activar GitHub Copilot dentro de un IDE como Visual Studio Code, se puede comenzar a especificar las estructuras de las tablas que se necesitan. Por medio de comentarios descriptivos, se indica a Copilot la creación de tablas y sus relaciones, a continuación se detallan unos pasos iniciales:

Definir el motor de base de datos que se utiliza (Postgres, MySQL, etc.).
Especificar el tipo de código SQL que se va a generar.
Mediante comentarios, guiar a Copilot sobre las tablas y relaciones que se desean establecer.

¿Cómo optimizar consultas con índices utilizando Copilot?

Los índices son fundamentales para optimizar las consultas a bases de datos. Con GitHub Copilot, crear índices compuestos es tan sencillo como solicitarlo. Puedes indicar a Copilot que genere índices compuestos para columnas específicas en una tabla, lo cual puede mejorar significativamente el rendimiento de consultas basadas en esas columnas.

¿Cómo manejar cambios y actualizaciones en las tablas con Copilot?

Es común necesitar agregar nuevas columnas o modificar las existentes en una base de datos. Con Copilot, una simple instrucción es suficiente para agregar columnas como created_at o updated_at e incluso crear copias de seguridad de tablas existentes o eliminarlas, todo esto sin tener que escribir manualmente el código completo.

¿Cuál es el potencial de los LLMs en la ingeniería de datos?

Los LLM como el que impulsa a GitHub Copilot son extremadamente potentes en la generación de código, lo que incluye la creación de modelos de datos o DDLs (Data Definition Language) para bases de datos. Son herramientas muy valiosas para los ingenieros de datos, ya que permiten automatizar tareas y procesos que de otra forma serían manuales y que consumen mucho tiempo.

¿Puedes afrontar el reto de crear modelos de datos con otras herramientas?

Existe un mundo de posibilidades más allá de GitHub Copilot. Herramientas de inteligencia artificial como chat GPT, Bing Chat, BART u otras, todas apoyadas por LLMs, pueden ser igualmente eficaces en la creación de modelos de datos. El reto está en aplicar lo aprendido y experimentar con estas herramientas para construir modelos únicos y eficientes en el manejo de datos.

La inclusión de LLMs en el flujo de trabajo de la ingeniería de datos abre nuevas fronteras, facilitando procesos y permitiendo a los profesionales centrarse en tareas más estratégicas. Si bien estos modelos no sustituyen el criterio y experiencia del ingeniero, se presentan como aliados valiosos en la búsqueda de la eficiencia y la innovación.

Daniel Alfredo García Serna

student•

📚 Generador de código SQL DDL

🎯 Idea principal

Las herramientas de inteligencia artificial pueden generar automáticamente estructuras de bases de datos (DDL) a partir de descripciones en lenguaje natural. Esto permite a los equipos de datos acelerar la creación de tablas, esquemas y relaciones, reduciendo tiempo en tareas repetitivas y enfocándose en el diseño lógico del modelo de datos.

🔑 Puntos clave

• DDL (Data Definition Language) es el conjunto de comandos de SQL que define la estructura de una base de datos: creación de tablas, modificaciones o eliminación de objetos.

• Los comandos principales de DDL son:

CREATE → crear tablas, bases de datos o vistas
ALTER → modificar estructuras existentes
DROP → eliminar objetos de la base de datos.

• Con IA (como copilotos de código) puedes describir el modelo de datos y obtener automáticamente el script SQL para crear las tablas.

• La IA puede ayudarte a:

definir columnas
asignar tipos de datos
crear claves primarias
definir relaciones entre tablas.

• Aun así, el profesional debe validar el diseño, porque la IA no entiende completamente el contexto del negocio.

🧠 Conceptos importantes

DDL (Data Definition Language) Subconjunto de SQL encargado de definir la estructura de una base de datos, incluyendo tablas, índices y vistas.

Modelo de datos Representación lógica de cómo se organizan los datos en una base de datos: entidades, atributos y relaciones.

Schema de base de datos Estructura que organiza los objetos de una base de datos (tablas, vistas, índices) dentro de un mismo contexto.

🚀 Acciones inmediatas

• Practicar describiendo un modelo de datos en lenguaje natural y pedir a la IA que genere el DDL.

• Revisar siempre:

tipos de datos
claves primarias
claves foráneas
restricciones.

• Usar IA para crear primeras versiones del esquema, luego refinarlas manualmente.

• Construir el hábito de documentar el modelo de datos junto al DDL.

🔥 Hacks para la comunidad

• Un prompt muy efectivo es describir la base de datos como si fuera un modelo de negocio:

“Crea un esquema SQL para un sistema de ventas con clientes, pedidos y productos”.

• Pide a la IA que incluya:

claves primarias
relaciones
índices.

• Después del DDL, pide también:

ejemplos de inserción de datos
consultas SQL para probar el modelo.

• Error común: aceptar el SQL generado sin revisar las relaciones o los tipos de datos.

📝 Reflexión estratégica

La IA no elimina la necesidad de entender bases de datos; lo que hace es acelerar la implementación técnica.

El valor real del profesional está en diseñar correctamente el modelo de datos. La IA puede escribir el SQL, pero el diseño correcto sigue siendo una habilidad humana clave.

Alex Aguirre

Sergio Eyzhan Del Castillo

Guillermo Mosquera Canchingre

Oswaldo Jiménez Mesa

David Lopez

León Alexis Buitrago López

Juan R. Vergara M.

Jose Julian Mosquera

Alarcon7a

Nixon Rolando García Ramírez

Andres Sanchez

Alberto Bernaola

juan.carlos.gonzalez

Fernando Sánchez Mejía

Gabriel Obregón

Bruno Benitez

Jorge Andres Avila Rodriguez

Cesar Fernandez

Nery Alberto Cano Ortigoza

Arístides Pérez Hernández

Luis Miguel Rodriguez

Creación y Optimización de Tablas SQL con GitHub Copilot

IA en equipos de data

Uso de IA para Clasificación de Imágenes con Redes Neuronales

Manejo de bases de datos