Contenido del curso
Etapas de RAG
- 5

Embeddings y vectorización en RAG
03:34 min - 6

RAG en Azure en lugar de local
03:51 min - 7

Qué son las bases de datos vectoriales
04:49 min - 8

Desplegando infraestructura RAG en Azure
Viendo ahora - 9

Despliegue de modelos GPT-4 y embeddings en Azure OpenAI
03:01 min - 10

Configuración de Jupyter Notebook y ambientes virtuales en Python
03:36 min
Tecnicas de RAG
- 11

Vectorización de documentos con Azure Search y OpenAI
06:15 min - 12

Configuración de Azure OpenAI y AI Search en Jupyter Notebook
06:56 min - 13

Integración de LLM para optimizar respuestas en Jupyter Notebook
03:09 min - 14

Reindexar nuevos PDFs en Azure AI Search
03:16 min - 15

Búsqueda tradicional, vectorial e híbrida en Azure AI Search
06:04 min
RAG avanzado
- 16

Creación de múltiples índices en Azure AI Search con Jupyter
09:40 min - 17

Cómo guardar embeddings en Parquet para la nube
03:13 min - 18

Subida automática de documentos fragmentados a Azure AI Search
02:52 min - 19

Cómo comparar índices vectoriales en Azure AI Search
03:58 min - 20

Demo app de Azure AI Search en minutos
03:38 min
Fusionando RAG con un agente
Desplegando infraestructura RAG en Azure
Resumen
Montar un proyecto de Retrieval Augmented Generation exige músculo de cómputo que tu laptop no puede dar, por eso el primer paso práctico es desplegar recursos en Azure con un script de bash que automatice todo. Esta guía te muestra cómo hacerlo de forma económica, ideal para quienes están aprendiendo RAG sin gastar de más.
¿Por qué usar la nube en lugar de un entorno local para RAG?
Aunque es tentador instalar todo en tu máquina, la inteligencia artificial aplicada a RAG necesita más de lo que ofrece una PC, incluso una gamer de gama alta.
- Procesamiento intensivo que un equipo personal no sostiene.
- Configuración y compatibilidad de herramientas que rara vez funcionan al primer intento.
- Servicios especializados como búsqueda vectorial y modelos de lenguaje que solo viven en la nube.
¿Puedo correr RAG en mi computadora? Técnicamente sí, pero te vas a topar con límites de procesamiento y problemas de instalación. Para un flujo realista, necesitas un proveedor de nube.
Por eso el camino natural es Azure, donde además puedes aprovechar créditos gratis y elegir las configuraciones más baratas mientras aprendes [00:46].
¿Qué necesitas antes de ejecutar el despliegue en Azure?
Antes de tocar la terminal, asegúrate de tener dos cosas listas. Sin esto, el script no va a correr.
- Una suscripción activa de Azure asociada a tu cuenta.
- La Azure CLI instalada en tu equipo, que te permite operar desde la terminal en lugar de hacer clics interminables en el portal [01:23].
La CLI ahorra muchísimo tiempo, sobre todo cuando vas a desplegar varios servicios encadenados como en este caso.
¿Qué hace el script deploy.sh para levantar tu infraestructura?
Dentro del repositorio de GitHub, en el folder de la clase siete, vas a crear un archivo llamado deploy.sh. Ese pequeño script de bash es el que orquesta todo el despliegue [01:38].
Recursos que despliega el script
El script crea cada pieza que tu sistema RAG necesita para funcionar.
- Un grupo de recursos de Azure que agrupa todo el proyecto.
- Una instancia de Azure OpenAI con el modelo ChatGPT-4 desplegado.
- Una cuenta de almacenamiento para guardar los PDFs que vas a indexar, los cuales ya están en la carpeta
data sampledel repositorio. - Un servicio de Azure AI Search configurado con SKU Basic.
Un detalle clave: los espacios de nombre de OpenAI y Search deben ser únicos a nivel global, parecido a un nombre de dominio. Si ya usaste Platzi, tendrás que cambiarlo a Platzi2 o algo equivalente para evitar conflictos [02:10].
Por qué elegir SKU Basic en Azure AI Search
La elección del SKU no es decorativa, impacta directo en tu factura.
¿Qué es el SKU en Azure AI Search? Es el nivel de servicio que defines al crear el recurso. Determina capacidad, precio y límites. El estándar puede costar hasta cuatro veces más que el Basic [02:43].
Para aprender, Basic sobra. Cuando un proyecto pase a producción real, ahí sí evalúas escalar.
¿Cómo ejecutar el despliegue y guardar las claves correctamente?
Con el script listo, vas a tu terminal, te ubicas en la carpeta de la clase y corres el comando.
bash cd clase7 ls bash deploy.sh
El proceso tarda algunos minutos. Al terminar, el script imprime en consola dos llaves esenciales: la de Azure OpenAI y la de Azure AI Search [03:21].
- Cópialas inmediatamente a un bloc de notas o a tu gestor de secretos preferido.
- No las pierdas, las vas a usar durante prácticamente todo el resto del curso.
- Acompáñalas de los endpoints, que el script también devuelve para ambos servicios.
¿Para qué sirven las claves de OpenAI y Search? Son las credenciales que autentican tus llamadas desde el código a los servicios de Azure. Sin ellas, ninguna petición a los modelos o al índice de búsqueda funciona.
¿Cómo verificar que tus recursos quedaron desplegados en Azure?
Una vez que el script termina con el mensaje de éxito, conviene confirmar visualmente en el portal.
Entras a tu portal de Azure, navegas a Grupos de recursos, abres el que corresponde a tu proyecto (por ejemplo, RAG-Platzi2) y deberías ver tres servicios listados [04:05].
- Servicio de Azure AI Search.
- Servicio de Azure OpenAI.
- Cuenta de almacenamiento.
Si los tres aparecen, todo está en orden y puedes seguir construyendo tu pipeline de RAG sobre esta base. Cuéntame en los comentarios qué nombre le pusiste a tu grupo de recursos y si tuviste que ajustar el sufijo por temas de unicidad.