Desplegando infraestructura RAG en Azure

Resumen

Montar un proyecto de Retrieval Augmented Generation exige músculo de cómputo que tu laptop no puede dar, por eso el primer paso práctico es desplegar recursos en Azure con un script de bash que automatice todo. Esta guía te muestra cómo hacerlo de forma económica, ideal para quienes están aprendiendo RAG sin gastar de más.

¿Por qué usar la nube en lugar de un entorno local para RAG?

Aunque es tentador instalar todo en tu máquina, la inteligencia artificial aplicada a RAG necesita más de lo que ofrece una PC, incluso una gamer de gama alta.

  • Procesamiento intensivo que un equipo personal no sostiene.
  • Configuración y compatibilidad de herramientas que rara vez funcionan al primer intento.
  • Servicios especializados como búsqueda vectorial y modelos de lenguaje que solo viven en la nube.

¿Puedo correr RAG en mi computadora? Técnicamente sí, pero te vas a topar con límites de procesamiento y problemas de instalación. Para un flujo realista, necesitas un proveedor de nube.

Por eso el camino natural es Azure, donde además puedes aprovechar créditos gratis y elegir las configuraciones más baratas mientras aprendes [00:46].

¿Qué necesitas antes de ejecutar el despliegue en Azure?

Antes de tocar la terminal, asegúrate de tener dos cosas listas. Sin esto, el script no va a correr.

  • Una suscripción activa de Azure asociada a tu cuenta.
  • La Azure CLI instalada en tu equipo, que te permite operar desde la terminal en lugar de hacer clics interminables en el portal [01:23].

La CLI ahorra muchísimo tiempo, sobre todo cuando vas a desplegar varios servicios encadenados como en este caso.

¿Qué hace el script deploy.sh para levantar tu infraestructura?

Dentro del repositorio de GitHub, en el folder de la clase siete, vas a crear un archivo llamado deploy.sh. Ese pequeño script de bash es el que orquesta todo el despliegue [01:38].

Recursos que despliega el script

El script crea cada pieza que tu sistema RAG necesita para funcionar.

  • Un grupo de recursos de Azure que agrupa todo el proyecto.
  • Una instancia de Azure OpenAI con el modelo ChatGPT-4 desplegado.
  • Una cuenta de almacenamiento para guardar los PDFs que vas a indexar, los cuales ya están en la carpeta data sample del repositorio.
  • Un servicio de Azure AI Search configurado con SKU Basic.

Un detalle clave: los espacios de nombre de OpenAI y Search deben ser únicos a nivel global, parecido a un nombre de dominio. Si ya usaste Platzi, tendrás que cambiarlo a Platzi2 o algo equivalente para evitar conflictos [02:10].

Por qué elegir SKU Basic en Azure AI Search

La elección del SKU no es decorativa, impacta directo en tu factura.

¿Qué es el SKU en Azure AI Search? Es el nivel de servicio que defines al crear el recurso. Determina capacidad, precio y límites. El estándar puede costar hasta cuatro veces más que el Basic [02:43].

Para aprender, Basic sobra. Cuando un proyecto pase a producción real, ahí sí evalúas escalar.

¿Cómo ejecutar el despliegue y guardar las claves correctamente?

Con el script listo, vas a tu terminal, te ubicas en la carpeta de la clase y corres el comando.

bash cd clase7 ls bash deploy.sh

El proceso tarda algunos minutos. Al terminar, el script imprime en consola dos llaves esenciales: la de Azure OpenAI y la de Azure AI Search [03:21].

  • Cópialas inmediatamente a un bloc de notas o a tu gestor de secretos preferido.
  • No las pierdas, las vas a usar durante prácticamente todo el resto del curso.
  • Acompáñalas de los endpoints, que el script también devuelve para ambos servicios.

¿Para qué sirven las claves de OpenAI y Search? Son las credenciales que autentican tus llamadas desde el código a los servicios de Azure. Sin ellas, ninguna petición a los modelos o al índice de búsqueda funciona.

¿Cómo verificar que tus recursos quedaron desplegados en Azure?

Una vez que el script termina con el mensaje de éxito, conviene confirmar visualmente en el portal.

Entras a tu portal de Azure, navegas a Grupos de recursos, abres el que corresponde a tu proyecto (por ejemplo, RAG-Platzi2) y deberías ver tres servicios listados [04:05].

  • Servicio de Azure AI Search.
  • Servicio de Azure OpenAI.
  • Cuenta de almacenamiento.

Si los tres aparecen, todo está en orden y puedes seguir construyendo tu pipeline de RAG sobre esta base. Cuéntame en los comentarios qué nombre le pusiste a tu grupo de recursos y si tuviste que ajustar el sufijo por temas de unicidad.