Despliegue de modelos GPT-4 y embeddings en Azure OpenAI

Clase 8 de 21Curso de RAG

Resumen

La transformación digital mediante inteligencia artificial exige herramientas poderosas y sencillas para gestionarla eficazmente. Azure OpenAI proporciona una solución accesible y efectiva para desplegar y utilizar modelos avanzados, como GPT-4 y embeddings, facilitando la implementación de aplicaciones inteligentes.

¿Qué modelos desplegar para tareas específicas?

Es importante entender que, según el tipo de necesidad, es necesario utilizar modelos diferentes. Principalmente, son dos:

  • Modelo GPT-4: Usado para tareas generales conversacionales, conocido como LLM (Large Language Model).
  • Modelo de Embeddings (Text Embedding ADA002): Indicado para fragmentar texto y generar representaciones vectoriales, esenciales en tareas de búsqueda, categorización y organización de datos.

Ambos modelos se implementan usando el mismo entorno de Azure AI Foundry.

¿Cómo desplegar GPT-4 en Azure AI Foundry?

Para desplegar GPT-4, sigue estos sencillos pasos desde tu portal de Azure OpenAI:

  1. Ingresa al portal de Azure y selecciona Azure OpenAI.
  2. Abre Azure AI Foundry, anteriormente conocido como Azure OpenAI Studio o Azure AI Studio.
  3. Busca y selecciona la sección Deployments.
  4. Escoge el modelo básico conocido como GPT-4 y realiza el despliegue.
  5. Se recomienda mantener el nombre predeterminado para recordar con facilidad el modelo desplegado.

Una vez desplegado, el modelo GPT-4 estará listo para usarse en diferentes aplicaciones conversacionales y creación de diálogos inteligentes.

¿Cómo desplegar el modelo de embeddings ADA002 en Azure?

Para desplegar el modelo de embeddings sigue estos pasos en Azure AI Foundry:

  1. Regresa a la sección Deployments y selecciona desplegar un Base model.
  2. Busca el modelo llamado Text-embedding-ADA-002, específico para convertir textos en representaciones vectoriales.
  3. Asegúrate que la capacidad propuesta por el modelo (150 mil tokens por minuto para ADA002) se ajusta al volumen requerido para tus tareas.
  4. Despliega el modelo ADA002 pulsando en crear.

Esta versión básica, ADA002, es recomendada para el ámbito académico o tareas puntuales, ya que ofrece suficiente rendimiento con un margen amplio de tokens.

¿Qué hacer después de desplegar estos modelos?

Con GPT-4 y ADA002 desplegados satisfactoriamente, debes configurar tu entorno de trabajo en Jupyter Notebook. Este ambiente será el siguiente paso antes de comenzar la indexación y preparación efectiva de tus datos, optimizando así tus flujos de tareas y proyectos de inteligencia artificial.

Te invitamos a compartir tus experiencias en despliegue de modelos Azure OpenAI.