Despliegue de modelos GPT-4 y embeddings en Azure OpenAI
Clase 8 de 21 • Curso de RAG
Resumen
La transformación digital mediante inteligencia artificial exige herramientas poderosas y sencillas para gestionarla eficazmente. Azure OpenAI proporciona una solución accesible y efectiva para desplegar y utilizar modelos avanzados, como GPT-4 y embeddings, facilitando la implementación de aplicaciones inteligentes.
¿Qué modelos desplegar para tareas específicas?
Es importante entender que, según el tipo de necesidad, es necesario utilizar modelos diferentes. Principalmente, son dos:
- Modelo GPT-4: Usado para tareas generales conversacionales, conocido como LLM (Large Language Model).
- Modelo de Embeddings (Text Embedding ADA002): Indicado para fragmentar texto y generar representaciones vectoriales, esenciales en tareas de búsqueda, categorización y organización de datos.
Ambos modelos se implementan usando el mismo entorno de Azure AI Foundry.
¿Cómo desplegar GPT-4 en Azure AI Foundry?
Para desplegar GPT-4, sigue estos sencillos pasos desde tu portal de Azure OpenAI:
- Ingresa al portal de Azure y selecciona Azure OpenAI.
- Abre Azure AI Foundry, anteriormente conocido como Azure OpenAI Studio o Azure AI Studio.
- Busca y selecciona la sección Deployments.
- Escoge el modelo básico conocido como GPT-4 y realiza el despliegue.
- Se recomienda mantener el nombre predeterminado para recordar con facilidad el modelo desplegado.
Una vez desplegado, el modelo GPT-4 estará listo para usarse en diferentes aplicaciones conversacionales y creación de diálogos inteligentes.
¿Cómo desplegar el modelo de embeddings ADA002 en Azure?
Para desplegar el modelo de embeddings sigue estos pasos en Azure AI Foundry:
- Regresa a la sección Deployments y selecciona desplegar un Base model.
- Busca el modelo llamado Text-embedding-ADA-002, específico para convertir textos en representaciones vectoriales.
- Asegúrate que la capacidad propuesta por el modelo (150 mil tokens por minuto para ADA002) se ajusta al volumen requerido para tus tareas.
- Despliega el modelo ADA002 pulsando en crear.
Esta versión básica, ADA002, es recomendada para el ámbito académico o tareas puntuales, ya que ofrece suficiente rendimiento con un margen amplio de tokens.
¿Qué hacer después de desplegar estos modelos?
Con GPT-4 y ADA002 desplegados satisfactoriamente, debes configurar tu entorno de trabajo en Jupyter Notebook. Este ambiente será el siguiente paso antes de comenzar la indexación y preparación efectiva de tus datos, optimizando así tus flujos de tareas y proyectos de inteligencia artificial.
Te invitamos a compartir tus experiencias en despliegue de modelos Azure OpenAI.