Despliegue de modelos GPT-4 y embeddings en Azure OpenAI
Clase 9 de 22 • Curso de RAG con Microsoft Azure
Contenido del curso
- 5

Embeddings y bases de datos vectoriales para documentos digitales
03:35 - 6

Configuración de Azure para RAG: preparativos y gestión de costos
03:51 - 7

Qué son las bases de datos vectoriales y sus aplicaciones
04:50 - 8

Despliegue de recursos de IA en Azure con scripts de Bash
05:15 - 9

Despliegue de modelos GPT-4 y embeddings en Azure OpenAI
03:01 - 10

Configuración de Jupyter Notebook y ambientes virtuales en Python
03:37 quiz de Etapas de RAG
- 11

Vectorización de documentos con Azure Search y OpenAI
06:15 - 12

Configuración de Azure OpenAI y AI Search en Jupyter Notebook
06:56 - 13

Integración de LLM para optimizar respuestas en Jupyter Notebook
03:09 - 14

Actualización manual de índices con nuevos documentos PDF
03:17 - 15

Búsqueda tradicional, vectorial e híbrida en Azure AI Search
06:05 quiz de Tecnicas de RAG
- 16

Creación de múltiples índices en Azure AI Search con Jupyter
09:40 - 17

Generación de información ficticia con archivos Parquet
03:14 - 18

Subida automática de documentos fragmentados a Azure AI Search
02:53 - 19

Comparación de índices en Azure para optimizar almacenamiento
03:59 - 20

Creación de aplicación demo con Azure Search Service
03:39 quiz de RAG avanzado
La transformación digital mediante inteligencia artificial exige herramientas poderosas y sencillas para gestionarla eficazmente. Azure OpenAI proporciona una solución accesible y efectiva para desplegar y utilizar modelos avanzados, como GPT-4 y embeddings, facilitando la implementación de aplicaciones inteligentes.
¿Qué modelos desplegar para tareas específicas?
Es importante entender que, según el tipo de necesidad, es necesario utilizar modelos diferentes. Principalmente, son dos:
- Modelo GPT-4: Usado para tareas generales conversacionales, conocido como LLM (Large Language Model).
- Modelo de Embeddings (Text Embedding ADA002): Indicado para fragmentar texto y generar representaciones vectoriales, esenciales en tareas de búsqueda, categorización y organización de datos.
Ambos modelos se implementan usando el mismo entorno de Azure AI Foundry.
¿Cómo desplegar GPT-4 en Azure AI Foundry?
Para desplegar GPT-4, sigue estos sencillos pasos desde tu portal de Azure OpenAI:
- Ingresa al portal de Azure y selecciona Azure OpenAI.
- Abre Azure AI Foundry, anteriormente conocido como Azure OpenAI Studio o Azure AI Studio.
- Busca y selecciona la sección Deployments.
- Escoge el modelo básico conocido como GPT-4 y realiza el despliegue.
- Se recomienda mantener el nombre predeterminado para recordar con facilidad el modelo desplegado.
Una vez desplegado, el modelo GPT-4 estará listo para usarse en diferentes aplicaciones conversacionales y creación de diálogos inteligentes.
¿Cómo desplegar el modelo de embeddings ADA002 en Azure?
Para desplegar el modelo de embeddings sigue estos pasos en Azure AI Foundry:
- Regresa a la sección Deployments y selecciona desplegar un Base model.
- Busca el modelo llamado Text-embedding-ADA-002, específico para convertir textos en representaciones vectoriales.
- Asegúrate que la capacidad propuesta por el modelo (150 mil tokens por minuto para ADA002) se ajusta al volumen requerido para tus tareas.
- Despliega el modelo ADA002 pulsando en crear.
Esta versión básica, ADA002, es recomendada para el ámbito académico o tareas puntuales, ya que ofrece suficiente rendimiento con un margen amplio de tokens.
¿Qué hacer después de desplegar estos modelos?
Con GPT-4 y ADA002 desplegados satisfactoriamente, debes configurar tu entorno de trabajo en Jupyter Notebook. Este ambiente será el siguiente paso antes de comenzar la indexación y preparación efectiva de tus datos, optimizando así tus flujos de tareas y proyectos de inteligencia artificial.
Te invitamos a compartir tus experiencias en despliegue de modelos Azure OpenAI.