Despliegue de modelos GPT-4 y embeddings en Azure OpenAI

Clase 9 de 22 • Curso de RAG con Microsoft Azure

Resumen

La transformación digital mediante inteligencia artificial exige herramientas poderosas y sencillas para gestionarla eficazmente. Azure OpenAI proporciona una solución accesible y efectiva para desplegar y utilizar modelos avanzados, como GPT-4 y embeddings, facilitando la implementación de aplicaciones inteligentes.

¿Qué modelos desplegar para tareas específicas?

Es importante entender que, según el tipo de necesidad, es necesario utilizar modelos diferentes. Principalmente, son dos:

Modelo GPT-4: Usado para tareas generales conversacionales, conocido como LLM (Large Language Model).
Modelo de Embeddings (Text Embedding ADA002): Indicado para fragmentar texto y generar representaciones vectoriales, esenciales en tareas de búsqueda, categorización y organización de datos.

Ambos modelos se implementan usando el mismo entorno de Azure AI Foundry.

¿Cómo desplegar GPT-4 en Azure AI Foundry?

Para desplegar GPT-4, sigue estos sencillos pasos desde tu portal de Azure OpenAI:

Ingresa al portal de Azure y selecciona Azure OpenAI.
Abre Azure AI Foundry, anteriormente conocido como Azure OpenAI Studio o Azure AI Studio.
Busca y selecciona la sección Deployments.
Escoge el modelo básico conocido como GPT-4 y realiza el despliegue.
Se recomienda mantener el nombre predeterminado para recordar con facilidad el modelo desplegado.

Una vez desplegado, el modelo GPT-4 estará listo para usarse en diferentes aplicaciones conversacionales y creación de diálogos inteligentes.

¿Cómo desplegar el modelo de embeddings ADA002 en Azure?

Para desplegar el modelo de embeddings sigue estos pasos en Azure AI Foundry:

Regresa a la sección Deployments y selecciona desplegar un Base model.
Busca el modelo llamado Text-embedding-ADA-002, específico para convertir textos en representaciones vectoriales.
Asegúrate que la capacidad propuesta por el modelo (150 mil tokens por minuto para ADA002) se ajusta al volumen requerido para tus tareas.
Despliega el modelo ADA002 pulsando en crear.

Esta versión básica, ADA002, es recomendada para el ámbito académico o tareas puntuales, ya que ofrece suficiente rendimiento con un margen amplio de tokens.

¿Qué hacer después de desplegar estos modelos?

Con GPT-4 y ADA002 desplegados satisfactoriamente, debes configurar tu entorno de trabajo en Jupyter Notebook. Este ambiente será el siguiente paso antes de comenzar la indexación y preparación efectiva de tus datos, optimizando así tus flujos de tareas y proyectos de inteligencia artificial.

Te invitamos a compartir tus experiencias en despliegue de modelos Azure OpenAI.

Comentarios

Leandro Espino Espino

student•

Desplegar modelos GPT-4 y servicios de embeddings en Azure OpenAI permite integrar capacidades avanzadas de procesamiento de lenguaje natural en soluciones personalizadas.

Al crear endpoints específicos para cada modelo, se habilita el consumo vía API con configuraciones ajustadas al caso de uso, como temperatura o longitud de respuesta.

Esta infraestructura facilita el desarrollo de aplicaciones inteligentes que combinan comprensión semántica y generación de texto con altos niveles de escalabilidad y seguridad.

Leandro Espino Espino

student•

Esta clase la necesitaba la semana pasada que desplegué mi primer modelo jaja para embeddings yo use el 3 large para muchos PDFs con mucho contenido (incluso contenido de imágenes)

David Jesús Rodríguez La Riva

student•

Pregunta interesante por aqui: 1. - Por que el profe hace el despliegue en sweden tiene algo que ver esa region con el rendimiento?

Alejandro Mejia Mendez

student•

La clase se centra en el despliegue de modelos en Azure, específicamente dos tipos: GPT-4 para interacción mediante lenguaje natural y un modelo de embedding para fragmentar información. Se explica cómo seleccionar y desplegar estos modelos en el portal de Azure AI Foundry. Se destaca la importancia de elegir el modelo adecuado según las necesidades del proyecto, como la capacidad de manejar grandes volúmenes de datos. La próxima clase se enfocará en la configuración del entorno de Jupyter para la indexación de datos.

MARIA TERESA PANIAGUA RIVERA

student•

Gracias

Vicente Benavides

student•

de embedding solo aparecen esos 3 y ninguno deja hacer deploy con el free plan, alguna alternativa ?

Marcos Cabral

student•

Y para este tipo de procesos, más o menos cuánto es el costo reflejado en el bolsillo?

Despliegue de modelos GPT-4 y embeddings en Azure OpenAI

Introduccion a RAG

Arquitectura y construcción de sistemas RAG desde cero

Qué es RAG y cómo potencia los modelos de lenguaje actuales

Flujo de comunicación entre aplicaciones y sistemas RAG

Fragmentación de documentos en bases de datos vectoriales

Etapas de RAG

Embeddings y bases de datos vectoriales para documentos digitales

Configuración de Azure para RAG: preparativos y gestión de costos

Qué son las bases de datos vectoriales y sus aplicaciones

Despliegue de recursos de IA en Azure con scripts de Bash

Despliegue de modelos GPT-4 y embeddings en Azure OpenAI

Configuración de Jupyter Notebook y ambientes virtuales en Python

Tecnicas de RAG

Vectorización de documentos con Azure Search y OpenAI

Configuración de Azure OpenAI y AI Search en Jupyter Notebook

Integración de LLM para optimizar respuestas en Jupyter Notebook

Actualización manual de índices con nuevos documentos PDF

Búsqueda tradicional, vectorial e híbrida en Azure AI Search

RAG avanzado

Creación de múltiples índices en Azure AI Search con Jupyter

Generación de información ficticia con archivos Parquet

Subida automática de documentos fragmentados a Azure AI Search

Comparación de índices en Azure para optimizar almacenamiento

Creación de aplicación demo con Azure Search Service

Fusionando RAG con un agente

Conexión de Azure AI Search con GPT-4 en Azure AI Foundry

Evolución acelerada de los sistemas de inteligencia artificial