Monitoreo de Azure OpenAI con Log Analytics y API Management

Clase 18 de 21 • Curso de Desarrollo de Chatbots con AzureOpenAI

Contenido del curso

Introducción a Azure Open AI

Open AI Studio

Prompt Enginereering

Uso de los datos (Chat with your Data)

Monitoreo

Mejores prácticas

Conclusiones

21
Desarrollo de Asistentes Virtuales Empresariales con IA Responsable
02:33 min

Tomar examen

Resumen

Controlar el consumo y las llamadas que reciben tus modelos de inteligencia artificial generativa es fundamental para garantizar la estabilidad, seguridad y escalabilidad de cualquier solución desplegada en la nube. A continuación se explican dos estrategias clave para lograrlo: Log Analytics y API Management, ambas disponibles dentro del ecosistema de Microsoft Azure.

¿Cómo configurar Log Analytics para rastrear el uso de Azure OpenAI?

El primer paso consiste en acceder a la configuración del recurso de Azure OpenAI Service en Azure Portal. Dentro de la sección Diagnostic Settings [0:29] se crea una nueva configuración donde se especifica el tipo de logs y métricas que se desean capturar. Esta información puede enviarse a diferentes destinos: un Log Analytics workspace, un storage account, un Event Hub o incluso una solución de un partner externo.

Para trabajar con Log Analytics se necesita un workspace dedicado. Si aún no existe, se despliega una nueva instancia indicando el nombre y la región deseada [1:28]. El proceso tarda entre uno y dos minutos. Una vez disponible, se vincula al recurso de Azure OpenAI para que todas las peticiones queden registradas automáticamente.

¿Qué tipo de análisis permite Log Analytics?

Dentro de la sección de logs del workspace se pueden ejecutar consultas que resumen las peticiones recibidas en un periodo determinado [2:32]. Por ejemplo, es posible obtener un histórico de llamadas a un modelo de embedding como Ada y detectar patrones de error cuando se alcanzan cuotas de uso. Esta visibilidad ayuda a tomar decisiones de arquitectura, como desplegar instancias adicionales para aumentar la capacidad de cómputo [3:18].

Las métricas incluyen volumen de peticiones, códigos de respuesta y tiempos.
Los resultados aparecen tras unos minutos de configurado el diagnóstico.
Un workspace con más de una hora de datos ofrece análisis más completos.

¿Qué ventajas aporta API Management al monitoreo de Azure OpenAI?

API Management permite un control más granular porque registra no solo las métricas de uso, sino también el contenido de cada petición enviada al servicio [5:22]. Esto resulta especialmente útil para auditar los prompts que reciben los modelos y detectar, por ejemplo, solicitudes que podrían generar contenido dañino o de autolesión.

¿Cómo se registra una API de OpenAI en API Management?

El proceso sigue estos pasos:

Registrar el endpoint: se indica la URL del recurso de Azure OpenAI y se asigna un nombre [3:53].
Agregar el API key: puede almacenarse directamente como un named value o, de forma más segura, guardarse en un Key Vault [4:08].
Crear la API con el archivo Swagger: este archivo describe los endpoints disponibles y las credenciales necesarias para la conexión [4:28].
Definir políticas de monitoreo: se configuran reglas que determinan qué datos se registran en cada llamada entrante [4:56].

Una vez completada la configuración, las aplicaciones dejan de apuntar directamente al endpoint de Azure OpenAI y pasan a utilizar la URL proporcionada por API Management. Para autenticarse se utiliza un subscription key que se genera automáticamente tras el registro del servicio [6:08].

¿Cómo configurar alertas para detectar errores en tiempo real?

Azure ofrece una funcionalidad de alertas directamente en el recurso que se desea monitorear [6:50]. Se pueden crear reglas que disparen acciones automáticas cuando se supere un umbral de errores en peticiones de chat completions o completions. Las acciones posibles incluyen:

Enviar un correo electrónico al administrador de la aplicación.
Ejecutar una notificación a través de otros canales configurados.

Esta capacidad de notificación proactiva complementa el análisis retrospectivo que ofrecen Log Analytics y API Management, cerrando así el ciclo completo de observabilidad.

¿Cuándo usar cada estrategia de monitoreo?

Log Analytics es ideal para obtener una vista general del comportamiento del servicio: volumen de llamadas, errores por cuota y tendencias de uso. API Management, en cambio, brinda la posibilidad de inspeccionar el detalle de cada prompt enviado, lo que resulta crítico en escenarios donde la seguridad del contenido y la auditoría son prioridad. Ambas estrategias son complementarias y se recomienda implementarlas en conjunto para cubrir tanto el análisis operativo como el de contenido.

Si ya tienes un recurso de Azure OpenAI en producción, prueba ambas configuraciones y comparte tu experiencia sobre cuál se adapta mejor a las necesidades de tu proyecto.

Comentarios

Hector Fabian Rodriguez Acosta

student•

aun es muy complejo conocer el exacto de tokens en azure, se habla mas del precio de los tokens pero no tando por cantidad que ayudaria mucho con otros modelos de texto

Maritza Mera Gaona

teacher•

Hola. Los tokens en Azure o en cualquier otra plataforma tendrán la misma lógica. Es la forma en que este tipo de modelos entiende. Para estimar los costos es necesario saber la cantidad de tokens que vas a procesar (prompts y completions). Esto depende de uso que le vayas a dar al chatbot, debes primero analizar tu escenario y levantar los requerimientos para determinar:

en promedio cuántos usuarios usaran el chatbot
en promedio en cada sesión el usuario cuántas veces le hará preguntas al chatbot.
cada prompt que envíe el usuario en promedio cuántos tokens genera.
cada completion que genera el chatbot cuántos tokens genera.

Con estos datos estimados ya es cuestión de multiuplicar y podrás calcular qué capacidades de OpenAI

Luis Alvarez

student•

Monitoreo de Servicio

Introducción

El monitoreo del uso de las APIs y recursos desplegados en Azure OpenAI Service es crucial para entender su desempeño y tomar decisiones informadas. Utilizaremos herramientas como Log Analytics y API Management para capturar y analizar datos detallados sobre el uso de nuestros recursos.

Configuración de Log Analytics

Para monitorear el uso de un recurso en Azure, configuramos los ajustes de diagnóstico en el portal de Azure, especificando los logs y métricas a capturar. Podemos enviar estos datos a Log Analytics, un Storage Account, Event Hub, o una solución de un socio. Configurar Log Analytics nos permite obtener información detallada sobre el uso de nuestros modelos de IA generativa.

Después de configurar Log Analytics, generamos peticiones a nuestros modelos para capturar datos de uso. Estos logs nos permiten hacer consultas y obtener un resumen del comportamiento del recurso, identificando posibles errores y ayudándonos a tomar decisiones de arquitectura, como la necesidad de desplegar más servicios.

Uso de API Management

Con API Management, podemos gestionar y monitorear las APIs de nuestros recursos de Azure OpenAI Service. Registramos la API, especificamos su endpoint y configuramos las políticas de monitoreo. Esto nos permite capturar detalles sobre cada llamada API, facilitando un análisis más profundo del contenido y uso de nuestras APIs.

Alertas y Notificaciones

Para detectar errores y problemas en tiempo real, configuramos alertas en el portal de Azure. Estas alertas pueden notificarnos, por ejemplo, cuando se alcanza un número determinado de errores en las solicitudes, permitiendo una respuesta rápida para mantener el rendimiento y disponibilidad del servicio.

Conclusión

El monitoreo efectivo de los recursos de Azure OpenAI Service es esencial para optimizar su uso y costos. Herramientas como Log Analytics y API Management nos proporcionan datos valiosos para comprender y mejorar nuestras aplicaciones de inteligencia artificial generativa. Implementar estas estrategias nos ayuda a garantizar que nuestras soluciones funcionen de manera eficiente y económica. Te invitamos a aplicar estas técnicas y analizar cuál se adapta mejor a tus necesidades específicas.

Jose Rodrigo Moreno Cordero

student•

La explicación es demaciado general, para los que no manejamos todos los conceptos queda muy en el aire la explicacion , Api Mangement,

Rommer Batista

student•

Una práctica útil es crear una consulta Kusto en Log Analytics que sume los tokens de prompt y completion por usuario y genere un dashboard de costos diarios así se visualiza el consumo antes de que se alcance el límite

jrojasn

student•

Hola,

Desde el Diagnostic Log es posible validar las preguntas y respuesta que nos genera los Https Request o para esto debependemos del API Managment?

Platzi

student•

Con Diagnostic Log se pueden capturar logs y métricas, pero para analizar el contenido de los prompts y las respuestas, se depende de API Management.

David Alejandro Lopera Betancur

student•

Interesante clase!

Monitoreo de Azure OpenAI con Log Analytics y API Management

Introducción a Azure Open AI

Desarrollo de Chatbots Empresariales con Azure OpenAI

Solicitud de Acceso a OpenAI Service en Microsoft Azure

Desarrollo de Asistentes Virtuales con Azure OpenAI

Despliegue de Azure OpenAI Service en Azure Portal

Open AI Studio

Gestión de modelos en Azure OpenAI Studio y uso de speech to text

Uso de Azure OpenAI Service con API REST y SDK Python/C#

Configuración de Asistentes Virtuales con GPT para Gestión de PQRs

Gestión de Azure OpenAI Studio y Modelos Generativos

Inteligencia Artificial Generativa Responsable: Principios y Prácticas

Prompt Enginereering

Capacidades del modelo GPT-4 Vision: uso en OpenAI Studio y API REST

Ajuste de modelos GPT 3.5 Turbo con OpenAI Studio en Azure

Búsqueda Vectorial con Embeddings en Azure OpenAI Service

Uso de los datos (Chat with your Data)

Arquitectura RAC para Asistentes Virtuales en Azure

Implementación de Arquitectura RAC con Azure y OpenAI Studio

Despliegue de Asistente Virtual en Azure como Aplicación Web

Integración de Datos No Estructurados con Azure AI Search

Monitoreo

Estimación de Costos y Cuotas en Azure OpenAI Service