Arquitectura y orquestación de agentes en Copilot Studio
Clase 14 de 17 • Curso Gratis para crear Agentes de AI con Copilot Studio
Resumen
Construir agentes efectivos requiere entender su arquitectura, la orquestación y cómo se conectan instrucciones, habilidades, autenticación, mensajes y variables. Aquí encontrarás una guía clara, práctica y accionable para diseñar experiencias confiables con Copilot Studio, desde el diseño de prompts hasta el manejo de datos y flujos.
¿Cómo se orquesta un agente inteligente end-to-end?
La arquitectura se organiza en capas que colaboran para dar respuestas útiles y seguras. La interacción inicia en la experiencia del usuario, pasa por un orquestador que decide el flujo, y se apoya en conocimiento con grounding para asegurar respuestas con datos confiables. Todo se ejecuta sobre modelos de inteligencia artificial.
¿Qué es la experiencia del usuario y el orquestador?
- Interacción por chat, voz o capacidades del agente.
- El orquestador actúa como director: decide el orden de pasos y qué habilidad activar.
- Prioriza contexto y selecciona acciones según las instrucciones definidas.
¿Cómo funciona el grounding y las habilidades?
- El grounding es la conexión a datos: asegura respuestas informadas.
- Las habilidades son acciones: enviar correo, disparar un trigger, ejecutar flujos, aprobar o firmar documentos.
- Cada habilidad requiere una descripción clara para que la orquestación seleccione la correcta.
¿Qué implica la autonomía y los modelos de IA?
- El agente puede planificar, manejar excepciones y decidir cuándo pasar a la siguiente fase.
- Tras validar el plan, procede a la ejecución.
- Todo se sustenta en modelos de IA que habilitan el razonamiento y la cimentación de datos.
¿Cómo diseñar instrucciones efectivas y seguras?
Las instrucciones son la columna vertebral: definen propósito, directrices, tono y restricciones. Además, conectan con habilidades y ejemplos, facilitando un plan de ejecución claro.
¿Qué estructura deben tener los prompts?
- Propósito: objetivo del prompt.
- Directrices: contexto, tono, restricciones y terminología.
- Ejemplos: mejorar comprensión con casos representativos.
- Habilidades: lista con su descripción funcional.
¿Qué buenas prácticas aplicar?
- Definir límites y alcances de la generación: qué sí y qué no producir.
- Usar one shot o few shots y, si conviene, encadenar prompts.
- Numerar pasos e incisos para mayor claridad.
- Escribir como si fuera para un becario: explícito, paso a paso y con subsegmentos.
- Pensamiento computacional y de programación para estructurar tareas.
¿Qué rol juegan las herramientas y conectores?
- Una “herramienta” como Outlook es un envoltorio de un API web con conectores y seguridad.
- Conectores: autenticación, prevención de pérdida de datos y acceso a documentos.
- Flujos de Power Automate: integraciones con múltiples servicios.
- Conectores personalizados: cuando no existe el conector requerido.
- Datos locales: uso de gateway, permisos y lectura desde la nube.
- AI Builder: OCR, lectura de tarjetas y formularios para reconocimiento.
- Autenticación:
- Usuario final: restringe acceso por grupos o datos sensibles.
- Autor de Copilot: útil en casos de bajo riesgo, como estado del tiempo.
- Moderación de contenido: balance entre precisión y verbosidad de la respuesta.
¿Cómo manejar mensajes, preguntas y variables en Copilot Studio?
La experiencia conversacional se construye con mensajes bien formateados, preguntas que capturan datos fiables y variables con un alcance definido. Así se garantiza continuidad y contexto entre nodos y temas.
¿Qué tipos de mensajes admite el agente?
- Texto directo: respuesta común al usuario.
- Variación de mensaje: selecciona aleatoriamente entre opciones.
- Imagen: requiere título y URL pública.
- Video: título, subtítulo, URL y opcionalmente un botón.
- Tarjeta básica: estructura simple de imagen y texto.
- Tarjeta adaptativa: mayor interacción y control.
- Múltiples imágenes: varias URLs en el mismo nodo.
- Respuestas rápidas: sugerencias seleccionables por el usuario.
¿Cómo capturar datos con preguntas y entidades?
- Tipo de pregunta: opción múltiple, entidades o personalizadas.
- Entidades: correo, dirección, nombre y más; es posible crear entidades propias.
- Elementos visuales: imagen, video, tarjetas y variaciones, igual que en mensajes.
- Comportamientos por omisión:
- Reintentar si no hay respuesta.
- Validar contra una entidad.
- Manejar “no encontrado” o interrupciones.
- Registrar errores o enviar datos a otro sistema.
¿Cómo usar variables, alcance y Power Fx?
- Alcance de variables:
- De tema: viven dentro del tema.
- Globales: accesibles desde todos los temas.
- De sistema: catálogo disponible al crear el agente; útiles para eventos como inicio o fin.
- Operaciones con variables:
- Crear y pasar variables entre nodos o temas.
- Establecer valores con “set” sin requerir una pregunta.
- Asignar valores iniciales para preparar un tema.
- Visualizar y auditar todas las variables y su tipo/alcance.
- Diseño modular:
- Pasar y retornar variables como en una función o método.
- Variables globales entre múltiples agentes bajo orquestación.
- Parseo y funciones:
- Convertir JSON o HTML a formatos legibles.
- Evitar que se renderice como markdown cuando no conviene.
- Usar Power Fx para concatenar, limpiar espacios y transformar texto.
¿Te gustaría comentar cómo estructurarías tus instrucciones o qué habilidades conectarías primero? Comparte tus ideas y casos de uso.