Arquitectura y orquestación de agentes en Copilot Studio

Clase 14 de 17Curso Gratis para crear Agentes de AI con Copilot Studio

Resumen

Construir agentes efectivos requiere entender su arquitectura, la orquestación y cómo se conectan instrucciones, habilidades, autenticación, mensajes y variables. Aquí encontrarás una guía clara, práctica y accionable para diseñar experiencias confiables con Copilot Studio, desde el diseño de prompts hasta el manejo de datos y flujos.

¿Cómo se orquesta un agente inteligente end-to-end?

La arquitectura se organiza en capas que colaboran para dar respuestas útiles y seguras. La interacción inicia en la experiencia del usuario, pasa por un orquestador que decide el flujo, y se apoya en conocimiento con grounding para asegurar respuestas con datos confiables. Todo se ejecuta sobre modelos de inteligencia artificial.

¿Qué es la experiencia del usuario y el orquestador?

  • Interacción por chat, voz o capacidades del agente.
  • El orquestador actúa como director: decide el orden de pasos y qué habilidad activar.
  • Prioriza contexto y selecciona acciones según las instrucciones definidas.

¿Cómo funciona el grounding y las habilidades?

  • El grounding es la conexión a datos: asegura respuestas informadas.
  • Las habilidades son acciones: enviar correo, disparar un trigger, ejecutar flujos, aprobar o firmar documentos.
  • Cada habilidad requiere una descripción clara para que la orquestación seleccione la correcta.

¿Qué implica la autonomía y los modelos de IA?

  • El agente puede planificar, manejar excepciones y decidir cuándo pasar a la siguiente fase.
  • Tras validar el plan, procede a la ejecución.
  • Todo se sustenta en modelos de IA que habilitan el razonamiento y la cimentación de datos.

¿Cómo diseñar instrucciones efectivas y seguras?

Las instrucciones son la columna vertebral: definen propósito, directrices, tono y restricciones. Además, conectan con habilidades y ejemplos, facilitando un plan de ejecución claro.

¿Qué estructura deben tener los prompts?

  • Propósito: objetivo del prompt.
  • Directrices: contexto, tono, restricciones y terminología.
  • Ejemplos: mejorar comprensión con casos representativos.
  • Habilidades: lista con su descripción funcional.

¿Qué buenas prácticas aplicar?

  • Definir límites y alcances de la generación: qué sí y qué no producir.
  • Usar one shot o few shots y, si conviene, encadenar prompts.
  • Numerar pasos e incisos para mayor claridad.
  • Escribir como si fuera para un becario: explícito, paso a paso y con subsegmentos.
  • Pensamiento computacional y de programación para estructurar tareas.

¿Qué rol juegan las herramientas y conectores?

  • Una “herramienta” como Outlook es un envoltorio de un API web con conectores y seguridad.
  • Conectores: autenticación, prevención de pérdida de datos y acceso a documentos.
  • Flujos de Power Automate: integraciones con múltiples servicios.
  • Conectores personalizados: cuando no existe el conector requerido.
  • Datos locales: uso de gateway, permisos y lectura desde la nube.
  • AI Builder: OCR, lectura de tarjetas y formularios para reconocimiento.
  • Autenticación:
  • Usuario final: restringe acceso por grupos o datos sensibles.
  • Autor de Copilot: útil en casos de bajo riesgo, como estado del tiempo.
  • Moderación de contenido: balance entre precisión y verbosidad de la respuesta.

¿Cómo manejar mensajes, preguntas y variables en Copilot Studio?

La experiencia conversacional se construye con mensajes bien formateados, preguntas que capturan datos fiables y variables con un alcance definido. Así se garantiza continuidad y contexto entre nodos y temas.

¿Qué tipos de mensajes admite el agente?

  • Texto directo: respuesta común al usuario.
  • Variación de mensaje: selecciona aleatoriamente entre opciones.
  • Imagen: requiere título y URL pública.
  • Video: título, subtítulo, URL y opcionalmente un botón.
  • Tarjeta básica: estructura simple de imagen y texto.
  • Tarjeta adaptativa: mayor interacción y control.
  • Múltiples imágenes: varias URLs en el mismo nodo.
  • Respuestas rápidas: sugerencias seleccionables por el usuario.

¿Cómo capturar datos con preguntas y entidades?

  • Tipo de pregunta: opción múltiple, entidades o personalizadas.
  • Entidades: correo, dirección, nombre y más; es posible crear entidades propias.
  • Elementos visuales: imagen, video, tarjetas y variaciones, igual que en mensajes.
  • Comportamientos por omisión:
  • Reintentar si no hay respuesta.
  • Validar contra una entidad.
  • Manejar “no encontrado” o interrupciones.
  • Registrar errores o enviar datos a otro sistema.

¿Cómo usar variables, alcance y Power Fx?

  • Alcance de variables:
  • De tema: viven dentro del tema.
  • Globales: accesibles desde todos los temas.
  • De sistema: catálogo disponible al crear el agente; útiles para eventos como inicio o fin.
  • Operaciones con variables:
  • Crear y pasar variables entre nodos o temas.
  • Establecer valores con “set” sin requerir una pregunta.
  • Asignar valores iniciales para preparar un tema.
  • Visualizar y auditar todas las variables y su tipo/alcance.
  • Diseño modular:
  • Pasar y retornar variables como en una función o método.
  • Variables globales entre múltiples agentes bajo orquestación.
  • Parseo y funciones:
  • Convertir JSON o HTML a formatos legibles.
  • Evitar que se renderice como markdown cuando no conviene.
  • Usar Power Fx para concatenar, limpiar espacios y transformar texto.

¿Te gustaría comentar cómo estructurarías tus instrucciones o qué habilidades conectarías primero? Comparte tus ideas y casos de uso.