Arquitectura y configuración de agentes en Copilot Studio

Clase 8 de 17Curso Gratis para crear Agentes de AI con Copilot Studio

Resumen

La creación de agentes efectivos en Copilot Studio empieza por dominar su arquitectura, la seguridad y el uso de fuentes de conocimiento. Aquí encontrarás una guía clara para configurar un agente con orquestación, memoria, herramientas y conectores, incorporando autenticación con Microsoft Entra ID, almacenamiento en Dataverse y respuesta generativa con GPT-4o.

¿Cómo se estructura un agente y qué componentes clave intervienen?

Un agente funciona como orquestador: recibe el prompt, interpreta la intención y decide los pasos a seguir. Se conecta con la experiencia del usuario, consulta fuentes de conocimiento, usa la memoria del chat y activa herramientas para recuperar o procesar datos.

  • Orquestador: decide el flujo y a quién enviar cada solicitud.
  • Conocimiento y cimentación: integra grounding para responder con base en datos confiables.
  • Memoria: aprovecha el contexto previo del chat para personalizar respuestas.
  • Herramientas: conectividad a servicios web, bases locales o procesos que devuelven datos.
  • Modelo generativo: formula respuestas claras en español.

¿Qué es el orquestador y cómo decide los pasos?

Actúa como el “director” del proceso. Cuando entra un prompt, determina si debe consultar conocimiento, usar memoria o activar una herramienta. Así mantiene coherencia y relevancia en cada respuesta.

¿Qué rol cumplen la memoria y las herramientas?

La memoria conserva el hilo del chat y ajusta el tono y las recomendaciones. Las herramientas conectan con servicios externos: desde una base de datos local hasta una API. Antes se llamaban acciones y hoy permiten ampliar capacidades sin perder control.

¿Cómo asegura respuestas el modelo generativo?

Con modelos de cimentación, el agente redacta en español y organiza la información de forma comprensible. Cuando corresponde, usa GPT-4o como modelo de respuesta para equilibrar calidad y contexto.

¿Cómo configurar un agente en Copilot Studio paso a paso?

Se parte de una descripción en lenguaje natural. Ejemplo: un hotel de lujo en Ciudad de México que desea un agente para reservas que guíe por tipo de habitación, fechas, huéspedes y servicios adicionales, y que al final envíe la reserva por correo al equipo de recepción. El idioma se ajusta en la parte superior y el agente puede renombrarse.

  • Personalización: el agente debe actuar de forma proactiva y personalizada, recomendar habitaciones según preferencias y necesidades como tipo de viaje, número de huéspedes o servicios deseados.
  • Servicios adicionales: sugerir spa, transporte al aeropuerto y desayuno incluido.
  • Detalles especiales: considerar no fumadores, pet friendly y accesibilidad.
  • Seguridad: autenticación con Microsoft Entra ID (antes Azure Active Directory) para integrarse con Microsoft 365 y Dynamics.
  • Marca: editar nombre, icono y descripción.
  • Orquestación: se puede deshabilitar la IA generativa para usar tópicos como orquestación manual, dejando GPT-4o como modelo de respuesta.

¿Cómo agregar y gestionar fuentes de conocimiento?

En la pestaña Conocimientos se cargan y administran los orígenes.

  • Sitios web públicos: hasta cuatro URL por agente.
  • Documentos: Word, Excel, PowerPoint o PDF, almacenados en Dataverse y limitados por su cuota.
  • SharePoint: hasta cuatro URL de SharePoint.
  • Búsqueda en la nube: opciones como Azure AI y Dataverse.
  • Terceros y avanzados: conectores hacia Snowflake, bases Oracle o un conector propio vía RESTful API.

Al cargar un documento, por ejemplo, la “descripción del hotel”, se guarda en Dataverse. Es clave añadir una descripción clara del origen: en orquestación con IA, el agente usará ese texto para elegir el origen correcto. Luego, la plataforma vectoriza el contenido y muestra el estado como “en curso” hasta que esté listo para consultas.

¿Qué criterios definen la herramienta correcta para recuperar datos?

Elegir la herramienta depende del tipo de fuente y del escenario de consulta.

  • Si son documentos corporativos: usar SharePoint o carga directa en Copilot Studio.
  • Si el origen es web: resolver con Microsoft 365 Copilot y Agent Builder.
  • Si hay bases internas o APIs: crear un conector en Copilot Studio.
  • Si se requiere control del flujo: usar tópicos como orquestación manual.
  • Si se necesita lenguaje natural y síntesis: activar IA generativa con grounding.

¿Te gustaría comentar cómo piensas estructurar tus fuentes de conocimiento y qué conectores necesitas?