Arquitectura y conocimiento en Copilot Studio

Resumen

Construir un agente útil va más allá de escribir un buen prompt. Necesitas entender cómo se estructura un agente en Copilot Studio, cómo se conecta a fuentes de conocimiento y qué decisiones tomar para que responda con seguridad y contexto real. Aquí te muestro esa arquitectura aplicada a un caso concreto: el Hotel Contoso.

¿Cómo está estructurada la arquitectura de un agente?

Un agente no es solo un modelo de lenguaje. Es un sistema con varias piezas trabajando juntas, y entenderlas te ayuda a diseñar mejor.

En el centro está el orquestador, que es la lógica que recibe cada prompt del usuario y decide qué hacer con él [1:00]. Ese orquestador se conecta con tres elementos clave:

  • La cimentación del conocimiento (también llamada conexión a tierra), que son las fuentes de información de las que el agente extrae respuestas.
  • La memoria del chat, que influye en cómo responde según lo que ya pasó en la conversación.
  • Las herramientas (antes llamadas acciones), que son conectores hacia bases de datos, servicios web o APIs externas [1:55].

Todo esto se apoya en los modelos de cimentación, los modelos generativos que estructuran el lenguaje natural de la respuesta [2:25].

¿Qué hace el orquestador en un agente? Recibe el prompt del usuario y decide si consultar la base de conocimiento, usar la memoria de la conversación o llamar a una herramienta externa antes de responder.

¿Cómo creo un agente paso a paso en Copilot Studio?

El flujo empieza con una descripción en lenguaje natural. Para el Hotel Contoso le indiqué que era un hotel de lujo de cinco estrellas en la Ciudad de México y que necesitaba un agente que ayudara a reservar habitaciones, eligiendo tipo de habitación, fechas, número de huéspedes y servicios adicionales, con envío final por correo a recepción [2:50].

Desde la interfaz de Copilot Studio puedes ajustar:

  • El idioma predeterminado, que en mi caso estaba en español de España y se puede cambiar a otros idiomas [3:30].
  • El nombre del agente. Le puse Contoso Hotel en lugar del sugerido Asistente de Reservas Contoso [4:05].
  • Detalles de personalidad y comportamiento, como ofrecer recomendaciones personalizadas, sugerir spa o transporte al aeropuerto, y atender solicitudes especiales como pet friendly o accesibilidad [5:00].

¿Qué configuración de seguridad y modelo debo elegir?

Al crear el agente, la autenticación se hace por defecto con Microsoft Entra ID, que antes se llamaba Azure Active Directory y es el mismo sistema de identidad de Microsoft 365 y Dynamics [6:30].

Para la orquestación, tienes dos caminos: usar inteligencia artificial generativa o trabajar con tópicos manuales. En este caso la deshabilité para empezar con tópicos y dejé el modelo de respuesta en GPT-4o, que es el predeterminado [7:30].

¿Qué tipos de conocimiento puedo conectar a un agente?

La pestaña de Conocimientos es donde defines de dónde saca información tu agente. Copilot Studio te ofrece varias fuentes y cada una tiene sus límites.

  • Sitios web públicos: hasta cuatro URLs por agente, por ejemplo microsoft.com [8:45].
  • Documentos cargados (Word, Excel, PowerPoint, PDF): se almacenan en Dataverse, la base de datos interna de la plataforma, y dependen de la capacidad de almacenamiento asignada [9:10].
  • SharePoint: también permite hasta cuatro URLs.
  • Azure AI Search: una búsqueda en la nube configurable contra distintos servicios.
  • Conectores avanzados hacia Snowflake, Oracle o conectores personalizados vía RESTful API [9:55].

¿Qué es Dataverse en Copilot Studio? Es la base de datos donde se guardan los archivos que cargas como conocimiento. La capacidad disponible depende de tu asignación de almacenamiento.

¿Por qué importa la descripción del archivo de conocimiento?

Cuando subes un documento, como la descripción del Hotel Contoso con sus servicios, restaurantes, gimnasio y tipos de habitación, debes agregar una descripción del archivo. Esa descripción es clave porque cuando uses orquestación con IA, el agente la lee para decidir si esa fuente es la correcta para responder una consulta [11:25].

Después de cargar, ocurre un proceso técnico importante: el contenido se vectoriza dentro de Dataverse. Esa vectorización convierte el texto en representaciones numéricas que permiten búsquedas semánticas, y por eso el estado aparece como en curso un rato antes de quedar disponible [12:00].

¿Qué herramienta elijo según mi fuente de datos?

No todos los agentes necesitan Copilot Studio. La elección depende del tipo de fuente que quieras conectar.

  • Si tu información vive en documentos (Word, Excel, PPT, PDF), puedes usar SharePoint, un agente declarativo o cargarlos directo en Copilot Studio.
  • Si la fuente es contenido web, el Agent Builder dentro de Microsoft 365 Copilot suele ser suficiente.
  • Si necesitas conectividad a bases de datos internas o sistemas con API, ahí sí es obligatorio Copilot Studio, porque es el único que te permite construir conectores personalizados [13:30].

La tarea ahora es tuya: define cuáles son las fuentes de conocimiento de tu proyecto y elige la herramienta correcta para resolver la recuperación de datos. ¿Qué fuente vas a conectar primero a tu agente?