Creación de agente de soporte MongoDB con búsqueda vectorial

Clase 7 de 13 • Curso para Crear Agentes de AI con MongoDB

Resumen

Construye un agente de soporte para MongoDB que responda dudas reales de desarrolladores, resuma documentación técnica y aproveche búsqueda vectorial con embeddings. Con un LLM de OpenAI (GPT) como cerebro y memoria de corto plazo, lograrás respuestas útiles, contextuales y enfocadas en la documentación almacenada en MongoDB.

¿Qué hará el agente de soporte con MongoDB?

Este agente está diseñado para solucionar problemas comunes de desarrolladores que trabajan con MongoDB y su ecosistema. Además, resumirá páginas de documentación específica para ofrecer respuestas breves y accionables.

¿Qué objetivos concretos resuelve?

Responder dudas técnicas, por ejemplo: ¿sirve MongoDB para comunicarse con un programa en PHP?.
Compartir enlaces cuando corresponda para guiar la implementación.
Resumir documentación extensa, como el manual del driver de PHP para MongoDB.
Destacar lo esencial: los “tres métodos principales”, cómo hacer una consulta y cómo hacer un update.

¿Qué datos alimentan las respuestas?

Todos los documentos fuente están guardados en MongoDB.
El agente usa estas fuentes controladas para asegurar coherencia y relevancia.

¿Cómo decide qué herramienta usar?

Si el usuario pide un resumen: utiliza la función que obtiene el contenido de una página y lo resume.
Si el usuario busca soluciones o respuestas semánticas: usa la herramienta de búsqueda vectorial sobre los documentos.
La elección depende de la intención de la pregunta.

¿Cómo se integra GPT con herramientas y memoria?

El LLM actúa como orquestador: interpreta la pregunta y activa la herramienta correcta. Además, se añade memoria a corto plazo para mantener el contexto entre turnos y mejorar la continuidad de las respuestas.

¿Qué herramientas usa el LLM?

Resumen de documentación: obtiene una página específica y produce un resumen.
Vector search semántico: consulta por similitud de significado en la base de documentos.

¿Para qué sirve la memoria a corto plazo?

Mantener contexto reciente de la conversación.
Reutilizar lo ya aclarado en interacciones futuras.
Ofrecer respuestas más consistentes sin repetir preguntas.

¿Cuál es el flujo general del agente?

El usuario formula una pregunta o solicita un resumen.
El LLM decide: resumir o buscar semánticamente.
Se consulta MongoDB, que contiene las fuentes y, cuando aplica, los vectores.
Se responde con información precisa y contextual.

¿Qué son los embeddings y cómo funciona la búsqueda vectorial en MongoDB?

La búsqueda vectorial encuentra resultados por similitud semántica del significado, no por coincidencia exacta de palabras. Para lograrlo, se usan vectores (embeddings): listas de números que capturan rasgos semánticos de textos u otros objetos y los ubican como puntos cercanos o lejanos en un espacio vectorial.

¿Cómo entender la similitud semántica con ejemplos simples?

Objetos como “gato”, “perro”, “manzana” y “naranja” se convierten en vectores.
Pedir “algo parecido a un gato” devuelve puntos cercanos: gato y, probablemente, perro.
Buscar con una “fresa” acercará resultados de frutas: manzana y naranja.

¿Qué exige trabajar con embeddings?

Usar un modelo especializado para generar vectores.
Mantener el mismo modelo para codificar los datos y las preguntas del usuario.
Aceptar que hay modelos para texto, imágenes y modelos multimodales.

¿Cómo es el proceso en MongoDB para la búsqueda vectorial?

Generar embeddings de los documentos fuente.
Guardar los vectores en una base con soporte nativo de vectores: MongoDB se usará aquí.
Crear un índice de búsqueda vectorial.
Codificar la pregunta del usuario con el mismo modelo.
Ejecutar la consulta vectorial y recuperar objetos con significancia semántica similar.

Y con esto, llega el momento de pasar al entorno de desarrollo: primer paso, implementar la búsqueda vectorial en MongoDB sobre el sistema de documentación que nutrirá al agente.

¿Te gustaría comentar qué casos de uso quieres cubrir con tu agente o qué documentación te interesa resumir primero?