Creación de agente de soporte MongoDB con búsqueda vectorial
Clase 7 de 13 • Curso para Crear Agentes de AI con MongoDB
Resumen
Construye un agente de soporte para MongoDB que responda dudas reales de desarrolladores, resuma documentación técnica y aproveche búsqueda vectorial con embeddings. Con un LLM de OpenAI (GPT) como cerebro y memoria de corto plazo, lograrás respuestas útiles, contextuales y enfocadas en la documentación almacenada en MongoDB.
¿Qué hará el agente de soporte con MongoDB?
Este agente está diseñado para solucionar problemas comunes de desarrolladores que trabajan con MongoDB y su ecosistema. Además, resumirá páginas de documentación específica para ofrecer respuestas breves y accionables.
¿Qué objetivos concretos resuelve?
- Responder dudas técnicas, por ejemplo: ¿sirve MongoDB para comunicarse con un programa en PHP?.
- Compartir enlaces cuando corresponda para guiar la implementación.
- Resumir documentación extensa, como el manual del driver de PHP para MongoDB.
- Destacar lo esencial: los “tres métodos principales”, cómo hacer una consulta y cómo hacer un update.
¿Qué datos alimentan las respuestas?
- Todos los documentos fuente están guardados en MongoDB.
- El agente usa estas fuentes controladas para asegurar coherencia y relevancia.
¿Cómo decide qué herramienta usar?
- Si el usuario pide un resumen: utiliza la función que obtiene el contenido de una página y lo resume.
- Si el usuario busca soluciones o respuestas semánticas: usa la herramienta de búsqueda vectorial sobre los documentos.
- La elección depende de la intención de la pregunta.
¿Cómo se integra GPT con herramientas y memoria?
El LLM actúa como orquestador: interpreta la pregunta y activa la herramienta correcta. Además, se añade memoria a corto plazo para mantener el contexto entre turnos y mejorar la continuidad de las respuestas.
¿Qué herramientas usa el LLM?
- Resumen de documentación: obtiene una página específica y produce un resumen.
- Vector search semántico: consulta por similitud de significado en la base de documentos.
¿Para qué sirve la memoria a corto plazo?
- Mantener contexto reciente de la conversación.
- Reutilizar lo ya aclarado en interacciones futuras.
- Ofrecer respuestas más consistentes sin repetir preguntas.
¿Cuál es el flujo general del agente?
- El usuario formula una pregunta o solicita un resumen.
- El LLM decide: resumir o buscar semánticamente.
- Se consulta MongoDB, que contiene las fuentes y, cuando aplica, los vectores.
- Se responde con información precisa y contextual.
¿Qué son los embeddings y cómo funciona la búsqueda vectorial en MongoDB?
La búsqueda vectorial encuentra resultados por similitud semántica del significado, no por coincidencia exacta de palabras. Para lograrlo, se usan vectores (embeddings): listas de números que capturan rasgos semánticos de textos u otros objetos y los ubican como puntos cercanos o lejanos en un espacio vectorial.
¿Cómo entender la similitud semántica con ejemplos simples?
- Objetos como “gato”, “perro”, “manzana” y “naranja” se convierten en vectores.
- Pedir “algo parecido a un gato” devuelve puntos cercanos: gato y, probablemente, perro.
- Buscar con una “fresa” acercará resultados de frutas: manzana y naranja.
¿Qué exige trabajar con embeddings?
- Usar un modelo especializado para generar vectores.
- Mantener el mismo modelo para codificar los datos y las preguntas del usuario.
- Aceptar que hay modelos para texto, imágenes y modelos multimodales.
¿Cómo es el proceso en MongoDB para la búsqueda vectorial?
- Generar embeddings de los documentos fuente.
- Guardar los vectores en una base con soporte nativo de vectores: MongoDB se usará aquí.
- Crear un índice de búsqueda vectorial.
- Codificar la pregunta del usuario con el mismo modelo.
- Ejecutar la consulta vectorial y recuperar objetos con significancia semántica similar.
Y con esto, llega el momento de pasar al entorno de desarrollo: primer paso, implementar la búsqueda vectorial en MongoDB sobre el sistema de documentación que nutrirá al agente.
¿Te gustaría comentar qué casos de uso quieres cubrir con tu agente o qué documentación te interesa resumir primero?