Contenido del curso
Herramientas y Búsqueda Vectorial
Orquestación y Construcción con LangGraph
Criterios de Uso y Finalización
Búsqueda vectorial con embeddings en MongoDB
Resumen
Construir un agente de inteligencia artificial que resuelva dudas técnicas requiere combinar un LLM, herramientas externas y una base de datos con capacidades vectoriales. Aquí aprenderás cómo se diseña un agente para soporte de MongoDB usando GPT, vector search y memoria a corto plazo, y por qué los embeddings son la pieza que conecta todo.
Qué hace un agente de IA para soporte técnico de MongoDB
El agente que vas a desarrollar amplía la página de soporte de MongoDB y atiende dos objetivos muy concretos: ayudar a desarrolladores a resolver problemas comunes y resumir páginas extensas de documentación. Si alguien pregunta cómo conectar MongoDB con un programa en PHP, el agente responde con los enlaces correctos. Si le pasas un manual gigante del driver de PHP, te devuelve los tres métodos principales y la función exacta para hacer un query o un update [00:38].
¿Qué es un agente de IA? Es un sistema que usa un LLM como cerebro y herramientas externas para ejecutar tareas. Decide qué herramienta usar según la pregunta del usuario.
Cómo se estructura la arquitectura del agente con GPT y MongoDB
El flujo del agente combina tres capas que trabajan en conjunto. El cerebro es GPT de OpenAI, que recibe la pregunta y decide qué herramienta invocar [01:18].
- Una herramienta que obtiene el contenido de una página de documentación específica y lo resume.
- Una herramienta de vector search que ejecuta búsqueda semántica sobre una base de datos en MongoDB.
- Una capa de memoria a corto plazo que guarda el contexto de la conversación para usarlo en interacciones futuras.
Ambas herramientas apuntan a MongoDB porque ahí viven todos los documentos fuente. La diferencia está en cómo cada una recupera la información: una resume, la otra busca por significado [01:50].
Por qué darle memoria al agente cambia la experiencia
La memoria a corto plazo permite que el agente recuerde lo que le preguntaste antes y mantenga coherencia en la conversación. Sin memoria, cada interacción empieza desde cero y el usuario tiene que repetir contexto cada vez [02:30].
Qué son los embeddings y cómo funcionan en búsqueda vectorial
La búsqueda vectorial es una metodología que busca por similitud semántica, es decir, por el significado de los conceptos, no por coincidencia de palabras clave como hace la búsqueda de texto tradicional [03:18].
La pieza clave son los embeddings. Aunque los científicos de IA los llamaron así, en realidad son vectores: arreglos de números que capturan las cualidades semánticas de un dato. Cualquier programador ya ha trabajado con vectores, solo que estos son un tipo especial: una lista de números que permite establecer conexiones entre el significado de múltiples objetos [03:55].
¿Qué es un embedding? Es un arreglo de números que representa el significado de un dato. Sirve para comparar qué tan parecidos son dos objetos desde el punto de vista semántico.
Cómo se mapean los datos en un espacio vectorial
Los vectores ubican datos similares como puntos cercanos dentro de un espacio vectorial. Imagina cuatro objetos: gato, perro, manzana y naranja. Cuando generas sus vectores, cada uno queda en una posición específica [04:35].
Si pides algo parecido a un gato, el sistema encuentra que el punto está cerca del perro pero lejos de la manzana y la naranja, así que devuelve gato y perro. Si buscas algo parecido a una fresa, sus vectores quedan cerca de manzana y naranja, lejos de los animales, y esos serán los resultados [05:10].
Cómo generar embeddings y guardarlos en MongoDB
Para crear vectores necesitas un modelo especializado en generación de embeddings. Le pasas un dato, atraviesa el modelo y recibes el arreglo de números como respuesta [05:55].
- Modelos especializados en texto.
- Modelos especializados en imágenes.
- Modelos multimodales, que aceptan cualquier tipo de objeto.
La regla crítica es usar siempre el mismo modelo para codificar tu información y para codificar las preguntas del usuario. Solo así puedes comparar vectores creados con el mismo algoritmo [06:25].
Por qué MongoDB funciona como base de datos vectorial
Los vectores de tu información se guardan en una base de datos con capacidades nativas para manejarlos como tipo de dato del modelo. MongoDB cumple con eso. Cuando llega una pregunta del usuario, generas su embedding, lo pasas como parámetro de la consulta y la base de datos retorna los objetos con vectores semánticamente similares [07:05].
El proceso completo en MongoDB tiene tres pasos:
- Generar los embeddings de tus datos.
- Crear un índice de búsqueda vectorial.
- Enviar la consulta para obtener resultados ordenados por similitud.
Con esta base ya puedes pasar al entorno de desarrollo e implementar búsqueda vectorial sobre el sistema de documentación que alimentará tu agente. ¿Qué tipo de documentación te gustaría indexar primero en tu propio agente?