Búsqueda vectorial con embeddings en MongoDB

Curso para Crear Agentes de AI con MongoDB

Contenido del curso

Fundamentos y Configuración de Agentes de AI

Herramientas y Búsqueda Vectorial

Orquestación y Construcción con LangGraph

Criterios de Uso y Finalización

13
Qué lograste al crear tu agente con MongoDB
00:48 min

Tomar examen

Búsqueda vectorial con embeddings en MongoDB

Resumen

Construir un agente de inteligencia artificial que resuelva dudas técnicas requiere combinar un LLM, herramientas externas y una base de datos con capacidades vectoriales. Aquí aprenderás cómo se diseña un agente para soporte de MongoDB usando GPT, vector search y memoria a corto plazo, y por qué los embeddings son la pieza que conecta todo.

Qué hace un agente de IA para soporte técnico de MongoDB

El agente que vas a desarrollar amplía la página de soporte de MongoDB y atiende dos objetivos muy concretos: ayudar a desarrolladores a resolver problemas comunes y resumir páginas extensas de documentación. Si alguien pregunta cómo conectar MongoDB con un programa en PHP, el agente responde con los enlaces correctos. Si le pasas un manual gigante del driver de PHP, te devuelve los tres métodos principales y la función exacta para hacer un query o un update [00:38].

¿Qué es un agente de IA? Es un sistema que usa un LLM como cerebro y herramientas externas para ejecutar tareas. Decide qué herramienta usar según la pregunta del usuario.

Cómo se estructura la arquitectura del agente con GPT y MongoDB

El flujo del agente combina tres capas que trabajan en conjunto. El cerebro es GPT de OpenAI, que recibe la pregunta y decide qué herramienta invocar [01:18].

Una herramienta que obtiene el contenido de una página de documentación específica y lo resume.
Una herramienta de vector search que ejecuta búsqueda semántica sobre una base de datos en MongoDB.
Una capa de memoria a corto plazo que guarda el contexto de la conversación para usarlo en interacciones futuras.

Ambas herramientas apuntan a MongoDB porque ahí viven todos los documentos fuente. La diferencia está en cómo cada una recupera la información: una resume, la otra busca por significado [01:50].

Por qué darle memoria al agente cambia la experiencia

La memoria a corto plazo permite que el agente recuerde lo que le preguntaste antes y mantenga coherencia en la conversación. Sin memoria, cada interacción empieza desde cero y el usuario tiene que repetir contexto cada vez [02:30].

Qué son los embeddings y cómo funcionan en búsqueda vectorial

La búsqueda vectorial es una metodología que busca por similitud semántica, es decir, por el significado de los conceptos, no por coincidencia de palabras clave como hace la búsqueda de texto tradicional [03:18].

La pieza clave son los embeddings. Aunque los científicos de IA los llamaron así, en realidad son vectores: arreglos de números que capturan las cualidades semánticas de un dato. Cualquier programador ya ha trabajado con vectores, solo que estos son un tipo especial: una lista de números que permite establecer conexiones entre el significado de múltiples objetos [03:55].

¿Qué es un embedding? Es un arreglo de números que representa el significado de un dato. Sirve para comparar qué tan parecidos son dos objetos desde el punto de vista semántico.

Cómo se mapean los datos en un espacio vectorial

Los vectores ubican datos similares como puntos cercanos dentro de un espacio vectorial. Imagina cuatro objetos: gato, perro, manzana y naranja. Cuando generas sus vectores, cada uno queda en una posición específica [04:35].

Si pides algo parecido a un gato, el sistema encuentra que el punto está cerca del perro pero lejos de la manzana y la naranja, así que devuelve gato y perro. Si buscas algo parecido a una fresa, sus vectores quedan cerca de manzana y naranja, lejos de los animales, y esos serán los resultados [05:10].

Cómo generar embeddings y guardarlos en MongoDB

Para crear vectores necesitas un modelo especializado en generación de embeddings. Le pasas un dato, atraviesa el modelo y recibes el arreglo de números como respuesta [05:55].

Modelos especializados en texto.
Modelos especializados en imágenes.
Modelos multimodales, que aceptan cualquier tipo de objeto.

La regla crítica es usar siempre el mismo modelo para codificar tu información y para codificar las preguntas del usuario. Solo así puedes comparar vectores creados con el mismo algoritmo [06:25].

Por qué MongoDB funciona como base de datos vectorial

Los vectores de tu información se guardan en una base de datos con capacidades nativas para manejarlos como tipo de dato del modelo. MongoDB cumple con eso. Cuando llega una pregunta del usuario, generas su embedding, lo pasas como parámetro de la consulta y la base de datos retorna los objetos con vectores semánticamente similares [07:05].

El proceso completo en MongoDB tiene tres pasos:

Generar los embeddings de tus datos.
Crear un índice de búsqueda vectorial.
Enviar la consulta para obtener resultados ordenados por similitud.

Con esta base ya puedes pasar al entorno de desarrollo e implementar búsqueda vectorial sobre el sistema de documentación que alimentará tu agente. ¿Qué tipo de documentación te gustaría indexar primero en tu propio agente?

Comentarios2

Mateo Montoya Henao

Estudiante

✨ Resumen Visual de la Clase: Creación de agente de soporte MongoDB con búsqueda vectorial ✨

1. La Idea Central (El Core 💡):
Desarrollar un agente de inteligencia artificial que ayuda a los desarrolladores a resolver problemas comunes en MongoDB mediante búsqueda semántica y resúmenes de documentación.

2. Puntos Clave (En viñetas 📌):

Agentes de IA: Herramientas que interactúan y resuelven dudas específicas.
Búsqueda Vectorial: Técnica que encuentra similitudes semánticas en lugar de coincidencias de palabras.
Embeddings: Vectores que representan cualidades semánticas de los datos.
Memoria en Agentes: Permite al agente recordar información de interacciones previas.
Funciones de Resumen y Búsqueda: Herramientas que el agente usa para obtener respuestas precisas.

3. El Ejemplo o Dato Crucial 🚀:
La búsqueda vectorial utiliza embeddings para mapear datos similares en un espacio vectorial, facilitando respuestas contextuales.

4. Conexión o Siguiente Paso 🔗:
Este conocimiento se aplica en la creación de agentes conversacionales que mejoran su rendimiento con cada interacción, útiles para proyectos de desarrollo y soporte técnico.

Alexander Silvera

Estudiante

puedo cambiar la base de datos de Mongodb a Firebase? Porque tengo una página web con firebase y quisiera realizar esto con esa base de datos. Es eso posible?

Daniel Lucumi

Estudiante

•

Segun leo en la pagina oficial si lo soporta, tendrias que crear los embedding! y luego crear el embedding para la busqueda.

Kevin Fiorentino

Estudiante

MongoDB permite vectorizar tu información, convertirla en embeddings y realizar búsquedas semánticas. Si quieres usar Firebase, tendrás que ver cómo convertir esa info a embeddings, como dice el compañero. En el caso de que no lo permita, también puedes convertir tu mismo esa info. No es algo difícil, investiga un poco.

Búsqueda vectorial con embeddings en MongoDB

Fundamentos y Configuración de Agentes de AI

Agentes de AI con LangGraph y MongoDB

Configura tu entorno de agentes en Instruct

Qué es un agente de IA y cuándo usarlo

Cuándo usar agentes de IA y cuándo no

Componentes clave de un agente de IA

Herramientas y Búsqueda Vectorial

Tools y memory en agentes de IA