Qué son las bases de datos vectoriales

Curso de RAG con Microsoft Azure

Contenido del curso

Introduccion a RAG

Etapas de RAG

Tecnicas de RAG

RAG avanzado

Fusionando RAG con un agente

Tomar examen

Qué son las bases de datos vectoriales

Resumen

Las bases de datos vectoriales son el motor que permite que sistemas como Netflix, Spotify y los flujos RAG encuentren información por similitud semántica en lugar de coincidencias exactas. Si vienes de SQL o MongoDB, este modelo cambia las reglas: ya no piensas en filas ni documentos, piensas en espacios tridimensionales.

¿Qué es una base de datos vectorial y por qué importa?

Una base de datos vectorial organiza la información en un núcleo de tres dimensiones, donde cada chunk se ubica cerca de otros con significado parecido. Si tienes fragmentos sobre computadoras, se agrupan en una zona; si el mismo documento también habla de reciclaje electrónico, esos fragmentos viajan a otra zona vinculada con hogar y familia. Y si aparece un tercer tema, ocupa un tercer vector.

Esta lógica rompe con lo que veníamos haciendo. Las bases de datos relacionales como SQL, MySQL u Oracle trabajan con tablas y estructura rígida. Las no relacionales guardan documentos completos para consultarlos rápido. Los grafos saltan entre nodos para encontrar relaciones. Pero ninguna piensa en tres dimensiones [01:00].

¿Qué es una base de datos vectorial? Es una base de datos que almacena pequeños pedazos de información (chunks) en un espacio tridimensional, donde la cercanía entre puntos representa similitud semántica. No guarda información lineal, sino fragmentos indexados para búsqueda por significado.

¿Cómo funciona la búsqueda por similitud semántica?

A diferencia de los documentos lineales de una base no relacional, aquí la información se almacena en pedazos pequeños que quedan estructurados gracias a los índices generados en la etapa de indexación. Cuando haces una consulta, la base no busca palabras exactas: busca el chunk que mejor encaje dentro de esa conversación.

Imagina que preguntas sobre planetas. La base recorre el espacio tridimensional, descarta zonas vacías y elige el índice más cercano al sentido de tu pregunta. Esa es la similitud semántica: encontrar lo más parecido en significado, no en letras [02:30].

¿Quién usa esto en producción?

Netflix y Spotify ya lo aplican. Cuando terminas una canción o una película, sus bases vectoriales identifican los índices más parecidos a lo que acabas de consumir y te recomiendan el siguiente contenido. Ese flujo de recomendación instantáneo vive sobre vectores.

¿Cuáles son las mejores bases de datos vectoriales del mercado?

El mercado de bases vectoriales está creciendo y conviven dos tipos de jugadores: los tradicionales con soporte vectorial añadido y los nativos.

PostgreSQL: soporta búsquedas vectoriales, útil si quieres mezclar relacional y vectorial en un solo motor.
Cassandra: también admite vectores, aunque no es su fuerte.
LanceDB, Milvus, Vespa, Chroma: jugadores nativos que dominan hoy el espacio vectorial.

Que una base relacional soporte vectores no significa que sea la mejor opción. PostgreSQL puede funcionarte si necesitas algo híbrido rápido, pero se queda corto frente a las opciones nativas cuando el volumen y la precisión importan [04:15].

¿Conviene usar PostgreSQL para vectores o una base nativa? Depende del caso. PostgreSQL sirve para proyectos pequeños o híbridos, pero si tu producto depende de búsqueda semántica a escala, una base nativa como Milvus o Chroma rinde mucho mejor.

¿Una sola base o arquitectura híbrida?

La decisión inteligente, desde la perspectiva de un arquitecto de software, suele ser usar dos bases de datos en paralelo: una vectorial para búsqueda semántica y una estructurada para datos lineales. Así obtienes lo mejor de ambos mundos sin forzar a un motor a hacer lo que no fue diseñado para hacer.

¿Cómo se conecta esto con un proceso RAG?

La indexación es el corazón del asunto. Cada chunk recibe un índice que define su posición dentro del espacio vectorial, y ese ordenamiento es lo que permite que un proceso de RAG (Retrieval Augmented Generation) recupere fragmentos relevantes para alimentar al modelo.

Dominar esta lógica te da tres habilidades concretas:

Entender cómo se acomodan los índices dentro del espacio tridimensional.
Estructurar chunks de forma que la búsqueda semántica devuelva resultados útiles.
Extraer información precisa para enriquecer respuestas generativas con RAG.

Visualizar un entorno tridimensional cuesta trabajo, no te voy a mentir. Yo mismo sigo aprendiendo a conceptualizarlo después de años trabajando con SQL. Pero una vez que lo asimilas, abres la puerta a construir buscadores, recomendadores y asistentes con IA que entienden lo que el usuario realmente quiere decir.

¿Ya estás usando alguna base vectorial en tus proyectos? Cuéntame en los comentarios cuál te ha funcionado mejor.