Búsqueda tradicional, vectorial e híbrida en Azure AI Search

Clase 14 de 21Curso de RAG

Resumen

Para obtener resultados más certeros y precisos en búsquedas dentro de Azure AI Search, se presentan diferentes técnicas según el objetivo y la cantidad de información disponible. La búsqueda tradicional o natural puede ofrecer un primer acercamiento, pero existen métodos más efectivos como la búsqueda vectorial y la búsqueda híbrida, que combinan las ventajas de ambas tecnologías para resultados más acotados y pertinentes.

¿Qué es y cómo funciona la búsqueda tradicional?

La búsqueda tradicional en Azure AI Search se basa en textos ingresados naturalmente. Aunque ofrece resultados relevantes inicialmente, podría también arrojar documentos no deseados relacionados indirectamente al tema central.

  • Es sencilla de implementar.
  • Puede devolver resultados superficiales que no siempre enfocan sólo en el documento esperado.

¿Por qué optar por la búsqueda vectorial?

La búsqueda vectorial implica trabajar con paquetes específicos como vectorizable text query, permitiendo una consulta mucho más precisa basada en vectores.

  • Devuelve resultados mucho más específicos.
  • Excluye documentos irrelevantes, como ocurrió al eliminar resultados que hacían referencia a "Benefit Details", enfocándose únicamente en los documentos relevantes para "Contoso".

¿Cómo combinar búsqueda tradicional y vectorial?

Los métodos se pueden unificar en una búsqueda híbrida, combinando texto tradicional con técnicas vectoriales para mejorar aún más la precisión de los resultados.

  • Permite especificar parámetros complementarios entre ambas técnicas.
  • Es ideal para contextos amplios como repositorios con múltiples documentos o archivos PDF.

Gracias a estos métodos de Azure AI, tienes la posibilidad de ajustar los parámetros según los requerimientos específicos de búsqueda, entregando resultados eficientes y cómodos adaptados a cada necesidad particular. Además, la implementación puede simplificarse siguiendo los pasos demostrados para establecer conexiones, realizar consultas y desplegar información desde la plataforma.