Comparación de índices en Azure para optimizar almacenamiento

Clase 19 de 22 • Curso de RAG con Microsoft Azure

Resumen

Evaluar y comparar índices en plataformas como Azure es esencial para optimizar el almacenamiento y facilitar operaciones eficientes en proyectos tecnológicos. Una selección adecuada del tipo de índice y escenario puede marcar una gran diferencia en términos de rendimiento, velocidad y compresión de datos almacenados.

¿Cuál es la importancia de verificar los índices creados?

Antes de comenzar cualquier comparación detallada, es crucial verificar que todos los índices hayan sido cargados correctamente. Esto te permitirá asegurarte de que la información esté lista para su análisis y evaluación posterior.

Confirmación visual del portal Azure.
Revisión del número total de registros por índice (en este caso, diez mil).

¿Cómo evaluar índices utilizando código?

Para realizar una evaluación eficiente, es recomendable crear un bloque de código especializado que ayude a extraer y presentar visualmente la información clave de tus índices en Azure. Algunos datos indispensables para observar:

Nombre del índice creado.
Escenario específico aplicado.
Tamaño en megabytes del almacenamiento general.
Tamaño de almacenamiento de vectores.

Utilizando paquetes útiles de visualización como el paquete double 8, se logra una presentación más clara y detallada, permitiendo detectar fácilmente diferencias relevantes entre cada índice.

¿Qué aspectos clave observar en la evaluación?

Existen detalles particulares que deben destacarse claramente al momento de realizar una evaluación efectiva:

Capacidad de almacenamiento inicial y comprimida.
Nivel de compresión alcanzado en diferentes escenarios.
Escenarios recomendados dependiendo del volumen y tipo de información gestionada.

¿Cómo seleccionar el escenario adecuado según la información manejada?

Cada escenario presenta ventajas específicas según el tipo de información con la que se está trabajando. Por ejemplo:

Para grandes volúmenes de datos, son recomendables escenarios con mayor eficiencia en compresión.
Para cantidades pequeñas o medianas, como seis o siete documentos PDF, podrían ser adecuados los escenarios tipo baseline s o escalar full.

Esta selección acertada facilitará significativamente cualquier proceso de RAC (Recuperación Automática de la Información) o cualquier otro proceso que requiera almacenamiento eficiente y velocidad óptima en la recuperación de información.

Comparar escenarios y métodos mediante métricas prácticas nos permite tomar decisiones basadas en información clara y precisa. Experimentar con índices distintos ayudará a encontrar la combinación más eficiente según tus necesidades específicas.

¿Cuál ha sido tu experiencia con el manejo de índices en Azure? ¡Comparte con nosotros tu perspectiva!

Alex Aguirre

student•

Les comparto info:

- Microsoft Reactor: para aumentar y complementar conceptos generales, y mayor volumen de ejemplos simples (mas simples que los mostrados en este curso. link: Repasar en particular: -- Vector embeddings -- RAG

- Azure AI Search Docu: todos los conceptos que vimos a lo largo del curso están explicados, y hay muchísimas mas información. link: Repasar en particular: -- Estrategias de importación de data, y la relación entre "Index" e "Indexer" (https://learn.microsoft.com/en-us/azure/search/search-what-is-data-import)

No encontré en la docu donde explican la diferente estrategia que existe al momento de crear el "index", hay multiples modelos y estrategias de búsquedas. En el recurso de Microsof Reactor que comparto, para Vector embeddings están super bien repasados estos conceptos!

David Agudelo

student•

excelente aporte!!!

Luis Sandoval

student•

Esta clase debio estar despues de la clase 17

Felipe A. Quiroz

student•

Falló el agente de IA

Edison Isaza

student•

pueden subir los recursos de esta clase porfavor

Pablo Martinez

student•

Siento que faltó profundizar más en los escenarios.

David Agudelo

student•

por lo visto el cobro es día a día. alguien sabe como pausar los cobros del RAG sin desmontarlo?

Francisco Espinoza

student•

Cierto, a tenerlo en cuenta. Tambien me ayudaria la informacion.

Edwin Garcia

student•

uy , siendo asi se consume el presupuesto que nos dan

Comparación de índices en Azure para optimizar almacenamiento

Introduccion a RAG

Arquitectura y construcción de sistemas RAG desde cero

Qué es RAG y cómo potencia los modelos de lenguaje actuales

Flujo de comunicación entre aplicaciones y sistemas RAG

Fragmentación de documentos en bases de datos vectoriales

Etapas de RAG

Embeddings y bases de datos vectoriales para documentos digitales

Configuración de Azure para RAG: preparativos y gestión de costos

Qué son las bases de datos vectoriales y sus aplicaciones

Despliegue de recursos de IA en Azure con scripts de Bash

Despliegue de modelos GPT-4 y embeddings en Azure OpenAI

Configuración de Jupyter Notebook y ambientes virtuales en Python

Tecnicas de RAG

Vectorización de documentos con Azure Search y OpenAI

Configuración de Azure OpenAI y AI Search en Jupyter Notebook

Integración de LLM para optimizar respuestas en Jupyter Notebook

Actualización manual de índices con nuevos documentos PDF

Búsqueda tradicional, vectorial e híbrida en Azure AI Search

RAG avanzado

Creación de múltiples índices en Azure AI Search con Jupyter

Generación de información ficticia con archivos Parquet

Subida automática de documentos fragmentados a Azure AI Search