Cargar colección de Chroma previamente creada
Clase 19 de 26 • Curso de Embeddings y Bases de Datos Vectoriales para NLP
Contenido del curso
Creación de embeddings
Usando embeddings preentrenados
- 9

Uso práctico de Sentence Transformers en procesamiento de textos
11:16 min - 10

Análisis Semántico: Buscar Textos con Sentence Transformers
04:42 min - 11

Manejo de Embeddings con OpenAI: API, Instalación y Datasets
10:28 min - 12

Manejo y Visualización de Embeddings con OpenAI: Guía Práctica
07:24 min - 13

Creación de un Motor de Búsqueda Semántico con Python
12:20 min - 14

Transformación de Texto a Embeddings con Sentence Transformer
03:53 min
Bases de datos vectoriales
- 15

Qué es y cómo usar una base de datos vectorial
05:36 min - 16

Gestión de Bases de Datos Vectoriales con ChromaDB: Instalación y Uso
11:45 min - 17

Generación y manejo de embeddings en Chroma con Sentence Transformer
04:20 min - 18

Consultas avanzadas y filtrado en bases de datos con Chroma
09:24 min - 19

Cargar colección de Chroma previamente creada
Viendo ahora - 20

Configuración y Uso de Pinecone: Desde la Instalación hasta la Inserción de Datos
05:08 min - 21

Optimización de Ingesta de Datos en Pinecone: Procesos y Estrategias
07:48 min - 22

Consultas Avanzadas en Pinecone: De Texto a Vector y Filtros
05:57 min - 23

Carga de índices en Pinecone: Gestión eficiente en la nube
02:35 min - 24

Carga de embeddings en Pinecone para búsqueda semántica
09:22 min - 25

Creación de buscador semántico con Gradio y Sentence Transformer
16:22 min
Conclusiones
Cargar colección de Chroma previamente creada
Imagina que ya tienes una colección o de Chroma que creaste con anterioridad y quieres cargarla nuevamente dentro del computador o servidor que estás utilizando. Para ello necesitarás dos cosas:
- El path o dirección en disco donde almacenaste tu colección de Chroma.
- El nombre de dicha colección.
En el caso de la notebook que hemos seguido en el curso, tenemos path="/content/data_embeddings"como dirección y 'movies_db_no_embeddings' como el nombre de la colección.
Para cargarla ejecutarás:
client_persistent_2 = chromadb.PersistentClient(path="/content/data_embeddings")
Esto inicializará otro PersistentClient en el mismo path, y después de ello cargarás la colección con el método get_collection() de la siguiente manera:
db_2 = client_persistent_2.get_collection('movies_db_no_embeddings')
Este método obtiene y carga la colección creada desde el archivo indicado.
Para probar tu nuevo índice con la colección de Chroma, ejecuta un peek:
db_2.peek(1)
Adicional a esto, ya puedes ejecutar cualquier otra de las características de las bases de datos Chroma sobre este nuevo índice. ⚙️