Cargar colección de Chroma previamente creada

Clase 19 de 26Curso de Embeddings y Bases de Datos Vectoriales para NLP

Cargar colección de Chroma previamente creada

Imagina que ya tienes una colección o de Chroma que creaste con anterioridad y quieres cargarla nuevamente dentro del computador o servidor que estás utilizando. Para ello necesitarás dos cosas:

  1. El path o dirección en disco donde almacenaste tu colección de Chroma.
  2. El nombre de dicha colección.

En el caso de la notebook que hemos seguido en el curso, tenemos path="/content/data_embeddings"como dirección y 'movies_db_no_embeddings' como el nombre de la colección.

Para cargarla ejecutarás:

client_persistent_2 = chromadb.PersistentClient(path="/content/data_embeddings")

Esto inicializará otro PersistentClient en el mismo path, y después de ello cargarás la colección con el método get_collection() de la siguiente manera:

db_2 = client_persistent_2.get_collection('movies_db_no_embeddings')

Este método obtiene y carga la colección creada desde el archivo indicado.

Para probar tu nuevo índice con la colección de Chroma, ejecuta un peek:

db_2.peek(1)

Adicional a esto, ya puedes ejecutar cualquier otra de las características de las bases de datos Chroma sobre este nuevo índice. ⚙️