¿Cómo funcionan los embeddings?

1

Cómo Entender y Aplicar Embeddings en IA: De Teoría a Práctica

2

Introducción a One-Hot Encoding y TF-IDF en IA

3

Representación Vectorial de Palabras

4

Evaluación de Similitudes Semánticas: Métodos y Aplicaciones

Quiz: ¿Cómo funcionan los embeddings?

Creación de embeddings

5

Creación y entrenamiento de modelos Word2Vec con Gensim

6

Procesamiento y Limpieza de Datos para IA con Word2Vec y Gensim

7

Entrenamiento de Modelos Word2Vec con GenSim y Análisis de Similitud

8

Word2Vec: Entrenando IA para Comprender el Lenguaje

Quiz: Creación de embeddings

Usando embeddings preentrenados

9

Uso práctico de Sentence Transformers en procesamiento de textos

10

Análisis Semántico: Buscar Textos con Sentence Transformers

11

Manejo de Embeddings con OpenAI: API, Instalación y Datasets

12

Manejo y Visualización de Embeddings con OpenAI: Guía Práctica

13

Creación de un Motor de Búsqueda Semántico con Python

14

Transformación de Texto a Embeddings con Sentence Transformer

Quiz: Usando embeddings preentrenados

Bases de datos vectoriales

15

Qué es y cómo usar una base de datos vectorial

16

Gestión de Bases de Datos Vectoriales con ChromaDB: Instalación y Uso

17

Generación y manejo de embeddings en Chroma con Sentence Transformer

18

Consultas avanzadas y filtrado en bases de datos con Chroma

19

Cargar colección de Chroma previamente creada

20

Configuración y Uso de Pinecone: Desde la Instalación hasta la Inserción de Datos

21

Optimización de Ingesta de Datos en Pinecone: Procesos y Estrategias

22

Consultas Avanzadas en Pinecone: De Texto a Vector y Filtros

23

Carga de índices en Pinecone: Gestión eficiente en la nube

24

Carga de embeddings en Pinecone para búsqueda semántica

25

Creación de buscador semántico con Gradio y Sentence Transformer

Quiz: Bases de datos vectoriales

Conclusiones

26

Potenciando los LLMs: Integración de Embeddings y Datos Vectoriales

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Gestión de Bases de Datos Vectoriales con ChromaDB: Instalación y Uso

16/26
Recursos

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Tanto el .csv como el dataset de la url de kaggle no coinciden con lo que se maneja en el video…

Resumen ■■■■■ En esencia Chroma es una base de datos vectorial que opera en memoria, es decir sus operaciones escritura y lectura suceden en la RAM que puede acceder a los recursos de manera más rápida que si estuviéramos accediendo a un disco, es decir no depende del almacenamiento en el disco. Podemos gestionar con ella directamente documentos debido a que por defecto las colecciones usan el modelo de "SentenceTransformer" para las operaciones de embebido. \- En el caso de uso de películas del \[top 1000 IMDB]\(- <https://www.kaggle.com/datasets/harshitshankhdhar/imdb-dataset-of-top-1000-movies-and-tv-shows?resource=download%5B)> en películas tenemos La idea general para el procesamiento es tomar las columnas útiles que se concatenarán en una columna semánticamente representativa, es decir, esta columna o arreglo de palabras será el input de un modelo que por lotes hará una operación de vectorización, esto es el encoding de palabras a vectores. \- Vectores, índices y datos precisan persistir. Podemos almacenar nuestros vectores en **colecciones**, a las que podremos acceder después y realizarle queries, los **metadatos** nos ayudará es la data original que nos permitirá entender el contexto.
Hola, al correr este código me sale un error: *import chromadbfrom chromadb.utils* *import embedding\_functions* \*\*\*\*\*\*\*\*\*\*\*\*\*\*\* Error \*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\* ImportError Traceback (most recent call last) [\<ipython-input-57-88ac7084b7e8>](https://localhost:8080/#) in \<cell line: 1>() \----> 1 import chromadb 2 from chromadb.utils import embedding\_functions 12 frames[/usr/local/lib/python3.10/dist-packages/fastapi/exceptions.py](https://localhost:8080/#) in \<module> 4 from starlette.exceptions import HTTPException as StarletteHTTPException 5 from starlette.exceptions import WebSocketException as StarletteWebSocketException \----> 6 from typing\_extensions import Annotated, Doc # type: ignore \[attr-defined] 7 8 ImportError: cannot import name 'Doc' from 'typing\_extensions' (/usr/local/lib/python3.10/dist-packages/typing\_extensions.py) \*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\*\* Luegó importe de nuevo *typing\_extensions*, pero el error sigue saliendo. ¿Alguna idea de cómo solucioanr el error? Muchas gracias