¿Cómo funcionan los embeddings?

1

Cómo Entender y Aplicar Embeddings en IA: De Teoría a Práctica

2

Introducción a One-Hot Encoding y TF-IDF en IA

3

Representación Vectorial de Palabras

4

Evaluación de Similitudes Semánticas: Métodos y Aplicaciones

Quiz: ¿Cómo funcionan los embeddings?

Creación de embeddings

5

Creación y entrenamiento de modelos Word2Vec con Gensim

6

Procesamiento y Limpieza de Datos para IA con Word2Vec y Gensim

7

Entrenamiento de Modelos Word2Vec con GenSim y Análisis de Similitud

8

Word2Vec: Entrenando IA para Comprender el Lenguaje

Quiz: Creación de embeddings

Usando embeddings preentrenados

9

Uso práctico de Sentence Transformers en procesamiento de textos

10

Análisis Semántico: Buscar Textos con Sentence Transformers

11

Manejo de Embeddings con OpenAI: API, Instalación y Datasets

12

Manejo y Visualización de Embeddings con OpenAI: Guía Práctica

13

Creación de un Motor de Búsqueda Semántico con Python

14

Transformación de Texto a Embeddings con Sentence Transformer

Quiz: Usando embeddings preentrenados

Bases de datos vectoriales

15

Qué es y cómo usar una base de datos vectorial

16

Gestión de Bases de Datos Vectoriales con ChromaDB: Instalación y Uso

17

Generación y manejo de embeddings en Chroma con Sentence Transformer

18

Consultas avanzadas y filtrado en bases de datos con Chroma

19

Cargar colección de Chroma previamente creada

20

Configuración y Uso de Pinecone: Desde la Instalación hasta la Inserción de Datos

21

Optimización de Ingesta de Datos en Pinecone: Procesos y Estrategias

22

Consultas Avanzadas en Pinecone: De Texto a Vector y Filtros

23

Carga de índices en Pinecone: Gestión eficiente en la nube

24

Carga de embeddings en Pinecone para búsqueda semántica

25

Creación de buscador semántico con Gradio y Sentence Transformer

Quiz: Bases de datos vectoriales

Conclusiones

26

Potenciando los LLMs: Integración de Embeddings y Datos Vectoriales

No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Qué es y cómo usar una base de datos vectorial

15/26
Recursos

Aportes 2

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Resumen: ■■■■■ Las \*\*\*\*Bases de datos vectoriales\*\*\*\* son sistemas diseñados para almacenar y gestionar datos en forma de vectores, que esencialmente son secuencias o números de elementos de datos. Los modelos de embebido serán aquellos que transforman la data en vectores, la estructura la define la base de datos vectorial y se indexan. Estas bases de datos son especialmente útiles en campos como la inteligencia artificial, el aprendizaje automático, y el análisis de grandes volúmenes de datos, podremos almacenar vectores con altas dimensionalidades. Es posible interactuar con un \[\*\*modelo fundacional\*\*]\(https://aws.amazon.com/es/what-is/foundation-models/) (como un LLM, GPT, Bert) y las bases de datos vectoriales, con el propósito de robustecer las salidas que se generan, en otras palabras podremos hacer búsquedas y comparaciones semánticas con alta calidad. En general la gestión de la BDv, tenemos: \- \*\*Vectores\*\*: Representación matemática de tus datos \- \*\*Documentos\*\*: Tus Documentos, procesados o crudos \- \*\*Metadata\*\*: Los datos que hablan de los datos, descripciones y manifiesto de información. \- \*\*ID\*\*: Parecido a la llave primaria de las bases de datos relacionales, todo índice tiene como propósito mejorar las búsquedas. ■ \*\*PROVEEDORES\*\* Como en cada servicio, siempre existirán ofertas open source y pagas, que recaen en modelos completamente administrados, otras bases de datos buscan ser soluciones en eficiente memoria y de allí que muchas opciones posean diferentes contextos concretos donde puede brillar. \- \[Trychroma]\(https://trychroma.com/) \- \[DeepLake]\(https://www.deeplake.ai/) \- \[Weaviate]\(https://weaviate.io/products)
Las bases de datos vectoriales son famosas ya que permiten el manejo de: * embeddings * documents * metadata * id