Pinecone: Implementación de Bases de Datos Vectoriales Escalables

Clase 20 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Cuando trabajas con modelos de lenguaje y embeddings, elegir la base de datos vectorial correcta marca la diferencia entre una aplicación funcional y una verdaderamente escalable. Pinecone se posiciona como una solución gestionada en la nube, diseñada para manejar búsquedas de vectores a gran escala con alto rendimiento, y en combinación con LangChain se convierte en una herramienta poderosa para construir sistemas de recuperación semántica.

¿Qué diferencia a Pinecone de otras soluciones como Chroma?

Existen varias opciones de vector databases en el mercado, y dos de las más populares son Chroma y Pinecone. Ambas permiten realizar búsquedas semánticas, pero sus diferencias radican en los casos de uso, la escalabilidad y los costos. Pinecone es una solución de paga, gestionada completamente en la nube, lo que significa que no necesitas administrar infraestructura. Esto la hace ideal para entornos empresariales donde se requiere un rendimiento consistente con grandes volúmenes de datos vectoriales.

¿Cómo se crea un index en Pinecone?

El concepto de index en Pinecone es fundamental: representa el espacio donde se almacenan y organizan los vectores de tus documentos. Al crear uno, debes configurar varios parámetros clave [1:15]:

Nombre del index: solo acepta minúsculas y tiene restricciones de formato.
Dimensiones: este número debe coincidir exactamente con el modelo de embeddings que vas a utilizar.
Métrica de distancia: puedes elegir entre similitud de cosenos, distancia euclidiana u otras opciones.
Proveedor cloud: Azure, Google Cloud o Amazon Web Services.

¿Por qué importa el número de dimensiones del modelo de embeddings?

Cada modelo de embeddings genera vectores con una cantidad específica de dimensiones. Por ejemplo, el modelo text-embedding-3-large de OpenAI produce vectores de 3072 dimensiones [2:30]. Si configuras tu index en Pinecone con un número diferente, la carga de datos fallará. Siempre consulta la documentación oficial del modelo para verificar este dato antes de crear tu index.

¿Cómo se conecta LangChain con Pinecone para cargar documentos?

El flujo de trabajo para cargar información en Pinecone desde LangChain sigue pasos bien definidos que involucran preparación, fragmentación y vectorización de los documentos.

Primero necesitas tus credenciales: la API key de OpenAI y la API key de Pinecone. Un consejo práctico es verificar la conexión con OpenAI usando invoke antes de continuar [3:45].

El proceso de carga se estructura así:

Cargar el documento: en el ejemplo se usa un archivo TXT con contenido breve para controlar costos.
Dividir en fragmentos (chunks): se utiliza CharacterTextSplitter de LangChain, definiendo el chunk_size y el chunk_overlap.
Definir el modelo de embeddings: se importa desde langchain_openai y se especifica el modelo text-embedding-3-large.
Vectorizar y subir a Pinecone: mediante PineconeVectorStore.from_documents, pasando los documentos fragmentados, el nombre del index y el modelo de embeddings.

Es importante prestar atención al tamaño de los chunks. Si defines un chunk_size demasiado pequeño, recibirás advertencias porque los fragmentos podrían ser más grandes que el límite establecido [6:50]. En el ejemplo, se ajustó a 200 caracteres con un overlap de 40 para evitar este problema.

¿Cuánto tarda la carga y cómo verificarla?

El tiempo de carga depende directamente del volumen de información. Con un TXT pequeño tarda segundos, pero con documentos extensos o CSVs con muchas filas, el proceso puede llevar minutos [8:30]. La verificación se hace directamente en el panel de Pinecone: si el index inicia vacío y ahora muestra registros, la carga fue exitosa.

¿Cómo se realiza una búsqueda por similitud en la base vectorial?

Una vez cargada la información, puedes hacer consultas utilizando el método similarity_search sobre el vector store [9:45]. Al enviar un query como "¿Dónde nació el hidrógeno?", Pinecone busca los vectores más cercanos al vector de la pregunta y devuelve los documentos relevantes.

El resultado incluye uno o más objetos Document con el contenido más similar.
La búsqueda retorna múltiples resultados ordenados por proximidad vectorial.
Una buena práctica es generar preguntas a partir del texto original para validar que la recuperación funciona correctamente.

Como recomendación profesional, si trabajas en un entorno empresarial, monitorea constantemente el consumo tanto en Pinecone como en OpenAI. Como ingeniero de NLP o inteligencia artificial, gestionar los costos de estas herramientas de paga es una responsabilidad clave.

Además de la búsqueda por similitud, existen otros métodos de recuperación de información en bases vectoriales. ¿Conoces cuáles son y en qué escenarios conviene usar cada uno? Comparte tu respuesta en los comentarios.

Comentarios

Ricardo Gomez

student•

Búsqueda Filtrada: Filtra los resultados basados en metadata. Por ejemplo, puedes buscar solo entre los tweets almacenados o restringir la búsqueda a comentarios de una categoría específica.
Búsqueda de Palabras Clave: Aunque Pinecone se enfoca en la búsqueda semántica, es posible combinar búsquedas tradicionales de palabras clave con búsquedas por embeddings para obtener resultados más precisos.

Jovanny Delgado

student•

VectorStore: Pinecone en LangChain

Pinecone es otro popular servicio de almacenamiento y búsqueda de vectores utilizado en LangChain. Al igual que Chroma, ofrece una forma eficiente de almacenar y recuperar vectores numéricos, pero con algunas características distintivas.

Ventajas de Pinecone

Escalabilidad: Pinecone está diseñado para manejar grandes volúmenes de datos y puede escalar automáticamente según las necesidades.
Gestión de Metadatos: Permite almacenar y buscar metadatos junto con los vectores, lo que puede ser útil para filtrar y organizar los resultados.
Integración con Cloud Providers: Pinecone se integra fácilmente con los principales proveedores de cloud como AWS, GCP y Azure.
API Amigable: Ofrece una API sencilla y bien documentada para interactuar con el servicio.

Cómo usar Pinecone en LangChain

Configurar una Cuenta: Crea una cuenta en Pinecone y obtén las credenciales necesarias.
Crear una Colección: Crea una colección en Pinecone para almacenar tus vectores.
Crear un VectorStore: En LangChain, utiliza la clase Pinecone para crear un VectorStore.
Agregar Vectores: Agrega tus vectores a la colección de Pinecone.
Realizar Búsquedas: Utiliza el método similarity_search para buscar vectores similares a una consulta dada.

Ejemplo:

Pythonfrom langchain.vectorstores import Pinecone from langchain.embeddings import OpenAIEmbeddings

# Crear embeddings embeddings = OpenAIEmbeddings()

# Crear un VectorStore vectordb = Pinecone.from_documents( documents, embeddings, index_name="my_index" )

# Realizar una búsqueda docs = vectordb.similarity_search("What is the meaning of life?") Usa el código con precaución.

Casos de Uso

Pinecone puede ser utilizado para una amplia variedad de aplicaciones, incluyendo:

Búsqueda Semántica: Encontrar documentos relevantes basados en su contenido semántico.
Recomendaciones: Sugerir productos, películas o artículos similares a los que el usuario ha visto o comprado.
Análisis de Sentimientos: Clasificar textos según su sentimiento (positivo, negativo, neutro).
Chatbots: Proporcionar respuestas relevantes a las preguntas de los usuarios.

Conclusión

Tanto Chroma como Pinecone son excelentes opciones para crear VectorStores en LangChain. La elección entre ellos dependerá de tus necesidades específicas, como el tamaño de los datos, la escalabilidad requerida y las características adicionales que necesites.

Ricardo Gomez

student•

Actualmente solo deja crear gratis sobre AWS

Juan Andrés Guillamet Chargué

student•

Hola, consulto, hice una pregunta que no tenia ninguna relacion con el documento txt que subi y el print del vectorstore me respondio con informacion del documento. La respuesta no deberia ser vacia? o no que no puede dar esa información por que no la tiene?

Juan Felipe Ángel Martínez Bernal

student•

Se que los notebooks son útiles para la exploración, pero aquí dejo mi versión en .py

"""
Create a vector store using Pinecone
"""

import os
from dotenv import load_dotenv

from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter
from langchain_openai import OpenAIEmbeddings
from langchain_pinecone import PineconeVectorStore

load_dotenv()

def pinecone_vectorstore():
    """Create a vector store using Pinecone"""

    # Variables globales
    index_name = os.getenv('INDEX_NAME')

    # 1. Cargar texto como Document
    loader = TextLoader('./Data/Final/text_pinecone.txt', encoding='utf-8')
    documents = loader.load()   # lista con 1 Document (todo el texto)

    # 2. Partir en varios Document (uno por chunk)
    text_splitter = CharacterTextSplitter(
        chunk_size=50,    # puedes ajustar según necesidad
        chunk_overlap=5
    )
    docs = text_splitter.split_documents(documents)  # ahora docs es una lista de muchos Document

    print(f"Original: {len(documents)} documento(s)")
    print(f"Después del split: {len(docs)} documentos")

    # 3. Crear embeddings
    embedding = OpenAIEmbeddings(model='text-embedding-3-large')

    # 4. Crear o cargar el índice de Pinecone
    vectorstore = PineconeVectorStore.from_documents(
        documents=docs,
        embedding=embedding,
        index_name=index_name,
    )

    # 5. Buscar documentos similares
    query = "¿Cuáles son los principales desafíos de la inteligencia artificial?"

    response = vectorstore.similarity_search(
        query=query,
        k=1
    )

    for doc in response:
        print("-" * 50)
        print(doc.page_content)
        print("-" * 50)

if __name__ == '__main__':
    pinecone_vectorstore()

Juan Felipe Ángel Martínez Bernal

student•

Este es el texto que use:

La inteligencia artificial está transformando múltiples industrias alrededor del mundo. En la medicina, permite detectar enfermedades con mayor precisión, analizar imágenes médicas en segundos y personalizar tratamientos para los pacientes. En el sector financiero, ayuda a prevenir fraudes, optimizar inversiones y mejorar la atención al cliente mediante asistentes virtuales. La IA también tiene un rol fundamental en la educación, donde puede adaptar los contenidos de aprendizaje a las necesidades de cada estudiante y generar nuevas metodologías pedagógicas.

Sin embargo, junto con las oportunidades aparecen grandes desafíos. Uno de ellos es la privacidad de los datos, ya que muchos de los sistemas de inteligencia artificial requieren cantidades masivas de información sensible para entrenarse. Otro reto es el sesgo algorítmico: si los datos de entrenamiento no son diversos, los resultados de los modelos pueden ser injustos o discriminatorios. A esto se suma la preocupación por la pérdida de empleos debido a la automatización, lo cual genera debates sobre el futuro del trabajo y la necesidad de nuevas habilidades en la fuerza laboral.

Por esta razón, es fundamental que el desarrollo y la implementación de la inteligencia artificial se realicen de manera ética y responsable. Los gobiernos, las empresas y la academia deben trabajar juntos para establecer marcos regulatorios, fomentar la transparencia y garantizar que los beneficios de la tecnología lleguen a toda la sociedad. Solo así se podrá aprovechar el enorme potencial de la inteligencia artificial sin dejar de lado los valores humanos que deben guiar nuestro progreso.

Juan Felipe Ángel Martínez Bernal

student•

Necesitas un archivo .env con estas variables:

# LLMs
OPENAI_API_KEY = ''
# Pinecone
INDEX_NAME = ''
PINECONE_API_KEY = ''

Platzi Team

student•

pueden porfavor subir el código de esta clase? el que esat subido es de una anterior

Kenny Cáceres

student•

No cargo el archivo!

Juan David Acosta González

student•

Me parece que hubiera sido mejor cargar el material y los diferentes notebooks en un repositorio en github, para asi ya clonar el repositorio y ya, en vez de tener que descargar los files por clase

Prevalentware SAS

student•

el archivo con el codigo esta desactualizado, pusieron el mismo codigo en las ultimas tres clases "18-introduccion-a-embedding"

Alejandro Nieto

student•

Rango, número fijo, aproximación, categoría, conjunto, híbrida, similitud cruzada, y cualquier otra que me falte jaja.

Pinecone: Implementación de Bases de Datos Vectoriales Escalables

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain

Creación de Agentes Inteligentes con LangChain

Instalación y uso de API Keys para modelos de lenguaje en Google Collab

Chat Models y Prompt templates

Chat Messages con OpenAI

Conexión y uso de modelos de chat con LangChain y OpenAI

Uso de Modelos de Google AI Gemini en LangChain

Creación de Plantillas de Prompts en LangChain

Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Cadenas en LangChain

Creación de Cadenas en LangChain con String Output Parser

Gestión de Historial de Chat con LangChain

Integración de Herramientas Claves en LangChain: Runnable, OutputParser, Streaming

Creación de Chatbots Inteligentes con Memoria Conversacional

Cadena de Procesos para Memoria Conversacional con GPT-3.5 Turbo

Carga de documentos en LangChain

Carga y procesamiento de archivos HTML con LangChain y Beautiful Soup

Carga de PDFs y CSVs en LangChain con PyPDF y CSV Loader

División de Texto en Fragmentos con TextSplitters en LangChain

Retrieval-augmented generation (RAG)

Gestión de Vectores de Texto con Chroma y LangChain

Embeddings y su aplicación en modelos de lenguaje y RAG