Cursos Empresas Blog Live Conf Precios

Conexión a Huggingface GPT-2 en Google Collaboratory

Clase 1 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Resumen

Construir aplicaciones inteligentes que no solo respondan preguntas, sino que anticipen necesidades y actúen de forma autónoma, es posible gracias a LangChain y los Large Language Models. Entender cómo conectarse a estos modelos es el primer paso para crear chatbots, asistentes virtuales y herramientas de búsqueda avanzada que transforman la experiencia del usuario.

¿Por qué LangChain es esencial para trabajar con Large Language Models?

LangChain facilita todas las etapas del ciclo de vida de una aplicación basada en Large Language Models (LLMs): desde la creación y selección del modelo, pasando por la puesta en producción, hasta la evaluación de la aplicación [0:22]. Su enfoque modular permite encadenar componentes para resolver tareas complejas de manera eficiente.

Los componentes clave de LangChain son:

Cadenas (chains): secuencias de pasos que combinan LLMs con otras herramientas como APIs para ejecutar tareas complejas [0:36].
Memoria: permite a las aplicaciones recordar interacciones previas, mejorando la experiencia en diálogos continuos [0:45].
Herramientas: integración con servicios externos como Google Search o Wolfram Alpha [0:52].
Agentes: entidades que toman decisiones autónomas sobre qué acción ejecutar, basándose en las entradas del usuario y los recursos disponibles [0:58].

¿Qué es un agente y cómo funciona en LangChain?

Un agente es un sistema que percibe su entorno, procesa información y toma decisiones autónomas [1:09]. Según el libro Artificial Intelligence: A Modern Approach, un agente actúa basándose en la percepción de su entorno. En LangChain, los agentes usan LLMs para analizar entradas, razonar y actuar [1:22].

Un ejemplo práctico: un asistente virtual que recibe la solicitud de reservar un vuelo desde Nueva York. El agente percibe la entrada de texto, razona usando el LLM para comprender los detalles y actúa interactuando con APIs de aerolíneas para buscar y reservar vuelos [1:32].

¿Cómo conectarse a un LLM usando Hugging Face y LangChain?

La documentación de LangChain incluye una sección de integraciones donde se listan todos los proveedores disponibles: Azure, Azure OpenAI, Google AI, Google Cloud Vertex AI, entre otros [2:10]. Para esta práctica se utiliza Hugging Face, que ofrece dos formas de conexión: mediante un endpoint o descargando los modelos con pipeline locales [2:28].

El modelo seleccionado es GPT-2, disponible de manera gratuita en Hugging Face [2:38].

¿Cuáles son los pasos para ejecutar el código en Google Colab?

Primero se instalan las dependencias necesarias. Se requieren dos librerías principales:

python !pip install transformers langchain-huggingface

Una vez instaladas las dependencias [2:55], se carga el modelo importando la clase correspondiente desde langchain_huggingface:

python from langchain_huggingface import HuggingFacePipeline

hf = HuggingFacePipeline.from_model_id( model_id="gpt2", task="text-generation", pipeline_kwargs={"max_new_tokens": 10} )

En este bloque se define el ID del modelo como gpt2, se especifica que la tarea es generación de texto (text-generation) y se limita la respuesta a diez tokens [3:15].

Para generar texto a partir de una entrada, se utiliza el método invoke:

python resultado = hf.invoke("Explain what is an electroencephalogram") print(resultado)

Cada vez que se ejecuta, el modelo construye una nueva cadena de texto a partir de la pregunta proporcionada, generando respuestas distintas en cada llamada [4:02].

¿Qué modelos están disponibles en la documentación de LangChain?

La documentación ofrece una tabla detallada con todos los LLMs accesibles desde LangChain. Esto permite comparar proveedores y elegir el más adecuado según las necesidades del proyecto [2:05]. Entre las opciones se encuentran modelos de Azure, Google y Hugging Face, cada uno con sus particularidades de conexión y configuración.

Esta conexión con Hugging Face representa la forma más sencilla de acceder a un modelo open source [4:22]. Todos estos fragmentos de código realizados en Google Colab serán integrados posteriormente en un proyecto completo usando Visual Studio Code.

¿Cuáles serían los tres modelos que seleccionarías para tu próximo proyecto y por qué? Comparte tu respuesta en los comentarios.

Conexión a Huggingface GPT-2 en Google Collaboratory

Obtén respuestas inmediatasProfundiza lo que acabas de ver

Comentarios

Juan Camilo Noreña López

student•

¿Qué es LangChain? 🤔

LangChain es un framework que te permite crear aplicaciones inteligentes utilizando modelos de lenguaje avanzados (como GPT). 🌐

💡 ¿Qué lo hace especial?

Te ayuda a integrar estos modelos en aplicaciones más complejas.
Permite conectar tus modelos con fuentes de datos externas, como APIs y bases de datos.
Facilita tareas como el procesamiento de lenguaje natural y la automatización de procesos. 🤖

Es ideal para desarrollar soluciones avanzadas de IA, ¡y hacerlas realidad de manera eficiente y sencilla! 🎯

Carli Code

teacher•

Excelente!

Juan R. Vergara M.

student•

Gracias por el resumen 🗒️

Sara María Mejia Sánchez

student•

Tomando como base los recursos de la clase sobre Modelos en Hugging Face, podría destacar tres modelos mencionados y sus posibles aplicaciones en el desarrollo de agentes:

gpt2: Este modelo, utilizado en ejemplos dentro de "Hugging Face Local Pipelines" para ilustrar la carga y ejecución local de modelos, se presenta como una opción versátil para tareas de generación de texto. En el contexto de agentes de IA, gpt2 podría ser útil para procesar lenguaje natural, permitiendo al agente comprender y generar texto en interacciones con humanos.

bigscience/bloom-1b7: Su mención en el contexto de inferencia por lotes en GPU sugiere su eficiencia en el procesamiento de grandes volúmenes de datos. Un agente de IA podría beneficiarse de esta capacidad para analizar rápidamente información del entorno y tomar decisiones más informadas.

sentence-transformers/all-MiniLM-L6-v2: Este modelo se destaca por su función de similitud de oraciones, resultando útil para tareas como la comparación y clasificación de texto. Un agente podría utilizar esta capacidad para comprender la intención detrás del lenguaje humano, identificando similitudes entre diferentes comandos o preguntas.

Es crucial recordar que la selección de los modelos ideales depende en gran medida del objetivo específico del agente, las tareas que debe realizar y los recursos disponibles.

Abraham Rodriguez

student•

Buen aporte, gracias

andres reyes

student•

A que se refiere "contexto de inferencia por lotes en GPU"

JOHAN SEBASTIAN ARIAS HERNANDEZ

student•

Hola ! Muy interesante, en qué plataforma estás ejecutando el código ?

Andoni Barba Noe

student•

Es Google Colab

Karla Verónica Álvarez Vázquez

student•

LangChain es una biblioteca de código abierto desarrollada en Python que permite a los desarrolladores crear aplicaciones de procesamiento de lenguaje natural (NLP) y modelos de inteligencia artificial (IA) de manera más fácil y eficiente. Fue lanzada en 2022 y desde entonces ha ganado popularidad debido a su capacidad para simplificar la integración de modelos de lenguaje grandes y complejos en aplicaciones prácticas.

LangChain se enfoca en proporcionar una capa de abstracción sobre modelos de lenguaje grandes como LLaMA, Llama, PaLM, y otros, facilitando la interacción con estos modelos para tareas como el procesamiento de lenguaje natural, la generación de texto, la traducción, la clasificación de texto, y más. Al ofrecer una interfaz unificada para interactuar con diferentes modelos de lenguaje, LangChain reduce la complejidad asociada con la configuración y el uso de estos modelos avanzados en aplicaciones de NLP.

Entre las características clave de LangChain se incluyen:

1. **Interfaz Unificada**: Proporciona una API consistente para interactuar con varios modelos de lenguaje, lo que simplifica el desarrollo y la migración entre diferentes modelos.

2. **Chain**: Permite crear "cadenas" de modelos de lenguaje, donde el output de un modelo se puede utilizar como input para otro, facilitando la creación de flujos de trabajo complejos de NLP.

3. **Hooks**: Ofrece la capacidad de agregar funcionalidades personalizadas en diferentes puntos de las cadenas de modelos, permitiendo la integración de lógica de negocio específica o la modificación de los flujos de trabajo según sea necesario.

4. **Soporte para Diferentes Modelos**: LangChain es compatible con una variedad de modelos de lenguaje, lo que permite a los desarrolladores elegir el modelo más adecuado para sus necesidades específicas.

5. **Comunidad Activa**: Dado que es de código abierto, LangChain cuenta con una comunidad activa de desarrolladores que contribuyen a su desarrollo y mejoramiento continuo.

LangChain es una herramienta valiosa para desarrolladores, investigadores y empresas que buscan aprovechar el poder de los modelos de lenguaje avanzados para crear aplicaciones innovadoras y soluciones de NLP sin necesidad de profundas habilidades en machine learning.

Sandra Milena RAIRAN PINILLA

student•

Los tres modelos que utilizaria son ctransformers, ollama y aphrodite-engine

Carli Code

teacher•

Hola Sandra! cuéntame la razón en la elección de esos modelos :D

Sandra Milena RAIRAN PINILLA

student•

Hola Carli!! los seleccione por ser open source segun lo que investigue.

Walder Elizabeth Javier Brioso

student•

Aqui esta el link a Langchain:

Arístides Pérez Hernández

student•

¿Puedo usar esto para otros modelos open-source?

Sí, puedes aplicar exactamente esta misma lógica para conectarte a miles de modelos open-source alojados en la plataforma. Gracias a que LangChain estandariza la interfaz de conexión mediante sus módulos, intercambiar GPT-2 por modelos mucho más modernos o especializados, como Llama-3, Mistral o variantes de BERT, es un proceso casi transparente. Solo necesitas actualizar el identificador del modelo (el model ID) en tu código y asegurarte de que tu entorno de ejecución tenga la memoria RAM o GPU suficiente para soportar el peso del nuevo modelo. Esta flexibilidad te permite iterar y experimentar a gran velocidad para descubrir qué arquitectura resuelve mejor tu problema específico. Por ejemplo, podrías integrar un modelo entrenado exclusivamente para generar código si estás construyendo un asistente para programadores, o uno optimizado para análisis financiero, todo sin tener que reescribir la lógica central de tu aplicación.

Efrén Andres Toro Gomez

student•

Para instalar las librerías necesarias y comenzar a trabajar con Hugging Face y LangChain en Google Collaboratory, sigue estos pasos:

Abre Google Collaboratory.
En una celda de código, instala las librerías ejecutando:
```
!pip install transformers langchain-huggingface
```

Esto descargará las dependencias requeridas para utilizar modelos como GPT-2. Luego, podrás cargar el modelo y empezar a trabajar en tu proyecto.

camilo andres pulido rodriguez

student•

Alguien sabe en que curso se aprende a usar hugging face?

Mayra Alejandra Soto Nieto

student•

https://platzi.com/cursos/hugging-face/

Ricardo Gomez

student•

Modelos a usar, Open AI, Claude, Meta

Sebastian Carballo

student•

Ricardo! esas son algunas de las empresas líderes creando y entrenando diversos modelos

Erick Eduardo Medina Morales

student•

Yo usaria:

Huggingface por el hecho de que tiene sus librerias independiente y para poder conocer un LLMs mas
OpenAI por ser el lider
Gemini por tener, al día de hoy el top con razonamiento matemático mas avanzado.

Cynthia Mercedes Gorozabel Villavicencio

student•

Se utilizarán varios programas y herramientas en el curso, principalmente Google Collaboratory para la programación y experimentación con los modelos. Además, se emplearán librerías como Transformers y LangChain para interactuar con el modelo GPT-2 de Hugging Face. A lo largo del curso, también se mencionarán otras herramientas externas, como APIs, que se integrarán para enriquecer las aplicaciones creadas.

Gustavo Alexander Alcántara Aravena

student•

LangChain permite a las aplicaciones recordar interacciones previas mediante su componente de memoria. Esto enriquece los diálogos continuos, haciendo que las conversaciones se sientan más naturales y personalizadas al considerar el contexto histórico.

Alejandra Monges

student•

Me fascina todo lo que tenga AI.

Felipe Silva

student•

Implementar un modelo con LangChain en un entorno empresarial ofrece varias ventajas en términos de seguridad. LangChain permite integrar memoria y conexiones a bases de datos internas, lo cual puede ser esencial para manejar información sensible. La seguridad depende de la configuración del acceso a los datos y el uso de protocolos seguros para las API. Además, es importante establecer políticas de autorización y autenticación robustas para proteger los datos internos. La arquitectura modular de LangChain ayuda a gestionar estos aspectos de manera eficiente, garantizando un uso responsable y seguro de los modelos de lenguaje.

Samuel Galindo Morales

student•

donde consigo el link a huggy face

Alfonso Aguilar Grimaldo

student•

en los recursos de la clase estan

Jason Sepulveda

student•

hice es curso en el siguiente repositorio de manera estructurada por si a alguien le sirve seguirlo aqui:

German Yesid Rubiano Romero

student•

El libro mencionado como referencia sobre qué es un agente es "Artificial Intelligence: A Modern Approach". Este texto es fundamental en el campo de la inteligencia artificial y ofrece una base sólida sobre la teoría y práctica de los agentes inteligentes.

Zaidibeth Ramos

student•

Segun Deepseek, los modelos Hugging Face Transformers, LLaMA (Meta AI), GPT-NeoX (EleutherAI), Falcon (TII), OpenLLM, Oobabooga's Text Generation Web UI, GPT4All y FastChat (Vicuna) son modelos que pueden ser utilizados de forma gratuita con LangChain

Juan Suarez

student•

Que son las cadenas es lo mismo que las bases vectoriales?

¡Hola Juan! No, para nada son lo mismo. Piénsalo así: una cadena es el proceso, la secuencia lógica de pasos que sigue tu modelo para llegar a una respuesta. Es como una receta de cocina donde cada instrucción depende de la anterior.

En cambio, una base vectorial es la despensa. Es donde guardas toda tu información convertida a números —vectores— para que el modelo pueda buscar y recuperar contextos relevantes rápidamente cuando los necesita.

La cadena es el "cómo se hace" y la base vectorial es el "de dónde saco los ingredientes". Si estás trabajando con GPT-2, ¿qué parte de tu flujo sientes que te está dando más problemas: definir el proceso de encadenar las ideas o cómo recuperar la información de la base?