Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Clase 9 de 26 • Curso de Agentes AI

Contenido del curso

Fundamentos de los Agentes Inteligentes y LangChain

Chat Models y Prompt templates

Cadenas en LangChain

Carga de documentos en LangChain

Retrieval-augmented generation (RAG)

Agentes en LangChain

Ecosistema de LangChain

26
Creación y Gestión de Aplicaciones con LangChain, LangSmith y LangGraph
03:56 min

Tomar examen

Resumen

Cuando un modelo de lenguaje no entiende exactamente lo que necesitas, la mejor estrategia es mostrarle ejemplos concretos dentro del mismo prompt. Esa es la esencia del few-shot prompting, una técnica que mejora la precisión y relevancia de las respuestas al guiar al modelo con pares de entrada y salida previamente definidos.

¿Qué es el few-shot prompting y por qué funciona?

El few-shot prompting es una técnica donde incluyes ejemplos de comportamiento esperado directamente en el prompt [0:01]. En lugar de depender de instrucciones abstractas, le proporcionas al modelo casos reales que ilustran el patrón que deseas. Esto permite que el modelo "aprenda" en contexto sin necesidad de un entrenamiento adicional.

Existen dos formas principales de implementarlo [0:18]:

Ejemplos fijos: un conjunto estático de ejemplos que se usan en todas las consultas.
Ejemplos dinámicos: se seleccionan automáticamente según la similitud semántica entre la entrada del usuario y los ejemplos almacenados.

¿Por qué el modelo falla sin ejemplos?

Un caso ilustrativo aparece cuando se le pregunta al modelo "¿cuánto es 2 🦜 9?" sin contexto previo [0:42]. El modelo responde con una explicación extensa, pregunta por el significado del emoji y sugiere que podría ser una suma, pero no da una respuesta directa. Lo que realmente queremos es que interprete el emoji como un signo de suma y responda simplemente "11".

Esa ambigüedad se resuelve proporcionando ejemplos claros que le enseñen la convención.

¿Cómo implementar few-shot prompting en LangChain?

Para construir un few-shot prompt se utilizan módulos específicos de LangChain Core [1:34]:

ChatPromptTemplate: define la estructura de cada ejemplo individual.
FewShotChatMessagePromptTemplate: agrupa los ejemplos y los integra al prompt final.

¿Cómo se estructuran los ejemplos?

Los ejemplos se pasan como una lista de diccionarios, cada uno con las llaves input y output [1:55]:

python ejemplos = [ {"input": "2 🦜 2", "output": "4"}, {"input": "2 🦜 3", "output": "5"}, ]

Cada diccionario representa un par de entrenamiento. El modelo observa que el emoji equivale a una suma y generaliza ese patrón para nuevas consultas.

Después se define el template de cada ejemplo usando ChatPromptTemplate con los roles de human y AI [2:52]:

python example_prompt = ChatPromptTemplate.from_messages([ ("human", "{input}"), ("ai", "{output}"), ])

Finalmente, se construye el FewShotChatMessagePromptTemplate pasándole el template y los ejemplos [3:30]:

python few_shot_prompt = FewShotChatMessagePromptTemplate( example_prompt=example_prompt, examples=ejemplos, )

¿Cómo integrar el prompt principal con el modelo?

El few-shot prompt se incorpora dentro de un prompt principal (main prompt) donde también se establece el rol del sistema [4:28]. Esto combina la instrucción de contexto con los ejemplos de entrenamiento:

python main_prompt = ChatPromptTemplate.from_messages([ ("system", "Eres un mago de las matemáticas"), few_shot_prompt, ("human", "{input}"), ])

Aquí se aplica el concepto de cadenas o chains [5:15], que permite encadenar componentes con el operador |:

python chain = main_prompt | modelo respuesta = chain.invoke({"input": "2 🦜 9"}).content

¿Qué resultado se obtiene?

Al ejecutar la cadena, el modelo ahora responde directamente: 2 🦜 9 = 11 [6:05]. Ya no genera explicaciones innecesarias ni pide contexto adicional. Los ejemplos previos le enseñaron exactamente cómo interpretar el emoji.

Este flujo demuestra cómo la combinación de un rol claro en el system message, los ejemplos fijos del few-shot prompting y la integración mediante cadenas produce respuestas precisas y predecibles. El modelo de lenguaje utilizado fue GPT-4o, aunque la misma técnica funciona con otros modelos como los de Hugging Face o Gemini [0:32].

¿Qué otros escenarios se te ocurren donde el few-shot prompting pueda guiar al modelo de forma efectiva? Comparte tus ejemplos en los comentarios.

Comentarios

Juan Pablo Paillet

student•

Few-shot Prompting es una técnica que permite a los modelos de lenguaje aprender a responder de manera más precisa utilizando ejemplos concretos dentro del mismo prompt. Los ejemplos ayudan a guiar las respuestas del modelo, mejorando su relevancia. Hay dos formas de implementar esta técnica: usando ejemplos fijos o dinámicos, lo que permite adaptar las interacciones según la entrada.

Conceptos Principales:

Few-shot Prompting: Utiliza ejemplos dentro del prompt para enseñar al modelo cómo debe comportarse. Los ejemplos actúan como guías para que el modelo aprenda a responder de manera precisa.
- Ejemplo: Si queremos que el modelo interprete emojis como operaciones matemáticas, proporcionamos ejemplos como "2 🦜 2 = 4" para que el modelo aprenda la relación.
Ejemplos Fijos: Conjunto estático de ejemplos que se utilizan en cada interacción, independientemente de la entrada del usuario.
- Ejemplo: Siempre usar "2 🦜 2 = 4" y "2 🦜 3 = 5" para que el modelo entienda cómo operar con emojis.
Ejemplos Dinámicos: Los ejemplos se seleccionan según la similitud semántica entre la entrada del usuario y los ejemplos almacenados.
- Ejemplo: Si el usuario pregunta "¿cuánto es 5 emoji 5?", se selecciona un ejemplo similar para que el modelo aprenda a sumar usando emojis.
Prompt Template: Pasa ejemplos al modelo. Cada ejemplo tiene una entrada (input) y una salida (output) esperada, generalmente estructurados en formato de diccionario.
- Ejemplo: Un diccionario con {input: "2 🦜 2", output: "4"} enseña al modelo que el emoji representa una operación matemática.
Chains: Permite integrar múltiples pasos en una cadena, combinando el modelo con ejemplos y roles para crear interacciones más complejas.
- Ejemplo: Encadenar un prompt que define al modelo como "un mago de las matemáticas" junto con ejemplos para que se comporte de acuerdo a la expectativa.

José Fernando Aguilar Arredondo

student•

Un buen approach que le podemos dar a este curso, no solo es compartiendo cuestiones técnicas, sino también cómo podemos aplicar esto en la vida real ya sea en las empresas o proyectos en los que trabajamos. Esto nos puede ayudar como brainstorming o feedback de lo que estemos haciendo.

Caso de uso que le ví: AI agent que esté atendiendo un chat.

Por ejemplo, podríamos iniciar con la identificación de consultas más comunes de los clientes que suele recibir en el chat (ya sea que lo haga un Data Science o Data Analyst). Luego diseñamos ejemplos de interacciones con cada tipo de consulta y los podemos incluir en el prompt del modelo, esto podrá guiar de forma contextual al modelo y pueda responder de forma precisa.

Mauro Volpe

student•

Para agregar Preguntas y Respuestas (Q&A) también se recomienda usar Few-shot prompting?

Juan Manuel Ortiz Suárez

student•

Lo más adecuado para sistemas de Q&A es la generación aumentada por recuperación (RAG) que es una técnica que se explicará más adelante en este curso.

Adrián Soto Girón

student•

Sí, para agregar preguntas y respuestas (Q&A) se recomienda usar Few-Shot Prompting. Esta técnica permite entrenar al modelo con ejemplos específicos, lo que mejora la precisión y relevancia de las respuestas. Al proporcionar ejemplos de preguntas y respuestas en el prompt, el modelo puede comprender mejor el contexto y generar respuestas adecuadas. Esto es especialmente útil en aplicaciones como chatbots, donde la claridad y precisión son esenciales para una buena experiencia de usuario.

Adrián Soto Girón

student•

Al aplicar Few-Shot Prompting, puedes incluir ejemplos que cubran diferentes escenarios. Por ejemplo, si deseas dar respuestas para una situación buena, una mala y una no resolvible, puedes estructurar tus ejemplos de la siguiente manera:

Situación buena: Input: "¿Cómo resuelvo este problema?" Output: "¡Excelente! Para resolverlo, necesitas..."
Situación mala: Input: "¿Y si no puedo resolverlo?" Output: "Lamentablemente, no se puede resolver de esa manera, pero podrías intentar..."
Situación no resolvible: Input: "¿Qué pasa si no hay solución?" Output: "En este caso, lo mejor es considerar alternativas como..."

De esta forma, guías al modelo a entender cómo responder en cada contexto específico, lo que mejorará la relevancia de las respuestas.

Alfonso José Chavarro Cortes

student•

Few-shot Prompting es una técnica donde un modelo es capaz de aprender o adaptarse a una tarea a partir de un número de ejemplos.

Consiste básicamente en mostrar al modelo algunos ejemplos (llamados shots) de lo que quieres que haga.

Variantes del shot prompting

0 shot prompting: Sin mostrar ejemplos al modelo
1 shot prompting: 1 ejemplo mostrado al modelo
few shot prompting: 2+ ejemplos mostrados al modelo

Adrián Soto Girón

student•

El Few-Shot Prompting no puede sustituir completamente al Fine-Tuning, ya que cada técnica tiene su propósito. Few-Shot Prompting permite al modelo aprender a partir de ejemplos específicos incluidos en el mismo prompt, lo que es útil para tareas donde se pueden proporcionar ejemplos relevantes. Es útil en casos donde el costo de reentrenar un modelo es alto o el acceso a datos es limitado.

Sin embargo, el Fine-Tuning ajusta los pesos del modelo a un conjunto de datos específico, lo que mejora el rendimiento en tareas particulares, especialmente cuando se requiere un alto nivel de precisión y adaptación a datos específicos. Sus limitantes incluyen la necesidad de una cantidad considerable de datos y recursos computacionales. En resumen, ambos enfoques son complementarios y se eligen según el contexto del problema a resolver.

Adrián Soto Girón

student•

Combinar Few-Shot Prompting con técnicas como Fine-tuning y RAG (Retrieval-Augmented Generation) es altamente recomendable.

Few-Shot Prompting permite guiar al modelo con ejemplos, aumentando la relevancia de las respuestas. Por otro lado, el Fine-tuning ajusta el modelo a tareas específicas, mejorando su rendimiento. RAG, al integrar información externa, permite enriquecer las respuestas con datos actualizados.

Usar estas técnicas en conjunto maximiza la efectividad de los chatbots, facilitando respuestas más precisas y contextuales.

Giancarlo Zevallos Lecca

student•

Igual que el anterior comentario que hice, se debería hacer ejemplo donde realmente sea útil este tipo de funciones porque esto se puede hacer simplemente con un prompt

Daniel Alejandro Ramirez Gomez

student•

¿Como implemento esto pero evitando gastar tantos token en los ejemplos?

Ronal Leiva

student•

Puedes usar huggin face o si sabes un poco más puedes descargar un destilado de Deepseek y utilizarlo localmente en tu computadora

Luis Carlos Sanmartín Iguarán

student•

podira alguien indicarme en que plataforma esta programando?

Platzi

student•

Está programando en Lan Chen y utilizando la integración Lan Chen OpenAI.

Marifer Villarroel

student•

Esta usando Google Colab:

Ulqernesh Karvenae

student•

La barra vertical en windows es con Alt + 124

Edwin Stiven Higuera Avila

student•

Una de las propuestas que se pueden realizar con este tipo de entrenamiento es la creación de preguntas de cuestionario, tipo:

Pregunta: Donde nació Simón Bolívar? A. respuesta 1 B. respuesta 2 C. respuesta 3

Técnicas de Few-Shot Prompting en Modelos de Lenguaje

Fundamentos de los Agentes Inteligentes y LangChain

Conexión a Huggingface GPT-2 en Google Collaboratory

Desarrollo de Aplicaciones Conversacionales con LangChain

Creación de Agentes Inteligentes con LangChain

Instalación y uso de API Keys para modelos de lenguaje en Google Collab

Chat Models y Prompt templates

Chat Messages con OpenAI

Conexión y uso de modelos de chat con LangChain y OpenAI

Uso de Modelos de Google AI Gemini en LangChain

Creación de Plantillas de Prompts en LangChain