Técnica zero-shot con 4 elementos clave

Resumen

El zero-shot prompting es la técnica de obtener una respuesta de un LLM con una instrucción directa, sin darle ejemplos previos de lo que esperas. Es la forma más común de interactuar con ChatGPT y la base para construir prompts efectivos cuando trabajas con modelos como GPT en el playground.

La idea suena simple, pero hay un detalle que cambia todo: cada mensaje que envías cuenta como un prompt, incluso las respuestas del asistente forman parte del contexto. Eso significa que la forma en que estructuras tu primera instrucción define cómo se comportará el resto de la conversación.

¿Qué es el zero-shot prompting y cuándo conviene usarlo?

Cuando le pides a ChatGPT algo como traduce a inglés "estoy aprendiendo a hacer prompts efectivos", estás haciendo zero-shot. Una sola instrucción, ningún ejemplo, y obtienes el resultado. La diferencia con el few-shot es justamente esa: aquí no entregas muestras de lo que esperas.

¿Qué es zero-shot prompting? Es darle a un LLM una instrucción directa para que ejecute una tarea sin proporcionarle ejemplos previos del resultado esperado. [00:08]

Esta técnica funciona muy bien para tareas sencillas como traducciones, definiciones o preguntas puntuales. Para problemas más complejos, conviene apoyarte en el system prompt, ese mensaje base que guía toda la conversación posterior.

¿Cómo construir un buen prompt para un LLM?

Hay cuatro conceptos que te ayudan a estructurar instrucciones efectivas. No son una forma natural de pensar al inicio, pero con práctica se vuelven automáticos. Te los explico con un caso real: pedirle al modelo que te ayude a planear unas vacaciones con tu pareja.

El enfoque: ¿qué tarea quieres que cumpla?

El enfoque define la tarea concreta que el modelo debe ejecutar. Casi siempre que usas ChatGPT empiezas por aquí, aunque no lo notes. Preguntar quién es el presidente de un país o pedir un resumen de la Revolución Francesa son enfoques. [04:30]

En el ejemplo de viajes, el primer enfoque fue ayúdame a planear mis vacaciones con mi esposa. Pero esa instrucción es ambigua: hay muchas formas de ayudar. Reducir la ambigüedad es tu trabajo principal al hacer prompting. Una versión mejor sería pedirle que te pregunte qué planes quieren hacer, qué tipo de vacaciones les gustan y que a partir de eso proponga opciones.

El contexto: ¿qué información necesita saber el modelo?

El contexto es la memoria que le entregas al LLM antes de que empiece a responder. Datos como nacionalidad, presupuesto, restricciones o preferencias evitan que tenga que preguntarte cosas obvias. [07:20]

En el ejemplo, el contexto incluyó tenemos la idea de ir a Europa, somos mexicanos, pero no sabemos qué países requieren visa. Con esa información, el asistente ya parte de un escenario claro y puede priorizar mejor sus respuestas.

Un detalle clave: los LLM son poco determinísticos. Si envías el mismo prompt dos veces, las respuestas pueden variar. Por eso conviene probar varias veces para ver si el comportamiento es consistente.

¿Cómo poner límites y un rol al asistente?

Los otros dos conceptos refinan cómo responde el modelo. Aquí es donde la mayoría de prompts amateurs se quedan cortos.

Los límites: qué puede y qué no puede hacer

Los límites se expresan como cosas que el modelo puede o no puede hacer, no como verbos o instrucciones. Si dices haz esto, eso es enfoque. Si dices no me hables de visados hasta que hayamos elegido un plan, eso es un límite. [11:45]

Los límites también sirven para controlar el estilo de las respuestas. Por ejemplo, pedir que sea conciso suele ser ambiguo, así que conviene ser específico:

  • Decirle que sus respuestas no superen los 250 caracteres, como un tuit.
  • Indicarle que no se salga de su rol cuando el usuario pregunte cosas fuera de tema.
  • Pedirle que haga un resumen en lugar de listas extensas.

¿Por qué pedir "sé conciso" no siempre funciona? Porque conciso es ambiguo para un LLM. Es mejor poner un límite medible, como un máximo de caracteres o de bullet points. [15:10]

Con ese límite, el modelo cambia su forma de responder: en lugar de lanzar seis países y tres recomendaciones, empieza a hacer preguntas concretas para afinar la propuesta.

El rol: ¿a quién contratarías para esta tarea?

El rol es el concepto menos intuitivo y el más poderoso. La pregunta clave es: si tuvieras que contratar a alguien para resolver esta tarea, ¿quién sería? Para planear vacaciones, un agente de viajes. [18:30]

La buena práctica no es solo decir rol: agente de viajes, sino pedirle al modelo actúa como un agente de viajes. Eso lleva el espacio vectorial del LLM hacia ese campo de conocimiento y hace que su personalidad y vocabulario se alineen con esa profesión.

El rol también ayuda a manejar desviaciones. Si el usuario pregunta cómo cambiar la rueda de un coche, puedes indicarle al asistente no te salgas de tu rol de agente de viajes y enfócate en la tarea por resolver. Así el chat vuelve al propósito original.

¿Hay que escribir las palabras enfoque, contexto, límites y rol en el prompt?

No es necesario etiquetar cada sección. Esas palabras tienen peso en el idioma y pueden meter ruido. Lo importante es que los cuatro conceptos te ayuden a enfocar el espacio vectorial del modelo hacia lo que quieres resolver:

  • El rol lleva al LLM al campo de conocimiento correcto.
  • El enfoque define las instrucciones que debe cumplir.
  • El contexto ahorra preguntas innecesarias.
  • Los límites afinan el estilo de las respuestas.

¿A ti te pasa que ChatGPT te da respuestas larguísimas que cuesta leer? Cuéntamelo en los comentarios y dime qué límite usarías para resolverlo.