Resumen

Cuando un prompt crece en complejidad, la forma en que lo organizamos marca la diferencia entre un resultado inconsistente y uno que se repite con calidad cada vez que lo ejecutamos. La clave está en traducir la estructura visual que usamos como humanos a un formato que la inteligencia artificial pueda interpretar sin ambigüedad: las etiquetas XML.

¿Por qué el formato visual de un documento no basta para la IA?

Partiendo de un prompt de few-shot prompting que incluía ejemplos de tuits de alto y bajo engagement, el primer paso fue llevarlo a un documento de Google Docs y aplicar títulos, subtítulos y listas con viñetas [1:40]. Visualmente, el resultado era mucho más legible para cualquier persona: se distinguían los tuits individuales, los grupos de alto y bajo engagement, y la instrucción principal.

Sin embargo, al copiar y pegar ese documento en Claude, el formato visual se perdió casi por completo [4:08]. Los títulos, la indentación y las viñetas desaparecieron. Esto ocurre porque toda esa jerarquía es puramente visual y las herramientas de IA no la interpretan de la misma forma que un humano. La máquina necesita marcadores explícitos que le digan dónde inicia y dónde termina cada bloque de información.

¿Qué son las etiquetas XML y cómo se aplican en un prompt?

Las etiquetas XML son una convención que permite delimitar contenido de forma clara para las máquinas [4:40]. Funcionan con una estructura sencilla:

  • Se abre con el signo < seguido de una palabra descriptiva y se cierra con >.
  • Se cierra el bloque repitiendo la etiqueta, pero añadiendo una barra / antes del nombre: </ejemplos>.
  • La palabra dentro de la etiqueta debe ser descriptiva: si describes tuits, usa <tweet>, no "pajarito" [7:15].

Como dato interesante, estas etiquetas evolucionaron históricamente hasta convertirse en HTML, el lenguaje con el que se construyen las páginas web [5:00]. No se trata de programar, sino de aplicar un sistema de marcado que elimina la ambigüedad.

¿Cómo se estructura un prompt complejo con estas etiquetas?

El proceso consiste en envolver cada pieza de información en su contenedor correspondiente. Por ejemplo, todos los ejemplos van dentro de <ejemplos> y </ejemplos>. Cada tuit individual se marca con <tweet-alto-engagement> o <tweet-bajo-engagement> según corresponda [8:20]. Las etiquetas funcionan como contenedores anidados: siempre que se abre uno, debe cerrarse, y un contenedor puede vivir dentro de otro.

  • Cada etiqueta de apertura debe tener su etiqueta de cierre idéntica.
  • El contenido entre ambas etiquetas es lo que la IA atribuye a ese bloque.
  • Si una etiqueta queda abierta o abarca contenido que no le corresponde, se incrementa la probabilidad de alucinaciones o de que no detecte los patrones deseados [10:52].

Un beneficio adicional de usar etiquetas descriptivas como <tweet-alto-engagement> es que se pueden mezclar los ejemplos de forma aleatoria [9:20], algo que en la clase anterior se identificó como oportunidad de mejora para el few-shot prompting. Cuando las frases tienen espacios, se reemplazan por guiones dentro de la etiqueta para mantener claridad.

¿Cómo hacer el prompt legible para humanos y máquinas al mismo tiempo?

Una vez que el prompt tiene etiquetas XML, es más claro para la IA pero puede volverse difícil de leer para las personas. La solución es aplicar indentación y colores dentro del documento de trabajo [11:30]. Al indentar el contenido dentro de cada etiqueta, se visualiza rápidamente qué pertenece a qué contenedor. Asignar colores a las etiquetas facilita aún más la lectura en equipo.

Lo importante es que estos cambios visuales no afectan el resultado. Al pegar el prompt en Claude, la indentación y los colores desaparecen, pero las etiquetas XML se mantienen intactas y cumplen su función [12:25].

¿Cuándo conviene usar etiquetas XML en lugar de escribir directo en el chat?

Para consultas cortas y simples, escribir directamente en la caja de texto funciona bien. El problema aparece con prompts largos: si se olvida presionar Shift + Enter para hacer un salto de línea y se presiona solo Enter, el prompt se envía incompleto [13:10].

La recomendación práctica es clara:

  • Escribe el prompt en un documento externo cuando sea estructurado.
  • Pide a alguien que no conozca el contexto que lo lea y te diga qué entendió.
  • Una vez validado, cópialo y pégalo en tu LLM favorito.

Esta disciplina de trabajar fuera de la herramienta no solo evita errores, sino que convierte cada prompt en un activo reutilizable que cualquier miembro del equipo puede entender, editar y mejorar. ¿Ya usas etiquetas XML en tus prompts o tienes otra forma de organizarlos? Comparte tu experiencia.