Chain of thought y self-consistency en LLMs
Clase 10 de 18 • Curso de Prompt Engineering
Contenido del curso
Clase 10 de 18 • Curso de Prompt Engineering
Contenido del curso
Robert Naranjo
Patricia Inés Castro
Robert Naranjo
Mateo Montoya Henao
Gabriel Obregón
Alfonso Galeano Conde
jeychdan palacios
Kevin Fiorentino
JC OlSol
Héctor Alonso Padilla Ramírez
Baltazar Andersson
Héctor Alonso Padilla Ramírez
Juan Camilo Mejía Rodríguez
Edgar Villatoro Pérez
Juan Miguel Jimenez
Yuliana Mallorga
Woldev S.A.S
Laura Daniela Acosta Contreras
Leyder Sanchez
Henry Norberto Arias Salgado
Charles Castillo Rosas
Javier Ramos
Jefrey Roman Perez
Cesar David Ramírez Dimaté
Noelia Luciana Lawler
Gerson Ismael Mejía Henríquez
Johanna Alexandra Martinez Vasquez
Aura Estela Mora Montero
Lizette Rosalía Dazza Hernández
Carlos Andres Linares Lesmes
Luis Miguel Rodríguez
Julian Camilo Cardona Escobar
Explicación en palabras cotidianas:
Tua aporte es realmente útil. Me gusta este nivel de síntesis que no reitera lo que ya dijo el profesor. Gracias
Gracias
✨ Resumen Visual de la Clase: Cadena de Pensamiento y Verificación en LLMs ✨
1. La Idea Central (El Core 💡): La cadena de pensamiento ayuda a los LLMs a razonar y verificar resultados al resolver problemas complejos.
2. Puntos Clave (En viñetas 📌):
3. El Ejemplo o Dato Crucial 🚀: Al calcular el precio de tres camisetas con descuento, se ilustraron diferentes métodos para llegar al mismo resultado de forma consistente.
4. Conexión o Siguiente Paso 🔗: Este conocimiento es fundamental para aplicar en contextos reales, donde la verificación y el razonamiento son esenciales para evitar errores en decisiones basadas en IA.
🎯Cómo obtener respuestas claras y confiables con LLMs
Técnicas: 🧩 Cadena de pensamiento + 🔁 Self Consistency
🧠 1. La cadena de pensamiento
Qué es:
Es el razonamiento paso a paso que sigue un modelo para llegar a una respuesta.
Cómo pedirla:
🗣️ Escribe → “Piensa paso a paso.”
Ejemplo: tres camisas de 25 $ con 20 % de descuento
1️⃣ 20 % de 25 = 5
2️⃣ 25 − 5 = 20
3️⃣ 3 × 20 = 60 $
🟩 Resultado: el modelo muestra su lógica, no solo el cálculo final.
⚡ 2. Modelos “rápidos” vs “pro”
🕒 Rápidos: responden velozmente, con razonamiento limitado.
🧭 Pro: disponen de más tiempo para pensar y razonar con mayor profundidad.
💡 Ambos razonan; lo que cambia es la profundidad del proceso.
🪄 3. Cómo activar el paso a paso
🟢 Escribe: “Piensa paso a paso.”
🔹 El modelo primero lista los pasos.
🔹 Luego da la respuesta final.
⚠️ Si no lo hace por sí solo, recuérdaselo en el prompt.
🔀 4. Varios caminos, un mismo resultado
🔁 5. Técnica: Self Consistency
Qué es:
Pide al modelo varios métodos para un mismo problema y compara los resultados.
Cómo aplicarla:
1️⃣ Solicita tres métodos diferentes.
2️⃣ Revisa los pasos de cada uno.
3️⃣ Quédate con el resultado más repetido o coherente.
Ventajas:
✔️ Detecta errores
✔️ Disminuye alucinaciones
✔️ Mejora la fiabilidad
Muchas gracias, quedó muy clara la síntesis.
de verdad es necesario leer algo que ya estamos viendo en pantalla? en realidad hace la clase monotona y aburrida, y el profesonar de por si tampoco ayuda mucho en esto. en verdad, si ya estamos viendo data en la pantalla, no es necesario leerlo textualmente, ya la estamos leyendo, ya entendimos.
Si el profesor solamente pegara el prompt, lo ejecutara, y se queda callado 20 segundos mientras leemos nosotros la respuesta, sería raro. La clase es dinámica, el profesor explica muy bien las cosas. No pienso que la haga monónona y aburrida.
Entiendo si a ti te molesta, para eso puedes poner la clase en 1.75, adelantarla con las flechitas, vas más rápido y pasas a la siguiente.
Le llaman aprendizaje auditivo, te invita a poner atencion en algun punto donde no estes viendo pero si escuchando y por cierto cubre la necesidad de debiles visuales.
Buen diagrama, lo generaste o cómo lo armaste?
Hola @Baltazar, utilizo Notion para hacer mis resúmenes.
Clase muy aterrizada para algo que muchos usan “a ojo”: cómo volver confiables las respuestas de un LLM. Me quedó clarísimo que pedir “piensa paso a paso” no es para adornar, sino para auditar el razonamiento, y que la magia real está en self consistency: obligar al modelo a proponer 2–3 caminos y quedarte con el resultado que converge. El ejemplo de las camisas es simple, pero demuestra el punto: cuando los métodos coinciden, sube la confianza; cuando divergen, ya sabes dónde meter lupa y cortar alucinaciones. Me llevo un hábito práctico para Copilot: paso a paso + tres métodos como estándar, especialmente en temas sensibles (normativa, finanzas, decisiones). Esto no es prompting bonito: es control de calidad.
Aquí entramos en el terreno de la Metacognición Artificial. No se trata de qué responde el modelo, sino de cómo llega a esa respuesta.
Nos revela dos técnicas hermanas:
¡Buena pregunta, Alejandro! Para estimar cuánto pagar por una aplicación de atención al usuario para un banco (app móvil/web, chat, PQRS, etc.) y cumpliendo la regulación, te propongo 3 métodos complementarios. Incluyo pasos, fórmulas y qué costos regulatorios suelen entrar. 1) Costeo “bottom‑up” (WBS + cost‑plus)
Idea: Desglosas el proyecto por componentes (funcionales, técnicos y de cumplimiento), calculas horas/costos directos y añades margen.
Pasos:
Fórmula tipo:
Plain Text
Precio = (Σ Costos directos dev + Σ Costos cumplimiento + Infraestructura + Licencias + Auditorías)
× (1 + Margen) + Contingencia
Mostrar más líneas
Checklist de costos de cumplimiento que suelen olvidarse:
2) Precio basado en valor (ROI + costo del riesgo de incumplimiento)
Idea: Pagas en función del valor económico que la app genera (ahorro, ventas, NPS) y del costo evitado por cumplir la regulación.
Pasos:
Fórmula tipo:
Plain Text
ROI anual = (Ahorros + Ingresos incrementales) – (Opex de la app)
Precio objetivo = α × ROI anual + β × Costo_riesgo_evitable
Mostrar más líneas
Donde Costo_riesgo_evitable incluye multas/penalidades potenciales evitadas por cumplir PCI DSS/ISO 27001, SAC, SARLAFT y Ley 1581/2300. [pcisecurit...ndards.org], [onac.org.co], [superfinan...era.gov.co], [superfinan...era.gov.co], [funcionpub...ica.gov.co], [wisecx.com]
3) Benchmark competitivo (comparables + “regulatory‑grade” features)
Idea: Te basas en precios de mercado de soluciones comparables (SaaS bancario, CRM financiero, plataformas de PQRS omnicanal) ajustando por requisitos regulatorios que elevan el costo (“regulatory‑grade”).
Pasos:
Ejemplo de ajuste cualitativo:
Mini‑ejemplo numérico (ilustrativo)
Supongamos app omnicanal para 100.000 clientes, PQRS/SAC, chat, notificaciones y sin procesamiento directo de tarjetas (no PCI DSS). Sí aplica Ley 1581, SAC, SARLAFT y Ley 2300.
Método 1 (bottom‑up):
Método 2 (valor):
Método 3 (benchmark):
Nota: Los valores son referenciales; el precio final depende del alcance real, si hay pagos (PCI DSS), y del nivel de certificación que el banco exija. [pcisecurit...ndards.org], [trendmicro.com]
Recomendaciones prácticas para cerrar precio
Pregunta:
Se debe revisar las diferentes estrategias de autenticacion que deben estar presentes para una aplicacion movil, UNICAMENTE dame la informacion asociada a este topico. Indicame 3 diferentes estrategias para que mi aplicacion movil sea compliance con todas las normas que se indican en los documentos para el uso de biometricos
Respuesta:
Basado en el análisis de la Ley de Instituciones de Crédito y las Disposiciones de carácter general (Anexo 63 y Artículos relacionados), aquí tienes la información exclusiva sobre estrategias de autenticación biométrica para que tu aplicación móvil cumpla con la normativa bancaria mexicana.
Marco Normativo para Biométricos (Factor de Autenticación Categoría 4)
Para que el uso de huella dactilar, reconocimiento facial o iris sea legalmente válido en tu app, debe cumplir estrictamente con la definición de Factor de Autenticación Categoría 4.
3 Estrategias de Implementación para Compliance Biométrico
Estas estrategias están diseñadas para cubrir los requisitos técnicos y legales más complejos del Artículo 310 y el Anexo 63.
1. Estrategia de "Tokenización Biométrica" (Cumplimiento de Un Solo Uso)
Objetivo: Cumplir con el requisito de que el dato biométrico se comporte como una "contraseña de un solo uso" y no sea reutilizable<sup>4</sup>.
2. Estrategia de Autenticación Escalonada (Step-Up Authentication)
Objetivo: Cumplir con el Artículo 313 que exige un segundo factor para operaciones monetarias y cambios de configuración, diferenciándolo del acceso básico<sup>5</sup>.
3. Estrategia de Validación de "Prueba de Vida" (Liveness Detection)
Objetivo: Cumplir con la exigencia de que la información "no pueda ser duplicada" <sup>8</sup> y mitigar el riesgo de suplantación mediante fotos o videos.
🙂 Metodo 3 = Regla de 3 😉
SI ES POSIBLE TAMBIEN
Mis notas 💚
Entonces al expresar en voz alta nuestros pensamientos, estamos haciendo una cadena de pensamiento ?
Pensar en voz alta estructura tu razonamiento.
¡Exactamente, Javier! Es la analogía perfecta. Al hablar, obligas a tu cerebro a conectar los puntos lógicamente, igual que cuando forzamos al LLM a usar Chain of Thought.
Ese proceso intermedio reduce errores porque no saltas a la conclusión de golpe. Sea escribiendo en Keep o hablando, desglosar el paso a paso válida la fiabilidad de la respuesta final.
¿Te ayuda hablar solo para resolver problemas?
No. Expresar en voz alta nuestros pensamientos sería el contexto de un prompt realmente. Recuerda que el CoT (Cadena de Pensamiento) es verbalizar el paso a paso para resolver un problema. Expresar tus pensamientos en voz alta no está resolviendo nada.
¿Cuándo debo pedir múltiples métodos de solución?
Debes aplicar esta técnica, conocida como Self-Consistency, siempre que te enfrentes a decisiones críticas, problemas lógicos complejos, análisis de datos o tareas donde un error tenga un alto costo. Piensa en esto como buscar una segunda o tercera opinión médica antes de someterte a una cirugía. Si le pides a la inteligencia artificial que resuelva un desafío financiero usando tres enfoques analíticos distintos y todos convergen en el mismo diagnóstico, tendrás una confianza casi absoluta en el resultado. Por el contrario, en tareas creativas simples como redactar un correo o generar ideas para un blog, pedir múltiples métodos matemáticos o lógicos sería un desperdicio de tiempo y recursos computacionales. Resérvalo para aquellos momentos donde necesites auditar la precisión del modelo y asegurarte de que no está inventando datos en el camino.
que significa engineer
ingeniero, para el curso creo que seria como "ingeniero de prompt"
Prompt: soy productora y tengo una marca de café en Colombia, necesito ajustar el precio para el presente año, precio paquete 500 gr 2025 esta en 38000 COP, necesito 3 métodos para ajustar el precio de la libra de mi café en el 2026
Respuesta Copilot combinando los 3 metodos que me dio:
Escenario combinado 2026 (inflación + costos, valor percibido y competencia):
Tomando el promedio de los tres métodos: (43,300+45,600+43,000)/3=43,967 COP
💻 Clase # 10 Cadena de pensamiento y verificación con múltiples métodos en LLMs
La cadena de pensamiento permite que el LLM resuelva problemas de forma estructurada, siguiendo un paso a paso que mejora la calidad y confiabilidad de la respuesta.
La chain of thought es el proceso interno mediante el cual el modelo descompone un problema en pasos lógicos para llegar a una solución. Este enfoque permite explorar distintos caminos de razonamiento para un mismo problema, aumentando la probabilidad de obtener un resultado correcto. A partir de esto surge la self-consistency, que consiste en pedirle al LLM que resuelva el mismo problema de varias formas distintas y luego comparar los resultados para verificar que convergen en la misma respuesta.
No se confía en una sola respuesta: la verificación ocurre cuando distintos razonamientos independientes llegan al mismo resultado, lo que incrementa la confianza en la solución final.
Esta técnica se usa para problemas complejos, decisiones críticas y validación de resultados, donde no basta con una respuesta rápida, sino que se necesita consistencia y razonamiento sólido.
Gracias por la info
La clase enseña cómo usar cadena de pensamiento y verificación múltiple para obtener respuestas más claras y fiables de un LLM.
Cadena de pensamiento
Verificación con múltiples métodos
Para hacer una previsión del tipo de cambio USD/COP al 31 de octubre de 2025 usando el comportamiento histórico entre enero y septiembre de 2025, es necesario adoptar supuestos (la tendencia sigue, volatilidad constante, etc.). A continuación te muestro 3 métodos posibles, con sus supuestos y un ejemplo numérico ilustrativo. (Toma los resultados como estimaciones con un margen de error importante).
Paso preliminar: datos y supuestos
Primero necesitamos un valor de referencia reciente. Según Trading Economics, el tipo de cambio USD/COP era aproximadamente 3,880.51 COP por USD al 1 de octubre de 2025. (Trading Economics) También los datos históricos muestran que en 2025 el tipo ha fluctuado bastante (promedios del orden de ~ 4,100 COP en varios informes). (Exchange Rates)
Para nuestros cálculos, asumiré que el tipo de cambio al final de septiembre de 2025 es aproximadamente COP 3,900/USD (una aproximación intermedia entre los distintos valores recientes). Esto será nuestro “punto de partida”.
Denotaré:
Método 1: Proyección lineal (tendencia histórica promedio mensual)
Idea: calcular la variación promedio mensual del tipo de cambio entre enero y septiembre 2025, y proyectar esa variación como constante para el mes de octubre.
Estimación rápida ilustrativa:
Bajo este modelo simple, se proyectaría un dólar en octubre ~ COP 3,864.
Método 2: Regresión lineal del tipo de cambio frente al tiempo
Idea: hacer una regresión del tipo de cambio mensual frente al tiempo (meses 1 a 9) y extrapolar al mes 10.
Este método permite que la tasa de cambio cambie de forma “suave” en el tiempo, no forzando variaciones porcentuales constantes.
Estimación ilustrativa (usando supuestos ficticios de los puntos):
Esto da una proyección similar: ~ COP 3,862.5.
Método 3: Modelo de crecimiento logarítmico (rendimientos promedio)
Idea: suponer que los cambios de tipo de cambio siguen un proceso multiplicativo (crecimiento/logaritmo). Calcular los rendimientos logarítmicos mensuales promedios y proyectar con ellos.
Este método captura mejor efectos proporcionales (porcentuales constantes) que los métodos lineales simples.
Estimación ilustrativa:
De nuevo se obtiene ~ COP 3,864 (coincidente con el método lineal simple, dado el escenario de caída gradual).
Comparación y estimaciones finales
MétodoProyección estimada para 31/10/2025Comentarios
Lineal promedio mensual
~ COP 3,864
Asume variación porcentual constante mes a mes
Regresión lineal
~ COP 3,862.5
Modelo de nivel lineal frente a tiempo
Modelo logarítmico / rendimientos
~ COP 3,864
Similar al lineal en este escenario
Observamos que, bajo los supuestos usados (descenso moderado del tipo de cambio entre enero y septiembre), los tres métodos dan estimaciones muy similares (alrededor de COP 3,860–3,865/USD).
Limitaciones y recomendaciones
Si quieres, puedo hacer una estimación más rigurosa (incorporando volatilidad, regressión multivariada con inflación, tasas de interés, etc.) y darte un intervalo de confianza para el dólar al 31 de octubre. ¿Te preparo eso?