Contenido del curso

Fundamentos prácticos de la IA generativa

Estructurando instrucciones claras y efectivas

Manejo de contexto extenso y datos

Tecnicas de razonamiento para tareas complejas

Aplicaciones y automatización profesional

Chain of thought y self-consistency en LLMs

Resumen

Resolver un problema de matemáticas básico puede parecer trivial, pero la forma en que verbalizas cada paso revela algo poderoso sobre cómo funcionan los modelos de lenguaje. Entender la cadena de pensamiento y la autoconsistencia te da herramientas concretas para obtener mejores respuestas y detectar errores cuando trabajas con cualquier LLM.

¿Qué es la cadena de pensamiento en un LLM?

Imagina que alguien te pregunta cuánto cuestan tres camisetas de $25 con un 20 % de descuento. Tu mente ejecuta pasos: calculas el descuento, lo restas al precio y multiplicas por la cantidad. Cuando expresas con palabras ese proceso, estás verbalizando tu cadena de pensamiento [0:12].

Esto mismo aplica a los modelos de lenguaje. El concepto de chain of thought [1:02] consiste en que el LLM no solo entregue un resultado final, sino que muestre el paso a paso que siguió para llegar a él. Hace algunos años era necesario incluir la instrucción explícita "piensa paso a paso" en el prompt para activar este comportamiento [1:15]. Hoy en día, prácticamente todos los modelos razonan de forma nativa; la diferencia entre un modelo rápido y uno más sofisticado radica en cuánto tiempo dedican a razonar antes de responder [1:35].

¿Cómo se ve en la práctica?

Al enviar el prompt "¿cuánto pagarías por tres camisas de $25 cada una con un 20 % de descuento?" en Microsoft Copilot, el modelo puede responder directamente $60 o desglosar su proceso [2:19]:

Multiplica el precio unitario por la cantidad: $25 × 3 = $75.
Calcula el 20 % de descuento sobre $75: $15.
Resta el descuento al total: $75 − $15 = $60.

Este camino es distinto al que podrías seguir tú —calcular primero el descuento por unidad y luego multiplicar— pero ambos llegan al mismo resultado. Esa transparencia es lo valioso: puedes verificar cada paso en lugar de confiar ciegamente en la respuesta.

¿Qué es self-consistency y por qué reduce alucinaciones?

La técnica de self-consistency [1:55] lleva la cadena de pensamiento un paso más allá. En lugar de pedir una sola ruta de solución, le solicitas al modelo múltiples métodos para resolver el mismo problema y luego comparas los resultados.

¿Cómo aplicar self-consistency con un prompt simple?

Basta con agregar una instrucción al final del prompt: "Dame tres métodos para calcular esto" [3:08]. El modelo responde con tres cadenas de pensamiento independientes:

Método 1: descuento sobre el precio total. $25 × 3 = $75, descuento de $15, total $60.
Método 2: precio unitario con descuento. $25 − $5 = $20, luego $20 × 3 = $60.
Método 3: multiplicación por el porcentaje restante. 100 % − 20 % = 80 % → $75 × 0.8 = $60 [3:30].

Cuando los tres métodos convergen en el mismo número, la confianza en la respuesta aumenta considerablemente. Si uno de ellos arrojara un resultado diferente, tendrías una señal clara para investigar dónde ocurrió el error [4:10]. También podrías optar por quedarte con la respuesta más frecuente entre todos los caminos.

¿Cómo aplicar estas técnicas más allá de las matemáticas?

Aunque el ejemplo usa una operación aritmética, estas estrategias funcionan en cualquier dominio. Pedir que el modelo explique su razonamiento y que ofrezca varias rutas de solución es especialmente útil en contextos donde las alucinaciones representan un riesgo real, como preguntas legales, normativas o técnicas [4:30].

Dos acciones concretas que puedes incorporar desde ahora:

Solicita siempre que el modelo verbalice su proceso antes de dar una respuesta final.
Pide múltiples métodos y compara resultados para validar la coherencia.

Prueba aplicar self-consistency con un tema que te interese —por ejemplo, una consulta sobre regulación bancaria— y comparte en los comentarios los distintos métodos que obtuvo el modelo y si todos llegaron al mismo resultado.

Comentarios

Robert Naranjo

student•

Explicación en palabras cotidianas:

Cadena de Pensamiento (CoT): Es como cuando en la escuela el profesor de matemáticas te decía: "No me pongas solo el resultado, quiero ver cómo llegaste a él". Al forzar a la IA a "pensar paso a paso", la obligas a seguir un camino lógico y evitas que "alucine" o se salte pasos cruciales.
Verificación Múltiple (Self-Consistency): Es el siguiente nivel. Si el CoT es pedirle a un alumno que muestre su trabajo, la Verificación Múltiple es como pedirles a tres alumnos diferentes que resuelvan el mismo problema de tres maneras distintas. Si los tres llegan a la misma respuesta (aunque usen métodos diferentes), tu confianza en ese resultado se dispara.

Patricia Inés Castro

student•

Tua aporte es realmente útil. Me gusta este nivel de síntesis que no reitera lo que ya dijo el profesor. Gracias

Robert Naranjo

student•

Gracias

Mateo Montoya Henao

student•

✨ Resumen Visual de la Clase: Cadena de Pensamiento y Verificación en LLMs ✨

1. La Idea Central (El Core 💡): La cadena de pensamiento ayuda a los LLMs a razonar y verificar resultados al resolver problemas complejos.

2. Puntos Clave (En viñetas 📌):

Cadena de Pensamiento: Proceso que verbaliza los pasos para llegar a una solución.
Self Consistency: Técnica que permite a los LLMs generar múltiples métodos para asegurar la robustez de los resultados.
Ejemplo de Calcular Descuentos: Se mostró cómo aplicar cadenas de pensamiento para resolver un problema de descuentos.
Métodos Múltiples: Pedir distintos enfoques para validar respuestas y detectar errores.
Razonamiento de LLMs: Diferencia entre modelos rápidos y modelos pro en cómo manejan el tiempo para razonar.

3. El Ejemplo o Dato Crucial 🚀: Al calcular el precio de tres camisetas con descuento, se ilustraron diferentes métodos para llegar al mismo resultado de forma consistente.

4. Conexión o Siguiente Paso 🔗: Este conocimiento es fundamental para aplicar en contextos reales, donde la verificación y el razonamiento son esenciales para evitar errores en decisiones basadas en IA.

Gabriel Obregón

student•

🎯Cómo obtener respuestas claras y confiables con LLMs

Técnicas: 🧩 Cadena de pensamiento + 🔁 Self Consistency

🧠 1. La cadena de pensamiento

Qué es:

Es el razonamiento paso a paso que sigue un modelo para llegar a una respuesta.

Cómo pedirla:

🗣️ Escribe → “Piensa paso a paso.”

Ejemplo: tres camisas de 25 $ con 20 % de descuento

1️⃣ 20 % de 25 = 5

2️⃣ 25 − 5 = 20

3️⃣ 3 × 20 = 60 $

🟩 Resultado: el modelo muestra su lógica, no solo el cálculo final.

⚡ 2. Modelos “rápidos” vs “pro”

🕒 Rápidos: responden velozmente, con razonamiento limitado.

🧭 Pro: disponen de más tiempo para pensar y razonar con mayor profundidad.

💡 Ambos razonan; lo que cambia es la profundidad del proceso.

🪄 3. Cómo activar el paso a paso

🟢 Escribe: “Piensa paso a paso.”

🔹 El modelo primero lista los pasos.

🔹 Luego da la respuesta final.

⚠️ Si no lo hace por sí solo, recuérdaselo en el prompt.

🔀 4. Varios caminos, un mismo resultado

Un problema puede resolverse de distintas formas.
Esto sirve para verificar la coherencia:
- 🟩 Si los métodos coinciden → mayor confianza.
- 🟥 Si difieren → revisa el razonamiento.

🔁 5. Técnica: Self Consistency

Qué es:

Pide al modelo varios métodos para un mismo problema y compara los resultados.

Cómo aplicarla:

1️⃣ Solicita tres métodos diferentes.

2️⃣ Revisa los pasos de cada uno.

3️⃣ Quédate con el resultado más repetido o coherente.

Ventajas:

✔️ Detecta errores

✔️ Disminuye alucinaciones

✔️ Mejora la fiabilidad

Alfonso Galeano Conde

student•

Muchas gracias, quedó muy clara la síntesis.

jeychdan palacios

student•

de verdad es necesario leer algo que ya estamos viendo en pantalla? en realidad hace la clase monotona y aburrida, y el profesonar de por si tampoco ayuda mucho en esto. en verdad, si ya estamos viendo data en la pantalla, no es necesario leerlo textualmente, ya la estamos leyendo, ya entendimos.

Kevin Fiorentino

student•

Si el profesor solamente pegara el prompt, lo ejecutara, y se queda callado 20 segundos mientras leemos nosotros la respuesta, sería raro. La clase es dinámica, el profesor explica muy bien las cosas. No pienso que la haga monónona y aburrida.

Entiendo si a ti te molesta, para eso puedes poner la clase en 1.75, adelantarla con las flechitas, vas más rápido y pasas a la siguiente.

JC OlSol

student•

Le llaman aprendizaje auditivo, te invita a poner atencion en algun punto donde no estes viendo pero si escuchando y por cierto cubre la necesidad de debiles visuales.

Héctor Alonso Padilla Ramírez

student•

Baltazar Andersson

student•

Buen diagrama, lo generaste o cómo lo armaste?

Héctor Alonso Padilla Ramírez

student•

Hola @Baltazar, utilizo Notion para hacer mis resúmenes.

Juan Camilo Mejía Rodríguez

student•

Clase muy aterrizada para algo que muchos usan “a ojo”: cómo volver confiables las respuestas de un LLM. Me quedó clarísimo que pedir “piensa paso a paso” no es para adornar, sino para auditar el razonamiento, y que la magia real está en self consistency: obligar al modelo a proponer 2–3 caminos y quedarte con el resultado que converge. El ejemplo de las camisas es simple, pero demuestra el punto: cuando los métodos coinciden, sube la confianza; cuando divergen, ya sabes dónde meter lupa y cortar alucinaciones. Me llevo un hábito práctico para Copilot: paso a paso + tres métodos como estándar, especialmente en temas sensibles (normativa, finanzas, decisiones). Esto no es prompting bonito: es control de calidad.

Edgar Villatoro Pérez

student•

Yuliana Mallorga

student•

Juan Miguel Jimenez

student•

Aquí entramos en el terreno de la Metacognición Artificial. No se trata de qué responde el modelo, sino de cómo llega a esa respuesta.

Nos revela dos técnicas hermanas:

Chain of Thought (CoT): Obligar al modelo a "mostrar su trabajo" (como en un examen de matemáticas).
Self-Consistency: Pedirle "3 opiniones diferentes" a la misma persona y ver en qué coinciden (democracia interna).

Woldev S.A.S

student•

¡Buena pregunta, Alejandro! Para estimar cuánto pagar por una aplicación de atención al usuario para un banco (app móvil/web, chat, PQRS, etc.) y cumpliendo la regulación, te propongo 3 métodos complementarios. Incluyo pasos, fórmulas y qué costos regulatorios suelen entrar. 1) Costeo “bottom‑up” (WBS + cost‑plus)

Idea: Desglosas el proyecto por componentes (funcionales, técnicos y de cumplimiento), calculas horas/costos directos y añades margen.

Pasos:

Alcance funcional: registro/login, perfil, productos, PQRS, chat/voz, notificaciones, agendamiento, etc.
Arquitectura y seguridad: backend, APIs, nube, cifrado, monitoreo, DR/BCP.
Cumplimiento/regulación (Colombia):
- Protección de datos personales (Ley 1581 de 2012): políticas, consentimiento, derechos del titular, gestión de incidentes. [funcionpub...ica.gov.co], [suin-juriscol.gov.co]
- Consumidor financiero y SAC: tiempos y mecanismos de respuesta, defensores y canales PQR, lineamientos SFC (Ley 1328/2010 y Circulares SFC). [superfinan...era.gov.co], [previsora.gov.co]
- SARLAFT (AML/CFT): debida diligencia, monitoreo, reportes UIAF, listas, PEP, gobierno del riesgo según Circular Básica Jurídica SFC. [superfinan...era.gov.co], [superfinan...era.gov.co]
- Ley 2300 de 2023 (“Dejen de fregar”): límites de contacto, horarios y frecuencia en cobros y comunicaciones. [wisecx.com]
- Estándares técnicos relevantes (según alcance):
  - PCI DSS (si hay datos de tarjetas): 12 requisitos, versión 4.0. [pcisecurit...ndards.org], [trendmicro.com]
  - ISO/IEC 27001:2022 (SGSI) y adopción local/planes de transición. [onac.org.co], [contaduria.gov.co]
Estimación de horas/costos por cada ítem de la WBS (UX, dev, QA, DevSecOps, legal/compliance, infraestructura, licencias, auditorías).
Margen (10–30%) y contingencia de cumplimiento (5–15%).

Fórmula tipo:

Plain Text

Precio = (Σ Costos directos dev + Σ Costos cumplimiento + Infraestructura + Licencias + Auditorías)

× (1 + Margen) + Contingencia

Mostrar más líneas

Checklist de costos de cumplimiento que suelen olvidarse:

Redacción/ajuste de políticas y avisos (Ley 1581). [funcionpub...ica.gov.co]
Módulo PQRS/SAC (radicación, trazabilidad, plazos). [superfinan...era.gov.co]
Controles SARLAFT (onboarding, listas restrictivas, ROS a UIAF). [superfinan...era.gov.co]
Horarios/opt‑in comunicaciones (Ley 2300). [wisecx.com]
Pruebas de seguridad y auditoría (PCI DSS/ISO 27001). [pcisecurit...ndards.org], [onac.org.co]

2) Precio basado en valor (ROI + costo del riesgo de incumplimiento)

Idea: Pagas en función del valor económico que la app genera (ahorro, ventas, NPS) y del costo evitado por cumplir la regulación.

Pasos:

Cuantifica beneficios anuales:
- Ahorro por desviar llamadas a canales digitales (p.ej., costo/contacto).
- Reducción de tiempos de PQRS (menos sanciones reputacionales).
- Upsell/cross‑sell en canales digitales.
Cuantifica riesgos y costos evitados:
- Sanciones por incumplimiento de PCI DSS (si aplica pagos); PCI DSS es obligatorio para quien procesa/almacena/transmite datos de tarjetas. [trendmicro.com], [stripe.com]
- Requerimientos SARLAFT (expectativas del supervisor SFC). [superfinan...era.gov.co]
- Protección de datos (Ley 1581): obligaciones de responsable/encargado, gestión de incidentes. [funcionpub...ica.gov.co]
- Atención al consumidor financiero/SAC (plazos, conciliación). [superfinan...era.gov.co]
- Ley 2300: límites de contacto (evitas multas y quejas). [wisecx.com]
Diseña pricing vinculado al valor:
- Fee fijo + variable por usuario activo/consulta/PQRS resuelta.
- Bonus/malus por cumplir KPIs (SLA de respuesta, NPS, tasa de resolución).
Decide el techo de precio como porcentaje del Valor neto anual (p.ej., 20–35% del ROI esperado + prima por compliance).

Fórmula tipo:

Plain Text

ROI anual = (Ahorros + Ingresos incrementales) – (Opex de la app)

Precio objetivo = α × ROI anual + β × Costo_riesgo_evitable

Mostrar más líneas

Donde Costo_riesgo_evitable incluye multas/penalidades potenciales evitadas por cumplir PCI DSS/ISO 27001, SAC, SARLAFT y Ley 1581/2300. [pcisecurit...ndards.org], [onac.org.co], [superfinan...era.gov.co], [superfinan...era.gov.co], [funcionpub...ica.gov.co], [wisecx.com]

3) Benchmark competitivo (comparables + “regulatory‑grade” features)

Idea: Te basas en precios de mercado de soluciones comparables (SaaS bancario, CRM financiero, plataformas de PQRS omnicanal) ajustando por requisitos regulatorios que elevan el costo (“regulatory‑grade”).

Pasos:

Identifica comparables: suites de atención bancaria, CRM financiero con PQRS/SAC, plataformas de monitoreo SARLAFT, módulos de notificaciones “opt‑in” (Ley 2300).
Clasifica por nivel de cumplimiento:
- Nivel A: ISO 27001 certificado y controles PCI DSS si procesan pagos. [onac.org.co], [pcisecurit...ndards.org]
- Nivel B: cumplimiento operativo de SAC y flujos PQRS/SFC. [superfinan...era.gov.co]
- Nivel C: comunicación alineada a Ley 2300 (horarios/frecuencia). [wisecx.com]
Ajusta el precio por “gap”: si un comparable no incluye SARLAFT o SGSI 27001, añade la prima estimada (auditorías, controles, gobierno).
Define rango: mensual (SaaS) o T&M (proyecto) y TCO a 3–5 años.

Ejemplo de ajuste cualitativo:

SaaS “A” (sin SGSI certificado) cuesta X; añadir SGSI ISO 27001 y auditoría anual eleva Opex/Capex (plan de transición ISO 27001:2022 y organismos de certificación/ONAC). [onac.org.co]
Si el flujo incluye pagos, exige PCI DSS v4.0 → más pruebas, escaneos y evidencias. [pcisecurit...ndards.org]

Mini‑ejemplo numérico (ilustrativo)

Supongamos app omnicanal para 100.000 clientes, PQRS/SAC, chat, notificaciones y sin procesamiento directo de tarjetas (no PCI DSS). Sí aplica Ley 1581, SAC, SARLAFT y Ley 2300.

Método 1 (bottom‑up):

Dev/UX/QA: USD 180.000
DevSecOps/monitoreo: USD 40.000
Cumplimiento (políticas Ley 1581, módulo PQRS/SAC, flujos SARLAFT, horarios Ley 2300): USD 65.000 [funcionpub...ica.gov.co], [superfinan...era.gov.co], [superfinan...era.gov.co], [wisecx.com]
Infra/licencias/auditorías iniciales ISO 27001 (si decides SGSI): USD 35.000 [onac.org.co]
Subtotal: USD 320.000
Margen 20% + contingencia 10% → Precio ≈ USD 422.400

Método 2 (valor):

Ahorros por desviar 50.000 contactos/año a digital (p.ej. USD 1,5/contacto): USD 75.000
Menos Opex anual: USD 25.000 → ROI anual ≈ USD 50.000
Costo de riesgo evitable (multas/quejas, reputación por no cumplir SAC/Ley 2300/Ley 1581): estimado USD 30.000 [superfinan...era.gov.co], [wisecx.com], [funcionpub...ica.gov.co]
Precio objetivo = 0,3×50.000 + 0,5×30.000 ≈ USD 45.000 (mantenimiento anual).

Método 3 (benchmark):

SaaS comparable con SAC y PQRS (sin ISO 27001 certificado): USD 7–12k/mes.
Prima por SGSI ISO 27001 y auditorías: +USD 2–5k/mes. [onac.org.co]
Rango mensual: USD 9–17k (TCO 3 años: USD 324k–612k).

Nota: Los valores son referenciales; el precio final depende del alcance real, si hay pagos (PCI DSS), y del nivel de certificación que el banco exija. [pcisecurit...ndards.org], [trendmicro.com]

Recomendaciones prácticas para cerrar precio

Incluye en el contrato: SLA de PQRS/SAC, límites de contacto (Ley 2300), políticas Ley 1581, y anexos de SGSI/ISO 27001 (o plan de adopción). [superfinan...era.gov.co], [wisecx.com], [funcionpub...ica.gov.co], [onac.org.co]
Matriz de cumplimiento enlazada a épicas/tickets (trazabilidad regulatoria).
Auditorías periódicas (internas y externas) y pruebas de seguridad (si hay pagos, PCI DSS). [pcisecurit...ndards.org]
Gobierno SARLAFT: roles, ROS/ausencia ROS, UIAF, listas, PEP. [superfinan...era.gov.co]

Laura Daniela Acosta Contreras

student•

Pregunta:

Se debe revisar las diferentes estrategias de autenticacion que deben estar presentes para una aplicacion movil, UNICAMENTE dame la informacion asociada a este topico. Indicame 3 diferentes estrategias para que mi aplicacion movil sea compliance con todas las normas que se indican en los documentos para el uso de biometricos

Respuesta:

Basado en el análisis de la Ley de Instituciones de Crédito y las Disposiciones de carácter general (Anexo 63 y Artículos relacionados), aquí tienes la información exclusiva sobre estrategias de autenticación biométrica para que tu aplicación móvil cumpla con la normativa bancaria mexicana.

Marco Normativo para Biométricos (Factor de Autenticación Categoría 4)

Para que el uso de huella dactilar, reconocimiento facial o iris sea legalmente válido en tu app, debe cumplir estrictamente con la definición de Factor de Autenticación Categoría 4.

Definición: Información derivada de características físicas del usuario (huellas, geometría de mano, iris, retina)1.
Requisito Crítico de No Duplicidad: No basta con que el teléfono reconozca al usuario. La normativa exige que la información obtenida por los dispositivos biométricos tenga elementos que aseguren que dicha información constituya contraseñas de un solo uso (OTP) y que en ningún caso puedan utilizarse nuevamente o duplicarse2.
Uso Permitido: Los biométricos están autorizados como Segundo Factor de Autenticación para validar operaciones sensibles (transferencias, alta de cuentas, etc.) en Banca Móvil, sustituyendo a los Tokens físicos o tablas de claves333.

3 Estrategias de Implementación para Compliance Biométrico

Estas estrategias están diseñadas para cubrir los requisitos técnicos y legales más complejos del Artículo 310 y el Anexo 63.

1. Estrategia de "Tokenización Biométrica" (Cumplimiento de Un Solo Uso)

Objetivo: Cumplir con el requisito de que el dato biométrico se comporte como una "contraseña de un solo uso" y no sea reutilizable4.

Descripción: En lugar de enviar la imagen de la huella o el rostro al servidor (lo cual violaría la norma de seguridad y duplicidad), la app debe utilizar el hardware de seguridad del dispositivo (Secure Enclave/Keystore) para generar una firma criptográfica única cada vez que el usuario se autentica.
Implementación:
1. El usuario pone su huella/rostro.
2. Esto desbloquea una llave privada almacenada en el dispositivo.
3. La app genera un código único (hash) firmado con esa llave para esa transacción específica.
4. El banco valida la firma, no la huella. Esto garantiza que la "información" enviada (el código firmado) no se puede duplicar ni reusar para otra transacción.

2. Estrategia de Autenticación Escalonada (Step-Up Authentication)

Objetivo: Cumplir con el Artículo 313 que exige un segundo factor para operaciones monetarias y cambios de configuración, diferenciándolo del acceso básico5.

Descripción: Utilizar factores de conocimiento (Categoría 2 - Contraseña/NIP) para el acceso (Login) y reservar el biométrico (Categoría 4) exclusivamente para la firma de transacciones.
Implementación:
- Login (Inicio de Sesión): Solicitar NIP de 6 dígitos (Factor Categoría 2 obligatorio para Banca Móvil)6.
- Firma de Transacción: Cuando el usuario intente transferir dinero o dar de alta una cuenta, solicitar el biométrico. Esto cumple con la exigencia de usar un factor adicional al de inicio de sesión para operaciones sensibles7.

3. Estrategia de Validación de "Prueba de Vida" (Liveness Detection)

Objetivo: Cumplir con la exigencia de que la información "no pueda ser duplicada" 8 y mitigar el riesgo de suplantación mediante fotos o videos.

Descripción: Implementar algoritmos que verifiquen que el biométrico proviene de una persona viva en tiempo real y no de una reproducción estática.
Implementación:
- Al usar reconocimiento facial, la app debe solicitar un gesto aleatorio (parpadear, girar cabeza) o analizar la profundidad 3D del rostro.
- Esto asegura que la característica física presentada es genuina en el momento de la operación, cumpliendo con el espíritu de seguridad robusta que la normativa exige para los factores de Categoría 4.

Leyder Sanchez

student•

🙂 Metodo 3 = Regla de 3 😉

Henry Norberto Arias Salgado

student•

SI ES POSIBLE TAMBIEN

Charles Castillo Rosas

student•

Mis notas 💚

Javier Ramos

student•

Entonces al expresar en voz alta nuestros pensamientos, estamos haciendo una cadena de pensamiento ?

Jefrey Roman Perez

student•

Pensar en voz alta estructura tu razonamiento.

¡Exactamente, Javier! Es la analogía perfecta. Al hablar, obligas a tu cerebro a conectar los puntos lógicamente, igual que cuando forzamos al LLM a usar Chain of Thought.

Ese proceso intermedio reduce errores porque no saltas a la conclusión de golpe. Sea escribiendo en Keep o hablando, desglosar el paso a paso válida la fiabilidad de la respuesta final.

¿Te ayuda hablar solo para resolver problemas?

Cesar David Ramírez Dimaté

student•

No. Expresar en voz alta nuestros pensamientos sería el contexto de un prompt realmente. Recuerda que el CoT (Cadena de Pensamiento) es verbalizar el paso a paso para resolver un problema. Expresar tus pensamientos en voz alta no está resolviendo nada.

Noelia Luciana Lawler

student•

¿Cuándo debo pedir múltiples métodos de solución?

Debes aplicar esta técnica, conocida como Self-Consistency, siempre que te enfrentes a decisiones críticas, problemas lógicos complejos, análisis de datos o tareas donde un error tenga un alto costo. Piensa en esto como buscar una segunda o tercera opinión médica antes de someterte a una cirugía. Si le pides a la inteligencia artificial que resuelva un desafío financiero usando tres enfoques analíticos distintos y todos convergen en el mismo diagnóstico, tendrás una confianza casi absoluta en el resultado. Por el contrario, en tareas creativas simples como redactar un correo o generar ideas para un blog, pedir múltiples métodos matemáticos o lógicos sería un desperdicio de tiempo y recursos computacionales. Resérvalo para aquellos momentos donde necesites auditar la precisión del modelo y asegurarte de que no está inventando datos en el camino.

Gerson Ismael Mejía Henríquez

student•

que significa engineer

Johanna Alexandra Martinez Vasquez

student•

ingeniero, para el curso creo que seria como "ingeniero de prompt"

Aura Estela Mora Montero

student•

Prompt: soy productora y tengo una marca de café en Colombia, necesito ajustar el precio para el presente año, precio paquete 500 gr 2025 esta en 38000 COP, necesito 3 métodos para ajustar el precio de la libra de mi café en el 2026

Respuesta Copilot combinando los 3 metodos que me dio:

Escenario combinado 2026 (inflación + costos, valor percibido y competencia):

Tomando el promedio de los tres métodos: (43,300+45,600+43,000)/3=43,967 COP

Precio recomendado: 44,000 COP por paquete de 500 gr.

Lizette Rosalía Dazza Hernández

student•

💻 Clase # 10 Cadena de pensamiento y verificación con múltiples métodos en LLMs

La cadena de pensamiento permite que el LLM resuelva problemas de forma estructurada, siguiendo un paso a paso que mejora la calidad y confiabilidad de la respuesta.

La chain of thought es el proceso interno mediante el cual el modelo descompone un problema en pasos lógicos para llegar a una solución. Este enfoque permite explorar distintos caminos de razonamiento para un mismo problema, aumentando la probabilidad de obtener un resultado correcto. A partir de esto surge la self-consistency, que consiste en pedirle al LLM que resuelva el mismo problema de varias formas distintas y luego comparar los resultados para verificar que convergen en la misma respuesta.

No se confía en una sola respuesta: la verificación ocurre cuando distintos razonamientos independientes llegan al mismo resultado, lo que incrementa la confianza en la solución final.

Esta técnica se usa para problemas complejos, decisiones críticas y validación de resultados, donde no basta con una respuesta rápida, sino que se necesita consistencia y razonamiento sólido.

Carlos Andres Linares Lesmes

student•

Gracias por la info

Luis Miguel Rodríguez

student•

La clase enseña cómo usar cadena de pensamiento y verificación múltiple para obtener respuestas más claras y fiables de un LLM.

Cadena de pensamiento

Consiste en pedirle al modelo que razone paso a paso en lugar de solo dar la respuesta final.
Esto ayuda a detectar errores lógicos y entender cómo llegó a la conclusión.platzi

Verificación con múltiples métodos

Se usan varias ejecuciones o enfoques (por ejemplo, diferentes prompts) para resolver el mismo problema y comparar resultados.
La técnica apunta a quedarte con la respuesta más consistente entre varias, reduciendo errores y alucinaciones.

Julian Camilo Cardona Escobar

student•

Para hacer una previsión del tipo de cambio USD/COP al 31 de octubre de 2025 usando el comportamiento histórico entre enero y septiembre de 2025, es necesario adoptar supuestos (la tendencia sigue, volatilidad constante, etc.). A continuación te muestro 3 métodos posibles, con sus supuestos y un ejemplo numérico ilustrativo. (Toma los resultados como estimaciones con un margen de error importante).

Paso preliminar: datos y supuestos

Primero necesitamos un valor de referencia reciente. Según Trading Economics, el tipo de cambio USD/COP era aproximadamente 3,880.51 COP por USD al 1 de octubre de 2025. (Trading Economics) También los datos históricos muestran que en 2025 el tipo ha fluctuado bastante (promedios del orden de ~ 4,100 COP en varios informes). (Exchange Rates)

Para nuestros cálculos, asumiré que el tipo de cambio al final de septiembre de 2025 es aproximadamente COP 3,900/USD (una aproximación intermedia entre los distintos valores recientes). Esto será nuestro “punto de partida”.

Denotaré:

( S_0 = 3{,}900 ) COP/USD como tipo base al 30/sep/2025 (aproximado)
Queremos proyectar ( S_{t} ) al 31/10/2025 (un mes hacia adelante)
Supondremos que la tasa de cambio evoluciona bajo alguno de los modelos que presento.

Método 1: Proyección lineal (tendencia histórica promedio mensual)

Idea: calcular la variación promedio mensual del tipo de cambio entre enero y septiembre 2025, y proyectar esa variación como constante para el mes de octubre.

Recolectar los tipos de cambio al cierre de cada mes (enero, febrero, …, septiembre).
Calcular la tasa de crecimiento mensual promedio: [ g = \frac{1}{N-1} \sum_{i=2}^N \frac{S_i - S_{i-1}}{S_{i-1}} ] donde (N=9) meses (ene–sep).
Aplicar esa tasa promedio al mes siguiente: [ \hat S_{\text{oct}} = S_{\text{sep}} \times (1 + g) ]

Estimación rápida ilustrativa:

Supongamos (hipotético) que entre enero y septiembre el tipo pasó de 4,200 COP a 3,900 COP, lo que representa una caída total de (-300) sobre 4,200, es decir −7.14 % en 8 meses.
Entonces la tasa promedio mensual sería aproximadamente ( g \approx -7.14% / 8 = -0.892% ) mes a mes.
Aplicando eso: [ \hat S_{\text{oct}} = 3{,}900 \times (1 - 0.00892) = 3{,}900 \times 0.99108 \approx 3{,}864 ;\text{COP/USD} ]

Bajo este modelo simple, se proyectaría un dólar en octubre ~ COP 3,864.

Método 2: Regresión lineal del tipo de cambio frente al tiempo

Idea: hacer una regresión del tipo de cambio mensual frente al tiempo (meses 1 a 9) y extrapolar al mes 10.

Definir el eje de tiempo: por ejemplo, mes 1 = enero 2025, mes 9 = septiembre 2025.
Tomar los valores ( (t, S_t) ) para t = 1, …, 9.
Ajustar una línea: ( S_t = a + b\cdot t + \varepsilon_t ).
Obtener estimadores ( \hat a, \hat b ).
Evaluar ( \hat S_{t=10} = \hat a + \hat b \cdot 10 ).

Este método permite que la tasa de cambio cambie de forma “suave” en el tiempo, no forzando variaciones porcentuales constantes.

Estimación ilustrativa (usando supuestos ficticios de los puntos):

Supongamos que en enero el tipo fue ~4,200 COP, y en septiembre ~3,900 COP, distribuidos linealmente.
Entonces la pendiente ( b \approx \frac{3,900 - 4,200}{9 - 1} = \frac{-300}{8} = -37.5 ) COP por mes.
Y la intersección ( a = S_1 - b \cdot 1 = 4,200 - (-37.5) = 4,237.5 ).
Entonces para t = 10: [ \hat S_{10} = 4,237.5 + (-37.5)\cdot 10 = 4,237.5 - 375 = 3,862.5 ]

Esto da una proyección similar: ~ COP 3,862.5.

Método 3: Modelo de crecimiento logarítmico (rendimientos promedio)

Idea: suponer que los cambios de tipo de cambio siguen un proceso multiplicativo (crecimiento/logaritmo). Calcular los rendimientos logarítmicos mensuales promedios y proyectar con ellos.

Calcular los rendimientos logarítmicos mensuales: [ r_i = \ln\bigl(S_i / S_{i-1}\bigr), \quad i = 2,\dots,9 ]
Calcular el promedio ( \bar r = \frac{1}{8} \sum_{i=2}^{9} r_i ).
Proyectar: [ \hat S_{10} = S_9 \times \exp(\bar r) ]

Este método captura mejor efectos proporcionales (porcentuales constantes) que los métodos lineales simples.

Estimación ilustrativa:

Si de 4,200 a 3,900 en 8 meses, el rendimiento total es ( \ln(3,900/4,200) = \ln(0.92857) \approx -0.0738 ).
El rendimiento promedio mensual sería ( \bar r \approx -0.0738 / 8 = -0.009225 ).
Entonces [ \hat S_{10} = 3,900 \times \exp(-0.009225) \approx 3{,}900 \times 0.99082 \approx 3{,}864 ]

De nuevo se obtiene ~ COP 3,864 (coincidente con el método lineal simple, dado el escenario de caída gradual).

Comparación y estimaciones finales

MétodoProyección estimada para 31/10/2025Comentarios

Lineal promedio mensual

~ COP 3,864

Asume variación porcentual constante mes a mes

Regresión lineal

~ COP 3,862.5

Modelo de nivel lineal frente a tiempo

Modelo logarítmico / rendimientos

~ COP 3,864

Similar al lineal en este escenario

Observamos que, bajo los supuestos usados (descenso moderado del tipo de cambio entre enero y septiembre), los tres métodos dan estimaciones muy similares (alrededor de COP 3,860–3,865/USD).

Limitaciones y recomendaciones

Estas proyecciones dependen fuertemente de los supuestos (tendencia estable, sin choques externos, volatilidad similar).
El mercado cambiario está sujeto a factores macroeconómicos, ajustes de política monetaria, eventos externos, etc.
No se tomó en cuenta la volatilidad mensual (desviaciones), ni intervalos de confianza.

Si quieres, puedo hacer una estimación más rigurosa (incorporando volatilidad, regressión multivariada con inflación, tasas de interés, etc.) y darte un intervalo de confianza para el dólar al 31 de octubre. ¿Te preparo eso?

Fundamentos prácticos de la IA generativa

Estructura de prompts que eliminan respuestas genéricas

Cómo crear el prompt perfecto con ChatGPT

Qué son los embeddings en los LLMs

Rol en prompts: cómo mejorar respuestas de IA

Estructurando instrucciones claras y efectivas

ChatGPT vs Claude vs Gemini cuál elegir

Zero-shot vs few-shot en prompts

Etiquetas XML para estructurar prompts

Manejo de contexto extenso y datos

Ventana de contexto y tokens en LLMs

Grounding para evitar que la IA invente leyes