Checklist de triaje antes de lanzar IA

Clase 3 de 12 • Curso de Ética y Manejo de Datos para Inteligencia Artificial

Contenido del curso

Decisiones responsables con datos y LLMs

Privacidad, seguridad y propiedad de datos

Sesgos, calidad y confiabilidad de modelos

Gobernanza y cumplimiento aplicables al trabajo

Resumen

Antes de poner en producción cualquier sistema con inteligencia artificial, existe una pregunta que pocos equipos se hacen a tiempo: ¿qué datos salen de nuestro sistema? No después del lanzamiento, sino antes. Construir un checklist de triaje permite tomar decisiones claras y documentadas sobre si un caso avanza, necesita ajustes o debe detenerse por completo. Este proceso funciona como la inspección previa al vuelo de un piloto: no se salta, aunque haya prisa, y se ejecuta al inicio del proyecto.

Para llegar a este punto se necesitan dos bases previas: un lente ético que identifique a quién afecta el sistema, qué daño puede ocurrir y quién responde; y un flujo completo de datos con sus diez pasos del ciclo de vida, cuatro zonas de frontera y tres puntos de riesgo con dueño y evidencia [0:40]. La pregunta clave ahora es si esos controles son verificables o solo intenciones escritas.

¿Cuáles son las seis preguntas del checklist de triaje?

El checklist se compone de seis preguntas, y cada una dispara una acción concreta que obliga al equipo a documentar con precisión.

¿Hay datos personales en juego?

Se deben revisar tres puntos del flujo de datos [1:18]. En la entrada, verificar si el texto que llega al modelo contiene nombres, correos, documentos, datos de salud o financieros. En el contexto, evaluar si el sistema mezcla documentos privados con públicos. En la salida, determinar si la respuesta podría exponer datos que el usuario no pidió. Un ejemplo claro: alguien escribe "tengo diabetes y vivo en Buenos Aires", combinando datos de salud y ubicación en una sola oración.

¿Hay datos sensibles o terceros involucrados?

Sensible no es lo mismo que personal [1:55]. Un dato es sensible cuando su exposición puede causar daño real: información médica, financiera, biométrica, ubicación o datos que revelen etnia o género, incluso de forma indirecta. La regla práctica es directa: si puede identificar o discriminar, es sensible.

Respecto a terceros [2:20], siempre se necesita saber:

Qué datos salen del sistema.
Quién los recibe.
Si actúa como procesador o controlador.
En qué país opera.

Si una empresa en Latinoamérica envía datos a un modelo en otro país, las leyes locales siguen aplicando. Y lo que se envía puede no quedarse solamente ahí.

¿Qué se guarda en logs y cuál es el impacto si algo falla?

Los logs funcionan como una cámara de banco [2:52]: graban, pero con reglas claras. Un log abierto a cualquiera no es seguridad, es un riesgo. Un log modificable no sirve para auditoría. Y guardar logs indefinidamente crea responsabilidad sin necesidad. Se debe definir quién accede y por cuánto tiempo.

Sobre el impacto [3:18], no es lo mismo un chatbot recomendando productos que un modelo decidiendo quién obtiene un crédito. No todos los errores tienen el mismo costo. Y si la decisión afecta derechos, salud o trabajo, un humano debe poder intervenir. No es opcional.

¿Cómo funciona el semáforo de decisión?

Las respuestas a las seis preguntas alimentan un sistema de semáforo con tres niveles [3:42]:

Rojo: detener. Casos prohibidos o con daño serio.
Amarillo: mitigar. Hay problemas, pero se pueden corregir.
Verde: aprobar. Todo cumple, pero se documenta igualmente.

Un ejemplo ilustrativo: un banco quiere aprobar préstamos con IA [3:56]. No está prohibido, pero perfila a personas (alto riesgo), presenta sesgo y carece de revisión humana. Resultado: amarillo, mitigar antes de lanzar.

¿Qué pasa cuando un resumen de IA se convierte en registro oficial?

Una empresa decide usar un LLM para resumir tickets de soporte y convertir ese resumen en el registro oficial de la compañía [4:18]. Los tickets contienen nombres, correos, datos de tarjetas. Cuando el resumen se vuelve oficial, una simple alucinación de la IA se transforma en un error legal. El ticket original dice "mi pedido llegó tarde", pero el resumen genera "el cliente solicitó un reembolso". Eso es un registro corrupto [4:55].

Las mitigaciones concretas son:

Filtrar información personal antes de que salga del sistema: en vez de "Juan Pérez, DNI 12345", el modelo recibe "Usuario A, ID redactado" [5:15]. Esto se prueba con casos diseñados para romper el sistema.
Revisión humana obligatoria: un agente compara ticket original versus resumen, aprueba con nombre y fecha, y se miden las tasas de correcciones [5:33]. Si son altas, el modelo no está listo.

Cada mitigación registra riesgo, acción, métrica, resultado, responsable y fecha. Como verificación final, se debe poder responder con precisión: qué datos salen del sistema y qué datos se quedan [5:52].

El modelo mental más útil es tratar cada ticket como un documento legal y al modelo como un empleado junior: necesita supervisión, control sobre las copias y capacidad de corregir errores.

Ahora es tu turno. Camila, de Chile, trabaja en una startup que quiere usar IA para analizar conversaciones de soporte y detectar clientes en riesgo de cancelación [6:18]. El sistema procesará mensajes de clientes, historial de uso y patrones de comportamiento. ¿Hay datos personales o sensibles? ¿Hay terceros involucrados? ¿Sería rojo, amarillo o verde? Dejá tu análisis en los comentarios.

Comentarios

Kimberly Aracely Rauda de Aragon

student•

seria riesgo moderado ya que la no es la IA ella decide el sistema toma decisiones automatizada sobre el perfil del comportamiento riesgo de cancelación

Marlon Melara

student•

Por acá mi análisis:

- ¿Hay datos personales o sensibles?

R/ Sí, hay datos personales que al relacionarlos con otros datos sencibles, si el cliente los revela en la conversación de soporte. Esto puede comprometer la privacidad del usuario y puede ser objeto de discriminación, sentirse acosado si comienza a recibir marketing dirigido o de cualquier otro tipo de amenaza.

¿Hay terceros involucrados?

R/ Sí la startup usa servicios externos y los datos salen de su control físico y de no existir un contrato de privacidad pueden ser un problema.

¿Sería rojo, amarillo o verde?

R/ Sería amarillo por un posible manejo de datos sensibles sin protección. Tiene que especificarse claramente una politica de privacidad y manejo de datos actualizando los terminos de uso para que el cliente se entere que sus datos pueden ser usados para analisis y mejora de servicio (no debería de usarse para otro propósito). Un humano debe de validar los riesgos de usar la IA en este proceso.

Santiago Pineda Botero

student•

Diagnóstico breve de la clase

Promete: Un checklist de triaje para validar proyectos de IA antes de su lanzamiento.
Entrega: Un marco de seis preguntas de control y un sistema de semaforización para gestionar riesgos.
Sirve para: Equipos técnicos y de producto que integran modelos de IA y necesitan mitigar riesgos legales y de seguridad.
Principal límite: La falta de profundidad técnica en los mecanismos de anonimización y la ausencia de marcos legales específicos.

Qué enseña realmente y qué solo aparenta enseñar

Enseña: La lógica de evaluación de riesgos (datos, terceros, logs, impacto, revisión humana) y la necesidad de documentar decisiones.
Aparenta enseñar: Un proceso de auditoría técnica robusto, cuando en realidad ofrece una guía de gestión de riesgos de alto nivel.

Contenidos de la clase

Explícitos: Seis preguntas de triaje, semaforización (rojo/amarillo/verde), ejemplo de tickets de soporte, importancia de la revisión humana.
Inferenciales: La necesidad de una cultura de cumplimiento (compliance) y la idea de que la IA es un "empleado junior" que requiere supervisión.
Ausentes: Métodos técnicos de anonimización (PII masking), gestión de contratos con proveedores (DPA), arquitectura de logs segura, métricas de sesgo.

Vacíos, omisiones y riesgos pedagógicos

Falla pedagógica: Advierte sobre el riesgo de que el proveedor use datos para entrenamiento, pero no enseña cómo verificar las cláusulas de privacidad o configurar el "opt-out" en APIs.
Omisión: No aborda la diferencia entre modelos on-premise y modelos vía API en términos de soberanía de datos.

Evaluación por nivel

Corresponde: Nivel básico/intermedio para gestión de proyectos.
Faltó (exigible): Criterios técnicos para evaluar la robustez del modelo (tasas de alucinación, drift) y conceptos básicos de ciberseguridad aplicados a prompts.
No razonable: Exigir una guía legal exhaustiva o implementación de código de anonimización.

Aplicación real de lo aprendido

Aplicación: Evaluación de viabilidad en proyectos de IA corporativa.
Contextos: Implementación de chatbots internos, automatización de atención al cliente, análisis de documentos legales.
Limitaciones: El checklist es estático; no cubre la monitorización continua (post-lanzamiento) ni la degradación del modelo en producción.

Qué más investigar y qué puede profundizarse más

Investigar: GDPR/leyes locales de protección de datos, técnicas de RAG (Retrieval-Augmented Generation) con privacidad, Red Teaming para modelos de lenguaje.
Profundizar: Arquitectura de sistemas "Privacy-by-design".

Evidencia

Directa: Transcripción con las 6 preguntas y el caso de Camila.
Inferencial: La clase asume un entorno de desarrollo con acceso a APIs de terceros.
Límites: El material es una guía de gestión, no un manual técnico.

Conclusión honesta

Fortaleza: Claridad en la estructura de decisión (semáforo).
Debilidad: Superficialidad en la ejecución técnica de las mitigaciones.
Mejora: Incluir una matriz de riesgos técnica más detallada.

5 preguntas avanzadas

Pregunta: ¿Cómo afecta la política de retención de datos del proveedor (ej. OpenAI) a la pregunta sobre logs?
Respuesta: Si el proveedor retiene datos, el log interno es insuficiente; se debe auditar el contrato del proveedor.
Elemento: Cuarta pregunta (logs).
Importancia: Define la responsabilidad legal.
Aplicación: Auditoría de proveedores.
Ejemplo: Uso de API de GPT-4.
Rigor: Revela que el control interno es insuficiente sin control externo.
Aporte: Conecta gestión interna con contractual.
Pregunta: ¿Qué diferencia la anonimización de la seudonimización en el triaje?
Respuesta: La anonimización es irreversible; la seudonimización permite reidentificar. El triaje debe exigir anonimización para datos sensibles.
Elemento: Primera y segunda pregunta.
Importancia: Define el nivel de riesgo residual.
Aplicación: Diseño de pipelines de datos.
Ejemplo: Enmascaramiento de nombres en tickets.
Rigor: Distingue entre seguridad superficial y real.
Aporte: Precisión terminológica.
Pregunta: ¿Por qué la revisión humana es obligatoria en decisiones de alto impacto?
Respuesta: Porque los modelos son probabilísticos, no determinísticos; no garantizan precisión legal.
Elemento: Sexta pregunta.
Importancia: Mitiga el riesgo de alucinación.
Aplicación: Flujos de trabajo de aprobación.
Ejemplo: Aprobación de créditos.
Rigor: Reconoce la limitación técnica de la IA.
Aporte: Establece el límite de la automatización.
Pregunta: ¿Cómo se audita un modelo que cambia por actualizaciones del proveedor?
Respuesta: Mediante pruebas de regresión constantes y monitoreo de salidas.
Elemento: Ejemplo de tickets de soporte.
Importancia: Evita la "deriva" del modelo.
Aplicación: Mantenimiento de software.
Ejemplo: Cambio de versión de modelo (GPT-4o a o1).
Rigor: Entiende la naturaleza dinámica de la IA.
Aporte: Enfoque de ciclo de vida.
Pregunta: ¿Es suficiente el triaje inicial para cumplir con regulaciones como la AI Act de la UE?
Respuesta: No, requiere evaluación de impacto continua y documentación técnica detallada.
Elemento: Todo el checklist.
Importancia: El triaje es solo el inicio.
Aplicación: Cumplimiento normativo.
Ejemplo: Lanzamiento de producto en Europa.
Rigor: Sitúa la clase como un primer paso, no como una solución total.
Aporte: Visión de cumplimiento escalable.

5 proyectos avanzados

Proyecto 1: "PII Scrubber Automático". Crear un script que detecte y enmascare datos personales antes de enviar a una API. Base: Pregunta 1. Dificultad: Media.
Proyecto 2: "Matriz de Riesgo Dinámica". Dashboard que mapee los 6 puntos de triaje a niveles de riesgo cuantificables. Base: Semaforización. Dificultad: Media.
Proyecto 3: "Framework de Auditoría de Logs". Sistema para centralizar y anonimizar logs de interacciones con IA. Base: Pregunta 4. Dificultad: Alta.
Proyecto 4: "Simulador de Red Teaming". Diseñar prompts para intentar extraer datos sensibles del modelo. Base: Pregunta 2. Dificultad: Alta.
Proyecto 5: "Protocolo de Intervención Humana". Definir un flujo de trabajo (Human-in-the-loop) para validación de resúmenes. Base: Pregunta 6. Dificultad: Baja.

Omar Santa Cruz

student•

Hace tiempo trabajé en la mejora de un agente de gestión de préstamos. Hoy me doy cuenta de que las herramientas de tracking y observabilidad, en este caso LangSmith, permitían visualizar información sensible de los usuarios dentro de las trazas del sistema, como nombres, datos de cuentas, ubicación, montos de préstamos y pagos futuros, lo que podía representar riesgos éticos y de privacidad en el manejo de datos.

Johanna Moreno

student•

Muy buen checklist, genial que puedan desarrollar todo un curso de clasificación del riesgos según AI ACT.

Fernanda Gutierrez

student•

sería amarillo, la información puede contener datos sensibles de los clientes, y es importante hacer validaciones a los resultados de la búsqueda de información que hizo la IA

FIDGERAL RODOLFO SILVA HUERTAS

student•

Hola toda la Información estaría en ROJO ES INFORMACIÓN SENSIBLE PARA LA EMPRESA

FIDGERAL RODOLFO SILVA HUERTAS

student•

"Gracias a todos por este debate increíble. Si queremos seguir aprendiendo, APRENDER IA ES FÁCIL"

El Video me motiva para aprender más acerca de la IA, el tema es tan chévere, Espero volverme experto , aplicar transversalmente a todo académica, profesional y aplicar lo aprendido.

Para el caso en Mención, estaria obligado a que el sistema tenga vulnerabilidad de riesgos e información encriptada para que unicamente los usuarios puedan ver esa información como las claves en los Bancos.

JORGE ALBERTO SIGUACHI ESCOBAR

student••

ami me gusto mucho este video

JORGE ALBERTO SIGUACHI ESCOBAR

student••

excelente clases El checklist de triaje

Juan Camilo Mejía Rodríguez

student•

Excelente clase! El checklist de triaje me parece una herramienta fundamental antes de desplegar cualquier sistema de IA. Me quedo especialmente con la pregunta sobre la revisión humana: no todos los errores tienen el mismo costo, y eso lo cambia todo a la hora de decidir cuánta supervisión necesita el sistema. También es clave la distinción entre bajo y alto riesgo según el AI Act: un chatbot de soporte y un sistema de perfilado para hipotecas no pueden tratarse igual éticamente. Gracias por estructurarlo de forma tan práctica!

Checklist de triaje antes de lanzar IA

Decisiones responsables con datos y LLMs

Cómo detectar daños invisibles en sistemas de IA

Mapa de riesgos en el ciclo de vida de datos con IA