Cursos Empresas Blog Live Conf Precios

Cómo detectar daños invisibles en sistemas de IA

Clase 1 de 12 • Curso de Ética y Manejo de Datos para Inteligencia Artificial

Contenido del curso

Decisiones responsables con datos y LLMs

Privacidad, seguridad y propiedad de datos

Sesgos, calidad y confiabilidad de modelos

Gobernanza y cumplimiento aplicables al trabajo

Resumen

Alguien pide recetas bajas en azúcar a un chatbot. Sin saberlo, el sistema infiere una condición de salud, esa señal viaja por el ecosistema de datos y termina influyendo en el precio de un seguro. La persona nunca supo que compartió datos médicos, nunca apareció en ninguna lista de afectados y, sin embargo, fue perjudicada. Ese tipo de daño invisible es exactamente lo que se puede aprender a detectar con un marco de tres preguntas simples pero poderosas: ¿a quién afecta?, ¿qué daño puede ocurrir? y ¿quién responde? [0:08]

¿Quiénes son las personas afectadas por un sistema de IA?

Cada vez que un sistema toca datos o involucra un modelo de lenguaje grande (LLM), hay cinco capas de personas afectadas que deben identificarse [1:02]:

Usuarios directos: quienes interactúan con el sistema a propósito, como el empleado que abre un chatbot.
Usuarios finales: quienes reciben el impacto sin haber tocado nada, por ejemplo un paciente cuyo diagnóstico fue sugerido por una IA que nunca eligió.
Terceros: personas cuyos datos aparecen sin relación directa, como autores de textos usados para entrenar un modelo sin consentimiento.
Organizaciones: quienes despliegan el sistema; aunque no lo hayan construido, cargan con la responsabilidad.
La sociedad: un modelo que discrimina por código postal no genera un daño individual, genera un daño estructural.

Para aterrizar esto, cuatro preguntas son clave: quién provee los datos, quién recibe el resultado, quién podría ser dañado si el modelo se equivoca y —la más incómoda— quién no tiene voz en este proceso [1:50]. Suelen ser grupos marginados, personas con baja alfabetización digital y culturas subrepresentadas. El patrón se repite: son los más afectados y los menos visibles.

¿Qué tipos de daño puede provocar un sistema?

Dentro de los daños directos se encuentran la pérdida financiera por filtración, la violación de privacidad, el daño reputacional (como un deep fake) e incluso el daño físico [2:26]. Los daños indirectos son igual de graves: la gente deja de compartir información, la discriminación se acumula con el tiempo y la confianza en las instituciones se erosiona.

¿Quién es responsable cuando algo sale mal?

La analogía es clara: en un accidente de auto no se culpa al vehículo, sino al conductor, al fabricante o a la autoridad [2:50]. Con la IA funciona igual:

Quien recopiló los datos responde por sesgos.
Quien desplegó el modelo responde por su comportamiento.
Quien decidió usarla responde por el contexto.

La IA no es responsable. Las decisiones humanas, sí.

¿Cuáles son los tres riesgos que se esconden detrás de un fallo?

Muchos equipos dicen "falló el modelo", pero en realidad existen tres riesgos distintos [3:18]:

Riesgo de modelo: errores técnicos, como un reconocimiento facial que identifica mal. Se mejora con datos, entrenamiento y testing.
Riesgo de producto: decisiones de diseño incorrectas. Por ejemplo, escanear a toda persona en un espacio público. El modelo puede funcionar perfecto y el sistema seguir siendo injusto.
Riesgo de proceso: el más silencioso. Datos mal etiquetados, evaluación débil, despliegue sin control y monitoreo inexistente. Cada etapa débil multiplica el daño en la siguiente.

¿Cómo documentar riesgos de forma práctica y verificable?

Imagina que vas a lanzar un chatbot de recursos humanos. Necesitas redactar una nota de riesgos de aproximadamente una página, como una etiqueta de medicamento [4:06]. Debe incluir:

Nombre, versión y uso previsto.
Nivel de riesgo y datos utilizados, incluyendo si hay datos sensibles.
Riesgos identificados, población afectada y controles.
Riesgo residual, cumplimiento y un dueño con nombre y fecha.

Cada riesgo documentado necesita cuatro partes [4:30]: un riesgo claro y concreto (por ejemplo: "el chatbot podría mostrar el salario de un empleado en respuesta a otro"), el daño especificando quién se ve afectado y qué tan grave es, un dueño con nombre y apellido —no un equipo genérico— y un control medible. No sirve decir "revisamos el modelo y parece justo"; lo correcto es informar algo como: "paridad demográfica 0,97, T sobre 5.000 registros, auditado el 15 de abril" [5:10].

Un dato crítico sobre privacidad: muchos sistemas usan datos de chat para entrenamiento por defecto. Lo que el usuario escribe se captura, se almacena —a veces sin expiración— y puede filtrarse en respuestas [5:26]. Como regla simple: trata todo lo que entra a un chatbot como si fuera público.

Antes de avanzar con cualquier proyecto, tres preguntas deben tener respuesta afirmativa: ¿está claro qué puede salir mal y a quién afecta?, ¿hay un responsable con nombre y apellido?, ¿hay un control concreto? Si falta una, no se avanza [5:42].

Ahora te queda un ejercicio concreto: piensa en un chatbot interno para empleados que puede responder sobre salarios, evaluaciones de desempeño e historial laboral. Identifica al menos dos riesgos concretos, define a quién afectan y propone un control verificable. Comparte tu análisis o un caso real en los comentarios.

Obtén respuestas inmediatasProfundiza lo que acabas de ver

Comentarios

Rafael Mosquera

student•

Equipo Platzi, me gustría aprender a desarrollar este tipo de cursos.

Carlos Bustillo

¿Qué cursos debo hacer para aprender a realizar este formato de cursos?

EDUARDO ANTONIO ESTRADA CHACON

student•

¿Cómo evito daños invisibles en mi chatbot?

Para evitar que tu sistema genere consecuencias ocultas, debes mapear el ecosistema completo antes de escribir una sola línea de código. Imagina que tu chatbot es una piedra arrojada a un estanque; las ondas no solo mojan la piedra, sino que alteran toda el agua a su alrededor.

Debes evaluar cinco niveles de impacto: los usuarios directos que interactúan con la interfaz, los usuarios finales que reciben las consecuencias de las decisiones del sistema, los terceros cuyos datos alimentaron el modelo sin su permiso, la organización que asume el riesgo legal, y la sociedad que sufre los sesgos a gran escala.

La estrategia más efectiva es hacerte la pregunta incómoda: ¿Quién no tiene voz en este diseño? Generalmente, las minorías o personas con baja alfabetización digital son las primeras en sufrir daños indirectos, como la discriminación algorítmica. Al identificar a estos grupos vulnerables desde el inicio, puedes implementar filtros de privacidad y reglas de negocio que bloqueen inferencias peligrosas (como deducir el estado de salud a partir de una simple lista de compras).

Andrés Gómez Vásquez

student•

Fenómeno raro que pasa, el precio dinámico ,

creo el ejemplo va asi poner que te gusta algo o comprar algo muy relacionado, hace que los precios en oferta para ti sean relativamente mas elevados para ti (menos descuento) que para otra persona cuando se preguntan , o miran web de consultas de precios.

Carolina Ibarra

student•

Pasa o pasaba con los precios de Uber cuándo la batería de tu celular estaba por debajo del 20%, prácticas comerciales bastante cuestionables.

Etlin Ortega

student•

Un control clave, es que para entrar al chatbot debe entrar con las credenciales unicas del usuario, si es posible con credenciales biometricas. Se debe registrar desde que terminar se ha tenido acceso al chatbot y ese usuario, solo puede tener acceso a sus datos y registros, parciales y el contenido de dicho chatbot, no debe poder ser imprimible, ni permitir la copia de pantalla, todo solicitud de documentos, debe solicitarse por los canales convencionales.

Vilma Inés González Palacios

student•

¿Qué pasa si el modelo funciona perfecto?

Incluso si un modelo tiene una precisión técnica impecable, el sistema completo puede ser profundamente injusto o peligroso. Esto es lo que diferencia el riesgo de modelo del riesgo de producto.

Piensa en un sistema de reconocimiento facial de última generación que identifica rostros con un 99.9% de exactitud. Técnicamente, el modelo es perfecto. Sin embargo, si decides implementar ese sistema para escanear a todas las personas que caminan por una plaza pública sin su consentimiento, estás cometiendo un error de diseño de producto. Estás violando la privacidad a escala masiva, independientemente de lo bien que funcione la matemática detrás de la red neuronal.

El éxito técnico no garantiza el éxito ético. Por eso, las decisiones de diseño, el contexto en el que se despliega la herramienta y la forma en que los usuarios interactúan con ella son tan críticos como el entrenamiento del algoritmo. Un modelo perfecto usado en el contexto equivocado es, en la práctica, un sistema fallido que generará daños reputacionales y legales.

Ana Lilian Zuniga de Santos

student•

quiero aprender la inteligencia

Armando Aguilar

student•

Quiero aprender algo nuevo

HENRY ALEJANDRO OCHOA CAMACHO

student•

En mi organización un equipo técnico va a realizar el despliegue de un recomendor de servicios y un asistente de IA. Sin embargo, antes de desplegarlo, levante la mano porque el mapeo de riesgos e impacto no es detallado y claro. Entonces, dado que la IA generativa es más compleja de parametrizar, es importante que el despliege se haga bajo una estrategía de Gobierno de IA en la que la nota de riesgos es esencial. Este curso en mi caso es excelente

Santiago Pineda Botero

student•

1. Diagnóstico breve de la clase

Qué promete: Un marco práctico para identificar daños invisibles en sistemas de IA mediante un "lente ético" y una "nota de riesgos".
Qué entrega realmente: Una taxonomía básica de afectados y riesgos, junto con una plantilla administrativa para documentar responsabilidad.
Para quién sirve: Gestores de producto o equipos técnicos sin formación previa en ética de datos.
Principal límite: Confunde la gestión de riesgos operativos con la detección técnica de daños en el comportamiento de la IA.

2. Qué enseña realmente y qué solo aparenta enseñar

Enseña una metodología de gobernanza y documentación (quién es responsable, qué riesgos documentar). Aparenta enseñar a "detectar daños invisibles", pero omite técnicas de auditoría algorítmica, análisis de sesgos en embeddings o pruebas de robustez, limitándose a una gestión burocrática del riesgo.

3. Contenidos de la clase

Explícitos: Clasificación de 5 capas de afectados; distinción entre riesgo de modelo, producto y proceso; estructura de la "nota de riesgos".
Inferenciales: La IA es un sistema sociotécnico donde el error técnico es solo una fracción del daño total.
Ausentes: Métodos de auditoría técnica (análisis de outliers, adversarial testing, interpretabilidad de modelos, métricas de equidad en el entrenamiento).

4. Vacíos, omisiones y riesgos pedagógicos

Falla al no distinguir entre "riesgo percibido" y "daño técnico". Presenta la responsabilidad como un ejercicio de asignar nombres, ignorando que en sistemas complejos la responsabilidad suele estar diluida por diseño. Riesgo pedagógico: inducir a la falsa sensación de seguridad mediante la documentación (la "nota de riesgos") sin implementar controles técnicos reales.

5. Evaluación por nivel

Qué sí corresponde: Introducción a la taxonomía de riesgos y responsabilidad.
Qué faltó y era exigible: Métricas de evaluación de modelos (ej. False Positive Rate por subgrupo) y herramientas de monitoreo en producción.
Qué no sería razonable exigir: Implementación de técnicas avanzadas de Explainable AI (XAI) o auditorías de seguridad de ciberseguridad.

6. Aplicación real de lo aprendido

Contexto: Implementación de sistemas de IA en entornos corporativos (RRHH, seguros, finanzas).
Uso actual: Creación de AI Risk Registers para cumplimiento normativo (ej. EU AI Act).
Limitaciones: La metodología es estática; no detecta daños emergentes o "deriva de modelo" (model drift) en tiempo real.

7. Qué más investigar y qué puede profundizarse más

Investigar: Algorithmic Impact Assessments (AIA), marcos de trabajo como NIST AI RMF.
Profundizar: Métricas de equidad (Fairness metrics), técnicas de Red Teaming para LLMs.
Conocimientos adicionales: Estadística aplicada a sesgos, fundamentos de ciberseguridad en modelos de lenguaje.

8. Evidencia

Directa: Transcripción que detalla las 5 capas de afectados y la estructura de la nota de riesgos.
Inferencias: La clase asume que el riesgo es gestionable mediante procesos humanos, ignorando la opacidad técnica de los modelos.
Límites: El material es puramente conceptual y administrativo; carece de código o casos técnicos.

9. Conclusión honesta

Fortaleza: Claridad en la estructura de responsabilidad y el impacto sistémico.
Debilidad: Ausencia total de herramientas técnicas para la detección empírica de daños.
Mejora mínima: Incluir al menos una métrica técnica de evaluación de sesgo o un ejemplo de adversarial attack.

10. 5 preguntas avanzadas

Pregunta: ¿Cómo se valida el control de "paridad demográfica" si los datos de entrenamiento son inherentemente sesgados? Respuesta: Mediante técnicas de re-ponderación (re-weighting) o post-procesamiento de salidas. Elemento: Control medible y verificable. Importancia: Evita la discriminación sistémica. Aplicación: Auditoría de modelos de crédito. Ejemplo: Ajuste de umbrales de decisión para igualar tasas de aprobación. Rigor: Revela que la clase ignora la complejidad de los datos sesgados. Aporte: Introduce el concepto de mitigación técnica.
Pregunta: ¿Es suficiente la "nota de riesgos" para mitigar el riesgo de proceso en sistemas de aprendizaje continuo? Respuesta: No, requiere monitoreo automatizado de drift y re-entrenamiento supervisado. Elemento: Riesgo de proceso. Importancia: Los modelos cambian con el tiempo. Aplicación: Sistemas de recomendación. Ejemplo: Monitoreo de drift en e-commerce. Rigor: La clase sobreestima la documentación. Aporte: Diferencia entre riesgo estático y dinámico.
Pregunta: ¿Qué sucede cuando el "dueño" del riesgo no tiene capacidad técnica para auditar el modelo? Respuesta: Se genera un riesgo de gobernanza; se requiere una figura de AI Auditor independiente. Elemento: Dueño con nombre y apellido. Importancia: Evita la negligencia por ignorancia. Aplicación: Implementación de IA en sector público. Ejemplo: Auditoría externa de algoritmos de justicia. Rigor: Expone la debilidad de la estructura de responsabilidad. Aporte: Necesidad de roles interdisciplinarios.
Pregunta: ¿Cómo se aplica la "regla de tratar todo como público" en entornos de privacidad estricta (HIPAA/GDPR)? Respuesta: Mediante técnicas de anonimización, differential privacy o despliegue on-premise. Elemento: Datos de chat para entrenamiento. Importancia: Protección de datos sensibles. Aplicación: Salud digital. Ejemplo: Chatbots médicos en hospitales. Rigor: La clase es demasiado simplista. Aporte: Introducción a la privacidad técnica.
Pregunta: ¿Es el daño reputacional por deep fake mitigable solo con procesos humanos? Respuesta: No, requiere marcas de agua digitales (watermarking) y detección de procedencia. Elemento: Daño reputacional. Importancia: Integridad de la información. Aplicación: Medios de comunicación. Ejemplo: Verificación de contenido generado por IA. Rigor: La clase ignora soluciones tecnológicas. Aporte: Necesidad de herramientas de autenticación.

11. 5 proyectos avanzados

Auditoría de Sesgo en LLM: Analizar sesgos de género en un modelo de lenguaje usando Counterfactual Fairness.
Dashboard de Monitoreo de Riesgo: Crear un sistema que detecte drift de datos en un flujo de producción.
Simulación de Red Teaming: Intentar forzar a un chatbot a revelar datos privados mediante prompt injection.
Automatización de Nota de Riesgos: Desarrollar un script que genere automáticamente el reporte de riesgos a partir de un archivo de configuración.
Análisis de Impacto Algorítmico: Realizar un estudio de impacto sobre un sistema de IA real (ej. un algoritmo de filtrado de CVs) usando métricas de equidad.

FIDGERAL RODOLFO SILVA HUERTAS

student•

Hola Mi Nombre es: FIDGERAL RODOLFO SILVA, me dedico a Vender Productos Digitales. Soy Ingeniero de Sistemas y tengo 47 años PLATZI, soy COLOMBIANO, y vivo en la Ciudad de Bogotá.

El Video me motiva para aprender más acerca de la IA, el tema es tan chévere, Espero volverme experto , aplicar transversalmente a todo académica, profesional y aplicar lo aprendido.

El Caso yo propondia, entrenar al Modelo hasta Lanzarlo a los Sistemas de Producción para saber como inter-actua el modelo y si ahi una situacion de Riesgo.

Omar Santa Cruz

student•

Quien redacta este documento ? Negocio ? Riesgo ? IA Gob ?

Mishell Zuñiga

student•

Debes redactar esta nota antes de comenzar a construir o integrar cualquier modelo, nunca como un parche de último minuto. Piensa en esta nota como la etiqueta de advertencia de un medicamento: los científicos no inventan la pastilla, la venden y luego investigan qué efectos secundarios causó. Todo eso se define en la fase de laboratorio.

En el desarrollo de software con LLMs, esta nota de una página actúa como tu contrato de viabilidad. Si durante la planificación no puedes definir claramente un riesgo concreto, identificar a la población afectada, nombrar a un responsable directo y establecer un control verificable, el proyecto debe detenerse.

Hacerlo al principio evita el riesgo de proceso, que es cuando los errores pequeños (como datos mal etiquetados o falta de monitoreo) se acumulan como una bola de nieve. Si esperas a tener el chatbot listo para pensar en la ética, los costos de reingeniería serán altísimos y es muy probable que los datos sensibles ya se hayan filtrado en los pesos del modelo.

Paola Garcia

student•

El sesgo algorítmico ocurre cuando un sistema toma decisiones injustas porque sus datos de entrenamiento o su diseño reflejan prejuicios humanos, amplificándolos a escala. No es que la máquina "sea mala", es que aprendió patrones del pasado que quizás ya no queremos repetir.

Si el sistema aprende de datos históricos donde solo hombres fueron contratados para puestos directivos, ¿cómo crees que clasificaría a una mujer altamente capacitada hoy?

Paola Garcia

student•

Hola, Paola. Los riesgos suelen esconderse donde el diseño parece "eficiente" pero ignora el contexto humano.

Piensa en un sistema de IA que prioriza automáticamente candidatos para una entrevista basándose en su historial laboral: ¿qué sucede si el algoritmo penaliza a quienes tuvieron brechas por cuidado familiar, perpetuando una brecha de género sin que nadie lo note? ¿Cómo medirías si ese criterio es justo o discriminatorio?