Sesgo vs discriminación en modelos de IA

Clase 8 de 12 • Curso de Ética y Manejo de Datos para Inteligencia Artificial

Contenido del curso

Decisiones responsables con datos y LLMs

Privacidad, seguridad y propiedad de datos

Sesgos, calidad y confiabilidad de modelos

Gobernanza y cumplimiento aplicables al trabajo

Resumen

Comprender la diferencia entre sesgo y discriminación es el primer paso para construir sistemas de inteligencia artificial más justos. Un modelo puede funcionar perfectamente en promedio y, sin embargo, perjudicar de forma sistemática a grupos específicos de personas. Saber dónde se origina el problema y cómo medirlo marca la diferencia entre una herramienta útil y una que causa daño real.

¿Cuál es la diferencia entre sesgo y discriminación en inteligencia artificial?

El sesgo es un problema de origen, comparable a una balanza rota que siempre se inclina hacia un lado [0:01]. Un modelo de reconocimiento facial entrenado mayoritariamente con rostros de piel clara va a funcionar peor con rostros de piel oscura. Eso es un sesgo técnico.

La discriminación, en cambio, es lo que le sucede a una persona cuando ese sistema toma una decisión en el mundo real [0:15]. Si la policía usa ese modelo y detiene erróneamente a alguien inocente, el sesgo técnico se convirtió en discriminación concreta. Y esto no es hipotético: ya ha ocurrido.

¿Qué tipos de daños genera un sistema sesgado?

Existen tres categorías de impacto que vale la pena distinguir [0:30]:

Daño individual: alguien pierde un trabajo, un crédito o incluso su libertad por una decisión errónea.
Daño grupal: un modelo penaliza sistemáticamente a personas de cierto barrio y ese grupo nunca logra salir del ciclo.
Daño a la confianza: cuando las personas perciben que un sistema es injusto, dejan de usarlo y eso rompe todo el ecosistema.

Un dato clave: reducir sesgo en los datos de entrenamiento no garantiza eliminar discriminación en los resultados [0:55]. Un modelo balanceado puede igualmente perjudicar a los mismos grupos dependiendo de cómo se implemente.

¿Por dónde entra el sesgo en un modelo de IA?

Hay cuatro puertas de entrada claramente identificables [1:07].

Primera puerta: la definición del objetivo. Al crear un modelo, hay que definir qué se va a predecir, y esa variable casi siempre proviene de datos históricos. El problema es que esos datos reflejan decisiones humanas que pudieron haber sido injustas [1:15]. Es como entrenar a alguien nuevo mostrándole solo cómo trabajaban los anteriores: si tenían prejuicios, el modelo los aprende como si fueran correctos.

Segunda puerta: las etiquetas. Son las respuestas que se le dan al modelo durante el entrenamiento [1:32]. Si una persona decidió que un candidato "no está calificado", esa decisión puede estar cargada de sesgos. Esto genera los peligrosos ciclos de retroalimentación (feedback loops): el modelo predice más delitos en un barrio, se envían más patrullas, hay más arrestos y los datos confirman la predicción [1:45].

Tercera puerta: muestreo y datos faltantes [1:55]. Un dataset educativo puede descubrir que el 20 % de los estudiantes nunca fueron registrados. ¿Quiénes son? Justamente los más vulnerables. El modelo interpreta la ausencia de datos como ausencia de riesgo, y eso es gravísimo.

Cuarta puerta: errores de medición [2:15]. Si un sistema financiero usa historial bancario para evaluar riesgo, las personas que operan en economía informal parecen riesgosas, no porque lo sean, sino porque no tienen datos. El modelo penaliza la invisibilidad.

¿Qué son las variables proxy y cómo detectarlas?

Una variable proxy es una variable que no es sensible en apariencia, pero en la práctica representa algo sensible [2:35]:

Código postal puede ser proxy de nivel socioeconómico.
Tipo de escuela puede ser proxy de clase social.
Apellido puede ser proxy de origen étnico.

Para detectarlas se pueden usar herramientas como correlación estadística, test de impacto dispar, test de permutación, información mutua y valores SHAP [2:55]. La regla práctica es clara: si una variable aparentemente inocente tiene mucho peso y correlaciona con algo sensible, se tiene un proxy.

¿Cómo medir equidad y qué hacer en la práctica?

Supongamos un modelo de lead scoring que asigna puntajes de 0 a 100 [3:12]. En el grupo A, los leads altos convierten al 40 %. En el grupo B, convierten al 18 %. Mismo puntaje, distinto resultado. Es como un termómetro que funciona bien para adultos pero mal para niños.

Las métricas esenciales incluyen precisión por grupo, recall por grupo, paridad demográfica e igualdad de oportunidad [3:30]. Nunca hay que quedarse con el promedio general: ahí es exactamente donde se esconde el sesgo.

¿Cómo construir un plan de mitigación efectivo?

No se pueden optimizar todas las métricas de equidad al mismo tiempo; cada decisión tiene un costo [3:45]. Un buen plan tiene tres componentes:

Cambios en datos: corregir muestras, balancear representación.
Cambios en proceso: monitoreo continuo, alertas ante desvíos.
Riesgo residual documentado: qué puede seguir fallando, quién es responsable y qué pasa si ocurre [4:00].

La metáfora final lo resume con claridad: un sistema de IA es como un sistema de agua [4:10]. Si el agua sale contaminada, no se arregla el vaso. Hay que ir río arriba hasta encontrar dónde se contaminó y ahí poner el control.

El caso práctico de un modelo de scoring crediticio en México lo ilustra perfectamente [4:20]: personas de ciertos códigos postales reciben peores puntajes incluso con ingresos similares. ¿El código postal es una variable válida o funciona como proxy de nivel socioeconómico? ¿Lo eliminarías, lo reemplazarías o ajustarías cómo se entrena el modelo? Compartí tu análisis en los comentarios.

Comentarios

Santiago Pineda Botero

student•

1. Diagnóstico breve de la clase

Qué promete: Diferenciar sesgo de discriminación y ofrecer un marco de detección y mitigación.
Qué entrega realmente: Una introducción conceptual a los riesgos éticos en IA y una enumeración de técnicas estadísticas básicas para auditar modelos.
Para quién sirve: Desarrolladores o analistas de datos que inician en el ámbito de la ética algorítmica.
Principal límite: La ausencia de una metodología de implementación técnica (código o flujos de trabajo) para aplicar las métricas mencionadas.

2. Qué enseña realmente y qué solo aparenta enseñar

Enseña la lógica causal de cómo los sesgos se infiltran en los sistemas de IA (datos históricos, etiquetas, muestreo, medición). Aparenta enseñar cómo mitigar estos riesgos, pero se limita a listar conceptos (paridad demográfica, igualdad de oportunidad) sin explicar la implementación técnica necesaria para resolver el conflicto entre métricas de equidad.

3. Contenidos de la clase

Explícitos: Diferencia entre sesgo y discriminación, los tres tipos de daños (individual, grupal, confianza), las cuatro puertas de entrada del sesgo, variables proxy, y métricas de equidad (precisión/recall por grupo).
Inferenciales: La necesidad de un enfoque multidisciplinario (sociología + estadística) y la inevitabilidad del riesgo residual.
Ausentes: Implementación práctica de las métricas mencionadas, manejo de trade-offs entre métricas de equidad, y marcos legales o de gobernanza de datos.

4. Vacíos, omisiones y riesgos pedagógicos

Falla pedagógica: presenta el problema de los trade-offs entre métricas de equidad (ej. paridad demográfica vs. igualdad de oportunidad) pero no enseña cómo decidir cuál priorizar según el contexto. Existe un riesgo de sobre-simplificación al sugerir que eliminar una variable (como el código postal) es una solución, cuando el problema suele estar en la estructura de los datos.

5. Evaluación por nivel

Qué sí corresponde: Identificación de sesgos y comprensión de variables proxy.
Qué faltó y era exigible: Ejemplos de implementación de bias detection usando librerías estándar (ej. AIF360, Fairlearn) y un análisis de cómo balancear métricas contrapuestas.
Qué no sería razonable exigir: Un marco legal completo o soluciones matemáticas universales para la equidad algorítmica.

6. Aplicación real de lo aprendido

Aplicación: Auditoría de modelos de scoring crediticio, selección de personal (HR Tech) y sistemas de recomendación.
Contexto: Flujos de trabajo de MLOps donde se requiere un paso de "validación ética" antes del despliegue.
Limitaciones: La transferencia a casos reales es compleja porque las variables proxy suelen estar profundamente entrelazadas en el dataset; eliminar una variable suele reducir la precisión predictiva, lo cual choca con objetivos de negocio.

7. Qué más investigar y qué puede profundizarse más

Investigar: Fairness-aware machine learning, técnicas de de-biasing (pre-processing, in-processing, post-processing), y el concepto de "justicia algorítmica".
Profundizar: La paradoja de Simpson en la evaluación de modelos y el uso de técnicas de explicabilidad (SHAP/LIME) para detectar sesgos.
Conocimientos adicionales: Estadística avanzada y marcos de gobernanza de IA (como el EU AI Act).

8. Evidencia

Evidencia directa: Definiciones de sesgo/discriminación, las 4 puertas de entrada, y la lista de métricas de equidad.
Inferencias: La clase asume un entorno de trabajo donde el auditor tiene acceso total al dataset y a la capacidad de modificar el proceso de entrenamiento.
Límites del material: La clase es puramente teórica y no provee evidencia empírica de los resultados de las técnicas mencionadas.

9. Conclusión honesta

Principal fortaleza: Claridad conceptual al distinguir el origen técnico del sesgo y su impacto social.
Principal debilidad: Falta de profundidad técnica en la mitigación.
Mejora mínima indispensable: Incluir un caso de estudio con código donde se aplique una métrica de equidad y se demuestre el impacto en el rendimiento del modelo.

10. 5 preguntas avanzadas

Pregunta: ¿Por qué la optimización de la "paridad demográfica" puede reducir la precisión general del modelo? Respuesta: Al forzar resultados iguales entre grupos, se ignoran las diferencias reales en las distribuciones de los datos, lo que obliga al modelo a clasificar erróneamente casos para cumplir con la cuota. Elemento concreto: La mención de que "no podés optimizar todas las métricas de equidad al mismo tiempo". Por qué importa: Es el trade-off fundamental entre equidad y utilidad. Aplicación: Sistemas de crédito donde los grupos tienen perfiles de riesgo históricamente distintos. Ejemplo real: Algoritmos de aprobación de préstamos donde la paridad forzada aumenta la tasa de impago. Qué revela: Que la clase reconoce la tensión entre equidad y rendimiento. Aporte: Ayuda a entender que la equidad tiene un costo operativo.

Pregunta: ¿Cómo se diferencia una variable proxy de una variable causal en el sesgo de un modelo? Respuesta: Una variable causal influye directamente en el resultado (ej. historial de pagos), mientras que el proxy es una variable correlacionada con una característica sensible (ej. código postal con etnia). Elemento concreto: La explicación de "variables proxy" y el ejemplo del código postal. Por qué importa: Eliminar un proxy no elimina el sesgo si la variable causal subyacente sigue sesgada. Aplicación: Limpieza de datos en modelos de contratación. Ejemplo real: Eliminar el género del CV pero mantener el "tipo de universidad" (que correlaciona con género). Qué revela: La clase identifica el riesgo de la sustitución de variables. Aporte: Previene la falsa sensación de seguridad al eliminar variables sensibles.

Pregunta: ¿Por qué el "daño a la confianza" es el riesgo más difícil de mitigar una vez ocurrido? Respuesta: Porque la confianza es un activo intangible basado en la percepción de justicia; una vez que el usuario percibe discriminación, el sistema pierde legitimidad social independientemente de su precisión técnica. Elemento concreto: La clasificación de los tres tipos de daños. Por qué importa: Define el límite de la viabilidad comercial de un modelo. Aplicación: Productos de consumo masivo (apps de banca, redes sociales). Ejemplo real: El abandono masivo de plataformas de reconocimiento facial tras escándalos de sesgo racial. Qué revela: Que la clase entiende que el éxito de la IA no es solo técnico. Aporte: Enfatiza la importancia de la ética como pilar de negocio.

Pregunta: ¿Qué significa que "la ausencia de datos se interpreta como ausencia de riesgo"? Respuesta: Es un error de medición donde el modelo asume que si no hay registros de un grupo, ese grupo no requiere atención, ignorando que la falta de datos suele ser síntoma de exclusión sistémica. Elemento concreto: El ejemplo de Sofía y los estudiantes invisibles. Por qué importa: Es la forma más silenciosa y peligrosa de sesgo. Aplicación: Modelos de salud pública o distribución de recursos. Ejemplo real: Algoritmos de salud que subestiman enfermedades en poblaciones que no acceden a seguros médicos. Qué revela: La clase identifica sesgos de muestreo. Aporte: Alerta sobre la peligrosidad de los datos faltantes.

Pregunta: ¿Qué implica el "riesgo residual documentado" en un plan de mitigación? Respuesta: Aceptar que ningún modelo es perfecto y establecer protocolos de responsabilidad, monitoreo y respuesta ante fallos inevitables. Elemento concreto: La mención de que "ningún sistema queda perfecto". Por qué importa: Mueve el enfoque de la "perfección técnica" a la "gestión de riesgos". Aplicación: Despliegue de modelos críticos (IA en medicina, justicia). Ejemplo real: Auditorías de sistemas de IA que incluyen "human-in-the-loop" para revisar casos de alta incertidumbre. Qué revela: Que la clase promueve un enfoque de responsabilidad profesional. Aporte: Fomenta la transparencia y la rendición de cuentas.

11. 5 proyectos avanzados para practicar

Proyecto: Auditoría de Sesgo en Dataset Público. Objetivo: Identificar variables proxy en el dataset "Adult Income" de UCI. Base: Concepto de variables proxy. Adicional: Librería Fairlearn. Stack: Python, Pandas, Fairlearn. Dificultad: Media. Resultado: Informe de impacto dispar. Ayuda: Pasa de la teoría a la detección estadística.
Proyecto: Comparativa de Métricas de Equidad. Objetivo: Entrenar un modelo y comparar cómo cambia la precisión al aplicar paridad demográfica vs. igualdad de oportunidad. Base: Métricas de equidad. Adicional: Optimización multiobjetivo. Stack: Scikit-learn. Dificultad: Alta. Resultado: Gráfica de trade-offs. Ayuda: Visualiza el costo de la equidad.
Proyecto: Simulación de Ciclo de Retroalimentación. Objetivo: Crear un modelo de predicción de delitos que se auto-alimente de sus propias predicciones. Base: Ciclos de retroalimentación. Adicional: Simulación de agentes. Stack: Python. Dificultad: Alta. Resultado: Modelo que muestra el sesgo acumulado. Ayuda: Demuestra el peligro de los datos históricos.
Proyecto: Pipeline de Mitigación de Sesgo. Objetivo: Implementar un flujo de pre-procesamiento que elimine correlaciones entre variables sensibles y el objetivo. Base: Cambios en datos. Adicional: Técnicas de re-weighting. Stack: AIF360. Dificultad: Alta. Resultado: Modelo "de-biased". Ayuda: Aplica mitigación técnica.
Proyecto: Diseño de Protocolo de Riesgo Residual. Objetivo: Crear un documento de gobernanza para un modelo de lead scoring que incluya alertas y responsables. Base: Riesgo residual documentado. Adicional: Marcos de ética en IA (NIST/EU). Stack: Documentación técnica. Dificultad: Baja. Resultado: Manual de gobernanza. Ayuda: Conecta la técnica con la gestión real.

Javier Ramos

student•

Para recordar las puertas de entrada del sesgo en IA

Eleccion de variable a predecir
Asignacion de respuestas la modelo
Representatividad y registros ausentes
Forma que se capturan las metricas

ANGELA JASMIN PERDOMO SANABRIA

student•

¿Cómo detecto una variable proxy oculta?

Para identificar si un dato aparentemente inofensivo está actuando como un proxy (un puente hacia información sensible como raza o nivel socioeconómico), debes aplicar pruebas de correlación estadística o valores SHAP. Si notas que al eliminar una columna como el código postal o el tipo de dispositivo las predicciones del modelo cambian drásticamente para ciertos grupos demográficos, estás frente a un proxy. Otra técnica muy útil es el test de permutación: mezcla los valores de esa variable sospechosa y observa si el rendimiento del modelo cae. Si el impacto es alto y además coincide con divisiones sociales del mundo real, debes replantear si es ético o seguro mantener esa variable en tu dataset, ya que el modelo la usará para discriminar de forma encubierta.

ANGELA JASMIN PERDOMO SANABRIA

student•

¿Por qué es mejor evitar promedios generales?

Porque el promedio general es un espejismo matemático que oculta las injusticias locales. Imagina un termómetro que marca una temperatura promedio perfecta en una habitación donde la mitad está en llamas y la otra mitad congelada. En inteligencia artificial, un modelo puede tener un 95% de precisión global, pero si desglosas ese rendimiento, podrías descubrir que acierta el 99% de las veces en un grupo mayoritario y solo el 50% en una minoría. Para evitar este punto ciego, debes medir el rendimiento utilizando métricas segmentadas como la precisión por grupo, el recall por grupo o la paridad demográfica. Solo al dividir tus datos en subgrupos vulnerables podrás ver la verdadera cara de tu algoritmo y garantizar que el sistema funcione con la misma eficacia para todos los usuarios.

Juan Camilo Mejía Rodríguez

student•

La diferencia clave que me quedó clara: el sesgo es un problema técnico de origen (datos o diseño), mientras que la discriminación es el daño real que ese sesgo causa a personas concretas. El gráfico de tasa de error en reconocimiento facial lo ilustra perfectamente: un modelo puede "funcionar bien" en promedio y al mismo tiempo tener tasas de error muchísimo mayores en mujeres de piel oscura. Eso no es un accidente, es el resultado de datos no representativos. La métrica de rendimiento global oculta el problema.

Ana Lilian Zuniga de Santos

student•

ES UNA TENDENCIA O INCLINACION DEL MODELO QUE PROVIENE DE LOS DATOS CON LOS QUE FUE ENTRENADO O DE COMO FUE DISEÑADO.

martir leonardo argueta torres

student•

a lo mejor asi debe de ser

Sesgo vs discriminación en modelos de IA

Decisiones responsables con datos y LLMs

Cómo detectar daños invisibles en sistemas de IA

Mapa de riesgos en el ciclo de vida de datos con IA

Checklist de triaje antes de lanzar IA

Privacidad, seguridad y propiedad de datos

Cuándo una foto se vuelve dato biométrico

Reidentificación: seis patrones que debes conocer

Cinco rutas donde los LLMs filtran tus datos

Cómo proteger secretos comerciales al usar IA

Sesgos, calidad y confiabilidad de modelos

Sesgo vs discriminación en modelos de IA

Inyección de prompt en agentes de IA

Deepfakes perfectos: por qué falla el proceso

Gobernanza y cumplimiento aplicables al trabajo

Cinco principios de privacidad para decisiones de producto

Supuestos que rompen sistemas de IA sin tocar código