Cursos Empresas Blog Live Conf Precios

Qué son los datos personales en IA

Clase 1 de 20 • Curso de Ética y Manejo de Datos para Data Science e Inteligencia Artificial

Contenido del curso

Privacidad y ética de los datos

Retos éticos en la actualidad

Data for good

Cierre

20
Qué sigue tras certificarte en ética de datos
01:16 min

Resumen

Entender qué son los datos personales es el primer paso para trabajar con ética en data science e inteligencia artificial. Si manejas información de personas, necesitas saber identificarla, clasificarla y protegerla antes de cualquier análisis. Esta guía te muestra los tipos, jerarquías y categorías que todo perfil técnico o curioso debería dominar.

¿Qué son los datos personales y cómo se identifican?

Los datos personales son aquella información que permite identificar de forma directa o indirecta a un individuo. La identificación directa ocurre cuando un dato te señala sin ambigüedad, como tu nombre. La indirecta aparece cuando el dato lo comparten varias personas, como tu nivel de ingresos, pero combinado con otros puede revelar quién eres.

En la práctica corporativa, esta distinción define cómo cuidas la información y qué análisis puedes ejecutar sin poner en riesgo a nadie [0:53].

¿Qué cuenta como dato personal? Cualquier información que identifique a una persona física, ya sea de forma directa (nombre, correo) o indirecta (ingresos, fecha de nacimiento combinada con ubicación).

¿Cómo se clasifican los datos personales por jerarquía de riesgo?

La jerarquía marca el nivel de cuidado que debes aplicar y la justificación que una empresa debe dar para recolectarlos [2:13]. Existen tres niveles:

Datos ordinarios: nombre, dirección, finanzas personales. Son los más comunes y de menor sensibilidad relativa.
Datos sensibles: origen étnico, preferencias políticas, religiosas y orientación sexual. Exigen rigor especial y justificación reforzada de uso.
Datos especiales: genéticos, biométricos o de salud. Provienen de fuentes clínicas o técnicas, no de declaraciones conscientes del usuario.

Cada categoría implica un protocolo distinto de protección y un argumento sólido frente al titular sobre por qué se le pidió esa información.

¿Qué información no se considera dato personal?

No toda la información que pasa por tus modelos es personal, y hacer bien esta distinción te ahorra fricción en proyectos analíticos. Tres casos quedan fuera:

Datos anonimizados, porque ya están protegidos y permiten estudios agregados sin identificar a nadie.
Datos de personas jurídicas, ya que el concepto aplica solo a individuos.
Datos generales que no permiten identificación de una persona específica.

Cuando un dataset cumple cualquiera de estas condiciones, puedes analizarlo con menos restricciones, aunque la buena práctica de documentar siempre se mantiene [3:54].

¿Anonimizar es lo mismo que cifrar? No. Anonimizar elimina la posibilidad de reidentificar a la persona; cifrar protege el acceso pero la información sigue siendo personal si se descifra.

¿Qué son los datos biométricos y cómo se clasifican?

Los datos biométricos son un subconjunto de los datos personales, no una categoría aparte. Incluyen el reconocimiento facial, el reconocimiento de retina, la firma, la escritura en teclado y el reconocimiento de voz [4:55].

Se clasifican de dos maneras complementarias: por su naturaleza y por sus características.

¿Cuál es la diferencia entre datos universales, únicos y permanentes?

Por su naturaleza, los datos biométricos pueden ser:

Permanentes: no cambian con el tiempo. La huella dactilar es el ejemplo clásico; aunque sufra una quemadura, se regenera.
Universales: los compartes con otras personas, como el grupo sanguíneo A positivo.
Únicos: te pertenecen solo a ti, como un análisis clínico individual.

La voz es un caso interesante: cambia con la afonía o durante la pubertad, pero sigue siendo un dato biométrico válido y, por tanto, un dato personal.

¿Qué son los rasgos físicos y los rasgos de comportamiento?

Por sus características, los datos biométricos se dividen en rasgos físicos y rasgos de personalidad o comportamiento [6:21]:

Rasgos físicos: observables a simple vista, como estatura o complexión.
Rasgos de comportamiento: requieren interacción para identificarlos, como si la persona es alegre, inteligente o reservada.

La diferencia práctica está en cuántas observaciones necesitas para registrar el dato con confianza.

¿Por qué importa la ética en el manejo de datos para IA?

Cuando hablamos de ética, normatividad y privacidad aparecen conceptos como blockchain, anonimización, cookies y GDPR [6:54]. Todos forman el ecosistema que regula cómo recolectas, almacenas y analizas información de personas reales.

Dominar estos términos te permite usar los datos para el bien social, evitar dilemas éticos y justificar técnicamente cada decisión analítica que tomes en una empresa o institución.

¿Qué otro tipo de dato personal se te ocurre que no aparezca en esta clasificación? Compártelo en los comentarios e indica si lo consideras ordinario, sensible, especial o biométrico según lo que aprendiste.

Obtén respuestas inmediatasProfundiza lo que acabas de ver

Comentarios

Avilio de Jesús Muñoz Vilchez

student•

Estuve revisando la legislación de algunos países sobre la protección de datos y obtuve esta información:

Ley de protección de datos personales (Ley 29733 -Perú). .
Ley de protección a la vida privada (Ley N°19.628 - Chile).
Ley de protección de datos (Ley 1581 - Colombia)
Ley de protección de datos personales en posesión de sujetos obligados (México)
Ley de Protección de Datos Personales (Ley 25326 - Argentina)
Ley Orgánica de Protección de Datos de Ecuador
Ley de Protección de datos personales y acción de habeas data (Ley 18331 - Uruguay)
Ley de Protección de los datos personales (Ley 25.326 - Paraguay)
Venezuela no posee legislación específica en materia de protección de datos

Mateo Montoya Villegas

student•

¡Muchas gracias por tu aporte Avilo!

Melanie Daniela Ventura Jimenez

student•

Gracias por tu aporte. Me gustaría señalar que en efecto Venezuela carece de un marco regulatorio en materia de protección de datos. Sin embargo, existe una ley promulgada en el año 2001 que podría servir de antecedente.

Te dejo el link del documento oficial: https://www.oas.org/juridico/spanish/mesicic3_ven_anexo19.pdf

Luis Enrique Chavarría Vázquez

student•

Resumen de la clase ¿Qué son los datos personales?

Información que permite identificar a una persona de manera directa o indirecta.

Algunos ejemplos.

Edad
Teléfono
Domicilio
Correo Electrónico
Documento nacional de identidad (INE en México)
Número de seguridad social
Ingresos
Fecha de nacimiento

Se pueden clasificar por jerarquía de riesgo(importancia:

Datos personales ordinarios ⇒ Nombre, dirección, finanzas personales, etc.
Datos personales sensibles ⇒ Origen étnico, opiniones políticas y religiosas, orientación sexual.
Datos especiales ⇒ Genéticos, biométricos y de salud (Vienen de fuentes no convencionales.

¿Qué datos no son personales?

Los datos anónimos (información anonimizada)
Los datos de personas jurídicas (instituciones)
Información que no permita identificar a la persona.

Los datos biométricos

Se consideran datos personales ⇒ Permiten identificar a una persona

Ejemplos:

Reconocimiento facial
Reconocimiento por retina
Reconocimiento vascular
Reconocimiento por firma
Reconocimiento de escritura
Acceso por voz
Reconocimiento de escritura de teclado

Clasificación de los datos biométricos

Por naturaleza

Universal
único (un análisis clínico)
Permanente (huella digital)

Por característica

Rasgos del orden físico o de su fisiología
Rasgos de comportamiento o su personalidad (Se sacan a partir de múltiples interacciones)

Avilio de Jesús Muñoz Vilchez

student•

Los datos de carácter penal no son considerados como una categoría especial, pero sí ++ameritan una protección especial++. Estos son datos personales relacionados con condenas y delitos o medidas de seguridad relacionadas con actividad criminal, acusaciones, investigaciones, acusaciones no probadas, información relacionada con la ausencia de condenas, datos personales de víctimas y testigos de delitos, datos personales sobre sanciones, condiciones o restricciones impuestas a un individuo como parte del proceso de justicia penal, medidas civiles que pueden dar lugar a una sanción penal si no se cumplen.

Este tipo de datos solo debe ser manejado por autoridades competentes.

Otro aspecto importante que he encontrado es la diferenciación que algunos especialistas realizan sobre la anonimización y la seudonimización.

La anonimización es un proceso que transforma por completo los datos, eliminando los vínculos con el individuo. Este proceso de transformación es irreversible. En cambio, la seudonimización es un proceso donde los datos se anonimizan, pero permite una conexión a los datos originales a través de permisos o una clave y este proceso puede ser revertido.

Sebastian F. Gimenez

student•

Excelente aporte, yo veo una dicotomía ya que la justicia es un servicio social para toda una sociedad, armo la discusión si dichos datos deberían ser de acceso público o no. Los leo.

MARTHA PAOLA GÓMEZ CARRIZOSA

student•

En Colombia , se podria decir que en casos judiciales se aplica un principio Publicidad donde es posible saber del proceso asi no sea parte o se tenga algún interés en el caso, pero también tiene una excepción en caso penales donde se vea involucrados menores o asuntos de Estado, no es posible su publicidad (dato público), adicionalmente tenemos la protección de datos como un derecho fundamental el cual tiene una ley específica que en casos de ser violada se puede pedir la eliminación del dato, pero esa publicidad siempre va a depender del caso particular, por eso no se podría decir que todo es público. Depende el escenario que se vea involucrados esos derechos.

Sebastian Rodriguez

student•

RESUMEN DE ESTA CLASE; Super importante saber estas clasificaciones

Carlos Mazzaroli

student•

Muy lindo el aporte. Toma un sanguchito

Eduardo Monzón

student•

Genia, gracias.

Simón Bello

student•

Juan R Rossano

student•

En argentina los datos personales se legislan por la llamada ley de habeas data (Ley 25.326). Cuando se definio la norma tengo entendido que se tomo como base la ley española. En la misma los datos de salud se definen como datos sensibles (no especiales) y es requerido un tratamiento especial (disociacion de datos) que justamente debi implementarlo en el 2004 en una aplicacion para hospitales. Me pregunte si hay normativas internacionales o cuales son las diferencias y si en ciencia de datos hay legislacion o se rige por las leyes comunes de habeas data (y en ese caso si se proyecta definir leyes especiales o normas internacionales para el tema). El perfil psicologico es algo que no esta clasificado y fue usado en el caso de cambridge analitycs. Yo lo ubicaria como dato sensible por el uso que se hizo de manipulacion.

Luis Enrique Chavarría Vázquez

student•

Buen aporte, gracias

Melanie Daniela Ventura Jimenez

student•

Juan, tal vez en esta clase presentan los datos vinculados a la salud como de tipo especial porque no todas las leyes los clasifican de la misma manera. Tendríamos que investigar un poco más a fines de esclarecerlo. De cualquier manera, como parte de un equipo de salud, a título personal creo que en efecto los datos sanitarios son datos sensibles hasta cierto punto, es decir, cuando son proporcionados por la misma persona. Por ejemplo, alguien que indica en un formulario que padece diabetes. Sin embargo, entrarían mejor en la categoría especiales porque en su mayoría la fuente de obtención no proviene de la persona declarante sino del equipo de salud que la ha diagnosticado, del analista clínico que realiza los exámenes en el laboratorio, etc.

Lukas Bustos

student•

Los datos de ubicación en tiempo real son datos privados muy sensibles por ejemplo los que recopila google y facebook

Sebastian Rodriguez

student•

Son super sensibles, con esos Datos literal saben donde estuvimos, a que hora, cuanto nos demoramos, y con GPS saben que otros dispositivos estuvieron cerca nuestro.

Juan Carlos Gutiérrez Ayala

student•

Es importante distinguir entre privacidad y confidencialidad. Como entiendo, la primera tiene que ver con los datos de la persona que le son inherentes y puede desear cuidarlos. La confidencialidad son datos que, bajo ciertas circunstancias como una investigación o un mandato judicial tienen que compartirse con las instancias autorizadas para ello.

José Rodrigo Arana Hi

student•

Econometría - es la rama de la economía que hace un uso extensivo de modelos matemáticos y estadísticos así como de la programación lineal y la teoría de juegos para analizar, interpretar y hacer predicciones sobre sistemas económicos, prediciendo variables como el precio de bienes y servicios, tasas de interés, tipos de cambio, las reacciones del mercado, el coste de producción, la tendencia de los negocios y las consecuencias de la política económica.

Fuente

José Rodrigo Arana Hi

student•

wikipedia

Hugo Montoya Diaz

student•

Es una excelente profesora Sílvia Ariza Sentís sera un magnifico curso garantizado

Miguel Torres

student•

Encontré esta clasificación de datos personales:

• Datos de identificación • Datos laborales • Datos patrimoniales • Datos sobre procedimientos administrativos y jurisdiccionales • Datos académicos • Datos de tránsito y movimientos migratorios

Fuente: https://www.infoem.org.mx/es/contenido/datos-personales

Obed Ulises Orta Aguilar

student•

Justamente yo estaba leyendo esta página, explican bien el tipo de datos personales.

Eduardo Monzón

student•

Buen dato.

Paola Alapizco

student•

Les dejo mi resumen :D

Los datos personales son aquellos que nos ayudan a identificar de forma directa o indirecta a un undividuo.

Sebastian Rodriguez

student•

Este es un tema de interes global, porque vivimos en una era donde estamos siendo vigilados a traves de redes sociales (facebook), motores de busqueda (Google), Gadgets (Smartwach), IOT (Alexa, Camaras, Chapas inteligentes, Neveras, ETC).

Solo por poner un ejemplo; El problema de la filtración de Datos de Millones de usuarios de Facebook con Cambridge Analítica.
La manera como controlan en China absolutamente todo, tienen hasta un sistema de puntos por buen comportamiento, eso significa que conocen todos los Datos Personales de la gente y son monitoreados 24/7.
Dejamos Datos en cuanta App se nos cruce, Subimos Fotos de absolutamente todo (unhelado, un almuerzo, cafe, etc.
Aunque el Big Data ya lleve mas de una Década siento que estamos en el inicio de toda esta Locura de rastreo masivo.
Dejamos Datos por todo lado, hasta para entrar al Gym ponemos nuestra huella, huella que sirve para falsificar, para desbloquear nuestro celular, pc o Tablet, para ingresar a las Apps de bancos y hacer transferencias, y por alguna razon la gente no se toma un momento y preguntarse como carajo manejan esos Datos tan sensibles en un pinche Gym.

Francisco Marín

student•

Discrepo en lo que a nombre y apellidos se refiere. Hay bastantes personas que se llaman y apellidan igual, por el contrario no todos viven en la misma dirección, ni su documento de identidad tiene el mismo número.

Melanie Daniela Ventura Jimenez

student•

Coincido. Creo que lo más atinado sería indicar que los datos personales directos u ordinarios vendrían siendo la combinación de datos como el nombre con la dirección, que amplía el margen de identificación de la persona. Por otro lado, el documento de identidad siempre será un dato directo y ordinario.

Diego Alexander Ariza Arenas

student•

Quizás le faltó más contexto a lo que dijo, pero pienso que no hay dos personas que tengan tu mismo nombre y apellido y al tiempo compartan número de identificación.

Eduard Giraldo Martínez

student•

Reto:

🩺 Encontré un tipo de dato que es ++Medical Data++ (Datos médicos para los panas). Se puede encontrar el estilo de vida, como por ejemplo, la dieta de la persona (si es vegana o no). . Hay otros como lo son el comportamiento social (conexiones), datos financieros, Etnia, Membresías.

Fuente (Está en inglés, aprovecha para practicar).

. Después de leer un poco más sobre los tipos de datos, me doy de cuenta la inmensidad de este tema. En serio, TODO, absolutamente todo, son datos que podemos guardar y usar. 🤯

Jhins Ledys Cárdenas Pardo

student•

Este curso hace parte de la Introduccion de la nueva escela de Data Science e IA. Lo que quiero compartir es que pasè a la nueva ruta de las escuelas nuevas y voy a enrolarme en estas rutas para cursar especificamente lo que requiere cada perfil. Vamos a ver como nos va.

Fabián Andrés Meneses Morales

student•

Para corroborar,

¿los datos especiales, que a diferencia de los datos personales ordinarios y sensibles, son los que se obtienen de manera diferente a la conciencia del individuo? ¿Por ejemplo, en psicología, cuando hacen una prueba psicométrica sobre ansiedad, depresión, personalidad, trastorno, conducta suicida, todo eso son datos especiales?
¿Las categorías de datos ordinarios, sensibles y especiales son mutuamente excluyentes? ¿Puede haber datos especiales y a la vez sensibles? Por ejemplo, un diagnóstico médico de cáncer es un dato especial porque fue resultado de un análisis de un profesional de la salud y no era conciencia plena del paciente, pero a la vez es información sensible debido a la delicadez de la información, ya si alguien se entera de manera inadecuada, puede cambiar 360 grados la vida del paciente mismo, de su familia y de su entorno cercano.

Mirla Trinidad Serruto Olguín

student•

RETO: ¿Qué otros datos personales conoces? 1.- Datos laborales

Solicitudes de empleo, correo electrónico institucional, teléfono institucional, actividades extracurriculares, referencias laborales.

2.- Datos patrimoniales

Bienes muebles e inmuebles, ingresos y egresos, cuentas bancarias, seguros, historial crediticio, información fiscal.

3.- Datos académicos:

Trayectoria académica, formación profesional, calificaciones, boletas, constancias, certificados, reconocimientos, títulos, cédulas profesionales.

4.- Datos de tránsito y movimientos migratorios

Información necesaria para nuestro tránsito dentro y fuera de país.

daniel cucuma

student•

datos de gustos o preferencias, por ejemplo, me gusta el real madrid, y los tacos

Fernando Jesús Núñez Valdez

student•

Creo que un tipo de datos personales son los datos de nuestros dispositivos eléctronicos; la dirección IP, modelo, versión, marca, etc. Aunque no todos sirven para identificarnos como persona, en el caso de la dirección IP creo que es tan importante como la dirección física (de nuestra casa).

Juan Esteban Sanchez Cifuentes

student•

lo mismo pensé yo, en general la metadata enriquece mucho, pero particularmente la IP me parece sensible