Ética del NLP y los límites del lenguaje IA

Curso de Ética y Manejo de Datos para Data Science e Inteligencia Artificial

Contenido del curso

Privacidad y ética de los datos

Retos éticos en la actualidad

Data for good

Cierre

20
Qué hacer al terminar el curso de ética en datos
01:12 min

Tomar examen

Ética del NLP y los límites del lenguaje IA

Resumen

El procesamiento de lenguaje natural, conocido como NLP por sus siglas en inglés (Natural Language Processing), es la interacción entre las computadoras y el lenguaje humano a través de lenguas naturales. Entender qué es y cómo funciona te ayuda a ver por qué hoy plantea dilemas éticos importantes para desarrolladores, empresas y usuarios.

¿Qué es el procesamiento de lenguaje natural y cómo funciona en un chatbot?

Un chatbot es uno de los ejemplos más visibles de NLP. Es una máquina reprogramada a partir de las preguntas y respuestas más frecuentes que recibe una página web, lo que le permite responder a un usuario sin límite horario. Así puedes obtener una respuesta incluso fuera del horario laboral del equipo humano detrás de la marca.

La mayor parte de esta tecnología se ha desarrollado en inglés, lo que abre una oportunidad clara: contribuir con contenido en español o en tu lengua natural para enriquecer estos modelos desde la comunidad [01:00].

¿Qué es un chatbot? Es un programa entrenado con preguntas y respuestas frecuentes que interactúa con usuarios en una página web sin depender de un horario laboral.

¿Puede una máquina superar la comprensión lectora humana?

Microsoft y Alibaba retaron a la Universidad de Stanford con un modelo de NLP enfrentado a estudiantes en una prueba de comprensión lectora. El algoritmo ganó. Eso puso en relevancia cómo un modelo procesado de datos puede recolectar, asumir y entender información mejor que personas en una tarea concreta [01:45].

El dilema ético apareció justo ahí: si una máquina lee y comprende mejor que un estudiante de una universidad de prestigio, ¿dónde queda la ventaja humana? La respuesta corta es que aún hay terreno donde el humano lleva la delantera.

¿En qué le gana todavía el humano al algoritmo?

La identidad y la emoción siguen siendo difíciles para los chatbots. Estos son los puntos donde los modelos aún no llegan:

Identificarse con la marca y transmitir su personalidad de forma consistente.
Detectar si una persona está frustrada, feliz o enojada y priorizar la respuesta.
Adaptar el tono: más joven con audiencias jóvenes, más formal con adultos.

En canales telefónicos sí se ha logrado una comprensión emocional más profunda, pero el ranqueo correcto entre intención, tono y emoción sigue siendo el reto que exploran la mayoría de empresas.

¿Qué es GPT-3 y por qué es un lenguaje autorregresivo?

GPT-3 es un lenguaje autorregresivo, es decir, un modelo que comprende el pasado de manera lineal: toma datos históricos y, a partir de ellos, predice lo que sigue. Combinado con deep learning o aprendizaje profundo, ha procesado textos de prácticamente toda la historia escrita disponible en la red [03:20].

Eso incluye textos legales, médicos y cualquier documento alojado en internet o en la nube. Y aquí viene lo interesante: ese alcance casi ilimitado abre preguntas serias sobre el papel del experto humano.

¿Qué es GPT-3? Es un modelo de lenguaje autorregresivo que predice texto a partir de millones de documentos previos en la red, usando aprendizaje profundo.

¿Puede GPT-3 reemplazar a un notario o a un médico?

Imagina poner a competir este lenguaje con un notario para redactar una escritura automatizada, o describirle síntomas como si fuera un médico. El algoritmo habrá leído una cantidad de documentos médicos que ningún profesional alcanzaría a revisar en su vida.

Entonces, ¿quién identificaría mejor tu potencial enfermedad a partir de los síntomas? La pregunta no tiene una respuesta única, y ese es justamente el dilema.

¿Cómo distingue el algoritmo información falsa de verídica?

En internet circula mucha información falsa, y uno de los retos centrales de estos modelos es clasificar qué información es verídica y qué información es falsa. Sin esa capa, la predicción puede sonar convincente pero estar equivocada, lo que multiplica el riesgo en contextos legales o médicos.

¿Dónde está el límite entre NLP y la sensibilidad humana?

Esa es la pregunta abierta del módulo. La tecnología avanza rápido en comprensión y predicción, pero la sensibilidad, la identidad y la lectura emocional siguen siendo territorios donde el humano aporta algo que el modelo todavía no replica del todo.

Si quieres aportar al desarrollo de NLP en español, revisa la guía en la sección de recursos y empieza a contribuir. ¿Tú dónde pondrías la línea entre lo que debe hacer un algoritmo y lo que debe quedarse en manos humanas? Cuéntame en los comentarios.

Daniel Alejandro Castro Figueroa

Estudiante

Hola :) Estudié Filosofía hasta la Maestría y quería comentarles sobre el asunto del "entendimiento" de las computadoras.

Silvia mencionó que las máquinas pueden "entender" un texto.

Esta afirmación es bastante problemática por dos razones. En primer lugar, uno puede decir que nosotros tenemos "intenciones". Es decir, yo puedo querer entender un texto o yo puedo querer lavarme los dientes o ser ingeniero, etc. En suma, para que se entienda algo, debe haber un agente con intención. Sería bastante dudoso afirmar que las computadoras tengan intenciones: ¿Las computadoras buscan algo? ¿Tienen una vida mental en la cual eligen qué hacer y, por lo tanto, eligen entender un texto? Al parecer, las computadoras carecen de vida mental y, al menos hasta ahora, no parece que tengan intenciones sino que sus interacciones con humanos son un resultado de una computación algorítimica sumamente compleja.

En segundo lugar, toda intención y entendimiento requiere que poseamos consciencia, lo cual es difícil de afirmar respecto a una computadora. ¿Qué es la consciencia? Usualmente, la definimos como esta percepción nuestra de que todos nuestros sentidos y pensamientos están unificados. Es decir, todos asumimos que los 5 sentidos y nuestros procesos cognitivos están en un "centro". Yo afirmo que tengo consciencia porque puedo percibir unidamente todo lo que pienso, veo, huelo, siento, degusto u oigo. Eso es la consciencia. ¿Ocurre lo mismo en las máquinas? Es muy controversial afirmar que ocurra similar, porque no podemos comprobarlo empíricamente. Que una computadora "actúe como humano" no quiere decir que esté consciente, salvo que creas que todo humano es solo una colección de algoritmos. No obstante, no podemos comprobar que exista verdadera consciencia.

Por estas dos razones, podemos decir que las computadoras computan información y usan algoritmos complejos junto a una gran cantidad de información para generar el output que responde a una pregunta. Pero no podemos decir que "entiendan"; no poseen ni intención ni consciencia.

Alfonso Andres Zapata Guzman

Estudiante

Una cosa que siempre he notado, es que nosotros definimos la consciencia, el estar vivo, desde el yo, es decir, desde el ambito del humano, y todo lo que carezca de estos atributos automaticamente lo señalamos como no humano, pero sucede algo, y es que al igual que las matematicas, la fisica, la filosofia y demas ramas del entendimiento humano, han sido creadas en base a convenciones sociales, moldeadas si o si por nosotros, y esto no quiere decir que estan sean las unicas maneras de ver el universo, sino que en caso de por ejemplo existir una sociedad avanzada de alienigenas que no comparten lo que nosotros creemos que es la vida, la creencia de uno u otro conjunto estaria errada?

Por eso yo generalizaria diciendo que como nosotros creemos que es la inteligencia y la vida segun nuestra convencion social, las maquinas quizas nunca lleguen a demostrar vida o inteligencia, pero a imagen y semejanza de nuestro modo de ver esto.

Ya seria un debate decidir si porque somos participes en la creacion de estas maquinas ellas debe basar o no en este criterio para juzgar si tienen vida o no.

Yo pongo un supuesto algo alocado, y si creamos estas maquinas y nunca las definimos como inteligentes, pero por alguna razon desaparecemos como especie y ellas quedan autosustentandose y autoaprendiendo a optimizarse poco a poco, se le quitaria ya el señalamiento de no ser seres vivos o no?

Alfonso Andres Zapata Guzman

Estudiante

Añadiria algo, no, una computadora no puede ser un ser humano, porque por el mismo motivo que un humano no puede ser un delfin, o un humano no puede ser un perro, o un arbol, o cualquier otra especie viva sobre la faz de la tierra, y viceversa tampoco sucede, porque bi'ologicamente hablando, ya no hablando del ser ni nada de eso, el humano y cualquier otro ser se compone en conjunto de todas sus celulas, osi lo vemos algo mas macro, de sus organos y demas componentes.

Aplicando el principio GIGO, si metes paja en una maquina, saldra allgo hecho de paja, no hecho de otro material, si metes algo basado en ceros y uno, saldra algo basado en eso, si usas organicos salen seres vivos.

Pero si, si creo que van a superar las maquinas a la humanidad en algun momento, y aun asi, tendremos la desfachatez de nuestro ego de decir que no, que ellas no son mejores porque no estan vivas.

Hugo Montoya Diaz

Juan R. Vergara M.

Juan Camilo Maldonado Perez

Jhojan Ramirez

Fernando Jesús Núñez Valdez

Hector eduardo ordoñez

Arely Marisol Zea Wellmann

Avilio de Jesús Muñoz Vilchez

Leandro Tenjo

Juan Pablo Cuenca Ludeña

Roberto Adolfo Zarza Jimenez

Wilson Jurado Valbuena

Alberto Duque Villegas

Eduard Giraldo Martínez

Lina Paola Perdomo Rincón

Julio César Pineda Mora

Rodrigo Alles

Madison Eduardo Herrera Carrión

Paolo Quintero

Jorge Eliécer Ortiz Ballesteros

Andres Sanchez

Sebastian Rodriguez

Santiago Rodriguez Chaves

Ricardo Bruni

Luis Renato Cabañas Rodríguez

Ética del NLP y los límites del lenguaje IA

Privacidad y ética de los datos

Qué son los datos personales en Data Science

Reflexiones y Retos en Ciencia de Datos

Escándalos históricos de fuga de datos

Por qué las empresas recolectan tus datos

Sesgo y garbage in garbage out en datos

Riesgos éticos del uso de datos en marketing

Manipulación de datos en campañas políticas

Ley mexicana y GDPR para proteger datos

Retos éticos en la actualidad

Ética de los vehículos autónomos hoy

Ética del reconocimiento facial en apps

Pandemia: ¿datos para proteger o controlar?

Dilemas éticos en tus relaciones digitales