Cuando un algoritmo supera a humanos en lectura

Clase 13 de 20 • Curso de Ética y Manejo de Datos para Data Science e Inteligencia Artificial

Contenido del curso

Privacidad y ética de los datos

Retos éticos en la actualidad

Data for good

Cierre

20
Qué sigue tras certificarte en ética de datos
01:16 min

Tomar examen

Resumen

El procesamiento de lenguaje natural (NLP por sus siglas en inglés) plantea uno de los dilemas éticos más fascinantes de la actualidad: hasta dónde puede una máquina entender, predecir y responder como un humano. Aquí te explico cómo funciona, qué retos enfrenta y por qué importa que existan más contribuciones en español.

Qué es el procesamiento de lenguaje natural y cómo funciona

El NLP es la interacción entre computadoras y el lenguaje humano a partir de lenguas naturales [1:09]. Cuando entras a una página web y aparece un chatbot que te responde dudas, estás interactuando con una máquina previamente programada con las preguntas y respuestas más frecuentes.

La gran ventaja es que no tiene límite horario: puedes obtener una respuesta fuera del horario laboral de la empresa, sin esperar a que alguien del equipo se conecte.

¿Qué es un chatbot? Es una máquina reprogramada a partir de preguntas y respuestas frecuentes que permite interactuar con una página web y resolver dudas sin depender de un horario humano.

Por qué necesitamos más NLP en español

La mayoría de esta tecnología se ha desarrollado en inglés [1:54], lo que deja un vacío enorme en otras lenguas. Por eso se buscan desarrolladores y contribuidores que aporten contenido en español y otros idiomas, para enriquecer el lenguaje natural a partir de aportes de la comunidad.

Por qué un algoritmo le ganó a estudiantes de Stanford en comprensión lectora

Uno de los casos más comentados fue el reto entre Microsoft, Alibaba y la Universidad de Stanford [2:30]. El experimento consistió en enfrentar un algoritmo de NLP contra estudiantes de la universidad en una prueba de comprensión lectora.

El resultado: el algoritmo ganó. Esa victoria abrió el debate sobre cómo un modelo procesado de datos puede recolectar, asumir y entender información mejor que un humano altamente capacitado.

Dónde sigue ganando el humano frente a la máquina

Aunque la máquina supera al humano en algunas tareas, hay terrenos donde la persona tiene ventaja clara:

Identidad: los chatbots aún no logran identificarse con una marca de forma natural.
Emoción: detectar si alguien está frustrado, feliz o enojado y priorizar esa emoción sigue siendo complejo.
Adaptación de tono: hablarle con lenguaje informal a alguien joven o más formal a un adulto requiere matices que la tecnología sigue explorando.

En vías telefónicas sí se ha logrado comprender la emoción de manera más profunda [4:00], pero falta camino por recorrer.

Cómo funciona GPT-3 y qué dilemas éticos plantea

GPT-3 es un lenguaje autorregresivo [4:35], lo que significa que comprende el pasado de manera lineal: toma datos de un histórico y a partir de ahí predice. Mediante deep learning o aprendizaje profundo, ha procesado textos de prácticamente toda la historia documentada de la humanidad.

El alcance de este tipo de texto es ilimitado: cualquier contenido en la red, en la base de internet o en la nube puede alimentarlo. Eso incluye textos legales, médicos, técnicos.

¿Qué es un lenguaje autorregresivo? Es un modelo que toma datos históricos y, de manera lineal, predice el siguiente resultado. GPT-3 es un ejemplo: aprende de textos pasados para generar texto nuevo.

Qué pasaría si compites a GPT-3 contra un notario o un médico

Imagina pedirle a este modelo una escritura legal automatizada, o describirle síntomas de una posible enfermedad. El algoritmo habrá leído infinidad de documentos médicos disponibles en la red, muchos más de los que un médico podría revisar en toda su carrera.

¿Quién identificaría mejor tus síntomas? Esa es la pregunta incómoda que pone sobre la mesa GPT-3.

El reto adicional es que en internet existe mucha información falsa, y el algoritmo debe aprender a clasificar qué es verídico y qué no. Sin esa capacidad, el riesgo de respuestas erróneas se multiplica.

Hasta dónde puede llegar la sensibilidad de una máquina

La pregunta de fondo es dónde está la línea en que esta tecnología supera la capacidad o el potencial de sensibilidad humana. La comprensión lectora ya cayó. La predicción de texto también. Pero la emoción, la identidad y el juicio ético siguen siendo terreno humano, al menos por ahora.

¿Tú dónde crees que está esa línea? Cuéntame en los comentarios qué piensas sobre el avance del NLP y hasta qué punto confiarías en un algoritmo para tareas que hoy hacen profesionales humanos.

Daniel Alejandro Castro Figueroa

student•

Hola :) Estudié Filosofía hasta la Maestría y quería comentarles sobre el asunto del "entendimiento" de las computadoras.

Silvia mencionó que las máquinas pueden "entender" un texto.

Esta afirmación es bastante problemática por dos razones. En primer lugar, uno puede decir que nosotros tenemos "intenciones". Es decir, yo puedo querer entender un texto o yo puedo querer lavarme los dientes o ser ingeniero, etc. En suma, para que se entienda algo, debe haber un agente con intención. Sería bastante dudoso afirmar que las computadoras tengan intenciones: ¿Las computadoras buscan algo? ¿Tienen una vida mental en la cual eligen qué hacer y, por lo tanto, eligen entender un texto? Al parecer, las computadoras carecen de vida mental y, al menos hasta ahora, no parece que tengan intenciones sino que sus interacciones con humanos son un resultado de una computación algorítimica sumamente compleja.

En segundo lugar, toda intención y entendimiento requiere que poseamos consciencia, lo cual es difícil de afirmar respecto a una computadora. ¿Qué es la consciencia? Usualmente, la definimos como esta percepción nuestra de que todos nuestros sentidos y pensamientos están unificados. Es decir, todos asumimos que los 5 sentidos y nuestros procesos cognitivos están en un "centro". Yo afirmo que tengo consciencia porque puedo percibir unidamente todo lo que pienso, veo, huelo, siento, degusto u oigo. Eso es la consciencia. ¿Ocurre lo mismo en las máquinas? Es muy controversial afirmar que ocurra similar, porque no podemos comprobarlo empíricamente. Que una computadora "actúe como humano" no quiere decir que esté consciente, salvo que creas que todo humano es solo una colección de algoritmos. No obstante, no podemos comprobar que exista verdadera consciencia.

Por estas dos razones, podemos decir que las computadoras computan información y usan algoritmos complejos junto a una gran cantidad de información para generar el output que responde a una pregunta. Pero no podemos decir que "entiendan"; no poseen ni intención ni consciencia.

Alfonso Andres Zapata Guzman

student•

Una cosa que siempre he notado, es que nosotros definimos la consciencia, el estar vivo, desde el yo, es decir, desde el ambito del humano, y todo lo que carezca de estos atributos automaticamente lo señalamos como no humano, pero sucede algo, y es que al igual que las matematicas, la fisica, la filosofia y demas ramas del entendimiento humano, han sido creadas en base a convenciones sociales, moldeadas si o si por nosotros, y esto no quiere decir que estan sean las unicas maneras de ver el universo, sino que en caso de por ejemplo existir una sociedad avanzada de alienigenas que no comparten lo que nosotros creemos que es la vida, la creencia de uno u otro conjunto estaria errada?

Por eso yo generalizaria diciendo que como nosotros creemos que es la inteligencia y la vida segun nuestra convencion social, las maquinas quizas nunca lleguen a demostrar vida o inteligencia, pero a imagen y semejanza de nuestro modo de ver esto.

Ya seria un debate decidir si porque somos participes en la creacion de estas maquinas ellas debe basar o no en este criterio para juzgar si tienen vida o no.

Yo pongo un supuesto algo alocado, y si creamos estas maquinas y nunca las definimos como inteligentes, pero por alguna razon desaparecemos como especie y ellas quedan autosustentandose y autoaprendiendo a optimizarse poco a poco, se le quitaria ya el señalamiento de no ser seres vivos o no?

Alfonso Andres Zapata Guzman

student•

Añadiria algo, no, una computadora no puede ser un ser humano, porque por el mismo motivo que un humano no puede ser un delfin, o un humano no puede ser un perro, o un arbol, o cualquier otra especie viva sobre la faz de la tierra, y viceversa tampoco sucede, porque bi'ologicamente hablando, ya no hablando del ser ni nada de eso, el humano y cualquier otro ser se compone en conjunto de todas sus celulas, osi lo vemos algo mas macro, de sus organos y demas componentes.

Aplicando el principio GIGO, si metes paja en una maquina, saldra allgo hecho de paja, no hecho de otro material, si metes algo basado en ceros y uno, saldra algo basado en eso, si usas organicos salen seres vivos.

Pero si, si creo que van a superar las maquinas a la humanidad en algun momento, y aun asi, tendremos la desfachatez de nuestro ego de decir que no, que ellas no son mejores porque no estan vivas.

Hugo Montoya Diaz

Juan R. Vergara M.

Juan Camilo Maldonado Perez

Jhojan Ramirez

Fernando Jesús Núñez Valdez

Hector eduardo ordoñez

Arely Marisol Zea Wellmann

Avilio de Jesús Muñoz Vilchez

Leandro Tenjo

Juan Pablo Cuenca Ludeña

Roberto Adolfo Zarza Jimenez

Wilson Jurado Valbuena

Alberto Duque Villegas

Eduard Giraldo Martínez

Lina Paola Perdomo Rincón

Julio César Pineda Mora

Rodrigo Alles

Madison Eduardo Herrera Carrión

Paolo Quintero

Jorge Eliécer Ortiz Ballesteros

Andres Sanchez

Sebastian Rodriguez

Santiago Rodriguez Chaves

Nurian Astrid Tablas Landaverde

Cristian Alexander Vallejos De la rosa

Cuando un algoritmo supera a humanos en lectura

Privacidad y ética de los datos

Qué son los datos personales en IA

Reflexiones y Retos en Ciencia de Datos

Escándalos históricos que moldearon la ética de datos

Por qué las empresas recolectan tus datos

Bias y garbage in, garbage out en datos

Riesgos éticos del uso de datos en marketing

Cómo Cambridge Analytica manipuló votantes

Ley de datos personales y GDPR explicados

Retos éticos en la actualidad

Vehículos autónomos y el dilema del hackeo

Reconocimiento facial: comodidad vs privacidad

Pandemia, datos y control gubernamental

Privacidad y ética en tus relaciones digitales