El procesamiento de lenguaje natural (NLP por sus siglas en inglés) plantea uno de los dilemas éticos más fascinantes de la actualidad: hasta dónde puede una máquina entender, predecir y responder como un humano. Aquí te explico cómo funciona, qué retos enfrenta y por qué importa que existan más contribuciones en español.
Qué es el procesamiento de lenguaje natural y cómo funciona
El NLP es la interacción entre computadoras y el lenguaje humano a partir de lenguas naturales [1:09]. Cuando entras a una página web y aparece un chatbot que te responde dudas, estás interactuando con una máquina previamente programada con las preguntas y respuestas más frecuentes.
La gran ventaja es que no tiene límite horario: puedes obtener una respuesta fuera del horario laboral de la empresa, sin esperar a que alguien del equipo se conecte.
¿Qué es un chatbot? Es una máquina reprogramada a partir de preguntas y respuestas frecuentes que permite interactuar con una página web y resolver dudas sin depender de un horario humano.
Por qué necesitamos más NLP en español
La mayoría de esta tecnología se ha desarrollado en inglés [1:54], lo que deja un vacío enorme en otras lenguas. Por eso se buscan desarrolladores y contribuidores que aporten contenido en español y otros idiomas, para enriquecer el lenguaje natural a partir de aportes de la comunidad.
Por qué un algoritmo le ganó a estudiantes de Stanford en comprensión lectora
Uno de los casos más comentados fue el reto entre Microsoft, Alibaba y la Universidad de Stanford [2:30]. El experimento consistió en enfrentar un algoritmo de NLP contra estudiantes de la universidad en una prueba de comprensión lectora.
El resultado: el algoritmo ganó. Esa victoria abrió el debate sobre cómo un modelo procesado de datos puede recolectar, asumir y entender información mejor que un humano altamente capacitado.
Dónde sigue ganando el humano frente a la máquina
Aunque la máquina supera al humano en algunas tareas, hay terrenos donde la persona tiene ventaja clara:
- Identidad: los chatbots aún no logran identificarse con una marca de forma natural.
- Emoción: detectar si alguien está frustrado, feliz o enojado y priorizar esa emoción sigue siendo complejo.
- Adaptación de tono: hablarle con lenguaje informal a alguien joven o más formal a un adulto requiere matices que la tecnología sigue explorando.
En vías telefónicas sí se ha logrado comprender la emoción de manera más profunda [4:00], pero falta camino por recorrer.
Cómo funciona GPT-3 y qué dilemas éticos plantea
GPT-3 es un lenguaje autorregresivo [4:35], lo que significa que comprende el pasado de manera lineal: toma datos de un histórico y a partir de ahí predice. Mediante deep learning o aprendizaje profundo, ha procesado textos de prácticamente toda la historia documentada de la humanidad.
El alcance de este tipo de texto es ilimitado: cualquier contenido en la red, en la base de internet o en la nube puede alimentarlo. Eso incluye textos legales, médicos, técnicos.
¿Qué es un lenguaje autorregresivo? Es un modelo que toma datos históricos y, de manera lineal, predice el siguiente resultado. GPT-3 es un ejemplo: aprende de textos pasados para generar texto nuevo.
Qué pasaría si compites a GPT-3 contra un notario o un médico
Imagina pedirle a este modelo una escritura legal automatizada, o describirle síntomas de una posible enfermedad. El algoritmo habrá leído infinidad de documentos médicos disponibles en la red, muchos más de los que un médico podría revisar en toda su carrera.
¿Quién identificaría mejor tus síntomas? Esa es la pregunta incómoda que pone sobre la mesa GPT-3.
El reto adicional es que en internet existe mucha información falsa, y el algoritmo debe aprender a clasificar qué es verídico y qué no. Sin esa capacidad, el riesgo de respuestas erróneas se multiplica.
Hasta dónde puede llegar la sensibilidad de una máquina
La pregunta de fondo es dónde está la línea en que esta tecnología supera la capacidad o el potencial de sensibilidad humana. La comprensión lectora ya cayó. La predicción de texto también. Pero la emoción, la identidad y el juicio ético siguen siendo terreno humano, al menos por ahora.
¿Tú dónde crees que está esa línea? Cuéntame en los comentarios qué piensas sobre el avance del NLP y hasta qué punto confiarías en un algoritmo para tareas que hoy hacen profesionales humanos.