El procesamiento del lenguaje natural es la rama de la inteligencia artificial que enseña a las máquinas a leer, entender, traducir y generar texto o audio como lo haríamos tú o yo. Importa porque el lenguaje es la evidencia más clara de inteligencia, y entenderlo abre la puerta a sistemas como ChatGPT. Esta guía es para quien empieza en IA y quiere ubicar el NLP dentro del panorama actual.
¿Por qué el lenguaje es la puerta de entrada a la inteligencia artificial?
El lenguaje no existe por sí solo. Es un sistema de comunicación que usa símbolos estructurados para dar significado a las cosas que nos rodean. Es decir, lo construimos como representación del mundo, no como un fin aislado [0:30].
El psicólogo y lingüista Steven Pinker lo resume con una frase potente: el lenguaje es la joya de la corona de la cognición [1:45]. Si quieres reconocer si algo es inteligente, mirar cómo usa el lenguaje es uno de los mejores atajos.
Y aquí entra una referencia que probablemente ya escuchaste: el test de Turing. Alan Turing propuso una idea simple pero incómoda. Si tú estás conversando por un canal como WhatsApp y no puedes distinguir si del otro lado hay una persona o una máquina, ¿qué argumentos te quedan para negarle inteligencia a esa máquina? [2:15].
¿Qué es el test de Turing? Es una prueba propuesta por Alan Turing donde una máquina se considera inteligente si, en una conversación, no puedes distinguirla de un humano.
La prueba ha sido muy criticada y hoy no se considera suficiente para garantizar inteligencia. Pero deja una idea sólida: el lenguaje es una evidencia enorme de eso que llamamos inteligencia, aunque ni tú ni yo podamos definirla del todo.
¿Qué es el procesamiento del lenguaje natural y para qué sirve?
El procesamiento del lenguaje natural, o NLP por sus siglas en inglés, es construir algoritmos que procesen, entiendan y analicen el texto y el audio que usamos los humanos [3:50]. Se apoya en machine learning para enseñarle a una máquina a manejar nuestro lenguaje en sus distintas formas.
No se trata de una sola habilidad. El lenguaje cumple muchos propósitos, y eso se traduce en muchas tareas distintas dentro del NLP.
¿Cuáles son las tareas más comunes del NLP?
Dentro del espectro hay tareas más sencillas y otras realmente difíciles. Estas son algunas que aparecen en la clase [5:10]:
- Corrección ortográfica.
- Modelado de temas de conversación, como detectar de qué habla la gente en Twitter.
- Clasificación de texto para saber si algo es positivo o negativo.
- Resumen automático de textos largos.
- Traducción entre idiomas.
- Generación de texto creativo, como poesía o contenido inspirador.
- Agentes conversacionales de dominio abierto, donde puedes preguntar cualquier cosa.
Las primeras suelen ser más fáciles. Traducir bien entre idiomas o sostener una conversación abierta sobre cualquier tema están en el extremo más complejo.
¿Qué es un agente conversacional de dominio abierto? Es un chatbot al que puedes preguntarle cualquier cosa y responde sin estar limitado a un tema específico, como ocurre con ChatGPT.
¿Qué son los modelos de lenguaje y los LLM?
Un modelo de lenguaje es un modelo estadístico que aprende patrones del idioma a partir de grandes volúmenes de texto. Cuando ese modelo se entrena con cantidades masivas de información de internet, foros, Reddit y demás, hablamos de un Large Language Model o LLM [7:20].
Este entrenamiento masivo le permite al algoritmo responder preguntas, clasificar texto, corregir ortografía o traducir de forma razonable, todo dentro del mismo sistema. Es justamente lo que hace que ChatGPT sea una tecnología tan comentada, y también tan controversial. Hay quienes dicen que es una ilusión y que no entiende lo que responde, y hay quienes ven en él un avance real.
¿Por qué los LLM cambiaron el NLP?
Antes, cada tarea de lenguaje se resolvía con un algoritmo específico. Ese algoritmo era bueno en una cosa y malo en todo lo demás [8:30]. Esa limitación dejaba mucho que desear, porque tú y yo sí podemos resumir, traducir, clasificar y conversar con el mismo cerebro.
La filosofía actual de la IA aspira a algo distinto: un solo algoritmo capaz de cumplir varias tareas de forma razonable. Esa es la vara que hoy se usa para decir que un sistema de NLP es lo suficientemente bueno.
¿En qué se diferencia un LLM de un modelo de NLP tradicional? Un LLM se entrena con datos masivos y resuelve muchas tareas a la vez, mientras que un modelo tradicional se entrena para una tarea específica.
¿Por qué el lenguaje natural no basta para lograr inteligencia artificial?
El lenguaje natural es una de las bases más sólidas hacia la inteligencia artificial, pero por sí solo no llega lejos. Para acercarnos a algo parecido a la inteligencia humana hace falta integrar otros canales cognitivos como audio, video e imágenes [9:40].
Nosotros combinamos todo ese flujo de datos para darle sentido al mundo y comunicarlo. Un sistema verdaderamente inteligente tendría que hacer algo similar, no quedarse solo en texto.
Reto para ti: del espectro de tareas de NLP, de fácil a difícil, escoge tres que te llamen la atención. Busca una aplicación de software que las resuelva, prueba qué tan bien lo hace y anota tus hallazgos en tu workbook. ¿Cuáles elegiste y por qué? Cuéntamelo en los comentarios.