Qué es el procesamiento del lenguaje natural

Curso de Fundamentos de AI para Data y Machine Learning

Contenido del curso

Fundamentos de IA

Deep learning: IA a profundidad

Inteligencia artificial aplicada

Machine learning Open-source

Importancia de las matemáticas para desarrollar IA

Ética y uso de datos en IA

El futuro con IA

Tomar examen

Qué es el procesamiento del lenguaje natural

Resumen

El procesamiento del lenguaje natural es la rama de la inteligencia artificial que enseña a las máquinas a leer, entender, traducir y generar texto o audio como lo haríamos tú o yo. Importa porque el lenguaje es la evidencia más clara de inteligencia, y entenderlo abre la puerta a sistemas como ChatGPT. Esta guía es para quien empieza en IA y quiere ubicar el NLP dentro del panorama actual.

¿Por qué el lenguaje es la puerta de entrada a la inteligencia artificial?

El lenguaje no existe por sí solo. Es un sistema de comunicación que usa símbolos estructurados para dar significado a las cosas que nos rodean. Es decir, lo construimos como representación del mundo, no como un fin aislado [0:30].

El psicólogo y lingüista Steven Pinker lo resume con una frase potente: el lenguaje es la joya de la corona de la cognición [1:45]. Si quieres reconocer si algo es inteligente, mirar cómo usa el lenguaje es uno de los mejores atajos.

Y aquí entra una referencia que probablemente ya escuchaste: el test de Turing. Alan Turing propuso una idea simple pero incómoda. Si tú estás conversando por un canal como WhatsApp y no puedes distinguir si del otro lado hay una persona o una máquina, ¿qué argumentos te quedan para negarle inteligencia a esa máquina? [2:15].

¿Qué es el test de Turing? Es una prueba propuesta por Alan Turing donde una máquina se considera inteligente si, en una conversación, no puedes distinguirla de un humano.

La prueba ha sido muy criticada y hoy no se considera suficiente para garantizar inteligencia. Pero deja una idea sólida: el lenguaje es una evidencia enorme de eso que llamamos inteligencia, aunque ni tú ni yo podamos definirla del todo.

¿Qué es el procesamiento del lenguaje natural y para qué sirve?

El procesamiento del lenguaje natural, o NLP por sus siglas en inglés, es construir algoritmos que procesen, entiendan y analicen el texto y el audio que usamos los humanos [3:50]. Se apoya en machine learning para enseñarle a una máquina a manejar nuestro lenguaje en sus distintas formas.

No se trata de una sola habilidad. El lenguaje cumple muchos propósitos, y eso se traduce en muchas tareas distintas dentro del NLP.

¿Cuáles son las tareas más comunes del NLP?

Dentro del espectro hay tareas más sencillas y otras realmente difíciles. Estas son algunas que aparecen en la clase [5:10]:

Corrección ortográfica.
Modelado de temas de conversación, como detectar de qué habla la gente en Twitter.
Clasificación de texto para saber si algo es positivo o negativo.
Resumen automático de textos largos.
Traducción entre idiomas.
Generación de texto creativo, como poesía o contenido inspirador.
Agentes conversacionales de dominio abierto, donde puedes preguntar cualquier cosa.

Las primeras suelen ser más fáciles. Traducir bien entre idiomas o sostener una conversación abierta sobre cualquier tema están en el extremo más complejo.

¿Qué es un agente conversacional de dominio abierto? Es un chatbot al que puedes preguntarle cualquier cosa y responde sin estar limitado a un tema específico, como ocurre con ChatGPT.

¿Qué son los modelos de lenguaje y los LLM?

Un modelo de lenguaje es un modelo estadístico que aprende patrones del idioma a partir de grandes volúmenes de texto. Cuando ese modelo se entrena con cantidades masivas de información de internet, foros, Reddit y demás, hablamos de un Large Language Model o LLM [7:20].

Este entrenamiento masivo le permite al algoritmo responder preguntas, clasificar texto, corregir ortografía o traducir de forma razonable, todo dentro del mismo sistema. Es justamente lo que hace que ChatGPT sea una tecnología tan comentada, y también tan controversial. Hay quienes dicen que es una ilusión y que no entiende lo que responde, y hay quienes ven en él un avance real.

¿Por qué los LLM cambiaron el NLP?

Antes, cada tarea de lenguaje se resolvía con un algoritmo específico. Ese algoritmo era bueno en una cosa y malo en todo lo demás [8:30]. Esa limitación dejaba mucho que desear, porque tú y yo sí podemos resumir, traducir, clasificar y conversar con el mismo cerebro.

La filosofía actual de la IA aspira a algo distinto: un solo algoritmo capaz de cumplir varias tareas de forma razonable. Esa es la vara que hoy se usa para decir que un sistema de NLP es lo suficientemente bueno.

¿En qué se diferencia un LLM de un modelo de NLP tradicional? Un LLM se entrena con datos masivos y resuelve muchas tareas a la vez, mientras que un modelo tradicional se entrena para una tarea específica.

¿Por qué el lenguaje natural no basta para lograr inteligencia artificial?

El lenguaje natural es una de las bases más sólidas hacia la inteligencia artificial, pero por sí solo no llega lejos. Para acercarnos a algo parecido a la inteligencia humana hace falta integrar otros canales cognitivos como audio, video e imágenes [9:40].

Nosotros combinamos todo ese flujo de datos para darle sentido al mundo y comunicarlo. Un sistema verdaderamente inteligente tendría que hacer algo similar, no quedarse solo en texto.

Reto para ti: del espectro de tareas de NLP, de fácil a difícil, escoge tres que te llamen la atención. Busca una aplicación de software que las resuelva, prueba qué tan bien lo hace y anota tus hallazgos en tu workbook. ¿Cuáles elegiste y por qué? Cuéntamelo en los comentarios.

Juan Carlos Gallardo Corona

Estudiante

🧠🗣Procesamiento de lenguaje natural: PLN

Procesamiento de Lenguaje Natural (PLN) 📚

Rama de la inteligencia artificial
Enfocado en interacción entre computadoras y lenguaje humano
Objetivo: permitir que computadoras entiendan, interpreten y generen lenguaje natural

Test de Turing 🧪

Propuesto por Alan Turing en 1950
Determina si una máquina exhibe comportamiento inteligente equivalente al humano
Realizado mediante conversación en lenguaje natural
Si la persona no distingue entre respuestas de máquina y humano, la máquina pasa el test

Inteligencia Artificial Fuerte 💪

Idea de IA que iguala o supera la inteligencia humana en todas las áreas cognitivas
Máquina capaz de pensar, razonar, aprender y tomar decisiones como un ser humano
Contraste con IA débil (tareas específicas)
Meta a largo plazo y objeto de debate entre expertos en IA

!Untitled

Enfoque Multimodal en IA 🧠🔊📷

El enfoque multimodal en IA busca combinar diferentes modalidades de entrada para resolver problemas complejos, emulando la capacidad humana de procesar información de diversas fuentes y modalidades.

Características del enfoque multimodal en IA 🌟

Combinación de imágenes, audio y texto
Emula la percepción y comprensión humana
Aplicable en clasificación de imágenes y comprensión de lenguaje natural

Avances e investigación en IA multimodal 🔬

Impulsado por grandes conjuntos de datos etiquetados
Mayor capacidad de procesamiento de computadoras
Desarrollo de sistemas de inteligencia artificial conversacionales avanzados

Integración de áreas en IA multimodal 🧩

Procesamiento de lenguaje natural (PLN)
Visión artificial: permite que IA "vea" el mundo y entienda el entorno
Robótica: permite que IA interactúe físicamente con el mundo y realice tareas complejas

La IA multimodal integra múltiples áreas de la inteligencia artificial, permitiendo que una máquina cumpla tareas de manera similar a como lo haría un humano.

Modelos de Lenguaje en IA 💬🤖

Los modelos de lenguaje son esenciales en el procesamiento del lenguaje natural (PLN) en IA y permiten a las máquinas entender y procesar el lenguaje humano.

Creación y entrenamiento de modelos de lenguaje 📚

Utilizan algoritmos de aprendizaje automático
Entrenados con grandes cantidades de datos de texto
Realizan tareas de PLN como traducción automática, análisis de sentimientos, resumen de texto y generación de texto

LLM (Language Model Libraries) en IA 📖

Bibliotecas de modelos de lenguaje pre-entrenados
Facilitan el uso de modelos de lenguaje en aplicaciones
Ejemplos: BERT de Google, GPT de OpenAI, ULMFiT de fast ai

Modelos de lenguaje y LLM en aplicaciones de IA 🌐

Importantes en inteligencia artificial
Utilizados en reconocimiento de voz, traducción automática, generación de texto
Entrenados con grandes cantidades de texto
LLM basados en arquitectura Transformer, enfocados en PLN
Aprenden representaciones semánticas complejas
Aplicaciones: chatbots, asistentes virtuales, sistemas de recomendación de texto

Los modelos de lenguaje y los LLM son herramientas poderosas en IA y se utilizan en diversas aplicaciones relacionadas con el procesamiento del lenguaje natural.

Edgardo Riveros Sepulveda

Estudiante

WOWWW

Rodrigo Alles

José González

Fabio Emilio Buiza Lopez

Jhoan Sebastián Lopera Gallego

Eduardo Monzón

Ixcoatl Francisco Pérez

Juan Esteban Bolívar Ferrer

Elias Garcia

Mejia Juan Sebastian

Kamilo Stevan Alomías Correa

Natalia Michelle Pineda Zorro

MARIA TERESA PANIAGUA RIVERA

Daniel Moreno

Alejandro Escobar

Anderson Eduardo Arévalo Ramírez

Lexx Redds

Eduardo Peña Ramos

Ameth Ordoñez Erazo

Diego Felipe Gallo García

Dennis Fernando Rodriguez Sanz

Osvaldo Damián Ruiz

Keny Isaías López Corrales

Juan R. Vergara M.

Diego Jurado

Jorge Pardo

Cristina Córdova

Ralph Peraza

Benjamin Allen Ramirez Horna

Jorge Francisco Vuelvas Lomeli

Paolo Joaquin Pinto Perez

Camilo Andrés Hurtado Erasso

Valentin Testa

Jeremy Giron Cisneros

Cristian David Gonzalez Ramirez

Qué es el procesamiento del lenguaje natural

Fundamentos de IA

Fundamentos de la Inteligencia Artificial para Principiantes

IA invisible que ya controla tu día

Qué puede y no puede hacer la IA

Conceptos Clave de Inteligencia Artificial, Machine Learning y Deep Learning

Conceptos Clave de Data Science y Aprendizaje Automático

Qué es machine learning y su ciclo de vida

Casos de éxito y retos reales de la IA

Deep learning: IA a profundidad

Fundamentos y Aplicaciones del Deep Learning

Cuándo no usar Deep Learning

Inteligencia artificial aplicada

Visión Artificial: Aplicaciones y Tecnologías Clave