Procesamiento del Lenguaje Natural en Inteligencia Artificial

Clase 11 de 23 • Curso de Fundamentos de AI para Data y Machine Learning

Contenido del curso

Fundamentos de IA

Deep learning: IA a profundidad

Inteligencia artificial aplicada

Machine learning Open-source

Importancia de las matemáticas para desarrollar IA

Ética y uso de datos en IA

El futuro con IA

Tomar examen

Resumen

El lenguaje es mucho más que palabras: es la evidencia más contundente de nuestra inteligencia. Comprender cómo las máquinas pueden procesar, analizar y generar texto humano abre una de las puertas más fascinantes de la inteligencia artificial. Francisco Camacho, CTO y cofundador de Hunty, explica con claridad cómo el procesamiento del lenguaje natural (NLP) se convierte en un pilar fundamental para construir algoritmos cada vez más capaces.

¿Por qué el lenguaje es la clave de la inteligencia artificial?

Todo parte de una idea poderosa: la inteligencia nos permite desarrollar el lenguaje [0:18]. El lenguaje es un sistema de comunicación que usa símbolos estructurados para dar significado a las cosas que nos rodean. No existe de forma aislada; es una representación del mundo y de cómo interactuamos con él.

Esta conexión entre lenguaje e inteligencia tiene raíces profundas. Steven Pinker, reconocido psicólogo y lingüista, lo expresó así: "El lenguaje es la joya de la corona de la cognición" [1:18]. Es decir, si queremos evaluar si algo es inteligente, el lenguaje resulta uno de los indicadores más reveladores.

Aquí entra en juego el famoso test de Turing [1:35], propuesto por el matemático Alan Turing. La prueba plantea un escenario simple: si mantienes una conversación —por ejemplo, por WhatsApp— y no puedes distinguir si hablas con una máquina o con un humano, ¿qué razones hay para negar que esa máquina sea inteligente? Aunque esta prueba ha sido criticada y no es suficiente para garantizar inteligencia, subraya algo esencial: el lenguaje es una puerta hacia el entendimiento de la inteligencia [2:15].

¿Qué es el procesamiento del lenguaje natural y qué tareas abarca?

El razonamiento es directo: si los seres inteligentes desarrollan lenguaje, entonces construir un algoritmo capaz de procesar y analizar texto humano puede ser un camino razonable hacia la inteligencia artificial [2:42]. Eso es, en esencia, el procesamiento del lenguaje natural: enseñar a una máquina a trabajar con texto, audio y otras formas de comunicación humana.

Este campo implica un amplio espectro de tareas [3:14]:

Traducir de un idioma a otro.
Resumir textos extensos.
Clasificar contenido como positivo o negativo.
Conversar con usuarios de forma coherente.
Generar texto original, como poesía o contenido inspirador.
Corregir ortografía de manera automática.
Modelar temas de conversación a partir de grandes volúmenes de datos, como tweets.

No todas estas tareas tienen la misma dificultad. La corrección ortográfica o la detección de temas son relativamente sencillas, mientras que la traducción automática y los agentes conversacionales de dominio abierto —un chatbot capaz de responder cualquier pregunta— se ubican en el extremo más complejo [3:50].

¿Qué son los modelos de lenguaje y los LLM?

Tecnologías como ChatGPT son ejemplos de lo que hoy llamamos Large Language Models o LLM [4:42]. Estos son modelos estadísticos del lenguaje entrenados con enormes cantidades de información extraída de internet: foros, comentarios, artículos y plataformas como Reddit.

El resultado de ese entrenamiento masivo es que el algoritmo puede responder preguntas de forma razonable, clasificar texto, corregir errores o traducir entre idiomas. Lo verdaderamente notable es que un solo modelo puede realizar múltiples tareas [5:22]. Antes, se necesitaba un algoritmo específico para cada tarea, y ese algoritmo era bueno solo en una cosa pero deficiente en todo lo demás.

¿Es suficiente el lenguaje para alcanzar la inteligencia artificial?

Aunque el NLP es una de las bases más sólidas del progreso en IA, por sí solo no es suficiente [6:05]. Los seres humanos no procesamos solo texto; combinamos audio, video, imágenes y otros canales cognitivos para dar sentido al mundo. La aspiración actual es construir algoritmos que integren todos esos flujos de datos, tal como lo hacemos nosotros.

Piensa en tres tareas del espectro de NLP que te resulten interesantes y busca aplicaciones de software que las resuelvan. Observa cómo lo hacen y comparte tus hallazgos: ¿qué tarea te parece más sorprendente en su implementación actual?

Comentarios

Rodrigo Alles

student•

Procesamiento de lenguaje natural (PLN)

El procesamiento de lenguaje natural (PLN) es una rama de la inteligencia artificial que se enfoca en la interacción entre las computadoras y el lenguaje humano. El objetivo del PLN es permitir que las computadoras puedan entender, interpretar y generar lenguaje natural de la misma manera que lo hacen los seres humanos.

Test de Turing

El test de Turing es un experimento propuesto por el matemático y científico de la computación Alan Turing en 1950. El objetivo del test es determinar si una máquina puede exhibir un comportamiento inteligente equivalente o indistinguible del de un ser humano. El test se realiza mediante una conversación en lenguaje natural entre una persona y una máquina, y si la persona no puede distinguir si la respuesta proviene de una máquina o de otro ser humano, se considera que la máquina ha pasado el test.

Inteligencia artificial fuerte

La inteligencia artificial fuerte se refiere a la idea de una inteligencia artificial que puede igualar o superar la inteligencia humana en todas las áreas cognitivas. Es decir, una máquina que es capaz de pensar, razonar, aprender y tomar decisiones de la misma manera que un ser humano. A diferencia de la inteligencia artificial débil, que se enfoca en solucionar tareas específicas, la inteligencia artificial fuerte tiene como objetivo crear una máquina con una capacidad cognitiva general y amplia. Sin embargo, esta idea aún se considera como una meta a largo plazo y es objeto de debate entre los expertos en inteligencia artificial.

José González

student•

Gracias, me ayudo a entender mucho más la clase

Fabio Emilio Buiza Lopez

student•

Gracias por el resumen, es muy buen aporte.

Rodrigo Alles

student•

Enfoque multimodal en IA

El enfoque multimodal en IA se refiere a la combinación de diferentes modalidades de entrada, como imágenes, audio y texto, para resolver problemas complejos que involucran la percepción y comprensión humana. A través de esta combinación de modalidades, se busca emular la capacidad humana de procesar información de diferentes fuentes y modalidades.

La IA multimodal ha demostrado ser efectiva en una variedad de aplicaciones, como la clasificación de imágenes y la comprensión del lenguaje natural en contextos más amplios. Por ejemplo, en lugar de depender exclusivamente del texto, la IA multimodal puede utilizar imágenes y audio para comprender el contexto y la intención detrás de las palabras.

La investigación en este campo ha avanzado en los últimos años, impulsada por la disponibilidad de grandes conjuntos de datos etiquetados y la capacidad de procesamiento mejorada de las computadoras. Además, el enfoque multimodal también está siendo utilizado en el desarrollo de sistemas de inteligencia artificial conversacionales más avanzados, que utilizan múltiples modalidades para comprender y responder a las consultas de los usuarios de manera más efectiva.

El procesamiento de lenguaje natural es una parte crucial de la inteligencia artificial, pero para que una IA pueda cumplir tareas de manera similar a como lo hace un humano, también es necesario que se integren otras áreas de la IA, como la visión artificial y la robótica. La visión artificial, por ejemplo, permite que una IA pueda "ver" el mundo y entender el entorno en el que se encuentra, lo que puede ser esencial para tareas como la navegación y la manipulación de objetos. La robótica, por su parte, puede permitir que una IA interactúe físicamente con el mundo, lo que también es esencial para tareas como la manipulación de objetos y la realización de tareas físicas complejas. En definitiva, para que una IA pueda cumplir tareas de manera similar a como lo haría un humano, se necesitan integrar múltiples áreas de la IA en un enfoque multimodal.

Jhoan Sebastián Lopera Gallego

student•

Gracias!

Eduardo Monzón

student•

Gracias.

Ixcoatl Francisco Pérez

student•

Jhoan Sebastián Lopera Gallego

student•

Gracias por el chart

Juan Esteban Bolívar Ferrer

student•

Interesante, gracias compañero

Elias Garcia

student•

Mejia Juan Sebastian

student•

¿En dónde haces tu apuntes? quedan impresionantes

Juan Carlos Gallardo Corona

student•

en donde haces tus apuntes?

Kamilo Stevan Alomías Correa

student•

¿a qué huele la carne? 🤣

Natalia Michelle Pineda Zorro

student•

La pregunta y las respuestas dadas por ChatGPT están muy buenas: ayudan a entender lo que se dijo en esta clase y, además, a disipar muchos de los miedos que ahorita tienen muchas personas frente a la IA: los programas basados en IA no nos pueden reemplazar porque están diseñados para una tarea (o varias) exclusivamente que no pueden imitar todos nuestros comportamientos biológicos, cognitivos y sensoriales.

Rodrigo Alles

student•

Los modelos de lenguaje en IA

Los modelos de lenguaje son una parte esencial del procesamiento del lenguaje natural en IA. Estos modelos permiten a las máquinas entender el lenguaje humano y procesar la información de manera efectiva.

Los modelos de lenguaje se crean utilizando algoritmos de aprendizaje automático y se entrenan con grandes cantidades de datos de texto. Una vez entrenados, los modelos pueden realizar una variedad de tareas de procesamiento del lenguaje natural, como la traducción automática, el análisis de sentimientos, el resumen de texto y la generación de texto.

Los LLM en IA

Los LLM (por sus siglas en inglés, Language Model Libraries) son bibliotecas de modelos de lenguaje pre-entrenados que se pueden utilizar para realizar diversas tareas de procesamiento del lenguaje natural. Estas bibliotecas permiten a los desarrolladores de software utilizar modelos de lenguaje pre-entrenados en sus aplicaciones sin tener que entrenar sus propios modelos desde cero.

Los LLM se han convertido en una herramienta popular para el procesamiento del lenguaje natural, ya que permiten a los desarrolladores construir aplicaciones más rápidamente y con menos recursos de computación. Algunos ejemplos de LLM incluyen la biblioteca BERT de Google, la biblioteca GPT de OpenAI y la biblioteca ULMFiT de fast ai.

Modelos de lenguaje y LLM en IA

Un modelo de lenguaje es un tipo de modelo estadístico que se utiliza para predecir la probabilidad de una secuencia de palabras en un idioma determinado. Los modelos de lenguaje son una parte importante de la inteligencia artificial y se utilizan en una variedad de aplicaciones, como el reconocimiento de voz, la traducción automática y la generación de texto.

Los modelos de lenguaje se entrenan utilizando grandes cantidades de datos de texto para aprender patrones en el lenguaje y predecir la siguiente palabra en una secuencia de texto. Uno de los enfoques más populares para entrenar modelos de lenguaje son los LLM (Language Models based on Transformers) que utilizan la arquitectura Transformer, que es una técnica de aprendizaje profundo que se enfoca en el procesamiento de lenguaje natural.

Los LLM son capaces de aprender representaciones semánticas complejas de las palabras y las frases, lo que les permite generar texto coherente y relevante. Estos modelos se han utilizado para crear chatbots, asistentes virtuales, sistemas de recomendación de texto y muchas otras aplicaciones de procesamiento de lenguaje natural.

En general, los modelos de lenguaje y los LLM son herramientas poderosas en la inteligencia artificial y se utilizan ampliamente en una variedad de aplicaciones que involucran el procesamiento del lenguaje natural.

MARIA TERESA PANIAGUA RIVERA

student•

Gracias

Daniel Moreno

student•

buenisimo!!

Alejandro Escobar

student•

Que buena clase.

Anderson Eduardo Arévalo Ramírez

student•

Tremenda

Lexx Redds

student•

Hay por ahí en las redes un meme basado en la película Yo Robot, donde el detective Spooner (Will Smith) a quien ponen como un programador, está interrogando a Sonny (el robot) quien representa a las IA. El programador le increpa a la IA: "Tú no eres capaz de crear código por ti mismo, solo copias el de los demás" y la IA le responde: "Y tú sí?". Esto a propósito de lo que comentabas sobre los detractores de las IA, que solo son cotorras estadísticas... Me parece absurdo el argumento, porque de hecho eso hacemos, ese es el proceso de aprendizaje de un humano desde que nace, es un proceso de años y toda esa información que percibimos forma nuestra data, en últimas todo lo hacemos igual que las cotorras estadísticas, la única ventaja es que tenemos una memoria muchísimo más grande. Hace unos año vi también un programa tipo realitiy, donde creo que tomaban a personas destacadas en el medio de el diseño gráfico... Supuestamente unos genios en creatividad, lo máximo... primero los llevaron a dar un paseo por la ciudad (muy casual, supuestamente tipo relax o para integrarse) al regresar al estudio, les hicieron como una primera prueba, debían una imagen, un diseño, no recuerdo los detalles... el hecho es que cada uno hizo su trabajo, obviamente muy bueno y explicaron en detalle su concepto y pues todo genial... pero, luego, tomaron las imágenes y el equipo de producción se puso a revisar las grabaciones del recorrido que habían hecho por la ciudad y todo, todo, lo habían tomado de elementos que habían visto en su recorrido, obviamente al motrarle las escenas a los chicos que estaban participando, también quedaron muy asombrados, porque había sido algo inconsciente... Cuál es entonces aquí el papel de creador? Es "simple", percepción, muchos datos, muchas imágenes, mucha información, que el cerebro toma inconscientemente y luego en ese mismo inconsciente, procesa esa información y genera "ideas creativas"

Eduardo Peña Ramos

student•

Qué pedazo de película es "Yo robot". Y totalmente cierto todo lo que dices de los artistas o diseñadores, en realidad todos se "inspiran" o toman prestadas ideas de los demás o del mundo que tienen a su alrededor.

Juan Carlos Gallardo Corona

student•

🧠🗣Procesamiento de lenguaje natural: PLN

Procesamiento de Lenguaje Natural (PLN) 📚

Rama de la inteligencia artificial
Enfocado en interacción entre computadoras y lenguaje humano
Objetivo: permitir que computadoras entiendan, interpreten y generen lenguaje natural

Test de Turing 🧪

Propuesto por Alan Turing en 1950
Determina si una máquina exhibe comportamiento inteligente equivalente al humano
Realizado mediante conversación en lenguaje natural
Si la persona no distingue entre respuestas de máquina y humano, la máquina pasa el test

Inteligencia Artificial Fuerte 💪

Idea de IA que iguala o supera la inteligencia humana en todas las áreas cognitivas
Máquina capaz de pensar, razonar, aprender y tomar decisiones como un ser humano
Contraste con IA débil (tareas específicas)
Meta a largo plazo y objeto de debate entre expertos en IA

!Untitled

Enfoque Multimodal en IA 🧠🔊📷

El enfoque multimodal en IA busca combinar diferentes modalidades de entrada para resolver problemas complejos, emulando la capacidad humana de procesar información de diversas fuentes y modalidades.

Características del enfoque multimodal en IA 🌟

Combinación de imágenes, audio y texto
Emula la percepción y comprensión humana
Aplicable en clasificación de imágenes y comprensión de lenguaje natural

Avances e investigación en IA multimodal 🔬

Impulsado por grandes conjuntos de datos etiquetados
Mayor capacidad de procesamiento de computadoras
Desarrollo de sistemas de inteligencia artificial conversacionales avanzados

Integración de áreas en IA multimodal 🧩

Procesamiento de lenguaje natural (PLN)
Visión artificial: permite que IA "vea" el mundo y entienda el entorno
Robótica: permite que IA interactúe físicamente con el mundo y realice tareas complejas

La IA multimodal integra múltiples áreas de la inteligencia artificial, permitiendo que una máquina cumpla tareas de manera similar a como lo haría un humano.

Modelos de Lenguaje en IA 💬🤖

Los modelos de lenguaje son esenciales en el procesamiento del lenguaje natural (PLN) en IA y permiten a las máquinas entender y procesar el lenguaje humano.

Creación y entrenamiento de modelos de lenguaje 📚

Utilizan algoritmos de aprendizaje automático
Entrenados con grandes cantidades de datos de texto
Realizan tareas de PLN como traducción automática, análisis de sentimientos, resumen de texto y generación de texto

LLM (Language Model Libraries) en IA 📖

Bibliotecas de modelos de lenguaje pre-entrenados
Facilitan el uso de modelos de lenguaje en aplicaciones
Ejemplos: BERT de Google, GPT de OpenAI, ULMFiT de fast ai

Modelos de lenguaje y LLM en aplicaciones de IA 🌐

Importantes en inteligencia artificial
Utilizados en reconocimiento de voz, traducción automática, generación de texto
Entrenados con grandes cantidades de texto
LLM basados en arquitectura Transformer, enfocados en PLN
Aprenden representaciones semánticas complejas
Aplicaciones: chatbots, asistentes virtuales, sistemas de recomendación de texto

Los modelos de lenguaje y los LLM son herramientas poderosas en IA y se utilizan en diversas aplicaciones relacionadas con el procesamiento del lenguaje natural.

Edgardo Riveros Sepulveda

student•

WOWWW

Ameth Ordoñez Erazo

student•

Que pedazo de clase! Me exploto el cerebro hasta en temas filosóficos 🤯

Diego Felipe Gallo García

student•

El Canal de DOT CSV explica estos temas de manera hermosa, deberían buscarlo en Youtube y twitter

Dennis Fernando Rodriguez Sanz

student•

Ese Carlos es muy bueno en estos temas

Osvaldo Damián Ruiz

student•

amo mucho ese canal

Keny Isaías López Corrales

student•

Reto de clase resuelto:

De las tareas posibles presentadas por Francisco, me centré en las tareas de procesamiento de "extracción de información y resumen de texto". _

Sobre estas, encontré una herramienta de Inteligencia Artificial para hacer resumenes de textos y libros llamada "Parafrasist".

Esta herramienta ofrece las funciones de resúmenes de textos largos, cuenta con una función que ayudará a entender mejor el contenido. Se trata de una composición de sinónimos para aquellos términos complejos del documento, lo que hará más fácil su compresión.
Los resúmenes se pueden personalizar al escoger si se quiere tener una versión del 20% o el 50% del original. Sin embargo, la versión gratuita permite textos de hasta 10.000 caracteres, con un máximo de 15 por día.

Aquí dejo el enlace: https://parafrasist.com/

Ixcoatl Francisco Pérez

student•

Juan R. Vergara M.

student•

Esta es una clase que estoy seguro veré varias veces.

Diego Jurado

student•

Habrá que estar pendiente de las evoluciones!

Jorge Pardo

student•

Me gusto la clase, nunca pensamos que realmente es inteligencia artificial y que es análisis y gestión detallada de datos, entender dicha diferencia es fundamental, para construcción de modelos de IA y algoritmos de gestión de data.

Cristina Córdova

student•

con esta clase me di cuenta que somos una computadora humana tipo cyborg natural.

Ralph Peraza

student•

exacto, la estructura de software se asemeja a la estructura mental.

Benjamin Allen Ramirez Horna

student•

y aun asi creen que una explosion espacial nos creo..

Jorge Francisco Vuelvas Lomeli

student•

Procesamiento de lenguaje natural

¿Qué es el lenguaje?

Sistema de comunicación
Usa símbolos estructurados
Da significado a las cosas

¿Por qué el lenguaje es una evidencia de inteligencia?

El lenguaje existe como representación de todo lo que nos rodea
El lenguaje es la joya de la corona de la cognición
Test de Turing:
- Es una conversación donde un humano no puede diferenciar si habla con un humano o una máquina

¿Qué es el procesamiento de lenguaje natural?

Enseñar a las maquinas a procesar y analizar el lenguaje humano
- Traducir
- Resumir
- Clasificar
- Conversar
- Generar
Tareas posibles (de fáciles a difíciles):
1. Corrección ortográfica
2. Recuperación de información basada en palabras clave
3. Modelado de temas
4. Clasificación de texto
5. Extracción de información
6. Agente conversacional de dominio cerrado
7. Resumen de texto
8. Respuesta a preguntas
9. Maquina traductora
10. Agente conversacional de dominio abierto

¿Qué son los Large Language Models?

Modelo que no pueden resolver problemas de la AGI por sí soloes
Se requiere contexto de otros canales cognitivos (audio, video, los demás sentidos)
Grandes cantidades de información
Haciendo al algoritmo capaz de hacer diversas tareas

¿Se podrá alcanzar la AGI con los LLM?

Detractores señalan que no se puede alcanzar solo con esto, pues solo se tendrían “loros estadísticos”

El lenguaje no existe por sí solo, es un conjunto de canales de cognición que se da a través de los sentidos.

Paolo Joaquin Pinto Perez

student•

Esto del LLM se puede ver mas a profundidad en el paper que se hizo acerca de ChatGPT y su impacto en el Mercado Laboral: Esta en inglés, pero sin duda es muy buena la investigacion

Camilo Andrés Hurtado Erasso

student•

¿ChatGPT no puede inventar? ¿Qué es inventar?

Respuestas dadas por ChatGPT al pedirle que inventara tres palabras en español:

Festiviano: una persona que ama los festivales y las celebraciones.
Aventurosa: una combinación de aventurera y osada, para describir a alguien que se arriesga y explora con valentía.
Nubelar: el acto de convertir en nubes, como cuando el vapor se condensa en el aire y forma nubes en el cielo.

Valentin Testa

student•

cual es la diferencia entre inventar y generar? chat gpt inventa o genera ?

Jeremy Giron Cisneros

student•

Yo considero que la diferencia entre inventar y generar es que cuando inventas algo, produces algo que antes no existía. Cuando generas algo, en este caso palabras, hallas algo que, aunque no tenga significado se pudo hallar debido a información previa. Existe un abecedario, y la combinación de las letras permite hallar palabras conocidas y no conocidas, significativas y no significativas. Es una infinidad de posibilidades.

Cristian David Gonzalez Ramirez

student•

Le agregaría que el lenguaje humano tambien se expresa con los gestos y movimientos corporales, no solamente con texto y audio, son formas de comunicarnos, saludos!

Juan R. Vergara M.

student•

Es muy válido.

Procesamiento del Lenguaje Natural en Inteligencia Artificial

Fundamentos de IA

Fundamentos de la Inteligencia Artificial para Principiantes

Presencia de la Inteligencia Artificial en la Vida Cotidiana

Capacidades y limitaciones de la Inteligencia Artificial

Conceptos Clave de Inteligencia Artificial, Machine Learning y Deep Learning

Conceptos Clave de Data Science y Aprendizaje Automático

Ciclo de Vida de un Proyecto de Machine Learning

Casos de Éxito y Retos en la Inteligencia Artificial

Deep learning: IA a profundidad

Fundamentos y Aplicaciones del Deep Learning

Limitaciones y Cuándo No Usar Deep Learning

Inteligencia artificial aplicada

Visión Artificial: Aplicaciones y Tecnologías Clave