Watson Natural Language Classifier

Clase 7 de 25 • Curso de Inteligencia Artificial con IBM Watson

Contenido del curso

Aprende a usar Manejo de Lenguaje Natural con Watson

Bases para el curso

Aprende el manejo del lenguaje natural con Watson

Watson Studio: Ciencia de Datos y Más

Integración

Tomar examen

Resumen

Automatizar la clasificación de textos cortos es una tarea fundamental cuando manejas comentarios, consultas o contenido generado por usuarios. Con Natural Language Classifier (NLC) de IBM Watson, es posible entrenar un modelo de inteligencia artificial que asigne categorías a textos de forma precisa, sin necesidad de conocer los algoritmos internos que operan como una caja negra [0:06].

¿Cómo funciona la clasificación supervisada de textos?

El servicio se basa en un enfoque de aprendizaje automático supervisado. Esto significa que un humano debe etiquetar previamente cada texto con la clase correspondiente antes de entrenar el modelo. En el ejemplo práctico utilizado, se ofrece un servicio de hospedaje alternativo: una persona alquila un cuarto de su casa a visitantes [0:22].

Los comentarios recibidos pueden hablar de dos temas distintos:

Ubicación: "está cerca del metro", "me queda cerca del transporte".
Servicio: "personas muy atentas", "servicio inmejorable".

Cada texto se asocia manualmente con su clase, y luego se entrena un modelo que replica esa clasificación de manera automática [0:48].

¿Qué pasos se siguen para preparar y entrenar el clasificador?

El proceso se divide en cuatro etapas claras [1:08]:

Preparar los datos de entrenamiento: identificar las clases, reunir los textos y asignar una clase a cada uno en una hoja de cálculo. La columna izquierda contiene los textos y la derecha la clase correspondiente.
Crear y entrenar el clasificador: se utiliza el API mediante cURL para enviar los datos de entrenamiento.
Consumir el clasificador: una vez entrenado, se envían textos nuevos para obtener su clasificación.
Evaluar y actualizar: los primeros entrenamientos rara vez son perfectos, por lo que conviene iterar y mejorar los datos [2:16].

Un detalle importante: por la codificación utilizada, no se pueden usar caracteres como Ñ ni acentos en los datos de entrenamiento [1:38].

¿Cuáles son los límites y consideraciones del servicio?

Antes de comenzar a trabajar, es necesario tener en cuenta varias restricciones [3:00]:

Cada frase de texto debe tener un máximo de sesenta palabras.
Se requieren entre cinco y diez frases mínimo por clase para un entrenamiento adecuado.
Cada instancia del servicio soporta hasta ocho clasificadores.
Se pueden clasificar hasta treinta frases en una sola solicitud.
En la capa gratuita (light), se obtiene un clasificador gratis por mes.

¿Cómo se entrena y consume el clasificador paso a paso?

Todo comienza en cloud.ibm.com, buscando el servicio Natural Language Classifier en el catálogo dentro de la sección de AI [3:36]. Al crearlo, se generan las credenciales del servicio, que incluyen un API key necesario para autenticar las peticiones.

El archivo de entrenamiento es un CSV sencillo con ejemplos de cada clase. Para el caso de hospedaje alternativo, el lado izquierdo tiene frases sobre ubicación y servicio, y el derecho indica la categoría [4:52].

El comando cURL para entrenar requiere tres elementos clave:

El API key obtenido de las credenciales.
El idioma de los textos (en este caso, español).
La URL del servicio.

Al ejecutar el entrenamiento, el servicio responde con un classifier ID y un status que indica que el modelo se sigue entrenando [5:30]. Para consultar el estado, se usa otro cURL con el mismo API key y el ID del clasificador, hasta que el status cambie a disponible [6:06].

¿Qué resultados entrega el clasificador entrenado?

Una vez disponible, se envía un texto nuevo mediante cURL. Por ejemplo, al enviar "son personas cálidas, amables y atentas", el servicio responde con la clase servicio con un 94% de certeza [6:50]. Al probar con "está cerca del metro", clasifica como ubicación con un 99% de certeza [7:18].

El resultado incluye la probabilidad de cada clase, lo que permite evaluar qué tan seguro está el modelo de su predicción.

¿Qué casos de uso puedes implementar con este servicio?

Más allá del hospedaje alternativo, las aplicaciones son variadas [2:28]:

Clasificar textos legales según su categoría.
Analizar currículums para asignar áreas temáticas.
Categorizar consultas de servicios tipo preguntas frecuentes.
Organizar publicaciones en redes sociales por tema.
Clasificar ofertas de productos por tipo.

En la práctica, podrías conectar tu página web al clasificador para que cada comentario recibido se categorice automáticamente y así priorizar la atención según tus necesidades [7:36]. También funciona a la inversa: clasificar contenido propio, como entradas de un blog, para que los usuarios accedan a categorías organizadas de forma inteligente [7:55].

Si quieres profundizar aún más en el análisis de textos, la herramienta complementaria es Natural Language Understanding, que permite extraer información más detallada de los contenidos escritos. ¿Ya tienes en mente un caso de uso para clasificar tus propios textos? Comparte tu idea en los comentarios.

Comentarios

Usuario anónimo

user•

Les comparto mi articulo de plataformas de procesamiento de lenguaje natural. https://medium.com/@monica.echeverrt/las-4-mejores-plataformas-de-procesamiento-de-lenguaje-natural-3657002341a7

William Schnaider Torres Bermon

student•

Muy bueno, gracias por el aporte.

Robinson Sotelo Ordoñez

student•

buen aporte, gracias.

Daniel Fernando Murcia Perdomo

student•

Voy a resumir un poco de los problemas más comunes que presenté con su solución:

No tenía tarjeta de credito para ponerla en la plataforma. (SOLUCION) Me abrí en 5 minutos una cuenta en daviplata recargue 3 mil pesos a la cuenta y me hice una tarjeta de credito virtual. No me van a quitar los 3 mil pesos solamente es para que ellos verifiquen que tengo saldo. La tarjeta la saco con daviplata porque en nequi cobran. El proceso de verificación dura máximo como 30 minutos y al final te mandan un correo de que el proceso ha sido exitoso (si revisas tu facturación todo va a estar en 0 tranquilos)
No podía crear la instancia de natural language classifier. (SOLUCION) Edite los parametros como los "service endpoints" y le cambie el nombre al servicio y ya el boton de crear se habia habilitado.
Con los codigos para los que trabajamos en windows recuerden siempre editar el "/" por un " ^ " y el codigo les tiene que quedar de dos filas para que les funcione curl -G -u "apikey:" ^ "/v1/classifiers/{classifier_id}/classify" ^ --data-urlencode "text=Donde quedan las oficinas de platzi?"

Nelson Andrés Loyola Salas

student•

En el segundo punto yo le agregaría que el "services endpoints" yo lo puse a público ya que de forma privada ejecutando el script me marca el error "curl: (7) Failed to connect to ... port 443: Timed out"

Juan Fernando Marin Rivera

student•

Muchas gracias, Si es verdad si lo colocas privado, no funciona, debe ser publico.

Nicolas Enrique Duque Aguirre

student•

Buena clase, ciertamente mas sencilla que la anterior al menos para un usuario principiante como yo, te dejo algunos consejos utiles:

Necesitas vincular una tarjeta de credito en ibm Watson para acceder a este servicios, sino tienes algunos compañeros mencionan que se puede usar e-card de bancolombia si estas en colombia o nequi (tambien para colombia), sin TC, no se puede usar el servicio.
Si eres usuario de windows (como yo) y no tienes alguna libreria en la que cURL reconozca los , recuerda cambiarlos por ^ para no generar errores.
Te recomiendo hacer esta clase con buen tiempo disponible, ya que el entrenamiento del servicio dura hora y media, o al menos ese fue mi caso.
Una vez entrenado el servicio. vas a usar las lineas

curl -G -u "apikey:{apikey}"
"{url}/v1/classifiers/{classifier_id}/classify" \ --data-urlencode "text=How hot will it be today?"

cuando se copian se copian como 3 lineas pero en terminal (caso windows, los otros no se) deben ser 2 lineas asi:

curl -G -u "apikey:{apikey}"
"{url}/v1/classifiers/{classifier_id}/classify" \ --data-urlencode "text=How hot will it be today?"

debes cambiar apikey, url, classifier_id, talvez los \ por ^ y el texto que quieras clasificar, esta solucion la menciono el compañero Duván Andrés Villa Martínez a quien le doy el credito

Jimmy Buriticá Londoño

student•

El servicio Natural Language Classifier utiliza técnicas avanzadas de procesamiento del lenguaje natural y de aprendizaje de máquina para asignar categorías personalizadas a texto de entrada.

Guillermo Parejo

student•

Super chevera la clase, barro no tener T.C. para pagar la suscripcion en IBM

Jaziel Flores

student•

Rashos, no tengo disponible en lite, ojalá después no haya problema con eso

Daniel Felipe Naranjo Cruz

student•

Muy buena la herramienta, la explicaciòn y los casos de uso es un plus que no había logrado identificar en otros cursos, que de hecho creo que puede ser una opción de mejora para los cursos que no tienen este tipo de ejemplos aplicación a la vida real.

Nota: con la velocidad de Isaac para hablar y explicar (no es crítica, es un comentario) he tenido que repasar los videos más de lo normal con el resto de cursos. Pero vale la pena por el contenido y lo que enseña.

Muchas gracias.

Nestor Antonio Pineda Otero

student•

Bájale la velocidad a la reproducción de los videos. 0.85x

Jaziel Flores

student•

Caja negra :c

Fabio Rueda García

student•

Al ejecutar el código en terminal de Windows 10

curl -i -u "apikey:xxxxxxxxxxxxx" ^
-F training_data=@data_train.csv ^
-F training_metadata="{\"language\":\"es\",\"name\":\"TutorialClassifier\"}" ^
"https://api.us-south.natural-language-classifier.watson.cloud.ibm.com/instances/xxxxxxx/v1/classifiers"

Arroja el siguiente error: HTTP/1.1 100 Continue X-EdgeConnect-MidMile-RTT: 77 X-EdgeConnect-Origin-MEX-Latency: 669

HTTP/1.1 500 Internal Server Error Server: AkamaiGHost Mime-Version: 1.0 Content-Type: text/html Content-Length: 176 Expires: Mon, 31 Aug 2020 15:42:30 GMT Date: Mon, 31 Aug 2020 15:42:30 GMT Connection: close

<HTML><HEAD><TITLE>Error</TITLE></HEAD><BODY> An error occurred while processing your request.<p> Reference #179.c65ff8be.1598888550.bd8b3fe </BODY></HTML>

Jesus Romero Palacio

student•

Me sucede el mismo error pero en MAC, ¿alguien sabe a qué se debe?

Nelson Andrés Loyola Salas

student•

Este es script de curl:

curl -i -u "apikey:API_KEY" ^
-F training_data=@data_train.csv ^
-F training_metadata="{\"language\":\"es\",\"name\":\"TutorialClassifier\"}" ^
"URL/v1/classifiers"

Yo solucioné este mismo error rectificando la API_KEY que estaba mal escrita.

Sandra Liliana Delgado Gómez

student•

Esas consultas de consumo podrían realizarse de manera masiva, es decir tengo un volumen de datos grandes para procesar luego de entrenado el modelo, se puede hacer mediante un csv u otro formato y si es así como sería el código para procesar?

Daniel Andrés Peñuela González

student•

Buenas tardes. Tengo el siguiente error en Curl luego de crear el servicio:

curl: (7) Failed to connect to api.private.us-south.natural-language-classifier.watson.cloud.ibm.com port 443: Timed out

Dilan Santiago Ariza Cañon

student•

El error se debe al tiempo que se quedo esperando la petición, revisa tu acceso o tu conexión a internet y tu latencia.

Nelson Andrés Loyola Salas

student•

Yo tuve el mismo problema, lo solucioné borrando el servicio y volviéndolo a crear pero esta vez en "Service endpoints" seleccioné "public network"

Rafael Vilches

student•

Ya no existe 😥

Josue Caycho Bardalez

student•

Adrian Huamani Ccallo

student•

Este plan no está disponible con su tipo de cuenta actual.

Actualice a una cuenta Pago según uso y reciba un crédito de $200.

Luis Antonio Hernandez Barragán

student•

Tengo el mismo problema T_T

Juliana Quiroz Upegui

student•

Natural Language Classifier is not available with your current account type. Upgrade your account to get started. :/

Juan Camilo Ortiz Villegas

student•

Recuerden para los que utilizan windows, poner el caracter ^ y no el \

al final el curl queda de la siguiente forma

curl -i -u "apikey:BS......................................" ^
-F training_data=@data_train.csv ^
-F training_metadata="{\"language\":\"es\",\"name\":\"TutorialClassifier\"}" ^
"https://api.us-south.natural-language-classifier.watson.cloud.ibm.com/instances/dxxxxxxxxxxx/v1/classifiers"

Martha Nelly Arango Villa

student•

Ami me genera el mismo error y no lo he podido resolver: C:\Watson\PersonalityInsig>curl -i -u "apikey:Uay9GsnuNdHadoZCIfdxXCtKVEu4BUDtZseMhZtWVP-n" ^ ¿Más? -F training_data=@data_train.csv ^ ¿Más? -F training_metadata="{"language":"es","name":"TutorialClassifier"}" ^ ¿Más? "https://api.us-south.natural-language-classifier.watson.cloud.ibm.com/instances/09a5cf73-5cbe-4d8a-a016-a9e81c715539/v1/classifiers" HTTP/1.1 100 Continue X-EdgeConnect-MidMile-RTT: 63 X-EdgeConnect-Origin-MEX-Latency: 1292

HTTP/1.1 500 Internal Server Error Server: AkamaiGHost Mime-Version: 1.0 Content-Type: text/html Content-Length: 175 Expires: Thu, 15 Oct 2020 14:06:23 GMT X-Reference-Error: 179.7daa4b68.1602770783.e18504 Date: Thu, 15 Oct 2020 14:06:23 GMT Connection: close

<HTML><HEAD><TITLE>Error</TITLE></HEAD><BODY> An error occurred while processing your request.<p> Reference #179.7daa4b68.1602770783.e18504 </BODY></HTML>

Agradezco apoyo con el tema

Luis David Arias Manjarrez

student•

A los que no les funciona la tarjeta e-prepago de bancolombia intenten recargarle 1 dolar de saldo, hay varios servicios que consultan que tengas el dinero para poder validarla (Eso no significa que lo vayas a perder). Lo acabo de hacer así y me funcionó.

David Jaramillo Saldarriaga

student•

¿En qué parte se puede configurar la codificación para usar este servicio completamente en español?

Nestor Antonio Pineda Otero

student•

Se encuentra en español en el script del curl. Parámetros de lenguaje.

William Schnaider Torres Bermon

student•

Mediante el parametro language.

Denis Goriz

student•

Cuando estaran disponible las clases que actualizan este curso?? y esta clase particular? Gracias

Roger Carlos Ariel Alba

student•

Hola!

Por lo menos en Marzo aún no. Pero puedes estar pendiente de la Agenda.

JuanFe Peralta

Team Platzi•

¡Hola! Este curso ya fue estrenado ¿No puedes verlo? ¿Te sale algún error? Quedo pendiente de tu respuesta. :)

CESAR RICARDO GUERRA ARNAIZ

student•

Tengo una duda con respecto al archivo .csv, este en si dentro tiene la columna de texto y la otra es para Ubicación/Sevicio, esa designación de: Ubicación/Sevicio que se carga inicialmente siempre será de ese tipo o es solo por fines del ejemplo. Que otro escenario se podría cargar. Gracias.

Jhon Jaiver Supelano Rojas

student•

¿Alguien sabe si existe algo similar de Natural Language Classifier que realice esto mismo pero que pueda implementar en maquinas propias con llamadas a la API ilimitadas?

Kevin Fiorentino

student•

Podés programarlo vos mismo el modelo, en Python o R. Se necesita de un nivel de conocimiento básico como para tener un modelo que te sirva para tu necesidad. Si hablás de algún otro servicio, sea de IBM o no, que haga lo mismo totalmente gratis, lo dudo..

curl -i -u "apikey:xxxxxxxxxxxxx" ^
-F training_data=@data_train.csv ^
-F training_metadata="{\"language\":\"es\",\"name\":\"TutorialClassifier\"}" ^
"https://api.us-south.natural-language-classifier.watson.cloud.ibm.com/instances/xxxxxxx/v1/classifiers"

curl -i -u "apikey:BS......................................" ^
-F training_data=@data_train.csv ^
-F training_metadata="{\"language\":\"es\",\"name\":\"TutorialClassifier\"}" ^
"https://api.us-south.natural-language-classifier.watson.cloud.ibm.com/instances/dxxxxxxxxxxx/v1/classifiers"

Watson Natural Language Classifier

Aprende a usar Manejo de Lenguaje Natural con Watson

Bases para el curso

Introducción de Watson

Configuración del entorno de trabajo

Instalar cURL en Windows

Arquitectura REST

Aprende el manejo del lenguaje natural con Watson

Uso de Watson Personality Insights via CURL

Uso de Watson Personality Insights via SDK