Introducción a Watson Knowledge Studio

Clase 10 de 25 • Curso de Inteligencia Artificial con IBM Watson

Contenido del curso

Aprende a usar Manejo de Lenguaje Natural con Watson

Bases para el curso

Aprende el manejo del lenguaje natural con Watson

Watson Studio: Ciencia de Datos y Más

Integración

Tomar examen

Resumen

Crear un modelo de machine learning personalizado para analizar texto especializado es una de las capacidades más potentes que ofrece IBM Watson. Con Watson Knowledge Studio puedes definir entidades, relaciones y anotaciones propias para dominios específicos como medicina, derecho o atención al cliente, y luego desplegar ese modelo en servicios como NLU o Discovery.

¿Qué es Watson Knowledge Studio y para qué sirve?

Watson Knowledge Studio es una herramienta que permite crear modelos de machine learning o de reglas personalizados que se integran directamente con Natural Language Understanding (NLU) y Discovery [0:08]. A diferencia de los modelos generales, estos modelos están pensados para lenguaje especializado: profesionales de salud, abogados o equipos de soporte técnico que manejan terminología propia de su industria.

Dentro de Knowledge Studio existen tres roles principales que se pueden asignar [0:27]:

Administrador: gestiona el proyecto completo.
Project Manager: coordina tareas de anotación.
Human Annotator: persona encargada de entrenar las entidades y relaciones del modelo.

¿Qué es el type system y cómo se configura?

El type system es la estructura que controla cómo puede ser anotado el contenido [0:46]. Define las entidades y relaciones que el modelo reconocerá. Puedes crearlo desde cero o importar un type system preentrenado según la industria en la que trabajes. En el ejemplo práctico se importa un archivo previamente creado con entidades como nombre, día de nacimiento, dirección, mail, hotel, número de identificación, día de ingreso y número de teléfono [4:30].

¿Cuál es la diferencia entre mención, entidad y relación?

Estos tres elementos son fundamentales para comprender el entrenamiento [1:26]:

Mención: cualquier texto relevante dentro del dominio específico.
Tipo de entidad: categoría asignada a objetos del mundo real (por ejemplo, "mail").
Entidad: una mención a la que se le asigna un tipo de entidad. Por ejemplo, i.carrada@ibm.com es una mención que se convierte en entidad cuando se clasifica como mail [2:03].
Relación: vínculo entre dos entidades que aparecen en la misma oración. Por ejemplo, "Isaac Carrada" tiene una relación con su correo electrónico [2:18].

¿Cómo se crea el modelo paso a paso en la nube de IBM?

El proceso comienza creando el servicio de Knowledge Studio desde IBM Cloud [2:55]. Se selecciona la región Dallas, el plan gratuito permite hasta cinco workspaces y cinco gigabytes de almacenamiento. Después de instanciar el servicio, se lanza la interfaz gráfica con el botón Launch Watson Knowledge Studio [3:22].

El primer paso dentro de la herramienta es crear un workspace con un nombre representativo y seleccionar el idioma, en este caso español [3:40]. Luego se importa el type system con las entidades predefinidas usando la opción upload [4:08].

Para añadir entidades nuevas, basta con escribir el nombre y guardar. Por ejemplo, se puede agregar la entidad "destino" directamente desde la interfaz [5:08]. Las relaciones se crean vinculando dos entidades: la relación "viajo" conecta la entidad "nombre" con la entidad "destino" [5:30].

¿Cómo se suben y anotan los documentos de entrenamiento?

Antes de entrenar el modelo se necesitan documentos de texto que servirán como datos de entrenamiento. Estos se suben desde la sección Assets > Documents en formatos como TXT [6:10]. Una vez cargados, se les puede asignar un nombre descriptivo.

La anotación puede hacerse de dos formas [7:55]:

Pre-anotación automática: se utiliza un diccionario previamente creado o el propio servicio NLU para mapear equivalencias. Por ejemplo, la entidad "destino" puede mapearse a la categoría location de NLU [7:10].
Anotación manual: un human annotator, generalmente un lingüista o experto en el dominio, selecciona fragmentos de texto y los asigna a la entidad correspondiente [8:25].

El proceso de anotación manual es simple: se abre cada documento, se selecciona el texto relevante y se le asigna el tipo de entidad correcto. Por ejemplo, "Oscar" se marca como nombre, una dirección de correo se marca como mail, y una fecha se clasifica como día de nacimiento [9:30]. Este proceso se repite en todos los documentos del set.

Una vez completada la anotación, se cambia el estado del task a completed [10:45]. Con las anotaciones finalizadas, el siguiente paso es entrenar el modelo y desplegarlo a través de NLU o Discovery para consumirlo en aplicaciones reales.

¿Cómo se organiza el trabajo de anotación en equipo?

Knowledge Studio permite crear annotation tasks donde se asigna un conjunto de documentos a un anotador específico, se define un deadline y se genera un set de anotaciones con nombre propio [8:40]. El administrador puede redistribuir responsabilidades entre anotadores según sea necesario. El anotador accede a sus tareas pendientes desde la sección de annotation tasks y marca cada documento como completado al terminar.

Si estás trabajando con dominios especializados y los modelos generales no capturan la terminología de tu industria, Watson Knowledge Studio es la solución para crear ese nivel de personalización. ¿Ya tienes un caso de uso en mente? Comparte tu experiencia en los comentarios.

Comentarios

Jimmy Buriticá Londoño

student•

Knowledge Studio permite enseñar a Watson el lenguaje de su dominio con modelos de aprendizaje automático personalizados que identifican entidades y relaciones exclusivas de su sector en texto no estructurado.

William Condori

student•

Gracias por el aporte😁

Nicolas Enrique Duque Aguirre

student•

Hay pequeños cambios a hoy 18/07/20, las preanotations ya no cuentan con esas opciones manuales, y para las anotaciones ya no se da click en open sino en el propio nombre del archivo, ademas al dar guardar no se vuelve al set, sino que se queda dentro del documento al menos para mi.

Ana Luisa Tapia Ramos

student•

Tendrás imagen de como hacer esta parte ?

Edwin Jorge Arroyo

student•

Knowledge Studio es un servicio de inteligencia artificial que ofrece IBM Watson para crear modelos de machine learning que entiendan las distintas matices, significados, y relaciones específicas de la industria en la cual planeamos crear un modelo basado en reglas que encuentren entidades in documentos con base a las reglas que le planteemos. Knowledge permite crear un modelo de machine learning o reglas personalizadas para nuestro Natrual Language Understanding (NLU) y/o Discovery.

Usuario anónimo

user•

En pre-anotaciones ya no están las pestañas Dictionaries ni Natural Language Understanding

Mario Alberto Vásquez Arias

student•

Estas clases están muy bien explicadas!

Guillermo Parejo

student•

Excelente Clase

Juan Guillermo Castrillón Serna

student•

buen día al intentar entrar al knowledge studio me saca este mensaje en el navegador: "Authorize Redirect ratelimit" alguien sabe q puedo hacer?

Isaac Carrada

teacher•

Hola!

A veces surgen problemas con el Oauth 2. Generalmente funciona con que borres tus cookies relacionadas con IBM Cloud o utilices una ventana "incognito"

Saludos y feliz aprendizaje!

cualquier otra duda dejala en los comentarios o si prefieres con mucho gusto me puedes contactar en mis redes: @elbuenizzy

Sergio Rubiano

student•

Me esta pasando lo mismo, cambie de navegador, borre las cookies y a un aparece "Authorize Redirect ratelimit"

Matias Jesus Ruiz Ruiz

student•

Hola, el archivo json no esta en los archivos del curso. saludos

JuanFe Peralta

Team Platzi•

¡Hola! Muchas gracias por comentarnos esto, ya lo reporté para que el archivo esté en la clase lo más pronto posible, y puedas continuar con tus clases. :D

Edwin Jorge Arroyo

student•

Vengo del futuro.

Gracias por reportarlo jeje

Osvaldo Trejo

student•

Que buena explicación!

Edgar Alejandro España Amaya

student•

Muy buena explicación de parte de Isaac. Excelente.

Juan Valentin Perdomo Bonilla

student•

Podria haber una actualizacion del curso ,o no es relevante las pre-annotation

JOHN GERMAN GARCIA GONZALEZ

student•

Uno debe seleccionar en el texto la informacion que se va tomar?? eso no lo debería hacer la aplicación ??

Hugo Montoya Diaz

student•

Mitchel Salazar

student•

Wow

Jhon Jaiver Supelano Rojas

student•

completada las anotaciones

Jaziel Flores

student•

Vamo a embellecerlo

{
  &quot;entityTypes&quot;: [
    {
      &quot;id&quot;: &quot;c0219737-4254-4a6d-a48d-6e76eb0c5ce6&quot;,
      &quot;label&quot;: &quot;Nombre&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;c0219737-4254-4a6d-a48d-6e76eb0c5ce6&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569310734,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;f010d990-478a-456b-9e16-b695c4946355&quot;,
      &quot;label&quot;: &quot;Dia_de_nacimiento&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;f010d990-478a-456b-9e16-b695c4946355&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569300038,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;b5b28a54-3877-4f43-9315-b8bb92c7af9a&quot;,
      &quot;label&quot;: &quot;Direccion&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;b5b28a54-3877-4f43-9315-b8bb92c7af9a&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569285059,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;571930ad-c8ba-454d-a268-b90d3a98b57b&quot;,
      &quot;label&quot;: &quot;Mail&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;571930ad-c8ba-454d-a268-b90d3a98b57b&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569270002,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;3f713657-8bb6-4906-a598-ea45ffd3bb71&quot;,
      &quot;label&quot;: &quot;Hotel&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;3f713657-8bb6-4906-a598-ea45ffd3bb71&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569235559,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;6b1f11be-7eac-44b6-9e75-a06c566ececd&quot;,
      &quot;label&quot;: &quot;ID_numero&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;6b1f11be-7eac-44b6-9e75-a06c566ececd&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569225639,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;c8c2ffa5-b332-4954-9a3b-fa7d09145e08&quot;,
      &quot;label&quot;: &quot;Dia_de_ingreso&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;c8c2ffa5-b332-4954-9a3b-fa7d09145e08&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569210580,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    },
    {
      &quot;id&quot;: &quot;49a777b6-2b71-4c79-8bf1-51d6e358fd5a&quot;,
      &quot;label&quot;: &quot;No_telefono&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: [
          &quot;49a777b6-2b71-4c79-8bf1-51d6e358fd5a&quot;
        ],
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569188307,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    }
  ],
  &quot;relationshipTypes&quot;: [],
  &quot;sireInfo&quot;: {
    &quot;entityProp&quot;: {
      &quot;mentionType&quot;: [
        {
          &quot;color&quot;: &quot;white&quot;,
          &quot;hotkey&quot;: &quot;1&quot;,
          &quot;backGroundColor&quot;: &quot;#AA00FF&quot;,
          &quot;name&quot;: &quot;NAM&quot;
        },
        {
          &quot;color&quot;: &quot;black&quot;,
          &quot;hotkey&quot;: &quot;2&quot;,
          &quot;backGroundColor&quot;: &quot;#00FF7F&quot;,
          &quot;name&quot;: &quot;NOM&quot;
        },
        {
          &quot;color&quot;: &quot;black&quot;,
          &quot;hotkey&quot;: &quot;3&quot;,
          &quot;backGroundColor&quot;: &quot;#AAFFFF&quot;,
          &quot;name&quot;: &quot;PRO&quot;
        },
        {
          &quot;color&quot;: &quot;white&quot;,
          &quot;hotkey&quot;: &quot;4&quot;,
          &quot;backGroundColor&quot;: &quot;gray&quot;,
          &quot;name&quot;: &quot;NONE&quot;
        }
      ],
      &quot;subtypes&quot;: null,
      &quot;roles&quot;: null,
      &quot;clazz&quot;: [
        {
          &quot;color&quot;: &quot;#A5A5A5&quot;,
          &quot;hotkey&quot;: &quot;3&quot;,
          &quot;backGroundColor&quot;: &quot;white&quot;,
          &quot;name&quot;: &quot;SPC&quot;
        },
        {
          &quot;color&quot;: &quot;black&quot;,
          &quot;hotkey&quot;: &quot;2&quot;,
          &quot;backGroundColor&quot;: &quot;#00FF7F&quot;,
          &quot;name&quot;: &quot;NEG&quot;
        },
        {
          &quot;color&quot;: &quot;black&quot;,
          &quot;hotkey&quot;: &quot;1&quot;,
          &quot;backGroundColor&quot;: &quot;#AAFFFF&quot;,
          &quot;name&quot;: &quot;GEN&quot;
        }
      ],
      &quot;color&quot;: null,
      &quot;hotkey&quot;: null,
      &quot;backGroundColor&quot;: null,
      &quot;active&quot;: true,
      &quot;roleOnly&quot;: false
    },
    &quot;relationProp&quot;: null
  },
  &quot;functionalEntityTypes&quot;: [
    {
      &quot;id&quot;: &quot;CATCH_ALL_ENTITY_ID&quot;,
      &quot;label&quot;: &quot;*&quot;,
      &quot;sireProp&quot;: {
        &quot;mentionType&quot;: null,
        &quot;subtypes&quot;: null,
        &quot;roles&quot;: null,
        &quot;clazz&quot;: null,
        &quot;color&quot;: null,
        &quot;hotkey&quot;: null,
        &quot;backGroundColor&quot;: null,
        &quot;active&quot;: true,
        &quot;roleOnly&quot;: false
      },
      &quot;creationDate&quot;: 1559569138593,
      &quot;source&quot;: null,
      &quot;modifiedDate&quot;: 0,
      &quot;typeType&quot;: null,
      &quot;typeClass&quot;: null,
      &quot;typeVersion&quot;: null,
      &quot;typeDesc&quot;: null,
      &quot;typeSuperType&quot;: null,
      &quot;typeSuperTypeId&quot;: null,
      &quot;typeCreateDate&quot;: null,
      &quot;typeUpdateDate&quot;: null,
      &quot;typeProvenance&quot;: null,
      &quot;alchemyAPITypes&quot;: null,
      &quot;nluAPITypes&quot;: null
    }
  ],
  &quot;pid&quot;: &quot;700d1a00-1b4d-11ea-8afa-8365c61bc0e2&quot;,
  &quot;modified_date&quot;: 1575984707885,
  &quot;kgimported&quot;: false
}

Kevin Naranjo

student•

una gran herramienta

Usuario anónimo

user•

Mucho por explorar.

Nestor Antonio Pineda Otero

student•

Me parece una forma muy fácil de hacer las cosas.

Usuario anónimo

user•

En el apartado de Machine Learning Model en la pestaña de Pre-annotations ya no esta esa pestaña que muestra el profe, aparecen otras cosas y con un orden. Al parecer se automatiza con la información que ya tenemos.

Introducción a Watson Knowledge Studio

Aprende a usar Manejo de Lenguaje Natural con Watson

Bases para el curso

Introducción de Watson

Configuración del entorno de trabajo

Instalar cURL en Windows

Arquitectura REST

Aprende el manejo del lenguaje natural con Watson

Uso de Watson Personality Insights via CURL

Uso de Watson Personality Insights via SDK

Watson Natural Language Classifier

Watson Natural Language Understanding

Discovery