Detección de Idiomas con Servicios Cognitivos Azure

Clase 8 de 27Curso de Azure Cognitive Services

Resumen

¿Para qué sirve la detección y traducción de textos?

La detección y traducción de textos es un servicio crucial para identificar el idioma de un texto analizado. Esto resulta esencial si te enfrentas a documentos en idiomas desconocidos. Al detectar el idioma, se permite la integración con otros servicios cognitivos que pueden requerir esta información para funcionar correctamente. Imagina que tienes que sintetizar texto a voz; necesitas saber en qué idioma está el texto para configurarlo adecuadamente. Así, este servicio es imprescindible en tales escenarios.

¿Cómo se prepara y se envía la petición?

En los servicios cognitivos, las solicitudes se preparan utilizando archivos JSON. La estructura de la petición debe incluir una serie de documentos identificados por ID; cada ID puede representar un texto en un idioma diferente o una combinación de idiomas. Es esencial recordar que el tamaño total del documento no debe superar los 5,120 caracteres.

Puedes realizar la prueba tanto en la consola de servicios cognitivos como en herramientas como PostMan o Curl. Debes enviar una petición POST al endpoint de servicios cognitivos, especificando la clave de suscripción en el encabezado y el archivo JSON en el cuerpo de la petición.

¿Cómo visualizar los resultados del análisis?

Una vez que envías la petición al servicio cognitivo, recibirás una respuesta para cada ID incluido. Esta respuesta detalla el idioma detectado, el porcentaje de confianza en la detección y posibles variantes culturales. Además, si hay alguna advertencia, el servicio también la indicará. No obstante, ten en cuenta que este tipo de servicios no guardan información de estado; es decir, cada vez que envíes la misma petición, obtendrás la misma respuesta. Por ello, se recomienda almacenar y usar directamente las respuestas en la lógica de la aplicación.

¿Cómo influye la combinación de idiomas en los resultados?

La detección de idiomas puede verse afectada cuando se combinan múltiples idiomas en una sola petición. El servicio puede identificar predominantemente un idioma, pero el nivel de confianza puede disminuir. Por ejemplo, si partes de un texto son en inglés y otras en español, la respuesta probablemente indique un idioma con menor nivel de confianza. Esto destaca la importancia de tener cuidado al mezclar idiomas en un solo texto al usar el servicio de detección.

Prueba práctica en la consola de servicios cognitivos

Para realizar una prueba práctica, sigue estos pasos:

  1. Selecciona el servicio cognitivo de detección de idiomas en la versión 3.1 de la API.
  2. Asegúrate de utilizar la región adecuada donde el servicio está desplegado (por ejemplo, WestUS).
  3. Obtén la clave de suscripción desde el portal de Azure en keys and endpoints.
  4. Prepara el JSON de solicitud con los textos que desees analizar, cada uno con un ID distinto.
  5. Envía la petición y observa la respuesta, donde se indicará el idioma detectado y el nivel de confianza.

Ejemplo de código JSON

{
  "documents": [
    {
      "id": "1",
      "text": "Hello, I'm testing a new cognitivo service to detect languages."
    },
    {
      "id": "2",
      "text": "Hola, estoy aprendiendo a utilizar un nuevo servicio cognitivo para detectar el idioma de un texto."
    }
  ]
}

Esta herramienta no solo permite detectar idiomas, sino que también abre puertas a amplias aplicaciones en reconocimiento y procesamiento de texto a nivel cognitivo. ¡Anímate a explorarlo y sacar el máximo partido a esta tecnología!