Configuración de Ambiente para Servicios Cognitivos en Azure

Clase 3 de 27Curso de Azure Cognitive Services

Contenido del curso

Resumen

Preparar el ambiente de desarrollo para trabajar con Azure Cognitive Services es el primer paso para construir aplicaciones que integren inteligencia artificial. Aquí se explica cómo crear el recurso en el portal de Azure, obtener las llaves de suscripción y poner en marcha la aplicación Intelligent Kiosk, que implementa múltiples servicios cognitivos en una sola solución.

¿Qué requisitos necesitas para comenzar con Cognitive Services?

Antes de tocar código, es fundamental contar con los siguientes elementos:

  • Una suscripción a Azure válida.
  • Visual Studio 2017 o superior.
  • Windows 10 versión 2004 o superior, ya que la aplicación es de tipo Universal Windows Platform (UWP).
  • El repositorio del curso clonado desde github.com/luisruval/cognitive-services, específicamente la rama uno correspondiente al setup del ambiente.

La razón por la que se requiere Windows 10 con una versión específica es que las aplicaciones UWP dependen de APIs del sistema operativo que varían entre compilaciones. Al verificar tu versión con el comando ver en el símbolo del sistema [06:40], puedes confirmar que tu equipo es compatible.

¿Cómo crear el servicio cognitivo en el portal de Azure?

Desde portal.azure.com se crea un nuevo recurso buscando Cognitive Services [02:15]. Durante la configuración hay varios campos importantes:

  • Suscripción: selecciona la correcta si tienes múltiples suscripciones.
  • Grupo de recursos: se recomienda crear uno nuevo dedicado al curso para facilitar su eliminación posterior.
  • Ubicación: determina la latencia que experimentará el usuario final.
  • Pricing tier: se selecciona el nivel estándar S0.

La latencia es un concepto clave cuando trabajas en la nube. Una latencia más baja significa una mejor experiencia para el cliente final. Para identificar la región óptima, se recomienda usar el sitio azurespeed.com [03:05], donde puedes ejecutar pruebas contra distintos centros de datos. Por ejemplo, desde México las pruebas pueden mostrar que West US ofrece la menor latencia entre las opciones disponibles.

¿Qué son las llaves de suscripción y por qué importan?

Una vez creado el recurso, necesitas tres datos fundamentales para consumir cualquier servicio cognitivo [05:15]:

  • El endpoint del servicio.
  • La ubicación (región) donde fue desplegado.
  • Las llaves de suscripción (keys), que funcionan como credenciales de autenticación.

Algunas APIs requieren tanto la llave como la ubicación en cada llamada, por lo que es importante anotar ambos valores. Más adelante existen alternativas de autenticación basadas en identidad administrada, que añaden una capa adicional de seguridad al consumo de los servicios.

El recurso de tipo Cognitive Services con pricing tier S0 permite acceder a servicios de visión, lenguaje, búsqueda y voz con una sola llave [08:30]. Sin embargo, para aplicaciones productivas se recomienda crear servicios independientes, como Computer Vision o Text Analytics por separado, de modo que cada uno pueda escalar de manera independiente sin generar un cuello de botella.

¿Cómo desplegar y configurar Intelligent Kiosk?

Al abrir la solución en Visual Studio desde la carpeta del repositorio, es importante mantener un path corto en el sistema de archivos [06:10]. Las aplicaciones UWP pueden fallar durante la compilación si la ruta excede cierto número de caracteres.

En las propiedades del proyecto UWP se debe verificar que:

  • El target version sea igual o superior a la compilación de Windows instalada.
  • La min version sea una versión anterior, para garantizar compatibilidad.

Una vez compilada y desplegada localmente, la aplicación queda instalada en el equipo y puede ejecutarse sin recompilar [09:50].

¿Cómo conectar la aplicación con el servicio cognitivo?

Dentro de Settings en Intelligent Kiosk [10:30] se configuran:

  • El nombre del workspace.
  • La llave de suscripción copiada desde el portal de Azure.
  • La ubicación del servicio (en el ejemplo, West US).
  • La cámara y micrófono del equipo, si están disponibles.

La llave se pega en los campos de Face API, Speech, Computer Vision, Text Analytics y Translator Text. Cada campo corresponde a un servicio cognitivo diferente que la aplicación puede invocar.

¿Qué puedes explorar con Intelligent Kiosk?

Con la configuración lista, es posible probar servicios de visión subiendo imágenes locales [11:45]. El servicio analiza la imagen y devuelve tags con niveles de confianza, detección de objetos, identificación de rostros y extracción de texto mediante OCR. Cada tag incluye un porcentaje que indica qué tan seguro está el modelo de su predicción.

Esta aplicación sirve como punto de partida para entender cómo se realizan las llamadas a cada servicio cognitivo antes de implementarlas desde cero. Te invito a seguir explorando las diferentes funcionalidades y compartir qué servicio cognitivo te resulta más interesante para tus proyectos.