Aún puedes aprender 1 año a precio de Black Friday

Antes: $199

Currency
$129/año
regístrate

termina en:

3D
4H
13M
38S
Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

¿Qué son los servicios cognitivos?

1/27
Recursos

Aportes 6

Preguntas 0

Ordenar por:

Los aportes, preguntas y respuestas son vitales para aprender en comunidad. Regístrate o inicia sesión para participar.

Los servicios cognitivos son modelos pre-entrenados de inteligencia artificial para ser integrados en nuestras aplicaciones; pues no siempre necesitaremos hacer una rueda por nuestras manos si la podemos alquilar.
__
Azure nos ofrece las categorias de vision, voz, idioma, decision y busqueda

¿Qué es Azure Cognitive Services?


 
Cognitive Services pone la inteligencia artificial al alcance de todos los desarrolladores y científicos de datos. Con los modelos iniciales, se pueden desbloquear una variedad de casos de uso. Lo único que se necesita es una llamada API para insertar la capacidad de ver, escuchar, hablar, buscar, comprender y acelerar la toma de decisiones avanzada en las aplicaciones. Permita a los desarrolladores y científicos de datos de todos los niveles de aptitudes agregar fácilmente funcionalidades de inteligencia artificial a sus aplicaciones.

Completemento inicial de Azure Cognitive Services
 
Fuente; Microsoft

¿Qué son los servicios cognitivos?
Son servicios basados en la nube accesibles a través de API Rest y SDK que permiten integrar inteligencia artificial (IA) o ciencia de datos.

Incluyen modelos de IA pre-entrenados y listos para integrarse en aplicaciones y bots

El catálogo que facilita la comprensión cognitiva consta de 5 pilares básicos:
Visión
Voz
Idioma
Decisión
Búsqueda

Categoría de servicios cognitivos:
Visión: Se podría obtener la información del contexto de la imagen, podría convertirse los carácteres ópticos en el caso de un PDF, examinar un poster.
Voz: Convertir el texto a voz y la voz a texto.
Idioma: Sirve para entender qué está escrito en un texto.
Decisión: Sirve para encontrar anomalías o hacer recomendaciones para una persona.
Búsqueda: Permite integrar servicios cognitivos para enriquecer un índice y proporcionar mejor capacidad de búsqueda para la aplicación.

Api de Visión
Visión Computacional: Consiste en encontrar información que no está necesariamente en la imagen, podría indicar que elementos se encuentran, el contexto de la imagen.
Reconocimiento Facial: Se podría encontrar cuales son las expresiones faciales de una persona, de qué género son, que edad se puede estimar, etc.
Visión Personalizada: En este nivel los servicios cognitivos ya se encuentran pre-entrenados y solo es cuestión de consumir lo que está creado, hay servicios dedicados a personalizar la experiencia.

Api de Voz
Voz a texto.
Texto a voz.
Traducción de voz.
Reconocimiento del speaker.

Api de Idioma
Entendimiento de Lenguaje natural (LUIS): Permite entender lo que el usuario realmente le está diciendo a un boot, se puede identificar cual es la intención y extraer las entidades.
Qna Maker: Permite convertir preguntas y respuestas en un servicio que podrá ser integrado a través de un boot.
Analítica de texto: Permite identificar la connotación de una frase, identificar palabras clave.
Traducción de texto: Identificar el idioma y hacer una traducción a otra.

Api de Decisión
Detección de anomalías: Permite anomalías en la información que se está analizando.
Moderación de contenido: Permite identificar la información, si es pública o confidencial.
Personalizado: Personalización de experiencias para usuarios finales.

Api de Búsqueda
Permite generar un índice enriquecido donde se pueden agregar índices cognitivos que permiten a partir de información no estructurada como: PDF’s, archivos de word, excel, etc.
Para que pueda detectar frases clave, detección de rostro, tag, conocer el idioma en que está, hacer la traducción para poder finalmente incorporarlos a una aplicación web para que pueda realizar la búsqueda de esa información no estructurada a través de este índice enriquecido.

Para hacer Servicios Cognitivos, APIs las puedo incorporar en diferentes lenguajes de programacion.

💡 Los que desarollan modelos de IA son los Cientificos de Datos.

💡 Los Servicios Cognitivos son modelos pre-entrenados de IA que me permiten integrarlos a mis Apps, a traves de una API REST y SDK, donde le paso mi Suscription Key y los parametros que requiere cada Servicio Cognitivo, y quedan listos para integrarlos en Aplicaciones y Bots.

Categorias:

  • VISION; (Obtener el Contexto de una imagen)
  1. Vision Computacional: Encontrar informacion que no esta necesariamente en la imagen, el contexto de la imagen, que objetos tiene la imagen.
  2. Reconocimiento Facial: Genero de una persona, edad estimada, razgos, sentimientos, etc.
  3. Vision Personalizada: Puedo entrenar un modelo con lo que yo necesite, entrenarlo con un grupo de imagenes para categorizar algo (Autos por marca, referencia, etc).
  • Voz;
  1. Voz a texto
  2. Texto a voz
  3. Traduccion de voz
  4. Reconocimiento del Speaker
  • Idioma; (Entender que se esta diciendo en un texto)
  1. Entendimiento de lenguaje Natural (LUIS), Integrar en Bots para poder entender lo que el usuario le esta diciendo al Bot, para entender cual es la intension y extraer las Entidades.
  2. QnA Maker: Convertir preguntas y respuestas en un servicio que puede ser integrado a traves de un Bot.
  3. Analitica de Texto: Entender cual es la conotacion de una frase, identificar las palabras Clave, Informacion del texto (que idooma esta, cuantas palabras, etc)
  4. Traduccion de texto: Traducir a otro idioma.
  • Decision (Anomalias o recomendaciones para una persona)
  1. Deteccion de Anomalias
  2. Moderacion de Contenido; Identificar si hay informacion que es confidencial o que se asocie a una persona.
  3. Personalizado; Personalizar experiencias para mis usuarios finales.
  • Busqueda (Enriquecer un indice para mejorar las busquedas)
  1. Indice enriquecido: En el indice puedo agregar distintos Servicios Cognitivos que me permitirian a partir de informacion No Estructurada (Pdf, word, Imagenes, etc), pasarla por el proceso para que pueda detectar;

Me gustan estos servicios los he probado mas no los he llevado a produccion

More information in the official documentation