Aprovecha el precio especial y haz tu profesión a prueba de IA

Antes: $249

Currency
$209
Suscríbete

Termina en:

0 Días
2 Hrs
23 Min
16 Seg
Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

¿Qué son los servicios cognitivos?

1/27
Resources
Transcript

What are Microsoft Cognitive Services?

Exploring the world of Microsoft Cognitive Services can be an eye-opening and transformative experience for any developer. Cognitive services allow you to integrate artificial intelligence models into applications without needing to be an AI expert. These services are pre-trained models that offer advanced functionality by simply making API calls. Throughout this course, you will learn how to implement them to enrich your applications.

What are the categories of cognitive services?

Microsoft offers five main categories of cognitive services:

  1. Vision: allows you to analyze images to obtain contextual information and specific details such as facial and object recognition.
  2. Speech: Offers text-to-speech and speech-to-speech conversion, speaker recognition and spoken text translation.
  3. Language: Facilitates the understanding of intentions and entities in text through services such as Luis and QnA Maker.
  4. Decision: Helps detect anomalies, moderate content and personalize experiences for end users.
  5. Search: Enrich search indexes with advanced services to improve the ability to locate information.

What does the vision category offer?

This category allows you to analyze images beyond the visually obvious. Services include:

  • Computer vision: Identification of objects and context in images.
  • Facial recognition: Analysis of facial expressions, age and gender estimation.
  • Personalized vision: Training models with specific images to personalize the experience.

How do voice services work?

The speech category focuses on verbal interaction, enabling:

  • Speech-to-text and text-to-speech conversion: Integrate more effective communications into applications.
  • Speaker recognition: Identify people through their voices.
  • Spoken text translation: Facilitate multilingual communication.

What are the benefits of the language category?

Language services improve textual comprehension through:

  • Luis: Integrates bots capable of understanding the intent behind interactions and extracting entities.
  • QnA Maker: Configures more efficient question and answer systems.
  • Text analytics: Identifies connotations, keywords and performs automatic translations.

What is included in the decision category?

Decision services provide analytical intelligence through:

  • Anomaly detection: Identifying unusual patterns that could indicate problems.
  • Content moderation: Detecting sensitive or inappropriate information.
  • Personalizing experiences: Improving end-user interaction.

How to enrich searches with cognitive services?

The integration of cognitive services in the search category allows:

  • Build rich indexes from unstructured documents such as PDFs and images.
  • Detect key phrases and perform advanced recognition, such as face detection and celebrity recognition.
  • Enable automatic translations and structuring of information to facilitate more effective searches.

These services represent a powerful tool for any developer looking to innovate with artificial intelligence. We invite you to continue exploring each category in detail in the next classes, where you will learn how to implement these services directly in your applications. With the use of cognitive services, innovation is accessible and achievable.

Contributions 7

Questions 1

Sort by:

Want to see more contributions, questions and answers from the community?

Los servicios cognitivos son modelos pre-entrenados de inteligencia artificial para ser integrados en nuestras aplicaciones; pues no siempre necesitaremos hacer una rueda por nuestras manos si la podemos alquilar.
__
Azure nos ofrece las categorias de vision, voz, idioma, decision y busqueda

¿Qué es Azure Cognitive Services?


 
Cognitive Services pone la inteligencia artificial al alcance de todos los desarrolladores y científicos de datos. Con los modelos iniciales, se pueden desbloquear una variedad de casos de uso. Lo único que se necesita es una llamada API para insertar la capacidad de ver, escuchar, hablar, buscar, comprender y acelerar la toma de decisiones avanzada en las aplicaciones. Permita a los desarrolladores y científicos de datos de todos los niveles de aptitudes agregar fácilmente funcionalidades de inteligencia artificial a sus aplicaciones.

Completemento inicial de Azure Cognitive Services
 
Fuente; Microsoft

¿Qué son los servicios cognitivos?
Son servicios basados en la nube accesibles a través de API Rest y SDK que permiten integrar inteligencia artificial (IA) o ciencia de datos.

Incluyen modelos de IA pre-entrenados y listos para integrarse en aplicaciones y bots

El catálogo que facilita la comprensión cognitiva consta de 5 pilares básicos:
Visión
Voz
Idioma
Decisión
Búsqueda

Categoría de servicios cognitivos:
Visión: Se podría obtener la información del contexto de la imagen, podría convertirse los carácteres ópticos en el caso de un PDF, examinar un poster.
Voz: Convertir el texto a voz y la voz a texto.
Idioma: Sirve para entender qué está escrito en un texto.
Decisión: Sirve para encontrar anomalías o hacer recomendaciones para una persona.
Búsqueda: Permite integrar servicios cognitivos para enriquecer un índice y proporcionar mejor capacidad de búsqueda para la aplicación.

Api de Visión
Visión Computacional: Consiste en encontrar información que no está necesariamente en la imagen, podría indicar que elementos se encuentran, el contexto de la imagen.
Reconocimiento Facial: Se podría encontrar cuales son las expresiones faciales de una persona, de qué género son, que edad se puede estimar, etc.
Visión Personalizada: En este nivel los servicios cognitivos ya se encuentran pre-entrenados y solo es cuestión de consumir lo que está creado, hay servicios dedicados a personalizar la experiencia.

Api de Voz
Voz a texto.
Texto a voz.
Traducción de voz.
Reconocimiento del speaker.

Api de Idioma
Entendimiento de Lenguaje natural (LUIS): Permite entender lo que el usuario realmente le está diciendo a un boot, se puede identificar cual es la intención y extraer las entidades.
Qna Maker: Permite convertir preguntas y respuestas en un servicio que podrá ser integrado a través de un boot.
Analítica de texto: Permite identificar la connotación de una frase, identificar palabras clave.
Traducción de texto: Identificar el idioma y hacer una traducción a otra.

Api de Decisión
Detección de anomalías: Permite anomalías en la información que se está analizando.
Moderación de contenido: Permite identificar la información, si es pública o confidencial.
Personalizado: Personalización de experiencias para usuarios finales.

Api de Búsqueda
Permite generar un índice enriquecido donde se pueden agregar índices cognitivos que permiten a partir de información no estructurada como: PDF’s, archivos de word, excel, etc.
Para que pueda detectar frases clave, detección de rostro, tag, conocer el idioma en que está, hacer la traducción para poder finalmente incorporarlos a una aplicación web para que pueda realizar la búsqueda de esa información no estructurada a través de este índice enriquecido.

¿Qué son los servicios cognitivos?

Son servicios en la nube accesibles a través de API REST y SDK que permiten integrar inteligencia artificial o ciencia de datos

Categorías:

  • Visión
    • Obtener información del contexto de la imagen
    • Analizar un PDF
  • Voz
    • Convertir texto a voz
    • Convertir voz a texto
  • Idioma
    • Entender qué se dice en un texto
  • Decisión
    • Anomalías
    • Hacer recomendaciones
  • Búsqueda
    • Enriquecer un índice

API de Visión

  • Visión computacional
  • Reconocimiento facial
  • Visión personalizada

API de voz

  • Voz a texto
  • Texto a voz
  • Traducción de voz
  • Reconocimiento del speaker

API de Idioma

  • Entendimiento de lenguaje natural (Luis)
  • QnA Maker
  • Analítica de texto
  • Traducción de texto

API de Decisión

  • Detectar anomalía
  • Moderación de contenido
  • Personalizado

API de búsqueda

  • Creación de un pipeline de enriquecimiento
    • Extracción de frases clave
    • Extracción de ubicaciones
    • Análisis de sentimientos

Para hacer Servicios Cognitivos, APIs las puedo incorporar en diferentes lenguajes de programacion.

💡 Los que desarollan modelos de IA son los Cientificos de Datos.

💡 Los Servicios Cognitivos son modelos pre-entrenados de IA que me permiten integrarlos a mis Apps, a traves de una API REST y SDK, donde le paso mi Suscription Key y los parametros que requiere cada Servicio Cognitivo, y quedan listos para integrarlos en Aplicaciones y Bots.

Categorias:

  • VISION; (Obtener el Contexto de una imagen)
  1. Vision Computacional: Encontrar informacion que no esta necesariamente en la imagen, el contexto de la imagen, que objetos tiene la imagen.
  2. Reconocimiento Facial: Genero de una persona, edad estimada, razgos, sentimientos, etc.
  3. Vision Personalizada: Puedo entrenar un modelo con lo que yo necesite, entrenarlo con un grupo de imagenes para categorizar algo (Autos por marca, referencia, etc).
  • Voz;
  1. Voz a texto
  2. Texto a voz
  3. Traduccion de voz
  4. Reconocimiento del Speaker
  • Idioma; (Entender que se esta diciendo en un texto)
  1. Entendimiento de lenguaje Natural (LUIS), Integrar en Bots para poder entender lo que el usuario le esta diciendo al Bot, para entender cual es la intension y extraer las Entidades.
  2. QnA Maker: Convertir preguntas y respuestas en un servicio que puede ser integrado a traves de un Bot.
  3. Analitica de Texto: Entender cual es la conotacion de una frase, identificar las palabras Clave, Informacion del texto (que idooma esta, cuantas palabras, etc)
  4. Traduccion de texto: Traducir a otro idioma.
  • Decision (Anomalias o recomendaciones para una persona)
  1. Deteccion de Anomalias
  2. Moderacion de Contenido; Identificar si hay informacion que es confidencial o que se asocie a una persona.
  3. Personalizado; Personalizar experiencias para mis usuarios finales.
  • Busqueda (Enriquecer un indice para mejorar las busquedas)
  1. Indice enriquecido: En el indice puedo agregar distintos Servicios Cognitivos que me permitirian a partir de informacion No Estructurada (Pdf, word, Imagenes, etc), pasarla por el proceso para que pueda detectar;

Me gustan estos servicios los he probado mas no los he llevado a produccion

More information in the official documentation