Un breve video de esta tecnología .
Introducción
¿Qué son los servicios cognitivos?
Funciones de cognitive services
Setup del ambiente
Privacidad y seguridad
Lenguaje
Procesamiento de texto
Escenarios de uso y consideraciones
Análisis de sentimiento
Detección y traducción de textos
Utilizando Text Analytics
Voz
Oportunidades con procesamiento de voz
Convierte texto en voz
Convierte voz a texto
Traducción de voz
Reconocimiento de voz
Visión
Oportunidades con visión computacional
Análisis de imagen con computer visión
Extracción de textos en imágenes utilizando OCR
Reconocimiento facial
Obteniendo atributos de rostros
Utilizando la librería de Face
LUIS
Conoce a LUIS
Creando el modelo de entendimiento de lenguaje y planeación de la app
Identificando la intención del usuario
Utiliza modelos prediseñados
Entrena al modelo
Integrando LUIS a nuestra aplicación
Conclusiones
Despedida
No tienes acceso a esta clase
¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera
Aportes 5
Preguntas 0
Un breve video de esta tecnología .
Unifica las funcionalidades de conversión de voz a texto, texto a voz y traducción de voz.
Servicio: Voz a texto
Característica: Conversión de voz en texto en tiempo real
Descripción: La conversión de voz en texto transcribe o traduce en tiempo real secuencias de audio o archivos de audio a texto que sus aplicaciones, herramientas o dispositivos pueden consumir o mostrar. Use voz a texto con Language Understanding (LUIS) para derivar las intenciones del usuario a partir de voz transcrita y actuar en los comandos de voz.
SDK: Sí
REST: Sí
Servicio: Texto a voz
Característica: Texto a voz
Descripción: Texto a voz convierte el texto de entrada en voz sintetizada similar a la humana mediante el Lenguaje de marcado de síntesis de voz (SSML).
Use voces neuronales, que son voces similares a las humanas con tecnología de redes neuronales profundas.
SDK: Sí
REST: Sí
Servicio: Traducción de voz
Caracteristica: Traducción de voz
Descripción: La traducción de voz habilita la traducción de voz en varios idiomas en tiempo real en sus aplicaciones, herramientas y dispositivos. Use este servicio para la traducción de voz a voz y voz a texto.
SDK: Sí
REST: No
Servicio: Speaker Recognition
Caracteristica: Verificación e identificación del hablante
Descripción: El servicio Speaker Recognition proporciona algoritmos que comprueban e identifican a los hablantes por sus características de voz únicas. Speaker Recognition se usa para responder a la pregunta “¿quién está hablando?”.
SDK: Sí
REST: Sí
AT&T muestra su servicio de red 5G permitiendo a los clientes hablar directamente con Bugs Bunny.
KPMG utiliza Speech to Text para transcribir y catalogar miles de
llamadas, permitiendo mejorar el servicio de atención a clientes.
Este curso lo encuentro patas para arriba, porque esta muy muy muy frontend, sin embargo, como UX UI designer me brinda las bases de código para demostrar a los desarrolladores que mi propuesta si se puede llevar a cabo con la combinación de varias propuestas para las personas de la 3ra edad …
¿Quieres ver más aportes, preguntas y respuestas de la comunidad?
o inicia sesión.