No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

Oportunidades con procesamiento de voz

10/27
Recursos

Aportes 5

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

o inicia sesión.

Un breve video de esta tecnología .

 
AT&T Launches Looney Tunes 5G Experience

¿Qué es Speech Service?

  • Unifica las funcionalidades de conversión de voz a texto, texto a voz y traducción de voz.

  • Servicio: Voz a texto
    Característica: Conversión de voz en texto en tiempo real
    Descripción: La conversión de voz en texto transcribe o traduce en tiempo real secuencias de audio o archivos de audio a texto que sus aplicaciones, herramientas o dispositivos pueden consumir o mostrar. Use voz a texto con Language Understanding (LUIS) para derivar las intenciones del usuario a partir de voz transcrita y actuar en los comandos de voz.
    SDK: Sí
    REST: Sí

  • Servicio: Texto a voz
    Característica: Texto a voz
    Descripción: Texto a voz convierte el texto de entrada en voz sintetizada similar a la humana mediante el Lenguaje de marcado de síntesis de voz (SSML).
    Use voces neuronales, que son voces similares a las humanas con tecnología de redes neuronales profundas.
    SDK: Sí
    REST: Sí

  • Servicio: Traducción de voz
    Caracteristica: Traducción de voz
    Descripción: La traducción de voz habilita la traducción de voz en varios idiomas en tiempo real en sus aplicaciones, herramientas y dispositivos. Use este servicio para la traducción de voz a voz y voz a texto.
    SDK: Sí
    REST: No

  • Servicio: Speaker Recognition
    Caracteristica: Verificación e identificación del hablante
    Descripción: El servicio Speaker Recognition proporciona algoritmos que comprueban e identifican a los hablantes por sus características de voz únicas. Speaker Recognition se usa para responder a la pregunta “¿quién está hablando?”.
    SDK: Sí
    REST: Sí

Ejemplos de uso

AT&T muestra su servicio de red 5G permitiendo a los clientes hablar directamente con Bugs Bunny.

KPMG utiliza Speech to Text para transcribir y catalogar miles de
llamadas, permitiendo mejorar el servicio de atención a clientes.

Este curso lo encuentro patas para arriba, porque esta muy muy muy frontend, sin embargo, como UX UI designer me brinda las bases de código para demostrar a los desarrolladores que mi propuesta si se puede llevar a cabo con la combinación de varias propuestas para las personas de la 3ra edad …