Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

Oportunidades con procesamiento de voz

10/27
Recursos

Aportes 4

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Un breve video de esta tecnología .

 
AT&T Launches Looney Tunes 5G Experience

¿Qué es Speech Service?

  • Unifica las funcionalidades de conversión de voz a texto, texto a voz y traducción de voz.

  • Servicio: Voz a texto
    Característica: Conversión de voz en texto en tiempo real
    Descripción: La conversión de voz en texto transcribe o traduce en tiempo real secuencias de audio o archivos de audio a texto que sus aplicaciones, herramientas o dispositivos pueden consumir o mostrar. Use voz a texto con Language Understanding (LUIS) para derivar las intenciones del usuario a partir de voz transcrita y actuar en los comandos de voz.
    SDK: Sí
    REST: Sí

  • Servicio: Texto a voz
    Característica: Texto a voz
    Descripción: Texto a voz convierte el texto de entrada en voz sintetizada similar a la humana mediante el Lenguaje de marcado de síntesis de voz (SSML).
    Use voces neuronales, que son voces similares a las humanas con tecnología de redes neuronales profundas.
    SDK: Sí
    REST: Sí

  • Servicio: Traducción de voz
    Caracteristica: Traducción de voz
    Descripción: La traducción de voz habilita la traducción de voz en varios idiomas en tiempo real en sus aplicaciones, herramientas y dispositivos. Use este servicio para la traducción de voz a voz y voz a texto.
    SDK: Sí
    REST: No

  • Servicio: Speaker Recognition
    Caracteristica: Verificación e identificación del hablante
    Descripción: El servicio Speaker Recognition proporciona algoritmos que comprueban e identifican a los hablantes por sus características de voz únicas. Speaker Recognition se usa para responder a la pregunta “¿quién está hablando?”.
    SDK: Sí
    REST: Sí

Ejemplos de uso

AT&T muestra su servicio de red 5G permitiendo a los clientes hablar directamente con Bugs Bunny.

KPMG utiliza Speech to Text para transcribir y catalogar miles de
llamadas, permitiendo mejorar el servicio de atención a clientes.