No tienes acceso a esta clase

隆Contin煤a aprendiendo! 脷nete y comienza a potenciar tu carrera

Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba S谩nchez

Luis Antonio Ruvalcaba S谩nchez

Oportunidades con procesamiento de voz

10/27
Recursos

Aportes 5

Preguntas 0

Ordenar por:

驴Quieres ver m谩s aportes, preguntas y respuestas de la comunidad?

o inicia sesi贸n.

Un breve video de esta tecnolog铆a .


AT&T Launches Looney Tunes 5G Experience

驴Qu茅 es Speech Service?

  • Unifica las funcionalidades de conversi贸n de voz a texto, texto a voz y traducci贸n de voz.

  • Servicio: Voz a texto
    Caracter铆stica: Conversi贸n de voz en texto en tiempo real
    Descripci贸n: La conversi贸n de voz en texto transcribe o traduce en tiempo real secuencias de audio o archivos de audio a texto que sus aplicaciones, herramientas o dispositivos pueden consumir o mostrar. Use voz a texto con Language Understanding (LUIS) para derivar las intenciones del usuario a partir de voz transcrita y actuar en los comandos de voz.
    SDK: S铆
    REST: S铆

  • Servicio: Texto a voz
    Caracter铆stica: Texto a voz
    Descripci贸n: Texto a voz convierte el texto de entrada en voz sintetizada similar a la humana mediante el Lenguaje de marcado de s铆ntesis de voz (SSML).
    Use voces neuronales, que son voces similares a las humanas con tecnolog铆a de redes neuronales profundas.
    SDK: S铆
    REST: S铆

  • Servicio: Traducci贸n de voz
    Caracteristica: Traducci贸n de voz
    Descripci贸n: La traducci贸n de voz habilita la traducci贸n de voz en varios idiomas en tiempo real en sus aplicaciones, herramientas y dispositivos. Use este servicio para la traducci贸n de voz a voz y voz a texto.
    SDK: S铆
    REST: No

  • Servicio: Speaker Recognition
    Caracteristica: Verificaci贸n e identificaci贸n del hablante
    Descripci贸n: El servicio Speaker Recognition proporciona algoritmos que comprueban e identifican a los hablantes por sus caracter铆sticas de voz 煤nicas. Speaker Recognition se usa para responder a la pregunta 鈥溌縬ui茅n est谩 hablando?鈥.
    SDK: S铆
    REST: S铆

Ejemplos de uso

AT&T muestra su servicio de red 5G permitiendo a los clientes hablar directamente con Bugs Bunny.

KPMG utiliza Speech to Text para transcribir y catalogar miles de
llamadas, permitiendo mejorar el servicio de atenci贸n a clientes.

Este curso lo encuentro patas para arriba, porque esta muy muy muy frontend, sin embargo, como UX UI designer me brinda las bases de c贸digo para demostrar a los desarrolladores que mi propuesta si se puede llevar a cabo con la combinaci贸n de varias propuestas para las personas de la 3ra edad 鈥