Aún no tienes acceso a esta clase

Crea una cuenta y continúa viendo este curso

Curso de Azure Cognitive Services

Curso de Azure Cognitive Services

Luis Antonio Ruvalcaba Sánchez

Luis Antonio Ruvalcaba Sánchez

Convierte texto en voz

11/27
Recursos

Aportes 6

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad? Crea una cuenta o inicia sesión.

Puede servir para personas con limitantes visuales o de habla.

Este curso me está volando el cerebro!
Se me ocurren escenarios de aplicaciones muy diversas.
Qué tal sí añadimos en una aplicación de aprendizaje de idiomas ejercicios donde repetimos una frase para que el sistema nos compruebe que la estamos diciendo correctamente. Pero no solo con la calificación del reconocimiento, sino que ponemos a la app a traducir el texto a nuestro idioma nativo y lo reproducimos para comprobar que lo que practicamos fue interpretado correctamente por el sistema?
O un plugin para las apps de valoración de aplicaciones o productos en un ecomerce donde en vez de escribir la reseña permitimos grabar un audio estilo whatsapp y así no tener que invertir tiempo escribiendo desde el teclado.

Código del ejemplo

Program.cs

using System;
using System.IO;
using System.Text;
using System. Threading.Tasks;
using Microsoft.CognitiveServices.Speech;
using Microsoft.CognitiveServices.Speech.Audio;
namespace DemoTextSpeech
{
  class Program
  {
    private static string suscriptionKey ="0d0fcb275cf949ce8cdc32c215da56ed";
    private static string serviceRegion = "westus";
    static async Task Main()
    {
      Console.WriteLine("Probando Speech to Text");
      await SynthesizeAudioToSpeakerAsync();
      await SynthesizeAudioToFileAsync();
      Console.ReadLine();
    }

    static async Task SynthesizeAudioToSpeakerAsync()
    {
      var config= SpeechConfig.FromSubsthecription (suscriptionKey, serviceRegion);
      using var synthesizer= new SpeechSynthesizer (config);
      await synthesizer.SpeakTextAsync("Hello, I am testing the text to speech service in Platzi ");
      }

      static async Task SynthesizeAudioToFileAsync()
      {
        var config SpeechConfig.FromSubscription (suscriptionkey, serviceRegion);
        config.SetSpeechSynthesisOutput Format (SpeechSynthesisOutput Format. Riff 24khz16BitMonoPcm);

        using var synthesizer = new SpeechSynthesizer (config, null);

        var ssml=File.ReadAllText("ssml.xml);
        var resultssml await synthesizer.SpeakSsmlAsync(ssml);

        using var stream= AudioDataStream.FromResult (resultssml);
        await stream. Save TowaveFileAsync("output-test.wav");
      }
  }
}

ssml.xml

<speak version="1.0" xmlns="https://www.w3.org/2001/10/synthesis" xml:lang="en-US">
  <voice name="en-US-AriaNeural">
    When you're on the freeway, it's a good idea to use a GPS.
  </voice>
</speak>

A mi se me ocurre que en los servicios de atención al cliente, siempre se grabe la llamada del cliente y se convierta de voz a texto, así el operador no tiene que estar transcribiendo el problema, esto los ayudaría a agilizar su trabajo.

Los bancos hicieron famosos estos servicios.

Se puede usar con voicebots específicamente en el área de cobranza, para recordatorio de pago.