Conversión de Voz a Texto con Servicios Cognitivos en Visual Studio
Clase 12 de 27 • Curso de Azure Cognitive Services
Contenido del curso
- 5

Text Analytics: Extracción y Análisis de Texto en Documentos
10:30 - 6

Escenarios de Uso de Servicios Cognitivos en Análisis de Datos
07:04 - 7

Análisis de Sentimiento con APIs de Azure: Uso y Configuración
09:37 - 8

Detección de Idiomas con Servicios Cognitivos Azure
07:26 - 9

Desarrollo de Aplicación de Consola con Text Analytics en C#
15:53
- 10

Servicios de Voz en Cognitive Services: Conversión y Aplicaciones
06:53 - 11

Conversión de Texto a Voz con Azure Cognitive Services
11:38 - 12

Conversión de Voz a Texto con Servicios Cognitivos en Visual Studio
13:33 - 13

Implementación de Traducción de Voz en Visual Studio
10:14 - 14

Implementación de Reconocimiento de Voz con Visual Studio
13:37
- 15

Visión Computacional con Microsoft: Análisis y Aplicaciones Prácticas
06:38 - 16

Creación de un Servicio de Computer Vision en Azure y su Implementación
11:56 - 17

Servicio OCR: Conversión de Imágenes a Texto Usando Azure
08:46 - 18

Reconocimiento Facial: Detección y Análisis de Rasgos Humanos
08:50 - 19

Detección y Análisis de Rostros con Face API
04:44 - 20

Uso de la API Face para Detección y Verificación de Rostros
16:53
- 21

Implementación de Luis para Comprensión del Lenguaje Natural
11:39 - 22

Creación de Modelos e Intenciones en Aplicaciones de Luis
11:52 - 23

Desarrollo de Aplicaciones en LUIS desde Cero
12:09 - 24

Uso de Modelos Prediseñados en Aplicaciones de Luis
07:25 - 25

Entrenamiento y Publicación de Modelos en LUIS
16:34 - 26

Integración del modelo Luis en aplicaciones con SDK de C#
08:28
¿Cómo implementar el servicio de voz a texto?
El servicio de voz a texto transforma el audio en texto utilizando tecnología cognitiva avanzada. Para comenzar a usarlo, es esencial disponer de una suscripción al servicio cognitivo de Azure. Aquí aprenderás cómo configurarlo desde cero en un entorno de Visual Studio, utilizando C# y algunas herramientas adicionales para trabajar con el sistema de archivos y métodos asíncronos.
¿Qué necesitas para comenzar?
- Suscripción al servicio cognitivo de speech: Este servicio es clave para realizar la conversión de voz a texto.
- Llave de suscripción y ubicación: Configura estos elementos cruciales para acceder al servicio y ejecutarlo correctamente.
¿Cómo configurar Visual Studio?
- Crear una aplicación de consola: Selecciona la opción de consola para crear una nueva aplicación. Esto simplifica el proceso de configuración inicial.
- Seleccionar framework: Elige el framework .NET adecuado para trabajar.
- Agregar el paquete NuGet:
- Haz clic derecho en el proyecto y selecciona "Administrar paquetes de Nuget".
- Busca
Microsoft.CognitiveServices.Speechy añade el paquete.
¿Cómo configurar el servicio de voz a texto?
Obtener la suscripción y configurar la región
Dirígete al portal de Azure:
- Selecciona el servicio cognitivo de tipo speech.
- Confirma la región en la que está configurado, por ejemplo, WestUS.
- Copia la primera llave desde la sección de
keys and endpoint.
Configurar la clave de suscripción
En Visual Studio, configura la suscripción y región en tu aplicación con speech config:
using var speechConfig = SpeechConfig.FromSubscription("YourSubscriptionKey", "WestUS");
¿Cómo capturar el audio desde el micrófono?
- Crear un método asíncrono: Define un método para capturar audio, por ejemplo
async static Task FromMic. - Configurar orígenes de audio: Utiliza el micrófono por defecto para captar el audio:
using var audioConfig = AudioConfig.FromDefaultMicrophoneInput();
using var recognizer = new SpeechRecognizer(speechConfig, audioConfig);
- Generar reconocimiento de voz:
- Solicita al usuario que hable al micrófono.
- Usa el reconocedor para transcribir en texto la voz captada.
var result = await recognizer.RecognizeOnceAsync();
Console.WriteLine("Tú dijiste: " + result.Text);
¿Cómo procesar un archivo de audio?
- Crear otro método asíncrono: Define
async static Task FromFile. - Configuración del archivo: Cambia el origen de micrófono a un archivo de audio:
using var audioConfig = AudioConfig.FromWavFileInput("test.wav");
- Ejecutar reconocimiento: Usa el mismo proceso de reconocimiento, pero manteniendo la configuracion para procesar un archivo:
var result = await recognizer.RecognizeOnceAsync();
Console.WriteLine("El resultado es: " + result.Text);
Ejecución completa
Para ejecutar correctamente, ajusta la firma del método Main en el programa de consola para trabajar con tareas asíncronas, e invoca los métodos según necesites trabajar desde un micrófono o un archivo de audio:
static async Task Main()
{
var speechConfig = SpeechConfig.FromSubscription("YourSubscriptionKey", "WestUS");
await FromMic(speechConfig);
// or
await FromFile(speechConfig);
Console.ReadLine();
}
¡Y ahí lo tienes! Con estas instrucciones, podrás implementar y probar el servicio de voz a texto empleando tanto entradas de micrófono como archivos de audio. Explorando el repositorio del curso, también encontrarás ejemplos más avanzados. Conviértete en un experto en procesamiento de voz aprovechando estas herramientas.