No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Watson Text to Speech

16/25
Recursos

Aportes 28

Preguntas 2

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Acá dejo el curl que se usa en esta clase, los dos hello world corresponden al texto y al nombre del archivo respectivamente.

curl -X POST -u "apikey:{apikey}" \
--header "Content-Type: application/json" \
--header "Accept: audio/wav" \
--data "{\"text\":\"hello world\"}" \
--output hello_world.wav \
"{url}/v1/synthesize?voice={voice}"

Apikey, url y voice se deben reemplazar por los parámetros que se deseen usar, y se deben borrar las llaves {}.

El servicio Text to Speech procesa texto y lenguaje natural para generar salida de audio sintetizada completa con la entonación y cadencia adecuadas.

Lo resolvi desde el Getting de IBM alli esta el codigo
hize varios ejemplos para mi familia

curl -X POST -u "apikey:{Pegar aqui la Apikey}" \
--header "Content-Type: application/json" \
--header "Accept: audio/wav" \
--data "{\"text\":\"-Escribir aqui el texto-\"}" \
--output mi_actividad.wav \
"{Pegar aqui la Url}/v1/synthesize?voice=es-LA_SofiaV3Voice" ```

curl -X POST -u “apikey:XYZ” --header “Content-Type: application/json” --header “Accept: audio/wav” --data “{“text”:“hola, bienvenidos al programa de entrenamiento”}” --output hello_world.wav “https://api.us-south.text-to-speech.watson.cloud.ibm.com/instances/f5f2c1f1-f0b0-4a74-9381-aea9bf71ecc5/v1/synthesize?voice=es-LA_SofiaV3Voice

Súper interesante esta herramienta, mejora el acceso que se puede tener a varias páginas web para tener una lectura del texto. Lo considero útil para personas que prefieran escuchar en vez de leer.

Al parecer solo funciona con pocos caracteres 499 por entrada, seria interesante que no tuviera limites, en textos largos se crearian varios archivos de audio, en el plan lite solo permite 10.000 caracteres al mes y en Estándar cobran 0.02 USD por caracter https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-rules

Aquí pueden encontrar más información sobre los formatos de audio soportados por Watson.

Excelente herramienta. Muy buen curso

Tiene múltiples usos, interesante aplicar en el campo de la inclusión para personas con discapacidad.

Me dedico hace ya unos años a enseñar inglés y se me ocurre una aplicación en donde mis estudiantes y compañeros lo utilicen para corregir su pronunciación, sin necesidad de ir a un traductor de Google o la presencia misma de un docente. ¡Genial esta clase!

interesante opción, no reconoce las tildes pero en general es muy bueno el detector de idioma que utiliza

curl -X GET -u “apikey:{apikey}”
–output hola_mundo.wav
“{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueVoice”

Hola, falta el archivo del curso… nuevamente 😄

Esto le daría escalabilidad horizontal a aplicaciones que requieran brindar información a personas con bajo nivel ya sea de lectura o de visión!! Fantástico!

Espectacular la clase
Profe Isaac, hace falta el archivo .txt del curl para realizar la actividad

El primer traductor de texto a voz que conoci fue LOKENDO.

Me parece muy útil para las personas que no pueden ver. Se puede usar en paginas web. lectura de textos, libros mucho más.

Funcionó perfecto, solo recordar siempre el cambio de los \ por ^ en los usuarios de windows!

Como el archivo no esta, lo transcribí desde el vídeo.

Buen tema, y podría usarse en personas que tienen dificultad para comunicarse por cualquier circunstancia.

Hecho. Todo funcionando 100%

Podría ser útil como un asistente para sistemas de control de procesos industriales, dando avisos de condiciones de alarma o recordatorios de operaciones que requieren una acción por parte del operario.

Muy interesante todos los videos, complejo la implementacion cuando no se tiene suficiente conocimiento del tema y mucho mas cuando los ejemplos practicos en la mayoria de ocaciones, no funcionan exactamente como se muestra en el video.

Muy genial esta clase. Muy fácil de implementar.

Tener presente que no soporta la letra ñ, como por ejemplo niñ@, el audio genera un error.

Excelente servicio, funcionó sin problema. Una aplicación que se me ocurre, sería en una app para traducir frases cortas, útiles para un viaje.

Hola, en mi caso el servicio no me funcionó con tildes en el texto, aunque no genera ningún problema al ejecutar el curl, no permite reproducir el archivo .wav.