CursosEmpresasBlogLiveConfPrecios

Watson Text to Speech

Clase 16 de 25 • Curso de Inteligencia Artificial con IBM Watson

Clase anteriorSiguiente clase

Contenido del curso

Bases para el curso
  • 1
    Introducción de Watson

    Introducción de Watson

    03:42
  • 2
    Configuración del entorno de trabajo

    Configuración del entorno de trabajo

    04:18
  • 3

    Instalar cURL en Windows

    01:00
  • 4

    Arquitectura REST

    00:59
Aprende el manejo del lenguaje natural con Watson
  • 5
    Uso de Watson Personality Insights via CURL

    Uso de Watson Personality Insights via CURL

    16:11
  • 6
    Uso de Watson Personality Insights via SDK

    Uso de Watson Personality Insights via SDK

    11:36
  • 7
    Watson Natural Language Classifier

    Watson Natural Language Classifier

    12:49
  • 8
    Watson Natural Language Understanding

    Watson Natural Language Understanding

    11:36
  • 9
    Discovery

    Discovery

    15:44
  • 10
    Introducción a Watson Knowledge Studio

    Introducción a Watson Knowledge Studio

    13:02
  • 11
    Entrenamiento de Watson Knowledge Studio

    Entrenamiento de Watson Knowledge Studio

    14:26
  • 12
    Introducción a Watson Assistant

    Introducción a Watson Assistant

    17:42
  • 13
    Implementación de Watson Assistant

    Implementación de Watson Assistant

    13:21
  • 14

    Funciones en Javascript

    00:48
  • 15
    Watson Speech to Text

    Watson Speech to Text

    08:02
  • 16
    Watson Text to Speech

    Watson Text to Speech

    05:45
  • 17
    Watson Voice Agent

    Watson Voice Agent

    15:11
Watson Studio: Ciencia de Datos y Más
  • 18
    Introducción a Machine Learning y Watson Studio

    Introducción a Machine Learning y Watson Studio

    13:46
  • 19
    Entrenamiento de modelo en Watson Studio

    Entrenamiento de modelo en Watson Studio

    14:40
  • 20
    Entrenamiento de clusterización en Watson Studio

    Entrenamiento de clusterización en Watson Studio

    10:43
  • 21
    Reconocimiento Visual

    Reconocimiento Visual

    17:00
Integración
  • 22
    Functions + Cloudant

    Functions + Cloudant

    13:42
  • 23
    Exposición de funciones a través de una API

    Exposición de funciones a través de una API

    07:58
  • 24
    Proyecto final

    Proyecto final

    10:13
  • 25
    Conclusiones

    Conclusiones

    02:52
    David Jaramillo Saldarriaga

    David Jaramillo Saldarriaga

    student•
    hace 6 años

    Acá dejo el curl que se usa en esta clase, los dos hello world corresponden al texto y al nombre del archivo respectivamente.

    curl -X POST -u "apikey:{apikey}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.wav \ "{url}/v1/synthesize?voice={voice}"

    Apikey, url y voice se deben reemplazar por los parámetros que se deseen usar, y se deben borrar las llaves {}.

      Juan David Arias González

      Juan David Arias González

      student•
      hace 6 años

      Gracias!

      Jorge Humberto Ramírez Aristizábal

      Jorge Humberto Ramírez Aristizábal

      student•
      hace 5 años

      Excelente tu apoyo!

    Jimmy Buriticá Londoño

    Jimmy Buriticá Londoño

    student•
    hace 6 años

    El servicio Text to Speech procesa texto y lenguaje natural para generar salida de audio sintetizada completa con la entonación y cadencia adecuadas.

    Guillermo Parejo

    Guillermo Parejo

    student•
    hace 6 años

    Lo resolvi desde el Getting de IBM alli esta el codigo hize varios ejemplos para mi familia

    curl -X POST -u "apikey:{Pegar aqui la Apikey}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"-Escribir aqui el texto-\"}" \ --output mi_actividad.wav \ "{Pegar aqui la Url}/v1/synthesize?voice=es-LA_SofiaV3Voice" ```
    Alexander G

    Alexander G

    student•
    hace 6 años

    curl -X POST -u "apikey:XYZ" --header "Content-Type: application/json" --header "Accept: audio/wav" --data "{"text":"hola, bienvenidos al programa de entrenamiento"}" --output hello_world.wav "https://api.us-south.text-to-speech.watson.cloud.ibm.com/instances/f5f2c1f1-f0b0-4a74-9381-aea9bf71ecc5/v1/synthesize?voice=es-LA_SofiaV3Voice"

    Loren Johanna Vásquez Rivera

    Loren Johanna Vásquez Rivera

    student•
    hace 5 años

    Súper interesante esta herramienta, mejora el acceso que se puede tener a varias páginas web para tener una lectura del texto. Lo considero útil para personas que prefieran escuchar en vez de leer.

    Jhon Jaiver Supelano Rojas

    Jhon Jaiver Supelano Rojas

    student•
    hace 6 años

    Al parecer solo funciona con pocos caracteres 499 por entrada, seria interesante que no tuviera limites, en textos largos se crearian varios archivos de audio, en el plan lite solo permite 10.000 caracteres al mes y en Estándar cobran 0.02 USD por caracter https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-rules

    William Schnaider Torres Bermon

    William Schnaider Torres Bermon

    student•
    hace 5 años

    Aquí pueden encontrar más información sobre los formatos de audio soportados por Watson.

    Carlos Andrés Mosquera Arria

    Carlos Andrés Mosquera Arria

    student•
    hace 5 años

    Eso es lo que pasa por no tener MAC o Linux. Las peticiones curl hay que saberlas hacer.... y aqui no enseñan como es en Windows y menos en la documentación de IBM. Casi no he podido hacer las cosas y gasto horas sin encontrar solución en la Web ni poder resolverlo yo mismo.

      Alberto Perdomo

      Alberto Perdomo

      student•
      hace 5 años

      Puedes usar un shell basado en Unix para no perderte tanto. EN windows tienes como opción powrshell o git bash.

      Israel Yance

      Israel Yance

      student•
      hace 5 años

      Como recomendación es aprender usar la terminal de comandos basados en Unix y si tienes Windows tener una terminal de ese tipo.

      No solo por ese curso, sino para diversa cantidad de tareas. Te facilitará la vida.

      Este es el curso, lo hacen justo en Windows https://platzi.com/clases/terminal/ Esta es la clase para la instalación: https://platzi.com/clases/1748-terminal/24394-windows-subsystem-for-linux-wsl-como-acceder-a-la-/

    Usuario anónimo

    Usuario anónimo

    user•
    hace 5 años

    Super, me encanto poder hacer la programación, me salio mucho error porque el código no estaba en los enlaces, pero creo que aprendí mas porque me daba cuenta de los errores y me logre mentalizar un poco mas de la estructura.

    Abel Fernando Becerra Carrillo

    Abel Fernando Becerra Carrillo

    student•
    hace 5 años

    Excelente herramienta. Muy buen curso

    JOHN GERMAN GARCIA GONZALEZ

    JOHN GERMAN GARCIA GONZALEZ

    student•
    hace 5 años

    Adjunto no esta el archivo curl.txt ??

      Hugo Alexander Gonzalez Bocanegra

      Hugo Alexander Gonzalez Bocanegra

      student•
      hace 5 años

      no esta adjunto, pero si lo necesitas te lo paso para que le ejecutes en el CMD de windows:

      curl -X POST -u "apikey:{Apikey}" --header "Content-Type: application/json" --header "Accept: audio/wav" --data "{\"text\":\"-Escribir aqui el texto-\"}" --output mi_actividad.wav "{URL}/v1/synthesize?voice=es-LA_SofiaV3Voice"

      recuerda que si le escribes acentos al texto, es possible que no puedas ejecutar el archivo *.wav

    Hugo Montoya Diaz

    Hugo Montoya Diaz

    student•
    hace 3 años
    IBMWatsonTexttoSpeech_image1_dataethics4all-ai-society.jpg
    Wilder Bravo

    Wilder Bravo

    student•
    hace 5 años

    Tiene múltiples usos, interesante aplicar en el campo de la inclusión para personas con discapacidad.

    Mateo Murcia Valles

    Mateo Murcia Valles

    student•
    hace 5 años

    Me dedico hace ya unos años a enseñar inglés y se me ocurre una aplicación en donde mis estudiantes y compañeros lo utilicen para corregir su pronunciación, sin necesidad de ir a un traductor de Google o la presencia misma de un docente. ¡Genial esta clase!

    Jhon Jairo Meneses Prieto

    Jhon Jairo Meneses Prieto

    student•
    hace 5 años

    interesante opción, no reconoce las tildes pero en general es muy bueno el detector de idioma que utiliza

      Eduardo Revollo Escudero

      Eduardo Revollo Escudero

      student•
      hace 5 años

      En Windows 10 no reconoce las tildes. Habría que investigar si se puede solucionar. Yo instalé Ubuntu en Windows 10 siguiendo los pasos descritos en https://docs.microsoft.com/en-us/windows/wsl/install-win10 y luego hice la prueba desde Ubuntu desplegándolo desde Windows Terminal y sí me reconoció las tildes.

    Jose Daniel Delgado Ballen

    Jose Daniel Delgado Ballen

    student•
    hace 6 años

    curl -X GET -u "apikey:{apikey}"
    --output hola_mundo.wav
    "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueVoice"

    Matias Jesus Ruiz Ruiz

    Matias Jesus Ruiz Ruiz

    student•
    hace 6 años

    Hola, falta el archivo del curso... nuevamente :D

    Rafael Antonio Chica Pretelt

    Rafael Antonio Chica Pretelt

    student•
    hace 6 años

    Esto le daría escalabilidad horizontal a aplicaciones que requieran brindar información a personas con bajo nivel ya sea de lectura o de visión!! Fantástico!

    Guillermo Parejo

    Guillermo Parejo

    student•
    hace 6 años

    Espectacular la clase Profe Isaac, hace falta el archivo .txt del curl para realizar la actividad

    Usuario anónimo

    Usuario anónimo

    user•
    hace 6 años

    cada vez mejor

Escuelas

  • Desarrollo Web
    • Fundamentos del Desarrollo Web Profesional
    • Diseño y Desarrollo Frontend
    • Desarrollo Frontend con JavaScript
    • Desarrollo Frontend con Vue.js
    • Desarrollo Frontend con Angular
    • Desarrollo Frontend con React.js
    • Desarrollo Backend con Node.js
    • Desarrollo Backend con Python
    • Desarrollo Backend con Java
    • Desarrollo Backend con PHP
    • Desarrollo Backend con Ruby
    • Bases de Datos para Web
    • Seguridad Web & API
    • Testing Automatizado y QA para Web
    • Arquitecturas Web Modernas y Escalabilidad
    • DevOps y Cloud para Desarrolladores Web
  • English Academy
    • Inglés Básico A1
    • Inglés Básico A2
    • Inglés Intermedio B1
    • Inglés Intermedio Alto B2
    • Inglés Avanzado C1
    • Inglés para Propósitos Específicos
    • Inglés de Negocios
  • Marketing Digital
    • Fundamentos de Marketing Digital
    • Marketing de Contenidos y Redacción Persuasiva
    • SEO y Posicionamiento Web
    • Social Media Marketing y Community Management
    • Publicidad Digital y Paid Media
    • Analítica Digital y Optimización (CRO)
    • Estrategia de Marketing y Growth
    • Marketing de Marca y Comunicación Estratégica
    • Marketing para E-commerce
    • Marketing B2B
    • Inteligencia Artificial Aplicada al Marketing
    • Automatización del Marketing
    • Marca Personal y Marketing Freelance
    • Ventas y Experiencia del Cliente
    • Creación de Contenido para Redes Sociales
  • Inteligencia Artificial y Data Science
    • Fundamentos de Data Science y AI
    • Análisis y Visualización de Datos
    • Machine Learning y Deep Learning
    • Data Engineer
    • Inteligencia Artificial para la Productividad
    • Desarrollo de Aplicaciones con IA
    • AI Software Engineer
  • Ciberseguridad
    • Fundamentos de Ciberseguridad
    • Hacking Ético y Pentesting (Red Team)
    • Análisis de Malware e Ingeniería Forense
    • Seguridad Defensiva y Cumplimiento (Blue Team)
    • Ciberseguridad Estratégica
  • Liderazgo y Habilidades Blandas
    • Fundamentos de Habilidades Profesionales
    • Liderazgo y Gestión de Equipos
    • Comunicación Avanzada y Oratoria
    • Negociación y Resolución de Conflictos
    • Inteligencia Emocional y Autogestión
    • Productividad y Herramientas Digitales
    • Gestión de Proyectos y Metodologías Ágiles
    • Desarrollo de Carrera y Marca Personal
    • Diversidad, Inclusión y Entorno Laboral Saludable
    • Filosofía y Estrategia para Líderes
  • Diseño de Producto y UX
    • Fundamentos de Diseño UX/UI
    • Investigación de Usuarios (UX Research)
    • Arquitectura de Información y Usabilidad
    • Diseño de Interfaces y Prototipado (UI Design)
    • Sistemas de Diseño y DesignOps
    • Redacción UX (UX Writing)
    • Creatividad e Innovación en Diseño
    • Diseño Accesible e Inclusivo
    • Diseño Asistido por Inteligencia Artificial
    • Gestión de Producto y Liderazgo en Diseño
    • Diseño de Interacciones Emergentes (VUI/VR)
    • Desarrollo Web para Diseñadores
    • Diseño y Prototipado No-Code
  • Contenido Audiovisual
    • Fundamentos de Producción Audiovisual
    • Producción de Video para Plataformas Digitales
    • Producción de Audio y Podcast
    • Fotografía y Diseño Gráfico para Contenido Digital
    • Motion Graphics y Animación
    • Contenido Interactivo y Realidad Aumentada
    • Estrategia, Marketing y Monetización de Contenidos
  • Desarrollo Móvil
    • Fundamentos de Desarrollo Móvil
    • Desarrollo Nativo Android con Kotlin
    • Desarrollo Nativo iOS con Swift
    • Desarrollo Multiplataforma con React Native
    • Desarrollo Multiplataforma con Flutter
    • Arquitectura y Patrones de Diseño Móvil
    • Integración de APIs y Persistencia Móvil
    • Testing y Despliegue en Móvil
    • Diseño UX/UI para Móviles
  • Diseño Gráfico y Arte Digital
    • Fundamentos del Diseño Gráfico y Digital
    • Diseño de Identidad Visual y Branding
    • Ilustración Digital y Arte Conceptual
    • Diseño Editorial y de Empaques
    • Motion Graphics y Animación 3D
    • Diseño Gráfico Asistido por Inteligencia Artificial
    • Creatividad e Innovación en Diseño
  • Programación
    • Fundamentos de Programación e Ingeniería de Software
    • Herramientas de IA para el trabajo
    • Matemáticas para Programación
    • Programación con Python
    • Programación con JavaScript
    • Programación con TypeScript
    • Programación Orientada a Objetos con Java
    • Desarrollo con C# y .NET
    • Programación con PHP
    • Programación con Go y Rust
    • Programación Móvil con Swift y Kotlin
    • Programación con C y C++
    • Administración Básica de Servidores Linux
  • Negocios
    • Fundamentos de Negocios y Emprendimiento
    • Estrategia y Crecimiento Empresarial
    • Finanzas Personales y Corporativas
    • Inversión en Mercados Financieros
    • Ventas, CRM y Experiencia del Cliente
    • Operaciones, Logística y E-commerce
    • Gestión de Proyectos y Metodologías Ágiles
    • Aspectos Legales y Cumplimiento
    • Habilidades Directivas y Crecimiento Profesional
    • Diversidad e Inclusión en el Entorno Laboral
    • Herramientas Digitales y Automatización para Negocios
  • Blockchain y Web3
    • Fundamentos de Blockchain y Web3
    • Desarrollo de Smart Contracts y dApps
    • Finanzas Descentralizadas (DeFi)
    • NFTs y Economía de Creadores
    • Seguridad Blockchain
    • Ecosistemas Blockchain Alternativos (No-EVM)
    • Producto, Marketing y Legal en Web3
  • Recursos Humanos
    • Fundamentos y Cultura Organizacional en RRHH
    • Atracción y Selección de Talento
    • Cultura y Employee Experience
    • Gestión y Desarrollo de Talento
    • Desarrollo y Evaluación de Liderazgo
    • Diversidad, Equidad e Inclusión
    • AI y Automatización en Recursos Humanos
    • Tecnología y Automatización en RRHH
  • Finanzas e Inversiones
    • Fundamentos de Finanzas Personales y Corporativas
    • Análisis y Valoración Financiera
    • Inversión y Mercados de Capitales
    • Finanzas Descentralizadas (DeFi) y Criptoactivos
    • Finanzas y Estrategia para Startups
    • Inteligencia Artificial Aplicada a Finanzas
    • Domina Excel
    • Financial Analyst
    • Conseguir trabajo en Finanzas e Inversiones
  • Startups
    • Fundamentos y Validación de Ideas
    • Estrategia de Negocio y Product-Market Fit
    • Desarrollo de Producto y Operaciones Lean
    • Finanzas, Legal y Fundraising
    • Marketing, Ventas y Growth para Startups
    • Cultura, Talento y Liderazgo
    • Finanzas y Operaciones en Ecommerce
    • Startups Web3 y Blockchain
    • Startups con Impacto Social
    • Expansión y Ecosistema Startup
  • Cloud Computing y DevOps
    • Fundamentos de Cloud y DevOps
    • Administración de Servidores Linux
    • Contenerización y Orquestación
    • Infraestructura como Código (IaC) y CI/CD
    • Amazon Web Services
    • Microsoft Azure
    • Serverless y Observabilidad
    • Certificaciones Cloud (Preparación)
    • Plataforma Cloud GCP

Platzi y comunidad

  • Platzi Business
  • Live Classes
  • Lanzamientos
  • Executive Program
  • Trabaja con nosotros
  • Podcast

Recursos

  • Manual de Marca

Soporte

  • Preguntas Frecuentes
  • Contáctanos

Legal

  • Términos y Condiciones
  • Privacidad
  • Tyc promociones
Reconocimientos
Reconocimientos
Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
Logo reconocimientoPrimera Startup EdTech · 2018
Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
Logo reconocimientoCEO Mejor Emprendedor del año · 2024
De LATAM conpara el mundo
YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads