CursosEmpresasBlogLiveConfPrecios

Watson Text to Speech

Clase 16 de 25 • Curso de Inteligencia Artificial con IBM Watson

Clase anteriorSiguiente clase

Contenido del curso

Aprende a usar Manejo de Lenguaje Natural con Watson

    Bases para el curso

    • 1
      Introducción de Watson

      Introducción de Watson

      03:42 min
    • 2
      Configuración del entorno de trabajo

      Configuración del entorno de trabajo

      04:18 min
    • 3

      Instalar cURL en Windows

      01:00 min
    • 4

      Arquitectura REST

      00:59 min

    Aprende el manejo del lenguaje natural con Watson

    • 5
      Uso de Watson Personality Insights via CURL

      Uso de Watson Personality Insights via CURL

      16:11 min
    • 6
      Uso de Watson Personality Insights via SDK

      Uso de Watson Personality Insights via SDK

      11:36 min
    • 7
      Watson Natural Language Classifier

      Watson Natural Language Classifier

      12:49 min
    • 8
      Watson Natural Language Understanding

      Watson Natural Language Understanding

      11:36 min
    • 9
      Discovery

      Discovery

      15:44 min
    • 10
      Introducción a Watson Knowledge Studio

      Introducción a Watson Knowledge Studio

      13:02 min
    • 11
      Entrenamiento de Watson Knowledge Studio

      Entrenamiento de Watson Knowledge Studio

      14:26 min
    • 12
      Introducción a Watson Assistant

      Introducción a Watson Assistant

      17:42 min
    • 13
      Implementación de Watson Assistant

      Implementación de Watson Assistant

      13:21 min
    • 14

      Funciones en Javascript

      00:48 min
    • 15
      Watson Speech to Text

      Watson Speech to Text

      08:02 min
    • 16
      Watson Text to Speech

      Watson Text to Speech

      Viendo ahora
    • 17
      Watson Voice Agent

      Watson Voice Agent

      15:11 min

    Watson Studio: Ciencia de Datos y Más

    • 18
      Introducción a Machine Learning y Watson Studio

      Introducción a Machine Learning y Watson Studio

      13:46 min
    • 19
      Entrenamiento de modelo en Watson Studio

      Entrenamiento de modelo en Watson Studio

      14:40 min
    • 20
      Entrenamiento de clusterización en Watson Studio

      Entrenamiento de clusterización en Watson Studio

      10:43 min
    • 21
      Reconocimiento Visual

      Reconocimiento Visual

      17:00 min

    Integración

    • 22
      Functions + Cloudant

      Functions + Cloudant

      13:42 min
    • 23
      Exposición de funciones a través de una API

      Exposición de funciones a través de una API

      07:58 min
    • 24
      Proyecto final

      Proyecto final

      10:13 min
    • 25
      Conclusiones

      Conclusiones

      02:52 min
  • Tomar el examen del curso
    • David Jaramillo Saldarriaga

      David Jaramillo Saldarriaga

      student•
      hace 6 años

      Acá dejo el curl que se usa en esta clase, los dos hello world corresponden al texto y al nombre del archivo respectivamente.

      curl -X POST -u "apikey:{apikey}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"hello world\"}" \ --output hello_world.wav \ "{url}/v1/synthesize?voice={voice}"

      Apikey, url y voice se deben reemplazar por los parámetros que se deseen usar, y se deben borrar las llaves {}.

        Juan David Arias González

        Juan David Arias González

        student•
        hace 6 años

        Gracias!

        Jorge Humberto Ramírez Aristizábal

        Jorge Humberto Ramírez Aristizábal

        student•
        hace 5 años

        Excelente tu apoyo!

      Jimmy Buriticá Londoño

      Jimmy Buriticá Londoño

      student•
      hace 6 años

      El servicio Text to Speech procesa texto y lenguaje natural para generar salida de audio sintetizada completa con la entonación y cadencia adecuadas.

      Guillermo Parejo

      Guillermo Parejo

      student•
      hace 6 años

      Lo resolvi desde el Getting de IBM alli esta el codigo hize varios ejemplos para mi familia

      curl -X POST -u "apikey:{Pegar aqui la Apikey}" \ --header "Content-Type: application/json" \ --header "Accept: audio/wav" \ --data "{\"text\":\"-Escribir aqui el texto-\"}" \ --output mi_actividad.wav \ "{Pegar aqui la Url}/v1/synthesize?voice=es-LA_SofiaV3Voice" ```
      Alexander G

      Alexander G

      student•
      hace 6 años

      curl -X POST -u "apikey:XYZ" --header "Content-Type: application/json" --header "Accept: audio/wav" --data "{"text":"hola, bienvenidos al programa de entrenamiento"}" --output hello_world.wav "https://api.us-south.text-to-speech.watson.cloud.ibm.com/instances/f5f2c1f1-f0b0-4a74-9381-aea9bf71ecc5/v1/synthesize?voice=es-LA_SofiaV3Voice"

      Loren Johanna Vásquez Rivera

      Loren Johanna Vásquez Rivera

      student•
      hace 5 años

      Súper interesante esta herramienta, mejora el acceso que se puede tener a varias páginas web para tener una lectura del texto. Lo considero útil para personas que prefieran escuchar en vez de leer.

      Jhon Jaiver Supelano Rojas

      Jhon Jaiver Supelano Rojas

      student•
      hace 6 años

      Al parecer solo funciona con pocos caracteres 499 por entrada, seria interesante que no tuviera limites, en textos largos se crearian varios archivos de audio, en el plan lite solo permite 10.000 caracteres al mes y en Estándar cobran 0.02 USD por caracter https://cloud.ibm.com/docs/text-to-speech?topic=text-to-speech-rules

      William Schnaider Torres Bermon

      William Schnaider Torres Bermon

      student•
      hace 5 años

      Aquí pueden encontrar más información sobre los formatos de audio soportados por Watson.

      Carlos Andrés Mosquera Arria

      Carlos Andrés Mosquera Arria

      student•
      hace 5 años

      Eso es lo que pasa por no tener MAC o Linux. Las peticiones curl hay que saberlas hacer.... y aqui no enseñan como es en Windows y menos en la documentación de IBM. Casi no he podido hacer las cosas y gasto horas sin encontrar solución en la Web ni poder resolverlo yo mismo.

        Alberto Perdomo

        Alberto Perdomo

        student•
        hace 5 años

        Puedes usar un shell basado en Unix para no perderte tanto. EN windows tienes como opción powrshell o git bash.

        Israel Yance

        Israel Yance

        student•
        hace 5 años

        Como recomendación es aprender usar la terminal de comandos basados en Unix y si tienes Windows tener una terminal de ese tipo.

        No solo por ese curso, sino para diversa cantidad de tareas. Te facilitará la vida.

        Este es el curso, lo hacen justo en Windows https://platzi.com/clases/terminal/ Esta es la clase para la instalación: https://platzi.com/clases/1748-terminal/24394-windows-subsystem-for-linux-wsl-como-acceder-a-la-/

      Usuario anónimo

      Usuario anónimo

      user•
      hace 6 años

      Super, me encanto poder hacer la programación, me salio mucho error porque el código no estaba en los enlaces, pero creo que aprendí mas porque me daba cuenta de los errores y me logre mentalizar un poco mas de la estructura.

      Abel Fernando Becerra Carrillo

      Abel Fernando Becerra Carrillo

      student•
      hace 6 años

      Excelente herramienta. Muy buen curso

      JOHN GERMAN GARCIA GONZALEZ

      JOHN GERMAN GARCIA GONZALEZ

      student•
      hace 5 años

      Adjunto no esta el archivo curl.txt ??

        Hugo Alexander Gonzalez Bocanegra

        Hugo Alexander Gonzalez Bocanegra

        student•
        hace 5 años

        no esta adjunto, pero si lo necesitas te lo paso para que le ejecutes en el CMD de windows:

        curl -X POST -u "apikey:{Apikey}" --header "Content-Type: application/json" --header "Accept: audio/wav" --data "{\"text\":\"-Escribir aqui el texto-\"}" --output mi_actividad.wav "{URL}/v1/synthesize?voice=es-LA_SofiaV3Voice"

        recuerda que si le escribes acentos al texto, es possible que no puedas ejecutar el archivo *.wav

      Hugo Montoya Diaz

      Hugo Montoya Diaz

      student•
      hace 3 años
      IBMWatsonTexttoSpeech_image1_dataethics4all-ai-society.jpg
      Wilder Bravo

      Wilder Bravo

      student•
      hace 5 años

      Tiene múltiples usos, interesante aplicar en el campo de la inclusión para personas con discapacidad.

      Mateo Murcia Valles

      Mateo Murcia Valles

      student•
      hace 5 años

      Me dedico hace ya unos años a enseñar inglés y se me ocurre una aplicación en donde mis estudiantes y compañeros lo utilicen para corregir su pronunciación, sin necesidad de ir a un traductor de Google o la presencia misma de un docente. ¡Genial esta clase!

      Jhon Jairo Meneses Prieto

      Jhon Jairo Meneses Prieto

      student•
      hace 5 años

      interesante opción, no reconoce las tildes pero en general es muy bueno el detector de idioma que utiliza

        Eduardo Revollo Escudero

        Eduardo Revollo Escudero

        student•
        hace 5 años

        En Windows 10 no reconoce las tildes. Habría que investigar si se puede solucionar. Yo instalé Ubuntu en Windows 10 siguiendo los pasos descritos en https://docs.microsoft.com/en-us/windows/wsl/install-win10 y luego hice la prueba desde Ubuntu desplegándolo desde Windows Terminal y sí me reconoció las tildes.

      Jose Daniel Delgado Ballen

      Jose Daniel Delgado Ballen

      student•
      hace 6 años

      curl -X GET -u "apikey:{apikey}"
      --output hola_mundo.wav
      "{url}/v1/synthesize?accept=audio%2Fwav&text=hola%20mundo&voice=es-ES_EnriqueVoice"

      Matias Jesus Ruiz Ruiz

      Matias Jesus Ruiz Ruiz

      student•
      hace 6 años

      Hola, falta el archivo del curso... nuevamente :D

      Rafael Antonio Chica Pretelt

      Rafael Antonio Chica Pretelt

      student•
      hace 6 años

      Esto le daría escalabilidad horizontal a aplicaciones que requieran brindar información a personas con bajo nivel ya sea de lectura o de visión!! Fantástico!

      Guillermo Parejo

      Guillermo Parejo

      student•
      hace 6 años

      Espectacular la clase Profe Isaac, hace falta el archivo .txt del curl para realizar la actividad

      Usuario anónimo

      Usuario anónimo

      user•
      hace 6 años

      cada vez mejor

    Escuelas

    • Desarrollo Web
      • Fundamentos del Desarrollo Web Profesional
      • Diseño y Desarrollo Frontend
      • Desarrollo Frontend con JavaScript
      • Desarrollo Frontend con Vue.js
      • Desarrollo Frontend con Angular
      • Desarrollo Frontend con React.js
      • Desarrollo Backend con Node.js
      • Desarrollo Backend con Python
      • Desarrollo Backend con Java
      • Desarrollo Backend con PHP
      • Desarrollo Backend con Ruby
      • Bases de Datos para Web
      • Seguridad Web & API
      • Testing Automatizado y QA para Web
      • Arquitecturas Web Modernas y Escalabilidad
      • DevOps y Cloud para Desarrolladores Web
    • English Academy
      • Inglés Básico A1
      • Inglés Básico A2
      • Inglés Intermedio B1
      • Inglés Intermedio Alto B2
      • Inglés Avanzado C1
      • Inglés para Propósitos Específicos
      • Inglés de Negocios
    • Marketing Digital
      • Fundamentos de Marketing Digital
      • Marketing de Contenidos y Redacción Persuasiva
      • SEO y Posicionamiento Web
      • Social Media Marketing y Community Management
      • Publicidad Digital y Paid Media
      • Analítica Digital y Optimización (CRO)
      • Estrategia de Marketing y Growth
      • Marketing de Marca y Comunicación Estratégica
      • Marketing para E-commerce
      • Marketing B2B
      • Inteligencia Artificial Aplicada al Marketing
      • Automatización del Marketing
      • Marca Personal y Marketing Freelance
      • Ventas y Experiencia del Cliente
      • Creación de Contenido para Redes Sociales
    • Inteligencia Artificial y Data Science
      • Fundamentos de Data Science y AI
      • Análisis y Visualización de Datos
      • Machine Learning y Deep Learning
      • Data Engineer
      • Inteligencia Artificial para la Productividad
      • Desarrollo de Aplicaciones con IA
      • AI Software Engineer
    • Ciberseguridad
      • Fundamentos de Ciberseguridad
      • Hacking Ético y Pentesting (Red Team)
      • Análisis de Malware e Ingeniería Forense
      • Seguridad Defensiva y Cumplimiento (Blue Team)
      • Ciberseguridad Estratégica
    • Liderazgo y Habilidades Blandas
      • Fundamentos de Habilidades Profesionales
      • Liderazgo y Gestión de Equipos
      • Comunicación Avanzada y Oratoria
      • Negociación y Resolución de Conflictos
      • Inteligencia Emocional y Autogestión
      • Productividad y Herramientas Digitales
      • Gestión de Proyectos y Metodologías Ágiles
      • Desarrollo de Carrera y Marca Personal
      • Diversidad, Inclusión y Entorno Laboral Saludable
      • Filosofía y Estrategia para Líderes
    • Diseño de Producto y UX
      • Fundamentos de Diseño UX/UI
      • Investigación de Usuarios (UX Research)
      • Arquitectura de Información y Usabilidad
      • Diseño de Interfaces y Prototipado (UI Design)
      • Sistemas de Diseño y DesignOps
      • Redacción UX (UX Writing)
      • Creatividad e Innovación en Diseño
      • Diseño Accesible e Inclusivo
      • Diseño Asistido por Inteligencia Artificial
      • Gestión de Producto y Liderazgo en Diseño
      • Diseño de Interacciones Emergentes (VUI/VR)
      • Desarrollo Web para Diseñadores
      • Diseño y Prototipado No-Code
    • Contenido Audiovisual
      • Fundamentos de Producción Audiovisual
      • Producción de Video para Plataformas Digitales
      • Producción de Audio y Podcast
      • Fotografía y Diseño Gráfico para Contenido Digital
      • Motion Graphics y Animación
      • Contenido Interactivo y Realidad Aumentada
      • Estrategia, Marketing y Monetización de Contenidos
    • Desarrollo Móvil
      • Fundamentos de Desarrollo Móvil
      • Desarrollo Nativo Android con Kotlin
      • Desarrollo Nativo iOS con Swift
      • Desarrollo Multiplataforma con React Native
      • Desarrollo Multiplataforma con Flutter
      • Arquitectura y Patrones de Diseño Móvil
      • Integración de APIs y Persistencia Móvil
      • Testing y Despliegue en Móvil
      • Diseño UX/UI para Móviles
    • Diseño Gráfico y Arte Digital
      • Fundamentos del Diseño Gráfico y Digital
      • Diseño de Identidad Visual y Branding
      • Ilustración Digital y Arte Conceptual
      • Diseño Editorial y de Empaques
      • Motion Graphics y Animación 3D
      • Diseño Gráfico Asistido por Inteligencia Artificial
      • Creatividad e Innovación en Diseño
    • Programación
      • Fundamentos de Programación e Ingeniería de Software
      • Herramientas de IA para el trabajo
      • Matemáticas para Programación
      • Programación con Python
      • Programación con JavaScript
      • Programación con TypeScript
      • Programación Orientada a Objetos con Java
      • Desarrollo con C# y .NET
      • Programación con PHP
      • Programación con Go y Rust
      • Programación Móvil con Swift y Kotlin
      • Programación con C y C++
      • Administración Básica de Servidores Linux
    • Negocios
      • Fundamentos de Negocios y Emprendimiento
      • Estrategia y Crecimiento Empresarial
      • Finanzas Personales y Corporativas
      • Inversión en Mercados Financieros
      • Ventas, CRM y Experiencia del Cliente
      • Operaciones, Logística y E-commerce
      • Gestión de Proyectos y Metodologías Ágiles
      • Aspectos Legales y Cumplimiento
      • Habilidades Directivas y Crecimiento Profesional
      • Diversidad e Inclusión en el Entorno Laboral
      • Herramientas Digitales y Automatización para Negocios
    • Blockchain y Web3
      • Fundamentos de Blockchain y Web3
      • Desarrollo de Smart Contracts y dApps
      • Finanzas Descentralizadas (DeFi)
      • NFTs y Economía de Creadores
      • Seguridad Blockchain
      • Ecosistemas Blockchain Alternativos (No-EVM)
      • Producto, Marketing y Legal en Web3
    • Recursos Humanos
      • Fundamentos y Cultura Organizacional en RRHH
      • Atracción y Selección de Talento
      • Cultura y Employee Experience
      • Gestión y Desarrollo de Talento
      • Desarrollo y Evaluación de Liderazgo
      • Diversidad, Equidad e Inclusión
      • AI y Automatización en Recursos Humanos
      • Tecnología y Automatización en RRHH
    • Finanzas e Inversiones
      • Fundamentos de Finanzas Personales y Corporativas
      • Análisis y Valoración Financiera
      • Inversión y Mercados de Capitales
      • Finanzas Descentralizadas (DeFi) y Criptoactivos
      • Finanzas y Estrategia para Startups
      • Inteligencia Artificial Aplicada a Finanzas
      • Domina Excel
      • Financial Analyst
      • Conseguir trabajo en Finanzas e Inversiones
    • Startups
      • Fundamentos y Validación de Ideas
      • Estrategia de Negocio y Product-Market Fit
      • Desarrollo de Producto y Operaciones Lean
      • Finanzas, Legal y Fundraising
      • Marketing, Ventas y Growth para Startups
      • Cultura, Talento y Liderazgo
      • Finanzas y Operaciones en Ecommerce
      • Startups Web3 y Blockchain
      • Startups con Impacto Social
      • Expansión y Ecosistema Startup
    • Cloud Computing y DevOps
      • Fundamentos de Cloud y DevOps
      • Administración de Servidores Linux
      • Contenerización y Orquestación
      • Infraestructura como Código (IaC) y CI/CD
      • Amazon Web Services
      • Microsoft Azure
      • Serverless y Observabilidad
      • Certificaciones Cloud (Preparación)
      • Plataforma Cloud GCP

    Platzi y comunidad

    • Platzi Business
    • Live Classes
    • Lanzamientos
    • Executive Program
    • Trabaja con nosotros
    • Podcast

    Recursos

    • Manual de Marca

    Soporte

    • Preguntas Frecuentes
    • Contáctanos

    Legal

    • Términos y Condiciones
    • Privacidad
    • Tyc promociones
    Reconocimientos
    Reconocimientos
    Logo reconocimientoTop 40 Mejores EdTech del mundo · 2024
    Logo reconocimientoPrimera Startup Latina admitida en YC · 2014
    Logo reconocimientoPrimera Startup EdTech · 2018
    Logo reconocimientoCEO Ganador Medalla por la Educación T4 & HP · 2024
    Logo reconocimientoCEO Mejor Emprendedor del año · 2024
    De LATAM conpara el mundo
    YoutubeInstagramLinkedInTikTokFacebookX (Twitter)Threads