Prototipa una experiencia de voz sin código

Curso de Diseño de Interfaces de Voz

Contenido del curso

Bienvenida

1
Diseño de Interfaces de Voz: Principios y Prácticas
03:39 min

Introducción

Descubre y define

Diseño de Interfaz de Voz

Prototipa y evalúa

Interfaces multimodal

22
Cinco tips para diseñar interfaces multimodales
04:43 min

Construye y lanza

23
Qué pasa después de diseñar una interfaz de voz
06:29 min

Cierre

Live Class

28
Diseño de Interfaces de Voz: Conceptos y Herramientas Básicas
59:27 min

Tomar examen

Prototipa una experiencia de voz sin código

Resumen

El método Mago de Oz te permite prototipar y evaluar una experiencia de voz sin escribir una sola línea de código. Sirve para diseñadores de voz que quieren validar conversaciones con usuarios reales antes de invertir en desarrollo, simulando que la interfaz responde sola cuando en realidad eres tú quien dispara los diálogos detrás de una cortina.

La técnica viene de la película Mago de Oz, donde un hombre común crea la ilusión de ser un mago poderoso. Aquí pasa lo mismo: el usuario cree que conversa con un asistente inteligente, pero detrás hay una persona reproduciendo audios desde otra habitación.

¿En qué consiste el experimento Mago de Oz para voz?

La idea es separar físicamente al evaluador del usuario para crear una experiencia lo más cercana posible a la realidad.

En el montaje que te recomiendo, el usuario está en una habitación con un speaker común (no un Alexa ni un Google Home, solo un altavoz para música) conectado a tu computador. Tú estás en otra habitación, fuera de su vista, y desde una herramienta de prototipado vas reproduciendo los diálogos del sistema según lo que el usuario responda en voz alta.

¿Necesito saber programar para hacer un prototipo de voz? No. Con el método Mago de Oz tú simulas las respuestas del sistema desde una herramienta de prototipado, sin desarrollo ni código.

Tienes flexibilidad total: puedes decidir si el usuario sabe que estás del otro lado o no, si compartes la habitación, o si usas el computador en lugar de un altavoz. Lo importante es definir qué tan realista quieres que sea la simulación.

¿Qué beneficios da prototipar antes de desarrollar?

Este enfoque ataca el problema más caro del diseño conversacional: construir algo que nadie entiende.

Obtienes feedback rápido del usuario sin esperar a que exista el producto.
Evalúas el diseño sin construirlo, así que ahorras tiempo y dinero.
Iteras múltiples versiones del flujo en cuestión de horas.
Es relativamente fácil de armar y ejecutar.

Después de identificar los puntos débiles, puedes refinar el guion antes de que el equipo de desarrollo escriba la primera línea.

¿Qué herramienta usar para un prototipo rápido de voz?

En la etapa de prototipado existen dos fases: baja fidelidad y alta fidelidad. La baja fidelidad busca validar la conversación rápido; la alta fidelidad acerca el prototipo al producto final.

Para baja fidelidad usaremos Fable, una herramienta gratuita que permite hasta tres proyectos sin costo. Para alta fidelidad, más adelante puedes explorar Voiceflow, que se adapta mejor cuando ya validaste el concepto y quieres una simulación más robusta.

¿Qué es un prototipo de baja fidelidad en voz? Es una simulación rápida de la conversación que reproduce los diálogos del sistema con voces sintéticas, sin lógica real ni desarrollo, pensada para testear ideas con usuarios.

¿Cómo construir el flujo paso a paso en Fable?

Una vez creas tu cuenta y tu proyecto, Fable te da dos bloques base: diálogo del sistema y paso del usuario. Con esos dos elementos replicas el flujo conversacional que diseñaste en la clase anterior.

El proceso es así:

Crea un paso inicial, por ejemplo Inicio, donde arranca el prototipo.
Agrega los diálogos del sistema (la bienvenida, las preguntas, las confirmaciones) y pega los textos que ya tenías escritos.
Crea pasos del usuario para representar lo que la persona puede decir, como meditar o leer una historia.
Conecta los nodos seleccionando y arrastrando hasta cerrar cada rama del flujo.

En un mismo paso del sistema puedes registrar varias respuestas alternativas. Por ejemplo, en la bienvenida puedes alternar entre "Hola, soy Moon" y "Un gusto conocerte, soy Moon", para variar la experiencia entre sesiones.

¿Cómo se documentan las expresiones del usuario o utterances?

Un utterance es la forma específica en que un usuario expresa una intención. La misma intención de meditar puede aparecer como "meditar", "quiero meditar", "practiquemos la meditación" o "¿me acompañas a meditar?".

Fable te deja registrar todas esas variantes dentro del mismo paso del usuario. Eso es oro para tu documentación, porque al final entregas a los desarrolladores un mapa real de cómo habla la gente, no solo lo que tú asumiste en el escritorio.

También puedes guardar slots, que son variables que el usuario aporta. Cuando el sistema pregunta "¿te gustaría meditar por cinco o diez minutos?", la duración es un slot: un dato variable que el sistema necesita capturar.

¿Cómo se ejecuta una sesión con el usuario?

Antes de iniciar, configura el idioma y la voz que reproducirá los diálogos. Fable ofrece varios idiomas; en español están disponibles voces como las de Alexa, con opciones masculinas y femeninas.

Al darle a Start Prototype, la herramienta reproduce el audio del paso seleccionado. Mientras el usuario habla, tú escuchas y haces clic en el camino que corresponde a su respuesta. Si dice "quiero meditar", sigues por la rama de meditación; si pide leer una historia, tomas la otra rama.

Un ejemplo concreto del flujo de Moon:

Sistema: "Hola, soy Moon. Te ayudaré a preparar tu mente para dormir."
Usuario: "Quiero meditar."
Sistema: "¿Es tu primera vez meditando?"
Usuario: "Sí."
Sistema: "Listo, vamos a hacer una meditación guiada. ¿Te gustaría meditar por cinco o diez minutos?"

Durante la sesión, toma notas en tiempo real sobre las reacciones, dudas o frases inesperadas. Fable permite anotar dentro del mismo paso para volver más tarde y refinar el diseño.

¿Qué hago si el usuario dice algo que no tengo en el flujo?

Diseña desde el inicio un flujo de errores. Si tu prototipo solo cubre meditar y leer una historia, pero el usuario pide "cuéntame un pódcast", necesitas una salida elegante en lugar de quedarte en silencio.

¿Qué es un flujo de error en diseño conversacional? Es una rama paralela del prototipo que responde cuando el usuario pide algo no contemplado, evitando silencios y manteniendo la conversación viva.

Es normal que en las primeras sesiones aparezcan muchas frases sin mapear. Justamente por eso testeas: para descubrir esos huecos y cerrarlos en la siguiente iteración. No te presiones a que el prototipo esté perfecto antes de probarlo.

Fable también te deja compartir el link del prototipo con tu equipo, lo cual facilita el trabajo con desarrolladores y la documentación final del proyecto.

Tu reto antes de avanzar: arma un flujo de alto nivel de tu conversación y construye su prototipo en Fable. Estos entregables son la base del experimento Mago de Oz que harás después y forman parte del proyecto final del curso. ¿Qué caso de uso vas a prototipar primero? Cuéntalo en los comentarios.

Prototipa una experiencia de voz sin código

Bienvenida

Diseño de Interfaces de Voz: Principios y Prácticas

Introducción

Diseño de Interfaces de Voz: Historia y Aplicaciones Actuales

Qué hace un diseñador de conversaciones

Beneficios reales de las interfaces de voz

Retos de privacidad y sesgo en voz

Retos reales del reconocimiento de voz

Interfaces de voz para la accesibilidad

Cómo hablan los humanos y qué aprenden las máquinas

Cómo funciona la IA detrás de Siri y Alexa

Principios para diseñar conversaciones de voz

Descubre y define

Cuándo usar una interfaz de voz

Diseño de Interfaz de Voz: Investigación y Comprensión del Usuario

Priorización de Casos de Uso en Diseño de Productos

Creación de un System Persona para Interfaces de Voz

Diseño de Interfaz de Voz

Diseño de Diálogos para Asistentes de Voz: Buenas Prácticas

Estrategias para Mejorar Interacciones en Sistemas de Voz

Creación de Diálogos para Asistentes de Voz

Table reading para validar diálogos de voz

Creación de Flujos Conversacionales en Sistemas Interactivos

Prototipa y evalúa