No tienes acceso a esta clase

¡Continúa aprendiendo! Únete y comienza a potenciar tu carrera

Principios de diseño

10/29
Recursos

¿Cómo diseñar una experiencia de voz eficiente?

Diseñar una experiencia de voz excepcional no es solo cuestión de tecnología. Implica apreciar el arte de la conversación humana. Aspiramos a crear interfaces de voz que sean naturales y fluidas, imitando a un buen conversador. ¿Pero cómo se logra esto? Analicemos los principios clave basados en la cooperación, la colaboración y la simplicidad en el diálogo, inspirados en las teorías filosóficas de Paul Rees.

¿En qué consiste el principio cooperativo en el diseño de voz?

El principio cooperativo es esencial para la comunicación eficaz. Según el filósofo Paul Rees, implica colaboración entre los interlocutores. Para que una interfaz de voz sea percibida como cooperativa, debe cumplir cuatro normas:

  • Calidad: Proporcionar información verdadera y precisa. Por ejemplo, si preguntamos por el clima de Tokio y está lloviendo, la interfaz debe reflejar esa realidad y no ofrecer datos erróneos.

  • Cantidad: Ofrecer la información necesaria, sin sobrecargar al usuario. Por ejemplo, al preguntar por chefs famosos, en lugar de dar una lista interminable, es más efectivo dar unos pocos nombres importantes y ofrecer más detalles si el usuario los solicita.

  • Relevancia: Asegurar que las respuestas estén alineadas con la pregunta original. Si buscamos vuelos a México, la respuesta de la interfaz no debe desviarse hacia temas irrelevantes, sino centrarse en la búsqueda de vuelos.

  • Claridad: Usar un lenguaje claro y comprensible, evitando términos técnicos desconocidos para el público general.

¿Cómo promover la colaboración en las interfaces de voz?

Las conversaciones efectivas se basan en la co-creación y colaboración. Cada participante debe tener su turno para hablar. Sin señales visuales o no verbales, las interfaces de voz deben indicar claramente cuándo es el turno del usuario y cuándo el de la interfaz. Así, las personas sabrán cuándo intervenir.

  • Uso de señales: Integrar indicativos visuales o sonoros para comunicar turnos de habla.
  • Interrupciones permitidas: Las interfaces podrían permitir interrupciones humanas, imitando la naturaleza impredecible de las conversaciones reales.
  • Preguntas-clave: Utilizar preguntas para guiar al usuario en el diálogo y hacer que el turno del habla sea más intuitivo.

¿Por qué es crucial el diseño para el uso frecuente?

Los usuarios esperan que las interfaces sean inteligentes y retengan información relevante de interacciones pasadas, sin necesidad de repetición. Este aspecto resalta cuando una interfaz recuerda detalles básicos, como nombres o conversaciones previas, lo que facilita la continuidad y personalización de la interacción.

  • Memorizar datos: Implementar funciones de memoria en las interfaces para recordar información básica sobre el usuario.
  • Contextualizar conversaciones: Permitir que la conversación fluya de manera coherente sin repeticiones, asimilando preguntas previas para proporcionar respuestas pertinentes.

¿Cómo manejar errores y malentendidos?

Las conversaciones están llenas de malentendidos potenciales. Las interfaces de voz deben estar preparadas para manejar errores de interpretación y ruido ambiental. Diseñar estrategias para abordar y rectificar estos casos es crucial para mantener una buena interacción.

  • Detectar y corregir errores: Diseñar la interfaz para que pueda re-preguntar o reformular si detecta malentendidos.
  • Flexibilidad ante imprevistos: Incluir opciones para retomar o guiar de nuevo la conversación, asegurando una experiencia fluida y rectificable.

Con estos principios, estamos un paso más cerca de crear experiencias de voz que sean tan naturales y satisfactorias como una buena conversación humana. Estos fundamentos no solo mejoran la tecnología detrás de las interfaces de voz, sino que también enriquecen nuestra interacción diaria con la tecnología. ¡Sigue explorando y diseñando con estos conceptos en mente!

Aportes 3

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Creo que está bueno cuando el asistente hace un call to action al usuario, preguntándole si quiere que realice alguna acción específica. De esta forma, se agiliza la conversación y se evita tener que volver a decir “ok google …”.

**Principios para un buena interfaz de voz** El sistema de voz debe sentirse cooperativo , para que percibamos algo cooperativo existen ciertos principios: \#### **Lenguaje simple** El uso de un lenguaje claro y sencillo permite que la interfaz sea accesible para un mayor número de personas, asegurando que las respuestas sean comprensibles para todo tipo de usuario, independientemente de su nivel de conocimiento o experiencia. !\[\[Pasted image 20241021190629.png]] \#### **Apoyo** Las respuestas cortas y secas, como un simple \*\*"no"\*\*, pueden resultar frustrantes. En su lugar, ofrecer respuestas más completas, como \*\*"No, pero creo que..."\*\*. \#### **No entregar toda la información** Para evitar la \*\*sobrecarga mental\*\*, es esencial que, cuando la respuesta sea extensa, la interfaz ofrezca opciones para ver más información si el usuario lo desea, en lugar de abrumarlo con todo el contenido de una sola vez. !\[\[Pasted image 20241021190254.png]] \#### **Veracidad** El sistema debe proporcionar información \*\*veraz y comprobable\*\*. La entrega de datos inexactos o falsos impacta negativamente en la confianza del usuario \#### **Interrupciones del usuario** Es importante que el sistema permita al usuario interrumpir el flujo de la conversación, ya sea para detener el habla del asistente de voz o para tomar la palabra al volver a hablar. También es esencial indicar claramente los \*\*estados de la conversación\*\*, como "hablando", "escuchando", "pensando" o "deteniéndose". \#### Preguntar Cuando la instrucción del usuario no es del todo clara, el sistema debe indagar con preguntas adicionales. Preguntar de forma adecuada ayuda a cubrir las necesidades del usuario sin confusión. !\[\[Pasted image 20241021190502.png]] \#### RePreguntar Es común que existan situaciones impredecibles, como ruido ambiental o el uso de jerga que el sistema no comprenda. En estos casos, es importante manejar la situación con respuestas claras y respetuosas, como \*\*"No te entiendo, ¿podrías explicarlo de nuevo?"\*\*, para mantener la interacción fluida y agradable. \#### Personalización La interfaz debe recordar quién está hablando y otros datos básicos de contexto, lo que genera una experiencia más cercana y personalizada. Esto ayuda al usuario a sentirse más comprendido y valorado por el sistema. !\[\[Pasted image 20241021191546.png]] Creo además que podría ser una buena idea que la interfaz repita parte de la instrucción que le dices esto genera una sensación de empatía y confianza en el receptor motivándolo a seguir hablando , como dice el libro de Chris Voss "rompe la barrera de No" ejemplo \- \*\*Usuario\*\*: "Quiero generar un reporte mensual de ventas." \- \*\*Interfaz\*\*: "Entendido, quieres generar un reporte mensual de ventas. ¿Te gustaría incluir algún dato específico?"

Algo que tienen algunas versiones de los asistentes de voz es el idioma en el que se crean estas interacciones, en muchos casos no existen contextos por ello, de igual manera he notado que están implementando aplicaciones que conectan el contexto con la pregunta, es como cuando juegas Akinator.