Introducción a las interfaces de voz (VUI)

2/29
Recursos
Transcripción

¿Qué son las interfaces de voz?

Las interfaces de voz están transformando la manera en que interactuamos con la tecnología, permitiendo la comunicación a través del lenguaje hablado. Aunque pueda parecer un concepto moderno popularizado por Google, Alexa y Siri, el desarrollo de estas tecnologías comenzó mucho antes. Desde 1952 con el sistema Audrey de los laboratorios Bell, estas interfaces han evolucionado dramáticamente para permitir a los usuarios realizar tareas cotidianas con tan solo el uso de su voz.

¿Cómo ha evolucionado la tecnología de interfaces de voz?

  1. Década de 1950 - 1960: Inicios

    • 1952: Los laboratorios Bell introducen Audrey, una tecnología capaz de reconocer dígitos.
    • 1962: IBM lanza The Shoebox, ampliando el reconocimiento a comandos aritméticos básicos, como sumas y restas.
  2. Años 80 y 2000: Progresos comerciales
    En la década de los 80, surge el juguete Julie, una muñeca equipada con reconocimiento de voz para niños. Más tarde, en los 2000, grandes empresas como Microsoft, Amazon y Google empezaron a integrar interfaces de voz en sus productos, contribuyendo a su popularización masiva.

  3. Siglo XXI: Avances de inteligencia artificial

    • 2011: IBM Watson se destaca al ganar la competencia de trivia "Jeopardy!" en EE.UU, demostrando la capacidad de respuesta precisa a preguntas sobre múltiples temas.
    • evolución tecnológica: Cada vez más presente en dispositivos comunes, como smartphones y altavoces inteligentes.

¿Cuáles son las aplicaciones urbanas más comunes de las interfaces de voz?

Las interfaces de voz nos ofrecen un mundo de posibilidades prácticas en contextos urbanos. Algunas de sus aplicaciones más notables incluyen:

  • Altavoces inteligentes: Dispositivos como Google Home y Alexa permiten gestionar múltiples dispositivos conectados en el hogar, desde luces hasta electrodomésticos.

  • Interfaces multimodales: Sistemas como Siri y Google Nest combinan información visual y auditiva, mejorando la interactividad del usuario.

  • Wearables: Relojes inteligentes como el Apple Watch, que permiten interactuar con Siri sin necesidad de un equipo voluminoso o estar conectados a la corriente eléctrica.

  • Automóviles: Integración de sistemas de voz para facilitar acciones como la navegación, envío de mensajes o llamadas, y la reproducción de música, aumentando la seguridad al conducir.

¿Por qué es importante aprender sobre el diseño de interfaces de voz?

La creciente adopción de estas tecnologías exige un enfoque emocionante y fundamental en su diseño:

  1. Impacto en los consumidores: Un estudio de 2018 del Global Web Index relevó que el 27% de los usuarios online ya utilizaba búsquedas por voz en sus dispositivos móviles. Además, en 2020, el 40% de la población de EE.UU. había adoptado asistentes de voz.

  2. Confort en el hogar inteligente: Según datos de PWC de 2018, el 44% de los consumidores han usado asistentes de voz para controlar otros dispositivos inteligentes, evidenciando su valor en la vida diaria.

  3. Crecimiento futuro: Statista reporta que para 2021 casi un tercio de los consumidores estadounidenses poseía un altavoz inteligente, subrayando la tendencia ascendente de estas tecnologías.

Las interfaces de voz no son solo una característica moderna, son un elemento cada vez más esencial de nuestras vidas digitales. Por lo tanto, es fundamental mantenerse al tanto de sus avances y aplicaciones. Con cada interacción, la tecnología proporciona una experiencia más personalizada y eficiente.

Recuerda, siempre puedes experimentar con interfaces de voz en tu día a día. Desde interactuar con el Google Assistant hasta permitir que Siri organice tus actividades, las posibilidades son infinitas. ¡Continúa aprendiendo y explorando!

Aportes 9

Preguntas 0

Ordenar por:

¿Quieres ver más aportes, preguntas y respuestas de la comunidad?

Uso VUI con cierta frecuencia sobre todo cuando conduzco o cuando debo programar recordatorios, alarmas o reuniones en la agenda, es muy practico, en mi caso uso Siri. También la uso en ambientes virtuales de aprendizaje para generar feedback instantáneo a través de Chatgpt por medio de Bling. Ha sido genial.

He utilizado muy poco assistant de Google, pero las pocas veces que lo utilizo es mucho mas rápido y mucho mas fácil investigar algo o colocar algo en mi teléfono, también en varias ocasiones le he dicho que me cuente un chiste y admito que tiene un muy mal sentido del humor pero aun así me hace reír jajajajajajaja

Mi experiencia con los asistentes de voz ha sido un tanto diversa. La de Samsung, Bixby, la he encontrado algo limitada y dificil para que pueda interactuar con ella usando un lenguaje natural. La mejor hasta ahora ha sido Siri, que me parece está mejor adaptada a reconocer comandos usando un lenguaje natural

¿Qué es una Interfaz de voz o Voice User Interface (VUI)?

Una interfaz de voz es una tecnología que permite a un usuario comunicarse con un sistema por medio de la voz. El objetivo principal, es que el usuario pueda pedir información o ejecutar tareas usando su voz.

Yo tengo un Echo Dot de Amazon, y Alexa es bien cool, frecuentemente nos hace reír a mi y a mi familia con sus aportes. Pregúntenle cuál es su canción favorita y verán que sale con una perla, jajaja. La mía respondió:

Me encanta Ciega Sordomuda de Shakira, porque es una súper mezcla de pop con rancheras, hecha por una colombiana. ¡Bien ahí, Shaki!

😂

si he tenido interacción, es más en estos días utilice la interfaz de voz del teclado del teléfono y no sabía que podía utilizarlo para escribir los mensajes en WhatsApp para no enviar mensajes de voz sino de texto, fue algo extraordinario sencillo pero lo valore ya que no me había dado cuenta de esta funcionalidad
La interfaz de Chatgtp , si bien es aun incomodo su uso es curioso lo rápido que llegas a confiar en la maquina . 👀

He interactuado con el asistente de Google y Siri, puedo decir varios puntos sobre el asistente:

El primero: es un desleal. se activa cuando cualquier persona dice “ok google”.

Segundo, muchas veces no te comprende lo que dices, incluso si le hablas en otro idioma ( y eso que yo hablo lento, y vocalizo lo mejor posible).

Tercero, cuando le haces preguntas de búsqueda específicas; cómo lo pueden ser una la diferencia entre un concepto y otro, sale divagando en muchas ocaciones diciéndote: “Encontré 10 resultados similares”. No me gusta lo poco natural de esa respuesta; o lo poco personalizable que es, no se vuelve personal simplemente porque te llame por tu nombre.

Cuarto, algunas veces se queda mudo o sin procesar mientras le hablo, incluso cuando ya he dicho “Ok Goolge”. tengo que hacer click en la pantalla para activarlo de verdad. Si es me asistente de voz, espero que se active cuando lo llamo con mi voz por su comando de activación, y no haciendo click a la pantalla.

En cuanto a Siri, mientras fui usuario de IOS fue terrible; es lo mas lento y desesperante que he experimentado. Tenia que repetir el mismo enunciado hasta 3 o más veces para que procesara lo que le pedía, y su forma de responder era muy cavernícola. Sinceramente espero que haya evolucionado para bien.

Y eso es todo.

En mi caso uso Siri para hacer llamadas mientras conduzco o voy caminado, lo hago desde el reloj Apple Watch y me evito sacar el celular de la cartera, es genial jajajaja hasta me siento acompañada.