La interacción mediante la voz ha ido introduciéndose poco a poco en la vida de los usuarios hasta el punto de evolucionar a un ritmo vertiginoso como vaticina Research and Markets: el mercado relacionado del reconocimiento de voz va a crecer de un 17,2% anual desde 2019 y alcanzará los 26,79 mil millones de euros para 2025. Los asistentes de voz y las nuevas soluciones en el ámbito telefónico facilitan la redirección de llamadas, la recopilación de información básica de la persona que llama o agilizan diferentes tipos de gestiones. Pero esto es solo el principio.
Alexa y Google Assistant son ya fieles compañeros en las vidas de los ciudadanos, pero la tecnología de voz llegará más allá de los asistentes. Hacer un pago con la voz o entender conversaciones en idiomas extranjeros gracias a la traducción simultánea serán realidades que cambiarán el uso del discurso. "Las nuevas tecnologías ya permiten realizar acciones con la voz que se amplían de manera exponencial y cada vez más empresas apuestan por ellas", explica Alfred Nesweda, CEO de masvoz. Esta empresa ha elaborado una pequeña lista con las cuatro tecnologías de voz que, a su juicio, supondrán una revolución en la manera en que nos comunicamos, ya sea con un contact center o con cualquier otro dispositivo.
[Te puede interesar: Los billetes de tren que se compran con asistente de voz]
El reconocimiento automático del habla (ASR) es responsable de entender y transcribir cuando el interlocutor dicta un número de DNI o de teléfono a la operadora virtual, lo que permite evitar la marcación vía teclado y crear una interacción más sencilla para el usuario. "Gracias a programas más avanzados, los sistemas son capaces de reconocer el lenguaje natural y se utiliza para transcribir llamadas o conversaciones completas y para subtitular o traducir una voz automáticamente", explica Nesweda de una tecnología que en sus comienzos solo era capaz de entender dígitos y letras como números de teléfono.
Dentro del ámbito de la atención al cliente o el retail, el análisis del habla seguirá siendo una tecnología de gran importancia. Se trata de una herramienta que detecta la emoción, el tono e incluso el estrés en la voz. Estos datos de audio se analizan y también sirven para identificar si un usuario está molesto o frustrado. De este modo, la persona que está al otro lado podrá gestionar mejor la petición o necesidad del usuario y considerar cuál es la mejor manera de abordar un problema. Con toda la información obtenida del análisis de estas interacciones, las compañías pueden mejorar su servicio y adaptarse a las necesidades de su público objetivo.
"La capacidad de análisis de los datos que proporcionan permite dar un valor diferencial y personalizar la relación con el usuario, ofreciendo así un servicio más eficiente", apunta el CEO de masvoz. Por otro lado, interactuar con los asistentes virtuales se convertirá en algo cotidiano y las búsquedas mediante voz se incrementarán exponencialmente como demuestra el Voice Engine Optimization (VEO). De hecho, ComScore revela que la mitad de las búsquedas en 2020 se harán por voz. Este nuevo hábito significa "un desafío para los expertos en marketing digital, puesto que las estrategias de contenido deberán estar enfocadas a la creación de preguntas y respuestas y todo ello en torno a la creación de palabras clave de conversación para responder en lenguaje natural", analiza Nesweda.
La seguridad entra en juego
La biometría de voz es una tecnología que se encuentra todavía en fase inicial de desarrollo, pero su llegada supondrá un gran avance en seguridad y privacidad de datos personales. En lugar de usar la huella dactilar o los rasgos faciales, este sistema creará una huella vocal única, segura e intransferible como medida de autenticación y firma digital. Para obtener la huella vocal de una persona se realizan una serie de pruebas y registros en los que el sistema tiene en cuenta rasgos físicos como la forma y el tamaño de la boca, además de la pronunciación, frecuencia y velocidad de la voz. Entre sus aplicaciones, se podrá votar por teléfono en unas elecciones, autorizar transacciones bancarias, obtener una contraseña olvidada o autenticarse en un Contact Center.