El pasado mes de mayo, Google lanzó la versión en español de su asistente virtual que, además de ser capaz de mantener un diálogo y recordar preguntas previas, está adaptado a la cultura española. Google Assistant entiende las bromas y el contexto de cada país gracias a la inteligencia artificial, el aprendizaje automático y el machine learning¸ sin dejar de lado la intervención humana. Un equipo de agentes revisa y valora las respuestas para mejorar las conversaciones hombre-máquina.
Aunque lejos de ser perfectos, los asistentes virtuales como Google Assistant, Siri, Cortana o Alexa comprenden, interactúan y resuelven las peticiones de los usuarios. Pero, ¿cómo ha evolucionado la tecnología de reconocimiento digital de voz?
De Audrey a Siri: evolución
El predecesor de Siri, Cortana, Alexa o Google Assistant fue Audrey. El sistema de reconocimiento automático del habla, desarrollado por los Laboratorios Bell en 1952, era capaz de reconocer números absolutos.
Diez años más tarde, la compañía IBM desarrolló Shoebox que procesaba los números del 0 al 9 y las operaciones matemáticas “más”, “menos”, “subtotal”, “total”, “falso” y “de” para dar respuestas a peticiones como “Cinco más tres más ocho más seis más cuatro menos nueve, total”, y ofrecer la respuesta correcta “17”. El siguiente hito llegó de la mano de la Universidad de Carnegie Mellon en 1978 bajo el nombre de Harpy y tenía capacidad para entender 1.000 palabras.
En la década de los 80, las investigaciones se centraron en el desarrollado de sistemas basados en el modelo Hidden Markov Model, es decir, en la probabilidad estadística de que determinada palabra siga a otra, con el objetivo de dejar atrás los sistemas basados en palabras para crear aplicaciones capaces de entender frases.
En la última década del siglo XX, compañías como IBM, Dragon, Philips, Lernout & Hauspie o Microsoft, llevaron el reconocimiento de voz al ordenador. La evolución tecnológica sufrió un importante parón con el estallido de la crisis de las puntocom y no fue hasta 2011 cuando se presentó el primer asistente virtual digital avanzando incorporado al iPhone 4S, Siri. Nacido de un proyecto de investigación financiado por DARPA, el sistema de Apple utiliza inteligencia artificial, tecnologías de búsqueda de data geográfica, y herramientas de lenguaje, entre otras.
Penetración de los asistentes de voz
Los asistentes de voz ganan adeptos cada día y se han convertido en un elemento más de la vida cotidiana. Así lo revela el estudio Intelligent Voice Assistants elaborado por MindMel, que señala que el 55% de los usuarios utilizan regularmente los asistentes de voz. No obstante, el uso varía en función de la edad, logrando el índice de penetración más alto entre los 18-24 años y el más bajo a partir de los 65 años.
Respecto a la evolución en los últimos años, el informe apunta una tendencia positiva en la adopción de esta tecnología. Si en 2015, el 45% de los usuarios utilizaban asistentes de voz, en 2016 la cifra ascendió hasta el 61%.
A pesar de que las bromas a los asistentes de voz son más que conocidas, el 27% de los encuestados declarada estar satisfecho con las respuestas ofrecidas por los asistentes, el 39% tiene una posición neutral, el 21% muy satisfecho, el 7% algo insatisfecho y el 6% muy insatisfecho.