La nueva función de Google reconoce voz offline
La función desarrollada por Google permite reducir la latencia en el reconocimiento de voz, además de aumentar su precisión y permitirle funcionar offline. De esta manera, el gigante de la red podría optimizar la introducción por voz en los dispositivos móviles. ¿Se acabaron los teclados?
En el año 2012, las investigaciones en el campo del reconocimiento de voz mostraban avances importantes producidos por el aprendizaje automático, más exactamante con buscador de Google, también conocido como Google Voice Search. Pero ése era solo el comienzo de toda una revolución; nuevas arquitecturas empezaron a aparecer cada año, para mejorar la tecnología del reconocimiento: desde redes neuronales profundas (DNN) y recurrentes (RNN) hasta las redes neuronales convolucionales, por nombrar algunos ejemplos.
Uno de los objetivos más importantes de dichas arquitecturas siempre ha sido el de reducir la latencia. Es decir, acortar el tiempo de espera entre habla y reconocimiento. Con dicho objetivo en mente, Google ha anunciado la introducción de una nueva función de reconocimiento completamente neuronal para facilitar la introducción de texto en su teclado Gboard. La nueva tecnología utiliza un transductor de redes neuronales recurrentes (RNN-T), que permite eliminar latencia e irregularidades en el funcionamiento.
El transductor es lo suficientemente compacto como para ser utilizado en dispositivos móviles. De esta manera, la tecnología pasa de estar alojada en el servidor a estar alojada dentro del dispositivo. Esto significa que también permite el reconocimiento de voz offline. El modelo lleva la transcripción al nivel fonema/carácter, de forma que el teclado va escribiendo caracteres a medida que el usuario habla, como si estuviese hablando y escribiendo al mismo tiempo.
El nuevo reconocimiento de voz para Gboard está planificado para su introducción en todos los dispositivos Pixel. Pero por el momento, solo recibirán la actualización aquellos Pixel que funcionen en inglés estadounidense. Sin embargo, dadas las mejoras algoritmicas de la actualidad, se espera que la función esté disponible en más idiomas bastante pronto.
¿Qué os parece este nuevo avance en el reconocimiento de voz? ¿Os imagináis un futuro cercano en el que los teclados queden obsoletos? Podéis contarnos vuestra opinión en los comentarios debajo.
Fuente: Google AI Blog
Contenido editorial recomendado
Con su consentimiento, aquí se cargan contenidos externos.
Al hacer clic en el botón anterior, acepta que se le muestren contenidos externos. En el proceso pueden transmitirse datos personales a terceros proveedores. Encontrará más información al respecto en nuestro Política de privacidad.