La voz como dato biométrico para acreditar identidad ha ganado popularidad, ya que su captura es sencilla, poco intrusiva y se puede realizar remotamente.
¿Sabías que tu voz también es un rasgo biométrico?
Sí. La voz cumple con las características que los expertos consideran necesarias para que pueda ser utilizada para acreditar identidad de personas: es un rasgo físico universal, único, registrable y medible.
Pero además se trata de uno de los pocos datos biométricos que se puede capturar sin contacto físico e inclusive de manera remota, dos características muy apreciadas en tiempos de pandemia y ahora en la Nueva Normalidad.
Aunque la tecnología para reconocimiento de voz y los sistemas para acreditar identidad de personas a partir de su voz existen desde los años 50 del siglo pasado, estos se han popularizado hace poco más de 10 años.
Primero con la creación de SIRI, el primer asistente virtual que atendía por comando de voz y más recientemente con el auge de búsquedas por voz y el uso de dispositivos como Alexa, que permite que los usuarios interactúen con dispositivos digitales simplemente hablando, lo que les facilita crear recordatorios, realizar búsquedas y completar otras tareas simples.
También, las instituciones financieras (bancos, empresas de seguros y afores) han jugado un papel fundamental en la popularización del uso de la biometría de voz en los últimos años, gracias a la masificación de herramientas de banca en línea y el desarrollo de aplicaciones bancarias para uso en dispositivos móviles.
En México, algunas instituciones financieras, han implementado aplicaciones en las que usan la voz como herramienta para verificar la identidad de sus clientes y autorizar transacciones; en algunos casos en combinación con otros rasgos biométricos como el trazo una firma autógrafa sobre la pantalla del dispositivo utilizado por el cliente, la captura de una fotografía o la grabación de un video durante la transacción para ser usado como prueba de vida y verificación de la identidad del cliente.
¿Por qué se usa la voz para acreditar la identidad de personas?
Los sistemas de acreditación de identidad de personas a partir de sus rasgos biométricos son sumamente confiables, pues se basan en el análisis de rasgos físicos y fisiológicos que permiten analizar “n” cantidad de elementos y características únicas para validar que la persona es quien dice ser. En general, los rasgos biométricos más utilizados son las huellas dactilares, el rostro, el iris y la voz.
En el caso particular de la voz, la facilidad para su “captura” ha sido fundamental para la masificación de su uso; pero ha influido en gran medida la tecnología desarrollada para identificar más de 100 parámetros físicos y otros tanto fisiológicos en la voz que constituyen lo que los expertos denominan “huella vocal”: características únicas de la voz que permiten atribuirla a una persona en particular, con un alto nivel de certeza.
Como rasgo físico, en el análisis biométrico de la voz se contemplan cientos de características que dependen fundamentalmente de la anatomía de la garganta, la boca, las cuerdas vocales y de más de 70 partes del cuerpo, que en cada persona tiene un tamaño y forma única, las cuales impactan de alguna manera en la voz.
De hecho, en el análisis biométrico de la voz para acreditar identidad se correlacionan esas características fisiológicas únicas de cada persona para definir su “huella de voz” o “plantilla de voz” que, eventualmente, permitirá verificar que se trata de la misma persona.
¿Cómo se analiza la voz como rasgo biométrico?
Tecnologías como el Machine Learning y el desarrollo de redes neuronales han impactado de manera positiva en el uso y análisis de rasgos biométricos para acreditar identidad, pues han permitido crear algoritmos más precisos y rápidos para analizar la información de cada rasgo y determinar niveles de coincidencia muy altos.
En el caso particular de la voz, los sistemas de acreditación de identidad permiten reconocer e identificar personas a través de la recopilación de datos sonoros (vibraciones y ondas) generados al hablar a partir de los cuales se crea un “patrón biométrico sonoro único”, que al compararse con otros registros almacenados permite a partir de la diferenciación identificar a la persona.
¿Cómo se captura y procesa la voz como rasgo biométrico?
Los sistemas de autenticación de voz se usan generalmente en entornos en los que la naturaleza de la información a la que la persona tendrá acceso es confidencial y sensible, como por ejemplo cuentas bancarias.
En la industria, se manejan dos tipos de autenticación biométrica, la de voz activa y la de voz pasiva, aunque ambos permiten la acreditación de identidad, la determinación del tipo a utilizar depende del tiempo del enrolamiento y la seguridad que se le brindan a los usuarios.
La diferencia entre la biometría de voz activa y la biometría de voz pasiva radica en la participación del usuario al ser reconocida su voz.
Voz activa:
- El usuario debe repetir varias veces una frase determinada (elaborada por ellos o por la institución).
- Esa frase se grabará y se registrará como huella vocal y hará las veces de contraseña.
- La persona debe memorizar la frase con la que se registró, pues para validar su identidad deberá repetirla.
- En este método, los vectores para acreditar identidad se almacenan al momento de la grabación; y son tomados como referencia al momento que se requiera verificar la identidad de la persona.
Voz pasiva:
- La huella vocal del usuario se registra a partir de la grabación de una conversación regular, con una duración aproximada de 20 segundos.
- El contenido de la grabación inicial y de lo que la persona vocalice al momento de autenticarse no es relevante, pues lo que se almacena en el sistema son los vectores en el tono y pronunciación particulares de la persona.
- En cada proceso de autenticación se identifican los patrones que definen la huella de voz de la persona, por lo que nuevamente no es relevante el contenido del mensaje.
- En este método la acreditación de identidad se realiza a través del análisis en tiempo real de la voz, por lo que es mucho más seguro e infalible, y además, es mucho más sencillo para el usuario, pues no requiere recordar ninguna frase.
Retos de la biometría de voz
1.- Obtener la grabación de la huella de voz con mínima distorsión por ruidos ambientales y con niveles de calidad aceptables, puede ser complicado. Afortunadamente, la calidad de los micrófonos de dispositivos móviles, computadoras y diademas han mejorado mucho, permitiendo minimizar sonidos de ambiente y mejorar la nitidez de la voz en las grabaciones.
2.- La determinación de los parámetros correctos para almacenar y comparar las muestras de voz es crucial. Los motores biométricos más confiables analizan como mínimo 100 parámetros diferentes de la voz para garantizar mejor tasa de éxito en la identificación.
¿Dónde ya usamos la voz para identificarnos?
La voz como biométrico para acreditar identidad, llegó para quedarse y es un hecho que será el futuro en las instituciones financieras, por ejemplo, quienes ya han introducido este dato biométrico dentro de sus procesos del KYC (Conoce tu cliente, por sus siglas en inglés), esto luego de las modificaciones en la CUB (Circular Única de bancos) en el 2018.
En el caso de BBVA, además de la integración de las huellas dactilares y el reconocimiento facial, en México en septiembre del 2016, pusieron en marcha un programa para verificar digitalmente a clientes pensionados a través de su voz.
Es un sistema de voz activa que, a través de llamadas de los clientes a los centros de atención telefónica, permite grabar y almacenar la huella vocal del adulto mayor con una grabación de una frase que repite 3 veces, lo cual evita a la persona desplazarse hasta una sucursal bancaria para realizar el proceso de onboarding, lo cual generalmente es complicado para este segmento de la población.
Otro ejemplo es HSBC, el cual a través del programa “Mi voz es mi contraseña” implementado en Reino Unido en el 2016, permitió a sus clientes usar su voz como biométrico para identificarse al momento de realizar transacciones telefónicas; en este caso, al momento de registrarse los clientes deben grabar cinco veces la frase “Mi voz es mi contraseña”.
En cuanto a instituciones gubernamentales, el Ejército de México implementó el programa “Que no falte tu voz” en conjunto con Banjercito para los militares en situación de retiro y pensionados. Este sistema de reconocimiento de voz permite al usuario identificarse a través de la frase “mi voz es la clave que no tengo que recordar” para poder acceder a su cuenta y realizar trámites.