Para facilitar las interacciones de personas sordas que muchas veces tienen dificultades para hablar, la firma Dialog, junto al Centro Avanzado de Ingeniería Eléctrica y Electrónica, AC3E, de la Universidad Federico Santa María, crearon una solución que mediante inteligencia artificial, traduce la articulación de palabras en audio digital.
El equipo, liderado por Luis López, adaptó un algoritmo de código abierto creado por investigadores de la Universidad de Oxford, que lee los labios y traduce a voz digital en inglés. Por ello, los chilenos entrenaron al sistema en el idioma español y desarrollaron una aplicación para dispositivos móviles que, mediante reconocimiento facial, lee los labios.
“El usuario articula palabras frente a la cámara del smartphone y el software lo transforma en voz digital, permitiendo que cualquier persona escuche. Esto va a facilitar interacciones como compras en el supermercado o consultas médicas, ya que no tendrán la necesidad de tener a un intérprete en todo momento”, comenta López.
El proyecto fue desarrollado con aportes del Fondo Regional de Corfo, PRAE, de la Región del Biobío, que les otorgó $ 20 millones más $ 5 millones de capital propio.
López cuenta que el sistema está operativo y que están en fase de precisión en la predicción de las palabras. Hoy el porcentaje de error oscila entre un 20% a 25% y la meta es llegar a 100% de precisión, para lanzar la solución al mercado el segundo semestre de 2018.
María José Escobar, investigadora del AC3E, dice que si bien el prototipo está orientado a niños, su aplicación en otros usuarios, como jóvenes o adultos mayores, depende de la cantidad y tipo de vocabulario que el sistema pueda reconocer. A futuro, se podría extender la funcionalidad a texto o lenguaje de señas.
“Construimos una base de datos con 100 palabras de niños. Pero se podría cargar, por ejemplo, un diccionario de trámites del Registro Civil o atención de salud, eso dependerá del contexto”, señala Escobar.