21 de noviembre de 2024

Xiaomi le ayuda a las personas con trastornos del habla a tener una voz única y personalizada

Escucha este Artículo

Xiaomi, líder tecnológico a nivel global, ha dado a conocer su última aplicación de algoritmos avanzados y tecnología de voz de desarrollo propio a nivel de accesibilidad. La tecnología Text-To-Speech de estilo espontáneo, desarrollada por Xiaomi AI Lab, se utiliza para generar una voz única y personalizada para los usuarios con trastornos del habla. 

Ahora, gracias a la increíble tecnología de Xiaomi, estos usuarios podrán comunicarse con las demás personas utilizando «su propia voz», en lugar de la típica y monótona voz electrónica. Como parte del proyecto de investigación previa «Own My Voice» dirigido por el Comité Técnico de Xiaomi, este exitoso proyecto demuestra el compromiso de la compañía de «permitir que todas las personas en el mundo disfruten de una vida mejor a través de la tecnología más innovadora».

¿Por qué Xiaomi ha lanzado este proyecto?

Xiaomi se preocupa por las personas y se esfuerza por satisfacer sus diversas necesidades a través de la innovación tecnológica. En ese sentido, la marca se dio cuenta  del deseo de muchos usuarios con trastornos del habla de poseer sus voces únicas para la comunicación diaria, por eso decidió crear el proyecto «Own My Voice» para invitar a uno de sus Xiaomi Fans con trastornos de habla a experimentar por primera vez esta solución. 

Al respecto, Zhu Xi, coordinador del Comité de Tecnología para el equipo de “Tech for Good” de Xiaomi Corporation, dijo: «Nos entusiasma explorar los múltiples valores que nos aporta la innovación tecnológica, como responder a las demandas de los usuarios en cuanto a la identidad propia y la construcción de la misma». 

¿Cómo se llevó a cabo el proyecto?

Para generar la voz más adecuada y personalizada para el destinatario, el equipo del proyecto reclutó a más de 200 voluntarios de Xiaomi para que donaran sus voces. Utilizaron el algoritmo de coincidencia de la huella vocal para comparar las características de las voces donadas por los voluntarios con las de la voz del destinatario. 

De este modo, encontraron la voz más adecuada como sonido básico de referencia para el usuario. Teniendo en cuenta la personalización y la protección de la privacidad, la voz real elegida se manipuló con una compleja modificación acústica para formar un sonido de voz nuevo y original.

A continuación, el equipo utilizó la tecnología Text-To-Speech de estilo espontáneo para entrenar el modelo de IA, haciendo que esta nueva voz adquiriera gradualmente un ritmo y una entonación naturales que pudieran expresar con veracidad la emoción y el tono de una persona. 

El proyecto «Own My Voice» combina los algoritmos más avanzados con la tecnología de voz desarrollada por Xiaomi para garantizar la especificidad, seguridad y autenticidad de la voz sintetizada, creando una nueva idea de síntesis de voz personalizada para los usuarios con trastornos del habla. 

¿Cuál es la importancia del proyecto?

La columna vertebral de este proyecto es un grupo de expertos en tecnología del habla de Xiaomi AI Lab. Desde 2017, han publicado 37 artículos sobre el lenguaje en las actas de las principales conferencias internacionales, como la Conferencia Internacional sobre Acústica, Habla y Procesamiento de Señales (ICASSP). El éxito de «Own My Voice» depende principalmente de la tecnología Text-To-Speech de estilo espontáneo desarrollada por ellos.

En el archivo anexo podrá encontrar el comunicado de prensa completo en formato Word, junto con su respectiva imagen, con la que puede acompañar la nota.