El lunes 1 de abril, la empresa de inteligencia artificial (IA) OpenAI anunció el desarrollo de su modelo Voice Engine, capaz de replicar voces humanas con un sonido natural y emotivo, utilizando tan solo una muestra de 15 segundos.
Sin embargo, la compañía decidió no lanzar esta tecnología al público general debido a los riesgos asociados.
Los creadores de ChatGPT reconocieron los serios riesgos que conlleva generar un discurso que se asemeje a las voces humanas. Especialmente en un año electoral.
¿Qué es Voice Engine?
Un nuevo modelo de IA que convierte texto a voz, permitiendo a los creadores de contenido traducir su trabajo a otras lenguas sin perder sus acentos nativos.
Además, facilita la comunicación verbal para personas con dificultades, como la capacidad de realizar llamadas telefónicas.
La empresa ha demostrado cómo la voz de una persona anglosajona puede traducirse a diferentes idiomas, conservando su acento nativo en español, mandarín, alemán, francés y japonés.
Por el momento, el acceso a esta tecnología está limitado a empresas como Age of Learning, HeyGen, Dimagi, Livox y Lifespan. OpenAI ha adoptado un enfoque cauteloso.
Solo trabajando con compañías que acepten sus políticas de uso, que incluyen el consentimiento del uso de las voces sintéticas y la indicación clara a los usuarios de su naturaleza artificial.
OpenAI ha implementado medidas de seguridad, como marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine y un monitoreo proactivo de su uso.
Estas precauciones buscan prevenir posibles casos de mal uso, como las recientes llamadas automáticas con voces clonadas de políticos.
A pesar de los beneficios de esta tecnología, existe el riesgo de que los estafadores la utilicen para acceder a cuentas bancarias que utilizan autenticación de voz. Este problema resalta la necesidad de un uso responsable y ético de las voces sintéticas generadas por IA.
También lee:
Crean tecnología para que discapacitados visuales vivan el eclipse
¿Conoces el origen de los Tiny Desk Concert?