Inteligência artificial pode clonar voz de qualquer pessoa em segundos

hwanghsuhui/creativecommons

A empresa Baidu (espécie de Google chinês) criou e desenvolveu o sistema de Inteligência Artificial Deep Voice. O dispositivo consegue clonar qualquer voz depois após registrar qualquer pessoa falando por menos de um minuto, além de alterar os seus sotaques ou inverter na tonalidade. Apesar de outros programas já terem feito “clones vocais” no passado, o fato comemorado pelos cientistas é de que as gravações requeridas pelo Baidu não precisam ser tão longas, de 20 ou 30 minutos, como anteriormente.

A facilidade na clonagem preocupou alguns especialistas, já que ela poderia ser utilizada para o bem ou para o mal. A empresa, por sua vez, explicou que não é sua intenção contribuir para a criação de notícias falsas. “Vemos muitas possíveis aplicações para essa tecnologia, clonagem de voz pode ajudar pacientes que perderam suas vozes. Uma mãe pode configurar facilmente um leitor de livros em áudio com a própria voz dela”, explicou Leo Zou, da equipe de comunicação da Baidu, ao jornal Digital Trends.

Para desenvolver o sistema de voz sintética, os pesquisadores da Baidu usaram mais de 800 horas de áudio a partir de 2,4 mil pessoas diferentes. Com alguns trechos de áudio, eles conseguiram reproduzir a voz com precisão mais de 95% das vezes. Os áudios clonados podem ser ouvidos em uma página criada no GitHub, que conta com diversas amostras, destacando em negrito as mais bem-sucedidas.

Gostou do conteúdo? Em nossa página tem mais: