Efeitos sonoros gerados por IA enganam audição humana

Desenvolvida por meio de machine learning, técnica 'AutoFoley' foi empregada em uma pesquisa nos Estados Unidos; 41 de 53 participantes foram enganados pelos sons reproduzidos
Flávio Pinto14/08/2020 11h24, atualizada em 14/08/2020 12h56

20200727070104-1786x1080

Compartilhe esta matéria

Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Um estudo recente publicado pelo Instituto de Engenheiros Eletricistas e Eletrônicos (IEEE) dos Estados Unidos divulgou que, cada vez mais, as novas tecnologias de inteligência artificial estão conseguindo “enganar” os humanos: desta vez, a audição de participantes foi testada e falhou ao detectar quais sons eram produzidos por IA e quais eram apenas uma reprodução de áudio comum.

O estudo avaliou a audição de 53 participantes, que tinham que responder se o som que ouviam era de uma reprodução comum de áudio ou de um som criado por IA. Ao todo, 41 dos participantes foram “enganados” pelos sons, sem saber que os áudios haviam sido criados por computadores.

Os sons foram criados por meio de uma técnica de machine learning chamada “AutoFoley”, na qual a máquina determina quais ações estão ocorrendo em um videoclipe e reprouz os efeitos sonoros em cima dessas imagens.

512151_982834.jpg

As tecnologias de IA já estão sendo utilizadas para manipular áudios, otimizando o trabalho dos mixadores de sons. Créditos: Unsplash

O efeito é originário do Foley, uma técnica de edição de som no qual os artistas devem criar um som artificial que capta a verdadeira essência daquilo que será representado no vídeo. Esse procedimento é muito aplicado na dublagem de desenhos ou na edição de um filme.

Jeff Prevost, professor da Universidade do Texas, em San Antonio, que co-criou o AutoFoley, contou à IEEE Spectrum que a adição de efeitos sonoros por meio de Foley é uma técnica utilizada desde 1930. “Os filmes pareceriam vazios e distantes sem a camada controlada de uma trilha sonora realista de Foley. No entanto, o processo de síntese de som de Foley adiciona tempo e custo significativos à criação de um filme”, ressaltou.

Veja uma das amostras de áudio que foram utilizadas para enganar os participantes:

Apesar do sucesso dos áudios no estudo, a IA para este tipo de efeito específico está longe de ser perfeita. O desafio agora é descobrir como misturar o áudio feito por machine learning com vídeos reais. Para enganar 100% do público, os sons terão de ser combinados com a ação dos vídeos.

Ainda não sabemos até que ponto a IA nos levará, no entanto, já é possível dizer que alguns dos seus efeitos brevemente poderão ser sentidos nas telas de cinema ou em nossas salas de estar.

Via: Futurism

Analista de SEO

Flávio Pinto é analista de seo no Olhar Digital