Pesquisadores da Universidade de Duke, nos Estados Unidos, desenvolveram uma ferramenta de inteligência artificial que transforma fotos borradas e irreconhecíveis em retratos extremamente convincentes gerados por computador, com mais detalhes do que nunca.
Métodos anteriores podem apenas dimensionar a imagem de um rosto até oito vezes a resolução original. A equipe da Duke criou um método que retira alguns pixels e cria rostos com aparência realista com até 64 vezes a resolução pixelada, “imaginando” traços como as linhas do rosto e os cílios, coisas que não existiam na imagem original.
O sistema não pode ser usado para identificar pessoas, segundo os pesquisadores. Ele não transformará uma foto desfocada e irreconhecível de uma câmera de segurança em uma imagem nítida de uma pessoa real. Na verdade, é capaz de gerar novos rostos que não existem, mas parecem reais.
Apesar de terem se focado em rostos, a mesma técnica poderia, teoricamente, tirar fotos em baixa resolução de quase qualquer coisa e criar imagens nítidas e realistas, com aplicações que variam de medicina e microscopia a astronomia e imagens de satélite, de acordo com Sachit Menon, coautor do projeto.
O método, chamado PULSE – e que você pode testar aqui -, será apresentado pelos criadores na Conferência sobre Visão Computacional e Reconhecimento de Padrões (CVPR) de 2020, realizada virtualmente nesta semana.
O PULSE transforma imagens borradas em retratos quase reais. Imagem: Duke University
As abordagens tradicionais obtêm uma imagem de baixa resolução e “adivinham” quais pixels extras são necessários, tentando fazer com que eles correspondam, em média, aos pixels de imagens de alta resolução que o computador já viu antes. Como resultado, as áreas texturizadas dos cabelos e da pele podem não se alinhar perfeitamente de um pixel para outro, parecendo confusas e indistintas.
A abordagem da equipe da Duke foi diferente. Em vez de tirar uma foto de baixa resolução e adicionar lentamente novos detalhes, o sistema vasculha exemplos de faces de alta resolução gerados por IA, procurando aqueles que pareçam o máximo possível com a imagem de entrada quando reduzidos para o mesmo tamanho.
Os pesquisadores usaram a ferramenta de aprendizado de máquina chamada “rede adversária generativa” (GAN), que são duas redes neurais treinadas no mesmo conjunto de dados de fotos. Uma rede cria rostos humanos imitando aqueles com os quais ela foi treinada, enquanto a outra decide de esse rosto é convincente o suficiente para ser confundido com um rosto real. A primeira rede fica cada vez melhor com a experiência, até que a segunda não perceba mais a diferença.
O PULSE pode criar imagens com aparência realista a partir de entradas ruidosas e de baixa qualidade que outros métodos não podem, segundo Cynthia Rudin, cientista da computação de Duke que liderou a equipe. A partir de uma única imagem borrada de um rosto, ele pode gerar qualquer número de possibilidades estranhamente realistas, cada uma se parecendo sutilmente com uma pessoa diferente.
Da esquerda para a direita: Sachit Menon, Alex Damian, McCourt Hu, Nikhil Ravi e Cynthia Rudin, autores do estudo. A primeira fileira mostra as fotos originais, que são borradas e transformadas com o PULSE. Imagem: Duke University
Mesmo com fotos em que os olhos e a boca são quase irreconhecíveis, “nosso algoritmo ainda consegue fazer algo com isso, algo que as abordagens tradicionais não conseguem fazer”, disse Alex Damian, especialista em matemática e coautor do estudo.
O sistema é capaz de converter uma imagem de 16 x 16 pixels em 1024 x 1024 pixels, adicionando mais um milhão de pixels, semelhante à resolução HD. Detalhes como rugas e mechas no cabelo imperceptíveis nas fotos de baixa qualidade tornam-se nítidas e claras na versão gerada por IA.
Os pesquisadores pediram que 40 voluntários classificassem 1.440 imagens geradas no PULSE e cinco outros métodos de dimensionamento com notas de um a cinco, e o PULSE obteve a melhor classificação, com uma pontuação quase tão alta quanto fotos de alta qualidade de pessoas reais.
Via: Tech Xplore