A empresa de inteligência artificial DeepMind, comprada pelo Google em 2014 por US$ 400 milhões, divulgou hoje um método que permite que sistemas “aprendam” sozinhos a realizar tarefas de maneira ainda mais rápida. A DeepMind chamou o sistema de UNREAL (sigla que significa “Unsupervised Reinforcement and Auxiliary Learning”, algo como “aprendizagem não-supervisionada por reforço e auxílio”).
Esse sistema foi utilizado para treinar uma inteligência artificial a jogar 53 jogos de ATARI, bem como navegar por 13 labirintos. Nos jogos de ATARI, a pontuação do computador foi cerca de nove vezes a média dos humanos; nos labirintos, a média foi de 87% a performance dos humanos, com resultados sobrehumanos em alguns deles. O vídeo abaixo mostra o UNREAL em ação:
Tarefas auxiliares
Para conseguir esse desempenho, o UNREAL apresenta duas tarefas auxiliares às inteligências artificiais. Esse processo seria semelhante a você pedir para um aluno prestar atenção a alguns aspectos diferentes da tarefa que ele vai realizar, a fim de facilitar o processo de aprendizagem. Mais detalhes sobre elas foram publicados pela equipe da DeepMind em um artigo científico no Arxiv (pdf).
A primeira tarefa auxiliar envolve controlar os pixels da tela. Em outras palavras, a inteligência artificial avalia como os seus comandos afetam o que aparece na tela. De acordo com a DeepMind, “isso é semelhante à forma como um bebê pode aprender a controlar suas mãos movendo-as e observando o movimento”. Essa tarefa ajuda o sistema a entender se está fazendo a coisa certa com base nas informações que aparecem na tela.
A segunda tarefa auxiliar leva a máquina a tentar prever atitudes corretas com base no histórico recente. Os desenvolvedores escreveram à Bloomberg que trata-se de um processo semelhante a sonhos: “Animais sonham com eventos recompensadores positiva ou negativamente com maior frequência”, disseram. Com base nesses “sonhos”, a máquina consegue entender a melhor maneira de agir para receber as recompensas (uma pontuação alta, por exemplo).
O GIF abaixo mostra como a máquina interpreta essas duas tarefas auxiliares enquanto navega por um labirinto:
Aplicações
Jogar joguinhos de ATARI e percorrer labirintos podem não ser tarefas muito interessantes para se ensinar a um computador. No entanto, o objetivo da DeepMind com esse projeto não é simplesmente criar um sistema capaz de jogar Pong muito bem: a empresa pretende criar uma inteligência artificial capaz de aprender o mais rapidamente possível sem que seja necessário que um agente externo a ensine novas tarefas.
O mesmo sistema UNREAL foi usado para ensinar a máquina a jogar todos os 53 joguinhos de ATARI e todas as fases do labirinto. Isso significa que um único código foi capaz de treinar um sistema de inteligência artificial a realizar tarefas muito diferentes, com mais habilidade e mais rapidamente que humanos aprenderiam.
Embora os cientistas tenham dito à Bloomberg que “ainda é cedo demais para falar em aplicações no mundo real”, se o sistema UNREAL funciona para ensinar as máquinas a jogar ATARI, ele pode também ser usado para ensinar tarefas diferentes. Algumas das aplicações das inteligências artificiais da DeepMind são reduzir enormemente a conta de luz do Google, imitar vozes humanas e estilos musicais, combater cegueira, ajudar no tratamento de câncer e, mais famosamente, vencer o campeão mundial de Go.