DeepCube é o nome de um programa criado por pesquisadores de ciência da computação da Universidade da Califórnia em Irvine, nos Estados Unidos. O sistema consiste em uma inteligência artificial que, segundo seus criadores, aprendeu sozinha a resolver um cubo mágico.
Também conhecido como “Cubo de Rubik”, em alusão ao seu criador, o húngaro ErnÅ Rubik, este famoso quebra-cabeças consiste em uma peça de seis lados, cada lado com nove adesivos coloridos. O objetivo é reunir todos os adesivos de uma cor só em cada lado, girando as linhas e colunas em torno do eixo do cubo.
O quebra-cabeças ficou tão famoso que muita gente dedica a vida a descobrir maneiras de resolver o cubo no menor tempo possível. Há máquinas capazes de fazê-lo até em menos de um segundo. Mas o DeepCube é, supostamente, a primeira máquina a resolver um cubo mágico sem interferência humana.
O desafio é mais complexo do que pode parecer, como explica o MIT Review. Há sistemas de IA capazes de vencer humanos em jogos como xadrez e Go, mas, diferentemente desses jogos, resolver um cubo mágico é mais difícil para uma máquina porque ela não tem como saber quando um movimento no jogo é bom ou ruim.
Sistemas de inteligência artificial são treinados, geralmente, por uma técnica conhecida como “aprendizagem por reforço”. Isto significa que, para aprender a realizar uma tarefa sozinha, a máquina é recompensada por tomar uma atitude “correta” e punida em caso de uma atitude “incorreta”. Por tentativa e erro, o sistema aprende o que é que se deve fazer.
Mas, no caso de um cubo mágico, não é fácil perceber quando um movimento foi “errado”. Só dá para saber se aquela jogada foi correta ou não quando se chega ao fim do cubo e se resolve o quebra-cabeças; antes disso, não. Também não ajuda o fato de que existem mais de 43 quintilhões de combinações possíveis para um cubo mágico, das quais apenas uma importa.
Resumindo: o desafio dos cientistas da Universidade da Califórnia era criar um sistema capaz de aprender, sozinho, uma maneira de resolver um cubo mágico, sem a ajuda de humanos e sem usar algoritmos ou estratégias já conhecidas ou previamente programadas no seu código.
É aí que entra a Iteração Autodidática, a técnica usada pelos cientistas norte-americanos na criação do DeepCube. Ela permite que a máquina descubra se o movimento que ela está “pensando” em fazer é uma jogada boa ou ruim, mesmo sem ter recompensas para uma boa ou uma má jogada. Como ela faz isso? Montando o cubo mágico de trás para frente.
Funciona assim: o sistema analisa o estado em que o cubo está, com as cores dispersas aleatoriamente, e gera uma proposta de movimento. Para saber se esse movimento é bom ou ruim, o DeepCube “imagina” o cubo completo, com todas as cores no lugar, e vai desmontando-o até chegar ao estado em que ele está agora.
Assim, a máquina sabe se o movimento proposto vai ajudar a resolver o cubo ou não. Como dá para perceber, não é um processo fácil. Cada movimento do cubo é exaustivamente analisado pelo DeepCube antes de ser tomado, para evitar “chutes” que não levem a nada. Mas o resultado, segundo os autores do estudo, é preciso.
“Nosso algoritmo foi capaz de resolver 100% dos cubos bagunçados aleatoriamente com, em média, apenas 30 movimentos – menos ou o mesmo que pessoas que empregam conhecimento de domínio humano”, explicaram os autores do estudo. O DeepCube foi até capaz de criar suas próprias estratégias, como começar a arrumar o cubo por um dos cantos e depois fazer o resto, por exemplo.
Todo o processo de aprendizagem levou 44 horas, enquanto o sistema analisava 2 milhões de combinações diferentes em mais de 8 bilhões de cubos virtuais (alguns repetidos). Para alcançar tudo isso, o DeepCube foi executado num servidor com processador Intel Xeon E5-2620 com 32 núcleos e três GPUs Titan XP da Nvidia.
Qual a vantagem disso tudo? Os cientistas explicam que ensinar máquinas a resolver problemas sem a ajuda humana nos deixa um passo mais próximos de sistemas de inteligência artificial realmente autônomos. Isso pode contribuir para a criação de carros mais inteligentes e até robôs de resgate mais eficientes. O próximo desafio do DeepCube, segundo o Gizmodo, é resolver um quebra-cabeças de 16 lados.