Um sistema de inteligência artificial do Google, chamado DeepMind, atingiu o ranque mais alto no jogo StarCraft II após apenas 44 dias. Considerado o maior desafio para o sistema até então, o robô tinha como objetivo se tornar o melhor possível sem que os outros jogadores soubessem que estavam enfrentando uma máquina.

A companhia já havia causado furor ao anunciar que o AlphaGo havia vencido um dos melhores jogadores de Go (um jogo de tabuleiro chinês) do mundo. Poucos meses depois, venceu o número um do mundo. A inteligência artificial também foi capaz de masterizar o xadrez. No entanto, o Google procurou um outro desafio, encontrado em StarCraft II, um jogo de estratégia em tempo real (RTS).

Reprodução

O objetivo era chegar entre os 200 melhores jogadores do planeta, por meio dos servidores públicos do game, como um jogador comum faria. Isso significa que o AlphaStar, como foi batizado, deveria enfrentar oponentes cada vez mais habilidosos e vencê-los. Alguns pontos do StarCraft interessavam aos pesquisadores: é jogado em tempo real, com milhões de ações possíveis por segundo e um rol muito mais complexo que seis peças de xadrez. E, o mais importante de tudo, era conter informações secretas, já que nos primeiros minutos de jogo é impossível saber os planos adversários. O sistema deveria planejar a estratégia sozinho.

Por isso, os planos deveriam ser flexíveis, para incorporar surpresas e emboscadas dos oponentes. Os jogadores foram avisados de que o robô estaria online, podendo optar por enfrentá-lo. Contudo, para que o AlphaStar subisse no ranking de forma justa, ele teve de jogar partidas anônimas, evitando que os players tentassem enganar ou se esforçar mais para vencer.

“Houve um certo meme onde as pessoas perguntavam ‘você é o AlphaStar?’ aos outros”, disse David Silver, um dos autores do projeto, em entrevista ao The Guardian. “Nós tínhamos a política de não usar o chat – a não ser desejar boa sorte e bom jogo”. 

Reprodução

O silêncio durante o jogo é algo comum, mas a necessidade de permanecer anônimo transformou a experiência em uma espécie de teste de paciência. “O AlphaStar deveria jogar como um humano bom, não como um super humano”, disse Oriol Vinyals, colega de Silver. Isso implica em diferentes abordagens das IAs anteriores, que tendiam a se apoiar em habilidades que só um computador poderia ter, como tomar milhares de ações por minuto, ou saber todas as informações do jogo, até as escondidas no início.

Os pesquisadores então adicionaram uma noção de câmera, que impedia que o AlphaStar fosse onisciente. Nas primeiras séries de partidas disputadas publicamente, o robô apresentou alguns comportamentos mecânicos, como cair em uma mesma estratégia diversas vezes.

Curiosamente, a máquina (inicialmente aprendendo por imitação dos trejeitos humanos) desenvolveu seu próprio entendimento das táticas do jogo. “AlphaStar foi uma experiência incrível”, conta Oriol. “Não porque ganhamos da maioria dos humanos – quer dizer, vencemos 99,8%. Mas sim porque pudemos ver algumas limitações para inspirar pesquisas futuras. Pegar desafios cada vez maiores e tentar vencê-los claramente é o caminho”.