Depois de dominar o jogo de Go e superar até mesmo os grandes campeões do jogo de tabuleiro, a DeepMind decidiu ir além. Comprada pelo Google em 2014, a empresa decidiu usar sua tecnologia de inteligência artificial para dominar o jogo Quake 3 em uma disputa na modalidade “Capture a bandeira”.

O desafio em casos como esse é fazer com que a máquina entenda as regras e descubra o método mais eficaz de jogar oferecendo o mínimo possível de informação pré-programada no sistema. Como informa o site The Verge, na prática, a técnica utilizada para alcançar o objetivo é um grande aprendizado por tentativa e erro, no qual os computadores competem entre si, partindo de pouco ou nenhum conhecimento do jogo e aos poucos vão entendendo o que funciona e o que não funciona para definir as melhores estratégias.

Para alcançar esse objetivo, no entanto, foi necessário muito treino. A DeepMind relata que foram necessárias cerca de 500 mil partidas, cada uma realizada em um tempo de 5 minutos, o que equivale a mais de 1.700 dias de treinamento. O tempo real de treino, no entanto, pode variar, porque várias partidas podem ser realizadas simultaneamente.

O experimento utilizou 30 agentes diferentes no experimento, o que garantiu a criação de uma variedade de estilos de jogo. O resultado disso foi que a empresa observou coisas interessantes, como a capacidade de criar um espírito de cooperação entre as máquinas para conclusão da missão e do rápido aprendizado de estratégias interessantes para o jogo, indo muito além das regras básicas. Em pouco tempo, as inteligências artificiais aprenderam táticas como deixar alguém guardando sua bandeira para impedir que o inimigo a capturasse e seguir seus companheiros de time para ter superioridade numérica no caso de encontrar um adversário, além de acampar próximo da base inimiga.

publicidade

Os pesquisadores também tomaram cuidado para não “viciar” a inteligência artificial em um único mapa, incentivando a criação de estratégias genéricas que funcionem em qualquer cenário. Para isso, a DeepMind realizou os experimentos em mapas gerados de forma procedural, que mudavam a cada partida, forçando as máquinas a se adaptarem a novas situações a cada novo jogo.

Depois de todo esse processo, a empresa colocou suas máquinas para medir suas capacidades contra humanos. Para isso, foi organizado um torneio com vários times compostos com dois jogadores; algumas das equipes eram totalmente formadas por inteligências artificiais, outras eram totalmente humanas e alguns times eram uma mistura de um humano e um robô. Os resultados mostraram que as equipes de máquinas tinham 74% de probabilidade de vitória. O estudo também mostrou que as chances caíam para 65% quando a competição envolvia grupos maiores, o que indica que as máquinas ainda não estão tão preparadas para dinâmicas mais complexas de cooperação.

Sempre é importante observar que este tipo de pesquisa não tem como finalidade tornar as máquinas superiores aos humanos em jogos eletrônicos. A ideia é utilizar o aprendizado com estes experimentos e aplica-los para fins reais, ajudando máquinas a realizar tarefas complexas, navegar por ambientes diversos e cooperar para a realização de uma tarefa. Como essa tecnologia será usada no futuro permanece um mistério, no entanto.