Depois de dominar o jogo de Go e superar até mesmo os grandes campeões do jogo de tabuleiro, a DeepMind decidiu ir além. Comprada pelo Google em 2014, a empresa decidiu usar sua tecnologia de inteligência artificial para dominar o jogo Quake 3 em uma disputa na modalidade “Capture a bandeira”.
O desafio em casos como esse é fazer com que a máquina entenda as regras e descubra o método mais eficaz de jogar oferecendo o mínimo possível de informação pré-programada no sistema. Como informa o site The Verge, na prática, a técnica utilizada para alcançar o objetivo é um grande aprendizado por tentativa e erro, no qual os computadores competem entre si, partindo de pouco ou nenhum conhecimento do jogo e aos poucos vão entendendo o que funciona e o que não funciona para definir as melhores estratégias.
Para alcançar esse objetivo, no entanto, foi necessário muito treino. A DeepMind relata que foram necessárias cerca de 500 mil partidas, cada uma realizada em um tempo de 5 minutos, o que equivale a mais de 1.700 dias de treinamento. O tempo real de treino, no entanto, pode variar, porque várias partidas podem ser realizadas simultaneamente.
O experimento utilizou 30 agentes diferentes no experimento, o que garantiu a criação de uma variedade de estilos de jogo. O resultado disso foi que a empresa observou coisas interessantes, como a capacidade de criar um espírito de cooperação entre as máquinas para conclusão da missão e do rápido aprendizado de estratégias interessantes para o jogo, indo muito além das regras básicas. Em pouco tempo, as inteligências artificiais aprenderam táticas como deixar alguém guardando sua bandeira para impedir que o inimigo a capturasse e seguir seus companheiros de time para ter superioridade numérica no caso de encontrar um adversário, além de acampar próximo da base inimiga.
Os pesquisadores também tomaram cuidado para não “viciar” a inteligência artificial em um único mapa, incentivando a criação de estratégias genéricas que funcionem em qualquer cenário. Para isso, a DeepMind realizou os experimentos em mapas gerados de forma procedural, que mudavam a cada partida, forçando as máquinas a se adaptarem a novas situações a cada novo jogo.
Depois de todo esse processo, a empresa colocou suas máquinas para medir suas capacidades contra humanos. Para isso, foi organizado um torneio com vários times compostos com dois jogadores; algumas das equipes eram totalmente formadas por inteligências artificiais, outras eram totalmente humanas e alguns times eram uma mistura de um humano e um robô. Os resultados mostraram que as equipes de máquinas tinham 74% de probabilidade de vitória. O estudo também mostrou que as chances caíam para 65% quando a competição envolvia grupos maiores, o que indica que as máquinas ainda não estão tão preparadas para dinâmicas mais complexas de cooperação.
Sempre é importante observar que este tipo de pesquisa não tem como finalidade tornar as máquinas superiores aos humanos em jogos eletrônicos. A ideia é utilizar o aprendizado com estes experimentos e aplica-los para fins reais, ajudando máquinas a realizar tarefas complexas, navegar por ambientes diversos e cooperar para a realização de uma tarefa. Como essa tecnologia será usada no futuro permanece um mistério, no entanto.