Os robôs foram capazes de pegar e mover objetos por décadas, porém isso só acontecia se eles fossem programados com instruções exatas para concluir os movimentos. As redes neurais abriram novas fronteiras na pesquisa de robótica, dando às máquinas a capacidade de lidar com objetos de tamanhos e condições inesperados. O Google vendeu alguns de seus projetos de robótica há poucos anos, mas se concentrou e investiu no aprendizado de máquina. Seus pesquisadores de IA criaram um braço robótico que entende a física de jogar objetos. O feito é mais impressionante do que parece.
Nós todos sabemos como jogar algo em uma lixeira – é uma habilidade desenvolvida quando ainda somos crianças. Porém, ensinar o aspecto intuitivo de um movimento para uma máquina é tarefa complexa. Você pode alterar a maneira como segura algo com base em sua forma, densidade e peso. O “TossingBot”, do laboratório de robótica do Google, usa várias redes neurais para lançar objetos de maneira ainda mais eficiente do que um humano.
Em seu primeiro anúncio, a inovação acompanhava vários itens aleatórios, mas não sabia como jogá-los nas caixas certas. A máquina aprendeu a lidar com esses objetos quando integrou física simples ao aprendizado profundo. O sistema tem uma câmera aérea mostrando os objetos possíveis e três redes neurais que informam o que fazer. Uma rede reconhece objetos dentro da caixa, uma segunda determina como pegá-los e, por fim, uma terceira descreve como jogá-los no contêiner certo. As redes foram sendo melhoradas a partir de tentativas repetidas — que costumam falhar muito no início. De acordo com os engenheiros, o TossingBot agora é melhor em jogar coisas do que os humanos que o projetaram.
Segundo a fabricante, o lançamento pode ser uma boa estratégia para um robô ao mover certos objetos — que não sejam frágeis. Nós, humanos, fazemos isso o tempo todo, porque é mais rápido e leva as coisas para áreas que não podemos alcançar. E é exatamente por isso que o TossingBot tem que apontar para compartimentos fora de seu alcance físico. Ele pode processar mais de 500 itens por hora, enquanto um robô que trabalha com predefinição faz apenas 200-300 itens no mesmo intervalo de tempo.
O Google também está projetando esses novos robôs para serem bons em tarefas designadas — a aparência humana ou animalesca não é um objetivo. Todos nós já vimos os máquinas perturbadoramente orgânicas da Boston Dynamics, que o Google vendeu no ano passado. Elas são capazes de navegar de forma mais eficaz em um mundo dominado por humanos, mas não são particularmente boas em nenhuma tarefa específica. O Atlas pode pegar uma caixa e movê-la para outro local, mas o TossingBot classifica uma grande quantidade de objetos diferentes no mesmo tempo. Os armazéns do futuro provavelmente serão automatizados por dispositivos como o TossingBot — movido por redes neurais, e não robôs atlas humanóides.