Um grupo de pesquisadores da Califórnia, nos Estados Unidos, publicou ontem um estudo que descreve uma inteligência artificial que eles criaram inspirada no córtex visual – uma parte do cérebro – de humanos. Graças a essa inspiração, o sistema é capaz de resolver com facilidade os testes CAPTCHA da internet – aquelas pequenas interações que pedem que o usuário prove que “não é um robô”.
Trata-se, segundo os cientistas, de um novo modelo de inteligência artificial, que eles chamaram de Recursive Cortical Network (rede cortical recursiva), ou RCN. A principal vantagem dela é que ela não só consegue aprender a derrotar os testes CAPTCHA como consegue também aprender a fazer isso com muito menos treinamento do que os sistemas tradicionais de inteligência artificial.
Do olho para a máquina
O córtex visual é a parte do cérebro que traduz as linhas, cores e texturas que observamos em objetos que fazem sentido. Grupos diferentes de neurônios são responsáveis por reconhecer as linhas e as superfícies. Esses neurônios “conversam” entre si para entender quais linhas e quais superfícies compõem um objeto.
Como nosso cérebro reconhece os objetos com base nas partes que o compõem, nós conseguimos reconhecer esses objetos mesmo que eles estejam levemente borrados, de trás para frente ou de ponta-cabeça. As inteligências artificiais, normalmente, não têm essa capacidade. Elas são ensinadas a identificar os objetos por inteiro. Por isso, se elas vêem a letra “A” de ponta-cabeça, não conseguem interpretá-la; no máximo, elas pensam que é um “V” com um traço no meio.
Para contornar esse problema, os pesquisadores criaram um sistema semelhante ao do nosso córtex visual. Um conjunto de comandos identifica os contornos de uma imagem; outro foca nas superfícies da imagem. Em seguida, os contornos e superfícies são agrupados segundo sua proximidade física. O sistema então compara esses grupos com diversas outras imagens que já viu, e com base nisso consegue identificar cada objeto – mesmo que ele esteja alterado de qualquer maneira.
Alta eficiência
Uma vez criado o sistema, os pesquisadores treinaram-no a reconhecer as letras do alfabeto na fonte Georgia. Essa fonte foi escolhida por ser relativamente parecida com a maioria das fontes usadas em testes CAPTCHA. Eles mostraram então 260 imagens de caracteres individuais naquela fonte ao sistema para treiná-lo. Na sequência, os pesquisadores mostraram à máquina letras giradas parcialmente, para ver se ela tinha de fato aprendido.
Foi o caso. Ela conseguiu acertar as letras 94% das vezes. E quando teve que resolver testes CAPTCHA, ela acertou dois terços (cerca de 66,6%) das vezes. Trata-se de um resultado impressionante: entre humanos, a taxa de sucesso é de 87%, mas essa nem é a questão: o sistema pode ser considerado inútil do ponto de vista de segurança caso qualquer máquina tenha uma taxa de sucesso maior que 1% em enganá-lo, segundo o Ars Technica.
Não foi só o teste CAPTCHA que capitulou perante à RCN: ela conseguiu também enganar o sistema BotDetect com precisão semelhante. E também passou a perna nos sistemas do Yahoo e do PayPal, com taxa de 57% de sucesso. Ela conseguiu isso com muito menos treinamento do que as redes tradicionais, que necessitavam de mais de 50 mil imagens para atingir esses mesmos resultados (a RCN usou apenas 260).
Contra imagens
Quanto aos testes de identificação de imagens, a rede precisou de um pouco de treinamento extra. A equipe que a desenvolveu forneceu a ela informações sobre a relação entre as letras (quais costumam vir depois de qual) e a frequência do uso de imagens. Ela também foi treinada para reconhecer formas geométricas e, com isso, superou outras redes com uma margem de 1,9%.
De acordo com o Ars Technica, o resultado em si pode não impressionar. Mas chama a atenção o fato de que ela fez isso com muito menos treinamento – usou 1.406 imagens nesse caso, contra mais de 7,9 milhões das outras redes. Como o treinamento das redes neurais é a fase que mais leva tempo, a criação da RCN pode trazer uma nova era em que o acesso a sistemas de inteligência artificial extremamente capazes pode ser feito também por pessoas que não tenham acesso a muitos recursos computacionais.