Em resposta aos crescentes discursos de ódio no Facebook somados ao episódio do assassinato de George Floyd no fim de maio, o boicote de grandes empresas na rede social se tornou real após Zuckerberg se mostrar incapaz de agir incisivamente durante anos. A pauta influenciou o Centro de Estudos sobre Tecnologias Web (Ceweb.br) – do Núcleo de Informação e Coordenação do Ponto BR (NIC.br) – a desenvolver um projeto de pesquisa para a categorização de discursos de ódio na internet com uso de inteligência artificial.

Ainda em fase inicial, o programa, que ainda conta com as parcerias da Pontifícia Universidade de São Paulo (PUC) e Queen Mary University of London, consiste, além da categorização dos discursos de ódio, na criação de um código (em linguagem Python) capaz de identificar declarações hostis expostas na rede.

O instrumento tem como base um modelo de processamento de linguagem natural, e foi parametrizado com um conjunto de orações para detecção de manifestações de ódio. “Com isso, o algoritmo consegue identificar possíveis sentenças que possam conter algum tipo de violação ou ofensas, como racismo, intolerância religiosa ou xenofobia”, afirma Diogo Cortiz, especialista do Ceweb.br e um dos desenvolvedores do código.

 

codigo.jpg

Com mais de 700 linhas, projeto do código está disponível na plataforma GitHub para que interessados possam contribuir. Foto: NIC/Reprodução

 

Cortiz diz ainda que o projeto não tem o intuito de criar um sistema para retirada automática de conteúdos ou para investigações, mas de explorar as potencialidades da inteligência artificial no uso da linguagem natural nas redes sociais para categorizar os diferentes tipos de declarações.

Apesar de o projeto estar em fases introdutórias, Vagner Diniz, gerente do Ceweb.br, acredita que o código será importante na compreensão do fluxo de informações das redes mundiais. “Ainda não sabemos se esse algoritmo em que estamos trabalhando compartilha de características como equidade, confiabilidade e segurança, obrigatórias em quaisquer algoritmos de inteligência artificial. É por isso que convocamos a comunidade de pesquisadores e desenvolvedores a se juntar a nós no desenvolvimento desse código”, frisa.

Os interessados em acessar o projeto ou contribuir com o desenvolvimento do código podem visualizar o programa pelo perfil do cewebbr, no GitHub. É importante ressaltar que o código não é uma ferramenta pronta para uso. Pontos como validação do modelo e implementação de ferramentas adicionais na explicação do formato e na geração de um novo corpus de dados ainda precisam ser discutidos.

Via: NIC.br