Uma equipe de estudantes desenvolveu um software de aprendizado de máquina feito para conseguir quebrar um dos principais desafios em processamento de linguagem natural: o reconhecimento de sarcasmo. 

O software foi chamado de TrueRatr, fruto de uma colaboração de estudantes da Universidade Cornell que participavam de um desafio tecnológico, e da Bloomberg. O projeto foi originalmente pensado para detectar críticas negativas irônicas a produtos vendidos online, mas a ferramenta teve seu código aberto, o que significa que ela pode ganhar novas aplicações no futuro (quem sabe um detector de sarcasmo no Facebook? Seria útil…). 

O trabalho complexo vai contra as pesquisas antigas sobre o que define o sarcasmo. Tentativas anteriores se baseavam em palavras e expressões que serviam como pistas, como, por exemplo “yeah, right” (que seria similar a um “ah, claro” no bom português sarcástico). No entanto, a nova pesquisa se baseia na “troca de sentimento”, que é o uso de palavras positivas e negativas ao mesmo tempo. 

Christopher Hong, mentor da equipe de estudantes, e que já havia pesquisado a detecção de sarcasmo, dá o exemplo da seguinte frase: “eu adoro quando gritam comigo”. “Adorar” é um sentimento positivo, enquanto “gritar comigo” é algo negativo. Assim, a frase deve denotar o sarcasmo. 

Com esta base sentimental, o sistema foi treinado e pode ser testado. O resultado foi de 71%, o que, apesar de não ser excelente, é melhor do que um cara-ou-coroa, indicando que não se trata de adivinhação ou sorte. No entanto, a base de comparação foi relativamente pequena, com apenas 50 avaliações comuns e 50 avaliações sarcásticas de produtos na Amazon. 

Os desenvolvedores decidiram transformar o TrueRatr em algo útil para o consumidor comum: uma ferramenta capaz de filtrar e corrigir a distorção causada por avaliações sarcásticas em aplicativos do Mac OS X e iOS. O algoritmo analisa as avaliações e tenta eliminar aquelas que considera sarcásticas para fazer com que o índice seja mais honesto. Por exemplo: o aplicativo da Uber, quando removidas as análises sarcásticas, teve sua nota aumentada de 3,5 estrelas para 4. Ao mesmo tempo, o jogo Grand Theft Auto: Chinatown caiu de 4,5 estrelas para 3,9. 

Como o algoritmo ainda não é 100% confiável, estas análises ainda são questionáveis. No entanto, o código aberto do TrueRatr, que pode ser acessado aqui, permite que desenvolvedores do mundo inteiro colaborem. Além disso, é possível ter acesso a amostras muito maiores de texto que permitirão que a inteligência artificial melhore com o tempo em reconhecer o sarcasmo.

Via Ars Technica