Estamos vivendo uma expansão de sistemas de inteligência artificial capazes de interpretar e gerar textos escritos. Mas há uma tendência curiosa neste campo de pesquisa: muitos dos modelos de aprendizado de máquina desenvolvidos tem nomes de Muppets, os bonecos da Vila Sésamo (Sesame Street, em inglês). Por quê?
Ao que parece, tudo é fruto de uma piada que saiu de controle. O primeiro modelo de IA com nome de um personagem da vila foi Elmo, desenvolvido pelo Instituto Allen (fundado por Paul Allen, co-fundador da Microsoft) em 2007.
Segundo Matt Peters, autor de um artigo descrevendo a pesquisa, havia uma lista de letras e termos que poderiam ser usados no nome. Um dos membros da equipe sugeriu ELMo (Embeddings for Language Models) e o nome “pegou”. Em parte porque é fácil de lembrar, mas também porque o filho de Peters tinha três anos na época, e foi uma forma que o pesquisador encontrou de dedicar seu trabalho a ele.
Em 2018 uma equipe do Google desenvolveu um modelo de linguagem chamado BERT (Bidirectional Encoder Representations from Transformers), que reconhecia o trabalho anterior no ELMo. Os resultados foram tão bons que foram incorporados no mecanismo de busca do Google para entender o contexto das buscas. Uma vez que o modelo foi divulgado, outros pesquisadores começaram a aprimorá-lo, e mantiveram a tradição de batizar derivados com nomes de personagens da Vila Sésamo.
Isso é conhecido como um “backronym”, um termo que é inventado para explicar uma sigla (Como o GNU de GNU/Linux: “GNU is Not Unix”). Por isso hoje temos ERNIE, KERMIT (nome em inglês do sapo Caco) e Big BIRD (conhecido por aqui como Garibaldo). A coisa chegou a um ponto que toda uma categoria de software para IA é conhecida como “Muppetware”.
Como explica Oren Etzioni, CEO do Allen Institute, é uma maneira séria de reconhecer uma “dívida intelectual” dentro do mundo da IA. “O Elmo foi batizado assim como uma brincadeira, mas o BERT baseia-se diretamente nas idéias do ELMo; Grover utiliza BERT, etc. ”, Etzioni disse ao site The Verge por e-mail. “Enfatizar o crédito devido ao ELMo é muito importante para nós”.
Fonte: The Verge