Cientistas alteram nomenclatura de genes humanos para driblar problemas com Excel

Organização do Genoma Humano preferiu determinar um novo esquema de nomes para evitar que o software interpretasse dados como datas
Renato Santino07/08/2020 20h56

20190628103020

Compartilhe esta matéria

Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

Não é só nos escritórios do mundo que o Excel, da Microsoft, é amplamente utilizado. Ele também é amplamente utilizado por cientistas e pesquisadores de todos os tipos, e um sinal de sua popularidade com este público foi dada com o fato de que um setor inteiro dos estudos da biologia precisaram criar novos esquemas de nomenclaturas para se adaptar à forma como o aplicativo interpreta dados.

De fato, como relata o site The Verge, cientistas do ramo da genética encontravam problemas ao inserir nomes de genes alfanuméricos como MARCH1, sigla para Membrane Associated Ring-CH-Type Finger 1. A informação era interpretada como uma data, 1º de março, e corrigida automaticamente pelo Excel.

Pode parecer um problema trivial, mas é recorrente o suficiente para afetar regularmente o resultado de pesquisas da área de genética, fazendo com que dados sejam corrompidos e interpretados incorretamente. Como relata a publicação, um estudo de 2016 nota que cerca de 20% dos dados genéticos compartilhados em 3.597 estudos foram afetados por questões de formatação do Excel.

O resultado desse descompasso entre a ciência e o Excel fez com que, ao longo do último ano, 27 genes humanos fossem renomeados para que eles parassem de ser interpretados como datas pelo aplicativo da Microsoft. As alterações, no entanto, só foram formalizadas nesta semana pelo Comitê de Nomenclatura de Genes da Organização do Genoma Humano (HGNC).

Pelas novas normas, o gene representado pelo símbolo MARCH1, como mencionado no exemplo, agora passa a se chamar MARCHF1; outro exemplo, a sigla SEPT1, que poderia ser interpretado como 1º de setembro, passa a ser SEPTIN1. A justificativa do HGNC em suas novas diretrizes é justamente modificar símbolos que “possam afetar o manuseio e a recuperação de dados”, sem citar diretamente o Excel, mas a questão é bem clara.

O Excel até permite, para quem tem o conhecimento para isso, driblar essa questão. Ao configurar a formatação de uma coluna inteira para apenas Texto, o aplicativo para de tentar corrigir os dados para o formato de data, mas a chance do erro ainda está lá. Ainda existe muita margem para erros resultantes de mera distração, especialmente se falarmos de planilhas com milhares de linhas.

Renato Santino é editor(a) no Olhar Digital