Boa vontade aliada à tecnologia traduz fotos e vídeos para deficientes visuais

Redação07/04/2017 16h48, atualizada em 08/04/2017 22h00

Compartilhe esta matéria

Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

O leitor de tela é a principal tecnologia de inclusão digital para deficientes visuais. O software que transforma em áudio todo o texto presente na tela do computador – hoje também disponível em tablets e smartphones – permite que a pessoa cega ou com baixa visão consiga navegar e ter uma vida online “quase” completa.

Quase”, porque já há algum tempo (principalmente nas redes sociais), a internet se tornou extremamente visual. As publicações de fotos e vídeos são cada vez mais presentes nas timelines. E todo mundo quer ter acesso a esse conteúdo, mesmo que não seja possível enxergá-lo. Mas se não tem tecnologia para “ler” fotos, como faz?

O uso de hashtags específicas tem ajudado as pessoas com qualquer tipo de deficiência visual. Essas tags marcam conteúdos visuais – principalmente fotos – que trazem junto uma descrição do que existe naquela imagem. Além de tornar as imagens acessíveis, essas descrições também deixam os cegos em pé de igualdade no que diz respeito ao consumo de conteúdo.

Cuidado! Descrição de imagens não é a mesma coisa que legenda; não confunda. Enquanto a legenda complementa o sentido da imagem, a descrição tem a função de traduzir em palavras o que está sendo visto. A principal regra para descrever uma imagem para um deficiente audiovisual é ir direto ao ponto; sem julgar ou opinar sobre o que está sendo visto.

Embora ainda não exista uma solução tecnológica para descrever imagens com precisão, o Facebook já usa uma ferramenta de reconhecimento de objetos combinada com inteligência artificial que ajuda os usuários cegos a pelo menos terem uma noção do que se trata uma determinada foto. É uma descrição bastante supérflua e simples, mas já é alguma coisa…

Ainda falta muito a ser explorado por grandes empresas como o Google e o Facebook nesse sentido. Tudo bem, identificar o número de pessoas em uma imagem e dizer se aquele é um ambiente interno ou externo já é alguma coisa. Mas seria possível, por exemplo, usar também a geolocalização e até artifícios mais modernos de inteligência artificial para identificar o local da imagem e até se ela retrata algo já popular, como um ponto turístico ou um evento importante.

Enquanto essa tecnologia não aparece, mais de sete milhões de cegos e outros 21 milhões de pessoas com baixa visão – só no Brasil – continuarão contando com a boa vontade e disponibilidade daqueles que puderem “emprestar seus olhos” para descreve uma imagem com clareza e objetividade.

Colaboração para o Olhar Digital

Redação é colaboração para o olhar digital no Olhar Digital