Pesquisadores da Universidade de East Anglia, no Reino Unido, desenvolveram um sistema que consegue interpretar as palavras ditas por um ser humano por meio da leitura labial. A tecnologia usa o aprendizado de máquina para classificar o aspecto visual de sons produzidos na fala. Em testes, mesmo sem conhecer o contexto das frases, o sistema se mostrou capaz de entender com maior grau de precisão até que os leitores de lábios humanos.
O principal desafio para as técnicas de leitura labial é que existem, pelo menos para o olho humano, menos dicas visuais do que sonoras, em palavras com P, B e M, por exemplo, o que normalmente causa dificuldades na tarefa. No entanto, os novos sistemas são capazes de distinguir pequenas variações entre as pronúncias, algo que as pessoas não conseguem perceber.
Aplicações
Por enquanto, o sistema está em fase de testes, mas, segundo os pesquisadores, existem dezenas de aplicações para a tecnologia, como ajudar deficientes auditivos, melhorar o entendimento de vídeos de câmeras de segurança sem áudio e até automatização de legendas.
Via TechCrunch