Reconhecimento de fala da Microsoft se iguala a profissionais treinados

Redação22/08/2017 17h39, atualizada em 22/08/2017 19h54

20161018204213

Compartilhe esta matéria

Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

A Microsoft anunciou uma conquista que pode melhorar a assistente pessoal Cortana e outras ferramentas do Office e Windows. A tecnologia de reconhecimento de fala da empresa reduziu a sua taxa de erros para 5,1% das palavras. Trata-se de um nível de precisão compatível com a de profissionais que trabalham com transcrição e que puderam ouvir os áudios múltiplas vezes durante o teste.

Para medir a exatidão do reconhecimento de fala, pesquisadores da Microsoft desenvolveram estudos para transcrever gravações do teste Switchboard. O material reúne cerca de 2.400 ligações telefônicas e é usado neste tipo de pesquisa desde a da década de 90. As tarefas envolviam converter conversas entre estranhos sobre diferentes assuntos, como esporte e política, para linguagem escrita.

Segundo a Microsoft Research, a melhora na precisão foi possível com o aperfeiçoamento no reconhecimento acústico e na previsão sonora da conversa. Além disso, os pesquisadores tornaram a ferramenta capaz de adivinhar palavras com base no histórico do bate-papo telefônico. Ao fim, os ganhos na exatidão foram de 12% em relação ao último ano, quando a taxa de erros ficou em 5,9%.

Embora ainda se tratem de pesquisas, os avanços podem impactar diretamente na vida do consumidor. A tendência é que produtos como a assistente pessoal Cortana, o serviço de tradução de apresentações do PowerPoint e também de inteligência artificial fiquem mais precisos e úteis no dia a dia.

Colaboração para o Olhar Digital

Redação é colaboração para o olhar digital no Olhar Digital