A Microsoft anunciou uma conquista que pode melhorar a assistente pessoal Cortana e outras ferramentas do Office e Windows. A tecnologia de reconhecimento de fala da empresa reduziu a sua taxa de erros para 5,1% das palavras. Trata-se de um nível de precisão compatível com a de profissionais que trabalham com transcrição e que puderam ouvir os áudios múltiplas vezes durante o teste.
Para medir a exatidão do reconhecimento de fala, pesquisadores da Microsoft desenvolveram estudos para transcrever gravações do teste Switchboard. O material reúne cerca de 2.400 ligações telefônicas e é usado neste tipo de pesquisa desde a da década de 90. As tarefas envolviam converter conversas entre estranhos sobre diferentes assuntos, como esporte e política, para linguagem escrita.
Segundo a Microsoft Research, a melhora na precisão foi possível com o aperfeiçoamento no reconhecimento acústico e na previsão sonora da conversa. Além disso, os pesquisadores tornaram a ferramenta capaz de adivinhar palavras com base no histórico do bate-papo telefônico. Ao fim, os ganhos na exatidão foram de 12% em relação ao último ano, quando a taxa de erros ficou em 5,9%.
Embora ainda se tratem de pesquisas, os avanços podem impactar diretamente na vida do consumidor. A tendência é que produtos como a assistente pessoal Cortana, o serviço de tradução de apresentações do PowerPoint e também de inteligência artificial fiquem mais precisos e úteis no dia a dia.