Baidu, a empresa líder de buscas na internet na China, desenvolveu um sistema de reconhecimento de voz que consegue compreender inglês e mandarim. Chamado de ‘Deep Speech 2’, o sistema usa aprendizagem de máquina para realizar a tradução, aprendendo a reconhecer as palavras a partir do zero.

O aplicativo do Baidu para smartphones permitirá aos usuários fazerem pesquisas por voz e incluirá um assistente pessoal, chamado de Duer. Andrew Ng, chefe do Baidu, disse que historicamente as pessoas viam o chinês e o inglês como línguas muito distintas, logo, havia a necessidade de pesquisa um sistema capaz de envolver os idiomas.

O sistema de aprendizagem profunda já tem sido usado por várias empresas em suas técnicas de reconhecimento de fala e de imagens, como Google, Facebook e, agora, o Baidu. Ele foi significativamente favorecido com os avanços tecnológicos na área da computação.

publicidade

No desenvolvimento do ‘Deep Speech 2’, o Baidu também criou uma nova arquitetura de hardware para o aprendizado profundo que é sete vezes mais rápida do que a versão anterior. O pesquisador Jesse Engel afirmou que alta velocidade permitiu fazer a experiência a uma escala maior do que alcançado anteriormente. O chefe da empresa declarou estarem próximos de níveis humanos de reconhecimento.

Via MIT