Que o Google vem há anos aperfeiçoando os meios de tradução não é uma novidade. Através de seu blog oficial, a empresa apresentou sua mais nova aposta no campo da tradução. O Translatotron é uma ferramenta capaz não só de traduzir o que é dito em um idioma e pronunciá-lo em outro, mas também imitar a voz de quem disse a frase.
Com esse novo sistema, o Google planeja melhorar a comunicação entre pessoas que falam idiomas diferentes. O recurso funciona de uma forma distinta do conhecido sistema de cascata que conhecemos, em que a frase é traduzida na forma como está escrita, sem respeitar regras linguísticas, por exemplo. Com a nova ferramenta, ele passará a funcionar de sequência em sequência, com isso, haverá uma melhora na velocidade, nos erros provenientes dessas traduções e na tradução em si.
Com esse sistema, a empresa pretende mostrar que a fala pode ser traduzida de uma língua para a outra sem a necessidade de uma representação intermediária de texto em qualquer um dos dois idiomas – como o sistema de cascata necessita. Para que isso seja possível, é usado um Vocoder Neural, que se encarrega de sintetizar a voz humana e dar a forma desejada para as ondas de saída, esse codificador é capaz de preservar as características da voz gravada.
Em resumo, o Translatotron consegue registrar as características do discurso de um interlocutor, além de sua voz. Com isso, ele consegue gerar um áudio traduzido para o idioma de destino, mantendo as características de fala. O grande objetivo do Google é fazer com que os assistentes do futuro busquem a naturalidade da conversação desses sistemas.
Como forma de comparação, o Google mostrou como o Translatotron funciona em modelo de cascata, basicamente o que é utilizado pela maioria dos assistentes de hoje, que apresentam uma linguagem meio travada e sequencial. Em seguida, o teste foi feito com a nova tecnologia, e a diferença é bastante clara.
A empresa está transformando a fala travada e muitas vezes robótica, em algo natural e com características de pronúncia próprias. Os testes com o tradutor ainda estão em andamento, mas já podemos prever que a tecnologia avança em passos largos para a criação assistentes cada vez mais humanos.
A tecnologia do Translatotron
O surgimento desse modelo de tradução de fala começou em 2016, quando foi demonstrado a sua viabilidade de uso como modelo de tradução de fala para texto. Em 2017, foi demonstrado que esses modelos de tradução de um idioma para outro em formato de voz pode substituir o modelo de cascata.
Agora, o Translatotron está se consolidando como o único modelo de tradução que pode traduzir diretamente a fala de uma linguagem para outra, sem depender de um intermédio. No próprio blog da empresa, é possível se ter uma ideia de como funciona esse sistema por meio dos áudios de comparação que foram disponibilizados pelo Google.
Fonte: Blog do Google
Via: Genbeta