Um dos maiores problemas dos assistentes digitais como a Siri, da Apple, é a voz robótica que faz com que eles não falem com muita naturalidade. Mas as empresas por trás desses assistentes estão buscando soluções para isso, e a Apple usou a aprendizagem de máquina para fazer a Siri parecer menos um robô.
Em um artigo, pesquisadores da Apple detalharam o trabalho feito para garantir que a Siri falasse com mais naturalidade a partir do iOS 11, que deve ser liberado para usuários nas próximas semanas.
Os desenvolvedores da Apple coletaram diversas horas de áudio de alta qualidade para criar as respostas com voz, e a partir disso criaram um sistema texto-voz (TTS, na sigla em inglês). Com o áudio gravado sendo usado como base, esse sistema aprendeu a destacar trechos de fala que, juntos, soam naturais. Ao todo foram gerados entre 1 e 2 milhões de segmentos de áudio que foram usados pelo sistema de aprendizagem de máquina.
No artigo, a Apple colocou amostras de áudio da Siri no iOS 9, 10 e 11, e a diferença para a nova versão é bastante perceptível. No entanto, a mudança só deve valer inicialmente para a versão em inglês da Siri, e apenas no futuro ela deve ganhar uma voz mais natural também em outros idiomas.