Pesquisadores da Universidade da Califórnia, em São Francisco, criaram um dispositivo que poderia ser obra de algum filme de ficção científica. Os espectadores da sala de cinema dessa suposta produção futurística pensariam que a tecnologia estaria a muitos anos e estudos longe da realidade. A equipe de pesquisa liderada pelo neurocientista Gopala Anumanchipalli mostrou que estavam enganados: um implante vocal computadorizado capaz de criar fala verbal a partir de ondas cerebrais já faz parte das nossas vidas – pelo menos da comunidade científica.
O sistema do trato vocal virtual se conecta diretamente ao cérebro e sintetiza fala a partir de sinais cerebrais associados com os aspectos mecânicos da fala, como movimentos da mandíbula, laringe, lábios e língua. Eventualmente, o dispositivo poderia ser usado por pessoas que perderam a capacidade de falar. A pesquisa foi publicada nesta quinta-feira (25) na renomada científica revista Nature.
Dispositivos convencionais – ou ultrapassados? – que geram falas inteligíveis, geralmente se baseiam em movimentos não verbais para produzir palavras, como contrações das pálpebras ou da cabeça. O funcionamento desses aparelhos, no entanto, é demorado. Exige que os usuários soletrem letra por letra e, por isso, produzem de seis a dez palavras por minuto – enquanto a fala natural forma de 100 a 150 no mesmo tempo.
Por conta disso, o dispositivo criado por Anumanchipalli e sua equipe poderia melhorar em grandes proporções a qualidade de vida de pessoas que perderam a capacidade de falar por Parkinson, esclerose lateral amiotrófica (ELA) ou outra lesão cerebral.
O neurocientista não foi o primeiro a usar sinais cerebrais para produzir fala em 2019. Em janeiro, uma equipe liderada pelo neurocientista Nima Mesgarani, da Universidade de Columbia, conseguiu produzir fala robótica a partir da síntese de sinais cerebrais que uma pessoa produz ao ouvir palavras. Para isso, Mesgarani utilizou Inteligência Artificial e aprendizagem de máquina. Nos testes, ouvintes puderam identificar corretamente as palavras emitidas (dígitos de zero a nove) em cerca de 75% das vezes. Conseguiram até dizer se o orador era masculino ou feminino. Aqui é possível ouvir o som produzido.
O estudo se diferencia da pesquisa da Universidade da Califórnia, porque, enquanto este decodifica sinais cerebrais de sons ouvidos, a experiência de Anumanchipalli decodifica os sinais cerebrais responsáveis pela fala verbal.
Porém, não pense que o sistema consegue decodificar pensamentos ou falas imaginárias. Isso ainda é assunto para ficção científica – estudos atuais ainda não alcançaram esse conhecimento. A pesquisa de Anumanchipalli utiliza sinais da atividade neural de sensações (percepção de fala) ou atividade neural motor (produção da fala, como no novo dispositivo).
Como chegaram nos resultados
Anumanchipalli e seus colegas recrutaram cinco pacientes com epilepsia que deveriam passar por uma cirurgia no cérebro para tratar a doença. Nenhum deles tinha problemas com a fala natural e eram falantes nativos de inglês. Para captar os sinais, cirurgiões implantaram matrizes de eletrodos nas áreas cerebrais associadas à fala dos participantes. Então, pediam para falarem centenas de frases em voz alta.
Os dados coletados foram decodificados por um algoritmo de aprendizagem de máquina e ligados a movimentos específicos do trato vocal. Depois da decodificação dos sinais cerebrais, um sintetizador os converteu em fala inteligente e audível. Assim, os neurocientistas criaram o trato vocal virtual que produz palavras.
Os pesquisadores, então, testaram o sistema em um voluntário. Ele foi instruído a fazer movimentos da fala, em voz alta (verbal) e sem emitir sons (subvocal). Alimentado com esses dados, o trato vocal produziu fala verbal inteligível com uma clareza surpreendente.
O som produzido foi testado com por centenas de falantes nativos de inglês. Os participantes conseguiram transcrever corretamente cerca de 70% das palavras que escutavam. Muitas dos erros eram mínimos, confundidos por expressões parecidas, como “rodent” (roedor) em vez de “rabbit” (coelho).
Por outro lado, os pesquisadores ponderam que ainda não é possível afirmar se o sistema pode ser usado por pessoas que nunca foram capazes de falar. Até o momento, o trato vocal poderias apenas ajudar pessoas que perderam a capacidade da fala.
Via: GizModo