Nova tecnologia da Nvidia promete melhorar videochamadas usando IA

Maxine é capaz de eliminar ruídos de fundo, traduzir e transcrever fala em tempo real e melhorar a qualidade de imagem, tudo isso consumindo um décimo da banda necessária em sistemas atuais
Rafael Rigues07/10/2020 15h23

20200907115919

Compartilhe esta matéria

Ícone Whatsapp Ícone Whatsapp Ícone X (Tweeter) Ícone Facebook Ícone Linkedin Ícone Telegram Ícone Email

A Nvidia anunciou nesta segunda-feira (5) uma nova plataforma de videoconferência que promete “resolver os problemas mais comuns em videochamadas”, como ruído de fundo e alto consumo de banda, entre outros.

Batizada de Maxine, a plataforma não é um produto para o consumidor mas sim um “kit de ferramentas” que as empresas podem implementar em seus produtos para videoconferência. A primeira parceira da Nvidia é a Avaya, empresa especializada em produtos e soluções para telecomunicações.

Maxine irá processar as chamadas na nuvem usando GPUs da Nvidia, e usar inteligência artificial para melhorar sua qualidade. Entre seus recursos estão remoção automática de ruído de fundo, upscaling da imagem para alta-definição, iluminação de rostos, reposicionamento do olhar (para que um participante pareça estar olhando para a pessoa com quem está falando, não para a tela) e tradução e transcrição de voz em tempo real.

Mas a promessa mais impressionante é um novo método de transmissão de vídeo que promete reduzir o consumo de banda em “um décimo” do necessário para uma chamada usando o popular codec H.264.

Isso é feito usando IA que roda nos servidores, analisa a imagem de origem e transmite apenas “pontos-chave” do rosto para o cliente, que “anima” a imagem para corresponder aos movimentos. Grosso modo, é como se em vez de transmitir vídeo de uma marionete dançando o servidor transmitisse apenas os movimentos das cordas que fazem o boneco se mexer, e usasse a informação para recriar a dança do outro lado.

Segundo Richard Kerris, gerente geral de mídia e entretenimento da NVidia, “todos já experimentamos momentos em que a largura de banda foi uma limitação nas videochamadas que fazemos diariamente nestes dias. Se aplicarmos IA a este problema podemos reconstruir a diferença entre as cenas em ambos os lados e transmitir apenas o que é necessário, reduzindo a largura de banda necessária significativamente”.

A demanda por videochamadas e telepresença causada pela pandemia de Covid-19 causou uma “corrida armamentista” entre os desenvolvedores de software, que estão redobrando esforços para implementar recursos que resolvam os problemas mais comuns do dia-a-dia para conquistar usuários.

Em março o Zoom ganhou planos de fundo virtuais, para reduzir distrações e esconder a “bagunça” atrás de você no escritório. E tanto o Teams quanto o Google Meet ganharam redução inteligente de ruídos, algo muito útil para quem tenta trabalhar em um ambiente doméstico, onde o barulho de crianças ou de vizinhos usando uma furadeira podem atrapalhar uma reunião.

Ainda não há informações de quando os softwares baseados na Maxine chegarão ao consumidor.

Fonte: The Verge

Colunista

Rafael Rigues é colunista no Olhar Digital