Uma equipe de engenheiros do serviço de streaming do Deezer criou uma biblioteca de separação de áudio chamada “Spleeter”. A tecnologia foi construída em Python e TenserFlow, que usa aprendizado de máquina para separar os diferentes sons das músicas de forma rápida e prática.
A biblioteca é fornecida em três modelos: duas hastes (vocais e outros acompanhamentos), quatro hastes (vocais, bateria, baixo e outros) e cinco hastes (vocais, bateria, baixo, piano e outros). Foram realizados testes com músicas do Led Zeppelin, Lizzo, Marvin Gaye, Billie Eilish e Lil Nas X w/ Billy Ray Cyrus.
The team at @Deezer just released #Spleeter, a Python music source separation library with state-of-the-art pre-trained models! ðŸÅ½¶âœ¨
Straight from command line, you can extract voice, piano, drums… from any music track! Uses @TensorFlow and #Keras.https://t.co/e4lyVtT2lR pic.twitter.com/tDsBMSYiJD
— 👩💻 DynamicWebPaige @ #TFWorld ðŸŒÂ (@DynamicWebPaige) 2 de novembro de 2019
O lançamento do Spleeter ocorrerá após a estreia do Open-Unmix, outra biblioteca de separação de código-fonte aberto em Python, que usa redes neurais similares ao TensorFlow. Nos testes de Andy Baio, tecnólogo e autor do blog waxy.org, o Open-Unmix separou os áudios com cerca de 35% da velocidade do Spleeter, não suportou arquivos MP3 e os resultados foram consideravelmente piores.
Via: Waxy