Você com certeza já ouviu música por meios digitais. E, se você fez isso, o mais provável é que você tenha usado um formato como o MP3 ou o AAC. Se você colocou um CD para ouvir no computador, então provavelmente já ouviu áudio em formato WAV também. E se você já baixou música na melhor qualidade possível, o formato provavelmente foi o FLAC.

Mas não dá para resumir em “qualidade” as diferenças entre esses formatos de arquivo. Assim como os diferentes formatos de arquivos de imagem, cada um deles tem vantagens e desvantagens, e pode ser útil conhecer mais sobre cada um deles – ainda que seja só para entender melhor qual tipo de arquivo você usa em seu serviço de streaming. Confira:

WAV e o som digital

A extensão .wav é um encurtamento da expressão “Waveform Audio File Format”, algo como “formato de arquivo de onda sonora”. A onda sonora é uma referência ao desenho do som em um gráfico de volume – algo semelhante ao que você vê enquanto escuta uma música no SoundCloud. Mas para entender completamente o que isso significa, é necessário explicar um pouco sobre som digital.

Um vídeo é uma sequência de imagens reproduzidas em determinada taxa (geralmente 24 ou 30 por segundo). Um som digital também é uma sequência de “imagens” sonoras. Mas a taxa em que essas “imagens” são capturadas é muito maior; em geral, são cerca de 44.100 “imagens” por segundo – resultando numa taxa de sampleamento de 44,1 kHz. É com essa taxa, geralmente, que o formato WAV trabalha – embora seja possível aumentá-la ainda mais.

Cada segundo de música nesse formato tem, portanto, 44.100 “samples” de áudio. Cada um desses “samples” tem um valor de volume associado a ele. A amplitude desses valores depende da profundidade de bits do arquivo. Normalmente, essa taxa é de 16 bits, mas também pode ser mais. Cada bit pode ser 0 ou 1, o que significa que, em 16 bits, são 65.536 valores de volume possíveis.

Então, a cada segundo, um arquivo em WAV médio contém 44.100 “imagens” do som, que podem ter valores de 0 a 65.535. Se cada “imagem” tem 16 bits, são 705.600 bits (ou, dividindo por 8, 88,2 mil bytes) por segundo. Cada segundo de música que você ouve nesse formato contém, então, cerca de 88 kB de informação.

Formato WAV

O que é importante de lembrar desse formato de arquivo é que ele é de alta fidelidade (ele reproduz com boa precisão o que foi gravado) e sem compressão. Nenhuma informação gravada é resumida ou removida para diminuir o tamanho do arquivo.

Por isso, ele é usado quando se pretende oferecer a melhor fidelidade sonora possível. Ele também é usado em processos de edição de áudio: por não ter compressão (da mesma forma como os arquivos RAW são usados para edição de imagem), ele permite que você manipule ou altere o som sem nenhuma interferência externa.

O problema é que esse formato é simplesmente enorme. Uma música que tem 4 MB como um mp3 pode ter 200 MB ou mais em formato WAV. Isso porque o mp3 é um arquivo comprimido – parte dos dados incluídos no som é descartado para fazer o mp3, o que significa que ele não têm toda a informação contida no arquivo original. Mas ele é bem menor.

Os diferentes tipos de MP3 

Talvez o MP3 seja o formato de áudio mais popular hoje em dia; com certeza, é um deles. E não é à toa: ele consegue ser de 75% a 95% menor do que os formatos sem compressão (como o WAV) sem muita perda perceptível de qualidade do som. Por isso, ele é um formato muito bom para se usar em tocadores de música portáteis ou celulares: ele oferece uma qualidade de reprodução muito boa por um tamanho relativamente pequeno de arquivo.

Mas não se engane: o MP3, como mencionado acima, consegue atingir esse tamanho menor por meio de uma compressão que gera perda de qualidade. Quando um arquivo é convertido para esse formato, alguns dos sons que são considerados menos audíveis para os ouvidos humanos médios são descartados, assim como outros sons que estão muito próximos uns dos outros e por isso dificilmente podem ser discernidos. Para a média dos ouvidos humanos, não faz muita diferença; para os seus, pode fazer.

O fato é que cada segundo de música em MP3 contém menos informação do que cada segundo dessa mesma música em WAV. Mas quantidade exata de informação por segundo – ou taxa de bits – varia conforme os arquivos MP3. É a taxa de bits que normalmente se associa à “qualidade” de um arquivo MP3.

MP3 CBR

Os arquivos MP3 com a melhor qualidade possível têm uma taxa de 320 kbps, ou 320 quilobits por segundo. Isso significa que cada segundo de música desse arquivo tem 320 mil bits de informação. Os arquivos de MP3 em 320 kbps são como imagens JPEG de alta qualidade: elas têm compressão, mas tão pouca são praticamente iguais às imagens sem compressão.

Mas como eles contém mais informação por segundo, eles também ocupam mais espaço. Por isso, é comum que se encontre também arquivos MP3 com taxas de 256 kbps, 192 kbps, 128 kbps ou até menos. Eles contém muito menos informação por segundo (resultante de muito mais compressão), mas também ocupam bem menos espaço.

Como em todos esses tipos de arquivos a taxa de bits é constante (já que cada segundo contém 320 quilobits, independente do que há naquele segundo), esses arquivos são chamados de arquivos MP3 com taxa de bits constante, ou “constant bit rate” em inglês. Por isso, é comum ver esses arquivos rotulados como “MP3 CBR 320” ou “128 CBR MP3”.

MP3 VBR

Acontece que, em alguns casos, não faz sentido comprimir cada segundo da música da mesma maneira. Alguns segundos podem conter mais informações que outros, e nesse caso é melhor comprimir mais os segundos com menos informação e menos os com mais informação.

É essa demanda que os arquivos MP3 VBR atendem. VBR significa “variable bit rate”, ou “taxa de bits variável”. A grande diferença deles é que, diferentemente dos MP3s CBR, neles nem todo segundo é comprimido da mesma maneira. Dessa forma, é possível unir o útil ao agradável: maior quantidade de informações (nos momentos em que ela é necessária) e menor tamanho do arquivo.

AAC, o “sucessor do MP3”

Outro formato que usa compressão para codificar arquivos de áudio com tamanhos mais aceitáveis é o AAC, uma sigla que significa “Advanced Audio Coding” (“codificação de áudio avançada”, ou algo assim). E é um formato importante para se conhecer: ele é usado como formato de áudio padrão no YouTube e no iTunes, além de ser adotado também pelos iPhones, iPads, Nintendo 3DS e Playstation 3, entre outras plataformas e dispositivos.

Não é sem motivo que o AAC é adotado nessas situações. Criado para ser uma espécie de “sucessor do MP3” – que já deixou de ser suportado pela própria instituição que o criou – o AAC consegue oferecer mais qualidade por tamanho de arquivo que o MP3.

Ou seja: se tiver dois arquivos da mesma música, um em MP3 e outro em AAC, os dois com o mesmo tamanho, o arquivo AAC deve ter melhor qualidade. Além disso, ele também é compatível com muitos dispositivos diferentes (além daqueles citados acima, que já o utilizam por padrão), o que faz com que ele seja um bom pretendente a esse posto.

E há outra vantagem do formato AAC sobre o formato MP3. O MP3 exige uma taxa de licenciamento para que sua tecnologia seja usada. Se você quiser vender um produto ou serviço que seja capaz de reproduzir arquivos MP3, você precisa pagar uma taxa aos detentores dos direitos de monopólio da tecnologia. Mas se você quiser fazer exatamente a mesma coisa com AAC, não precisa. Esse pode ser outro motivo pelo qual as plataformas citadas acima estão preferindo-o.

Assim como o MP3, o AAC também está disponível em taxas de bit fixas ou variáveis. Os arquivos com taxa constante também se chamam AAC CBR, seguidos da taxa de quilobits por segundo (AAC CBR 256, por exemplo, ou só AAC 192). Quando eles têm taxa variável de bits, eles são chamados de AAC ABR (o ABR significa “average bit rate”, ou taxa média de bits). Um arquivo AAC ABR 207, por exemplo, tem uma taxa média de 207 quilobits por segundo.

FLAC, compressão sem perda de qualidade

Tanto o MP3 quanto o AAC, porém, geram alguma perda de qualidade para o arquivo final durante seu processo de compressão. Pode ser uma perda pequena e calculada para fornecer o máximo possível de redução do tamanho do arquivo com o mínimo possível de alteração no som, mas é uma perda mesmo assim. E se você quisesse um arquivo de tamanho mais utilizável, mas sem perda? Nesse caso, você poderia usar o FLAC.

FLAC é uma significa “Free Lossless Audio Codec” (ou “codec de áudio sem perda aberto”). “Audio Codec” se refere ao fato de que é uma maneira de codificação digital de áudio. “Lossless” se refere ao fato de que esse processo de codificação não gera perda para o resultado final. E “Free” significa que ele é “livre” e aberto, e pode ser usado por qualquer pessoa, dispositivo ou plataforma. 

De certa forma, se o MP3 e o AAC são semelhantes a imagens em JPG (que têm compressão com perda de qualidade), os arquivos FLAC são mais parecidos com imagens em PNG. Isso porque os arquivos FLAC também passam por compressão, mas sem que isso implique em perda de qualquer parte da informação original. Por exemplo: imagine a seguinte linha de dados: ABCABCABCABC. Ela pode ser simplificada como 4(ABC); dessa forma, você pode escrever exatamente a mesma coisa ocupando menos espaço. A compressão pela qual os arquivos FLAC passam é algo semelhante a isso.

Isso é a vantagem da parte “Lossless” do nome do formato. A parte “Free” traz a vantagem de que, assim como o AAC, o FLAC não exige o pagamento de nenhuma taxa de licenciamento. E isso, por sua vez, faz com que o formato FLAC seja aceito em uma ampla gama de dispositivos e serviços diferentes.

Os iPhones, iPods e os iTunes, no entanto, não fazem parte dessa ampla gama. Eles não têm suporte ao formato FLAC. Para eles, no entanto, há o formato ALAC, que substitui o F de “Free” por A de “Apple”. Assim, o ALAC (“Apple Lossless Audio Codec”) é basicamente a versão do FLAC usada pelos dispositivos da Apple.

Qual é o melhor?

Decidir qual desses formatos de arquivo é o “melhor” depende muito do uso que você pretende fazer do seu áudio. Como cada um deles apresenta vantagens e desvantagens, cada um deles pode ser melhor dependendo da situação.

Por exemplo: se você estiver trabalhando com edição de áudio e quiser inserir efeitos, fazer recortes, samples e mixagens, os formatos sem compressão (como o WAV) são os ideais. Mas se você só quiser ouvir uma música rapidinho para tirar ela da cabeça, qualquer MP3 ou AAC quebra o galho.

Se por acaso você tem algumas canções do coração que você quer ouvir com frequência e em boa qualidade, vale a pena ocupar um pouco mais de espaço com um MP3 de 320 kbps. Ou até mesmo procurar o arquivo em formato FLAC para garantir não apenas o melhor som possível, mas também permitir que você converta para outros formatos depois. 

No final das contas, só há uma maneira de saber qual desses formatos vale mais a pena: pergunte aos seus ouvidos. Se para você um MP3 de 96 kbps e um arquivo WAV com mais de 250 MB têm exatamente o mesmo som, não tenha dúvida: fique com o arquivo mais leve. Mas não deixe de ouvir o arquivo mais pesado também. Ele pode revelar detalhes na música que você nem imaginava que existiam. Como em muitas situações da vida, quanto mais experiência você tiver, melhor será sua escolha.