Arquivos mp3 e as Instruções de Canto
Com
a popularização da internet é cada vez mais comum a circulação
de arquivos de áudio, no formato mp3, com cantos de pássaros.
Muitos desses arquivos são convertidos para o formato wav e empregados
em instruções de canto para a vetorização de filhotes.
Um arquivo originalmente wav, convertido para mp3 sofrerá a perda de um conjunto de informações que jamais poderá ser recuperado quando da sua reconversão para o formato original. Essa perda de qualidade, pouco perceptível aos nossos ouvidos, poderá limitar o resultado do aprendizado dos filhotes, cuja audição varia em limitações conforme as características de cada espécie.
É
importante entendermos as características do processo para uma melhor
compreensão dos resultados.
O
algoritmo de compressão do MP3, desenvolvido pelo IIS (Institut Integrierte
Schaltungen), na Alemanha, em 1987, é muito mais complexo que um simples
compactador e se fundamenta na exclusão de sons baseado nas limitações
da audição humana.
Além
das limitações físicas do ouvido, o som tem que viajar
através dos nervos até o córtex auditivo do cérebro
onde é transformado em diferentes percepções das quais
tomamos consciência.
O
ser humano pode perceber sons na faixa de freqüências de 20 Hz a
20 kHz devido às limitações físicas do ouvido. A
faixa compreendida entre 1000 e 5000 Hz é melhor percebida. Com a idade
vamos diminuindo a percepção das freqüências mais elevadas.
O
princípio do mascaramento em freqüência.
Sempre
que um som é mais forte, mascara outros mais baixos. Quando uma forte
batida do prato em uma música executada por uma orquestra nos chega ao
ouvido, por um momento, apenas esse som é percebido, mascarando o som
dos demais instrumentos. Esse princípio fundamenta a eliminação
de todos os sons mascarados em um determinado arquivo.
O
princípio do mascaramento temporal.
Quando
um som forte nos chega ao ouvido há uma fração de tempo
de cerca de 200 milisegundos durante a qual nosso ouvido não percebe
som algum. Esse princípio permite a eliminação de muitos
dados de um arquivo sonoro sem prejuízo para a nossa impressão
auditiva.
O
princípio da redundância estereofônica.
A
limitação do ouvido humano para detectar a direção
das baixas freqüências, chamada de redundância estereofônica,
também permite eliminar parte da informação de áudio
sem afetar significativamente nossa impressão.
O
processo de conversão ainda está sujeito a limitações
de ordem técnica, como a qualidade do Encoder , um programa
que utiliza um algoritmo de compressão/decompressão (codec) para
converter arquivos wav em mp3 ou mp3 em wav. Versões gratuitas de encoders
disponíveis na internet e empregadas pela maioria dos usuários
não apresentam a mesma qualidade das versões profissionais destinadas
à comercialização.
Outro
fator que influencia diretamente a qualidade de áudio de um arquivo MP3
é o equipamento usado para gerá-lo. Para criação
de arquivos mp3 são empregadas placas de som e unidades de CDROM disponíveis
no computador, que, normalmente, não foi montado para essa especialidade.
A
maioria das placas de som existente no mercado tem uma péssima relação
sinal/ruído (SNR, Signal-to-Noise Ratio). Para
uma boa qualidade de áudio, a placa de som deve ter uma relação
sinal/ruído acima de 96 dB. As placas de som mais baratas, presentes
na maioria dos computadores, possuem uma relação de apenas 80
dB! Unidade de CDROM e cabos de ligação com uma relação
sinal/ruído maior que 96 dB não estão presentes na maioria
dos computadores de uso pessoal. O resultado da baixa qualidade do hardware
envolvido no processo é a injeção de ruído nos arquivos
gerados.
Um
último aspecto a ser considerado é o nível de compressão
configurado pelo operador do Encoder na conversão do arquivo
para o formato mp3. As taxas de compressão normalmente variam entre 10:1
e 12:1 (128 Kbps a 112 Kbps). Quanto mais comprimido for o som, menor será
o tamanho do arquivo resultante e pior sua qualidade.