Figura 2.19: Imagem antes e após aplicação do filtro de redução blocagem.
A codificação de imagens utiliza um ou mais slices, cada um contendo um determinado número de macroblocos que não é constante, podendo variar em slices de uma mesma imagem e não existe interdependência entre estes. A Tabela 2.3 mostra os tipos de slices permitidos.
Tabela 2.3: Slices permitidos no H.264/AVC.
Tipo Descrição Perfil
I (Intra) Contem apenas macroblocos I Todos
P (Previsto) Contem macroblocos P e/ou macroblocos I Todos
B (Bidirecional) Contém macroblocos B e/ou macroblocos I Extended e Main SP (Switching P) Facilita a troca de fluxos codificados. Contém
macroblocos P e/ou I.
Extended
SI (Switching I) Facilita a troca de fluxos codificados. Contém macroblocos SI, um tipo especial de intra codificado.
Extended
Macroblocos inter codificados e partes de macroblocos em slices P ficam sempre na lista 0. Macroblocos inter codificados e partes de macrobloco em slices B podem estar nas duas listas (0 ou 1). Cada macrobloco pode ser transmitido de maneiras diferente dependendo da codificação utilizada no slice.
extremos: a conversação humana e música de alta qualidade. O áudio é uma onda analógica e o ouvido humano responde a ela como uma mudança na pressão do ar. A quantidade de oscilações da pressão do ar por unidade de tempo é definida como freqüência. A magnitude da pressão define a intensidade dos sons. O formato das orelhas é preciso para captar o que o ser humano pode ouvir. A conversão de uma forma analógica de som para armazenamento digital requer a medição de nível deste som e anotações dos valores. Esta medição leva o nome de samples (amostras). A intensidade dos sons é chamada de decibéis (dB). Essa conversão oferece vantagens como alta imunidade a ruídos, estabilidade e reprodutibilidade. O formato digital permite utilizar eficientemente processos como mixagem, filtragem e equalização. Os formatos de gravação e reprodução mais comuns são descritos na Tabela 2.4 (Wooton, 2005).
Tabela 2.4: Formatos para gravação e reprodução de áudio digital.
Nome Speakers Descrição
Mono 1 O som é transmitido por meio de um único canal.
Dual-Mono 2 O mono duplicado em dois canais estéreo.
Estéreo 2 Utiliza dois canais de áudio independentes criando a impressão de ouvir um som que vem de várias direções.
Dolby Surround 3 na frente e 1
atrás Reprodução usando 4 canais de áudio.
5.0 Surround 3 na frente e 2
atrás Aproveita 5 canais para reprodução do áudio.
Dolby Digital (AC3)
3 na frente, 2 atrás e 1 de baixa frequência
Além dos 5 canais de áudio, aproveita um canal Low Frequenc Effects (LFE).
Digital Surround 5.1
3 na frente, 2 atrás e 1 de baixa frequência
Uma alternativa ao Dolby Digital.
O padrão utilizado para definir as notações de nomes surround se refere ao número de canais usados para reprodução. Tomando por exemplo, o termo “5.1” refere-se à utilização de 5 canais de reprodução. O “.1” é incluído para indicar o uso de um canal Low Frequency Effects (LFE). O canal LFE normalmente é reproduzido pelo subwoofer de um aparelho.
Alguns exemplos da configuração espacial do áudio são ilustrados na Figura 2.20.
Figura 2.20: Configuração espacial do áudio.
2.6.1 Compressão
As técnicas utilizadas para compressão de áudio são muito parecidas com as de vídeo, mas diferem porque ouvimos ao invés de ver. Um exemplo atual de compressão é uso de arquivos “.mp3”, facilmente encontrados na internet. Para criar estes arquivos de áudio com tamanho reduzido, são utilizadas técnicas de compressão que a maioria das pessoas conhece pouco, ou até desconhece. Estas técnicas influenciam na qualidade final e taxa de transmissão dos arquivos.
Os algoritmos de compressão de áudio MPEG são um padrão reconhecido internacionalmente para alta fidelidade. O MPEG utiliza um método de compressão com perdas, mas muito próximo do arquivo original em termos de percepção auditiva. Algumas razões pelo qual o MPEG tornou-se um sucesso foram (Brandenburg, 1999):
Padrão aberto: o MPEG é definido com um padrão aberto, onde todos podem acessar a especificação (mediante pagamento). Embora existam patentes que cobrem para o uso da norma, ninguém é dono da mesma.
Tecnologias de apoio: computadores rápidos o bastante para codificar e decodificar dados de áudio, utilização de gravadores de CD e DVD e Internet rápida podem ser indicados como fatores para o sucesso da compressão MPEG.
O padrão MPEG-1 para áudio possui três camadas de compressão (Pan, 1993):
Camada I: com algoritmos básicos de compressão, muito utilizado em ambientes de áudio profissional.
Camada II: uma melhoria da Camada I que utiliza um grupo maior de dados para codificação.
Camada III: um refinamento das Camadas I e II. O fluxo de áudio codificado é nomeado de MP3 (MPEG Audio Layer III).
A Camada III é a mais utilizada, pois possui visíveis melhorias com relação a I e II, destacando-se:
Redução que remove redundâncias deixadas pelas Camadas I e II.
Codificação de entropia utilizando o código de Huffman.
O padrão MPEG-2 também trouxe melhorias para o áudio. O Advanced Audio Coding (MPEG-2 AAC) é usado para codificação de áudio em alta qualidade e utiliza as mesmas técnicas de codificação da Camada III do MPEG, entretanto incrementa melhoras com relação às ferramentas de codificação, trazendo aumento na qualidade.
O MPEG-2 AAC suporta até 48 canais de áudio. Ele utiliza diversas ferramentas de codificação para reduzir o bitstream do áudio. O codificador suporta três modos diferentes de operação (Watson, 2000):
Main Profile: traz a melhor qualidade, porém consome mais memória e processamento.
Low Complexity: sacrifica um pouco da qualidade para usar menos memória e processador.
Scalable Sample Rate: possui a menor complexidade entre os três.
O padrão AAC consegue grandes níveis de qualidade, podendo codificar o áudio em 5.1 canais no formato digital ou analógico e por isso tem sido adotado como padrão de codificação em várias aplicações, tais como radiodifusão digital e serviços de áudio para internet. (Lee, 2002).
O padrão é normalizado pela ISO/IEC e é dito como sucessor do MP3. Sua especificação está descrita no documento ISO/IEC 13818 - Part 7. Traz diversas melhorias, entre elas (Brandenburg, 1999):
Alta resolução de freqüência.