• Nenhum resultado encontrado

Dolby AC-3. André de Macedo P. Lobato

N/A
N/A
Protected

Academic year: 2021

Share "Dolby AC-3. André de Macedo P. Lobato"

Copied!
7
0
0

Texto

(1)

Dolby AC-3

André de Macedo P. Lobato

Curitiba Novembro de 2007 Universidade Federal do Paraná Setor de Tecnologia

Departamento de Engenharia Elétrica

Disciplina de Processamento Digital de Sinais Professor Marcelo de Oliveira Rosa

(2)

1. Objetivo

O objetivo deste documento é ilustrar o funcionamento da tecnologia de processamento de áudio Dolby AC-3, através de uma introdução as generalidades da mesma e da explicação do funcionamento de um codificador e de um decodificador Dolby AC-3.

2. Siglas e Termos Técnicos Utilizados

A seguir será dado o significado das siglas e uma breve explicação dos termos técnicos utilizados neste documento, a fim de facilitar a compreensão do mesmo.

Bandas críticas: o ouvido interno do sistema auditivo humano (parte do ouvido que converte as vibrações mecânicas em um sinal eletroquímico ou nervoso para transmissão ao cérebro para ser processado) representa o espectro de potência dos sinais que chegam em intervalos de freqüências limitados denominados bandas críticas. A faixa de freqüências audíveis se divide em 25 bandas críticas, cujas larguras de banda não são iguais, pois se elevam com o aumento da freqüência. Tais larguras de banda podem ser inferiores a 100 Hz para as freqüências audíveis mais baixas e próximas de 5 kHz para as freqüências audíveis mais altas. Desta forma, o sistema auditivo pode ser modelado como um banco de 25 filtros passa-faixa que se sobrepõe.

Mascaramento auditivo: é um fenômeno que ocorre quando um sinal de nível baixo e um sinal de nível alto, situados em freqüências próximas, ocorrem simultaneamente. Caso o sinal de nível baixo se situe abaixo de um limiar de mascaramento, ele se tornará inaudível pelo sinal de nível alto. Este fenômeno é mais acentuado quando ambos os sinais se situam na mesma banda crítica e menos acentuado quando se situam em bandas críticas adjacentes.

Quantizar: processo de aproximar uma faixa contínua de valores em valores possíveis de um conjunto finito.

Aliasing: fenômeno que faz com que diferentes sinais contínuos se tornem indistinguíveis, ou seja, assumam a identidade um do outro, depois de amostrados.

TDAC: Time Domain Alias Cancellation ou Cancelamento de Alias no Domínio do Tempo. FFT: Fast Fourier Transform ou Transformada Rápida de Fourier.

3. Introdução

Dolby AC-3 é uma técnica de codificação de áudio proprietária, de alta qualidade e baixa complexidade, que codifica múltiplos canais como uma única entidade, desenvolvida pela Dolby Laboratories para armazenar e transmitir canais de áudio únicos ou múltiplos. É utilizado pelo formato de som digital Dolby Digital em aplicações como som de cinema, DVD-Video, DVD-Audio e transmissões de televisão digital, entre outras.

É uma tecnologia de som surround capaz de fornecer áudio digital de alta qualidade para até seis canais discretos. São eles os canais esquerdo, direito, central, esquerdo surround e direito surround, reproduzidos por alto-falantes e que dão um efeito direcional e mais realista ao som, e um canal para os efeitos de baixa freqüência, normalmente reproduzido através de um subwoofer e, que além de ouvidos, podem ser sentidos. Tal sistema é usualmente denominado 5.1, onde 5 representa os cinco canais principais (esquerdo, direito, central, esquerdo surround e direito surround), que recebem sinais de áudio sem limitação de largura de banda, entre 3 Hz e 20 kHz, e .1 significa o canal para os efeitos de baixa freqüência, que recebe sinais de áudio com largura de banda limitada entre 3 Hz e 120 Hz.

Foi desenvolvido em 1992 para permitir que rolos de filme de cinema de 35 mm pudessem conter som digital multicanal.

4. Visão Geral da Tecnologia Dolby AC-3

A tecnologia Dolby AC-3 divide o espectro de freqüências de áudio em faixas estreitas, a partir de modelos matemáticos derivados das características do ouvido humano, e analisa

(3)

cada uma destas faixas para determinar a audibilidade dos sinais. Para maximizar a eficiência dos dados, a maior parte dos bits representa os sinais mais audíveis, enquanto a menor parte dos bits representa os sinais menos audíveis. Para determinar a audibilidade dos sinais a tecnologia se utiliza do fenômeno conhecido como mascaramento auditivo. O aproveitamento deste fenômeno permite que o áudio seja codificado de forma mais eficiente do que em outros sistemas com qualidade de áudio comparável a do Dolby AC-3, o que torna esta tecnologia excelente para os sistemas que requerem áudio com alta qualidade, mas que possuem limitações de largura de banda e de espaço de armazenamento.

O Dolby AC-3 nada mais é que um codificador adaptativo baseado em transformações que utiliza um banco de filtros criticamente amostrado baseado na técnica TDAC. A principal vantagem da codificação baseada em bancos de filtros é que as componentes do sinal e as correspondentes componentes do ruído de quantização, que devem ser mascaradas pelas componentes do sinal, são mantidas na mesma banda crítica, tirando o máximo proveito do fenômeno de mascaramento auditivo do ouvido humano e minimizando a taxa de bits necessária para uma codificação perceptivelmente livre de ruídos.

5. Principais Etapas de Processamento de Um Codificador Dolby AC-3

A figura ilustrada no anexo 1 mostra o diagrama de blocos de um codificador Dolby AC-3. Os principais processos realizados pelo codificador são descritos a seguir.

5.1 Buffer de Entrada

Pelo fato do AC-3 ser um codificador estruturado em blocos, um ou mais blocos de sinais no domínio do tempo, com geralmente 512 amostras cada, são coletados de cada canal em um buffer de entrada antes de serem processados.

5.2 Filtragem de Entrada

Os sinais de entrada do codificador são filtrados individualmente em um filtro passa-altas com freqüência de corte de 3 Hz, com o objetivo de remover o offset CC. Já os sinais do subwoofer são filtrados em um filtro passa-baixas com freqüência de corte de 120 Hz.

5.3 Detecção de Transitórios

Os sinais de entrada filtrados são analisados em um filtro passa-faixa de alta freqüência, com o objetivo de se detectar a existência de transitórios. Isto é feito para se ajustar o tamanho do banco de filtros TDAC e, assim, restringir o ruído de quantização associado aos transitórios em uma pequena região temporal em volta dos mesmos, evitando o mascaramento temporal.

5.4 Banco de Filtros TDAC

O sinal de entrada de cada canal filtrado no filtro passa-altas é alocado em uma janela e filtrado em um banco de filtros com a técnica TDAC. Esta transformação TDAC nada mais é do que uma FFT seguidos por um estágio twiddle. Este bloco requer baixa complexidade computacional e possui boa seletividade em freqüência.

O processamento seguinte é realizado no conjunto de coeficientes da transformação TDAC dos 5.1 canais, tratados como uma entidade única, sendo que apenas os primeiros coeficientes do canal do subwoofer são transmitidos adiante.

5.5 Conversão para a Notação de Ponto Flutuante

Mesmo quando a transformação TDAC é implementada em chips de processamento digital de sinais com notação de ponto fixo, os coeficientes da transformação TDAC na tecnologia Dolby AC-3 são convertidos para a notação de ponto flutuante para posterior processamento, com a magnitude das mantissas variando entre 0,5 e 1. Isto é feito para garantir que os processamentos seguintes não imponham limitações de faixa dinâmica. A representação dos coeficientes nesta notação, em particular devido à presença de expoentes,

(4)

também serve como auxílio computacional para a alocação de bits, que é um processo logarítmico.

5.6 Pré-combinação da Portadora

Em geral, a taxa média de bits para se codificar múltiplos canais é proporcional a raiz quadrada do número de canais. Por exemplo: se para codificar um canal são necessários 128 kbps, para se codificar 5.1 canais são necessários 128 x raiz(5.1) kbps, ou seja, 289 kbps. Isto implica que a maioria dos sinais multicanais podem ser codificados pela técnica de alocação de bits. Para sinais que demandam altas taxas de bits, a pré-combinação seletiva de componentes de portadora de alta freqüência é usada para prover ganho de codificação.

Esta técnica elimina informações redundantes em altas freqüências, utilizando o fato de que, em altas freqüências, o sistema auditivo humano detecta os sons baseado principalmente na envoltória das versões de banda crítica filtradas dos sinais que atingem os ouvidos, e não nos próprios sinais. Tal fato é aproveitado pela tecnologia Dolby AC-3 através da separação de sinais de alta freqüência em componentes de envoltória e portadora, sendo que a codificação da informação da envoltória é feita com maior precisão que a codificação da informação da portadora. Caso necessário, as componentes de envoltória são combinadas, ou casadas, seletivamente através dos canais, o que tem um impacto audível mínimo.

A informação codificada referente a portadora aumenta os vetores da mantissa e dos expoentes dos coeficientes da transformação TDAC, enquanto a informação referente a envoltória é armazenada como um vetor de coeficientes de casamento.

5.7 Alocação de Bits

A principal vantagem da codificação multicanais unificada é provavelmente a habilidade da rotina de alocação em distribuir os bits de quantização entre os vários canais e freqüências conforme o necessário para atender o deslocamento requerido para os sinais.

O alocador de bits da tecnologia Dolby AC-3 analisa os coeficientes TDAC considerando os seus efeitos de mascaramento auditivo e sua relação com o limiar da audição humana, para computar a precisão da quantização, ou seja, o seu número de bits, para codificar cada mantissa.

Tanto o codificador quanto o decodificador Dolby AC-3, que será visto mais adiante, realizam a mesma rotina de alocação de bits, trabalhando primeiramente com os expoentes da transformação TDAC.

5.8 Quantização

Os resultados do cálculo de alocação de bits são usados para quantizar os dados da mantissa TDAC. Ao invés de simplesmente enviar os bits mais significativos de um dado valor, tal valor sofre um escalamento e uma operação de offset para prover níveis de quantização com simetria ímpar, centrados em zero e com igual largura, a fim de minimizar a distorção. 5.9 Empacotamento dos Dados

Os processos descritos anteriormente convertem cada bloco de seis canais de sinais no domínio do tempo em uma série de vetores e escalares, incluindo os expoentes e mantissas quantizadas do TDAC, informações sobre a alocação de bits e coeficientes de casamento. No último estágio do processo de codificação toda esta informação é armazenada, ou empacotada, em um único bloco, juntamente com informações de sincronização e um cabeçalho. Um cuidado especial é tomado para empacotar os dados de forma lógica, a fim de que o decodificador possa desempacotá-los.

6. Principais Etapas de Processamento de Um Decodificador Dolby AC-3

A figura ilustrada no anexo 2 mostra o diagrama de blocos de um decodificador Dolby AC-3. Os principais processos realizados pelo decodificador são descritos a seguir.

(5)

6.1 Buffer de Entrada

Como o codificador, o decodificador Dolby AC-3 é estruturado em blocos, então ele estabiliza e mantém um sincronismo com o fluxo de dados de entrada, armazenando um bloco codificado inteiro em um buffer de entrada antes de proceder com sua decodificação.

6.2 Ocultação de Erros

Cada bloco de dados de entrada do decodificador é analisado para a verificação de sua consistência interna. Caso um erro incorrigível seja encontrado, o decodificador pode reutilizar o último bloco de entrada íntegro no lugar do atual para ocultar o erro. Desta forma, caso necessário, um bloco íntegro pode ser repetido diversas vezes antes que condições de erro extensas façam com que o decodificador silencie os alto-falantes.

6.3 Desempacotamento de Dados de Formato Fixo

O desempacotamento dos dados é realizado em dois estágios. Primeiramente, os dados de formato fixo são desempacotados, incluindo os expoentes e coeficientes de casamento. Porções relevantes destes dados são então utilizadas pelo decodificador para recuperar a alocação de bits, que é utilizada para desempacotar os dados de formato variável, principalmente os vetores de mantissas da transformação TDAC.

6.4 Decodificação da Alocação de Bits

A rotina de decodificação da alocação de bits é quase idêntica a alocação correspondente no codificador, com exceção de que ela utiliza os resultados intermediários transmitidos pelo codificador para economizar tempo e, opcionalmente, modificar a alocação de bits encaminhada pelo codificador. Isto também permite que o decodificador compute a alocação de bits de cada canal por vez, o que reduz os requisitos de memória do mesmo.

A alocação de bits do decodificador deve combinar perfeitamente com a do codificador, de modo que os dados de formato variável sejam desempacotados corretamente. Caso contrário, sons indesejáveis podem ser introduzidos na saída do decodificador.

6.5 Desempacotamento dos Dados de Formato Variável

A alocação de bits recuperada pela decodificação, que especifica o nível de quantização de cada mantissa, é utilizada para desempacotar os dados de formato variável de cada feixe de bits codificados.

6.6 Conversão para a Notação de Ponto Fixo

Neste estágio, as mantissas e os expoentes recebidos são combinados para converter os coeficientes da transformação TDAC novamente para a notação de ponto fixo. Isto é feito para preparar os dados para a transformação inversa TDAC.

6.7 Reinserção da Portadora de Alta Freqüência

Os coeficientes de alta freqüência que foram codificados como informações de envoltória e portadora são reconstruídos pela combinação das portadoras com seus respectivos coeficientes de casamento.

6.8 Transformação TDAC Inversa

Os coeficientes convertidos da transformação TDAC de cada canal são inversamente transformados para o domínio do tempo e postos em janelas para produzir sinais de saída digitais no domínio do tempo. Os coeficientes do sinal do subwoofer são preenchidos com zeros nas freqüências médias e altas antes da transformação inversa, de forma que a saída no domínio do tempo do subwoofer contenha a taxa de amostragem completa. O resultado na saída do decodificador são 5.1 canais de áudio.

(6)

7. Referências

[1] Simon Haykin, Sistemas de Comunicação Analógicos e Digitais, 4ª edição, Bookman, 2004. [2] Mark F. Davis, The AC-3 Multichannel Coder.

(7)

Anexo 1 – Diagrama de Blocos de Um Codificador Dolby AC-3 Input Buffer 3 Hz Highpass Filter Window Forward TDAC Transform Transient Detect Fixed to Floating Point HF Carrier / Envelope Separation Global Bit Allocation Quantizer (Dither) Bit Pack 6 Channel

Input OutputCoded

Mantissas Expoents

Mantissas

Expoents

Coupling Coefficients Transient Flags

Anexo 2 - Diagrama de Blocos de Um Decodificador Dolby AC-3

Coded Input BufferInput CheckError Fixed Data Unpack Global Bit Allocation Window 6 Channel Output

Variable Format Unpack (Undither) HF Carrier Reinsertion Floating P1 to Floating P1 Inverse TDAC Transform Overlap Add Expoents Mantissas Mantissas Transient Flags Expoents

Referências

Documentos relacionados

Tabela 3 - Duração do ciclo após a germinação, produtividade, eficiência no uso da água em cenários climáticos futuros RCP4.5 para o milho semeado em 10 de outubro.. Já para

Segundo Brown (2004), apoiado principalmente no trabalho de Warren e Nisbet (1999), é possível conceber que os indivíduos, quer sejam professores ou estudantes, geralmente

Como prenuncia o próprio título do texto, O pensamento cria, embora fique evidente que aí se trata da relação entre música e artes visuais, não deixamos de notar que o foco

Consulte a Secção 11 para obter informações pormenorizadas sobre sintomas e efeitos na saúde.. Classificação conforme Regulamentação (EC) 1272/2008 [CLP/GHS] SECÇÃO

(2019) Pretendemos continuar a estudar esses dados com a coordenação de área de matemática da Secretaria Municipal de Educação e, estender a pesquisa aos estudantes do Ensino Médio

Esta realidade exige uma abordagem baseada mais numa engenharia de segu- rança do que na regulamentação prescritiva existente para estes CUA [7], pelo que as medidas de segurança

Para o HIDRALERTA utilizou-se uma série de dados de agitação marítima compreendidos entre 1979 e 2014 como input para o sistema, a fim de simular a ocorrência de

Rosa. Integrante do Projeto de Pesquisa “República e Democracia no Estado de Direito”.. Ao longo da História, houve sucessivas mudanças na organização