Codecs - INTERFACE EXPANDIDA O vídeo na comunicação on line

CODEC é a contração de “compression/decompression”. Como sugere a expressão,

sua função é comprimir as informações de um arquivo digital durante a gravação para ser

transportado ou armazenado, e descomprimi-las na sua exibição ou reprodução.

Os CODECs são algoritmos, ou seja, seqüências de instruções utilizadas para

solucionar um problema computável, “receitas matemáticas” que definem como deve ser

processado um determinado conjunto de informações. Esses algoritmos analisam as

redundâncias do sinal e as codificam em modelos ou vetores matemáticos, reduzindo e

dividindo o grande volume de dados em arquivos menores. Metaforicamente, pode ser

traduzido como uma espécie de caixa mágica que faz com que um elefante caiba numa

caixa de fósforos, em termos de volume de informação; ou mesmo, como uma caixa

surpresa (jack-in-the-box), onde o palhaço salta para fora ao abrirmos a tampa

impulsionada por uma mola. O CODEC funciona mais ou menos como essa mola:

comprimida quando a caixa está fechada, estendida quando aberta.

Foi graças aos CODECs que a Internet pôde se tornar multimídia, pois praticamente

todos os arquivos de áudio e vídeo utilizam algum tipo de CODEC. Porém, todo CODEC

apresenta perda. Depois de aplicar um CODEC sobre um arquivo de áudio ou vídeo,

algumas informações são permanentemente perdidas. O tipo de perda apresentada

depende do tipo de CODEC. Enquanto alguns promovem perda de resolução, outros

quebrada em blocos, e outros problemas. O mesmo ocorre com o áudio e suas

características específicas (harmônicas, ruído de quantização, etc.).

Quando um CODEC é aplicado sobre outro CODEC, as perdas promovidas por

cada um se somam, resultando em uma degradação maior da imagem e/ou som. Esse

fenômeno aparentemente contraria o senso comum de que o vídeo e o áudio digitais não

apresentam degradação de uma geração para outra. Na verdade, não há degradação entre

cópias. Se houver processamento entre as gerações, é provável que ocorram perdas.

Conforme afirmou Manovich, “a digitalização inevitavelmente envolve perda de

informação. Em contraste com uma representação analógica, uma representação codificada

digitalmente contém uma quantidade determinada de informação”.52

Ainda que isso seja

um fato, o autor pondera que já pelo fim da primeira década da nova mídia, no início dos

anos 1990, a tecnologia atingiu o ponto em que uma imagem digital53

poderia facilmente

conter muito mais informação do que qualquer um poderia almejar. Ele menciona esse fato

a respeito dos scanners de 1200 ou 2400 ppi,54

mas hoje temos máquinas fotográficas

digitais com 22 megapixels (22 milhões de pixels) e câmeras mini-DV e HDV. No entanto,

na prática essa diferença é irrisória desde o final dos anos 1990, pois os scanners mais

baratos eram capazes de escanear imagens de 1200 ou 2400 ppi. Nessa época, o

armazenamento digital da imagem ainda era formado de um número finito de pixels,

resolução na qual pode conter um nível de detalhe tão fino quanto na fotografia tradicional,

dependendo do tamanho da impressão.

Porém, não há sentido prático no princípio de que a discretização implica em perda

de informação. Hoje em dia, a digitalização chegou a um tal nível de refinamento de

captura que a diferenciação entre o que é ou não digital (contínuo ou discreto) torna-se

imperceptível. Por outro lado, há o princípio de que a degradação da cópia digital não se

dê na prática, mas devido às limitações de armazenamento, transmissão e processamento,

MANOVICH. Op. cit., p. 49.

Manovich define uma imagem digital como “um número finito de pixels, cada um tendo um distinto valor tonal ou cromático, e esse número determina a quantidade de detalhe que uma imagem pode representar”. Cf. Op. cit, p. 53.

no caso do vídeo. Assim, toda imagem capturada já é digitalizada com algum nível de

compressão. No caso do formato mini-DV, a própria câmera já captura o som e as

imagens de modo numérico, ou seja, discreto. O CODEC mini-DV é tido como lossless,

isto é, sem perda, reversível. Todo procedimento de cópia que é feito desse material será

literalmente (ou numericamente) idêntico, como, por exemplo, de fita para fita ou

computador > fita > CD > DVD. Mas se o arquivo passar por algum processamento,

provavelmente haverá perda de informação. A aplicação de um CODEC implica em perda,

mas isso pode ocorrer também quando é feita uma transição em vídeo (fade, wipe, etc), ou

aplicação de algum efeito (aumento de contraste, lettering, texturas, etc), pois há uma

retirada de informação.

Tome-se o áudio, por exemplo. Os 16 bits de resolução utilizados nos CDs são suficientes para reproduzir sons com a qualidade exigida pela audição humana. No entanto, quando originalmente gravados por engenheiros de som, normalmente é usada a resolução de 24 bits. Os 8 bits adicionais servem para compensar erros de arredondamento que ocorrerão durante os subseqüentes processamentos digitais dos sinais (como equalização, filtragem, alteração de volume e pitch, mixagem, etc.).55

Na mídia digital a cópia não se distingue do original, pois não há perda de qualidade

(informação) na reprodução. Não há degradação do material de origem. Embora isso seja

verdade, na prática há muito mais degradação e perda de informação entre versões de uma

imagem digital do que entre cópias de fotografia tradicional (analógica). Uma única imagem

digital consiste de milhões de pixels. Todos esses dados exigem um considerável espaço de

armazenamento no disco rígido e tempo para trafegar pela rede. “Por conta disso, o

software e o hardware usados para adquirir, armazenar, manipular e transmitir imagens

digitais se baseam na lossy compression.” 56

A capacidade de resolução dos dispositivos de captura (digitalização) atuais é tão

alta que torna a perda de informação pela discretização irrelevante. No entanto, arquivos

sem compressão possuem uma quantidade enorme de informação e tornam-se muito

Do inglês ppi - pixels per inch, em português “pixels por polegada”.

DALDEGAN, Pedro. “A escolha do CODEC ideal”. 2001. Cf. http://paginas.terra.com.br/arte/fetiche/brocolisvhs/codec.htm.

“pesados”. No caso do vídeo, isso é crítico. A solução veio ao se perceber que havia muita

informação repetida, logo, o caso era cortar essa redundância para que o arquivo ficasse

mais “leve”. Todas as imagens, em alguma medida, trazem repetições.

A redundância pode ser de dois tipos:

• Redundância espacial: ocorre em áreas da imagem onde pixels adjacentes possuem

o mesmo valor. São relativas a forma, textura e cor da imagem;

• Redundância temporal: ocorre quando há semelhança entre imagens sucessivas, os

pixels da áreas correspondentes possuem o mesmo valor.

Há três aspectos dos CODECs que são intimamente relacionados: taxa de

compressão, qualidade e velocidade de processamento. Em relação ao tempo de

compressão e de descompressão, temos a compressão simétrica e a assimétrica. Na

primeira, o tempo necessário para comprimir e descomprimir o vídeo é equivalente; já na

segunda, a compressão é muito mais demorada que a descompressão, porque efetua uma

análise mais refinada dos elementos de redundância tempo/espacial. Isso torna menos

evidentes os artefatos (ruídos digitais) e garante maior qualidade na recepção e uma

descompressão mais rápida, permitindo a fluidez do vídeo. Na compressão simétrica, há

uma eficiência menor na análise de redundâncias, o que torna os artefatos mais evidentes.

No entanto, em um streaming “ao vivo” ela é inevitável, uma vez que o tempo de

compressão também é determinante.

A taxa de compressão, que define a medida em que o algoritmo reduz a quantidade

de informação contida em uma imagem, pode ser variável. A alteração dos pixels é maior

sobretudo em cenas de movimento, movimentos de câmera ou transições e efeitos de pós-

produção, onde há uma mudança de praticamente 100% dos pixels de um quadro a outro.

Os métodos de compressão podem ser implementados não só através de softwares,

mas também com a ajuda de placas e chips dedicados (hardwares). No começo do desktop

vídeo, o hardware específico era indispensável, pois os processadores da época não

tinham capacidade para processar tal volume de informação individualmente.

Durante a evolução dos processadores, vários CODECs foram sendo criados e constantemente aprimorados. Nos primórdios do vídeo digital, a falta de capacidade de processamento obrigou à utilização de algoritmos mais simples, e portanto menos eficazes. Em alguns casos, chegou-se à implementação via hardware dedicado. Um exemplo é o mpeg2, que durante um bom tempo só podia ser conseguido através de placas específicas para essa tarefa. Com o aumento da capacidade de processamento das CPUs, elas puderam assumir para si essa tarefa, e a implementação do mpeg2 tornou-se possível via software. Com o surgimento de CODECs mais eficazes, aqueles mais primitivos foram gradualmente sendo abandonados, tornando-se obsoletos. É o caso dos CODECs utilizados nos primórdios da multimídia.57

É possível comprimir imagens de vídeo reduzindo o número de frames por segundo, ou alterando sua resolução (tamanho em pixels). Em um método escalonável, a taxa de compressão e, por conseqüência, a qualidade da imagem, adapta-se ao equipamento de exibição. Nesse caso, interferem tanto no poder de processamento do computador como na velocidade de transferência de dados. É o caso dos streamings de vídeo para a Web, em que a velocidade de acesso à Internet é determinante. As imagens também podem ser comprimidas progressivamente. Isso significa que uma seqüência de imagens pode ter sua transmissão e exibição iniciada rapidamente, com alta compressão, para ser refinada progressivamente, com a continuidade do fluxo de dados.

Por fim, outro fator determinante é o ajuste do key-frame (quadro chave). Os key-

frames são quadros inteiros sem compressão de imagem colocados no vídeo em intervalos regulares. Cada qual é seguido por informações sobre como os pixels vão mudar entre um

key-frame e o próximo, produzindo os delta frames. Durante a exibição do filme, o decodificador recria os delta frames baseado nas informações dadas pelo key-frames.

Muitas vezes, essa subtração de informação é imperceptível ao olhar humano, uma forma digital de trompe l’oeil, que em francês significa “enganar o olho”. Essas técnicas envolvem uma relação entre resolução de imagem e tamanho de arquivo. Quanto maior a compressão, menor o tamanho do arquivo, mais leve, mais rápido e mais “portátil” ele fica. E, geralmente, mais visíveis se tornam seus artefatos visuais (ruídos digitais) no momento da visualização, quando o arquivo é descomprimido. Isso é resultado da informação deletada.

É muito comum confundir formatos de vídeo digital com tipos de CODECs. A indústria de software tem uma parcela de responsabilidade por essa situação, ou seja, às

vezes a extensão do arquivo é referente ao formato do arquivo, às vezes aos CODECs. Por exemplo, as extensões .avi e .mov referem-se respectivamente aos formatos de vídeo desenvolvidos inicialmente pela Microsoft e pela Apple. Já as extensões .mpeg, .mp3, .divx ou .mp4 referem-se a suas compressões, que muitas vezes podem ser usadas tanto em arquivos tipo .mov quanto .avi (ou sua versão atual, o .wmv). Já o software RealPlayer trabalha com um tipo de CODEC específico, o que praticamente implica dizer que a extensão .rm desses arquivos e o CODEC utilizado se confundem.

No documento INTERFACE EXPANDIDA O vídeo na comunicação on line (páginas 55-60)