CODEC é a contração de “compression/decompression”. Como sugere a expressão,
sua função é comprimir as informações de um arquivo digital durante a gravação para ser
transportado ou armazenado, e descomprimi-las na sua exibição ou reprodução.
Os CODECs são algoritmos, ou seja, seqüências de instruções utilizadas para
solucionar um problema computável, “receitas matemáticas” que definem como deve ser
processado um determinado conjunto de informações. Esses algoritmos analisam as
redundâncias do sinal e as codificam em modelos ou vetores matemáticos, reduzindo e
dividindo o grande volume de dados em arquivos menores. Metaforicamente, pode ser
traduzido como uma espécie de caixa mágica que faz com que um elefante caiba numa
caixa de fósforos, em termos de volume de informação; ou mesmo, como uma caixa
surpresa (jack-in-the-box), onde o palhaço salta para fora ao abrirmos a tampa
impulsionada por uma mola. O CODEC funciona mais ou menos como essa mola:
comprimida quando a caixa está fechada, estendida quando aberta.
Foi graças aos CODECs que a Internet pôde se tornar multimídia, pois praticamente
todos os arquivos de áudio e vídeo utilizam algum tipo de CODEC. Porém, todo CODEC
apresenta perda. Depois de aplicar um CODEC sobre um arquivo de áudio ou vídeo,
algumas informações são permanentemente perdidas. O tipo de perda apresentada
depende do tipo de CODEC. Enquanto alguns promovem perda de resolução, outros
quebrada em blocos, e outros problemas. O mesmo ocorre com o áudio e suas
características específicas (harmônicas, ruído de quantização, etc.).
Quando um CODEC é aplicado sobre outro CODEC, as perdas promovidas por
cada um se somam, resultando em uma degradação maior da imagem e/ou som. Esse
fenômeno aparentemente contraria o senso comum de que o vídeo e o áudio digitais não
apresentam degradação de uma geração para outra. Na verdade, não há degradação entre
cópias. Se houver processamento entre as gerações, é provável que ocorram perdas.
Conforme afirmou Manovich, “a digitalização inevitavelmente envolve perda de
informação. Em contraste com uma representação analógica, uma representação codificada
digitalmente contém uma quantidade determinada de informação”.52
Ainda que isso seja
um fato, o autor pondera que já pelo fim da primeira década da nova mídia, no início dos
anos 1990, a tecnologia atingiu o ponto em que uma imagem digital53
poderia facilmente
conter muito mais informação do que qualquer um poderia almejar. Ele menciona esse fato
a respeito dos scanners de 1200 ou 2400 ppi,54
mas hoje temos máquinas fotográficas
digitais com 22 megapixels (22 milhões de pixels) e câmeras mini-DV e HDV. No entanto,
na prática essa diferença é irrisória desde o final dos anos 1990, pois os scanners mais
baratos eram capazes de escanear imagens de 1200 ou 2400 ppi. Nessa época, o
armazenamento digital da imagem ainda era formado de um número finito de pixels,
resolução na qual pode conter um nível de detalhe tão fino quanto na fotografia tradicional,
dependendo do tamanho da impressão.
Porém, não há sentido prático no princípio de que a discretização implica em perda
de informação. Hoje em dia, a digitalização chegou a um tal nível de refinamento de
captura que a diferenciação entre o que é ou não digital (contínuo ou discreto) torna-se
imperceptível. Por outro lado, há o princípio de que a degradação da cópia digital não se
dê na prática, mas devido às limitações de armazenamento, transmissão e processamento,
52
MANOVICH. Op. cit., p. 49.
53
Manovich define uma imagem digital como “um número finito de pixels, cada um tendo um distinto valor tonal ou cromático, e esse número determina a quantidade de detalhe que uma imagem pode representar”. Cf. Op. cit, p. 53.
no caso do vídeo. Assim, toda imagem capturada já é digitalizada com algum nível de
compressão. No caso do formato mini-DV, a própria câmera já captura o som e as
imagens de modo numérico, ou seja, discreto. O CODEC mini-DV é tido como lossless,
isto é, sem perda, reversível. Todo procedimento de cópia que é feito desse material será
literalmente (ou numericamente) idêntico, como, por exemplo, de fita para fita ou
computador > fita > CD > DVD. Mas se o arquivo passar por algum processamento,
provavelmente haverá perda de informação. A aplicação de um CODEC implica em perda,
mas isso pode ocorrer também quando é feita uma transição em vídeo (fade, wipe, etc), ou
aplicação de algum efeito (aumento de contraste, lettering, texturas, etc), pois há uma
retirada de informação.
Tome-se o áudio, por exemplo. Os 16 bits de resolução utilizados nos CDs são suficientes para reproduzir sons com a qualidade exigida pela audição humana. No entanto, quando originalmente gravados por engenheiros de som, normalmente é usada a resolução de 24 bits. Os 8 bits adicionais servem para compensar erros de arredondamento que ocorrerão durante os subseqüentes processamentos digitais dos sinais (como equalização, filtragem, alteração de volume e pitch, mixagem, etc.).55
Na mídia digital a cópia não se distingue do original, pois não há perda de qualidade
(informação) na reprodução. Não há degradação do material de origem. Embora isso seja
verdade, na prática há muito mais degradação e perda de informação entre versões de uma
imagem digital do que entre cópias de fotografia tradicional (analógica). Uma única imagem
digital consiste de milhões de pixels. Todos esses dados exigem um considerável espaço de
armazenamento no disco rígido e tempo para trafegar pela rede. “Por conta disso, o
software e o hardware usados para adquirir, armazenar, manipular e transmitir imagens
digitais se baseam na lossy compression.” 56
A capacidade de resolução dos dispositivos de captura (digitalização) atuais é tão
alta que torna a perda de informação pela discretização irrelevante. No entanto, arquivos
sem compressão possuem uma quantidade enorme de informação e tornam-se muito
54
Do inglês ppi - pixels per inch, em português “pixels por polegada”.
55
DALDEGAN, Pedro. “A escolha do CODEC ideal”. 2001. Cf. http://paginas.terra.com.br/arte/fetiche/brocolisvhs/codec.htm.
“pesados”. No caso do vídeo, isso é crítico. A solução veio ao se perceber que havia muita
informação repetida, logo, o caso era cortar essa redundância para que o arquivo ficasse
mais “leve”. Todas as imagens, em alguma medida, trazem repetições.
A redundância pode ser de dois tipos:
• Redundância espacial: ocorre em áreas da imagem onde pixels adjacentes possuem
o mesmo valor. São relativas a forma, textura e cor da imagem;
• Redundância temporal: ocorre quando há semelhança entre imagens sucessivas, os
pixels da áreas correspondentes possuem o mesmo valor.
Há três aspectos dos CODECs que são intimamente relacionados: taxa de
compressão, qualidade e velocidade de processamento. Em relação ao tempo de
compressão e de descompressão, temos a compressão simétrica e a assimétrica. Na
primeira, o tempo necessário para comprimir e descomprimir o vídeo é equivalente; já na
segunda, a compressão é muito mais demorada que a descompressão, porque efetua uma
análise mais refinada dos elementos de redundância tempo/espacial. Isso torna menos
evidentes os artefatos (ruídos digitais) e garante maior qualidade na recepção e uma
descompressão mais rápida, permitindo a fluidez do vídeo. Na compressão simétrica, há
uma eficiência menor na análise de redundâncias, o que torna os artefatos mais evidentes.
No entanto, em um streaming “ao vivo” ela é inevitável, uma vez que o tempo de
compressão também é determinante.
A taxa de compressão, que define a medida em que o algoritmo reduz a quantidade
de informação contida em uma imagem, pode ser variável. A alteração dos pixels é maior
sobretudo em cenas de movimento, movimentos de câmera ou transições e efeitos de pós-
produção, onde há uma mudança de praticamente 100% dos pixels de um quadro a outro.
Os métodos de compressão podem ser implementados não só através de softwares,
mas também com a ajuda de placas e chips dedicados (hardwares). No começo do desktop
vídeo, o hardware específico era indispensável, pois os processadores da época não
tinham capacidade para processar tal volume de informação individualmente.
Durante a evolução dos processadores, vários CODECs foram sendo criados e constantemente aprimorados. Nos primórdios do vídeo digital, a falta de capacidade de processamento obrigou à utilização de algoritmos mais simples, e portanto menos eficazes. Em alguns casos, chegou-se à implementação via hardware dedicado. Um exemplo é o mpeg2, que durante um bom tempo só podia ser conseguido através de placas específicas para essa tarefa. Com o aumento da capacidade de processamento das CPUs, elas puderam assumir para si essa tarefa, e a implementação do mpeg2 tornou-se possível via software. Com o surgimento de CODECs mais eficazes, aqueles mais primitivos foram gradualmente sendo abandonados, tornando-se obsoletos. É o caso dos CODECs utilizados nos primórdios da multimídia.57
É possível comprimir imagens de vídeo reduzindo o número de frames por segundo, ou alterando sua resolução (tamanho em pixels). Em um método escalonável, a taxa de compressão e, por conseqüência, a qualidade da imagem, adapta-se ao equipamento de exibição. Nesse caso, interferem tanto no poder de processamento do computador como na velocidade de transferência de dados. É o caso dos streamings de vídeo para a Web, em que a velocidade de acesso à Internet é determinante. As imagens também podem ser comprimidas progressivamente. Isso significa que uma seqüência de imagens pode ter sua transmissão e exibição iniciada rapidamente, com alta compressão, para ser refinada progressivamente, com a continuidade do fluxo de dados.
Por fim, outro fator determinante é o ajuste do key-frame (quadro chave). Os key-
frames são quadros inteiros sem compressão de imagem colocados no vídeo em intervalos regulares. Cada qual é seguido por informações sobre como os pixels vão mudar entre um
key-frame e o próximo, produzindo os delta frames. Durante a exibição do filme, o decodificador recria os delta frames baseado nas informações dadas pelo key-frames.
Muitas vezes, essa subtração de informação é imperceptível ao olhar humano, uma forma digital de trompe l’oeil, que em francês significa “enganar o olho”. Essas técnicas envolvem uma relação entre resolução de imagem e tamanho de arquivo. Quanto maior a compressão, menor o tamanho do arquivo, mais leve, mais rápido e mais “portátil” ele fica. E, geralmente, mais visíveis se tornam seus artefatos visuais (ruídos digitais) no momento da visualização, quando o arquivo é descomprimido. Isso é resultado da informação deletada.
É muito comum confundir formatos de vídeo digital com tipos de CODECs. A indústria de software tem uma parcela de responsabilidade por essa situação, ou seja, às
vezes a extensão do arquivo é referente ao formato do arquivo, às vezes aos CODECs. Por exemplo, as extensões .avi e .mov referem-se respectivamente aos formatos de vídeo desenvolvidos inicialmente pela Microsoft e pela Apple. Já as extensões .mpeg, .mp3, .divx ou .mp4 referem-se a suas compressões, que muitas vezes podem ser usadas tanto em arquivos tipo .mov quanto .avi (ou sua versão atual, o .wmv). Já o software RealPlayer trabalha com um tipo de CODEC específico, o que praticamente implica dizer que a extensão .rm desses arquivos e o CODEC utilizado se confundem.