Natureza da Informação
Profª Ana Carolina Lorena
Bacharelado em Ciência e Tecnologia Universidade Federal do ABC
Setembro 2010
Compressão com perda
Compressão em que alguma informação da
mensagem original é perdida
Sequências originais não podem ser geradas
novamente a partir da sequência comprimida
Não necessariamente implica que a qualidade do
resultado é reduzida
Ex. Ruído aleatório é frequente em imagens e som Algumas perdas e imagens e som também são
imperceptíveis para o humano
Compressão com perda
Para dados visuais ou auditivos, alguma
perda de qualidade pode ser tolerada
Sem perder a natureza essencial dos dados
Levando em consideração limitações do sistema
sensorial humano
Compressão com perda é usada
Compressão com perda
Usada também em:
Câmeras digitais
Para aumentar capacidade de armazenamento
DVDs
Compressão de vídeo com MPEG-2 Video Codec
Audio
Métodos de físico-acústica são usados para remover
Compressão com perda
Vantagem sobre compressão sem perda é que
muitas vezes compressão com perda produz arquivos/mensagens bem menores
Ainda mantendo requisitos da aplicação
Em imagens: dobro ou mais de compressão do que sem
perda
A maioria dos formatos de compressão com perda
sofre de perda de geração
Compressão e descompressão repetida do mesmo
Compressão com perda
Importante que qualidade “degrade” em
aspectos menos perceptíveis ao humano
Ex. descartar pixels aleatórios é provavelmente
mais prejudicial do que descartar alguma informação de cor
Portanto, maioria das técnicas de compressão
Técnicas de compressão com
perda
Algumas técnicas gerais:
Quantização escalar
Quantização vetorial
Quantização escalar
Reduzir conjunto de mensagens possíveis S
a um conjunto menor S’
Mapeando cada elemento de S em um elemento
em S’
Ex. dividir inteiros de 8 bits por 4 (descartar dois
menores bits)
Ex. se há letras maiúsculas e minúsculas, transformar
todas maiúsculas em minúsculas
Mapeamento é de muitos-para-um
Quantização escalar
Usada em:
Reduzir número de bits em cores de níveis de
escala de cinza em imagens
Usada para economizar memória em vários monitores
de computador
Classificar intensidade de frequência de
componentes em imagens ou som em grupos Usada em JPEG
Quantização escalar
Uniforme
: mapeamento é linear
Ex. dividir inteiros de 8 bits por 4
Não uniforme
: mapeamento não linear
Em geral melhor que a uniforme
Ex. olho é mais sensível a valores baixos de vermelho
do que altos
Tornar regiões com valores baixos menores que regiões
em valores maiores
Outra alternativa: basear mapeamento na probabilidade
Quantização escalar
Quantização escalar
Ex. quantizando imagem de 8 bits em 6bits,
5bits, 4bits, 3bits, 2bits, e 1 bit
8 bits
Quantização vetorial
Quantização escalar permite mapeameno
individual de cada cor em uma imagem
colorida em um conjunto menor de valores
Na prática, pode ser mais efetivo mapear regiões
tridimensionais do espaço de cores
Quantização vetorial
: mapear espaço
multidimensional em conjunto menor de
mensagens S’
Quantização vetorial
Tipicamente:
Seleção de conjuntos representativos do espaço
de entrada;
Mapeamento de todos outros pontos para o
representante mais próximo
Representante pode ser:
Fixo
Determinado para cada arquivo/mensagem
Quantização vetorial
Como escolher representantes?
Tipicamente: algoritmos de agrupamento
Encontra grupos de pontos nos dados
Quantização vetorial
Mais efetiva quando variáveis no espaço
multi-dimensional são correlacionadas
Ex.: conjunto de exemplos peso x altura
• Há clara correlação de peso e altura
• Representantes podem se concentrar em áreas que tenham sentido físico (maiores densidades em regiões mais comuns)
• Mais efetivo que quantização escalar separada de peso e altura
Quantização vetorial
Sem compressão Após quantização vetorial
Quantização
Tanto escalar quanto vetorial podem ser
usadas como parte de compressão sem
perda
Ex. manda representante mais próximo e
distância do ponto a ele
⇒ ponto original pode ser reconstruído Pode não prover compressão
Mas, se distâncias são pequenas, podem ser codificadas
Transformadas
Transformar entrada em forma diferente
Para melhor compressão
Perda de alguns termos sem muita perda qualitativa na
saída
Ex. uso de conjunto linear de funções de base ∅i
que preenchem o espaço a ser transformado
Alguns conjuntos comuns: seno, cosseno, polinômios,
Transformadas
Ex. 3 primeiras funções base de
Transformadas
Para um conjunto de n valores,
transformadas podem ser expressas por
matriz T de dimensão n x n
Coeficientes transformada: T . entrada
Multiplicação
Transformadas
• Ex. DCT (Discrete Cosine Transform)
– Coeficientes são:
(
)
(
)
<
≤
<
<
+
<
≤
=
+
=
n
j
n
i
n
i
j
n
n
j
i
n
i
j
n
T
ij0
,
0
2
1
2
cos
2
0
,
0
2
1
2
cos
1
π
π
Transformadas
Propriedades para compressão:
Descorrelacionar os dados
Vários coeficientes de transformada pequenos
Passíveis de serem descartados
Para percepção, alguns termos são mais
importantes do que outros
Ex. DCT em imagem
Separa imagem em partes de frequências
diferentes
Frequências menos importantes podem ser
descartadas Quantização
As mais importantes são usadas para recuperar a
imagem na descompressão
Ex. DCT em imagem
JPEG:
Quebra imagem em blocos de 8x8 pixels
Da esquerda para direita e de cima para baixo, a
transformada DCT é aplicada a cada bloco
Cada bloco é comprimido por quantização
Descartando frequências pouco perceptíveis para
humanos
O vetor de blocos comprimidos é armazenado
Reduzindo drasticamente a quantidade de espaço
Ex. DCT em imagem
original Qualidade 50
Qualidade 20 Qualidade 10
http://www.dip.ee.uct.ac.za/~nicolls/lectures/eee401f/projects/dct.pd f
Compressão
De forma geral, não existe uma técnica melhor
para todas as situações
Por esse motivo, há compactadores especializados
para determinados tipos de mídia
Mesmo em uma mesma mídia, em algumas situações
Compressão
Sem perda
• Reversível
• Geralmente exploram re-dundâncias nos dados
• Maioria dos dados reais possuem redundância
• Falham em comprimir al-guns arquivos/mensagens
Com perda
• Irreversível
• Em geral, leva a maiores compressões
• Mais usados na
compressão de vídeo, som e imagens
• Várias técnicas focam em idiossincrasias da anatomia humana idiossincrasias
Referências
Material de:
Wikipedia
Aula MIT (capítulo 3, no site do curso)
Livro CMU: Introduction to data compression, Guy
Blelloch
http://www.cs.cmu.edu/afs/cs/project/pscico-guyb/realworld/www/compression.pdf
Image compression and the discrete cosine
transform
http://www.dip.ee.uct.ac.za/~nicolls/lectures/eee401f/pro