Aula5 parte2

(1)

Natureza da Informação

Profª Ana Carolina Lorena

Bacharelado em Ciência e Tecnologia Universidade Federal do ABC

Setembro 2010

(2)

Compressão com perda

Compressão em que alguma informação da

mensagem original é perdida

Sequências originais não podem ser geradas

novamente a partir da sequência comprimida

Não necessariamente implica que a qualidade do

resultado é reduzida

Ex. Ruído aleatório é frequente em imagens e som Algumas perdas e imagens e som também são

imperceptíveis para o humano

(3)

Compressão com perda

Para dados visuais ou auditivos, alguma

perda de qualidade pode ser tolerada

Sem perder a natureza essencial dos dados

Levando em consideração limitações do sistema

sensorial humano

Compressão com perda é usada

(4)

Compressão com perda

Usada também em:

Câmeras digitais

Para aumentar capacidade de armazenamento

DVDs

Compressão de vídeo com MPEG-2 Video Codec

Audio

Métodos de físico-acústica são usados para remover

(5)

Compressão com perda

Vantagem sobre compressão sem perda é que

muitas vezes compressão com perda produz arquivos/mensagens bem menores

Ainda mantendo requisitos da aplicação

Em imagens: dobro ou mais de compressão do que sem

perda

A maioria dos formatos de compressão com perda

sofre de perda de geração

Compressão e descompressão repetida do mesmo

(6)

Compressão com perda

Importante que qualidade “degrade” em

aspectos menos perceptíveis ao humano

Ex. descartar pixels aleatórios é provavelmente

mais prejudicial do que descartar alguma informação de cor

Portanto, maioria das técnicas de compressão

(7)

Técnicas de compressão com

perda

Algumas técnicas gerais:

Quantização escalar

Quantização vetorial

(8)

Quantização escalar

Reduzir conjunto de mensagens possíveis S

a um conjunto menor S’

Mapeando cada elemento de S em um elemento

em S’

Ex. dividir inteiros de 8 bits por 4 (descartar dois

menores bits)

Ex. se há letras maiúsculas e minúsculas, transformar

todas maiúsculas em minúsculas

Mapeamento é de muitos-para-um

(9)

Quantização escalar

Usada em:

Reduzir número de bits em cores de níveis de

escala de cinza em imagens

Usada para economizar memória em vários monitores

de computador

Classificar intensidade de frequência de

componentes em imagens ou som em grupos Usada em JPEG

(10)

Quantização escalar

Uniforme

: mapeamento é linear

Ex. dividir inteiros de 8 bits por 4

Não uniforme

: mapeamento não linear

Em geral melhor que a uniforme

Ex. olho é mais sensível a valores baixos de vermelho

do que altos

Tornar regiões com valores baixos menores que regiões

em valores maiores

Outra alternativa: basear mapeamento na probabilidade

(11)

Quantização escalar

(12)

Quantização escalar

Ex. quantizando imagem de 8 bits em 6bits,

5bits, 4bits, 3bits, 2bits, e 1 bit

8 bits

(13)

Quantização vetorial

Quantização escalar permite mapeameno

individual de cada cor em uma imagem

colorida em um conjunto menor de valores

Na prática, pode ser mais efetivo mapear regiões

tridimensionais do espaço de cores

Quantização vetorial

: mapear espaço

multidimensional em conjunto menor de

mensagens S’

(14)

Quantização vetorial

Tipicamente:

Seleção de conjuntos representativos do espaço

de entrada;

Mapeamento de todos outros pontos para o

representante mais próximo

Representante pode ser:

Fixo

Determinado para cada arquivo/mensagem

(15)

Quantização vetorial

Como escolher representantes?

Tipicamente: algoritmos de agrupamento

Encontra grupos de pontos nos dados

(16)

Quantização vetorial

Mais efetiva quando variáveis no espaço

multi-dimensional são correlacionadas

Ex.: conjunto de exemplos peso x altura

• Há clara correlação de peso e altura

• Representantes podem se concentrar em áreas que tenham sentido físico (maiores densidades em regiões mais comuns)

• Mais efetivo que quantização escalar separada de peso e altura

(17)

Quantização vetorial

Sem compressão Após quantização vetorial

(18)

Quantização

Tanto escalar quanto vetorial podem ser

usadas como parte de compressão sem

perda

Ex. manda representante mais próximo e

distância do ponto a ele

⇒ ponto original pode ser reconstruído Pode não prover compressão

Mas, se distâncias são pequenas, podem ser codificadas

(19)

Transformadas

Transformar entrada em forma diferente

Para melhor compressão

Perda de alguns termos sem muita perda qualitativa na

saída

Ex. uso de conjunto linear de funções de base ∅_i

que preenchem o espaço a ser transformado

Alguns conjuntos comuns: seno, cosseno, polinômios,

(20)

Transformadas

Ex. 3 primeiras funções base de

(21)

Transformadas

Para um conjunto de n valores,

transformadas podem ser expressas por

matriz T de dimensão n x n

Coeficientes transformada: T . entrada

Multiplicação

(22)

Transformadas

• Ex. DCT (Discrete Cosine Transform)

– Coeficientes são:

(

)

(

)











<

≤

<

+

<

≤

=

+

=

n

j

n

i

n

i

j

n

j

i

n

i

j

n

T

_ij

0 ,

0

2

1

2 cos

2

0 ,

0

2

1

2 cos

1 π

π

(23)

Transformadas

Propriedades para compressão:

Descorrelacionar os dados

Vários coeficientes de transformada pequenos

Passíveis de serem descartados

Para percepção, alguns termos são mais

importantes do que outros

(24)

Ex. DCT em imagem

Separa imagem em partes de frequências

diferentes

Frequências menos importantes podem ser

descartadas Quantização

As mais importantes são usadas para recuperar a

imagem na descompressão

(25)

Ex. DCT em imagem

JPEG:

Quebra imagem em blocos de 8x8 pixels

Da esquerda para direita e de cima para baixo, a

transformada DCT é aplicada a cada bloco

Cada bloco é comprimido por quantização

Descartando frequências pouco perceptíveis para

humanos

O vetor de blocos comprimidos é armazenado

Reduzindo drasticamente a quantidade de espaço

(26)

Ex. DCT em imagem

original Qualidade 50

Qualidade 20 Qualidade 10

http://www.dip.ee.uct.ac.za/~nicolls/lectures/eee401f/projects/dct.pd f

(27)

Compressão

De forma geral, não existe uma técnica melhor

para todas as situações

Por esse motivo, há compactadores especializados

para determinados tipos de mídia

Mesmo em uma mesma mídia, em algumas situações

(28)

Compressão

Sem perda

• Reversível

• Geralmente exploram re-dundâncias nos dados

• Maioria dos dados reais possuem redundância

• Falham em comprimir al-guns arquivos/mensagens

Com perda

• Irreversível

• Em geral, leva a maiores compressões

• Mais usados na

compressão de vídeo, som e imagens

• Várias técnicas focam em idiossincrasias da anatomia humana idiossincrasias

(29)

Referências

Material de:

Wikipedia

Aula MIT (capítulo 3, no site do curso)

Livro CMU: Introduction to data compression, Guy

Blelloch

http://www.cs.cmu.edu/afs/cs/project/pscico-guyb/realworld/www/compression.pdf

Image compression and the discrete cosine

transform

http://www.dip.ee.uct.ac.za/~nicolls/lectures/eee401f/pro