Sistemas discretos sem memória e codificação da fonte

(1)

Sistemas discretos sem mem´

oria e codifica¸c˜

ao da

fonte

Luis Henrique Assump¸c˜ao Lolis

(2)

Conte´

udo

1 Sistemas discretos sem mem´oria

Redundˆancia

2 Codifica¸c˜ao da fonte

C´odigo Morse

(3)

Sum´

ario

1 Sistemas discretos sem mem´oria

Redundˆancia

2 Codifica¸c˜ao da fonte C´odigo Morse

(4)

Sistemas discretos sem mem´

oria

Um evento n˜ao depende dos eventos anteriores, sendo assim

estatisticamente independente. Defini¸c˜oes:

Fonte discreta de informa¸c˜ao Fonte que gera uma sequˆencia de s´ımbolos.

S´ımbolo Tamb´em chamado de letra.

Alfabeto da fonte Um conjunto de s´ımbolos que fazem parte do mesmo grupo.

Mensagem Grupo de s´ımbolos consecutivos.

(5)

O que em estat´ıstica nós chamamos de experimento, em comunica¸cões nós chamaremos de alfabeto:

U = {u1, ..., un} com probabilidades P = {p1, ..., pn} Analogia com a linguagem escrita, existem as palavras ou mensagens, com tamanho l e denominadas por v. Um

alfabeto consistente de n s´ımbolos, permite nl mensagens

diferentes. O conjunto V = {v1, ..., vj, ..., vnl} cont´em todas

as mensagens poss´ıveis. As probabilidades de p1 a pn d˜ao a quantidade de informa¸c˜ao do alfabeto: H(U ) = n X i=1 pilog2 1 pi

Tendo a m´axima quantidade de informa¸c˜aoem:

maxuH(U ) = log2n tendo pi=

1

(6)

Redundˆ

ancia

´

E quando se trabalha as probabilidades de determinadas sequências de maneira que não se obtém a máxima quantidade de informa¸cão.

Não é necessariamente ruim, pois a redundância, explicada no conceito da teoria da informa¸cão, diminui a quantidade de surpresa de uma sequência e elimina a possibilidade de ocorrência de outras sequencias.

A redundância será usada em códigos de corre¸cão de erro, pois se certas sequências forem recebidas e não são esperadas, isso vai indicar erro.

A redundânciaé quantificada como a distância da quantidade máxima de informa¸cão:

red= 1 − H(U )

maxuH(U )

= 1 −H(U )

(7)

Exerc´ıcio

Considere o alfabeto bin´ario:

U = {0, 1}

A ocorrˆencia dos s´ımbolos sendo estatisticamente independente e de valor: P0 = 1 4 P1= 3 4

As mensagens s˜ao todas as combina¸c˜oes poss´ıveis de 3 bits: V = {000, 001, ..., 111}

(8)

Nota

A quantidade de informa¸c˜ao tamb´em pode ser medida por

unidade de tempo. Se o envio de uma mensagem leva t

segundos, a quantidade de informa¸c˜ao no tempo ´e dada em

bits/segundo: Ht(U ) = 1 tH(U ) t = n X k=1 tk· pk Ex:

Quanta informa¸c˜ao em bits/s tr´as um v´ıdeo em RGB

codificado em 256 n´ıveis para cada cor, com 800X600 pixels e 25 quadros por segundo?

(9)

t é o tempo médio de cada s´ımbolo ou o tempo médio de cada mensagem.

Considere que t0 = 0, 02 seg e que t1= 0, 01.

Calcular a quantidade de informa¸c˜ao por s´ımbolo em bits/seg H(U ) = n X i=1 p(ui)log2 1 p(ui) = 1 4log2(4) + 3 4log2 4 3 = 0, 811 bits/s´ımbolo t = n X k=1 tk· pk= t0· p(0) + t1· p(1) = 0, 02 · 0, 25 + 0, 01 · 0, 75 = 0, 0125 seg Ht(U ) = 1 tH(U ) = 1 0, 01250, 811 = 64, 88 bits/seg Calcular a quantidade de informa¸c˜ao em bits/s das palavras contendo 3 bits.

(10)

Sum´

ario

1 Sistemas discretos sem mem´oria Redundˆancia

2 Codifica¸c˜ao da fonte

C´odigo Morse

(11)

Codifica¸c˜

ao da fonte

Tornar a representa¸c˜ao mais compacta poss´ıvel sem perda de informa¸c˜ao.

Intui¸c˜ao

Não se usa mais bits na mensagem que a própria quantidade de informa¸cão, ligada a probabilidade das mensagens ocorrerem. Mensagens com menor probabilidade podem ser codificadas com sequências mais longas (pois contêm maior quantidade de informa¸cão).

(12)

C´

odigos de largura vari´

avel

Quantidade de informa¸cão de sistemas com palavras código de largura variável:

H(V) = K−1 X k=0 pklog2 1 pk

(13)

Estamos interessados em c´odigos que satisfa¸ca duas condi¸c˜oes:

1 A palavra código é na forma binária 2 O código é unicamente decodificável

Qualquer sequencia de palavras código é ligada à uma única sequência de s´ımbolos da fonte.

(14)

C´

odigo Morse

O interessante do c´odigo morse ´e ele ter sido implementado

em sistemas anal´ogicos, onde o conceito do tamanho da

palavra código se aplicava à representa¸cão de um caractere:

Fonte: wikip´edia : letter frequency http://en.wikipedia.org/Letter frequency

Fonte: morsecodecompany

(15)

Fonte discreta sem mem´oria sk, passada por um codificador

da fonte, criando a sequˆencia bin´aria bk de probabilidade pk,

k = 0, 1, .., K − 1, K é o número de s´ımbolos diferentes. O tamanho de palavra de código é variável e denominado lk

O tamanho m´edio de cada palavra c´odigo depende da probabilidade de cada s´ımbolo, pk:

L =

K−1

X

k=0

pklk

Se o código é ideal, o tamanho médio da palavra código é igual ao tamanho m´ınimo da palavra código Lmin. Então a

eficiência do código é dada por:

η = Lmin

(16)

Sum´

ario

1 Sistemas discretos sem mem´oria Redundˆancia

2 Codifica¸c˜ao da fonte C´odigo Morse

(17)

Teorema de codifica¸c˜

ao

L ≥ H(V), então o tamanho m´ınimo da palavra código é: L = H(V)

Dado uma sequˆencia de s´ımbolos de Entropia (quantidade de

informa¸c˜ao) H(V), o tamanho m´edio das palavras deve ser tal que:

η = H(V)

(18)

Fazendo a diferen¸ca entre redundˆ

ancia e eficiˆ

encia

Redundˆancia

Compara a quantidade de informa¸cão de um conjunto de palavras código (probabilidades das diferentes palavras código) e a máxima quantidade de informa¸cão poss´ıvel quando as palavras código são equiprováveis.

Eficiˆencia

Teorema de Shannon: compara a quantidade de informa¸cão de um jogo de palavras-código (mensagens) e o tamanho médio m´ınimo poss´ıvel para as palavras código.

Para um sistema de m´axima eficiˆencia:

Encontre a rela¸cão que liga o tamanho das palavras código às suas probabilidades: K−1 X k=0 pklk= K−1 X k=0 pklog2 1 pk

(19)

Exerc´ıcio (1):

Encontre a rela¸cão que liga o tamanho das palavras código às suas probabilidades em um código ideal:

1 L = H(V) 2 L = K−1 X k=0 pklk 3 H(V) = L = K−1 X k=0 pklog2 1 pk 4 K−1 X k=0 pklk= K−1 X k=0 pklog2 1 pk