TL011 - Televisão Digital

(1)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

TL011 - Televisão Digital

Capítulo I – Codificação de fonte

Pós-Graduação em Engenharia de Redes e Sistemas de Telecomunicações

2014

(2)

Codificador de fonte Codificador de canal Modulador Fonte Decodificador de canal Demodulador Decodificador de fonte Destino Canal Ruído Sistema de comunicação digital genérico

Transmissão

(3)

(4)

Vídeo

O vídeo é formado por uma sequência de quadros

(“fotos/imagens” estáticas) de uma cena, que são tomados com uma certa frequência (ex. 30 quadros/s).

(5)

Relação de Aspecto

Define a proporção entre largura e altura da tela/video. 4:3

Largura= 1.33 x Altura

16:9 (widescreen) Largura = 1.78 x Altura

(6)

Resoluções de vídeo em TV Digital (Colunas x Linhas)

HDTV - 1920 x 1080 (16:9)

(High Definition Television)

2.074 Megapixels

SDTV - 640 x 480 (4:3)

(Standard Definition Television)

0.307 Megapixels

EDTV - 1280 x 720 (16:9)

(Enhanced Definition Television)

0.922 Megapixels

LDTV - 320 x 240 (4:3) (Low Definition Television)

(7)

UHDTV (Ultra High Definition Television)

4K - 8 megapixels (3840 x 2160) 8K - 32 megapixels (7680 x 4320)

(8)

Conversão de sinais de vídeo

analógico para Digital

(9)

Os sensores das câmeras convertem as informações capturadas da cena em sinais correspondentes as cores primárias RGB ( Red Green Blue).

O monitor da TV exibe a informação RGB de cada elemento – pixel - que compõe a imagem.

Monitor

(10)

Vídeo Analógico para Digital

Os principal formato de vídeo componente utilizado nos sistemas de transmissão digitais não é o RBG, mas sim um sinal chamado de YCbCr.

Sendo que:

Y = Luminância ou brilho (imagem em preto e branco); Cb e Cr = Crominância ou sinais de diferença de cor;

O olho humano é mais sensível às variações de informação de brilho do que às variações de cor.

O sinal de vídeo componente permite explorar as características do sistema visual humano para otimizar a transmissão do sinal de vídeo – isto não é possibilitado com sinal RGB. Por exemplo, pode-se sub-amostrar as informações de crominância.

(11)

Vídeo Analógico para Digital

As informações de vídeo digital são transmitidas através de um sinal de vídeo componente que é o YCbCr.

A relação matemática para conversão do sinal RGB digitalizado para o sinal YCbCr, definida pela recomendação BT 601 para sinais SD

(Standart Definition), está mostrada abaixo:

Y = 0,257R’ + 0,504G’ + 0,098B’ + 16

Cb = −0,148R’ − 0,291G’ + 0,439B’ + 128 Cr = 0,439R’ − 0,368G’ − 0,071B’ + 128

Neste caso, cada um dos sinais RGB variam de 0 até 255 e correspondendo à uma palavra de 8 bits.

(12)

Geração do sinal YCbCr

Matriz Linear* (RGB p/ YPbPr)

Filtro Amostrador _Quantizador _{Codificador PCM} R’G’B’ (analógico)

YPbPr (analógico)**

YCbCr (Digital)

* Converte RGB para YPbPr ** Versão analógica do YCbCr

Filtro _Filtro Amostrador _Amostrador _Quantizador _{Codificador PCM} Quantizador Codificador PCM

(13)

Formatos de amostragem dos sinais de vídeo

• O formato de amostragem define como as componentes Y, Cb e Cr serão amostradas para compor a informação de cada pixel da imagem;

• Emprega-se normalmente a sub-amostragem (down sample) das informações de crominância para diminuir a taxa de bits necessária para a transmissão das informações de vídeo;

• O formato de amostragem é representado pela notação A:B:C Ex.: 4:4:4, 4:2:2, etc.

(14)

Formato de amostragem 4:4:4

Tem-se amostras das componentes Y, Cb e Cr em todos os pixels.

Pixel

Amostra Luminância (Y)

Amostra Crominância (Cr,Cb)

Formato 4:4:4

(15)

Formatos de Amostragem

Tem-se amostras de Luminância (Y) em todos os pixels;

As amostras de crominância (Cb e Cr) estão presentes em pixels alternados (pixel sim, pixel não);

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb)

(16)

A cada 4 pixel toma-se amostras das crominâncias em apenas 1.

Pixel

Amostra Luminância (Y)

Amostra Crominância (Cr,Cb)

Formato 4:1:1

(17)

Na primeira linha: Tem-se amostras de crominância em pixels intercalados;

Na segunda linha não há amostra de crominâncias.

Pixel

Formato 4:2:0

(18)

Número de bits por pixel

Considerando que nominalmente cada sinal de vídeo componente YCbCr é formada por 8 bits, para o formato de amostragem 4:2:0 tem-se:

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb) Formato 4:2:0

Formatos de Amostragem

24 bits (YCbCr) 8 bits (Y)

(19)

Analógico para Digital

A tabela abaixo apresenta o número de pixels para as duas taxas de amostragem da Recomendação ITU-R BT601-5, de acordo com os formatos de amostragens 4:2:2 e 4:4:4, para padrões com 525 linhas e 30 quadros por segundo (NTSC e PAL-M), nas relações de aspecto 4:3 e 16:9.

(20)

Taxa de transmissão - YCbCr

A taxa de transmissão do sinal de vídeo componente digital para

atender um sistema de TV convencional pode ser calculada através da expressão:

onde: R_b é a taxa de bits em bps,

R_q é a taxa de apresentação de quadros por segundo,

n_b é o número de bits por amostra,

l é o número de linhas ativas,

S_Y é o número de amostras do sinal Y (pixels ativos por linha),

S_Cr é o número de amostras do sinal Cr (pixels ativos por linha),

S_Cb é o número de amostras do sinal Cb(pixels ativos por linha).

)

(

_Y _Cr _Cb b q b

R

n

l

S

R







(21)

Exercício

Exercícios YPbPr

1 - Determine a taxa necessária para se transmitir as informações visíveis

de vídeo componente digital (YCbCr) em um padrão de TV com 525 linhas e 30 quadros por segundo, que faz uso da taxa de amostragens de 13,5 MHz nos formatos de amostragem 4:4:4 e 4:2:2 com 8 bits por

amostra.

(

)

Cb Cr Y b q b

R

n

l

S

R







(22)

Exercício

Exercício 2:

Baseado nos cálculos obtidos no exercício 1, responda:

2.1 - O que se pode concluir com relação à escolha do formato de amostragem?

2.2 - O que se pode concluir com relação à taxa útil necessária para a transmissão do sinal YCbCr?

(23)

(24)

Compressão de Vídeo

O processo de compressão de vídeo tem por objetivo diminuir a taxa de bits necessárias para a transmissão do sinal de vídeo.

O processo de compressão explora as redundâncias e informações

“menos relevantes” – ex. não perceptíveis visualmente – para alcançar a diminuição da taxa de bits.

A compressão de vídeo, portanto, reduz as redundâncias e introduz distorções controladas nas

informações que formam o vídeo

.

Compactação Compressão Entropia Redundância Entropia Redundância Entropia Redundância

(25)

• Exemplo de compactação: amostragem.

• Teorema de Nyquist: “Todo sinal analógico limitado em banda pode ser perfeitamente representada por suas amostras, desde que estas sejam tomadas a taxa de amostragem dada por

onde, f_s é a frequência de amostragem e f_max é a máxima frequência do sinal analógico.”

máx

S

f



2

(26)

Exemplo de compressão: sub-amostragem dos sinais de crominância.

Pixel

Formato 4:2:2

(27)

Tipos de redundâncias:

• Espacial: informações similares dentro de um mesmo quadro; • Temporal: informações similares entre quadros sucessivos;

“Redundância Temporal” Redundância

Espacial

(28)

A seguir as duas principais técnicas de compressão utilizadas em processamento de vídeo:

• Codificação por transformada DCT Utilizada na compressão espacial.

• Estimação de movimento e compensação de movimento Utilizada na compressão Temporal.

(29)

Codificação por transformada DCT

(30)

Os principais padrões de compressão – JPEG, MPEG – utilizam a transformada

discreta de cossenos ou DCT (Discrete Cosine Transform), pois esta apresenta

uma solução de compromisso entre complexidade e desempenho.

O emprego da codificação por transformada DCT em compressão de imagens/vídeo normalmente envolve os seguintes passos:

Cálculo

da DCT Quantização Ordenação dos _coeficientes

Coeficientes da DCT F(u,v)

Codificação por transformada - DCT

Codificação RLC

(31)

Primeiro passo – Cálculo da DCT

A DCT expressa uma sequencia finita de dados em função de uma soma de funções cosenoidais com frequências diferentes entre si. Veja a fórmula de cálculo da DCT e IDCT 2D (bidimensional):

DCT

IDCT

(32)

A DCT pode ser definida para qualquer arranjo retangular de pixels, mas em compressão de imagem, o bloco básico é geralmente um arranjo com 8 × 8 pixels (64 pixels).

A aplicação da DCT sobre um bloco de pixels de tamanho maior

aumenta consideravelmente a complexidade de processamento e não proporciona ganho de compressão significativo.

Cálculo da DCT

172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100

Valores de intensidade do pixel (Y) 8 × 8 pixels

x y

(33)

Para um arranjo com 8 × 8 pixels a DCT, para compressão JPEG, é definida como

onde,

f (x, y) é o valor da amostra do pixel situado nas coordenadas (x, y) do

arranjo 8 × 8 de amostras;

F(u, v) são os coeficientes da transformada dos pixels nas coordenadas

(u, v) do arranjo 8 × 8 de coeficientes.

Os valores de Cu e Cv são definidos como

(34)

A DCT converte valores de amostras espaciais (ex. valores de

luminância (Y) dos pixels de um determinado espaço da imagem) em coeficientes de frequências espaciais.

Cálculo da DCT

f(x,y) F(u,v) DCT x y u v IDCT Domínio espacial

(35)

Cálculo da DCT

f(x,y)

f(x,y) = valor de amostra – ex. luminância (Y) - de cada pixel. F(u,v) DCT x y u v IDCT 172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100 1256,4 228,6 -50,0 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 F(u,v) = Coeficientes da DCT DCT

(36)

Note que:

O cálculo de F(0, 0) resultará em um valor DC (sem componentes cosenoidais ou seja, sem componentes AC).

O cálculo de um valor de coeficiente F(u, v) envolve a soma/multiplicação dos 64 valores de f(x,y). Portanto, cada valor de F(u, v) depende de todos os pixels do bloco.

Os valores dos elementos da fórmula que não o f(x,y) – amostras da imagem -

dependem apenas de x, u, y e v, que são valores pré-determinados (0 a 7 para blocos de 8x8 pixels):

Estes valores são chamados de FUNÇÕES BASE da DCT.

(37)

Veja as funções base da DCT no domínio espacial (domínio dos pixels):

As funções base representam um conjunto de 64 pixels

(38)

A DCT descreve o bloco da imagem em função de uma soma ponderada ou combinação linear das funções base.

Bloco da imagem Componente DC Componentes AC

Através da soma ponderada das funções base,

pode-se representar qualquer padrão de bloco de imagem.

Cálculo da DCT

(39)

Cálculo da DCT – Exemplo Wikipedia

Bloco de imagem

DCT

Matriz de coeficientes da DCT F(u,v)

(40)

Cálculo da DCT - Exemplo Wikipedia

Funções base e os coeficientes

Legenda da animação:

Esquerda: Imagem resultante da soma cumulativa

Meio: Resultado da multiplicação da função base pelo Coeficiente

Direita:

Função base e o coeficiente da DCT

http://en.wikipedia.org/wiki/Discrete_cosine_transform A imagem a partir das

(41)

Componentes de frequência espacial

• Tipicamente o resultado da DCT concentra coeficientes de valores maior nas componentes de baixa frequência espacial.

• O sistema visual humano é

menos sensível às componentes de alta frequência espacial.

Cálculo da DCT

F(u,v)

Aumento da frequência espacial

(42)

O emprego da DCT resulta em quase nenhuma compactação, pois a matriz resultante terá o mesmo tamanho da matriz original.

O processo de quantização é que permite a compressão de dados, pois transforma em zero muitos elementos da matriz de coeficientes DCT. A matriz de coeficientes DCT é dividida por outra matriz (chamada de matriz de quantização). O resultado da divisão passa por um

ARREDONDAMENTO, e os elementos “menos importantes”

(componentes de alta frequência espacial) passam a assumir o valor Zero.

O processo de arredondamento da divisão introduz perda de informação, o que insere distorções irreversíveis, porém pouco perceptíveis ao olho humano.

(43)

Quantização - Exemplo

1256,4 228,6 -50 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 F(u,v) Q(u,v) 78,525 20,7818182 -5 1,10625 -0,65 0,05 -0,0529412 0,095082 12,9 -6,66666667 -6,6571429 1,4210526 -0,25 0,212069 0,0333333 0,0127273 0,6928571 -7,1 3,58125 1,6375 -0,725 0,0596491 0,0913043 0,0267857 1,1642857 -0,74705882 1,6090909 -1,6413793 -0,1352941 0,2045977 -0,02625 0,0709677 0,1166667 -0,82727273 0,1081081 -0,2571429 0,4058824 -0,0522936 -0,1252427 -0,0181818 -0,125 -0,11142857 0,0109091 -0,1453125 0,0308642 -0,1711538 0,1088496 0,0663043 -0,0244898 -0,084375 0,024359 -0,0827586 0,0601942 -0,0123967 0,0516667 -0,1168317 0,0986111 -0,03152174 0,04 0,0091837 -0,0125 0 0,0194175 0,0292929 = 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Div / C(u,v) Coeficientes a serem transmitidos Exemplo

(44)

Organização dos coeficientes

Passo 3 – Organização dos coeficientes

A leitura (scan) dos coeficientes da DCT quantizados é realizada de forma a

concatenar o maior número de zeros consecutivos.

A leitura se inicia pelos componentes com probabilidade maior de assumir valores diferentes de zero.

Existem padrões de leitura padronizados como o “zig-zag” (veja ao lado).

(45)

Organização dos coeficientes

Exemplo de matrizes de coeficientes da DCT quantizados:

Coeficientes organizados: 79, 13, 21, -5, ... 0, 0, 0, 0, 0, 0 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C(u,v) C(u,v) Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0

(46)

Codificação RLC

Passo 4 – Codificação RLC – Run Lenght Coding A codificação RLC permite reduzir a quantidade de dados

necessários para a transmissão de uma longa sequência de símbolos idênticos.

Princípio da codificação RLC:

Símbolos: A B C D D D D D D D D D D E F... Codificação RLC: A B #10D E F ...

(47)

Codificação RLC

Passo 4 – Codificação RLC – Run Lenght Coding

A utilização de codificação RLC para a codificar os coeficientes da DCT quantizados permite reduzir a taxa de bits necessária para a transmissão de tais coeficientes.

A codificação RLC é potencializada graças aos processo prévios de quantização e de organização de leitura dos coeficientes quantizados.

Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0

(48)

JPEG

A codificação por transformada DCT é a base do padrão de compressão JPEG

Tipicamente a compressão JPEG sem perda visível gira em torno de 10:1, podendo chegar até 20:1. Exemplo: Imagem de 2 Mbytes tem seu

tamanho reduzido para 100 Kbytes.

O limiar de erro visível varia consideravelmente por imagem.

Compressão de 30:1 a 50:1 é possível com imperfeições moderadas. A taxa de compressão é obtida em função da matriz de quantização Q Utilizada no processo de compressão por transformada DCT.

(49)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital Compressão 2,6:1 Tamanho do arquivo 83kB Compressão 15:1 Tamanho do arquivo 15kB Compressão 46:1 Tamanho do arquivo 5kB

(50)

Cálculo

da DCT Quantização Ordenação dos _coeficientes Coeficientes da DCT F(u,v)

Codificação por transformada - DCT

Codificação RLC

Exercício - Codificação por transformada DCT 1 ) Responda:

1.1 - Descreve as etapas normalmente envolvidas no processo de codificação por transformada DCT.

1.2 – A transformada DCT em si insere perdas na informação? E a codificação por transformada? Por quê?

1.3 - O que representa os coeficientes da transformada DCT? 1.4 - Comente sobre as componentes de frequência espacial

(51)

Estimação de Movimento e

Compensação de movimento

(52)

Uma maneira de explorar esta similaridade entre os quadros no sistema de codificação de fonte, seria transmitir um dado quadro e para o

quadro seguinte transmitir somente as informações que se alteram em relação ao quadro anterior.

Este é o principio básico explorado pela codificação temporal.

(53)

- Transmite-se todas as informações do primeiro quadro - quadro de referência (I) - utilizando codificação por DCT, por exemplo. Ou seja realiza-se uma compressão espacial ou INTRAQUADRO. Compare blocos do quadro atual com blocos do quadro de

referência (I): grande parte dos blocos possuem informações idênticas ou com pequenas alterações e/ou movimentos.

Quadro de referência (I) Quadro Atual

(54)

- Transmite-se instruções ao decodificador relacionadas a como reconstruir o quadro atual em função do quadro de referência. - Estas instruções são enviadas em forma de Vetores de

Movimento e também de resíduos (diferenças ou erros).

- A técnica de levantar os valores dos vetores de movimento chama-se: Estimação de movimento.

- A técnica que utiliza os vetores de movimento para reduzir os efeitos do movimento chama-se: Compensação de Movimento. - Os blocos idênticos – ex. fundo – possuirão vetor de movimento e

os resíduos com valor zero.

(55)

Exemplo de estimação do vetor de movimento:

Comparando os blocos do quadro atual com o quadro de referência pode-se encontrar o bloco com maior correlação – bloco de melhor casamento - e a partir daí obter o vetor de movimento associado ao bloco. O vetor de movimento indicará onde encontrar no quadro de referência o bloco de maior correlação com o bloco a ser codificado.

Quadro de

Referência (I) Quadro Atual

Vetor de movimento Bloco a ser

codificado Codificação Temporal

(56)

O cálculo do melhor casamento pode indicar que há diferenças entre o bloco do quadro atual e o bloco de melhor casamento.

Deformações de objetos, rotações, diferenças de iluminação, etc. podem causar diferenças “pequenas” entre os blocos.

A matriz de diferenças entre os blocos, chamada de RESÍDUO, é codificada e transmitida junto com o vetor de movimento para

permitir reconstruir o bloco atual em função do bloco de referência. Um bom codificador compara a quantidade de bits necessária para a transmissão dos resíduos e para a transmissão do bloco inteiro (sem usar compensação de movimento) para verificar qual a melhor opção em termos de redução de taxa de transmissão.

(57)

Quadro de referência (I) Quadro Atual

Vetores de movimento

(58)

Busca do bloco de melhor casamento

Definição do vetor de movimento Exercícios Codificação Temporal

1)Responda:

1.1- Descreve o processo de compensação de movimento. 1.2 – Que tipo de redundância é explorada por esta técnica?

1.3 – Como é alcançada a redução de taxa de transmissão fazendo uso desta técnica?

Codificação Temporal - Compensação de Movimento

vetor de movimento

(59)

Compressão de vídeo

Padrão MPEG

(60)

MPEG - Introdução

MPEG (Moving Pictures Experts Groups)

Comitê formado em 1988 pela ISO (International Organization for Standardization) com objetivo de desenvolver padrões para

compressão/codificação de vídeo e áudio.

Foram definidos três padrões a serem desenvolvidos cujas características alvo inicialmente propostas eram:

- MPEG-1 - padrão para compressão de vídeo/áudio até 1.5 Mbps; - MPEG-2 - padrão para compressão de vídeo/áudio até 10 Mbps; - MPEG-3 - padrão para compressão de vídeo/áudio até 60 Mbps; O desenvolvimento do MPEG-3 fora cancelado, devido ao

(61)

MPEG - Introdução

Resumo das principais características dos padrões MPEG

MPEG-1 Padronizado em 1991 - ISO/IEC 11172

- Taxas de vídeo/áudio até 1.5 Mbps;

- Resolução máxima de 352 x 240 (CIF); - Suporte somente a vídeo não entrelaçado; - Utilizado em CD-Rom;

MPEG-2 - Padronizado em 1994 - ISO/IEC 13818

- Taxas de vídeo/áudio superior a 80 Mbps; - Suporte à resolução HD;

- Suporte a vídeo entrelaçado e não entrelaçado;

(62)

MPEG - Introdução

Resumo das principais características dos padrões MPEG MPEG-4/H.264

H.264 é um padrão para compressão de vídeo, baseado no MPEG-4 Part 10 ou AVC (Advanced Video Coding).

O padrão foi desenvolvido pela ITU-T - Video Coding Experts Group (VCEG) - em conjunto com a ISO/IEC – MPEG - através de uma parceria conhecida por Joint

Video Team (JVT). A versão oficial do padrão, ISO/IEC 14496-10, foi lançado em 2003.

A principal meta proposta para o desenvolvimento do padrão H.264/MPEG-4 AVC foi a de melhorar a eficiência de codificação em pelo menos duas vezes em relação ao MPEG-2.

O Padrão MPEG-4/H.264 é utilizado nos padrões de TV Digital ISDB-TB e DVB-T2.

(63)

• Bloco: é uma matriz de 8x8 pixels (ex. luminância)

• Macrobloco: é uma matriz composta de 16x16 pixels ou 4 blocos.

• Fatia (Slice): é um conjunto de macroblocos sequenciais. Os slices são codificados de modo independente entre si, de modo que se o canal corromper dados de um slice, a decodificação pode recomeçar no próximo slice recebido.

• Quadro (Frame): é uma imagem propriamente dita.

Hierarquia e Terminologia do MPEG

Quadro Slice

Macrobloco

(64)

Grupo de quadros (GOP - Group Of Pictures): é um conjunto de quadros

formado tipicamente por 3 diferentes tipos de quadros: I, B e P (quadros estes gerados a partir de diferentes tipos de codificações);

Tais quadros são organizados em uma estrutura normalmente repetitiva periódica que tem comprimento típico entre 10 e 30 quadros.

I P B B B P B B B P B B B I Grupo de Quadros Próximo GOP

(65)

Tipos de Quadros:

• Quadro I – Intraquadro - é um quadro cuja codificação é realizada

utilizando apenas as informações contidas no próprio quadro. Este tipo de quadro é codificado utilizando apenas compressão espacial e não

compressão temporal.

• Quadro P – Predito - é um quadro que contém principalmente os vetores de movimento e as diferenças entre o último quadro I ou P para o quadro atual.

• Quadro B - Bidirecional - é um quadro construído principalmente a

partir da interpolação entre quadros P ou I anterior e o quadro P ou I

posterior.

(66)

Referências:

• Os quadros I e P são chamados quadros ancoras, pois podem servir de

referência para outros quadros a serem codificados utilizando compensação de movimento.

Os quadros B não são utilizados como referência para a compensação de movimento e portanto não são quadros ancoras.

MPEG - Tipos de Quadros

Próximo GOP

P

(67)

MPEG - Tipos de Quadros

Quadros de entrada do codificador

O GOP define o tipo de codificação principal a ser empregada em cada quadro do vídeo.

A formação do GOP é configurável e definida no codificador. GOP

(68)

Princípio da codificação dos quadros I, P e B

Vamos ilustrar o princípio de codificação dos quadros I, P e B usando a sequência de quadros dadas ao lado. As figuras mostram a sequência de quadros 1 2 e 3 a serem codificadas e transmitidas da emissora para um dado receptor (Set Top Box) ou decodificador.

O Quadro 1 será codificado utilizando codificação por transformada DCT. Os quadros 2 e 3 serão codificados utilizando principalmente a técnica de estimação e compensação de movimento.

1 (I)

3 (P) 2 (B)

(69)

No receptor, o processo de decodificação do...

Quadro I – é Imediata;

Quadro P – Requer o quadro I ou quadro P anterior;

Quadro B – Requer o quadro I ou P anterior + quadro I ou quadro P

posterior;

Um quadro B somente poderá ser decodificado se o receptor possuir

previamente disponível as informações dos dois quadros utilizados como referências em sua codificação.

Para possibilitar a decodificação eficiente dos quadros B no receptor, os quadros ancoras (I e P) são transmitidos de forma reordenada, sendo transmitidos de forma antecipada aos quadros B à eles referenciados.

Esta reordenação de quadros exige uso de buffer no codificador e insere

delay no processo de codificação, mas facilita e simplifica o processo de

decodificação a ser realziado no receptor.

• GOP regular: são grupos de quadros que apresentam um número fixo de quadros P e B. Este tipo de grupo de quadros podem ser representados por dois

parâmetros: M que representa a distância entre dois quadros I sucessivos e N que representa a distância entre dois quadros de referência sucessivos.

• GOP irregular: não apresenta uma estrutura de repetição com distância fixa entre os quadros fixos. Embora seja prevista, este tipo de organização dos quadros não é muito utilizada.

(70)

I

B

P

B

I

P

B

P

B

P

B

I

Grupo de Quadros para exibição

P

Grupo de Quadros para transmissão

B

P

I

(71)

Vetores de movimento

I

B

(72)

Exercícios - MPEG

1.1 – Descreva a hierarquia empregada no MPEG-1 indo do bloco ao GOP;

1.2 - Descreva os tipos de quadro que compõe o GOP e os tipos de codificações empregados em cada um;

1.3 – Relacione a taxa de bits necessárias para transmissão de cada tipo de quadro; 1.4 – Mostre a ordem de apresentação e ordem de transmissão dos quadros

codificados para o GOP com formação: I B B B B P B B B B P

(73)

Agradeço pela sua atenção!

Agradecimentos:

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Marcelo Carneiro de Paiva