• Nenhum resultado encontrado

TL011 - Televisão Digital

N/A
N/A
Protected

Academic year: 2021

Share "TL011 - Televisão Digital"

Copied!
73
0
0

Texto

(1)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

TL011 - Televisão Digital

Capítulo I – Codificação de fonte

Pós-Graduação em Engenharia de Redes e Sistemas de Telecomunicações

2014

(2)

Codificador de fonte Codificador de canal Modulador Fonte Decodificador de canal Demodulador Decodificador de fonte Destino Canal Ruído Sistema de comunicação digital genérico

Transmissão

(3)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

(4)

Vídeo

O vídeo é formado por uma sequência de quadros

(“fotos/imagens” estáticas) de uma cena, que são tomados com uma certa frequência (ex. 30 quadros/s).

(5)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Relação de Aspecto

Define a proporção entre largura e altura da tela/video. 4:3

Largura= 1.33 x Altura

16:9 (widescreen) Largura = 1.78 x Altura

(6)

Resoluções de vídeo em TV Digital (Colunas x Linhas)

HDTV - 1920 x 1080 (16:9)

(High Definition Television)

2.074 Megapixels

SDTV - 640 x 480 (4:3)

(Standard Definition Television)

0.307 Megapixels

EDTV - 1280 x 720 (16:9)

(Enhanced Definition Television)

0.922 Megapixels

LDTV - 320 x 240 (4:3) (Low Definition Television)

(7)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

UHDTV (Ultra High Definition Television)

4K - 8 megapixels (3840 x 2160) 8K - 32 megapixels (7680 x 4320)

(8)

Conversão de sinais de vídeo

analógico para Digital

(9)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Os sensores das câmeras convertem as informações capturadas da cena em sinais correspondentes as cores primárias RGB ( Red Green Blue).

O monitor da TV exibe a informação RGB de cada elemento – pixel - que compõe a imagem.

Monitor

(10)

Vídeo Analógico para Digital

Os principal formato de vídeo componente utilizado nos sistemas de transmissão digitais não é o RBG, mas sim um sinal chamado de YCbCr.

Sendo que:

Y = Luminância ou brilho (imagem em preto e branco); Cb e Cr = Crominância ou sinais de diferença de cor;

O olho humano é mais sensível às variações de informação de brilho do que às variações de cor.

O sinal de vídeo componente permite explorar as características do sistema visual humano para otimizar a transmissão do sinal de vídeo – isto não é possibilitado com sinal RGB. Por exemplo, pode-se sub-amostrar as informações de crominância.

(11)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Vídeo Analógico para Digital

As informações de vídeo digital são transmitidas através de um sinal de vídeo componente que é o YCbCr.

A relação matemática para conversão do sinal RGB digitalizado para o sinal YCbCr, definida pela recomendação BT 601 para sinais SD

(Standart Definition), está mostrada abaixo:

Y = 0,257R’ + 0,504G’ + 0,098B’ + 16

Cb = −0,148R’ − 0,291G’ + 0,439B’ + 128 Cr = 0,439R’ − 0,368G’ − 0,071B’ + 128

Neste caso, cada um dos sinais RGB variam de 0 até 255 e correspondendo à uma palavra de 8 bits.

(12)

Geração do sinal YCbCr

Matriz Linear* (RGB p/ YPbPr)

Filtro Amostrador Quantizador Codificador PCM R’G’B’ (analógico)

YPbPr (analógico)**

YCbCr (Digital)

* Converte RGB para YPbPr ** Versão analógica do YCbCr

Filtro Filtro Amostrador Amostrador Quantizador Codificador PCM Quantizador Codificador PCM

(13)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Formatos de amostragem dos sinais de vídeo

• O formato de amostragem define como as componentes Y, Cb e Cr serão amostradas para compor a informação de cada pixel da imagem;

• Emprega-se normalmente a sub-amostragem (down sample) das informações de crominância para diminuir a taxa de bits necessária para a transmissão das informações de vídeo;

• O formato de amostragem é representado pela notação A:B:C Ex.: 4:4:4, 4:2:2, etc.

(14)

Formato de amostragem 4:4:4

Tem-se amostras das componentes Y, Cb e Cr em todos os pixels.

Pixel

Amostra Luminância (Y)

Amostra Crominância (Cr,Cb)

Formato 4:4:4

(15)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Formatos de Amostragem

Formato de amostragem 4:2:2

Tem-se amostras de Luminância (Y) em todos os pixels;

As amostras de crominância (Cb e Cr) estão presentes em pixels alternados (pixel sim, pixel não);

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb)

(16)

Formato de amostragem 4:1:1

Tem-se amostras de Luminância (Y) em todos os pixels;

A cada 4 pixel toma-se amostras das crominâncias em apenas 1.

Pixel

Amostra Luminância (Y)

Amostra Crominância (Cr,Cb)

Formato 4:1:1

(17)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Formato de amostragem 4:2:0

Tem-se amostras de Luminância (Y) em todos os pixels;

Na primeira linha: Tem-se amostras de crominância em pixels intercalados;

Na segunda linha não há amostra de crominâncias.

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb)

Formato 4:2:0

(18)

Número de bits por pixel

Considerando que nominalmente cada sinal de vídeo componente YCbCr é formada por 8 bits, para o formato de amostragem 4:2:0 tem-se:

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb) Formato 4:2:0

Formatos de Amostragem

24 bits (YCbCr) 8 bits (Y)

(19)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Analógico para Digital

A tabela abaixo apresenta o número de pixels para as duas taxas de amostragem da Recomendação ITU-R BT601-5, de acordo com os formatos de amostragens 4:2:2 e 4:4:4, para padrões com 525 linhas e 30 quadros por segundo (NTSC e PAL-M), nas relações de aspecto 4:3 e 16:9.

(20)

Taxa de transmissão - YCbCr

A taxa de transmissão do sinal de vídeo componente digital para

atender um sistema de TV convencional pode ser calculada através da expressão:

onde: Rb é a taxa de bits em bps,

Rq é a taxa de apresentação de quadros por segundo,

nb é o número de bits por amostra,

l é o número de linhas ativas,

SY é o número de amostras do sinal Y (pixels ativos por linha),

SCr é o número de amostras do sinal Cr (pixels ativos por linha),

SCb é o número de amostras do sinal Cb(pixels ativos por linha).

)

(

Y Cr Cb b q b

R

n

l

S

S

S

R

(21)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Exercício

Exercícios YPbPr

1 - Determine a taxa necessária para se transmitir as informações visíveis

de vídeo componente digital (YCbCr) em um padrão de TV com 525 linhas e 30 quadros por segundo, que faz uso da taxa de amostragens de 13,5 MHz nos formatos de amostragem 4:4:4 e 4:2:2 com 8 bits por

amostra.

(

)

Cb Cr Y b q b

R

n

l

S

S

S

R

(22)

Exercício

Exercício 2:

Baseado nos cálculos obtidos no exercício 1, responda:

2.1 - O que se pode concluir com relação à escolha do formato de amostragem?

2.2 - O que se pode concluir com relação à taxa útil necessária para a transmissão do sinal YCbCr?

(23)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

(24)

Compressão de Vídeo

O processo de compressão de vídeo tem por objetivo diminuir a taxa de bits necessárias para a transmissão do sinal de vídeo.

O processo de compressão explora as redundâncias e informações

“menos relevantes” – ex. não perceptíveis visualmente – para alcançar a diminuição da taxa de bits.

A compressão de vídeo, portanto, reduz as redundâncias e introduz distorções controladas nas

informações que formam o vídeo

.

Compactação Compressão Entropia Redundância Entropia Redundância Entropia Redundância

(25)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

• Exemplo de compactação: amostragem.

• Teorema de Nyquist: “Todo sinal analógico limitado em banda pode ser perfeitamente representada por suas amostras, desde que estas sejam tomadas a taxa de amostragem dada por

onde, fs é a frequência de amostragem e fmax é a máxima frequência do sinal analógico.”

máx

S

f

f

2

(26)

Exemplo de compressão: sub-amostragem dos sinais de crominância.

Pixel

Amostra Luminância (Y) Amostra Crominância (Cr,Cb)

Formato 4:2:2

(27)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Tipos de redundâncias:

• Espacial: informações similares dentro de um mesmo quadro; • Temporal: informações similares entre quadros sucessivos;

“Redundância Temporal” Redundância

Espacial

(28)

A seguir as duas principais técnicas de compressão utilizadas em processamento de vídeo:

• Codificação por transformada DCT Utilizada na compressão espacial.

• Estimação de movimento e compensação de movimento Utilizada na compressão Temporal.

(29)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Codificação por transformada DCT

(30)

Os principais padrões de compressão – JPEG, MPEG – utilizam a transformada

discreta de cossenos ou DCT (Discrete Cosine Transform), pois esta apresenta

uma solução de compromisso entre complexidade e desempenho.

O emprego da codificação por transformada DCT em compressão de imagens/vídeo normalmente envolve os seguintes passos:

Cálculo

da DCT Quantização Ordenação dos coeficientes

Coeficientes da DCT F(u,v)

Codificação por transformada - DCT

Codificação RLC

(31)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Primeiro passo – Cálculo da DCT

A DCT expressa uma sequencia finita de dados em função de uma soma de funções cosenoidais com frequências diferentes entre si. Veja a fórmula de cálculo da DCT e IDCT 2D (bidimensional):

DCT

IDCT

(32)

A DCT pode ser definida para qualquer arranjo retangular de pixels, mas em compressão de imagem, o bloco básico é geralmente um arranjo com 8 × 8 pixels (64 pixels).

A aplicação da DCT sobre um bloco de pixels de tamanho maior

aumenta consideravelmente a complexidade de processamento e não proporciona ganho de compressão significativo.

Cálculo da DCT

172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100

Valores de intensidade do pixel (Y) 8 × 8 pixels

x y

(33)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Para um arranjo com 8 × 8 pixels a DCT, para compressão JPEG, é definida como

onde,

f (x, y) é o valor da amostra do pixel situado nas coordenadas (x, y) do

arranjo 8 × 8 de amostras;

F(u, v) são os coeficientes da transformada dos pixels nas coordenadas

(u, v) do arranjo 8 × 8 de coeficientes.

Os valores de Cu e Cv são definidos como

(34)

A DCT converte valores de amostras espaciais (ex. valores de

luminância (Y) dos pixels de um determinado espaço da imagem) em coeficientes de frequências espaciais.

Cálculo da DCT

f(x,y) F(u,v) DCT x y u v IDCT Domínio espacial

(35)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Cálculo da DCT

f(x,y)

f(x,y) = valor de amostra – ex. luminância (Y) - de cada pixel. F(u,v) DCT x y u v IDCT 172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100 1256,4 228,6 -50,0 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 F(u,v) = Coeficientes da DCT DCT

(36)

Note que:

O cálculo de F(0, 0) resultará em um valor DC (sem componentes cosenoidais ou seja, sem componentes AC).

O cálculo de um valor de coeficiente F(u, v) envolve a soma/multiplicação dos 64 valores de f(x,y). Portanto, cada valor de F(u, v) depende de todos os pixels do bloco.

Os valores dos elementos da fórmula que não o f(x,y) – amostras da imagem -

dependem apenas de x, u, y e v, que são valores pré-determinados (0 a 7 para blocos de 8x8 pixels):

Estes valores são chamados de FUNÇÕES BASE da DCT.

(37)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Veja as funções base da DCT no domínio espacial (domínio dos pixels):

As funções base representam um conjunto de 64 pixels

(38)

A DCT descreve o bloco da imagem em função de uma soma ponderada ou combinação linear das funções base.

Bloco da imagem Componente DC Componentes AC

Através da soma ponderada das funções base,

pode-se representar qualquer padrão de bloco de imagem.

Cálculo da DCT

(39)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Cálculo da DCT – Exemplo Wikipedia

Bloco de imagem

DCT

Matriz de coeficientes da DCT F(u,v)

(40)

Cálculo da DCT - Exemplo Wikipedia

Funções base e os coeficientes

Legenda da animação:

Esquerda: Imagem resultante da soma cumulativa

Meio: Resultado da multiplicação da função base pelo Coeficiente

Direita:

Função base e o coeficiente da DCT

http://en.wikipedia.org/wiki/Discrete_cosine_transform A imagem a partir das

(41)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Componentes de frequência espacial

• Tipicamente o resultado da DCT concentra coeficientes de valores maior nas componentes de baixa frequência espacial.

• O sistema visual humano é

menos sensível às componentes de alta frequência espacial.

Cálculo da DCT

F(u,v)

Aumento da frequência espacial

(42)

O emprego da DCT resulta em quase nenhuma compactação, pois a matriz resultante terá o mesmo tamanho da matriz original.

O processo de quantização é que permite a compressão de dados, pois transforma em zero muitos elementos da matriz de coeficientes DCT. A matriz de coeficientes DCT é dividida por outra matriz (chamada de matriz de quantização). O resultado da divisão passa por um

ARREDONDAMENTO, e os elementos “menos importantes”

(componentes de alta frequência espacial) passam a assumir o valor Zero.

O processo de arredondamento da divisão introduz perda de informação, o que insere distorções irreversíveis, porém pouco perceptíveis ao olho humano.

(43)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Quantização - Exemplo

1256,4 228,6 -50 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 F(u,v) Q(u,v) 78,525 20,7818182 -5 1,10625 -0,65 0,05 -0,0529412 0,095082 12,9 -6,66666667 -6,6571429 1,4210526 -0,25 0,212069 0,0333333 0,0127273 0,6928571 -7,1 3,58125 1,6375 -0,725 0,0596491 0,0913043 0,0267857 1,1642857 -0,74705882 1,6090909 -1,6413793 -0,1352941 0,2045977 -0,02625 0,0709677 0,1166667 -0,82727273 0,1081081 -0,2571429 0,4058824 -0,0522936 -0,1252427 -0,0181818 -0,125 -0,11142857 0,0109091 -0,1453125 0,0308642 -0,1711538 0,1088496 0,0663043 -0,0244898 -0,084375 0,024359 -0,0827586 0,0601942 -0,0123967 0,0516667 -0,1168317 0,0986111 -0,03152174 0,04 0,0091837 -0,0125 0 0,0194175 0,0292929 = 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Div / C(u,v) Coeficientes a serem transmitidos Exemplo

(44)

Organização dos coeficientes

Passo 3 – Organização dos coeficientes

A leitura (scan) dos coeficientes da DCT quantizados é realizada de forma a

concatenar o maior número de zeros consecutivos.

A leitura se inicia pelos componentes com probabilidade maior de assumir valores diferentes de zero.

Existem padrões de leitura padronizados como o “zig-zag” (veja ao lado).

(45)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Organização dos coeficientes

Exemplo de matrizes de coeficientes da DCT quantizados:

Coeficientes organizados: 79, 13, 21, -5, ... 0, 0, 0, 0, 0, 0 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C(u,v) C(u,v) Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0

(46)

Codificação RLC

Passo 4 – Codificação RLC – Run Lenght Coding A codificação RLC permite reduzir a quantidade de dados

necessários para a transmissão de uma longa sequência de símbolos idênticos.

Princípio da codificação RLC:

Símbolos: A B C D D D D D D D D D D E F... Codificação RLC: A B #10D E F ...

(47)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Codificação RLC

Passo 4 – Codificação RLC – Run Lenght Coding

A utilização de codificação RLC para a codificar os coeficientes da DCT quantizados permite reduzir a taxa de bits necessária para a transmissão de tais coeficientes.

A codificação RLC é potencializada graças aos processo prévios de quantização e de organização de leitura dos coeficientes quantizados.

Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0

(48)

JPEG

A codificação por transformada DCT é a base do padrão de compressão JPEG

Tipicamente a compressão JPEG sem perda visível gira em torno de 10:1, podendo chegar até 20:1. Exemplo: Imagem de 2 Mbytes tem seu

tamanho reduzido para 100 Kbytes.

O limiar de erro visível varia consideravelmente por imagem.

Compressão de 30:1 a 50:1 é possível com imperfeições moderadas. A taxa de compressão é obtida em função da matriz de quantização Q Utilizada no processo de compressão por transformada DCT.

(49)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital Compressão 2,6:1 Tamanho do arquivo 83kB Compressão 15:1 Tamanho do arquivo 15kB Compressão 46:1 Tamanho do arquivo 5kB

(50)

Cálculo

da DCT Quantização Ordenação dos coeficientes Coeficientes da DCT F(u,v)

Codificação por transformada - DCT

Codificação RLC

Exercício - Codificação por transformada DCT 1 ) Responda:

1.1 - Descreve as etapas normalmente envolvidas no processo de codificação por transformada DCT.

1.2 – A transformada DCT em si insere perdas na informação? E a codificação por transformada? Por quê?

1.3 - O que representa os coeficientes da transformada DCT? 1.4 - Comente sobre as componentes de frequência espacial

(51)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Estimação de Movimento e

Compensação de movimento

(52)

Uma maneira de explorar esta similaridade entre os quadros no sistema de codificação de fonte, seria transmitir um dado quadro e para o

quadro seguinte transmitir somente as informações que se alteram em relação ao quadro anterior.

Este é o principio básico explorado pela codificação temporal.

(53)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

- Transmite-se todas as informações do primeiro quadro - quadro de referência (I) - utilizando codificação por DCT, por exemplo. Ou seja realiza-se uma compressão espacial ou INTRAQUADRO. Compare blocos do quadro atual com blocos do quadro de

referência (I): grande parte dos blocos possuem informações idênticas ou com pequenas alterações e/ou movimentos.

Quadro de referência (I) Quadro Atual

(54)

- Transmite-se instruções ao decodificador relacionadas a como reconstruir o quadro atual em função do quadro de referência. - Estas instruções são enviadas em forma de Vetores de

Movimento e também de resíduos (diferenças ou erros).

- A técnica de levantar os valores dos vetores de movimento chama-se: Estimação de movimento.

- A técnica que utiliza os vetores de movimento para reduzir os efeitos do movimento chama-se: Compensação de Movimento. - Os blocos idênticos – ex. fundo – possuirão vetor de movimento e

os resíduos com valor zero.

(55)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Exemplo de estimação do vetor de movimento:

Comparando os blocos do quadro atual com o quadro de referência pode-se encontrar o bloco com maior correlação – bloco de melhor casamento - e a partir daí obter o vetor de movimento associado ao bloco. O vetor de movimento indicará onde encontrar no quadro de referência o bloco de maior correlação com o bloco a ser codificado.

Quadro de

Referência (I) Quadro Atual

Vetor de movimento Bloco a ser

codificado Codificação Temporal

(56)

O cálculo do melhor casamento pode indicar que há diferenças entre o bloco do quadro atual e o bloco de melhor casamento.

Deformações de objetos, rotações, diferenças de iluminação, etc. podem causar diferenças “pequenas” entre os blocos.

A matriz de diferenças entre os blocos, chamada de RESÍDUO, é codificada e transmitida junto com o vetor de movimento para

permitir reconstruir o bloco atual em função do bloco de referência. Um bom codificador compara a quantidade de bits necessária para a transmissão dos resíduos e para a transmissão do bloco inteiro (sem usar compensação de movimento) para verificar qual a melhor opção em termos de redução de taxa de transmissão.

(57)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Quadro de referência (I) Quadro Atual

Vetores de movimento

(58)

Busca do bloco de melhor casamento

Definição do vetor de movimento Exercícios Codificação Temporal

1)Responda:

1.1- Descreve o processo de compensação de movimento. 1.2 – Que tipo de redundância é explorada por esta técnica?

1.3 – Como é alcançada a redução de taxa de transmissão fazendo uso desta técnica?

Codificação Temporal - Compensação de Movimento

vetor de movimento

(59)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Compressão de vídeo

Padrão MPEG

(60)

MPEG - Introdução

MPEG (Moving Pictures Experts Groups)

Comitê formado em 1988 pela ISO (International Organization for Standardization) com objetivo de desenvolver padrões para

compressão/codificação de vídeo e áudio.

Foram definidos três padrões a serem desenvolvidos cujas características alvo inicialmente propostas eram:

- MPEG-1 - padrão para compressão de vídeo/áudio até 1.5 Mbps; - MPEG-2 - padrão para compressão de vídeo/áudio até 10 Mbps; - MPEG-3 - padrão para compressão de vídeo/áudio até 60 Mbps; O desenvolvimento do MPEG-3 fora cancelado, devido ao

(61)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

MPEG - Introdução

Resumo das principais características dos padrões MPEG

MPEG-1 Padronizado em 1991 - ISO/IEC 11172

- Taxas de vídeo/áudio até 1.5 Mbps;

- Resolução máxima de 352 x 240 (CIF); - Suporte somente a vídeo não entrelaçado; - Utilizado em CD-Rom;

MPEG-2 - Padronizado em 1994 - ISO/IEC 13818

- Taxas de vídeo/áudio superior a 80 Mbps; - Suporte à resolução HD;

- Suporte a vídeo entrelaçado e não entrelaçado;

(62)

MPEG - Introdução

Resumo das principais características dos padrões MPEG MPEG-4/H.264

H.264 é um padrão para compressão de vídeo, baseado no MPEG-4 Part 10 ou AVC (Advanced Video Coding).

O padrão foi desenvolvido pela ITU-T - Video Coding Experts Group (VCEG) - em conjunto com a ISO/IEC – MPEG - através de uma parceria conhecida por Joint

Video Team (JVT). A versão oficial do padrão, ISO/IEC 14496-10, foi lançado em 2003.

A principal meta proposta para o desenvolvimento do padrão H.264/MPEG-4 AVC foi a de melhorar a eficiência de codificação em pelo menos duas vezes em relação ao MPEG-2.

O Padrão MPEG-4/H.264 é utilizado nos padrões de TV Digital ISDB-TB e DVB-T2.

(63)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

• Bloco: é uma matriz de 8x8 pixels (ex. luminância)

• Macrobloco: é uma matriz composta de 16x16 pixels ou 4 blocos.

• Fatia (Slice): é um conjunto de macroblocos sequenciais. Os slices são codificados de modo independente entre si, de modo que se o canal corromper dados de um slice, a decodificação pode recomeçar no próximo slice recebido.

• Quadro (Frame): é uma imagem propriamente dita.

Hierarquia e Terminologia do MPEG

Quadro Slice

Macrobloco

(64)

Grupo de quadros (GOP - Group Of Pictures): é um conjunto de quadros

formado tipicamente por 3 diferentes tipos de quadros: I, B e P (quadros estes gerados a partir de diferentes tipos de codificações);

Tais quadros são organizados em uma estrutura normalmente repetitiva periódica que tem comprimento típico entre 10 e 30 quadros.

I P B B B P B B B P B B B I Grupo de Quadros Próximo GOP

(65)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Tipos de Quadros:

• Quadro I – Intraquadro - é um quadro cuja codificação é realizada

utilizando apenas as informações contidas no próprio quadro. Este tipo de quadro é codificado utilizando apenas compressão espacial e não

compressão temporal.

• Quadro P – Predito - é um quadro que contém principalmente os vetores de movimento e as diferenças entre o último quadro I ou P para o quadro atual.

• Quadro B - Bidirecional - é um quadro construído principalmente a

partir da interpolação entre quadros P ou I anterior e o quadro P ou I

posterior.

(66)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Referências:

• Os quadros I e P são chamados quadros ancoras, pois podem servir de

referência para outros quadros a serem codificados utilizando compensação de movimento.

Os quadros B não são utilizados como referência para a compensação de movimento e portanto não são quadros ancoras.

MPEG - Tipos de Quadros

Próximo GOP

P

(67)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

MPEG - Tipos de Quadros

Quadros de entrada do codificador

O GOP define o tipo de codificação principal a ser empregada em cada quadro do vídeo.

A formação do GOP é configurável e definida no codificador. GOP

(68)

Princípio da codificação dos quadros I, P e B

Vamos ilustrar o princípio de codificação dos quadros I, P e B usando a sequência de quadros dadas ao lado. As figuras mostram a sequência de quadros 1 2 e 3 a serem codificadas e transmitidas da emissora para um dado receptor (Set Top Box) ou decodificador.

O Quadro 1 será codificado utilizando codificação por transformada DCT. Os quadros 2 e 3 serão codificados utilizando principalmente a técnica de estimação e compensação de movimento.

1 (I)

3 (P) 2 (B)

(69)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

No receptor, o processo de decodificação do...

Quadro I – é Imediata;

Quadro P – Requer o quadro I ou quadro P anterior;

Quadro B – Requer o quadro I ou P anterior + quadro I ou quadro P

posterior;

Um quadro B somente poderá ser decodificado se o receptor possuir

previamente disponível as informações dos dois quadros utilizados como referências em sua codificação.

Para possibilitar a decodificação eficiente dos quadros B no receptor, os quadros ancoras (I e P) são transmitidos de forma reordenada, sendo transmitidos de forma antecipada aos quadros B à eles referenciados.

Esta reordenação de quadros exige uso de buffer no codificador e insere

delay no processo de codificação, mas facilita e simplifica o processo de

decodificação a ser realziado no receptor.

• GOP regular: são grupos de quadros que apresentam um número fixo de quadros P e B. Este tipo de grupo de quadros podem ser representados por dois

parâmetros: M que representa a distância entre dois quadros I sucessivos e N que representa a distância entre dois quadros de referência sucessivos.

• GOP irregular: não apresenta uma estrutura de repetição com distância fixa entre os quadros fixos. Embora seja prevista, este tipo de organização dos quadros não é muito utilizada.

(70)

I

B

B

B

P

B

B

B

I

P

B

B

B

P

B

B

B

P

B

B

B

I

Grupo de Quadros para exibição

P

Grupo de Quadros para transmissão

B

B

B

P

I

(71)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Vetores de movimento

I

B

(72)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Exercícios - MPEG

1.1 – Descreva a hierarquia empregada no MPEG-1 indo do bloco ao GOP;

1.2 - Descreva os tipos de quadro que compõe o GOP e os tipos de codificações empregados em cada um;

1.3 – Relacione a taxa de bits necessárias para transmissão de cada tipo de quadro; 1.4 – Mostre a ordem de apresentação e ordem de transmissão dos quadros

codificados para o GOP com formação: I B B B B P B B B B P

(73)

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital

Agradeço pela sua atenção!

Agradecimentos:

Prof. MSc. Carlos Augusto Rocha Prof. MSc. Marcelo Carneiro de Paiva

Referências

Documentos relacionados

Esta realidade exige uma abordagem baseada mais numa engenharia de segu- rança do que na regulamentação prescritiva existente para estes CUA [7], pelo que as medidas de segurança

O mar profundo é uma vasta região que recobre aproximadamente 70% da superfície da terra, sendo considerado ainda uma vastidão a ser explorada e estudada pelo homem. A coleção

Quando os pais investem tempo em seus relacionamentos com seus filhos, eles terão a oportunidade de ver o propósito de Deus se cumprindo na vida deles. Eles

debêntures realizadas no período, bem como aquisições e vendas de debêntures efetuadas pela Emissora: (Artigo 12, alínea e, inciso XVII da Instrução CVM 28/83). •

Segundo sugere Huston (2010) o constructo deve ser medido em quatro dimensões, quais sejam: i) o valor do dinheiro no tempo, poder de compra, as demonstrações

Nesta seção será apresentada uma revisão bibliografica das duas ferramentas que serão utilizadas para avaliar o projeto de investimentos do trem de alta velocidade, sendo

depressões são geralmente de pouca profundidade, e durante o período de cheias retêm água (Figura 4). Em poucos anos estas caixas de empréstimo são colonizadas por

Os indicadores para as metas acima definidas são: a “Qualidade do ar” nas áreas de intervenção durante toda a implantação do empreendimento para a meta de baixa