Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
TL011 - Televisão Digital
Capítulo I – Codificação de fonte
Pós-Graduação em Engenharia de Redes e Sistemas de Telecomunicações
2014
Codificador de fonte Codificador de canal Modulador Fonte Decodificador de canal Demodulador Decodificador de fonte Destino Canal Ruído Sistema de comunicação digital genérico
Transmissão
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Vídeo
O vídeo é formado por uma sequência de quadros
(“fotos/imagens” estáticas) de uma cena, que são tomados com uma certa frequência (ex. 30 quadros/s).
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Relação de Aspecto
Define a proporção entre largura e altura da tela/video. 4:3
Largura= 1.33 x Altura
16:9 (widescreen) Largura = 1.78 x Altura
Resoluções de vídeo em TV Digital (Colunas x Linhas)
HDTV - 1920 x 1080 (16:9)
(High Definition Television)
2.074 Megapixels
SDTV - 640 x 480 (4:3)
(Standard Definition Television)
0.307 Megapixels
EDTV - 1280 x 720 (16:9)
(Enhanced Definition Television)
0.922 Megapixels
LDTV - 320 x 240 (4:3) (Low Definition Television)
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
UHDTV (Ultra High Definition Television)
4K - 8 megapixels (3840 x 2160) 8K - 32 megapixels (7680 x 4320)
Conversão de sinais de vídeo
analógico para Digital
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Os sensores das câmeras convertem as informações capturadas da cena em sinais correspondentes as cores primárias RGB ( Red Green Blue).
O monitor da TV exibe a informação RGB de cada elemento – pixel - que compõe a imagem.
Monitor
Vídeo Analógico para Digital
Os principal formato de vídeo componente utilizado nos sistemas de transmissão digitais não é o RBG, mas sim um sinal chamado de YCbCr.
Sendo que:
Y = Luminância ou brilho (imagem em preto e branco); Cb e Cr = Crominância ou sinais de diferença de cor;
O olho humano é mais sensível às variações de informação de brilho do que às variações de cor.
O sinal de vídeo componente permite explorar as características do sistema visual humano para otimizar a transmissão do sinal de vídeo – isto não é possibilitado com sinal RGB. Por exemplo, pode-se sub-amostrar as informações de crominância.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Vídeo Analógico para Digital
As informações de vídeo digital são transmitidas através de um sinal de vídeo componente que é o YCbCr.
A relação matemática para conversão do sinal RGB digitalizado para o sinal YCbCr, definida pela recomendação BT 601 para sinais SD
(Standart Definition), está mostrada abaixo:
Y = 0,257R’ + 0,504G’ + 0,098B’ + 16
Cb = −0,148R’ − 0,291G’ + 0,439B’ + 128 Cr = 0,439R’ − 0,368G’ − 0,071B’ + 128
Neste caso, cada um dos sinais RGB variam de 0 até 255 e correspondendo à uma palavra de 8 bits.
Geração do sinal YCbCr
Matriz Linear* (RGB p/ YPbPr)
Filtro Amostrador Quantizador Codificador PCM R’G’B’ (analógico)
YPbPr (analógico)**
YCbCr (Digital)
* Converte RGB para YPbPr ** Versão analógica do YCbCr
Filtro Filtro Amostrador Amostrador Quantizador Codificador PCM Quantizador Codificador PCM
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Formatos de amostragem dos sinais de vídeo
• O formato de amostragem define como as componentes Y, Cb e Cr serão amostradas para compor a informação de cada pixel da imagem;
• Emprega-se normalmente a sub-amostragem (down sample) das informações de crominância para diminuir a taxa de bits necessária para a transmissão das informações de vídeo;
• O formato de amostragem é representado pela notação A:B:C Ex.: 4:4:4, 4:2:2, etc.
Formato de amostragem 4:4:4
Tem-se amostras das componentes Y, Cb e Cr em todos os pixels.
Pixel
Amostra Luminância (Y)
Amostra Crominância (Cr,Cb)
Formato 4:4:4
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Formatos de Amostragem
Formato de amostragem 4:2:2
Tem-se amostras de Luminância (Y) em todos os pixels;
As amostras de crominância (Cb e Cr) estão presentes em pixels alternados (pixel sim, pixel não);
Pixel
Amostra Luminância (Y) Amostra Crominância (Cr,Cb)
Formato de amostragem 4:1:1
Tem-se amostras de Luminância (Y) em todos os pixels;
A cada 4 pixel toma-se amostras das crominâncias em apenas 1.
Pixel
Amostra Luminância (Y)
Amostra Crominância (Cr,Cb)
Formato 4:1:1
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Formato de amostragem 4:2:0
Tem-se amostras de Luminância (Y) em todos os pixels;
Na primeira linha: Tem-se amostras de crominância em pixels intercalados;
Na segunda linha não há amostra de crominâncias.
Pixel
Amostra Luminância (Y) Amostra Crominância (Cr,Cb)
Formato 4:2:0
Número de bits por pixel
Considerando que nominalmente cada sinal de vídeo componente YCbCr é formada por 8 bits, para o formato de amostragem 4:2:0 tem-se:
Pixel
Amostra Luminância (Y) Amostra Crominância (Cr,Cb) Formato 4:2:0
Formatos de Amostragem
24 bits (YCbCr) 8 bits (Y)Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Analógico para Digital
A tabela abaixo apresenta o número de pixels para as duas taxas de amostragem da Recomendação ITU-R BT601-5, de acordo com os formatos de amostragens 4:2:2 e 4:4:4, para padrões com 525 linhas e 30 quadros por segundo (NTSC e PAL-M), nas relações de aspecto 4:3 e 16:9.
Taxa de transmissão - YCbCr
A taxa de transmissão do sinal de vídeo componente digital para
atender um sistema de TV convencional pode ser calculada através da expressão:
onde: Rb é a taxa de bits em bps,
Rq é a taxa de apresentação de quadros por segundo,
nb é o número de bits por amostra,
l é o número de linhas ativas,
SY é o número de amostras do sinal Y (pixels ativos por linha),
SCr é o número de amostras do sinal Cr (pixels ativos por linha),
SCb é o número de amostras do sinal Cb(pixels ativos por linha).
)
(
Y Cr Cb b q bR
n
l
S
S
S
R
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Exercício
Exercícios YPbPr
1 - Determine a taxa necessária para se transmitir as informações visíveis
de vídeo componente digital (YCbCr) em um padrão de TV com 525 linhas e 30 quadros por segundo, que faz uso da taxa de amostragens de 13,5 MHz nos formatos de amostragem 4:4:4 e 4:2:2 com 8 bits por
amostra.
(
)
Cb Cr Y b q bR
n
l
S
S
S
R
Exercício
Exercício 2:
Baseado nos cálculos obtidos no exercício 1, responda:
2.1 - O que se pode concluir com relação à escolha do formato de amostragem?
2.2 - O que se pode concluir com relação à taxa útil necessária para a transmissão do sinal YCbCr?
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Compressão de Vídeo
O processo de compressão de vídeo tem por objetivo diminuir a taxa de bits necessárias para a transmissão do sinal de vídeo.
O processo de compressão explora as redundâncias e informações
“menos relevantes” – ex. não perceptíveis visualmente – para alcançar a diminuição da taxa de bits.
A compressão de vídeo, portanto, reduz as redundâncias e introduz distorções controladas nas
informações que formam o vídeo
.
Compactação Compressão Entropia Redundância Entropia Redundância Entropia Redundância
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
• Exemplo de compactação: amostragem.
• Teorema de Nyquist: “Todo sinal analógico limitado em banda pode ser perfeitamente representada por suas amostras, desde que estas sejam tomadas a taxa de amostragem dada por
onde, fs é a frequência de amostragem e fmax é a máxima frequência do sinal analógico.”
máx
S
f
f
2
Exemplo de compressão: sub-amostragem dos sinais de crominância.
Pixel
Amostra Luminância (Y) Amostra Crominância (Cr,Cb)
Formato 4:2:2
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Tipos de redundâncias:
• Espacial: informações similares dentro de um mesmo quadro; • Temporal: informações similares entre quadros sucessivos;
“Redundância Temporal” Redundância
Espacial
A seguir as duas principais técnicas de compressão utilizadas em processamento de vídeo:
• Codificação por transformada DCT Utilizada na compressão espacial.
• Estimação de movimento e compensação de movimento Utilizada na compressão Temporal.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Codificação por transformada DCT
Os principais padrões de compressão – JPEG, MPEG – utilizam a transformada
discreta de cossenos ou DCT (Discrete Cosine Transform), pois esta apresenta
uma solução de compromisso entre complexidade e desempenho.
O emprego da codificação por transformada DCT em compressão de imagens/vídeo normalmente envolve os seguintes passos:
Cálculo
da DCT Quantização Ordenação dos coeficientes
Coeficientes da DCT F(u,v)
Codificação por transformada - DCT
Codificação RLC
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Primeiro passo – Cálculo da DCT
A DCT expressa uma sequencia finita de dados em função de uma soma de funções cosenoidais com frequências diferentes entre si. Veja a fórmula de cálculo da DCT e IDCT 2D (bidimensional):
DCT
IDCT
A DCT pode ser definida para qualquer arranjo retangular de pixels, mas em compressão de imagem, o bloco básico é geralmente um arranjo com 8 × 8 pixels (64 pixels).
A aplicação da DCT sobre um bloco de pixels de tamanho maior
aumenta consideravelmente a complexidade de processamento e não proporciona ganho de compressão significativo.
Cálculo da DCT
172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100Valores de intensidade do pixel (Y) 8 × 8 pixels
x y
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Para um arranjo com 8 × 8 pixels a DCT, para compressão JPEG, é definida como
onde,
f (x, y) é o valor da amostra do pixel situado nas coordenadas (x, y) do
arranjo 8 × 8 de amostras;
F(u, v) são os coeficientes da transformada dos pixels nas coordenadas
(u, v) do arranjo 8 × 8 de coeficientes.
Os valores de Cu e Cv são definidos como
A DCT converte valores de amostras espaciais (ex. valores de
luminância (Y) dos pixels de um determinado espaço da imagem) em coeficientes de frequências espaciais.
Cálculo da DCT
f(x,y) F(u,v) DCT x y u v IDCT Domínio espacialProf. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Cálculo da DCT
f(x,y)
f(x,y) = valor de amostra – ex. luminância (Y) - de cada pixel. F(u,v) DCT x y u v IDCT 172 179 188 191 196 200 204 174 188 187 190 193 199 201 178 101 189 189 196 197 199 183 117 84 186 192 197 199 189 130 85 85 198 197 199 192 149 100 100 95 195 195 193 158 108 98 96 98 195 189 171 111 111 108 104 96 192 177 124 110 113 113 108 100 1256,4 228,6 -50,0 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 F(u,v) = Coeficientes da DCT DCT
Note que:
O cálculo de F(0, 0) resultará em um valor DC (sem componentes cosenoidais ou seja, sem componentes AC).
O cálculo de um valor de coeficiente F(u, v) envolve a soma/multiplicação dos 64 valores de f(x,y). Portanto, cada valor de F(u, v) depende de todos os pixels do bloco.
Os valores dos elementos da fórmula que não o f(x,y) – amostras da imagem -
dependem apenas de x, u, y e v, que são valores pré-determinados (0 a 7 para blocos de 8x8 pixels):
Estes valores são chamados de FUNÇÕES BASE da DCT.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Veja as funções base da DCT no domínio espacial (domínio dos pixels):
As funções base representam um conjunto de 64 pixels
A DCT descreve o bloco da imagem em função de uma soma ponderada ou combinação linear das funções base.
Bloco da imagem Componente DC Componentes AC
Através da soma ponderada das funções base,
pode-se representar qualquer padrão de bloco de imagem.
Cálculo da DCT
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Cálculo da DCT – Exemplo Wikipedia
Bloco de imagem
DCT
Matriz de coeficientes da DCT F(u,v)
Cálculo da DCT - Exemplo Wikipedia
Funções base e os coeficientes
Legenda da animação:
Esquerda: Imagem resultante da soma cumulativa
Meio: Resultado da multiplicação da função base pelo Coeficiente
Direita:
Função base e o coeficiente da DCT
http://en.wikipedia.org/wiki/Discrete_cosine_transform A imagem a partir das
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Componentes de frequência espacial
• Tipicamente o resultado da DCT concentra coeficientes de valores maior nas componentes de baixa frequência espacial.
• O sistema visual humano é
menos sensível às componentes de alta frequência espacial.
Cálculo da DCT
F(u,v)
Aumento da frequência espacial
O emprego da DCT resulta em quase nenhuma compactação, pois a matriz resultante terá o mesmo tamanho da matriz original.
O processo de quantização é que permite a compressão de dados, pois transforma em zero muitos elementos da matriz de coeficientes DCT. A matriz de coeficientes DCT é dividida por outra matriz (chamada de matriz de quantização). O resultado da divisão passa por um
ARREDONDAMENTO, e os elementos “menos importantes”
(componentes de alta frequência espacial) passam a assumir o valor Zero.
O processo de arredondamento da divisão introduz perda de informação, o que insere distorções irreversíveis, porém pouco perceptíveis ao olho humano.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Quantização - Exemplo
1256,4 228,6 -50 17,7 -15,6 2 -2,7 5,8 154,8 -80 -93,2 27 -6,5 12,3 2 0,7 9,7 -92,3 57,3 39,3 -29 3,4 6,3 1,5 16,3 -12,7 35,4 -47,6 -6,9 17,8 -2,1 4,4 2,1 -18,2 4 -14,4 27,6 -5,7 -12,9 -1,4 -3 -3,9 0,6 -9,3 2,5 -17,8 12,3 6,1 -1,2 -5,4 1,9 -7,2 6,2 -1,5 6,2 -11,8 7,1 -2,9 3,8 0,9 -1,4 0 2 2,9 16 11 10 16 24 40 51 61 12 12 14 19 26 58 60 55 14 13 16 24 40 57 69 56 14 17 22 29 51 87 80 62 18 22 37 56 68 109 103 77 24 35 55 64 81 104 113 92 49 64 78 87 103 121 120 101 72 92 95 98 112 100 103 99 F(u,v) Q(u,v) 78,525 20,7818182 -5 1,10625 -0,65 0,05 -0,0529412 0,095082 12,9 -6,66666667 -6,6571429 1,4210526 -0,25 0,212069 0,0333333 0,0127273 0,6928571 -7,1 3,58125 1,6375 -0,725 0,0596491 0,0913043 0,0267857 1,1642857 -0,74705882 1,6090909 -1,6413793 -0,1352941 0,2045977 -0,02625 0,0709677 0,1166667 -0,82727273 0,1081081 -0,2571429 0,4058824 -0,0522936 -0,1252427 -0,0181818 -0,125 -0,11142857 0,0109091 -0,1453125 0,0308642 -0,1711538 0,1088496 0,0663043 -0,0244898 -0,084375 0,024359 -0,0827586 0,0601942 -0,0123967 0,0516667 -0,1168317 0,0986111 -0,03152174 0,04 0,0091837 -0,0125 0 0,0194175 0,0292929 = 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 Div / C(u,v) Coeficientes a serem transmitidos ExemploOrganização dos coeficientes
Passo 3 – Organização dos coeficientes
A leitura (scan) dos coeficientes da DCT quantizados é realizada de forma a
concatenar o maior número de zeros consecutivos.
A leitura se inicia pelos componentes com probabilidade maior de assumir valores diferentes de zero.
Existem padrões de leitura padronizados como o “zig-zag” (veja ao lado).
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Organização dos coeficientes
Exemplo de matrizes de coeficientes da DCT quantizados:
Coeficientes organizados: 79, 13, 21, -5, ... 0, 0, 0, 0, 0, 0 79 21 -5 1 -1 0 0 0 13 -7 -7 1 0 0 0 0 1 -7 4 2 -1 0 0 0 1 -1 2 -2 0 0 0 0 0 -1 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 C(u,v) C(u,v) Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0
Codificação RLC
Passo 4 – Codificação RLC – Run Lenght Coding A codificação RLC permite reduzir a quantidade de dados
necessários para a transmissão de uma longa sequência de símbolos idênticos.
Princípio da codificação RLC:
Símbolos: A B C D D D D D D D D D D E F... Codificação RLC: A B #10D E F ...
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Codificação RLC
Passo 4 – Codificação RLC – Run Lenght Coding
A utilização de codificação RLC para a codificar os coeficientes da DCT quantizados permite reduzir a taxa de bits necessária para a transmissão de tais coeficientes.
A codificação RLC é potencializada graças aos processo prévios de quantização e de organização de leitura dos coeficientes quantizados.
Coeficientes organizados: 5, -21, 2, 0, ... 0, 0, 0, 0, 0, 0
JPEG
A codificação por transformada DCT é a base do padrão de compressão JPEG
Tipicamente a compressão JPEG sem perda visível gira em torno de 10:1, podendo chegar até 20:1. Exemplo: Imagem de 2 Mbytes tem seu
tamanho reduzido para 100 Kbytes.
O limiar de erro visível varia consideravelmente por imagem.
Compressão de 30:1 a 50:1 é possível com imperfeições moderadas. A taxa de compressão é obtida em função da matriz de quantização Q Utilizada no processo de compressão por transformada DCT.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital Compressão 2,6:1 Tamanho do arquivo 83kB Compressão 15:1 Tamanho do arquivo 15kB Compressão 46:1 Tamanho do arquivo 5kB
Cálculo
da DCT Quantização Ordenação dos coeficientes Coeficientes da DCT F(u,v)
Codificação por transformada - DCT
Codificação RLC
Exercício - Codificação por transformada DCT 1 ) Responda:
1.1 - Descreve as etapas normalmente envolvidas no processo de codificação por transformada DCT.
1.2 – A transformada DCT em si insere perdas na informação? E a codificação por transformada? Por quê?
1.3 - O que representa os coeficientes da transformada DCT? 1.4 - Comente sobre as componentes de frequência espacial
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Estimação de Movimento e
Compensação de movimento
Uma maneira de explorar esta similaridade entre os quadros no sistema de codificação de fonte, seria transmitir um dado quadro e para o
quadro seguinte transmitir somente as informações que se alteram em relação ao quadro anterior.
Este é o principio básico explorado pela codificação temporal.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
- Transmite-se todas as informações do primeiro quadro - quadro de referência (I) - utilizando codificação por DCT, por exemplo. Ou seja realiza-se uma compressão espacial ou INTRAQUADRO. Compare blocos do quadro atual com blocos do quadro de
referência (I): grande parte dos blocos possuem informações idênticas ou com pequenas alterações e/ou movimentos.
Quadro de referência (I) Quadro Atual
- Transmite-se instruções ao decodificador relacionadas a como reconstruir o quadro atual em função do quadro de referência. - Estas instruções são enviadas em forma de Vetores de
Movimento e também de resíduos (diferenças ou erros).
- A técnica de levantar os valores dos vetores de movimento chama-se: Estimação de movimento.
- A técnica que utiliza os vetores de movimento para reduzir os efeitos do movimento chama-se: Compensação de Movimento. - Os blocos idênticos – ex. fundo – possuirão vetor de movimento e
os resíduos com valor zero.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Exemplo de estimação do vetor de movimento:
Comparando os blocos do quadro atual com o quadro de referência pode-se encontrar o bloco com maior correlação – bloco de melhor casamento - e a partir daí obter o vetor de movimento associado ao bloco. O vetor de movimento indicará onde encontrar no quadro de referência o bloco de maior correlação com o bloco a ser codificado.
Quadro de
Referência (I) Quadro Atual
Vetor de movimento Bloco a ser
codificado Codificação Temporal
O cálculo do melhor casamento pode indicar que há diferenças entre o bloco do quadro atual e o bloco de melhor casamento.
Deformações de objetos, rotações, diferenças de iluminação, etc. podem causar diferenças “pequenas” entre os blocos.
A matriz de diferenças entre os blocos, chamada de RESÍDUO, é codificada e transmitida junto com o vetor de movimento para
permitir reconstruir o bloco atual em função do bloco de referência. Um bom codificador compara a quantidade de bits necessária para a transmissão dos resíduos e para a transmissão do bloco inteiro (sem usar compensação de movimento) para verificar qual a melhor opção em termos de redução de taxa de transmissão.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Quadro de referência (I) Quadro Atual
Vetores de movimento
Busca do bloco de melhor casamento
Definição do vetor de movimento Exercícios Codificação Temporal
1)Responda:
1.1- Descreve o processo de compensação de movimento. 1.2 – Que tipo de redundância é explorada por esta técnica?
1.3 – Como é alcançada a redução de taxa de transmissão fazendo uso desta técnica?
Codificação Temporal - Compensação de Movimento
vetor de movimento
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Compressão de vídeo
Padrão MPEG
MPEG - Introdução
MPEG (Moving Pictures Experts Groups)
Comitê formado em 1988 pela ISO (International Organization for Standardization) com objetivo de desenvolver padrões para
compressão/codificação de vídeo e áudio.
Foram definidos três padrões a serem desenvolvidos cujas características alvo inicialmente propostas eram:
- MPEG-1 - padrão para compressão de vídeo/áudio até 1.5 Mbps; - MPEG-2 - padrão para compressão de vídeo/áudio até 10 Mbps; - MPEG-3 - padrão para compressão de vídeo/áudio até 60 Mbps; O desenvolvimento do MPEG-3 fora cancelado, devido ao
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
MPEG - Introdução
Resumo das principais características dos padrões MPEG
MPEG-1 Padronizado em 1991 - ISO/IEC 11172
- Taxas de vídeo/áudio até 1.5 Mbps;
- Resolução máxima de 352 x 240 (CIF); - Suporte somente a vídeo não entrelaçado; - Utilizado em CD-Rom;
MPEG-2 - Padronizado em 1994 - ISO/IEC 13818
- Taxas de vídeo/áudio superior a 80 Mbps; - Suporte à resolução HD;
- Suporte a vídeo entrelaçado e não entrelaçado;
MPEG - Introdução
Resumo das principais características dos padrões MPEG MPEG-4/H.264
H.264 é um padrão para compressão de vídeo, baseado no MPEG-4 Part 10 ou AVC (Advanced Video Coding).
O padrão foi desenvolvido pela ITU-T - Video Coding Experts Group (VCEG) - em conjunto com a ISO/IEC – MPEG - através de uma parceria conhecida por Joint
Video Team (JVT). A versão oficial do padrão, ISO/IEC 14496-10, foi lançado em 2003.
A principal meta proposta para o desenvolvimento do padrão H.264/MPEG-4 AVC foi a de melhorar a eficiência de codificação em pelo menos duas vezes em relação ao MPEG-2.
O Padrão MPEG-4/H.264 é utilizado nos padrões de TV Digital ISDB-TB e DVB-T2.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
• Bloco: é uma matriz de 8x8 pixels (ex. luminância)
• Macrobloco: é uma matriz composta de 16x16 pixels ou 4 blocos.
• Fatia (Slice): é um conjunto de macroblocos sequenciais. Os slices são codificados de modo independente entre si, de modo que se o canal corromper dados de um slice, a decodificação pode recomeçar no próximo slice recebido.
• Quadro (Frame): é uma imagem propriamente dita.
Hierarquia e Terminologia do MPEG
Quadro Slice
Macrobloco
Grupo de quadros (GOP - Group Of Pictures): é um conjunto de quadros
formado tipicamente por 3 diferentes tipos de quadros: I, B e P (quadros estes gerados a partir de diferentes tipos de codificações);
Tais quadros são organizados em uma estrutura normalmente repetitiva periódica que tem comprimento típico entre 10 e 30 quadros.
I P B B B P B B B P B B B I Grupo de Quadros Próximo GOP
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Tipos de Quadros:
• Quadro I – Intraquadro - é um quadro cuja codificação é realizada
utilizando apenas as informações contidas no próprio quadro. Este tipo de quadro é codificado utilizando apenas compressão espacial e não
compressão temporal.
• Quadro P – Predito - é um quadro que contém principalmente os vetores de movimento e as diferenças entre o último quadro I ou P para o quadro atual.
• Quadro B - Bidirecional - é um quadro construído principalmente a
partir da interpolação entre quadros P ou I anterior e o quadro P ou I
posterior.
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Referências:
• Os quadros I e P são chamados quadros ancoras, pois podem servir de
referência para outros quadros a serem codificados utilizando compensação de movimento.
Os quadros B não são utilizados como referência para a compensação de movimento e portanto não são quadros ancoras.
MPEG - Tipos de Quadros
Próximo GOP
P
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
MPEG - Tipos de Quadros
Quadros de entrada do codificadorO GOP define o tipo de codificação principal a ser empregada em cada quadro do vídeo.
A formação do GOP é configurável e definida no codificador. GOP
Princípio da codificação dos quadros I, P e B
Vamos ilustrar o princípio de codificação dos quadros I, P e B usando a sequência de quadros dadas ao lado. As figuras mostram a sequência de quadros 1 2 e 3 a serem codificadas e transmitidas da emissora para um dado receptor (Set Top Box) ou decodificador.
O Quadro 1 será codificado utilizando codificação por transformada DCT. Os quadros 2 e 3 serão codificados utilizando principalmente a técnica de estimação e compensação de movimento.
1 (I)
3 (P) 2 (B)
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
No receptor, o processo de decodificação do...
Quadro I – é Imediata;
Quadro P – Requer o quadro I ou quadro P anterior;
Quadro B – Requer o quadro I ou P anterior + quadro I ou quadro P
posterior;
Um quadro B somente poderá ser decodificado se o receptor possuir
previamente disponível as informações dos dois quadros utilizados como referências em sua codificação.
Para possibilitar a decodificação eficiente dos quadros B no receptor, os quadros ancoras (I e P) são transmitidos de forma reordenada, sendo transmitidos de forma antecipada aos quadros B à eles referenciados.
Esta reordenação de quadros exige uso de buffer no codificador e insere
delay no processo de codificação, mas facilita e simplifica o processo de
decodificação a ser realziado no receptor.
• GOP regular: são grupos de quadros que apresentam um número fixo de quadros P e B. Este tipo de grupo de quadros podem ser representados por dois
parâmetros: M que representa a distância entre dois quadros I sucessivos e N que representa a distância entre dois quadros de referência sucessivos.
• GOP irregular: não apresenta uma estrutura de repetição com distância fixa entre os quadros fixos. Embora seja prevista, este tipo de organização dos quadros não é muito utilizada.
I
B
B
B
P
B
B
B
I
P
B
B
B
P
B
B
B
P
B
B
B
I
Grupo de Quadros para exibição
P
Grupo de Quadros para transmissão
B
B
B
P
I
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Vetores de movimento
I
B
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Exercícios - MPEG
1.1 – Descreva a hierarquia empregada no MPEG-1 indo do bloco ao GOP;
1.2 - Descreva os tipos de quadro que compõe o GOP e os tipos de codificações empregados em cada um;
1.3 – Relacione a taxa de bits necessárias para transmissão de cada tipo de quadro; 1.4 – Mostre a ordem de apresentação e ordem de transmissão dos quadros
codificados para o GOP com formação: I B B B B P B B B B P
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Juliano Silveira Ferreira Prof. MSc. Juliano Silveira Ferreira TL011 – Televisão Digital
Agradeço pela sua atenção!
Agradecimentos:
Prof. MSc. Carlos Augusto Rocha Prof. MSc. Marcelo Carneiro de Paiva