Transformada Discreta de Wavelet - M´etodos de Segmenta¸c˜ao de V´ıdeo

2.4 M´etodos de Segmenta¸c˜ao de V´ıdeo

2.4.2 Transformada Discreta de Wavelet

onde n=256, I é o histograma de uma imagem modelo, no caso o âncora do telejornal, M é o histograma de um quadro-chave de uma tomada e b é o canal de cor no qual as duas imagens estão sendo comparadas (b ∈ [R, G, B]). O valor obtido da normaliza¸cão fica no intervalo de 0 e 1. Portanto, quanto maior a similaridade entre as imagens, mais próximo o valor fica de 1.

Histograma Local de Cor O histograma local de cor, assim como o histograma glo- bal, calcula a intensidade das cores na imagem, entretanto, não considera os pixels em separados, mas sim um grupo deles, formando blocos (B × B) de pixels. Neste trabalho, o tamanho do bloco foi definido em 16 × 16 pixels. Portanto, o cálculo de interseçcão de histograma calcula os histogramas de cada bloco da imagem modelo e os compara com o bloco equivalente da imagem candidata, descrito como (Barla et al., 2003):

H(local)(I, M ) = 3 X b=1 PG g=1min(Ig, Mg) PG g=1Mg (2.5) onde G ´e a quantidade de de blocos da imagem (G = [(N1× N2)/B]2), Ig ´e o histograma

local de cor no bloco g da imagem modelo no canal de cor b (b ∈ [R, G, B]), e Mg ´e

o histograma local de cor da imagem candidata. Do mesmo modo, o valor obtido da normaliza¸c˜ao tamb´em fica no intervalo de 0 e 1.

2.4.2 Transformada Discreta de Wavelet

As transformadas de wavelets, também chamada de decomposi¸cão wavelets, podem ser vistas como mecanismos para decompor ou quebrar sinais nas suas partes constituintes, permitindo analisar os dados em diferentes dom´ınios de frequências com a resolu¸cão de cada componente amarrada à sua escala. Resumidamente, pode-se dizer que na análise

wavelet, um sinal é decomposto nas fun¸cões derivadas da wavelet mãe em diversas escalas e deslocamentos temporais (Misiti et al., 1996). Dentre as principais wavelets mãe destacam-se: a wavelet Haar, a fam´ılia Deubechies, Coiflets, Symlets, Morlet e Meyer.

Como a análise de Fourier, a representa¸cão wavelet fornece acesso a um conjunto de dados de vários n´ıveis de detalhes, todavia, as wavelets diferenciam-se de Fourier no sentido que as diferentes frequências descritas pelas fun¸cões básicas da wavelet são locais ao invés de somente globais, como acontece com Fourier. Isso ocorre porquê essa técnica consegue distinguir as caracter´ısticas locais de um sinal em diferentes escalas e, por transla¸cões, elas cobrem toda a região na qual o sinal é estudado. Por causa dessas propriedades ´

unicas, as wavelets são usadas em análise numérica, reconhecimento de padrões, com- pressão de imagens e sons, computa¸cão gráfica, processamento de imagens, etc. Dentre as principais vantagens associadas ao uso de wavelets na área de processamento digital de imagens estão: as decomposi¸cões waveletes permitem uma boa aproxima¸cão da imagem original com poucos coeficientes; os coeficientes fornecem informa¸cão que é independente da resolu¸cão da imagem original, permitindo comparar facilmente imagens de resolu¸cão diferente; e decomposi¸cões rápidas e fáceis de computar, requerindo tempo linear no tamanho da imagem e pouco código (Wen et al., 1999).

As transformadas wavelets podem ser cont´ınuas ou discretas. A transformada wavelet cont´ınua (do inglês, Continuous Wavelet Transform - CWT), possui parâmetros de dilata¸cão e transla¸cão que variam continuamente, ou seja, é aplicada a um sinal com resolu¸cão temporal infinita e, por conseguinte, precisa de infinitas escalas e deslocamentos temporais infinitamente suaves gerando assim infinitos coeficientes. A proposta da transformada wavelet discreta (do inglês, Discrete Wavelet Transform - DWT) é escolher um subconjunto de parâmetros de dilata¸cão e transla¸cão que variam discretamente, baseadas em potência de dois. Computacionalmente, a DWT tem melhor eficiência (mais rápida e economiza memória), exatamente por ser composta por valores discretizados do sinal.

Portanto, na área de processamento digital de imagem é geralmente mais comum o uso da DWT para extrair caracter´ısticas de textura e/ou reconhecimento de face, contudo, existem dois modos de decompor uma imagem bidimensional usando essa transformada: a decomposi¸cão padrão e a decomposi¸cão não-padrão. A decomposi¸cão padrão aplica a DWT unidimensional a cada linha de valores de pixels, resultando em um coeficiente de média e os coeficientes de detalhe para cada linha. Após, tratam-se estas linhas transformadas como se elas fossem uma imagem, e aplica-se a DWT unidimensional para cada coluna. Os valores resultantes são todos os coeficientes de detalhes, exceto por um único coeficiente que representa a média geral. Na decomposi¸cão não-padrão são realizadas opera¸cões de decomposi¸cão alternadas entre linhas e colunas. Primeiro aplica-se o cálculo da média nos pares horizontais e faz-se a diferen¸ca dos valores dos pixels em cada linha da matriz que representa a imagem. Depois, aplica-se o cálculo da média nos pares ver- ticais e encontra-se a diferen¸ca para a coluna do resultado. Por fim, repete-se o processo

recursivamente apenas no quadrante contendo as m´edias em ambas as dire¸c˜oes.

Outro modo de conseguir resultados mais eficazes é por intermédio da transformada wavelet rápida (do inglês, Fast Wavelet Transform - FWT), utilizando os coeficientes da DWT (Mallat, 1989). Também conhecida como codificador de subfaixa de canais, a FWT envolve a filtragem do sinal de entrada baseada na fun¸cão wavelet mãe utilizada.

Come¸cando com um sinal de entrada discreto, o primeiro estágio do algoritmo da FWT decompõe o sinal em dois conjuntos de coeficientes. Estes dois conjuntos são os coeficientes de aproxima¸cão, contendo informa¸cões de baixa frequência e os coeficientes de detalhes, contendo informa¸cões de alta frequência. O vetor dos coeficientes de aproxima¸cão é obtido através da convolu¸cão com o filtro passa-baixa e o vetor dos coeficientes de detalhes é obtido através da convolu¸cão com o filtro passa-alta. A opera¸cão de filtragem é seguida por uma dizima¸cão diádica ou subamostragem por um fator 2, isto porque, após serem feitas as convolu¸cões, o número de coeficientes é dobrado em rela¸cão ao sinal de entrada. Assim, o que operador de dizima¸cão faz é eliminar todas as amostras de ordem ´ımpar dos vetores de aproxima¸cão e convolu¸cão, mantendo um número de coeficientes igual ao do vetor original.

Foi escolhido para este trabalho o uso da wavelet mais simples de Daubechies (daub4), gerada a partir de quatro coeficientes (Nievergelt, 1999):

(h0, h1, h2, h3) = 1 +√3 4√2 , 3 +√3 4√2 , 3 −√3 4√2 , 1 −√3 4√2 ! (2.6) A partir desses coeficientes constr˜oe-se a fun¸c˜ao escala:

φ(t) =√2 2N −1 X k=0 hkφ(2t − k) (2.7) calcula-se gn: (g0, g1, g2, g3) = 1 − √ 3 4√2 , −3 +√3 4√2 , 3 +√3 4√2 , −1 −√3 4√2 ! (2.8) Asssim, a wavelet de Daubechies ´e dada por:

Ψ(t) =√2

2N −1

k=0

gkφ(2t − k) (2.9)

trabalho, a wavelet de Daubechies foi calculada com o aux´ılio da biblioteca JWave2 _em

Java.

A distância euclidiana foi a fun¸cão de distância escolhida para medir a similaridade dos resultados das wavelets. Adotou-se essa fun¸cão devido aos bons resultados obtidos durante a experimenta¸cão e, também, porque a literatura reporta experiências que sugerem sua boa adequa¸cão em aplica¸cões de recupera¸cão de informa¸cões (Zhang & Lu, 2003).

O cálculo para a distância euclidiana é dado pela seguinte fórmula: Deuclidiana(I, M ) =

b=1

p(DwtI − DwtM)2 (2.10)

onde DwtM ´e a transformada discreta de wavelet r´apida aplicada na imagem modelo,

DwtI ´e a transformada discreta de wavelet r´apida aplicada na imagem que representa um

quadro-chave do v´ıdeo e b ´e o canal de cor na qual as imagens est˜ao sendo comparadas (b ∈ [R, G, B]).

No documento Segmentação de cenas em telejornais: uma abordagem multimodal (páginas 41-44)