2.4 M´etodos de Segmenta¸c˜ao de V´ıdeo
2.4.2 Transformada Discreta de Wavelet
onde n=256, I ´e o histograma de uma imagem modelo, no caso o ˆancora do telejornal, M ´e o histograma de um quadro-chave de uma tomada e b ´e o canal de cor no qual as duas imagens est˜ao sendo comparadas (b ∈ [R, G, B]). O valor obtido da normaliza¸c˜ao fica no intervalo de 0 e 1. Portanto, quanto maior a similaridade entre as imagens, mais pr´oximo o valor fica de 1.
Histograma Local de Cor O histograma local de cor, assim como o histograma glo- bal, calcula a intensidade das cores na imagem, entretanto, n˜ao considera os pixels em separados, mas sim um grupo deles, formando blocos (B × B) de pixels. Neste trabalho, o tamanho do bloco foi definido em 16 × 16 pixels. Portanto, o c´alculo de intersec¸c˜ao de histograma calcula os histogramas de cada bloco da imagem modelo e os compara com o bloco equivalente da imagem candidata, descrito como (Barla et al., 2003):
H(local)(I, M ) = 3 X b=1 PG g=1min(Ig, Mg) PG g=1Mg (2.5) onde G ´e a quantidade de de blocos da imagem (G = [(N1× N2)/B]2), Ig ´e o histograma
local de cor no bloco g da imagem modelo no canal de cor b (b ∈ [R, G, B]), e Mg ´e
o histograma local de cor da imagem candidata. Do mesmo modo, o valor obtido da normaliza¸c˜ao tamb´em fica no intervalo de 0 e 1.
2.4.2
Transformada Discreta de Wavelet
As transformadas de wavelets, tamb´em chamada de decomposi¸c˜ao wavelets, podem ser vistas como mecanismos para decompor ou quebrar sinais nas suas partes constituintes, permitindo analisar os dados em diferentes dom´ınios de frequˆencias com a resolu¸c˜ao de cada componente amarrada `a sua escala. Resumidamente, pode-se dizer que na an´alise
wavelet, um sinal ´e decomposto nas fun¸c˜oes derivadas da wavelet m˜ae em diversas esca- las e deslocamentos temporais (Misiti et al., 1996). Dentre as principais wavelets m˜ae destacam-se: a wavelet Haar, a fam´ılia Deubechies, Coiflets, Symlets, Morlet e Meyer.
Como a an´alise de Fourier, a representa¸c˜ao wavelet fornece acesso a um conjunto de da- dos de v´arios n´ıveis de detalhes, todavia, as wavelets diferenciam-se de Fourier no sentido que as diferentes frequˆencias descritas pelas fun¸c˜oes b´asicas da wavelet s˜ao locais ao inv´es de somente globais, como acontece com Fourier. Isso ocorre porquˆe essa t´ecnica consegue distinguir as caracter´ısticas locais de um sinal em diferentes escalas e, por transla¸c˜oes, elas cobrem toda a regi˜ao na qual o sinal ´e estudado. Por causa dessas propriedades ´
unicas, as wavelets s˜ao usadas em an´alise num´erica, reconhecimento de padr˜oes, com- press˜ao de imagens e sons, computa¸c˜ao gr´afica, processamento de imagens, etc. Dentre as principais vantagens associadas ao uso de wavelets na ´area de processamento digital de imagens est˜ao: as decomposi¸c˜oes waveletes permitem uma boa aproxima¸c˜ao da imagem original com poucos coeficientes; os coeficientes fornecem informa¸c˜ao que ´e independente da resolu¸c˜ao da imagem original, permitindo comparar facilmente imagens de resolu¸c˜ao diferente; e decomposi¸c˜oes r´apidas e f´aceis de computar, requerindo tempo linear no ta- manho da imagem e pouco c´odigo (Wen et al., 1999).
As transformadas wavelets podem ser cont´ınuas ou discretas. A transformada wave- let cont´ınua (do inglˆes, Continuous Wavelet Transform - CWT), possui parˆametros de dilata¸c˜ao e transla¸c˜ao que variam continuamente, ou seja, ´e aplicada a um sinal com re- solu¸c˜ao temporal infinita e, por conseguinte, precisa de infinitas escalas e deslocamentos temporais infinitamente suaves gerando assim infinitos coeficientes. A proposta da trans- formada wavelet discreta (do inglˆes, Discrete Wavelet Transform - DWT) ´e escolher um subconjunto de parˆametros de dilata¸c˜ao e transla¸c˜ao que variam discretamente, baseadas em potˆencia de dois. Computacionalmente, a DWT tem melhor eficiˆencia (mais r´apida e economiza mem´oria), exatamente por ser composta por valores discretizados do sinal.
Portanto, na ´area de processamento digital de imagem ´e geralmente mais comum o uso da DWT para extrair caracter´ısticas de textura e/ou reconhecimento de face, contudo, existem dois modos de decompor uma imagem bidimensional usando essa transformada: a decomposi¸c˜ao padr˜ao e a decomposi¸c˜ao n˜ao-padr˜ao. A decomposi¸c˜ao padr˜ao aplica a DWT unidimensional a cada linha de valores de pixels, resultando em um coeficiente de m´edia e os coeficientes de detalhe para cada linha. Ap´os, tratam-se estas linhas transfor- madas como se elas fossem uma imagem, e aplica-se a DWT unidimensional para cada coluna. Os valores resultantes s˜ao todos os coeficientes de detalhes, exceto por um ´unico coeficiente que representa a m´edia geral. Na decomposi¸c˜ao n˜ao-padr˜ao s˜ao realizadas opera¸c˜oes de decomposi¸c˜ao alternadas entre linhas e colunas. Primeiro aplica-se o c´alculo da m´edia nos pares horizontais e faz-se a diferen¸ca dos valores dos pixels em cada linha da matriz que representa a imagem. Depois, aplica-se o c´alculo da m´edia nos pares ver- ticais e encontra-se a diferen¸ca para a coluna do resultado. Por fim, repete-se o processo
recursivamente apenas no quadrante contendo as m´edias em ambas as dire¸c˜oes.
Outro modo de conseguir resultados mais eficazes ´e por interm´edio da transformada wavelet r´apida (do inglˆes, Fast Wavelet Transform - FWT), utilizando os coeficientes da DWT (Mallat, 1989). Tamb´em conhecida como codificador de subfaixa de canais, a FWT envolve a filtragem do sinal de entrada baseada na fun¸c˜ao wavelet m˜ae utilizada.
Come¸cando com um sinal de entrada discreto, o primeiro est´agio do algoritmo da FWT decomp˜oe o sinal em dois conjuntos de coeficientes. Estes dois conjuntos s˜ao os coeficientes de aproxima¸c˜ao, contendo informa¸c˜oes de baixa frequˆencia e os coeficientes de detalhes, contendo informa¸c˜oes de alta frequˆencia. O vetor dos coeficientes de aproxima¸c˜ao ´e obtido atrav´es da convolu¸c˜ao com o filtro passa-baixa e o vetor dos coeficientes de detalhes ´e obtido atrav´es da convolu¸c˜ao com o filtro passa-alta. A opera¸c˜ao de filtragem ´e seguida por uma dizima¸c˜ao di´adica ou subamostragem por um fator 2, isto porque, ap´os serem feitas as convolu¸c˜oes, o n´umero de coeficientes ´e dobrado em rela¸c˜ao ao sinal de entrada. Assim, o que operador de dizima¸c˜ao faz ´e eliminar todas as amostras de ordem ´ımpar dos vetores de aproxima¸c˜ao e convolu¸c˜ao, mantendo um n´umero de coeficientes igual ao do vetor original.
Foi escolhido para este trabalho o uso da wavelet mais simples de Daubechies (daub4), gerada a partir de quatro coeficientes (Nievergelt, 1999):
(h0, h1, h2, h3) = 1 +√3 4√2 , 3 +√3 4√2 , 3 −√3 4√2 , 1 −√3 4√2 ! (2.6) A partir desses coeficientes constr˜oe-se a fun¸c˜ao escala:
φ(t) =√2 2N −1 X k=0 hkφ(2t − k) (2.7) calcula-se gn: (g0, g1, g2, g3) = 1 − √ 3 4√2 , −3 +√3 4√2 , 3 +√3 4√2 , −1 −√3 4√2 ! (2.8) Asssim, a wavelet de Daubechies ´e dada por:
Ψ(t) =√2
2N −1
X
k=0
gkφ(2t − k) (2.9)
trabalho, a wavelet de Daubechies foi calculada com o aux´ılio da biblioteca JWave2 em
Java.
A distˆancia euclidiana foi a fun¸c˜ao de distˆancia escolhida para medir a similaridade dos resultados das wavelets. Adotou-se essa fun¸c˜ao devido aos bons resultados obtidos durante a experimenta¸c˜ao e, tamb´em, porque a literatura reporta experiˆencias que sugerem sua boa adequa¸c˜ao em aplica¸c˜oes de recupera¸c˜ao de informa¸c˜oes (Zhang & Lu, 2003).
O c´alculo para a distˆancia euclidiana ´e dado pela seguinte f´ormula: Deuclidiana(I, M ) =
3
X
b=1
p(DwtI − DwtM)2 (2.10)
onde DwtM ´e a transformada discreta de wavelet r´apida aplicada na imagem modelo,
DwtI ´e a transformada discreta de wavelet r´apida aplicada na imagem que representa um
quadro-chave do v´ıdeo e b ´e o canal de cor na qual as imagens est˜ao sendo comparadas (b ∈ [R, G, B]).