Imagem - RASTREAMENTO E LOCALIZAÇÃO GEOGRÁFICA DE OBJETOS

Conforme apresentado porKlette(2014), a imagem digital é definida pela integração de várias amostragens de dados analógicos em um espaço de domínio. Este espaço consiste em um conjunto retangular de pixels (x,y,u) cuja combinação de (x,y) ∈ Z² determina a localização deste conjunto e o valor deu∈Zé o endereço do canal de cor. O espaço depixel(Ω) de uma imagem é definido por

Ω = {(x,y) : 1≤x≤w,1≤y ≤h} ⊂Z², (1)

na qual,wehsão os limites do domínio.

Essa característica de mapear o espaço da imagem, possibilita referenciar regiões através da localização dos pixels. Como exemplo, aFigura 1arepresenta a imagem com o padrão de referência das imagens e de dimensõesw= 800e h= 500, e aFigura 1bé um recorte desta imagem com o tamanho dew= 77eh= 77. Por fim, no centro da imagem (Figura 1b), há um ponto de referência cuja localização na imagem principal corresponde ao ponto(453,134).

Sobre as características da imagem, o espaço de cores define o tamanho da dimen-são da matriz de cor e valor dopixel o qual é comumente encontrado com o valor de 8 bits (0 a 255 em valores decimais). Existem diversos espaços de cores, tais como: RGB¹, HSV²

1 do inglêsRed, Green, Blue

2 do inglêsHue, Saturation, Value

Capítulo 2. Fundamentação Teórica 6

Figura 1 – Exemplo de um espaçoΩde imagem

(a) Figura padrão (b) Ponto de referência

Fonte:Klette(2014, p. 3)

e CMYK³ (SZELISKI,2011).

Para efeito exemplificativo, a Figura 2 é uma imagem colorida no espaço de cor RGB que por sua vez é segmentada em três matrizes de cores de mesma dimensão de pixels (w,h), ou seja, cada cor possui uma matriz correspondente a cada canal. No caso deste exemplo, a matriz vermelha está disposta naFigura 2b, a matriz verde naFigura 2ce a matriz azul na Figura 2d. Dessa forma, as matrizes na parte superior correspondem a cada canal de cor e, na região inferior, é representada a contribuição de cada canal acima para a formação daFigura 2a. Deste modo, é formado um dos principais espaços de cores RGB. Ressalta-se que para determinar o espaço de tons de cinza, basta encontrar a média pontual dopixeldas matrizes de cores do espaço de cor RGB.

Em uma imagem podem ser aplicados alguns filtros a fim de arrefecer a quantidade de ruídos de alta frequência. Uma das possibilidades para suavizar uma imagem, consiste em aplicar cálculos de janela deslizante em locais pontuais que visam diminuir valores discrepantes na vizinhança da imagem em questão. Nessa perspectiva, Klette (2014), apresenta as principais técnicas de suavização, tais como: filtro de média, filtro de mediana e, especialmente para este trabalho, filtro de Gauss. Em seguida, determina-se o tamanho da janelak, uma matriz de dimensão(k,k)denominada comokernel do filtro, que deslizará na imagem de acordo com a influência da vizinhança da imagem. Caso opte-se por uma maior influência dos dados vizinhos, aplica-se uma janela maior; caso contrário, uma janela menor.

Nesse contexto, como o próprio nome diz, o filtro de média, realiza a operação de janela deslizante da média dos valores do seukernel para determinar o valor do ponto central.

3 do inglêsCyan, Magenta, Yellow, White

Capítulo 2. Fundamentação Teórica 7

Figura 2 – Espaço de cor RGB

(a) Figura Padrão (b) Canal vermelho (c) Canal verde (d) Canal azul

Fonte: Adaptado deMatlab(2020b)

Figura 3 – Exemplo de aplicação do filtro de Gauss

(a) Figura Padrão (b) Figura com o filtro de Gauss

Fonte:Matlab(2020a)

Analogamente, os demais filtros realizam a mesma operação com as suas características.

Ainda de acordo comKlette(2014), filtro de Gauss (Figura 3) é uma convolução local com o filtro dekernel. Após determinar o valor parakeσ, define-se as amostras da função de duas dimensões de Gauss da seguinte forma:

G_σ,µ_x_,µ_y_(x,y)= 1 2πσ²e

−^(x−µ¹⁾^2+(x−^µx)2

2σ2

, (2)

em que (µx,µy) combina os valores esperados para os componentes x e y,σ é o desvio padrão. De forma exemplificativa, aFigura 4demonstra três tipos dekernel comk= (5,5):

Capítulo 2. Fundamentação Teórica 8

Figura 4 – Exemplo dekernel dos filtros da forma

(a)Box filter (b)Gaussian filter (c)Difference filters

Fonte:Burger e Burge(2016, p. 99)

Box filter,Gaussian filter eDifference filters.

2.1.1 Algoritmo matchTemplate

O algoritmomatchTemplate é uma técnica no processamento digital de imagens para a determinação da similaridade entre uma instância de uma máscara (T) dentro de uma imagem (I) (ITSEEZ,2014).

Dessa forma, o algoritmo realiza uma operação de janela deslizante utilizando a instância de máscara sobre uma imagem, comparando estes dois grupos - templatee o recorte da imagem da imagem - com cada ponto de pixel factível. Portanto, dado uma instância de máscara Ω_T(w,h) e uma imagem Ω_I(W,H), é feito a operação da medida de desempenho adotada para determinar um valor de similaridade, iniciando em Ω_I(W −

2, H − ^h₂)até ΩI(W − ^w₂ + 1,H − ^h₂ + 1). AFigura 5 exemplifica esse procedimento no qual a figura do lado esquerdo representa a instância de máscara, o lado direito a operação sendo feita e, em vermelho, o espaço gerado após o algoritmo. Assim, resulta em uma saída de Ω_R(W −w+ 1, H −h+ 1)e o valor dessa medida do casamento de máscara R(x,y). Ressalta-se que o maior valor de R(x,y) desta operação, exceto a soma das diferenças ao quadrado (SQDIFF⁴), é considerado o ponto central da imagem em que mais se assemelha da instância de máscara (ITSEEZ,2014). Ainda de acordo comItseez (2014), utiliza-se, comumente, as medidas de desempenhos SQDIFF, correlação cruzada (CCORR⁵) e correlação cruzada de desvio médio (CCOEFF⁶).

Para a medida de desempenho da soma das diferenças ao quadrado (SQDIFF), a

4 do inglêsSquare Difference

5 do inglêsCross Correlation

6 do inglêsCorrelation Coefficient

Capítulo 2. Fundamentação Teórica 9

Figura 5 – Algoritmo matchTemplate

(a) Template (b) Imagem

melhor similaridade é obtida quando o resultado for igual a zero, de acordo com a equação a seguir:

R_{SQDIF F}(x,y) =X

x⁰,y⁰

(T(x⁰,y⁰)−I(x+x⁰,y+y⁰))². (3)

Já no método da correlação cruzada (CCORR), utiliza a multiplicação para determinar a similaridade de acordo com:

R_CCORR(x,y) = X

x⁰,y⁰

(T(x⁰,y⁰)·I(x+x⁰,y+y⁰))². (4) Assim, caso o valor seja relativamente alto, significa que existe uma similaridade alta; caso contrário, similaridade baixa.

Por outro lado, a correlação cruzada de desvio médio (CCOEFF), indicada por:

R_{CCOEF F}(x,y) = X

x⁰,y⁰

(T⁰(x⁰,y⁰)·I(x+x⁰,y+y⁰))², (5) é similar ao método CCORR, entretanto, difere-se na correspondência entre o modelo em relação a sua média. Dessa forma, tanto otemplatequanto a imagem, subtraem a média de: Essas medidas também possuem suas respectivas formas normalizadas, apresenta-das na Tabela 1. Essa forma é útil para contribuir para a redução dos efeitos inerentes à variação da iluminação do meio ambiente e entre outros ruídos.

Capítulo 2. Fundamentação Teórica 10

Tabela 1 – Medidas normalizadas do algoritmomatchTemplate Método Normalizado Equação

SQDIFF R_{SQDIF F}−N ormed(x,y) = ^R^{SQDIF F}_Z(x,y)^(x,y) CCORR RCCORR−N ormed(x,y) = ^R^CCORR_Z(x,y)^(x,y) CCOEFF R_{CCOEF F}_{−N ormed}(x,y) = ^R^{CCOEF F}_Z(x,y)^(x,y)

A funçãoZ(x,y)indicada naTabela 1, corresponde a:

Z(x,y) =

que é igual para todos os métodos de normalização descritos nessa seção.

No documento RASTREAMENTO E LOCALIZAÇÃO GEOGRÁFICA DE OBJETOS (páginas 17-22)