SURF Speeded-Up Robust Features - Pontos de Interesse

3.2 Pontos de Interesse

3.2.2 SURF Speeded-Up Robust Features

Desenvolvido a partir do legado iniciado pelo seu antecessor direto, o SIFT (LOWE, 1999), o algoritmo SURF (Speeded-Up Robust Features) foi desenvolvido por Bay et al. (2008) e possui as mesmas etapas que o SIFT: a etapa de deteçcão de pontos de interesse, descri¸cão destes pontos e correla¸cão.

Com o objetivo de reduzir drasticamente o custo computacional, Bay et al. (2008) utilizam o conceito de imagens integrais, apresentado por Viola e Jones (2004). O uso de imagens integrais resulta em um rápido tempo de processamento ao utilizar filtros de convolu¸cão no formato de caixa. Uma imagem integral IP(w) na posi¸cão w = (x, y), representa a soma de todos os valores dos pixels em uma região retangular entre a origem e w. IP(w) = i≤x X i=0 j≤y X j=0 I(i, j) (13)

Com todos os valores da imagem integral calculados, são necessárias apenas 3 opera¸cões simples para sumarizar as intensidades dos pixels em uma área retangular da imagem, independente de tamanho (Figura 12).

3.2.2.1 Deteçcão dos pontos de interesse O detector de pontos de interesse do algoritmo SURF trabalha com uma matriz hessiana, que é a matriz da derivada parcial da segunda ordem, aplicada no resultado da pirâmide de filtros obtida a partir da imagem

Figura 12: Representa¸c˜ao do c´alculo da imagem integral.

Fonte: (BAY et al., 2008)

original e que serve como uma etapa para supressão de pontos não máximos. Os pontos são escolhidos de acordo com o determinante dessa matriz hessiana. Dado um ponto w = (x, y) em uma imagem I, a matriz hessiana H(w, σ) no ponto w e na escala σ será:

H(w, σ) = 2 4 Lxx(w, σ) Lxy(w, σ) Lxy(w, σ) Lyy(w, σ) 3 5 (14)

Onde, Lxx(w, σ) representa a convolu¸c˜ao da derivada parcial de segunda ordem da

gaussiana com a imagem I no ponto w e na dire¸cão horizontal, ou seja, a derivada de x em rela¸cão a x que mostra o quanto a fun¸cão varia na dire¸cão horizontal, já Lyy(w, σ)

indica a varia¸cão para a dire¸cão vertical e Lxy(w, σ) a varia¸cão na diagonal. Através disso

será poss´ıvel descrever a curvatura local necessária para sele¸cão dos pontos.

Segundo Bay et al. (2008), o SURF é um algoritmo que tenta detectar os pontos de forma eficiente, para isso é utilizada uma aproxima¸cão através da Laplaciana da Gaussiana fazendo uma convolu¸cão nos pontos da imagem nas dire¸cões X, Y e XY (diagonal). Os filtros utilizados nas matrizes de convolu¸cão são apresentados na figura 13, da esquerda para a direita: derivada parcial de segunda ordem da gaussiana na dire¸cão Y e XY respectivamente e aproxima¸cão para a derivada parcial de segunda ordem da gaussiana na dire¸cão Y e XY. As partes em cinza são iguais a zero. Estes filtros resultam em um baixo custo computacional quando utilizados com imagens integrais, o tempo de processamento independe do tamanho do filtro.

Figura 13: Filtros utilizados nas matrizes de convolu¸c˜ao do SURF.

Fonte: (BAY et al., 2008)

Assim como no algoritmo SIFT (LOWE, 1999), o SURF (BAY et al., 2008) utiliza uma pirâmide de escalas para detectar as varia¸cões de diferentes magnitudes na imagem, ou seja, os pontos são detectados em diferentes escalas que representam diferentes valores de σ. No entanto, o SIFT gera uma pirâmide de escalas para a imagem, já o SURF gera uma pirâmide de escalas para os filtros utilizados (Figura 14). O filtro de tamanho 9x9 mostrado na figura 13, representa a menor escala da pirâmide e equivale a um valor de σ = 1, 2.

Figura 14: Pirˆamide de escalas utilizada nos filtros do SURF.

Fonte: (BAY et al., 2008)

Para verificar se o ponto será considerado um ponto de interesse, o SURF aplica uma supressão de não-máximos em torno de uma vizinhan¸ca de 3 pixels para cada lado, onde no total são verificados os 26 pixels nas dire¸cões X e Y e nas escalas superior e inferior, assim como é feito no algoritmo SIFT (Figura 9). Aplicando esse processo de deteçcão dos pontos, serão capturados os pontos com grandes varia¸cões de intensidade.

3.2.2.2 Descri¸cão dos pontos de interesse Na etapa de descri¸cão dos pontos de interesse, o algoritmo SURF cria um vetor que descreve a distribui¸cão da intensidade em uma região de pixels vizinha ao ponto considerado (BAY et al., 2008), uma abordagem similar a forma como a informa¸cão do gradiente é extra´ıda pelo algoritmo SIFT (LOWE,

1999). A partir desta região é realizada a extra¸cão da orienta¸cão dominante da imagem, que torna o algoritmo invariante a rota¸cão.

Segundo Bay et al. (2008), para encontrar o vetor que descreve a distribui¸cão de intensidades na região de pixels vizinhos ao ponto de interesse, o algoritmo faz uma convolu¸cão com dois filtros que representam as dire¸cões X e Y, apresentados na figura 15, onde a parte escura possui o valor -1 e a parte clara possui o valor +1. Utiliza-se o conceito de imagens integrais e um vetor de 64 posi¸cões para obter um processamento mais rápido.

Figura 15: Filtros da transformada de Haar utilizados pelo SURF.

Fonte: (BAY et al., 2008)

Assim que as respostas para os filtros são calculadas em torno do ponto de interesse, estas são representadas como pontos no espa¸co, com a resposta horizontal e vertical ao longo da abcissa e ordenada. A orienta¸cão dominante é sumarizada percorrendo uma vizinhan¸ca circular com um intervalo de π/3 em torno do ponto de interesse. O vetor com maior valor define a orienta¸cão do ponto de interesse, conforme apresentado na figura 16.

Figura 16: Atribui¸c˜ao da orienta¸c˜ao do ponto no algoritmo SURF.

Fonte: (BAY et al., 2008)

Tendo o vetor resultante, o próximo passo consiste em obter a distribui¸cão de respostas da transformada de Haar em cada ponto de interesse, mas dessa vez em rela¸cão a esse vetor

que indica a orienta¸cão. O atributo de cada posi¸cão é considerado mais uma vez realizando a convolu¸cão com os filtros X e Y (Figura 15) e somam-se os resultados da dire¸cão destes quadrantes. Em um grid quadrado com 4x4 sub-regiões em torno do ponto, é calculada a resposta da transformada de Haar e cada 2x2 sub-divisões de cada quadrado corresponde ao campo atual do descritor. Essas são as somas dx, |dx|, dy e |dy|, calculadas em rela¸cão a orienta¸cão do grid. Com isso, para cada ponto de interesse tem-se um vetor de 64 posi¸cões descrevendo a forma como a imagem varia nesse ponto, conforme apresentado na figura 17.

Figura 17: Descritor do ponto de interesse do SURF.

Fonte: (BAY et al., 2008)

No documento Recomendações de obras de arte baseadas em conteúdo (páginas 31-35)