Speeded Up Robust Features (SURF) - Técnicas de Extração de Caracter´ısticas

3.2 Técnicas de Extração de Caracter´ısticas

3.2.3 Speeded Up Robust Features (SURF)

Uma alternativa ao SIFT é apresentada por Leonardis (2006) e revisada por Bay (2008): um detector e descritor de caracter´ısticas invariante à escala e à rotação denominado SURF (Speeded-up Robust Features). Este método utiliza os mesmos passos do algoritmo SIFT, oti- mizando cálculos por diferentes maneiras de encontrar, filtrar e definir pontos de interesse. Relembrando, os quatro passos do método SIFT são detecção de pontos de interesse, filtragem, obtenção de orientação do ponto e sua descrição distribu´ıda.

Para a detecção de pontos de interesse, o método SIFT utiliza os pontos máximos e m´ınimos das diferenças de gaussianas em escalas sucessivas. No método SURF, o mesmo efeito é alcançado analisando o determinante de uma matriz Hessiana, dada pela matriz H(p, σ ) com- putada pela equação 3.4.

H(p, σ ) = Lxx(p, σ ) Lxy(p, σ )

Lyx(p, σ ) Lyy(p, σ )

(3.4)

Os termos Lxx(p, σ ), Lxy(p, σ ), Lyx(p, σ ) e Lyy(p, σ ) correspondem às convoluções das de-

rivadas gaussianas de segunda ordem centradas no ponto p= (x, y), cada uma em uma direção diferente. Estas derivadas são obtidas no método SIFT por sucessivas suavizações na imagem, e aqui, são aproximadas por filtros quadrados com pesos inteiros baseados na teoria de imagens integrais. Os cálculos das matrizes L(p, σ ) são computacionalmente intensivos e lidam com números reais. Na Figura 3.12, temos as matrizes que gerarão os termos originais da matriz Hessiana na esquerda, e na direita, temos as aproximações feitas por filtros utilizando pesos inteiros. Os filtros na primeira linha são correspondentes ao cálculo de Lyy(p, σ ), e, na segunda

linha, Lxy(p, σ ). O termo σ tem valor de 1.2, sendo a menor escala de blur utilizada para encon-

trar blobs em uma imagem. Para aumentar a performance deste custoso processo, utilizam-se filtros quadrados integrais (LEWIS, 1995) para obter cada uma das orientac¸˜oes desejadas.

Figura 3.12: C´alculo das derivadas gaussianas de segunda ordem.

Fonte: Retirado de http://docs.opencv.org/3.0-beta/doc/py tutorials/py feature2d/ py surf intro/py surf intro.html em 09/01/2017.

Isto cobre a escala original da imagem. Mas, para encontrar caracter´ısticas invariantes à escala, precisamos utilizar a teoria de espaço escalar e criar novas representações da imagem. No método SURF, isto é feito por uma pirâmide de imagens criada por sucessivas convoluções de filtros com escala crescente (figura 3.13). Dividimos o espaço escalar em oitavas, assim

como no algoritmo SIFT, mas ao inv´es de alterar diretamente a imagem, alteramos o tamanho inicial do filtro gaussiano.

No n´ıvel inicial da pirâmide, temos os filtros de 9× 9 pixels apresentados na figura 3.12. No segundo n´ıvel, aumentamos este filtro para 15× 15 pixels (processo ilustrado na figura 3.14). No terceiro, 21× 21 pixels. A cada n´ıvel, aumentamos o tamanho do filtro em 6 pixels em cada dimensão. Na primeira oitava, os filtros começam com 9× 9 pixels, e as próximas oitavas tem acréscimos iguais ao dobro da oitava anterior: a segunda oitava tem o primeiro n´ıvel em 15× 15

pixelse o segundo em 27× 27, por exemplo.

Figura 3.13: Pirˆamide de imagens. Na esquerda, o processo SIFT original. Na direita, o processo SURF.

Fonte: Retirado de (BAY, 2008).

Figura 3.14: Processo de aumento escalar dos filtros gaussianos aproximados. Na imagem, um filtro de 9x9 ´e passado para um n´ıvel superior, com tamanho 15x15.

Fonte: Retirado de (BAY, 2008).

Pontos de interesse são obtidos procurando os valores máximos em vizinhanças de 3x3x3, nos seus vizinhos próximos e entre escalas. Os pontos resultantes são interpolados em espaço escalar e de imagem para encontrar suas posições exatas na imagem original.

Para encontrar a orientação deste ponto de interesse, são calculadas as respostas das trans- formadas de Haar (HAAR, 1910) nas direções verticais e horizontais em um raio de 6s, onde s representa a escala do ponto. As respostas obtidas são multiplicadas por uma função gaussi- ana centrada no ponto de interesse e desenhadas como pontos em um espaço bidimensional. A orientação dominante do ponto de interesse é dada por um vetor com sua magnitude definida pela soma de todas as respostas em uma janela deslizante de tamanho π₃, e sua direção definida pelo ângulo para o qual a janela está correntemente apontando. Esta janela verifica todos os ângulos poss´ıveis e gera um vetor local de orientação a cada passo. O maior vetor gerado dentre todos é o escolhido para ser o dominante. Na figura 3.15, a orientação dominante pode ser vista como o vetor vermelho.

Figura 3.15: Extração da orientação de um ponto de interesse pelo método SURF. O vetor indicado em vermelho é o maior dentre todos os poss´ıveis vetores encontrados pela janela deslizante em cinza.

Fonte: Retirado de (BAY, 2008).

Com a orientação definida, prosseguimos para a etapa de descrição do ponto de interesse. Uma janela quadrática de tamanho 20s é gerada direcionada para a orientação dominante do ponto. Esta janela é dividida em quatro sub-regiões de 4x4. Em cada setor destas sub-regiões, 25 pontos de amostragem equidistantes são retirados e suas respostas à transformada de Haar são computadas e rotacionadas de acordo com a orientação dominante (figura 3.16). Elas são, então, somadas para representar a orientação e magnitude daquele setor, e cada sub-região ar- mazena quatro números: a soma das derivadas nas direções verticais e horizontais, e a soma dos absolutos destas derivadas.

As quatro regiões tem quatro somas cada, resultando em um vetor concatenado de 64 posições. Este vetor descreve o ponto de interesse com menor tamanho comparado com o método SIFT, otimizado e com acurácia comparável.

Figura 3.16: Criação do vetor de descrição em um ponto de interesse. Na esquerda, a janela quadrática orientada completa; na direita, uma sub-região em destaque.

Fonte: Retirado de (BAY, 2008).

No documento UNIVERSIDADE FEDERAL DE S ˜ (páginas 51-55)