Classificação usando Descritores de Gabor

1.2 Estrutura da tese

2.1.10 Classificação usando Descritores de Gabor

Existem muitas aplicações de sensores remotos de imagens, tanto militares como civis. As apli- cações civis incluem o planeamento do uso da terra, previsão do tempo, estudo das mudanças climatéricas a longo prazo, monitorização de culturas, planeamento da cidade, e muitos outros. Estas aplicações requerem o desenvolvimento de meios eficazes para a aquisição, transmissão, processamento, armazenamento, análise e recuperação de imagens.

O resultado de uma segmentação ao nível dos píxeis é um mapa temático em que a cada pixel é atribuído um rótulo predefinido a partir de um conjunto finito. No entanto, as imagens pro- venientes de sensores remotos são muitas vezes multi-espetrais e de alta resolução o que torna a sua segmentação semântica detalhada excessivamente exigente. Esta é a razão pela qual al- guns pesquisadores decidiram classificar blocos de imagens, em vez de píxeis individuais. Esse procedimento foi também adotado na abordagem [30] a seguir descrita e onde foram avaliados os classificadores com base no estado dos descritores da imagem e SVMs, que têm mostrado bons resultados em tarefas de classificação de imagem aérea. Foram avaliados dois descritores de imagem, ambos com base em filtros de Gabor. Existe uma longa tradição na utilização de descritores de Gabor no processamento de imagem. Posteriormente, os descritores de Gabor têm sido usados para várias tarefas, incluindo segmentação de textura, reconhecimento de imagem, reconhecimento de íris e registo e controlo de movimento.

2.1.10.1 Descritor de Gabor

O descritor de Gabor para uma imagem é calculado pela passagem da imagem por meio de uma base de dados de filtros de Gabor. O filtro de Gabor é um filtro linear cuja resposta ao impulso é definida como uma função gaussiana modulada com uma sinusoide complexa.

2.1.10.2 Descritor GIST

Oliva e Torralba [26] propuseram os descritores GIST para representar o spatial envelope11 _da

imagem. O spatial envelope é um conjunto de propriedades holísticas que podem ser utilizadas para deduzir a categoria semântica da imagem, sem a necessidade de reconhecimento dos objeto. O descritor de GIST de uma imagem é calculado pela filtragem da imagem por uma base de filtros de Gabor, e depois calculando a média das respostas dos filtros pertencentes a cada bloco de uma grelha 4x4. Comparando este descritor com o descritor de Gabor, vemos que o descritor GIST é essencialmente uma disposição espacial de texturas. Note-se que os desvios padrão e a distribuição de respostas de filtro não são utilizados. Apesar da sua simplicidade, este descritor mostra resultados muito bons em tarefas de classificação de imagens.

2.1.10.3 Classificador Support Vector Machine

A partir de distâncias de descritores de Gabor foi construída uma função de kernel. Esta fun- ção é essencialmente baseada numa norma ponderada e satisfaz a condição de Mercer. Para o descritor GIST foi usado o SVM com o kernel de função base radial. Foi construído um classifi- cador multi-classe utilizando N (correspondendo ao número de categorias) de one-vs-all SVMs e selecionada a classe de saída SVM máxima.

2.1.10.4 Conjuntos de dados e resultados experimentais

As imagens foram testadas com classificadores em dois conjuntos de dados (imagens aéreas). O primeiro conjunto de dados (conjunto de dados In-House) continha imagens de parte de Banja Luka, na Bósnia e Herzegovina. O segundo conjunto de dados continha imagens usadas anteri- ormente para a classificação imagem aérea, que foram incluídas para fins de comparação. Conjunto de dados In-House

Foi utilizada uma imagem multi-espetral (RGB) com 4500x6000 píxeis da parte de Banja Luka, na Bósnia e Herzegovina para a avaliação dos classificadores. Esta imagem continha uma grande variedade de estruturas, tais como edifícios, fábricas e armazéns, campos, árvores e rios. A imagem foi dividida em quadrados de 128x128 píxeis, e foi usado um total de 606 imagens na experiência. Todas as imagens foram classificadas manualmente em seis categorias: ’casas’, ’cemitério’, ’indústria’, ’campo’, ’rio’ e ’árvores’. Metade das imagens foi usada para treino e a outra metade para teste. Foram calculados os descritores de Gabor em oito escalas e oito orientações para todas as imagens do conjunto de dados. Foram procuradas também outras combinações de números de escalas e orientações e foram escolhidos os que apresentavam melhor desempenho. Foram calculados os descritores de Gabor para as três bandas espetrais da imagem, e concatenados os vetores obtidos, que produziram 3x8x8x2 = 384 descritores. Para fins de comparação, também foram calculados os descritores de Gabor para tons de cinza (pan- cromática), 8x8x2 = 128.

Quanto aos descritores GIST, foram obtidos os melhores resultados com a configuração padrão, ou seja, um conjunto de filtros em 4 escalas e 8 orientações. Para estes descritores também foi calculado o tom de cinza, 4x8x16 = 512, e de cor, o que resulta em 3x4x8x3 = 1536 descritores. Para testar os classificadores foi utilizada a validação cruzada (dez vezes), com partições alea- tórias diferente do conjunto de dados, e a média dos resultados.

De salientar que o descritor Gabor, muito mais simples, com dimensionalidade quatro vezes menor, produz um desempenho semelhante ao do descritor de GIST. Para imagens em tons de cinza (pancromática) o descritor Gabor supera o GIST. Quando as imagens em tons de cinza são consideradas, os desvios padrão de respostas de filtro de Gabor fornecem informações mais importantes sobre a textura da imagem, daí o seu melhor desempenho. Outra conclusão é que a disposição espacial das respostas do conjunto de filtros não tem influência benéfica sobre o desempenho do classificador de imagem aérea.

Matriz confusão - Descritores de Gabor: As confusões surgem principalmente entre as categorias que podem ser de difícil diferenciação, mesmo para os seres humanos. Não há muitas confu- sões entre as categorias naturais (’rio’, ’árvores’, ’campo’) e artificiais (’casas’, ’cemitério’, ’indústria’).

Matriz confusão - Descritores GIST: As observações para a matriz de confusão dos descritores Gabor também são válidas aqui.

Conjunto de dados do Reino Unido

de dados contempla 1040 imagens aéreas de 64x64 píxeis, que foram manualmente classificadas nas seguintes oito categorias: ’construção’, ’estrada’, ’rio’, ’campo’, ’erva/relva’, ’árvore’, ’barco’, ’veículo’. O conjunto foi dividido em conjunto de treino e teste de 520 imagens cada. Para este conjunto de dados, as imagens foram processadas pelos descritores de Gabor em oito escalas e oito orientações, bem como pelo descritor GIST, e formado, depois, um classificador multi-classe. Verificou-se, novamente, alguma vantagem para os descritores de Gabor, tal como na primeira experiência.

Na utilização do Descritor Gabor ocorrem erros comuns de classificação em casos que tam- bém podem potencialmente confundir os seres humanos, como a ’construção’ com ’veículo’ e ’campo’ com ’relva’. Raramente ocorrem erros de classificação entre categorias naturais e artificiais.

2.1.11 Extração de Estruturas de Estacionamento - Interpolação, Extrapola-

No documento Google Earth™ search engine: classificação de imagens aéreas (páginas 43-45)