• Nenhum resultado encontrado

5.4 Metodologia de classicação de imagens usando SOMs segmentados por mor-

5.4.1.2 Imagem teste 2

A segunda imagem teste utilizada nos experimentos é composta pelas bandas espectrais 2, 3 e 4 do satélite CBERS/CCD, possui 496x462 pixels e foi cedida pela Divisão de Geração de Ima- gens do Instituto Nacional de Pesquisas Espaciais (INPE). A cena, adquirida em 31/07/2000, abrange uma área ao redor da cidade de Brasília-DF e apresenta 5 classes de cobertura terrestre predominantes: água, vegetação, cultura agrícola, área irrigada (pivôs centrais) e cerrado. A gura 5.8 mostra uma composição colorida da imagem.

Fig. 5.8: Composição colorida das bandas 3(R), 4(G) e 2(B) da imagem teste 2.

Iniciando a aplicação da metodologia de classicação proposta neste capítulo, janelas amos- trais de tamanho 5x5 foram coletadas de maneira uniforme sobre toda a região da cena, em intervalos regulares de oito pixels, totalizando 3.534 amostras obtidas sem a intervenção do

usuário.

Um SOM composto por 225 neurônios, dispostos num arranjo retangular 15x15, foi treinado com todos os dados amostrais de acordo com os parâmetros e procedimentos descritos na seção 4.2.2. O tempo de treinamento sob o Matlab em uma máquina com processador AMD Athlon XP 2600+ 1,91GHZ e 1GB de RAM foi de 109 segundos.

A gura 5.9 mostra o MCI obtido após o treinamento do SOM. É possível visualizar através dele, os 5 padrões de cobertura terrestre presentes na imagem original. No canto superior esquerdo do mapa (em cores verdes mais claras) estão os protótipos representantes do padrão de área irrigada (pivôs de irrigação), logo abaixo ao redor deles (na cor verde mais escura) estão os protótipos da classe vegetação, do canto inferior direito ao centro do mapa (na cor magenta) estão os protótipos da classe cultura agrícola, no canto inferior esquerdo do mapa (na cor magenta mais escura) estão os protótipos da classe cerrado, e logo acima deles (na cor preta) estão os protótipos que representam a classe água.

Fig. 5.9: Imagem do MCI da imagem teste 2 após o treinamento do SOM.

A gura 5.10 mostra a imagem em 3D da U-matrix do SOM treinado. É possível observar a existência de vales que estão associados aos agrupamentos de dados (classes) visualizadas no

170Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos MCI.

Fig. 5.10: U-matrix na forma de superfície do SOM da imagem teste 2.

Na seqüência, a estratégia de particionamento do mapa de neurônios descrita na seção 5.2 foi aplicada. O gráco do número de regiões conectadas para cada valor de limiar k da U- matrix, apresentado na gura 5.11, foi então construído para determinar o conjunto Sk, cujos

elementos são os valores de k que correspondem à inícios de seqüências contíguas e constantes de número de regiões conectadas (Nrc) maiores que 3. Da mesma forma que nos experimentos

anteriores, devido ao número elevado de rugosidades apresentadas pela matriz de distâncias, nesta etapa da análise foram aplicadas duas iterações do algoritmo de suavização da U-matrix com o objetivo de reduzir as rugosidades apresentadas pela mesma.

Analisando o gráco da gura 5.11, observa-se que Sk é composto por 12 valores (Sk =

{17, 43, 57, 74, 91, 113, 128, 143, 150, 167, 183, 195}). Os 12 valores de k, que pertencem ao con-

junto Sk, denem, portanto, 12 imagens de marcadores para a U-matrix.

Seguindo o método de classicação proposto, para cada uma das 12 imagens de marcadores, obteve-se as linhas de partição da U-matrix (através do algoritmo watershed), rotulou-se a U- matrix particionada e copiou-se os rótulos de cada elemento da U-matrix para os neurônios

17 43 57 74 91 113 128 143150 167 183 195 250 0 1 2 3 4 5 6

Valor do limiar (k) da U−matrix

Número de regiões conectadas (agrupamentos)

Fig. 5.11: Número de regiões conectadas versus limiar da U-matrix da imagem teste 2. correspondentes no SOM. A gura 5.12 mostra as 12 partições do SOM da imagem teste 2 (cada uma delas correspondendo a um dos valores de Sk).

Uma vez determinadas as 12 partições para o SOM treinado, os índices de validação de agrupamentos (modicados) VSOM

CDbw, VDBSOMKim e V

SOM

P BM foram então aplicados para avaliar a qua-

lidade de cada uma delas. A tabela 5.10 mostra os valores dos índices para cada uma das partições obtidas (representadas pelo limiar k), juntamente com o número de agrupamentos correspondente.

Observando os valores da tabela 5.10, verica-se que não houve consenso entre os três índices de validação na indicação da melhor partição. Os índices VSOM

CDbw e VDBSOMKim indicaram

como melhor partição aquela correspondente ao valor de k = 128. Já o índice VSOM

P BM apontou

a partição referente ao valor de k = 150 como a melhor.

Considerando que dos três índices utilizados dois deles sugeriram a mesma partição (k = 128), e levando em conta que o índice VSOM

CDbw foi aquele que apresentou o melhor desempenho

172Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos k = 17 k = 183 k = 167 k = 150 k = 143 k = 128* k = 113 k = 91 k = 74 k = 57 k = 43 k = 195

Fig. 5.12: Diferentes partições do SOM da imagem teste 2. Partição referente ao Número de Valores dos índices

limiar k agrupamentos VSOM

CDbw VDBSOMKim V SOM P BM 17 3 142.29 414.83 648.62 43 4 892.53 404.22 539.39 57 5 1471.4 328.39 446.53 74 5 2094.6 306.29 461.08 91 4 2222.7 297.18 599.02 113 4 2072.2 286.90 599.40 128 5 7146.3 236.23 586.75 143 4 2849.7 299.13 744.84 150 3 1064.5 360.35 799.70 167 4 3350.0 364.49 538.20 183 3 90.793 406.09 421.93 195 2 24.598 647.78 216.86

Tab. 5.10: Valores dos índices VSOM

CDbw, VDBSOMKim e V

SOM

P BM para as 12 partições do SOM da imagem

teste 2.

VSOM

DBKim foi então considerada aqui como a mais adequada para os dados da imagem teste 2.

k = 128), nota-se que o mapa foi segmentado adequadamente de acordo com as cinco classes de

cobertura terrestre existentes na imagem, as quais são representadas pelos protótipos do SOM. Em seguida, outros cinco submapas foram gerados a partir dos subconjuntos de dados de cada uma das classes encontradas na partição k = 128, mas como nenhum deles apresentou mais de uma região (ou agrupamento), os mesmos foram descartados e o processo de análise de agrupamentos foi então nalizado.

No último passo do método de clasicação proposto, os pixels da imagem teste 2 foram classicados utilizando como referência os protótipos do SOM rotulado. A gura 5.13 mostra a imagem categorizada de acordo com as 5 classes de cobertura terrestre detectadas.

Fig. 5.13: Imagem teste 2 classicada pela metodologia de classicação proposta.

Analisando o processo de classicação da imagem teste 2 pela metodologia de classicação proposta nesse capítulo, nota-se que a avaliação de diferentes segmentações do SOM (inicial) possibilitou a detecção dos cinco agrupamentos de dados da imagem com apenas uma iteração do algoritmo. Ou seja, da mesma forma que no experimento da imagem teste 1, foi necessário apenas um único SOM para encontrar a melhor partição para os dados da imagem teste 2.

174Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos Caso a metodologia de classicação apresentada no capítulo 4 fosse aplicada, a partição referente ao limiar k = 17 seria escolhida para segmentar o SOM inicial, uma vez que corres- ponde à seqüência mais estável de número de regiões conectadas em função do valor do limiar

k da U-matrix. E como pode ser visto através da gura 5.12, a partição do SOM referente

ao limiar k = 17 apresenta apenas três classes, sendo que duas delas incluem ainda mais duas subclasses. Diante disso, é necessário que pelo menos dois outros SOMs sejam gerados e treina- dos para discriminar corretamente as cinco classes existentes na imagem teste 2, o que exige um tempo de processamento maior do que o do método proposto neste capítulo. O apêndice A.6 (localizado na mídia anexada a essa tese) mostra a árvore de mapas que é gerada a partir da aplicação da metodologia de classicação proposta no capítulo 4 sobre a imagem utilizada nesse experimento.

A tabela 5.11 mostra o tempo despendido por cada uma das etapas da metodologia proposta neste capítulo na classicação da imagem teste 2.

Etapas do método Tempo consumido proposto (em segundos)

Amostragem 12

Treinamentos dos SOMs 207 Segmentações dos SOMs 13

Avaliação das partições 7 Classicação da imagem 39

Total 278

Tab. 5.11: Tempo consumido pelas etapas da metodologia proposta na classicação da imagem teste 2.

Buscando destacar a vantagem de se utilizar a estratégia proposta para modicar os índices de validação de agrupamentos, a tabela 5.12 mostra os tempos consumidos pelas versões mo- dicadas dos três índices utilizados na avaliação das 12 partições do SOM (mostradas na gura 5.12). Os tempos das versões originais dos índices também são exibidos com o objetivo de evidenciar a inviabilidade de aplicação das mesmas dentro da metodologia de classicação proposta. Caso as versões originais fossem aplicadas para avaliar todas as 12 partições do SOM, o tempo gasto apenas nesta etapa (de avaliação) seria de aproximadamente 598 segundos, mais que o dobro do tempo que foi gasto para executar todas as etapas do método de classicação

usando as versões modicadas dos índices.

Partição referente ao Tempos dos índices limiar k VCDbw VCDbwSOM VDBKim V

SOM DBKim VP BM V SOM P BM 17 37.413 0.4842 5.2733 0.0404 6.1627 0.0401 43 38.839 0.4809 5.1456 0.0389 5.1376 0.0414 57 33.050 0.4822 5.142 0.0390 5.1380 0.0406 74 33.161 0.4840 5.1409 0.0489 5.1375 0.0415 91 34.696 0.4957 5.1382 0.0484 6.1318 0.0501 113 33.833 0.4930 5.1376 0.0478 6.1585 0.0578 128 33.226 0.5036 5.1458 0.0331 6.1394 0.0515 143 41.368 0.5024 5.1398 0.0480 6.0363 0.0498 150 41.933 0.4997 5.1399 0.0479 5.9512 0.0408 167 42.200 0.5081 5.1381 0.0497 5.8876 0.0521 183 48.970 0.5111 5.1393 0.0377 5.4359 0.0574 195 48.218 0.5405 5.1552 0.0475 6.1383 0.0504 466.9 5.9854 61.8357 0.5273 69.4548 0.5735 speedup 78 117.26 121.10

Tab. 5.12: Tempos de processamento (em segundos) gastos pelas versões originais e modicadas dos índices de validação na avaliação das 12 partições do SOM da imagem teste 2.

Os grácos da gura 5.14 mostram os valores das versões originais e modicadas dos três índices de validação para as 12 partições analisadas. Através deles é possível vericar que as indicações das melhores partições dadas pelas versões modicadas dos índices coincidem com as indicações de suas versões originais, já que os valores de ambas apresentaram variações semelhantes em todas as partições.

Do mesmo modo que foi feito para a imagem teste 1, devido a ausência de verdade terrestre, a imagem teste 2 foi classicada de maneira supervisionada por uma rede neural MLP. A imagem resultante serviu de referência para avaliar a qualidade da classicação produzida pela metodologia de classicação proposta. A tabela 5.13 mostra a matriz de confusão calculada considerando as duas classicações. Exceto para a classe vegetação, o percentual de acerto da imagem classicada pelo método proposto foi bastante elevado para cada classe de cobertura terrestre. Se observarmos novamente o MCI da imagem teste 2 (gura 5.9), verica-se que a classe vegetação (na cor verde mais escuro) possui fronteira com os protótipos de todas as outras classes. Isso justica o maior grau de confusão na classicação dos pixels dessa classe

176Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos 17 43 57 74 91 113 128 143 150 167 183 195 0 1000 2000 3000 4000 5000 6000 7000 8000 Partições (valores de k) Valores do índice CDbw Original Modificado (a) VCDbw e VCDbwSOM 17 43 57 74 91 113 128 143 150 167 183 195 200 300 400 500 600 700 800 900 1000 Partições (valores de k)

Valores do índice Davies−Bouldin Kim (2005)

Original Modificado (b) VDBKim e V SOM DBKim 17 43 57 74 91 113 128 143 150 167 183 195 200 300 400 500 600 700 800 900 1000 Partições (valores de k) Valores do índice PBM Original Modificado (c) VP BM e VP BMSOM

Fig. 5.14: Grácos dos valores das versões originais e modicadas dos três índices de validação utilizados para avaliar as partições do conjunto de dados da imagem teste 2.

de cobertura terrestre com os pixels das demais classes.

Em relação ao índice de concordância Kappa, o valor obtido foi igual a 0.81, que de acordo com a tabela 2.5, qualica a classicação produzida pelo método proposto neste capítulo como excelente.

Procurando ainda comparar o desempenho da metodologia de classicação proposta com métodos convencionais de classicação não-supervisionada, a imagem teste 2 também foi clas- sicada utilizando o algoritmo K-médias. A gura 5.15 mostra o resultado da classicação da imagem pelo algoritmo considerando o número de classes (k) igual a cinco. O algoritmo K- médias foi executado utilizando cinco inicializações diferentes para os centróides de cada classe e um número máximo de iterações igual a 150. A classicação considerada para a análise foi

Classes cultura agrícola área irrigada água cerrado vegetação Total cultura agrícola 96.87 3.51 0.00 0.10 7.12 42.89 área irrigada 0.02 96.49 0.00 0.00 15.86 6.77 água 0.00 0.00 100.00 2.73 2.57 2.27 cerrado 3.11 0.00 0.00 86.48 21.16 37.39 vegetação 0.00 0.00 0.00 10.70 53.29 10.68 Total 100.00 100.00 100.00 100.00 100.00 100.00

Tab. 5.13: Matriz de confusão das classes (em porcentagem) entre a imagem classicada pelo método proposto e a imagem referência (resultante da classicação supervisionada). As linhas da matriz mostram os erros de comissão e as colunas mostram os erros de omissão.

aquela que apresentou o valor mais baixo para a soma dos quadrados das distâncias dada pela equação 2.4.

Fig. 5.15: Imagem teste 2 classicada pelo algoritmo K-médias considerando k = 5. Diferentemente da imagem classicada pela metodologia proposta, na imagem resultante do algoritmo K-médias os pixels da classe água não foram reconhecidos, e tanto as áreas de cultura agrícola como as de cerrado foram divididas em duas subclasses. Vale destacar ainda que o algoritmo não discriminou corretamente os padrões mais importantes da cena, mesmo

178Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos inicializando os centróides dentro das cinco classes desejadas. As cinco classes de cobertura terrestre da imagem teste 2 são corretamente discriminadas pelo algoritmo K-médias somente quando um número elevado de classes é considerado. No entanto, para que o usuário tenha conhecimento disso, é necessário que ele interaja no processo e execute o algoritmo diversas vezes variando a quantidade de agrupamentos.

Com relação ao tempo de processamento, o algoritmo K-médias consumiu 268 segundos para classicar a imagem teste 2, quantidade de tempo ligeiramente inferior ao da metodologia de classicação proposta. Entretanto, conforme já discutido no capítulo anterior, os dois métodos apresentam princípios e características bastante diferenciadas, que devem ser levadas em conta quando suas complexidades computacionais são comparadas.