• Nenhum resultado encontrado

5.4 Metodologia de classicação de imagens usando SOMs segmentados por mor-

5.4.1.1 Imagem teste 1

Com o objetivo de comparar as diferenças de desempenho entre a metodologia de classi- cação de imagens proposta neste capítulo com aquela apresentada no capítulo 4, a primeira imagem utilizada nos testes é a mesma que foi empregada nos experimentos apresentados na seção 4.3.1. A imagem é composta pelas bandas espectrais 3, 4 e 5 do satélite LANDSAT-5 (TM), possui 496x512 pixels e apresenta quatro classes de cobertura terrestre.

Desse modo, o mesmo SOM que foi usado como mapa raiz (SOM inicial) no experimento mostrado na seção 4.3.2, também foi empregado aqui como ponto de partida para realizar a análise de agrupamentos da imagem. As guras 4.15 e 4.16 mostram, respectivamente, a imagem do MCI e da U-matrix do mapa de neurônios treinado.

De acordo com a metodologia de classicação proposta neste capítulo, após o treinamento do SOM, a estratégia de particionamento do mapa de neurônios descrita na seção 5.2 deve ser aplicada. Sendo assim, o próximo passo consiste em obter o conjunto Sm de imagens de

marcadores para a U-matrix obtida. Para isso, é necessário determinar o conjunto Skcomposto

por todos os valores de k que correspondem à inícios de seqüências contíguas e constantes de números de regiões conectadas (com tamanhos superiores a 3).

A gura 5.4 mostra o gráco do valor de limiar (k) da U-matrix versus o número de regiões conectadas (Nrc). O gráco é igual àquele mostrado na gura 4.17, porém procurou-se destacar

os valores de k que devem pertencer ao conjunto Sk.

0 611 59 90 149 0 1 2 3 4 5

Valor do limiar (k) da U−matrix

Número de regiões conectadas (agrupamentos)

Fig. 5.4: Gráco do valor de limiar (k) da U-matrix versus o número de regiões conectadas destacando os valores de k que pertencem a Sk.

Analisando o gráco, observa-se que os valores de k iguais a 6, 11, 59, 90 e 149 correspondem à inícios de seqüências contíguas e constantes de Nrccom tamanhos superiores a 3, ou seja, Sk =

{6, 11, 59, 90, 149}. Com isso foi possível gerar então o conjunto Sm ={U26, U211, U259, U290, U2149}

composto pelas imagens de marcadores da U-matrix, cada uma delas correspondendo a um dos cinco valores de k pertencentes a Sk.

Na seqüência, para cada uma das cinco imagens de marcadores de Sm, obteve-se as linhas

de partição da U-matrix (através do algoritmo watershed), rotulou-se a U-matrix particionada e copiou-se os rótulos de cada elemento da U-matrix para os neurônios correspondentes no

162Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos SOM. A gura 5.5 mostra os resultados obtidos para cada uma dessas ações.

k = 149 k = 59 k = 11 k = 90 k = 6 Imagens de marcadores SOM rotulado linhas de partição (watershed) U−matrix rotulada (melhor partição)

Fig. 5.5: Diferentes partições para o SOM da imagem teste 1.

Tendo produzido cinco partições diferentes para o SOM treinado, os índices de validação de agrupamentos (modicados) VSOM

CDbw, VDBSOMKim e V

SOM

qualidade de cada uma delas, buscando desse modo determinar qual a melhor partição. A tabela 5.6 mostra os valores dos índices para cada uma das partições obtidas (representadas pelo limiar k), juntamente com o número de agrupamentos correspondente.

Considerando que as melhores partições são dadas pelos maiores valores dos índices VSOM

CDbw e

VSOM

P BM, e pelos menores do índice VDBSOMKim, verica-se, portanto, que a melhor partição sugerida

pelos três índices de validação é aquela referente ao limiar k = 59, a qual possui 4 agrupamentos. Analisando o MCI do SOM treinado (gura 4.15) e a sua melhor partição (na gura 5.5), nota-se que o mapa foi segmentado adequadamente de acordo com as 4 classes de cobertura terrestre existentes na imagem, as quais são representadas pelos protótipos do SOM. A classe água 1 no canto superior esquerdo (padrão de água mais escuro), a classe água 2 no canto superior direito (mais arroxeada), a classe área urbana no canto inferior direito (em rosa no MCI) e, por m, a classe vegetação (em verde) com protótipos do canto inferior esquerdo ao centro do mapa.

Partição referente ao Número de Valores dos índices limiar k agrupamentos VSOM

CDbw VDBSOMKim V SOM P BM 6 2 48.16 812.3 213.08 11 3 156.67 692.4 380.18 59 4 777.49 332.7 728.79 90 3 347.17 409.3 548.11 149 2 64.67 581.7 714.71

Tab. 5.6: Valores dos índices VSOM

CDbw, VDBSOMKim e V

SOM

P BM para as 5 partições do SOM da imagem

teste 1.

Em seguida, outros quatro submapas foram gerados a partir dos subconjuntos de dados de cada uma das classes encontradas, mas como nenhum deles gerou um número mínimo de duas regiões (ou agrupamentos), os mesmos foram descartados.

Executando a última etapa do método de classicação proposto, todos os pixels da ima- gem teste 1 foram classicados utilizando como referência os protótipos do SOM rotulado. A gura 5.6 mostra a imagem categorizada de acordo com as 4 classes de cobertura terrestre detectadas.

164Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos

Fig. 5.6: Imagem teste 1 classicada pela metodologia de classicação proposta.

todologia de classicação proposta no capítulo 4, verica-se que um número menor de SOMs foi necessário para detectar os 4 agrupamentos de dados existentes na imagem teste 1. Des- considerando os SOMs que não apresentaram nenhum agrupamento de dados, a metodologia proposta neste capítulo necessitou de apenas um único SOM para encontrar a partição cor- reta do conjunto de dados da imagem. Já aquela do capítulo 4, necessitou de três mapas (dois a mais). Conforme mencionado anteriormente, essa diferença nas quantidades de SOMs analisados ocorre em função das estratégias de segmentação dos SOMs empregadas pelas duas metodologias. Na metodologia apresentada no capítulo 4, a partição escolhida para cada SOM é aquela que corresponde à imagem binária obtida da limiarização da U-matrix com o valor inicial da seqüência mais estável de número de regiões conectadas (Nrc). Sendo assim, para

o primeiro SOM da imagem teste 1, o valor inicial da seqüência mais estável foi k = 149, o qual corresponde a uma partição com apenas dois agrupamentos de dados. De acordo com os resultados experimentais mostrados na seção 4.3.2, cada um dos dois agrupamentos de dados inicialmente discriminados apresentavam ainda mais dois subgrupos de dados. Conseqüente-

mente, foi necessário gerar e analisar mais dois submapas para encontrar as quatro classes de cobertura terrestre existentes na imagem. Já no método de classicação proposto neste capí- tulo, que avalia diferentes segmentações para a U-matrix, e não somente a mais estável, foi possível encontrar a melhor partição dos dados logo na primeira iteração do algoritmo.

Para analisar as diferenças entre as duas metodologias em termos de tempo de processa- mento, a tabela 5.7 mostra os tempos consumidos por cada uma das etapas do método proposto neste capítulo na classicação da imagem teste 1. Vale observar que o tempo da etapa de treina- mento do SOM (158 segundos) apresentado na tabela engloba, além do tempo de treinamento do SOM inicial, os tempos gastos no treinamento dos submapas que não apresentaram nenhum agrupamento de dados. O tempo total gasto pela metodologia de classicação proposta neste capítulo para classicar a imagem teste 1 foi de 215 segundos, aproximadamente um terço a menos do tempo total gasto pela metodologia de classicação apresentada no capítulo anterior (tabela 4.2). Como pode ser visto na subseção 4.3.3.1, esse tempo foi praticamente igual ao que foi consumido pelo algoritmo K-médias na classicação da mesma imagem.

Etapas do método Tempo consumido proposto (em segundos)

Amostragem 9

Treinamentos dos SOMs 158 Segmentações dos SOMs 9

Avaliação das partições 3 Classicação da imagem 36

Total 215

Tab. 5.7: Tempo consumido pelas etapas da metodologia proposta na classicação da imagem teste 1.

Observando ainda os tempos mostrados na tabela 5.7, verica-se que a etapa de avaliação das diferentes segmentações (ou partições) do SOM, a qual envolve a aplicação dos índices de validação, apresenta um tempo de processamento praticamente irrelevante diante do tempo total gasto pelo método. Tal fato ocorre em virtude da aplicação da estratégia proposta para modicar os cálculos dos índices de validação de agrupamentos. A tabela 5.8 mostra a diferença entre os tempos de processamento das versões originais e modicadas dos índices de validação na avaliação das partições da imagem teste desse experimento. Caso não fossem aplicadas as

166Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos versões modicadas dos três índices, e sim suas versões originais, o tempo total gasto para avaliar as cinco partições seria de aproximadamente 120 segundos. Essa quantidade de tempo seria maior do aquela que foi reduzida com a aplicação da metodologia de classicação proposta neste capítulo. Em outras palavras, se as versões originais dos índices de validação fossem utilizadas, a metodologia de classicação proposta aqui consumiria um tempo de processamento maior do que o tempo total gasto pela metodologia apresentada no capítulo 4.

Partição referente ao Tempos dos índices limiar k VCDbw VCDbwSOM VDBKim V

SOM DBKim VP BM V SOM P BM 6 15.265 0.3926 3.0571 0.0299 3.9862 0.0399 11 16.311 0.4067 3.2357 0.0379 4.1100 0.0406 59 16.657 0.4838 3.0928 0.0367 4.0897 0.0397 90 17.768 0.3996 3.0885 0.0358 3.9887 0.0384 149 18.276 0.3982 3.0896 0.0374 4.0143 0.0382 84.277 2.0809 15.5637 0.1777 20.1889 0.1968 speedup 40.5 87.58 102.58

Tab. 5.8: Tempos de processamento (em segundos) gastos pelas versões originais e modicadas dos índices de validação na avaliação das cinco partições do SOM da imagem teste 1. Na última linha da tabela, são mostrados os speedups de tempo das versões modicadas dos índices em relação as suas versões originais.

Os grácos da gura 5.7 mostram ainda os valores das versões originais e modicadas dos três índices de validação para as cinco partições analisadas. Da mesma forma que nos testes experimentais mostrados na seção 5.3.3, as versões modicadas apresentaram praticamente o mesmo comportamento que suas versões originais.

Procurando avaliar também a qualidade da classicação produzida pela metodologia pro- posta aqui, a imagem resultante (gura 5.6) também foi comparada com o resultado da classi- cação supervisionada da imagem teste 1 apresentada na seção 4.3.3. Conforme relatado naquela seção, devido a ausência de verdade terrestre, a classicação da imagem teste 1 realizada de modo supervisionado através de uma rede neural MLP, serviu como referência para avaliar a qualidade das classicações obtidas. Sendo assim, a tabela 5.9 mostra os valores da matriz de confusão para a classicação produzida pela metodologia proposta neste capítulo. O valor obtido para o índice de concordância Kappa foi 0.93.

6 11 59 90 0 100 200 300 400 500 600 700 800 Partições (valores de k) Valores do índice CDbw Original Modificado (a) VCDbw e VCDbwSOM 6 11 59 90 300 400 500 600 700 800 900 1000 1100 Partições (valores de k)

Valores do índice Davies−Bouldin Kim (2005)

Original Modifcado (b) VDBKim e V SOM DBKim 6 11 59 90 200 300 400 500 600 700 800 Partições (valores de k) Valores do índice PBM Original Modificado (c) VP BM e VP BMSOM

Fig. 5.7: Grácos dos valores das versões originais e modicadas dos três índices de validação utilizados para avaliar as partições do conjunto de dados da imagem teste 1.

Classes água 1 água 2 vegetação área urbana Total

água 1 98.71 2.20 0.86 0.67 17.56

água 2 0.91 97.79 0.01 0.84 15.15

vegetação 0.37 0.00 93.90 1.73 52.59

área urbana 0.01 0.01 5.43 96.69 14.69

Total 100.00 100.00 100.00 100.00 100.00

Tab. 5.9: Matriz de confusão das classes para a imagem classicada pela metodologia de clas- sicação proposta. As linhas da matriz mostram os erros de comissão (porcentagem de pixels que pertencem a outra classe, mas que foi classicado como a classe de interesse) e as colu- nas mostram os erros de omissão (porcentagem de pixels que pertencem a classe da referên- cia/verdade, mas que foram classicados incorretamente).

168Classicação baseada em SOMs segmentados por morfologia matemática e emíndices de validação de agrupamentos Comparando os valores das matrizes de confusão e do índice Kappa apresentados pelas duas metodologias de classicação, verica-se que o resultado da classicação pelo método apresentado neste capítulo foi ligeiramente superior, principalmente para os padrões de água e de área urbana.