• Nenhum resultado encontrado

Aplicação de Mapas de Kohonen em imagem de satélite do semi-árido e comparação com o método da máxima verossimilhança.

N/A
N/A
Protected

Academic year: 2021

Share "Aplicação de Mapas de Kohonen em imagem de satélite do semi-árido e comparação com o método da máxima verossimilhança."

Copied!
8
0
0

Texto

(1)

Aplicação de Mapas de Kohonen em imagem de satélite do semi-árido e comparação com o método da máxima verossimilhança.

Davi Nunes Oliveira1

Beatriz Fernandes Simplicio Sousa1 Arthur Plínio de Souza Braga1

Francisco de Assis Tavares Ferreira da Silva2 Adunias dos Santos Teixeira1

1Universidade Federal do Ceará - UFC Caixa Postal 96 - 13416-000 - Fortaleza - CE , Brasil

davi@dee.ufc.br, beatrizsimplicio@gmail.com, {adunias, arthurp}@ufc.br

2 Instituto Nacional de Pesquisas Espaciais - INPE Caixa Postal 21- 61760-000- Eusébio - CE, Brasil

tavares@roen.inpe.br

Abstract. Artificial Neural Networks represent a potential approach for classification of remote sensing images.

Different from the traditional multi-layer neural networks, the Kohonen self-organizing map is a two-layer network that creates class representation by self organizing the connection weights from the input patterns to the output layer. This paper aims to compare the performance of Kohonen self-organizing map with classification method of maximum likelihood to classify the caatinga biome. The test of the algorithm was carried out by classifying the scene of satellite Landsat Thematic Mapper (bands 2,3,4). This scene contains the city of Iguatu, Ceara, Brazil and the study area was a piece of this city. Iguatu is a semi-arid region that contains an important, fragile and depleted biome: caatinga. A quantitative validation was carried out by comparison between 92 GPS points collected, and used as a ground truth, and the image obtained of each classification proposed. Using these points it was generated a confusion matrix to each classification. Also, the Kappa coefficient and overall accuracy have been calculated. The experimental results show that the self-organizing map presented an equal performance to the Maximum Likelihood algorithm with values of Kappa coefficient of 0,69. In this case, classifying caatinga biome through the analyzes of the specific accuracy, the self-organizing map has a better performance than the maximum likelihood method.

Palavras-chave: remote sensing, image processing, artificial neural networks, confusion matrix, sensoriamento remoto, processamento de imagens, redes neurais artificiais, matriz de confusão.

(2)

1. Introdução

O homem, diante da atual fase de degradação do meio ambiente, cada vez mais, tem procurado por estratégias que possibilitem o desenvolvimento sustentável deste. Estas estratégias devem proporcionar facilidades de uso e rapidez nos resultados. A classificação de imagens de satélite é um meio relativamente rápido e simples de se obter informações a respeito de determinada região. Estas informações são extremamente valiosas para estudos e planejamentos ambientais.

Atualmente, é possível realizar o processamento de diversos tipos de dados, dentre estes os provenientes do sensoriamento remoto, através de técnicas computacionais como, por exemplo, os algoritmos genéticos, lógica fuzzy e as redes neurais artificiais (RNAs).

As RNAs vêm obtendo sucesso nas áreas de reconhecimento de padrões e processamento de imagens já que uma de suas principais vantagens em relação à algoritmos estatísticos é que não é necessário conhecer as funções de distribuição das classes de informação. Vários trabalhos fazem uso das RNA para classificação de imagens de satélite (Ji (2000), Todt et al.

(2003), Jianwen et al. (2005),) e a grande maioria destes estudos aplicaram rede de perceptrons multicamadas (MLP) única para resolver o problema de classificação.

O Mapa Auto-Organizável de Kohonen (SOM) pertence à classe de redes neurais não- supervisionadas. Estas redes são estruturas baseadas em aprendizagem competitiva, onde os neurônios de saída competem entre si para serem ativados. Como resultado apenas um neurônio da camada de saída é ativado a cada amostra. Normalmente os neurônios desse tipo de rede são dispostos em nós formando cadeias de uma ou duas dimensões. Estes mapas auto- organizáveis são caracterizados por ser uma representação do tipo mapa topográfica da distribuição dos exemplos de entrada sobre o espaço amostral, onde a ocorrência de um neurônio é um indicativo de existência de exemplos próximos àquela região (HAYKIN, 1999).

O modelo rede proposto por Kohonen (KOHONEN, 1982) se propõe a captar características essenciais de exemplos de entrada e apresenta um resultado correspondente a um mapa topográfico com otimização do posicionamento de um número fixo de vetores iniciais. Por ser uma rede generalista, esta deve receber estímulos de dimensão arbitrária em sinais de uma ou duas dimensões.

O algoritmo responsável pela conformação do mapa auto-organizável pode ser dividido em três etapas: competição, cooperação e adaptação sináptica. Na primeira fase, dependendo da resposta de cada neurônio, um único elemento é declarado vencedor. Em seguida, são determinados os elementos que compõem a vizinhança do neurônio vencedor para ser associado um coeficiente de cooperação. Com base nesses dados o neurônio vencedor recebe um incremento para correção da sua função de ativação, e, conforme o fator de vizinhança, um percentual do incremento recebido pelo neurônio vencedor é aplicado aos neurônios vizinhos (HAYKIN,1999)

Considerando X={x1,x2,x3,…,xn} sendo um vetor de entrada da rede, onde n é a dimensão do vetor, ou seja, o número de bandas analisadas. Para cada neurônio os coeficientes sinápticos são randomizados com valores entre 0 e 255 correspondentes aos limites empregados à definição inteira relacionada à codificação RGB. Quando um exemplo é apresentado, a distância dos neurônios é computada segundo a Equação (1):

=

= 1

0

))2

( ) ( (

N

i

ij

i t m t

x

Dj (1)

O neurônio que possui a menor distância é selecionado e tem seus coeficientes sinápticos alterados como:

(3)

)]

( ) ( )[

( ) ( ) 1

(t m t t x t m t

mij + = ijiij , se j Є Nci (t) )

( ) 1

(t m t

mij + = ij , se j Є Ncj (t)

Onde, Ncj(t) é o grau de vizinhança máximo considerado entre o nó j no instante t; α(t) é um valor escalar do coeficiente de adaptação com valores 0<α(t)<1. Em seguida pode ser analisada a próxima entrada.

Para a aplicação do algoritmo de treinamento da rede SOM em classificação de imagens, devem ser respeitados alguns passos. Após ser apresentada a arquitetura neural de classificação, o processo de classificação das imagens pode ser resumido como segue:

1. Vários pixels são coletados aleatória e uniformemente sobre toda região da imagem e fornecidos como padrões de entrada para o SOM.

2. O treinamento não supervisionado do SOM é efetuado.

3. A imagem da matriz de pesos do SOM é gerada.

4. Um analista de imagens escolhe, através da imagem gerada, as classes de informação desejadas e agrupa segundo suas características semelhantes.

5. Todos os pixels da imagem original são classificados através do SOM, produzindo assim um mapa temático da cena.

Os métodos de classificação de imagens tradicionais podem ser divididos em dois grandes grupos: os supervisionados e os não-supervisionados. O método K-Means é um método não supervisionado, e calcula inicialmente as classes distribuindo em uma classe uniformemente no espaço e então aglomera classe por classe em um processo iterativo usando a técnica de distância mínima (MOREIRA, 2005). Já a classificação MaxVer é uma das classificações supervisionadas mais aplicadas no tratamento de dados satélites. Este método classifica os pixels em uma determinada classe conforme a distância estatística entre cada pixel e a média dos níveis de cinza da classe (ASSAD e SANO, 1998). Segundo estes autores, uma função de probabilidade P(x) define a que classe pertencerá determinado pixel. O cálculo é feito para as várias classes pré-definidas e o pixel é atribuído à classe cuja probabilidade de pertencer a esta seja maior.

Parâmetros que possibilitem a quantificação exata do levantamento de uso das terras são essenciais. Um desses parâmetros é o índice Kappa, o qual é obtido mediante a adoção de uma referência para a comparação dos mapeamentos produzidos. Neste caso, a análise da exatidão do mapeamento é obtida por meio de uma matriz de confusão ou matriz de erro, sendo posteriormente calculado o Coeficiente Kappa de concordância. Este coeficiente deve ser comparado aos parâmetros criados por Landis e Koch (1977) os quais são utilizados como referência para classificar mapas resultantes da utilização de imagens de sensoriamento remoto.

O presente trabalho tem como objetivo testar a aplicabilidade de uma rede de Kohonen para condições semi-áridas brasileiras presentes em uma cena do satélite LANDSAT-5 no município de Iguatu-CE, e comparar o seu desempenho desta com a de um classificador estatístico de MaxVer.

2. Metodologia de trabalho

2.1 Classes Propostas

Foi utilizada uma cena do satélite Landsat (217/65) composta pelas bandas 2 (0,50 - 0,60 µm), 3 (0,63 - 0,69 µm) e 4 (0,76 - 0,90 µm) do espaço RGB. Nesta cena está localizada uma parte do município de Iguatu, no Estado do Ceará – Brasil, entre os paralelos 6º 19’ 29.91’’S e 6º 25’ 58.98’’S e os meridianos 39º 14’ 53.29’’W e 39º 21’ 22.89’W. A referida área vem sendo objeto de estudo de diversos grupos de pesquisa do departamento de Engenharia

(4)

um segmento de imagem de 506x506 pixels.

Figura 1. Parte do município de Iguatu-CE.

As classes de interesse a serem classificadas foram: Classe 1 – Água: rios, açudes e lagoas; Classe 2 – Agricultura; Classe 3 – Antropizada: áreas que sofreram algum tipo de degradação ou áreas descobertas; Classe 4 – Caatinga Arbórea Densa (CAD): Engloba a vegetação arbórea densa, de porte mais elevado. Nas regiões de serra observa-se uma vegetação com característica mais exuberante, onde as condições climáticas fornecem maior vigor na vegetação. Também está presente nas regiões do interior mais planas e mais secas apresentando uma leve diferença de tonalidade; Classe 5 – Caatinga Herbácea Arbustiva (CHA): Segundo Fernades & Bezerra (1990) esta vegetação é do tipo xerófila surgindo em áreas com características de semi-aridez. Engloba a vegetação herbácea arbustiva (porte baixo a médio) aberta à densa;

2.2 Áreas de treinamento

O processo de escolha das 1000 amostras de treinamento para cada classe foi executado no software ENVI 4.3® e posteriormente exportado para um formato legível no MatLab (*.txt). Realizando a amostragem desta forma evita-se a tendenciosidade nos resultados finais.

A escolha das amostras é de extrema importância para a classificação e deve ser feita de tal forma que estas realmente caracterizem cada classe.

2.3 Criação da rede e processo de classificação

Para a realização deste trabalho, foi escolhido o software MATLAB 7.0. Este software oferece pacotes prontos para utilização das RNA’s em seu toolbox. Desta forma, para a classificação da imagem de satélite optou-se por utilizar as redes de Kohonen. A fim de encontrar a melhor topologia desta rede, foram realizados vários testes onde variou-se o número de neurônios e seu arranjo, o número de iterações e a função de distância.

A classificação pelo método da máxima verossimilhança foi realizada no software ENVI 4.3®.

(5)

2.4 Criação da matriz de confusão

Para validação da exatidão do mapeamento coletou-se pontos representativos da verdade terrestre na área de estudo. Foi realizada a coleta de 80 pontos referentes às cinco classes a serem classificadas no município estudado. Para isto, utilizou-se aparelho GPS Garmim. Os pontos coletados são o meio para confirmar, por exemplo, se um determinado ponto x pertencente à classe y quando classificado continua pertencendo a esta classe ou é classificado pelo método em teste em outra classe z. A partir da contagem de todos os pontos, pode-se, através das Equações 1 e 2, obter os índices de exatidão global e Kappa, respectivamente, que qualificam a classificação.

100 N*

EG= A (1)

Onde, A é o número de pontos classificados corretamente e N o número de pontos amostrais.

∑ ∑

= + +

= = + +

= γ

γ γ

1 2

1 1

)

* (

)

* (

i

i i

i i

i i ii

x x N

x x x

N

K (2)

Onde,

K = coeficiente Kappa de concordância; N = número de observações (pontos amostrais); r = número de linhas da matriz de erro; xii = observações na linha i e coluna i, respectivamente;

xi+ = total marginal da linha i; x+i = total marginal da coluna i.

3. Resultados

Os resultados da classificação pelo método de Kohonen obtidos a cada treinamento foram analisados visualmente e os que se distanciavam muito quando comparados à imagem original e à classificação pelo método da máxima verossimilhança eram descartados.

O resultado mais satisfatório foi obtido utilizando uma rede com 5x8x2 neurônios, ou seja, 80 neurônios dispostos em forma de paralelepípedo, utilizando a topologia hexagonal (Figura 2). Na entrada da rede foram utilizados exemplos de treinamento no formato de vetores de três elementos correspondente à codificação RGB dos pontos amostrados. A partir da conclusão da etapa de treinamento cada neurônio foi associado a uma classe, sendo formados 5 grupos. Como as classes dos exemplos de amostragem para treinamento eram conhecidas, a imagem pôde ser apresentada à rede, que atribuía uma classificação ao ponto conforme o grupo que o neurônio ativado pertencia.

Figura 2. Disposição dos neurônios na rede.

(6)

na Figura 3. Já a Figura 4 expõe a classificação encontrada pelo método da máxima verossimilhança.

Figura 3. Resultado da classificação utilizando redes de Kohonen.

Figura 4. Resultado da classificação pelo método da Máxima Verossimilhança.

As matrizes de confusão, geradas a partir da coleta de pontos em campo, estão expostas nas Tabela 1 e 2. A primeira matriz correspondente à classificação pelo método das redes de Kohonen está exposta na Tabela 1. O número total de amostras foi de 92 e o número de

(7)

pontos classificados corretamente foi de 72. Assim, a Exatidão Global foi de 78%. Valores de Exatidão específicas para água (100%), agricultura (89,5%), antropizada (100%), CHA (60%) e CAD (50%) foram obtidos com a rede de Kohonen.

Tabela 1. Matriz de confusão pelo método de Kohonen

Água Agricultura Antropizada CHA CAD Exatidão

específica

Água 2 100

Agricultura 17 1 1 89,5

Antropizada 28 100

CHA 3 11 21 60

CAD 4 4 50

A Tabela 2 expõe a matriz de confusão obtida pelo método da máxima verossimilhança.

Neste método o número de pontos classificados corretamente foi de 72. A Exatidão Global foi de 78%. Valores de exatidão específica para água (100%), agricultura (84,2%), antropizada (89,3%), CHA (71,4%) e CAD (50%) foram obtidos através deste método.

Tabela 2. Matriz de confusão pelo método da máxima verossimilhança

Água Agricultura Antropizada CHA CAD Exatidão

específica

Água 2 100

Agricultura 16 3 84,2

Antropizada 3 25 89,3

CHA 3 7 25 71,4

CAD 2 2 4 50

Os resultados de classificação de Kohonen foram comparados com os da máxima verossimilhança. O primeiro método apresentou maiores valores de exatidão específica para as classes agricultura (89,5%) e antropizada (100%). Enquanto que a classe CHA apresentou maiores valores de exatidão específica (71,4%) no método estatístico da máxima verossimilhança. A classe água, que possui uma assinatura espectral bem definida, foi classificada corretamente pelos dois métodos apresentando 100% de acerto. Assim, como a classe CAD obteve a mesma exatidão para os dois métodos. As duas classificações obtiveram mesmo valor de Exatidão Global, ou seja, 78%.

O valor do Coeficiente de Kappa calculado para o método da máxima verossimilhança e para o método das redes de Kohonen foi de 0.69. Assim, através da análise destes índices, observa-se que o método de classificação utilizando as redes de Kohonen, apesar de ser um método não supervisionado, apresentou resultados compatíveis ao método da máxima verossimilhança. Os valores do coeficiente de Kappa permitem considerar a classificação obtida, por meio da proposta de Landis e Koch (1977), como boa para os dois métodos.

4. Conclusões

Os dois métodos propostos alcançaram os mesmos valores dos índices de Exatidão Global e Coeficiente da Kappa.

Por meio do índice exatidão específica foi possível de observar que a rede de Kohonen classificou melhor as classes agricultura e antropizada, enquanto que o outro método classificou melhor as classes CHA. E que ambos obtiveram resultados semelhantes desse índice para as classes água e CAD.

(8)

detecção de áreas com bioma caatinga.

Revisão Bibliográfica

Assad, E.D.; Sano, E.E. Sistema de informações geográficas: aplicações na agricultura. Brasília:

EMBRAPA-SPI/EMBRAPA-CPAC, 1998. 2. ed. 434p.

Fernandes, A.; Bezerra, P. Esquema Fitogeográfico (províncias): província nordestina ou das caatingas. Estudo Fitogeográfico do Brasil. Fortaleza: Stylus comunicações, 1990. 184 p.

Ji, C. Y. Land-Use Classification of Remotely Sensed Data Using Kohonen Self-organizing Feature Map Neural Networks. Photogrammetric Engineering & Remote Sensing. v. 66, n. 12, p. 1451-1460, 2000.

Jianwen, M.; Bagan, H. Land-use classification using ASTER data and self-organized neutral networks.

International Journal of Applied Earth Observation and Geoinformation., v. 7, p.183–188, 2005.

Kohonen, T. Self-organizing formation of topologically correct feature maps. Biological Cybernetics, v. 43, p.

59-69, 1982.

Landis, J.R.; Koch, G.C. The measurement of observer agreement for categorical data. Biometrics, v. 33, n. 1, p.

159-14, 1977.

Moreira, M.A. Fundamentos do sensoriamento remoto e metodologias de aplicação. Viçosa: Ed. UFV, 2005.

3. ed. Atual. Ampl. 320p.

Simon Haykin. Neural Networks – A Comprehensive foundation, Canadá: Ed. Prentice Hall, 1999. 2. Edição.

Todt, V. D.; Formaggio, A. R.; Shimabukuro, Y. Identificação de áreas desflorestadas na Amazônia através de uma rede neural artificial utilizando imagens fração derivadas dos dados do IR-MSS/CBERS11, 2003, Belo Horizonte. Anais... São José dos Campos: INPE, 2003. Artigos, p. xxx –xxxx. CD-ROM, On-line. ISBN 85-17- 00017-X. Disponível em: <http://urlib.net/ltid.inpe.br/sbsr/2002/11.11.09.39>. Acesso em: 02 nov. 2008.

Referências

Documentos relacionados

Assim, através de um questionário (Apêndice I), pretendeu-se estabelecer um perfil dos professores de Matemática regentes de duas turmas do nono ano do Ensino Fundamental

MELO NETO e FROES (1999, p.81) transcreveram a opinião de um empresário sobre responsabilidade social: “Há algumas décadas, na Europa, expandiu-se seu uso para fins.. sociais,

Crisóstomo (2001) apresenta elementos que devem ser considerados em relação a esta decisão. Ao adquirir soluções externas, usualmente, a equipe da empresa ainda tem um árduo

De acordo com o Consed (2011), o cursista deve ter em mente os pressupostos básicos que sustentam a formulação do Progestão, tanto do ponto de vista do gerenciamento

Neste tipo de situações, os valores da propriedade cuisine da classe Restaurant deixam de ser apenas “valores” sem semântica a apresentar (possivelmente) numa caixa

Este trabalho tem como objetivo contribuir para o estudo de espécies de Myrtaceae, com dados de anatomia e desenvolvimento floral, para fins taxonômicos, filogenéticos e

Realizar a manipulação, o armazenamento e o processamento dessa massa enorme de dados utilizando os bancos de dados relacionais se mostrou ineficiente, pois o

O professor orientador da Educação a Distância (EaD) não é um mero executor de tarefas e nem tampouco um instrumentalista das ferramentas tecnológicas, mas, sim, um