Validação da classificação do uso e cobertura da terra mediante visita “in loco” e imagem de VANT1
Kelly Lais Wiggers, Selma Regina Aranha Ribeiro
Departamento de Informática, Universidade Estadual de Ponta Grossa, Paraná, Brasil, kellylaiswiggers@hotmail.com, selmar.aranha@gmail.com
RESUMO
O reconhecimento de objetos na superfície física é importante em diferentes áreas de conhecimento, bem como para diversos fins voltados à agricultura, que, com a integração de técnicas matemáticas e estatísticas, torna possível discriminar feições mediante imagens de sensores remotos. O objetivo da pesquisa é descrever a validação da classificação do uso e cobertura da terra, por meio de análise quantitativa dos dados, a partir de imagem orbital de Sensoriamento Remoto (SR). Os métodos consagrados na literatura de classificação digital utilizam a discretização do mundo real em que o nível de abstração é o pixel. Desde os anos 2000, estudos em Processamento Digital de Imagens (PDI) e SR utilizam do novo paradigma conhecido como Análise de Imagens Baseada a Objetos. A partir da etapa de segmentação do PDI, é possível gerar vetores com descritores espaciais, espectrais e de textura, com a formação de um banco de dados relacional. O número de classes no processo de classificação, devem ser definidas mediante dados advindos de uma verdade terrestre, podendo ser mapas ou documentos. No caso dessa pesquisa, utilizou-se os dados de visita in loco, bem como imagem de Veículo Aéreo Não Tripulado (VANT). O conhecimento a campo foi crucial para seleção das amostras de validação da classificação, e o valor do índice kappa igual a 0.9, com 91% de exatidão global. A imagem de VANT proporcionou validar com base nos objetos, também com resultado excelente, destacando a eficiência dos métodos utilizados no objetivo de estudo.
PALAVRAS-CHAVE: Sensoriamento remoto, classificação digital, GEOBIA, Mapas auto- organizáveis
ABSTRACT
Recognition of objects in the physical surface is important in different areas of knowledge, as well as for various purposes aimed at agriculture, which, in the integration of mathematical
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
1 Este trabalho faz parte de pesquisa integrando a metodologia de Dissertação já apresentada
!
and statistical techniques, makes it possible to discriminate features through remote sensing images. The objective of the research is to describe the validation of the classification of the use and land cover, through quantitative analysis of data from orbital image of Remote Sensing (RS). The methods enshrined in the digital classification of literature, using the discretization of the real world, where the level of abstraction is the pixel. Since the 2000s, studies of Processing Digital Images (PDI) and SR using the new paradigm known as Object Based Image Analysis. From the PDI segmentation step, you can generate vectors with spatial, spectral and texture descriptors, with the formation of a relational database. The number of classes in the classification process, should be defined by data coming from a ground truth and may be maps or documents. In the case of this research, we used data of the on-site visit, as well as image Unmanned Aerial Vehicle (UAV). Knowing the field is crucial for the selection of the classification validation samples, and the value of kappa index of 0.9, with 91% overall accuracy. The UAV image provided validate based on objects, also with excellent results, highlighting the efficiency of the methods used in order to study.
KEYWORDS: Remote Sensing, Digital Classification, GEOBIA, Self-Organizing Maps
INTRODUÇÃO
Os processos de categorização do uso do solo envolvem fatores muitas vezes complexos para realizar a identificação e diferenciação das paisagens, principalmente quando são processos tradicionais, sendo criticados por serem caros, demorados e subjetivos.
Desta forma, uso de sensores facilita a instrumentação dos equipamentos agrícolas, em suas atividades de gerenciamento da cultura, manejo do solo ou mesmo aplicação de insumos de forma adequada. Assim, as imagens de sensores apresentam potencial para estudos da superfície terrestre, marítma, impactos ambientais, dentre outros.
A grande quantidade de imagens que são coletadas por sistemas de sensores, cada vez mais sofisticados, requerem o desenvolvimento de metodologias de classificação digital inovadoras, tornando o processo de mapeamento menos subjetivo e com maior potencial de repetição em outras situações e/ou regiões.
A técnica de Análise de Imagens Baseada em Objetos Geográficos (GEOBIA), segundo Blaschke (2014), realiza o processo de agregação de pixels ou segmentos em regiões mediante análise de textura, cor, tamanho e topologia. Como resultado, possibilita a análise regional da cena e ainda, a geração de banco de dados relacional, que pode ser exportado para um Sistema de Informação Geográfica (SIG), com descritores específicos (espacial, espectral
e de textura), que possuem diferentes escalas e origens, e representam as regiões da imagem.
Para a classificação a nível de objetos, necessita-se buscar novas técnicas que permitam reconhecer os descritores, fato que não é possível nas técnicas convencionais que consideram o pixel como informação básica.
Para classificar os objetos, um método conhecido é a Rede Neural Artificial (RNA) não-supervisionada Self-Organizing Maps (SOM), que tem como princípio a aprendizagem competitiva, simulando processos específicos do cérebro humano para fins de reconhecimento de padrões (HAYKIN, 2001). Este se apresenta pertinente em estudos de classificação com áreas complexas e descritores de diferentes origens e escalas, uma vez que não necessite da análise "a priori" destes descritores.
Na análise dos resultados, o uso de critérios para avaliar e comparar a exatidão da classificação do uso e cobertura da terra é bem descrito por Congalton (1991). Segundo este autor, uma matriz de erro pode ser usada como o ponto de partida para a aplicação de várias técnicas estatísticas descritivas e analíticas. Porém, como a matriz de erro é utilizada em análise de pixel, optou-se também em realizar o teste estatístico F, em que uma imagem de Veículo Aéreo Não Tripulado (VANT) serviu de base para validação dos resultados obtidos na classificação.
Portanto, após a classificação automática, é relevante validar estatisticamente as classes obtidas nesse processo. Nesse contexto, o objetivo deste trabalho é explicitar a validação estatística do uso e cobertura da terra de uma área da Bacia do Pitangui - PR, Brasil classificada mediante GEOBIA e RNA SOM em um recorte de imagem Rapideye.
MATERIAL E MÉTODOS
Neste trabalho, foi utilizada uma imagem Rapideye ortorretificada, disponibilizada pelo curso de Pós-Graduação em Geografia (Mestrado e Doutorado) da Universidade Estadual de Ponta Grossa, obtida em agosto de 2012. Possui as características de resolução espacial de 5 metros, resolução radiométrica de 12 bits, resolução temporal de 1 dia e 5 bandas espectrais (azul (1), verde (2), vermelho (3), red-edge (4) e infravermelho próximo (5)).
A área de estudo está localizada na Bacia Hidrográfica do Pitangui, no estado do Paraná, o qual compreende uma rede de drenagem que segue em direção ao interior do estado (oeste). A Bacia Hidrográfica do Pitangui possui uma área de 927,3 km2, situando-se na porção centro-leste do Estado do Paraná, entre as latitudes 25º46′40” e 25º49′06”S e as longitudes 49º46′40” e 50º17′38”W.
Para eleger a unidade de paisagem deste estudo, foram analisados alguns atributos físicos distintos da região, a fim de determinar e classificar diferentes tipos de cultivos e cobertura da terra. Desta forma, a área de estudo situa-se no norte da cidade de Ponta Grossa, entre as coordenadas médias aproximadas 582.600m E 7.230.800m N à 585.400m E e 7.232.400m N, meridiano 51, totalizando 6.352m2. A área de estudo está ilustrada na Figura 1.
Figura 1 - Localização da área de estudo
Fonte: A autora
Validação a campo
A classificação das áreas de estudo são validadas por Verdade Terrestre (VT). As classes foram obtidas por meio de interpretação visual e conhecimento a campo de algumas regiões para gerar o mapa de referência com pontos de validação. Para compor a VT, foi utilizada verificação "in loco", bem como imagem aérea de VANT modelo eBee, disponibilizada pela empresa Santiago e Cintra, em demonstração do equipamento.
Desta forma, as classes de uso e cobertura da terra analisadas a campo para validação mediante imagem de VANT estão descritas na Figura 2:
Figura 2 - Classes de uso e cobertura da terra utilizadas na validação do VANT.
Fonte: A autora
As classes de uso e cobertura da terra que foram analisadas para validação baseada no pixel, utilizam as classes exibidas nas Figuras 2 e 3.
Figura 3 - Classes de uso e cobertura da terra utilizadas na validação a pixel
Fonte: A autora
Com as imagens de campo, verificou-se que a classe cobertura florestal é determinante no fator textura, visto que há diferentes tipos de vegetação, inclusive a presença de vegetação rasteira ao redor da mata de galeria. Já com as imagens do VANT, foram identificadas na Figura 4a, as classes estradas e corpos d'água, demarcadas em 1 e 2, respectivamente. As demais classes foram identificadas “in loco”, conforme Figura 4b.
Figura 4 - Imagem VANT (a) e horizontal em (b)
Fonte: A autora
Para a etapa de validação, foram seguidas as orientações de Congalton (1991), para número de amostras a serem validadas. A área de interesse tem aproximadamente 6 Km2, foram coletados 20 pontos amostrais de cada classe, conforme Figura 5. Estes pontos foram superpostos à imagem classificada, gerando uma matriz de confusão, bem como análise mediante índice kappa, erros de omissão e inclusão.
O índice kappa, tradicionalmente usado para análise de resultados, é amplamente aceito e adotado pelo SIG e SR. A idéia é construir uma matriz de confusão que resume a categorização entre um conjunto de dados de referência, e o mapa temático a ser avaliado (MARINHO; FASBENDER; KOK, 2012). Estas amostras estão exibidas na Figura 5.
Figura 5 - Pontos coletados para validação a pixel
Fonte: A autora
Na sequência, foi realizado o teste F para duas variâncias, e regiões coletadas para serem verdades de campo na imagem do VANT. A Figura 6, mostra 4 regiões da imagem do VANT, correspondente às classes: Cobertura florestal, corpos d’água, cultivo e estradas.
Nestas classes foram coletadas amostras para o cálculo da área. Esta validação aborda o novo paradigma baseado no objeto (GEOBIA), que foi explorado por Marinho, Fasbender e Kok (2012) e Becker, Ostermann e Pahl (2012).
Figura 6 - Áreas coletadas da imagem VANT para validação
Fonte: A autora
Com a validação baseada no objeto, procura-se verificar possíveis alterações na variabilidade. Nesses casos, o teste é feito com as hipóteses:
• Hipótese nula H0 As regiões da imagem classificada é igual à verdade de campo (imagem do VANT);
• Hipótese alternativa H1: as regiões da imagem classificada são diferentes da verdade de campo (imagem do VANT).
Assim, os resultados serão analisados seguindo estas abordagens de validação.
RESULTADOS E DISCUSSÃO
Para o processo de segmentação mediante GEOBIA, a fim de obter os dados a serem validados a campo, realizaram-se experimentos em busca de valores dos parâmetros que melhor delimitaram os objetos. Assim, encontrou-se o valor de escala 61.7 e fusão de 70, com o intuito de diminuir espúrios dentro de objetos maiores. Este teste representou a melhor delimitação das classes de uso e cobertura da terra, pois com ele, as classes de cultivo ficaram
devidamente separadas, bem como as classes corpos d’água e estradas. O resultado da segmentação pode ser analisado na Figura 7.
Figura 7 - GEOBIA aplicada na área de estudo
Fonte: A autora
Em se tratando de classificação por RNA, foram elaborados mapas com diferentes variações de topologia, tamanho, treinamento, funções de vizinhança e aprendizado, até a obtenção do mapa que fosse considerado adequado para análise de resultados, ou seja, que abordasse todas as classes de interesse identificadas pela fotointerpretação da área de estudo, e definidas a campo.
A partir da classificação não-supervisionada RNA SOM, foi possível analisar os agrupamentos das regiões de interesse na área de estudo. Para tanto, selecionou-se o resultado de configurações da SOM que melhor realizou este processo. A Figura 8 exibe o resultado da classificação mediante as técnicas GEOBIA e RNA SOM, com todas as classes delimitadas na fotointerpretação.
Figura 8 - Resultado da classificação do uso e cobertura da terra
Fonte: A autora
O processo de validação é uma etapa necessária na pesquisa, visto que há necessidade de analisar a acuracidade da imagem classificada, de forma estatística. Assim, a tabela 1 exibe os resultados da matriz de confusão bem como os erros de inclusão e omissão, respectivamente.
Tabela 1 - Matriz de confusão da classificação
Classe Cultivo 1 Corpos d’água
Cultivo 2 Cultivo 3 Cobertura Florestal
Cultivo 4 Estradas e construções
Total
Cultivo 1 Corpos d’água
Cultivo 2 Cultivo 3 Cobertura Florestal
Cultivo 4 Estradas e construções
20 0 0 0 0 0 0
0 17
0 0 3 0 0
0 0 19
1 0 0 0
0 0 0 19
1 0 0
4 0 0 0 16
0 0
0 0 0 0 0 20
0
2 0 0 0 0 1 17
26 17 19 20 20 21 17
Total 20 20 20 20 20 20 20 140
Erros de inclusão (%) 23,07 0 0 5 20 4,76 0
Erros de omissão (%) 0 15 5 5 20 0 15
Fonte: A autora
Verificou-se na matriz de confusão da tabela 1 que uma amostra pertencente ao cultivo 2 foi classificado como cultivo 3. Houve confusão entre as amostras de corpos d’água com cobertura florestal, provavelmente devido a radiância refletida no canal do visível (bandas vermelho, verde e azul), ou mesmo a sombra que a cobertura florestal faz na água, alterando a sua intensidade.
Os cultivos 1 e 4 foram corretamente classificados, então a RNA SOM conseguiu discriminar estas classes. Entre as classes estradas e contruções e o cultivo 1, os erros de inclusão foram de duas amostras, já para cultivo 4 foi uma amostra. Para esta classe a separabilidade das estradas foi adequada somente na PR 151 (estrada principal), porém para os caminhos entre as culturas, i.e, estradas de "chão batido", a confusão espectral ficou evidente na Figura 8. Neste trabalho, o índice kappa foi calculado com resultado em 0.9, considerado excelente pelo valor de referência em Moreira (2011).
Partindo do princípio das hipóteses, realizou-se o teste F nas classes: Estradas e construções, Corpos d’água, Cobertura Florestal e Cultivo, visto que foram estas classes que puderam ser analisadas como verdade de campo na imagem VANT.
Tabela 2 - Teste F - Classes: Estradas e construções, Corpos d’água, Cobertura florestal e Cultivo2 Classe Variância
VANT
Variância Classificada
gl Num
gl Den
F valor-P F crítico
Estradas e construções Corpos d’água Cob. Florestal
Cultivo Todas
44092,96 50987,44 316635,7 104944,6 212192,4
86707,75 216286 129622,4 100156,3 279732,1
1 1 1 1 1
6 6 6 6 6
0,204511 0,029577 0,243652 0,141578 0,101734
0,666993 0,869107 0,639127 0,719663 0,760571
5,987378 5,987378 5,987378 5,987378 5,987378 Fonte: A autora
Nota-se, conforme a tabela 2, que valor de F é menor que F crítico (valor tabelado consultado em Barbetta, Reis e Bornia (2010)) em todas as análises. O valor p é menor que o
!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
2 Cob. = Cobertura, gl = grau de liberdade, Num = numerador, Den = denominador
nível de significância estipulado em 5%. Portanto, conclui-se que, a hipótese H0 é aceita, determinando que todas as áreas (regiões) da análise são iguais à verdade de campo.
Ressalta-se aqui, a importância de realizar dois testes de acuracidade, sendo o primeiro com o nível de abstração no pixel, e o segundo com abordagem baseada no objeto (regiões).
Assim, verificou-se que os resultados foram satisfatórios na abordagem de pixel, com exatidão de 91% verificadas na matriz de confusão. Já para abordagem baseada no objeto, o teste F pareada entre áreas do VANT e áreas de classificação, no nível de significância de 5%, com valor p próximo a 1, e valor de F menor que F crítico, resultando em áreas classificadas conforme o esperado.
CONCLUSÕES
A presente pesquisa realizou a classificação do uso e cobertura da terra mediante técnica de RNA não-supervisionada SOM. Esta classificação foi analisada mediante análises de validação a campo e estatística.
Com a capacidade da GEOBIA em particionar regiões (objetos), foi possível realizar a segmentação da área de estudo, encontrando os valores de escala e fusão que melhor representassem a separação dos mesmos. Assim, obteve-se os descritores espectrais, espaciais e de textura dispostos em um banco de dados relacional. Destaca-se a importância da GEOBIA neste estudo, pois evidencia outros elementos da cena, como textura e formas, além de dados espectrais,.
A abordagem de RNA não-supervisionada SOM pode reduzir significativamente a complexidade da análise, tornando possível a utilização de técnicas que são normalmente consideradas complexas para o PDI de SR. Além disso, o método apresenta outras vantagens, como a integração de dados de diferentes escalas e origens.
O conhecimento a campo auxiliou na seleção das amostras para validação da classificação. Foi possível analisar os resultados mediante matriz de confusão, com nível de abstração no pixel, sendo esta técnica consagrada em análises de classificação de uso e cobertura da terra. O índice kappa auxiliou para descrever e testar o grau de concordância, com valor de 0,90, resultado de qualidade excelente na classificação, destacando a eficiência dos métodos utilizados no objetivo de estudo.
A imagem do VANT, obtida em visita a campo, colaborou na validação dos resultados em abordagem baseada no objeto (regiões). Desta forma, utilizando o teste F para duas variâncias, verificou-se que a hipótese foi aceita, com nível de significância de 5%. Isto demonstra que as áreas classificadas são iguais às áreas do VANT.
Conclui-se que o conhecimento a campo auxiliou na definição das classes de uso e cobertura da terra, sendo relevante para utilização dos métodos no estudo, os quais atingiram os objetivos propostos na pesquisa, visto que os resultados apresentaram eficiência e agilidade na classificação em escala detalhada.
AGRADECIMENTOS
À CAPES pelo apoio financeiro para a pesquisa. À empresa Santiago & Cintra, na pessoa de Leandro Rosso, pela demonstração do VANT, possibilitando a validação dos resultados da pesquisa.
REFERÊNCIAS
BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística para cursos de engenharia e informática. [S.l.]: Editora Atlas, 2010.
BECKER, C.; OSTERMANN, J.; PAHL, M. Automatic quality assessment of gis data base an object coherence. In: Procedings of the 4th GEOBIA. Rio de Janeiro: [s.n.], 2012.
BLASCHKE, T.; HAY, G. J.; KELLY, M.; LANG, S.; HOFMANN, P.; ADDINK, E.;
FEITOSA, R. Q.; MEER, F. V.; WERFF, H. J.; COILLIE, F. V.; TIEDE, D. Geographic Object-Based Image Analysis – Towards a new paradigm. ISPRS Journal of Photogrammetry and Remote Sensing, v. 87, p. 180-191, 2014.
CONGALTON, R. A review of assessing the accuracy of classifications of remotely sensed data. Remote Sensing of Environment, v. 49, n. 12, p. 1671–1678, 1991.
HAYKIN, S. Redes Neurais: princípios e prática. 2. ed. Porto Alegre: Bookman, 2001.
MARINHO, E.; FASBENDER, D.; KOK, R. D. Spatial assessment of categorical maps aproposed framework. In: Procedings of the 4th GEOBIA. Rio de Janeiro: [s.n.], 2012.
MOREIRA, M. A. Fundamentos do Sensoriamento e Metodologia de Aplicação. Viçosa, ED UFV, 3 ed. 2011.