Validação da classificação do uso e cobertura da terra mediante visita in loco e imagem de VANT 1

(1)

Validação da classificação do uso e cobertura da terra mediante visita “in loco” e imagem de VANT¹

Kelly Lais Wiggers, Selma Regina Aranha Ribeiro

Departamento de Informática, Universidade Estadual de Ponta Grossa, Paraná, Brasil, kellylaiswiggers@hotmail.com, selmar.aranha@gmail.com

RESUMO

O reconhecimento de objetos na superfície física é importante em diferentes áreas de conhecimento, bem como para diversos fins voltados à agricultura, que, com a integração de técnicas matemáticas e estatísticas, torna possível discriminar feições mediante imagens de sensores remotos. O objetivo da pesquisa é descrever a validação da classificação do uso e cobertura da terra, por meio de análise quantitativa dos dados, a partir de imagem orbital de Sensoriamento Remoto (SR). Os métodos consagrados na literatura de classificação digital utilizam a discretização do mundo real em que o nível de abstração é o pixel. Desde os anos 2000, estudos em Processamento Digital de Imagens (PDI) e SR utilizam do novo paradigma conhecido como Análise de Imagens Baseada a Objetos. A partir da etapa de segmentação do PDI, é possível gerar vetores com descritores espaciais, espectrais e de textura, com a formação de um banco de dados relacional. O número de classes no processo de classificação, devem ser definidas mediante dados advindos de uma verdade terrestre, podendo ser mapas ou documentos. No caso dessa pesquisa, utilizou-se os dados de visita in loco, bem como imagem de Veículo Aéreo Não Tripulado (VANT). O conhecimento a campo foi crucial para seleção das amostras de validação da classificação, e o valor do índice kappa igual a 0.9, com 91% de exatidão global. A imagem de VANT proporcionou validar com base nos objetos, também com resultado excelente, destacando a eficiência dos métodos utilizados no objetivo de estudo.

PALAVRAS-CHAVE: Sensoriamento remoto, classificação digital, GEOBIA, Mapas auto- organizáveis

ABSTRACT

Recognition of objects in the physical surface is important in different areas of knowledge, as well as for various purposes aimed at agriculture, which, in the integration of mathematical

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

1 Este trabalho faz parte de pesquisa integrando a metodologia de Dissertação já apresentada

!

(2)

and statistical techniques, makes it possible to discriminate features through remote sensing images. The objective of the research is to describe the validation of the classification of the use and land cover, through quantitative analysis of data from orbital image of Remote Sensing (RS). The methods enshrined in the digital classification of literature, using the discretization of the real world, where the level of abstraction is the pixel. Since the 2000s, studies of Processing Digital Images (PDI) and SR using the new paradigm known as Object Based Image Analysis. From the PDI segmentation step, you can generate vectors with spatial, spectral and texture descriptors, with the formation of a relational database. The number of classes in the classification process, should be defined by data coming from a ground truth and may be maps or documents. In the case of this research, we used data of the on-site visit, as well as image Unmanned Aerial Vehicle (UAV). Knowing the field is crucial for the selection of the classification validation samples, and the value of kappa index of 0.9, with 91% overall accuracy. The UAV image provided validate based on objects, also with excellent results, highlighting the efficiency of the methods used in order to study.

KEYWORDS: Remote Sensing, Digital Classification, GEOBIA, Self-Organizing Maps

INTRODUÇÃO

Os processos de categorização do uso do solo envolvem fatores muitas vezes complexos para realizar a identificação e diferenciação das paisagens, principalmente quando são processos tradicionais, sendo criticados por serem caros, demorados e subjetivos.

Desta forma, uso de sensores facilita a instrumentação dos equipamentos agrícolas, em suas atividades de gerenciamento da cultura, manejo do solo ou mesmo aplicação de insumos de forma adequada. Assim, as imagens de sensores apresentam potencial para estudos da superfície terrestre, marítma, impactos ambientais, dentre outros.

A grande quantidade de imagens que são coletadas por sistemas de sensores, cada vez mais sofisticados, requerem o desenvolvimento de metodologias de classificação digital inovadoras, tornando o processo de mapeamento menos subjetivo e com maior potencial de repetição em outras situações e/ou regiões.

A técnica de Análise de Imagens Baseada em Objetos Geográficos (GEOBIA), segundo Blaschke (2014), realiza o processo de agregação de pixels ou segmentos em regiões mediante análise de textura, cor, tamanho e topologia. Como resultado, possibilita a análise regional da cena e ainda, a geração de banco de dados relacional, que pode ser exportado para um Sistema de Informação Geográfica (SIG), com descritores específicos (espacial, espectral

(3)

e de textura), que possuem diferentes escalas e origens, e representam as regiões da imagem.

Para a classificação a nível de objetos, necessita-se buscar novas técnicas que permitam reconhecer os descritores, fato que não é possível nas técnicas convencionais que consideram o pixel como informação básica.

Para classificar os objetos, um método conhecido é a Rede Neural Artificial (RNA) não-supervisionada Self-Organizing Maps (SOM), que tem como princípio a aprendizagem competitiva, simulando processos específicos do cérebro humano para fins de reconhecimento de padrões (HAYKIN, 2001). Este se apresenta pertinente em estudos de classificação com áreas complexas e descritores de diferentes origens e escalas, uma vez que não necessite da análise "a priori" destes descritores.

Na análise dos resultados, o uso de critérios para avaliar e comparar a exatidão da classificação do uso e cobertura da terra é bem descrito por Congalton (1991). Segundo este autor, uma matriz de erro pode ser usada como o ponto de partida para a aplicação de várias técnicas estatísticas descritivas e analíticas. Porém, como a matriz de erro é utilizada em análise de pixel, optou-se também em realizar o teste estatístico F, em que uma imagem de Veículo Aéreo Não Tripulado (VANT) serviu de base para validação dos resultados obtidos na classificação.

Portanto, após a classificação automática, é relevante validar estatisticamente as classes obtidas nesse processo. Nesse contexto, o objetivo deste trabalho é explicitar a validação estatística do uso e cobertura da terra de uma área da Bacia do Pitangui - PR, Brasil classificada mediante GEOBIA e RNA SOM em um recorte de imagem Rapideye.

MATERIAL E MÉTODOS

Neste trabalho, foi utilizada uma imagem Rapideye ortorretificada, disponibilizada pelo curso de Pós-Graduação em Geografia (Mestrado e Doutorado) da Universidade Estadual de Ponta Grossa, obtida em agosto de 2012. Possui as características de resolução espacial de 5 metros, resolução radiométrica de 12 bits, resolução temporal de 1 dia e 5 bandas espectrais (azul (1), verde (2), vermelho (3), red-edge (4) e infravermelho próximo (5)).

A área de estudo está localizada na Bacia Hidrográfica do Pitangui, no estado do Paraná, o qual compreende uma rede de drenagem que segue em direção ao interior do estado (oeste). A Bacia Hidrográfica do Pitangui possui uma área de 927,3 km², situando-se na porção centro-leste do Estado do Paraná, entre as latitudes 25º46′40” e 25º49′06”S e as longitudes 49º46′40” e 50º17′38”W.

(4)

Para eleger a unidade de paisagem deste estudo, foram analisados alguns atributos físicos distintos da região, a fim de determinar e classificar diferentes tipos de cultivos e cobertura da terra. Desta forma, a área de estudo situa-se no norte da cidade de Ponta Grossa, entre as coordenadas médias aproximadas 582.600m E 7.230.800m N à 585.400m E e 7.232.400m N, meridiano 51, totalizando 6.352m². A área de estudo está ilustrada na Figura 1.

Figura 1 - Localização da área de estudo

Fonte: A autora

Validação a campo

A classificação das áreas de estudo são validadas por Verdade Terrestre (VT). As classes foram obtidas por meio de interpretação visual e conhecimento a campo de algumas regiões para gerar o mapa de referência com pontos de validação. Para compor a VT, foi utilizada verificação "in loco", bem como imagem aérea de VANT modelo eBee, disponibilizada pela empresa Santiago e Cintra, em demonstração do equipamento.

Desta forma, as classes de uso e cobertura da terra analisadas a campo para validação mediante imagem de VANT estão descritas na Figura 2:

Figura 2 - Classes de uso e cobertura da terra utilizadas na validação do VANT.

Fonte: A autora

As classes de uso e cobertura da terra que foram analisadas para validação baseada no pixel, utilizam as classes exibidas nas Figuras 2 e 3.

(5)

Figura 3 - Classes de uso e cobertura da terra utilizadas na validação a pixel

Fonte: A autora

Com as imagens de campo, verificou-se que a classe cobertura florestal é determinante no fator textura, visto que há diferentes tipos de vegetação, inclusive a presença de vegetação rasteira ao redor da mata de galeria. Já com as imagens do VANT, foram identificadas na Figura 4a, as classes estradas e corpos d'água, demarcadas em 1 e 2, respectivamente. As demais classes foram identificadas “in loco”, conforme Figura 4b.

Figura 4 - Imagem VANT (a) e horizontal em (b)

Fonte: A autora

Para a etapa de validação, foram seguidas as orientações de Congalton (1991), para número de amostras a serem validadas. A área de interesse tem aproximadamente 6 Km², foram coletados 20 pontos amostrais de cada classe, conforme Figura 5. Estes pontos foram superpostos à imagem classificada, gerando uma matriz de confusão, bem como análise mediante índice kappa, erros de omissão e inclusão.

O índice kappa, tradicionalmente usado para análise de resultados, é amplamente aceito e adotado pelo SIG e SR. A idéia é construir uma matriz de confusão que resume a categorização entre um conjunto de dados de referência, e o mapa temático a ser avaliado (MARINHO; FASBENDER; KOK, 2012). Estas amostras estão exibidas na Figura 5.

Figura 5 - Pontos coletados para validação a pixel

(6)

Fonte: A autora

Na sequência, foi realizado o teste F para duas variâncias, e regiões coletadas para serem verdades de campo na imagem do VANT. A Figura 6, mostra 4 regiões da imagem do VANT, correspondente às classes: Cobertura florestal, corpos d’água, cultivo e estradas.

Nestas classes foram coletadas amostras para o cálculo da área. Esta validação aborda o novo paradigma baseado no objeto (GEOBIA), que foi explorado por Marinho, Fasbender e Kok (2012) e Becker, Ostermann e Pahl (2012).

Figura 6 - Áreas coletadas da imagem VANT para validação

Fonte: A autora

Com a validação baseada no objeto, procura-se verificar possíveis alterações na variabilidade. Nesses casos, o teste é feito com as hipóteses:

• Hipótese nula H0 As regiões da imagem classificada é igual à verdade de campo (imagem do VANT);

• Hipótese alternativa H1: as regiões da imagem classificada são diferentes da verdade de campo (imagem do VANT).

Assim, os resultados serão analisados seguindo estas abordagens de validação.

RESULTADOS E DISCUSSÃO

Para o processo de segmentação mediante GEOBIA, a fim de obter os dados a serem validados a campo, realizaram-se experimentos em busca de valores dos parâmetros que melhor delimitaram os objetos. Assim, encontrou-se o valor de escala 61.7 e fusão de 70, com o intuito de diminuir espúrios dentro de objetos maiores. Este teste representou a melhor delimitação das classes de uso e cobertura da terra, pois com ele, as classes de cultivo ficaram

(7)

devidamente separadas, bem como as classes corpos d’água e estradas. O resultado da segmentação pode ser analisado na Figura 7.

Figura 7 - GEOBIA aplicada na área de estudo

Fonte: A autora

Em se tratando de classificação por RNA, foram elaborados mapas com diferentes variações de topologia, tamanho, treinamento, funções de vizinhança e aprendizado, até a obtenção do mapa que fosse considerado adequado para análise de resultados, ou seja, que abordasse todas as classes de interesse identificadas pela fotointerpretação da área de estudo, e definidas a campo.

A partir da classificação não-supervisionada RNA SOM, foi possível analisar os agrupamentos das regiões de interesse na área de estudo. Para tanto, selecionou-se o resultado de configurações da SOM que melhor realizou este processo. A Figura 8 exibe o resultado da classificação mediante as técnicas GEOBIA e RNA SOM, com todas as classes delimitadas na fotointerpretação.

Figura 8 - Resultado da classificação do uso e cobertura da terra

Fonte: A autora

O processo de validação é uma etapa necessária na pesquisa, visto que há necessidade de analisar a acuracidade da imagem classificada, de forma estatística. Assim, a tabela 1 exibe os resultados da matriz de confusão bem como os erros de inclusão e omissão, respectivamente.

(8)

Tabela 1 - Matriz de confusão da classificação

Classe Cultivo 1 Corpos d’água

Cultivo 2 Cultivo 3 Cobertura Florestal

Cultivo 4 Estradas e construções

Total

Cultivo 1 Corpos d’água

Cultivo 2 Cultivo 3 Cobertura Florestal

Cultivo 4 Estradas e construções

20 0 0 0 0 0 0

0 17

0 0 3 0 0

0 0 19

1 0 0 0

0 0 0 19

1 0 0

4 0 0 0 16

0 0

0 0 0 0 0 20

0

2 0 0 0 0 1 17

26 17 19 20 20 21 17

Total 20 20 20 20 20 20 20 140

Erros de inclusão (%) 23,07 0 0 5 20 4,76 0

Erros de omissão (%) 0 15 5 5 20 0 15

Fonte: A autora

Verificou-se na matriz de confusão da tabela 1 que uma amostra pertencente ao cultivo 2 foi classificado como cultivo 3. Houve confusão entre as amostras de corpos d’água com cobertura florestal, provavelmente devido a radiância refletida no canal do visível (bandas vermelho, verde e azul), ou mesmo a sombra que a cobertura florestal faz na água, alterando a sua intensidade.

Os cultivos 1 e 4 foram corretamente classificados, então a RNA SOM conseguiu discriminar estas classes. Entre as classes estradas e contruções e o cultivo 1, os erros de inclusão foram de duas amostras, já para cultivo 4 foi uma amostra. Para esta classe a separabilidade das estradas foi adequada somente na PR 151 (estrada principal), porém para os caminhos entre as culturas, i.e, estradas de "chão batido", a confusão espectral ficou evidente na Figura 8. Neste trabalho, o índice kappa foi calculado com resultado em 0.9, considerado excelente pelo valor de referência em Moreira (2011).

Partindo do princípio das hipóteses, realizou-se o teste F nas classes: Estradas e construções, Corpos d’água, Cobertura Florestal e Cultivo, visto que foram estas classes que puderam ser analisadas como verdade de campo na imagem VANT.

Tabela 2 - Teste F - Classes: Estradas e construções, Corpos d’água, Cobertura florestal e Cultivo² Classe Variância

VANT

Variância Classificada

gl Num

gl Den

F valor-P F crítico

Estradas e construções Corpos d’água Cob. Florestal

Cultivo Todas

44092,96 50987,44 316635,7 104944,6 212192,4

86707,75 216286 129622,4 100156,3 279732,1

1 1 1 1 1

6 6 6 6 6

0,204511 0,029577 0,243652 0,141578 0,101734

0,666993 0,869107 0,639127 0,719663 0,760571

5,987378 5,987378 5,987378 5,987378 5,987378 Fonte: A autora

Nota-se, conforme a tabela 2, que valor de F é menor que F crítico (valor tabelado consultado em Barbetta, Reis e Bornia (2010)) em todas as análises. O valor p é menor que o

!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

2 Cob. = Cobertura, gl = grau de liberdade, Num = numerador, Den = denominador

(9)

nível de significância estipulado em 5%. Portanto, conclui-se que, a hipótese H0 é aceita, determinando que todas as áreas (regiões) da análise são iguais à verdade de campo.

Ressalta-se aqui, a importância de realizar dois testes de acuracidade, sendo o primeiro com o nível de abstração no pixel, e o segundo com abordagem baseada no objeto (regiões).

Assim, verificou-se que os resultados foram satisfatórios na abordagem de pixel, com exatidão de 91% verificadas na matriz de confusão. Já para abordagem baseada no objeto, o teste F pareada entre áreas do VANT e áreas de classificação, no nível de significância de 5%, com valor p próximo a 1, e valor de F menor que F crítico, resultando em áreas classificadas conforme o esperado.

CONCLUSÕES

A presente pesquisa realizou a classificação do uso e cobertura da terra mediante técnica de RNA não-supervisionada SOM. Esta classificação foi analisada mediante análises de validação a campo e estatística.

Com a capacidade da GEOBIA em particionar regiões (objetos), foi possível realizar a segmentação da área de estudo, encontrando os valores de escala e fusão que melhor representassem a separação dos mesmos. Assim, obteve-se os descritores espectrais, espaciais e de textura dispostos em um banco de dados relacional. Destaca-se a importância da GEOBIA neste estudo, pois evidencia outros elementos da cena, como textura e formas, além de dados espectrais,.

A abordagem de RNA não-supervisionada SOM pode reduzir significativamente a complexidade da análise, tornando possível a utilização de técnicas que são normalmente consideradas complexas para o PDI de SR. Além disso, o método apresenta outras vantagens, como a integração de dados de diferentes escalas e origens.

O conhecimento a campo auxiliou na seleção das amostras para validação da classificação. Foi possível analisar os resultados mediante matriz de confusão, com nível de abstração no pixel, sendo esta técnica consagrada em análises de classificação de uso e cobertura da terra. O índice kappa auxiliou para descrever e testar o grau de concordância, com valor de 0,90, resultado de qualidade excelente na classificação, destacando a eficiência dos métodos utilizados no objetivo de estudo.

A imagem do VANT, obtida em visita a campo, colaborou na validação dos resultados em abordagem baseada no objeto (regiões). Desta forma, utilizando o teste F para duas variâncias, verificou-se que a hipótese foi aceita, com nível de significância de 5%. Isto demonstra que as áreas classificadas são iguais às áreas do VANT.

(10)

Conclui-se que o conhecimento a campo auxiliou na definição das classes de uso e cobertura da terra, sendo relevante para utilização dos métodos no estudo, os quais atingiram os objetivos propostos na pesquisa, visto que os resultados apresentaram eficiência e agilidade na classificação em escala detalhada.

AGRADECIMENTOS

À CAPES pelo apoio financeiro para a pesquisa. À empresa Santiago & Cintra, na pessoa de Leandro Rosso, pela demonstração do VANT, possibilitando a validação dos resultados da pesquisa.

REFERÊNCIAS

BARBETTA, P. A.; REIS, M. M.; BORNIA, A. C. Estatística para cursos de engenharia e informática. [S.l.]: Editora Atlas, 2010.

BECKER, C.; OSTERMANN, J.; PAHL, M. Automatic quality assessment of gis data base an object coherence. In: Procedings of the 4th GEOBIA. Rio de Janeiro: [s.n.], 2012.

BLASCHKE, T.; HAY, G. J.; KELLY, M.; LANG, S.; HOFMANN, P.; ADDINK, E.;

FEITOSA, R. Q.; MEER, F. V.; WERFF, H. J.; COILLIE, F. V.; TIEDE, D. Geographic Object-Based Image Analysis – Towards a new paradigm. ISPRS Journal of Photogrammetry and Remote Sensing, v. 87, p. 180-191, 2014.

CONGALTON, R. A review of assessing the accuracy of classifications of remotely sensed data. Remote Sensing of Environment, v. 49, n. 12, p. 1671–1678, 1991.

HAYKIN, S. Redes Neurais: princípios e prática. 2. ed. Porto Alegre: Bookman, 2001.

MARINHO, E.; FASBENDER, D.; KOK, R. D. Spatial assessment of categorical maps aproposed framework. In: Procedings of the 4th GEOBIA. Rio de Janeiro: [s.n.], 2012.

MOREIRA, M. A. Fundamentos do Sensoriamento e Metodologia de Aplicação. Viçosa, ED UFV, 3 ed. 2011.