Transformação por Principais Componentes - SENSORIAMENTO REMOTO: FUNDAMENTOS E PRINCÍPIOS

A natureza do formato das imagens multiespectrais possibilita representar os valores de brilho dos pixels por suas posições dentro de um espaço vetorial, com quantos eixos ou

Introdução ao Processamento de Imagens de Sensoriameto Remoto 156 dimensões forem as bandas espectrais. Isso foi visto na representação de cor das composições coloridas, por meio do espaço cúbico das três cores RGB, e que consistia, simplesmente, plotar os valores de brilho dos pixels de cada uma das três bandas, em um sistema ortogonal de coordenadas, no espaço tridimensional. O mesmo pode ser realizado para o espaço n- dimensional, com qualquer número de bandas que um sensor possua. No contexto da transformação por principais componentes, o objetivo da representação do espaço vetorial n- dimensional é determinar o nível de correlação que pode haver entre n bandas e calcular o grau de informação ou variância que os dados apresentam, a fim de determinar os coeficientes que transformam as imagens em novos componentes. Para facilitar o entendimento matemático e geométrico, a discussão que segue se limitará ao espaço de duas dimensões, pelo fato de que dimensões maiores só podem ser algebricamente representadas.

Considere um espaço de duas variáveis x e y com um grande número de pixels plotados neste espaço, como na Figura 10.2a. Cada pixel pode ser descrito por seu vetor x, enquanto, o vetor média m define a média das posições dos pixels neste espaço. Se os valores dos pixels são bastante correlacionáveis, medidas simultâneas de x e y traçam uma linha reta definida pelo eixo AB na Figura 10.2b. Se x e y não são perfeitamente correlacionáveis, os pixels são delimitados pelo espaço de uma elipse, com seus dois eixos com dimensões, significativamente, diferentes (Figura 10.2c). Haverá uma direção predominante (AB) de variabilidade que tem um eixo maior em relação a um segundo pequeno eixo traçado ortogonalmente (CD), que mostra ter baixa variabilidade. Se este eixo CD contém uma pequena proporção do total da variabilidade dos dados, ele pode ser ignorado sem acarretar muita perda da informação. Isso significa uma diminuição na dimensão dos dados de dois para um. Dessa maneira, ao se representar a distribuição dos pixels na forma de uma elipse, percebe-se que os eixos AB e CD revelam, mais apropriadamente, a estrutura interna que está presente nos dados das imagens, do que os eixos x e y separados. Para confirmar essa afirmativa, observe na Figura 10.2a, que as variâncias das variáveis x e y, que são medidas pelo espalhamento dos pontos na direção paralela aos eixos x e y, são aproximadamente iguais.

Fig. 10.2 Espaço bidimensional da representação dos dados mostrando: a) o vetor x_idos pixels e o vetor média m; b) a alta correlação dos dados com a variabilidade em um único eixo AB; c) a correlação positiva com os eixos AB e CD medindo a variabilidade dos dados.

Segundo Mather (1987), o exemplo da Figura 10.2 mostra que há uma distinção importante a ser vista entre o número de variáveis (bandas) e a dimensionalidade do conjunto de dados. Na Figura 10.2b, o número de variáveis é dois, mas a dimensionalidade é um. Na Figura 10.2c, a dimensionalidade dos dados é efetivamente um, embora o número de variáveis observadas seja de fato dois. O uso de um único eixo AB substitui os eixos separados x e y, com a vantagem de reduzir a dimensionalidade dos dados e, adicionalmente,

x x y

+ m x₂

x y

a b c

Introdução ao Processamento de Imagens de Sensoriameto Remoto 157 a informação transmitida pelo eixo AB é maior do que a informação transmitida pelos dois eixos separados. Normalmente, imagens multiespectrais têm uma dimensionalidade que é menor do que o número de bandas espectrais. A transformação por principais componentes atua neste sentido, de reduzir o conjunto de dados, preservando a informação existente e, com isso, minimizar o esforço de análise de um grande número de variáveis, no caso de sensoriamento remoto, de um grande número de bandas.

A forma da elipse, como meio para descrever o espalhamento dos pixels no espaço n- dimensional, é definida pela matriz de covariância calculada para as n bandas espectrais. Por definição, matriz de covariância é uma matriz simétrica, que mede como duas ou n variáveis variam conjuntamente, e seus valores são sempre positivos. A covariância é por vezes chamada de medida de dependência linear entre duas ou n variáveis aleatórias. Calculando-se o vetor média e a matriz de covariância, determinam-se a localização e a forma do espalhamento dos pontos no espaço n-dimensional e se conhece os valores numéricos da correlação existente entre o conjunto de bandas analisadas.

A matriz de covariância é um dos mais importantes recursos matemáticos usados no processamento de imagens multiespectrais e os valores da matriz enfatizam propriedades do conjunto das bandas analisadas. Mas, há uma controvérsia em se usar a matriz de covariância ao invés da matriz de coeficientes de correlação para transformações de bandas. Se a matriz de covariância for usada para definir a forma da elipse que encerra os pontos numa direção particular, as medidas de cada variável devem ser comparáveis. E isso não é o que de fato acontece quando se compara os valores digitais entre bandas diferentes. Um número digital de valor 52 numa dada banda representa um valor de radiância que não é, fisicamente, o mesmo valor de radiância para o número 52 em outra banda. Simplesmente, porque os detectores de cada banda possuem valores específicos de ganhos e offset para efeitos de calibração. Sendo assim, são variáveis não totalmente comparáveis. Pode-se verificar isso na Figura 10.3, que é um extrato de pixels de duas bandas em diferentes comprimentos de onda, da mesma área. Na imagem à esquerda o pixel situado na coluna 1, linha 2, tem ND=52. Esse mesmo valor digital é encontrado na imagem à direita na posição coluna 1, linha 4. Observe a diferença dos tons de cinza nas duas imagens para o mesmo valor digital 52. Nessa situação é que a matriz de coeficientes de correlação é melhor para medir o grau de correlação entre bandas espectrais. Os coeficientes de correlação são, simplesmente, a covariância medida para variáveis padronizadas (Mather, 1987), e são encontrados na matriz, nos elementos fora da diagonal.

Fig. 10.3 Imagens de duas diferentes bandas contendo pixels de igual valor digital, mas que exibem valores de brilho diferentes. O pixel com contorno tracejado tem valor 52 nas duas bandas.

Como vem sendo destacado, a experiência nos mostra que qualquer sensor multiespectral possui algumas bandas com alta correlação, de modo que os eixos de suas

banda 1 banda 2

Introdução ao Processamento de Imagens de Sensoriameto Remoto 158 funções de densidade de probabilidade (FDP), não são estatisticamente ortogonais, isso é, as variáveis nos eixos não são independentes. A técnica principais componentes envolve uma rotação (e uma translação) num hipotético espaço de atributos do sistema de coordenadas da função de densidade de probabilidade, produzindo novas variáveis conhecidas como principais componentes, ou eixos, que são combinações lineares das variáveis originais (bandas originais). A rotação das coordenadas dos eixos originais é um esforço para ortogonalizar os novos eixos PC, fazendo-os coincidirem ao máximo com as direções de distribuição dos dados, ou suas variâncias.

Numa representação hipotética, considere a distribuição no espaço bidimensional dos valores de brilho dos pixels de duas bandas (Figura 10.4). Os pontos representam o espaço de distribuição dos pixels, que nas duas bandas originais ostentam quase que as mesmas características espectrais (alta correlação). Na transformação por principais componentes, isso é, no novo sistema de eixos ou componentes ortogonais rotacionados, os pixels apresentam no primeiro componente (PC1) ou primeiro eixo principal, maior variância, enquanto, que no segundo componente (PC2) a variância é menor. Desde que se assume que a variância é uma medida do conteúdo de informação da imagem, o primeiro componente ou primeiro eixo agrega uma maior quantidade de informação espectral, produzindo uma imagem com maior detalhe de informação. Nesse novo espaço de eixos rotacionados o primeiro componente não tem correlação com o segundo componente. Situações similares podem ser imaginadas em espaços de n dimensões, ou n bandas, sabendo-se, contudo, que todo o processo de transformação da imagem é realizado numa concepção puramente matemática.

Fig. 10.4 Rotação espectral dos eixos originais com alta correlação, para novos eixos PC descorrelacionados.

Em síntese, no processamento das imagens por principais componentes, o objetivo principal é definir o número de dimensões que estão presentes no conjunto de dados e fixar os coeficientes que especificam as posições dos eixos que apontem nas direções das mais altas variabilidades dos dados. Portanto, eliminar a alta correlação das imagens tem a vantagem de reduzir o volume de dados a ser analisado e de redistribuir a informação espectral entre os novos principais componentes.

O cálculo da transformação por principais componentes é extenso e de relativa complexidade. No livro Statistic and Data Analysis in Geology, de Davis (2002), o leitor encontrará a base do desenvolvimento estatístico, com exemplos de aplicações a variáveis geológicas. Um exemplo prático é mostrado a seguir, com as seis bandas ETM da faixa óptica do espectro. Primeiro, foram computadas as matrizes de correlação das seis bandas, mas, cabe ao usuário decidir se todas as bandas ou apenas uma parte delas será utilizada para

ND1

ND2

PC₁ PC₂

Introdução ao Processamento de Imagens de Sensoriameto Remoto 159 os cálculos dos componentes. Ambas as matrizes são simétricas, e por isso é desnecessário repetir os mesmos valores acima da diagonal. A Tabela 10.1 é a matriz dos coeficientes de correlação computada para as seis bandas. Os coeficientes variam de -1 a +1. Os altos valores positivos indicam que se tem uma correlação positiva alta entre as bandas e a correlação diminui quando o coeficiente se aproxima de zero. O sinal negativo indica que há correlação inversa entre as bandas, ou seja, quando um pixel tem um alto valor digital numa banda, na outra banda ele tem um baixo valor. Coeficientes negativos ocorrem devido à presença de vegetação, que na banda 4 do infravermelho próximo têm altos valores de brilho, enquanto, nas outras cinco bandas, os valores são baixos. A Tabela 10.2 é a matriz de covariância cujos valores medem quanto as bandas variam conjuntamente. É também, chamada de matriz de variância-covariância porque a diagonal é a medida da variância de cada banda. Note neste exemplo que a banda 5 é a banda que tem a maior variância, ou seja, a banda que contem maior informação e maior contraste espectral.

Tabela 10.1 Matriz de coeficientes de correlação computada de seis bandas do sensor ETM

Correlação Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 7 Banda 1 1,0

Banda 2 0,918 1,0

Banda 3 0,935 0,953 1,0

Banda 4 -0,430 -0,558 -0,418 1,0

Banda 5 0,876 0,861 0,893 0,457 1,0

Banda 7 0,881 0,851 0,906 0,332 0,965 1,0

Tabela 10.2 Matriz de covariância das mesmas bandas da Tabela 10.1

Covariância Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 7 Banda 1 20,408

Banda 2 15,747 14,411

Banda 3 32,681 27,963 59,751

Banda 4 17,661 19,231 29,357 82,474

Banda 5 78,381 64,667 136,773 82,191 392,147

Banda 7 37,743 30,633 66,452 28,639 181,325 90,045

O primeiro passo na transformação principais componentes consiste num cálculo algébrico linear que altera a matriz de coeficientes, determinando um conjunto de quantidades denominado de autovalores (eigenvalues). Os autovalores são medidos em termos de unidade de variância, na diagonal da matriz da Tabela 10.3. Por convenção, eles são arranjados em ordem decrescente de variância. A variância total das imagens componentes mantém a mesma das imagens originais, só que a maior variância agora está localizada no primeiro componente, com valores sucessivamente menores para os componentes de ordem maior. Como a variância é uma das medidas da quantidade de informação presente numa imagem, os autovalores representam o tamanho dos eixos principais do elipsóide de seis eixos. Fora da diagonal os valores zero indicam não haver qualquer correlação entre os componentes. O número de principais componentes sempre será igual ao número de bandas originais.

Introdução ao Processamento de Imagens de Sensoriameto Remoto 160

Tabela 10.3 Matriz de autovalores (eigenvalues) calculados pela transformação dos coeficientes de correlação.

Componentes PC1 PC2 PC3 PC4 PC5 PC6

PC1 572,816

PC2 0 65,961

PC3 0 0 14,670

PC4 0 0 0 3,174

PC5 0 0 0 0 1,916

PC6 0 0 0 0 0 0,699

Para facilitar a percepção do impacto dessa transformação, pode-se apresentar os autovalores, isso é, as variâncias, em porcentagens. Para se calcular a porcentagem de variância de cada imagem principal componente, basta dividir a variância total dos seis componentes pela variância de cada componente. Seus valores estão mostrados na Tabela 10.4.

Tabela 10.4 Autovalores em porcentagens

Componentes PC1 PC2 PC3 PC4 PC5 PC6

% variância 86,891 10,005 2,225 0,481 0,291 1,107

% variância acumulada

86,891 96,896 99,121 99,602 99,893 100

Observe que os três primeiros componentes somam 99,121%, o que se pode dizer que é praticamente a variância total do conjunto das seis bandas originais. O restante da variância, que é menor que 1%, seria muito pouco significativo em termos de conteúdo de informação. Normalmente, considera-se que a partir do quarto componente as imagens contêm apenas ruídos e podem ser desprezadas. Em outras palavras, separa-se a variância não aleatória (conteúdo de informação), da variância aleatória (ruído), enquanto, simultaneamente, qualquer redundância entre as bandas é eliminada. Como resultado prático os três primeiros componentes, que contêm 99,121% da variância total original, podem ser combinados em uma única composição colorida RGB. Por essa razão, a transformação por principais componentes é uma forma de reduzir a dimensão dos dados originais, diminuindo a obrigação de se analisar um grande número de variáveis. Mas, antes que esse processo possa ser concluído, uma segunda operação é processada. Associados à cada autovalor existe um conjunto de coordenadas que define as direções dos eixos dos principais componentes. São chamados de autovetores (eigenvectors). A Tabela 10.5 apresenta os autovetores computados.

Tabela 10.5 Matriz de autovetores derivados da matriz de coeficientes de correlação.

Componentes Banda 1 Banda 2 Banda 3 Banda 4 Banda 5 Banda 7

PC1 0,171 0,143 0,299 0,190 0,823 0,384

PC2 -0,012 0,061 -0,045 0,967 -0,116 -0,213

PC3 0,377 0,359 0,736 -0,023 -0,429 0,056

PC4 0,135 0,072 0,167 -0,150 0,351 -0,896

PC5 0,892 -0,064 -0,445 -0,001 -0,028 0,035

PC6 0,121 -0,915 0,376 0,073 -0,018 -0,005

Introdução ao Processamento de Imagens de Sensoriameto Remoto 161 Os coeficientes da matriz de autovetores são interpretados como as direções cosenos dos novos eixos em relação aos eixos originais, apontando na direção de qual é a contribuição ou peso das bandas originais na formação de cada principal componente. De uma maneira bem simples, pode-se dizer que a banda original que mais contribui para a formação de um principal componente é a que tem na matriz de autovetores o valor absoluto maior. Na Tabela 10.5 o primeiro componente tem uma contribuição muito maior da banda 5. Como consequência, a imagem da PC1 será muito semelhante, na aparência, com a banda 5 original.

A diferença com a imagem original da banda 5 é que a PC1 é interpretada como sendo, aproximadamente, uma imagem albedo, a qual descreve o brilho médio da cena. A PC1 é quase uma soma das médias das imagens, enquanto os componentes restantes de algum modo parecem diferenças entre pares das imagens originais.

Em termos numéricos pode-se entender que os autovetores são definidos como uma combinação aditiva e linear computada para cada pixel de uma banda original, para criar o novo valor de pixel dos principais componentes. Tomando-se como exemplo os autovetores do primeiro componente da matriz da Tabela10.5, a seguinte operação é feita para se calcular o novo valor de cada pixel da imagem principal componente. A mesma operação é repetida com os demais componentes.

ܲܥ_ଵ ൌ Ͳǡͳ͹ͳݔ_௜௝ଵ൅ ͲǡͳͶ͵ݔ_௜௝ଶ൅ Ͳǡʹͻͻݔ_௜௝ଷ൅ ͲǡͳͻͲݔ_௜௝ସ൅ Ͳǡͺʹ͵ݔ_௜௝ହ൅ Ͳǡ͵ͺͶݔ_௜௝଺

onde, PC1_ij = valor do pixel na linha i coluna j do primeiro principal componente

x_ij1...6= valor do pixel na linha i coluna j de cada uma das bandas originais 1 a 6

A Figura 10.5 mostra as imagens resultantes da transformação por principais componentes, cujos dados são os das matrizes apresentadas. Como as imagens principais componentes têm correlação zero, qualquer pixel lido em um componente tem um diferente valor digital nos outros componentes.

Os três primeiros principais componentes, que reúnem 99,121% da informação total, podem ser combinados em uma composição colorida RGB, obtendo-se uma imagem de alto contraste de cores. As cores são mais contrastantes do que as que são obtidas com as bandas originais, e isso é devido à ausência de correlação entre os componentes. Porém, há uma grande dificuldade para se identificar as naturezas das classes dos alvos, porque sendo cada uma das imagens componentes formadas pela soma das contribuições de informações de todas as bandas originais, são perdidas as relações espectrais dos alvos com as imagens.

Crósta e Moore (1989) desenvolveram uma solução para essa dificuldade de identificação da natureza das classes nas imagens componentes principais, por meio da aplicação de uma técnica de análise denominada Feature Oriented Principal Component (FPSC), também denominada Técnica Crósta. Essa técnica possibilita identificar as classes de alvos através da análise da matriz de autovetores, reconhecendo qual componente contém a informação diretamente relacionada à assinatura espectral do alvo.

A primeira etapa da FPCS é a avaliação do espectro do alvo a ser pesquisado, com o objetivo de identificar duas bandas que contenham respostas de feições espectrais marcantes, uma com alta absorção e outra com alta reflectância. Após selecionadas essas duas bandas, são escolhidas outras duas bandas que contenham reflectâncias médias do alvo. Nessas quatro bandas é aplicada a transformação por principais componentes. A seguir são analisados os valores e sinais da matriz de autovetores, considerando-se que a imagem principal componente que contém a informação individualizada do alvo, é aquela que apresenta os maiores e menores valores absolutos nas bandas que têm as feições espectrais do alvo. Esse componente conterá a informação individualizada do alvo.

Introdução ao Processamento de Imagens de Sensoriameto Remoto 162

Fig. 10.5 Imagens principais componentes das seis bandas TM com os três primeiros componentes acumulando 99,126% da variância total das imagens originais.

PC1 PC2

PC3 PC4

PC5 PC6

Introdução ao Processamento de Imagens de Sensoriameto Remoto 163 Por exemplo, os espectros de reflectância dos minerais hidroxilados caolinita, montmorilonita e muscovita, apresentam uma forte feição de absorção na banda 7 e uma alta reflectância na banda 5 dos sensores TM e ETM⁺. Na Figura 10.6 é mostrado o espectro para o mineral muscovita e as posições espectrais das bandas do sensor ETM⁺. A aplicação da técnica crosta para mapeamento deste grupo mineral, e no caso deste exemplo da muscovita, utiliza a rotação por principais componentes entre as bandas 1, 4, 5 e 7.

Fig. 10.6: Espectro da muscovita sobreposto ao intervalo das bandas 1, 2, 3, 4, 5 e 7 do sensor ETM+.

Na análise da matriz de autovetores deve-se identificar o principal componente que tenha sinais opostos e variações de moderado a alto para as bandas 5 e 7, sendo esse o principal componente que identifica as áreas que concentram a presença de muscovita nas rochas.

Um exemplo é demonstrado com as imagens ETM⁺do Granito Pedra Branca da Província Estaninífera de Goiás, município de Nova Roma (Figura 10.7a). Na matriz de autovetores da Tabela 10.6 observa-se que os valores que apresentam a informação relativa à muscovita é o PC4 (maiores sinais de valores opostos). A imagem do componente PC4 é mostrada na Figura 10.7b, onde se destaca uma área de forma oval, a qual coincide com a faixa de greissen muscovítico mineralizado em estanho no granito Pedra Branca.

Tabela 10.6 Autovetores obtidos por principais componentes para as bandas 1, 4, 5 e 7 do sensor ETM⁺ do satélite Landsat 7.

B1 B4 B5 B7

PC1 0,199966 0,250449 0,780750 0,536394 PC2 -0,191043 0,887538 0,050195 -0,416244 PC3 -0,875854 -0,264005 0,387476 -0,114209 PC4 -0,395470 0,282583 -0,487619 0,725244

1 2 3 4 5 7

Introdução ao Processamento de Imagens de Sensoriameto Remoto 164

Fig. 10.7 Na imagem à esquerda composição colorida da área do granito Pedra Branca e na imagem à direita exemplo da aplicação da técnica Crósta (Feature Oriented Principal Component) com as bandas 1, 4, 5, 7 ETM, destacando a área de graissen no granito Serra Branca (GO).

10.3

No documento SENSORIAMENTO REMOTO: FUNDAMENTOS E PRINCÍPIOS (páginas 165-174)