• Nenhum resultado encontrado

4.2 Metodologia de classicação de imagens de sensoriamento remoto usando SOMs

4.2.1 Amostragem da imagem

O primeiro passo da metodologia de classicação proposta consiste em coletar um conjunto de amostras da imagem para realizar o treinamento do SOM.

Com o aumento signicativo da resolução espacial das imagens de satélite nos últimos anos, as abordagens de classicação pixel a pixel não têm mais alcançado resultados plenamente satisfatórios no reconhecimento de padrões de imagens coletadas por sensores modernos. Devido à heterogeneidade espectral existente dentro de uma mesma classe, amostras na forma de pixels isolados não são capazes de capturar a maioria dos padrões de cobertura terrestre, especialmente no caso de imagens que apresentam melhores resoluções (Blaschke et al., 2007; Gonçalves et al., 2008a). Diante disso, observando a necessidade de explorar novas técnicas que não

analisam apenas a assinatura espectral de pixels individuais, o presente trabalho realiza o processo de amostragem das imagens através de janelas de pixels. A idéia é incorporar na análise de agrupamentos da imagem informações de vizinhança (ou de contexto) dos pixels. Relacionamentos entre pixels vizinhos que sejam estáveis, consistentes e possíveis de serem previstos são utilizados para melhorar a qualidade da classicação resultante.

A gura 4.2 mostra uma imagem gerada articialmente com quatro segmentos de classes de cobertura terrestre retirados de imagens do satélite IKONOS (com resolução espacial de 4 metros). As quatro classes apresentam padrões de textura bem diferenciados e fáceis de serem discriminados visualmente.

Com o objetivo de destacar as diferenças no processo de detecção de agrupamentos da imagem empregando uma amostragem pixel a pixel e uma amostragem através de janelas de pixels, dois SOMs compostos de 100 neurônios (arranjados numa grade retangular 10x10) foram treinados: um com amostras na forma de pixels isolados e o outro com amostras na forma de janelas 5x5 de pixels. A inicialização dos pesos foi linear, a apresentação dos padrões (amostras) em lote e o número de iterações foi 500 para os dois mapas. Os dois SOMs foram treinados com a mesma quantidade de amostras. O tempo de treinamento sob o Matlab em uma máquina com processador AMD Athlon XP 2600+ 1,91GHZ e 1GB de RAM foi de 28 segundos para o SOM treinado com janelas de pixels e de 13 segundos para o SOM treinado com pixels individuais.

A gura 4.3 mostra a U-matrix do SOM treinado com janelas de pixels, onde pode-se observar claramente quatro regiões ou "vales" bem denidos, que correspondem a quatro agru- pamentos de dados. A gura 4.4 mostra a imagem dos protótipos do SOM1 correspondente,

na qual também pode-se visualizar claramente quatro agrupamentos que correspondem exata- mente aos quatro "vales" da U-matrix da gura 4.3. É fácil perceber também que os quatro agrupamentos de protótipos na imagem do SOM treinado (gura 4.4) correspondem às quatro classes de cobertura terrestre da imagem original.

Por outro lado, a U-matrix calculada a partir do SOM treinado com pixels isolados (na gura 4.5) não apresenta depressões ou "vales" tão bem denidos, o que diculta uma detecção automática de agrupamentos a partir da mesma. Além disso, se considerarmos a imagem dos

4.2 Metodologia de classicação de imagens de sensoriamento remoto usando

SOMs segmentados por morfologia matemática 97

1 2

3 4

Fig. 4.2: Imagem construída com quatro classes de cobertura terrestre capturadas pelo satélite IKONOS (com resolução espacial de 4 metros).

Fig. 4.3: U-matrix 3D do SOM treinado com janelas de pixels.

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 1 2 3 4

Fig. 4.4: Imagem dos protótipos do SOM treinado com janelas de pixels.

protótipos do SOM correspondente (apresentada na gura 4.6) e observarmos os protótipos que estão associados com aquelas regiões marcadas na imagem da U-matrix, verica-se que eles não correspondem exatamente às classes de cobertura terrestre existentes na imagem original. Na realidade, é suciente observar apenas a imagem do SOM treinado com pixels isolados (gura 4.6) para concluir que as classes existentes na imagem original não foram aprendidas pelo SOM usando esse tipo de amostragem. O SOM treinado com pixels isolados foi capaz de mapear todas as variações espectrais (cores) existentes na imagem, mas não conseguiu capturar padrões de cunho espacial (texturas), que são fundamentais para caracterizar e diferenciar as

quatro classes consideradas.

Fig. 4.5: U-matrix 3D do SOM treinado com pixels isolados.

1 2 3 4 5 6 7 8 9 10 1 2 3 4 5 6 7 8 9 10 4 1 2 3

Fig. 4.6: Imagem dos protótipos do SOM treinado com pixels isolados.

As guras 4.7 e 4.8 mostram, respectivamente, os resultados da classicação da imagem da gura 4.2 usando os protótipos do SOM treinado com janelas de pixels e os protótipos do SOM treinado com pixels isolados. Visualmente, nota-se uma diferença signicativa nos resultados. A classicação realizada através dos protótipos do SOM treinado com janelas de pixels apresentou uma discriminação bastante satisfatória das quatro classes, com alguns erros apenas nas fronteiras ou bordas de transição. Já a imagem resultante da classicação pelo SOM treinado com pixels isolados apresentou um alto grau de confusão entre elas, uma vez que foi capaz de discriminar apenas atributos espectrais (tonalidades) diferentes, que na realidade pertencem a mais de uma classe.

Embora a estratégia de utilizar informações de pixels vizinhos apresente obviamente um maior custo computacional do que uma abordagem pixel a pixel, os resultados do experimento apresentado aqui, e de outros trabalhos existentes na literatura, mostram claramente que esse esforço é justicado por um aumento proporcional na acurácia da classicação (Gonçalves, 1997; Zhang et al., 2003; Magnussen et al., 2004). Na tentativa ainda de aperfeiçoar o desempenho das técnicas de classicação, procurando incorporar informações de vizinhança sem causar um aumento signicativo no volume de processamento, algumas metodologias de classicação, como aquela apresentada em Bandyopadhyay (2005), têm proposto o uso de descritores estatísticos (como média e desvio-padrão) para representar as informações de vizinhança ao redor de um

4.2 Metodologia de classicação de imagens de sensoriamento remoto usando

SOMs segmentados por morfologia matemática 99

Fig. 4.7: Imagem da gura 4.2 classicada através dos protótipos do SOM treinado com janelas de pixels.

Fig. 4.8: Imagem da gura 4.2 classicada através dos protótipos do SOM treinado com pixels isolados.

pixel, evitando assim a utilização dos valores numéricos de todos os pixels que fazem parte de uma janela amostral. Embora essa abordagem diminua o custo computacional da análise da imagem, é importante observar que diante da diversidade de padrões de cobertura terrestre existentes, medidas estatísticas de primeira ordem, como média, variância e desvio-padrão, podem não ser sucientes para descrever ou representar de maneira adequada as informações contidas em uma amostra na forma de janelas de pixels. Conforme relatado em Rennó (1995), esse problema ocorre porque tais medidas não levam em conta o posicionamento espacial relativo

dos pixels, e portanto, uma janela amostral que contenha uma mesma quantidade de diferentes níveis de cinza que outra, diferenciando-se apenas em termos do posicionamento dos mesmos, irá apresentar os mesmos valores para as medidas estatísticas calculadas.

É certo que, além de medidas estatísticas básicas, existe na literatura uma série de outras técnicas que podem ser utilizadas para descrever ou representar a organização espacial dos níveis de cinza de um imagem ou de uma janela de pixels, como as medidas de Haralick (mencionadas na subseção 2.5.4.2), ltragem de Gabor (Jain e Farrokhnia, 1991) e decomposição em wavelets (Vower et al., 1999). No entanto, a complexidade computacional desses métodos deve ser considerada, principalmente quando aplicados em grandes volumes de dados como as imagens de sensoriamento remoto.

Sendo assim, neste trabalho, optou-se por processar os valores de níveis de cinza de todos os pixels das janelas amostrais. Tal abordagem, além de não exigir nenhum cálculo explícito de medidas de textura ou de organização espacial dos pixels, proporciona algumas vantagens que serão apresentadas mais adiante nos experimentos e em outras abordagens de classicação apresentadas no trabalho.

Dois pontos importantes que decorrem do processo de amostragem por meio de janelas de pixels são a forma de extração das janelas amostrais e o tamanho das mesmas. Conforme mostra a gura 4.9, com o objetivo de garantir a captura de todos os padrões existentes em uma cena, inclusive daqueles com baixa probabilidade de ocorrência, a metodologia de classicação proposta coleta as janelas amostrais de maneira uniforme cobrindo toda a região da imagem, sem sobreposições e em intervalos regulares de aproximadamente 10 pixels. Todas as amostras são quadradas e possuem o mesmo tamanho.

O espaçamento em torno de 10 pixels, empregado para extrair as janelas amostrais das ima- gens, foi denido experimentalmente. Intervalos maiores podem ser utilizados, porém quanto maior o espaçamento adotado entre as janelas amostrais, maior é o risco de exclusão de padrões de cobertura terrestre que aparecem em pequenas áreas na imagem com baixa probabilidade de ocorrência.

A gura 4.10 mostra um exemplo de situação em que um intervalo muito grande entre as janelas amostrais pode prejudicar a detecção das classes de cobertura terrestre de uma

4.2 Metodologia de classicação de imagens de sensoriamento remoto usando

SOMs segmentados por morfologia matemática 101

.

.

.

.

.

.

.

.

.

.

.

.

(janelas de pixels)

Amostras

. . .

. . .

Fig. 4.9: Processo de amostagem da imagem de entrada.

imagem a partir de um SOM treinado. A gura mostra uma imagem do satélite Landsat/TM composta por diferentes classes de cobertura terrestre, incluindo a classe água (na cor preta), que aparece em pequenas áreas numa densidade menor que as dos outros padrões da imagem. Logo abaixo, a gura mostra também as imagens dos protótipos (neurônios) de três SOMs de tamanhos iguais (12x12), treinados a partir de três conjuntos diferentes de janelas amostrais. A diferença entre os conjuntos de amostras está justamente no espaçamento utilizado para coletar as janelas amostrais. A gura 4.10(b) mostra a imagem resultante de um SOM treinado a partir de um conjunto de janelas amostrais extraídas em intervalos (espaços) regulares de 10 pixels, onde é possível notar que há protótipos no canto superior esquerdo do mapa (de cor escura) correspondentes à classe água. Já as guras 4.10(c) e (d) mostram imagens resultantes de SOMs treinados a partir de conjuntos de janelas amostrais extraídas em intervalos regulares de 20 e 30 pixels, respectivamente. Na imagem (c), ainda é possível visualizar pelo menos um protótipo (no canto superior esquerdo do mapa) com aparência espectral próxima ao do padrão de água. No entanto, na imagem (d), verica-se claramente que o SOM não apresenta protótipos representantes dessa classe. Isso certamente ocorre devido ao espaçamento maior utilizado no processo de amostragem da imagem. O intervalo de 30 pixels de uma janela amostral à outra não possibilitou a inclusão de um número suciente de amostras da classe água para treinar o SOM. Portanto, caso o SOM da gura 4.10(c) fosse utilizado para detectar todos os padrões existentes na imagem (a), a classe água não seria reconhecida.

(d)

(b) (c)

(a)

Fig. 4.10: Efeito do espaçamento entre janelas amostrais no treinamento do SOM: (a) Imagem Landsat/TM. (b) Imagem de um SOM treinado com janelas amostrais coletadas em intervalos regulares de 10 pixels. Os protótipos correspondentes à classe água aparecem (circulados) no canto superior esquerdo do mapa. (c) Imagem de um SOM treinado com janelas amostrais coletadas em intervalos regulares de 20 pixels. Apenas um protótipo no mapa (circulado no canto superior esquerdo) corresponde à classe água. (d) Imagem de um SOM treinado com janelas amostrais coletadas em intervalos regulares de 30 pixels. O mapa não apresenta protótipos associados à classe água.

trais da imagem pode depender também dos objetivos da classicação. Caso o usuário de- seje uma classicação mais renada ou detalhada da imagem, espaçamentos menores entre as janelas amostrais devem ser utilizados. Isso garante que uma porcentagem maior da área total da imagem será coberta pelo processo de amostragem, e portanto, classes com menor proba- bilidade de ocorrência na cena serão amostradas. Por outro lado, se o usuário pretende obter uma classicação mais supercial ou grosseira da cena, procurando detectar somente as classes

4.2 Metodologia de classicação de imagens de sensoriamento remoto usando

SOMs segmentados por morfologia matemática 103

mais predominantes na imagem, espaçamentos maiores entre as janelas amostrais podem ser empregados.

Todavia, vale ressaltar também, que o custo computacional para realizar o treinamento do SOM será obviamente maior no caso de amostragens que tiverem um espaçamento menor entre as janelas amostrais, visto que, neste caso, um número maior de amostras será coletado a par- tir da imagem. De maneira contrária, quanto maior o espaçamento entre as janelas amostrais, menor será o tempo gasto para treinar os neurônios do SOM, uma vez que uma quantidade menor de amostras será extraída da imagem a ser classicada. Isso pode ser vericado re- tomando o exemplo da gura 4.10. O tempo gasto para treinar o SOM da gura 4.10(b) foi de 69 segundos, utilizando 2600 amostras, decorrentes do espaçamento de 10 pixels adotado para coletar as janelas amostrais. Já os treinamentos dos SOMs das guras 4.10 (c) e (d), consumiram 21 e 15 segundos, usando 625 e 289 janelas amostrais, respectivamente. Como esperado, seus tempos de treinamento foram bem menores que o do SOM da gura 4.10(b), uma vez que utilizaram quantidades bem menores de amostras, determinadas em função do uso de espaçamentos maiores entre as janelas amostrais extraídas da imagem.

Ainda em relação ao processo de amostragem das imagens, verica-se que a determinação do tamanho das janelas amostrais é outra tarefa difícil de ser automatizada. A escolha de um tamanho adequado para as janelas amostrais depende de alguns fatores importantes, entre eles, a resolução espacial e as características das classes de cobertura terrestre da imagem de entrada. Dependendo da imagem, janelas muito pequenas podem não capturar o padrão particular das classes, enquanto que janelas maiores podem incluir pixels de duas ou mais classes. Contudo, como será mostrado nos próximos capítulos deste trabalho, partindo de um tamanho não inferior a 5x5, o usuário possui alguma exibilidade para denir a dimensão das janelas amostrais, o que permite descaracterizar essa tarefa como um ponto crítico do processo. Esse trabalho mostra que procedimentos para realizar a ltragem de amostras e de protótipos do SOM que incorporam mais de uma classe podem ser aplicados no processo de análise de agrupamentos das imagens. Além disso, também será possível vericar que protótipos que possuem mais de uma classe funcionam como bordas no mapa de neurônios do SOM, contribuindo para a separação dos agrupamentos.