• Nenhum resultado encontrado

Otimização de Classificador Fuzzy para Imagens de Sensoriamento Remoto utilizando Algoritmos Genéticos

N/A
N/A
Protected

Academic year: 2021

Share "Otimização de Classificador Fuzzy para Imagens de Sensoriamento Remoto utilizando Algoritmos Genéticos"

Copied!
7
0
0

Texto

(1)

Otimização de Classificador Fuzzy para Imagens de Sensoriamento Remoto utilizando Algoritmos Genéticos

Vanessa de Oliveira Campos, Marco Aurélio C. Pacheco, Raul Queiroz Feitosa Departamento de Engenharia Elétrica

Pontifícia Universidade Católica do Rio de Janeiro

R. Marquês de São Vicente 225, Gávea, Rio de Janeiro, CEP 22453-900, RJ, Brasil { vanessa, marco, raul }@ele.puc-rio.br

Resumo

Este trabalho aborda uma metodologia para a otimização de parâmetros de classificação com regras fuzzy utilizando algoritmos genéticos.

Esta ferramenta permite a utilização de algoritmos genéticos para determinar os valores ótimos para os parâmetros dos classificadores fuzzy. Sendo assim, os sistemas de classificação podem ser implementados intuitivamente por especialistas e em seguida submetidos a um processo evolutivo utilizando algoritmos genéticos. Isso representa um ganho significativo, tanto no tempo de desenvolvimento quanto na eficiência, do processo de implementação destes sistemas.

Palavras-chave: Sensoriamento remoto;

classificação; processamento digital de imagens;

lógica nebulosa; algoritmo genético

1. Introdução

Sensoriamento remoto pode ser definido como qualquer processo através do qual é coletada informação a respeito de um objeto, área ou fenômeno sem entrar em contato físico com ele. Atualmente, existe a disponibilidade de uma infinidade de tipos diferentes de sensores, contudo, neste trabalho trataremos apenas àqueles referidos por aquisição de imagens por satélites.

O processo de classificação de imagens é de grande importância na extração de informações de imagens de Sensoriamento Remoto. A classificação das imagens de sensoriamento remoto, aqui tratada, consiste da associação de cada segmento (obtidos pelo processo de segmentação que subdivide uma

imagem em suas regiões ou objetos constituintes) da imagem a um “rótulo” que descreve um objeto real (água, tipo de vegetação, de solo, etc.), podendo ser chamadas de classes.

O sensoriamento fornece ferramentas capazes de monitorar grandes áreas da superfície da terra. Esta tecnologia pode exercer um papel fundamental na gestão dos recursos naturais, podendo, por exemplo, detectar regiões onde o processo de degradação natural está ou esteve atuando. Portanto, além de viabilizar o acompanhamento eficiente das intervenções preservacionistas, o uso de técnicas de sensoriamento remoto possibilita a detecção do início de novos processos de degradação, que é essencial para a fiscalização, preservação e recuperação de reservas ambientais. Entretanto, independentemente da aplicação em questão, o monitoramento do uso do solo pode ser realizado de forma mais eficiente através do uso de imagens obtidas por sensores remotos por permitir o acompanhamento de grandes áreas sem porventura necessitar de extenso trabalho de campo.

A classificação de imagens de sensoriamento remoto empregada neste trabalho é baseada na técnica utilizada em [5], onde foram utilizados sistemas fuzzy para classificação das imagens pela capacidade de lidar com informações vagas e facilidade da descrição de regras por especialistas. No entanto, existem situações nas quais o conhecimento especialista é ausente como na especificação das funções de pertinência tais como seus parâmetros. Inicialmente, as funções de pertinência para cada um dos conjuntos nebulosos do classificador implementado em [5], foram desenvolvidas de forma manual. Ou seja, estabeleciam-se os valores às funções, executava-se o sistema de classificação e uma avaliação era feita e repetia-se este processo até que o classificador apresentasse um resultado

(2)

satisfatório. Sob este método, o classificador apresentou um desempenho considerado bom, mas sob tediosas seções de tentativas de acerto.

Desta forma, este trabalho propõe uma metodologia para busca de parâmetros de funções de pertinência através de algoritmos genéticos, tornando este processo automático.

2. Lógica Fuzzy

A teoria fuzzy foi apresentada em 1965 [8] por Lotfi A. Zadeh, professor no departamento de engenharia elétrica e ciências da computação da Universidade da Califórnia, em Berkeley, quando ele trabalhava com problemas de classificações de conjuntos que não possuíam fronteiras bem definidas (ou seja, a transição entre os conjuntos é suave e não abrupta). Sendo assim, surgiram os conjuntos fuzzy ligados a funções de pertinência que mapeiam um valor escalar em um número entre 0 e 1, o qual indica o grau de pertinência a esse conjunto.

Considerando-se um vetor de entrada (constituído pelos atributos) x = (x1, x2,..., xn) e uma base de regras composta por m regras lingüísticas fuzzy Ri, i = 1,...,m :

R1⇒ Se x1 é A1,1 e ... e xn é A1,m então y é B1

. . .

Rm⇒ Se x1 é An,1 e ... e xn é An,m então y é Bm O conectivo lógico “e” e “ou” são utilizados para conectar os antecedentes em cada regra. Estes conectivos são interpretados como os operadores lógicos min e max, respectivamente. A implicação fuzzy “Se- Então” é definida como uma conjunção das funções de pertinência do antecedente e do conseqüente de uma regra. Esta implicação é interpretada como:

µR(R) = min(µA1(x1), µA2(x2))

No classificador de segmentos, calcula- se o vetor que contém os atributos do segmento em questão. Em seguida, a máquina de inferência calcula com base nas regras de inferência, nos conjuntos nebulosos e nos atributos os valores da pertinência do segmento em questão a cada uma das classes da legenda.

O classificador atribui ao segmento em questão o rótulo da classe que possui o maior grau de pertinência para o segmento.

A classificação utilizando lógica fuzzy facilita a descrição de regras por especialistas, mas tem-se dificuldade para definir os conjuntos nebulosos. Portanto, este trabalho tem como

objetivo estimar parâmetros de funções de pertinência de classificação fuzzy para imagens de sensoriamento remoto utilizando algoritmos genéticos.A principais vantagens da utilização da lógica fuzzy são:

• Baseado em linguagem natural - facilita a descrição das regras pelos especialistas;

• Explicação do raciocínio;

• Capaz de tratar com informação vaga.

Entretanto, uma das desvantagens da utilização desta técnica é a dificuldade na especificação das funções de pertinência, a qual pretendemos atacar.

3. Algoritmos Genéticos

A tentativa de imitar a evolução dos seres vivos na natureza originou a Computação Evolucionária (CE). Computação Evolucionária é o nome genérico, dado a métodos computacionais, inspirados na teoria da evolução. Os algoritmos usados, em computação evolucionária, são conhecidos como Algoritmos Evolucionários. Atualmente, os Algoritmos Evolucionários mais conhecidos são os Algoritmos Genéticos que consiste na simulação da evolução de estruturas individuais, via processos de seleção e os operadores de busca, referidos como operadores genéticos.

Algoritmos Genéticos foi proposto inicialmente por John H. Holland em 1975.

Holland inspirou-se no mecanismo de evolução das espécies, tendo como base teoria da evolução de Charles Darwin. De acordo com a teoria Darwiniana de evolução das espécies, uma população sujeita a um ambiente qualquer, sofrerá influências desse, de tal forma que os mais aptos terão maior probabilidade de sobreviver a tal ambiente. Desta forma, a cada geração haverá uma população mais adaptada ao ambiente em questão.

A idéia básica é de buscar a solução ótima para um problema partindo-se de uma população inicial, que representam um conjunto inicial de candidatos à solução. A partir do cruzamento de indivíduos selecionados aleatoriamente privilegiando os mais aptos, chega-se a uma nova geração. São geradas novas gerações, desta forma, até que se chegue ao objetivo.

A nível biológico, um indivíduo é formado por um conjunto de cromossomos. No entanto, pode-se fazer uma analogia, neste contexto, entre indivíduo e cromossomo, tendo em vista que um indivíduo pode ser formado por apenas um cromossomo, o que é comum em

(3)

algoritmos genéticos. Por isso, os dois termos são utilizados indistintamente, neste contexto.

Em relação às técnicas de busca convencionais, os algoritmos genéticos diferem nos seguintes pontos:

• A busca da melhor solução para o problema é feita sobre uma população de pontos, e não sobre um único ponto, diminuindo o tempo de processamento para encontrar a solução e reduzindo sensivelmente o risco da solução recair sobre um máximo (ou mínimo) local;

• A única exigência é o conhecimento do valor da função de custo (ou objetivo) de cada indivíduo. Não há necessidade de qualquer outra informação, ou heurística, dependente do problema;

• Os algoritmos genéticos usam operadores estocásticos e não regras determinísticas para guiar uma busca altamente exploratória e estruturada, onde informações acumuladas nas iterações (gerações) anteriores são usadas para direcionar essa busca.

4. Classificação Fuzzy para Imagens de Sensoriamento Remoto

A tabela a seguir apresenta a descrição das classes no problema:

Rótulo Classe Descrição

ω1 Solo exposto Um solo que tenha sido degradado por erosão ou que esteja sendo preparado para o cultivo.

ω2 Mata Ciliar Floresta densa ao longo de rios e córregos.

ω3 Pasto Pasto cultivado para a alimentação de bovinos.

Sua consistência é variável, pois na maioria das vezes não é mantido

apropriadamente além de ser afetado por fatores climáticos (secas).

ω4 Corpos d’água

Água aparente ou região pantanosa.

ω5 Cerradão Floresta de savana densa.

ω6 Cerradão em regeneração

Área anteriormente usada como pasto que foi deixada de lado pelo proprietário e por isso, agora, a cobertura vegetal original está se

regenerando.

Tabela 1: Classes apresentadas no problema.

Para caracterizar cada segmento, foram extraídos atributos x = {x1, ..., x6} de cada segmento que podem ser subdivididos em três conjuntos de atributos, x1 = {x1, x2, x3}, x2 = {x4, x5} e x3 = {x6}. x1 refere-se à resposta espectral média de cada banda no segmento, x2 está associado a localização do segmento (distância do segmento ao rio mais próximo e se está em montanha) e x3 corresponde à resposta multitemporal, ou seja, à classificação anterior do segmento (relacionado a possibilidade de ocorrência de uma classe c1, dado que ocorreu c2 anteriormente).

Descrição – tonalidades da resposta espectral

Classes que se enquadram na

descrição Rosa claro a branco Solo exposto Verde escuro Mata ciliar e

Cerradão Rosa, rosa esverdeado

ou rosa azulado

Pasto

Marrom escuro a preto Corpos d’água e Cerradão

Verde Cerradão em

regeneração

Tabela 2: Classes ligadas a cada resposta espectral.

Uso/ Cobertura em t-1

Uso / Cobertura

em t

Processo

Cerradão Pasto Desflorestamento e introdução de um novo pasto.

Solo exposto

Preparo da terra para plantio de novo pasto Cerradão em

regeneração

Pasto Desflorestamento e introdução de um novo pasto.

Solo exposto

Preparo da terra para plantio de novo pasto Cerradão Condições ambientais favoráveis possibilitando a recomposição da cobertura vegetal original.

Mata ciliar Pasto Desflorestamento 2 e introdução de um novo pasto

(4)

Solo exposto

Preparo2 da terra para plantio de novo pasto

Pasto Solo ex-

posto

Preparo da terra para plantio de novo pasto ou degradação do solo (erosão) Solo exposto Pasto Renovação do

pasto

Tabela 3: Possíveis mudanças da classificação de um segmento e o motivo – conhecimento multitemporal.

A regras empregadas na classificação, assim como as variáveis e conjuntos nebulosos, foram definidas a partir de conhecimento adquirido de especialistas.

O conjunto de regras (R1, ..., R7) que expressam a estratégia de classificação é apresentado a seguir:

R1⇒ SE (x1 é rosa claro ou branco) E (x6 é solo exposto) ENTÃO classe é ω1

R2⇒ SE (x1 é verde escuro) E (x4 é perto de rio) E (x6 é mata ciliar) ENTÃO classe é ω2 R3⇒ SE (x1 é verde escuro) E (x4 é longe de rio) E (x6 é cerradão) ENTÃO classe é ω5 R4⇒ SE (x1 é rosa azulado ou rosa esverdeado) E (x6 é pasto) ENTÃO classe é ω3

R5⇒ SE (x1 é marrom escuro ou preto) E (x5

está em montanha) E (x6 é cerradão) ENTÃO classe é ω5

R6⇒ SE (x1 é marrom escuro ou preto) E (x5 não está em montanha) E (x6 é corpos d’água) ENTÃO classe é ω4

R7⇒ SE (x1 é verde claro) E (x6 é cerradão em regeneração) ENTÃO classe é ω6

A fim de definir a classificação do segmento é preciso determinar o enquadramento dos valores da resposta espectral, localização e classificação anterior em seus respectivos rótulos lingüísticos. Esta medida corresponde ao grau de pertinência dos valores das variáveis aos conjuntos nebulosos associados a seus rótulos lingüísticos. A seguir são apresentados os rótulos correspondentes a cada uma das variáveis lingüísticas.

Para a função de pertinência da resposta espectral foi adotada a função gaussiana para cada banda (R, G e B). Cada resposta espectral (ex. rosa claro, branco, preto) utilizada foi associada a um conjunto nebuloso diferente. Sendo assim, o grau de pertinência de x1 = {x1, x2, x3} a.branco, por exemplo, se dá pela função:

µ(x1) = min(µR(x1), µG(x2), µB(x3));

µR(x1) = e ,

µG(x2) = e ,

µB(x3) = e ,

Figura 1: Formato dos conjuntos R, G e B para resposta espectral.

Para a reposta estrutural x2 = {x4, x5} foram adotadas as seguintes funções:

• Perto de rio (longe de rio = 1 - µ(x4)):

1 , se x4 ≤ a µ(x4) = (a + b –x4)/b , se a < x4 ≥ a+b

0 , se x4 > a+b

Figura 2: Formato do conjunto “perto de rio”.

• Em montanha:

1, se segmento localizado em montanha 0, caso contrário

Para a resposta multitemporal foi atribuída para cada classe ωi (i = 1, ..., 6) a função µi:

ci, se x6 = i 0, caso contrário

Inicialmente, os parâmetros das funções de pertinência para cada um dos conjuntos nebulosos foram desenvolvidos manualmente. Ou seja, foram estabelecidos valores aleatoriamente para os parâmetros e depois testados diversas vezes até que o classificador apresentasse um resultado satisfatório. Sob este método, classificador apresentou um desempenho considerado bom, mas sob tediosas seções de tentativas de acerto.

µ(x5) =

-(x1 - mR) 2dR2

mR = média dR = desvio padrão -(x2 - mG)

2dG2

mG = média dG = desvio padrão -(x3 - mB)

2dB2

mB = média dB = desvio padrão

R G B

a φ

b = φ - a

µi(x6) =

(5)

5. Otimização de parâmetros através de Algoritmos Genéticos

Como mencionado anteriormente, o algoritmo genético é uma técnica de otimização que se assemelha ao processo de seleção natural.

Nele, o conjunto de parâmetros desconhecidos é submetido a um processo iterativo de seleção, descartando as soluções menos aptas e gerando novas estimativas a partir das melhores soluções.

Nesta aplicação, o indivíduo foi definido por um vetor de números reais, de modo que cada vetor represente um conjunto de valores para o conjunto de parâmetros do problema. Deste modo, cada posição do vetor ou cromossomo representa um parâmetro de uma função de pertinência. Para cada uma das oito respostas espectrais foram reservados seis posições no cromossomo ou parâmetros (mR, dR, mG, dG, mB, dB), em seguida foram reservadas duas posições (a, b) para a resposta estrutural e uma posição (c) para cada uma das seis respostas possíveis de classificações anteriores.

Totalizando cinqüenta e seis parâmetros a serem estimados e representados no cromossomo.

A população inicial foi obtida através da geração aleatória de indivíduos, obedecendo a condições de limite previamente estabelecidas.

A função de avaliação foi definida como a taxa média de classificação correta:

A = (T1 + T2 + ... + Tp)/p;

Ti = Ci/ni , i = 1, 2, ..., p Onde:

• A é a avaliação do cromossomo;

• p é número total de classes;

• Ti é a porcentagem de acertos para a classe i;

• Ci é o total de elementos da classe i classificados corretamente;

• ni é o total de elementos da classes i.

O módulo de seleção tem por objetivo selecionar indivíduos para reprodução privilegiando os mais aptos. Como método de aptidão, foi utilizada a Normalização Linear.

Sendo assim, o processo de seleção tem início após a verificação do grau de aptidão de cada elemento à função de avaliação e a verificação da não convergência dos valores.

Após seleção dos indivíduos, estes são reproduzidos através de operadores genéticos para criação da nova geração de indivíduos. A técnica utilizada para determinar o critério de substituição dos indivíduos foi a troca parcial da população (steady state) que gera M indivíduos (M menor que o tamanho da população) e substitui os piores indivíduos da população

corrente (o número percentual de indivíduos substituídos é conhecido através do parâmetro GAP), garantindo, portanto, a preservação dos melhores indivíduos e que a população seguinte tenha soluções no mínimo igual a corrente.

Os operadores genéticos utilizados foram os seguintes:

• Crossover simples: este se dá pela aproximação dos cromossomos dos dois indivíduos (pais), que trocam entre si partes de seus cromossomos. Isso resulta em dois cromossomos diferentes que ainda guardam características dos pais. O crossover é o principal operador genético, ele atua cruzando as soluções fazendo com que novas gerações permaneçam com características desejáveis adquiridas de gerações anteriores. Primeiro um local de cruzamento é escolhido com probabilidade uniforme sobre o comprimento do cromossomo, sendo, então, os genes correspondentes permutados.

• Crossover aritmético: este se diferencia do anterior pela combinação linear dos indivíduos pais.

• Mutação: ocorre alterando aleatoriamente um gene do indivíduo. A mutação consiste em perturbações na cadeia dos cromossomos dando origem a uma nova cadeia, que guardará pouca ou nenhuma informação da cadeia origem. Esta alteração ocorre de forma que cada gene em cada cromossomo é um candidato à mutação, de forma que a seleção é determinada pela probabilidade de mutação. A mutação é essencial para o processo de iterações genéticas, pois previne que o processo iterativo fique estagnado dentro de um mínimo local, introduzindo uma diversidade a população.

• Creep com ajuste pequeno: atua na busca de uma solução próxima da resultante através de ajustes aleatórios em as direções (limite superior e inferior).

• Creep com ajuste grande: tem a mesma funcionalidade do anterior, forçando um ajuste maior.

Também foi utilizada a técnica de interpolação de parâmetros para as taxa de operadores para alcançar maior desempenho.

6. Resultados

Os resultados apresentados na presente seção foram realizados com o intuito de validar o método proposto. No presente trabalho, utilizou-se o indicador de desempenho

(6)

conhecido como “taxa de reconhecimento”

(percentual dos segmentos pertencente a uma classe ou conjunto de classes na imagem de entrada corretamente classificados pelo modelo).

A seguir, é apresentado o gráfico de desempenho médio em vinte experimentos do método implementado:

Figura 3: Gráfico de desempenho médio obtido em vinte experimentos.

A tabela a seguir apresenta as taxas de reconhecimento obtidas através do ajuste manual e através de algoritmos genéticos dos parâmetros do classificador fuzzy:

Classe Ajuste Manual

Algoritmos Genéticos

ω1 62,0 87,7

ω2 97,5 99,2

ω3 53,5 94,3

ω4 100,0 100,0

ω5 97,5 98,1

ω6 33,5 100,0

Média 74,0 96,5

Tabela 4: Tabela de desempenho apresentando as taxas de reconhecimento obtidas pelos dois métodos.

Figura 4: Gráfico comparativo das taxas de reconhecimento por classe nas duas metodologias

Além da vantagem mencionada anteriormente que é a automatização da parametrização do classificador fuzzy, pode-se

observar pela tabela e gráfico de taxas de reconhecimento que o algoritmo genético apresentou resultados ainda mais eficientes que o método manual.

Para efeito de visualização dos resultados, são apresentados a seguir algumas imagens classificadas segundo a legenda:

Figura 4: Legenda de cores para classificação.

Figura 5: Imagem original adquirida por sensoriamento remoto.

Figura 6: Imagem classificada corretamente segundo a legenda da figura 4 para a figura 5.

ω1 – Solo exposto ω2 – Mata ciliar ω3 – Pasto

ω4 – Corpos d’água ω5 – Cerradão

ω6 – Cerradão em regeneração

(7)

Figura 7: Imagem classificada de acordo com as classes encontradas pelo classificador fuzzy utilizando os parâmetros encontrados por algoritmos genéticos segundo a legenda da figura 4 para a figura 5.

7. Conclusão

O sensoriamento remoto desempenha um papel fundamental em áreas bastante distintas de atuação, principalmente no mapeamento, cadastramento e monitoramento de recursos naturais. Por isso, é de grande importância o desenvolvimento de técnicas de classificação bastante eficientes.

Uma boa técnica para classificação de imagens de sensoriamento remoto é a utilização da lógica fuzzy, mas uma dificuldade que se tem é a definição dos conjuntos nebulosos que foi abordado com ótimos resultados utilizando algoritmos genéticos. Além disso, a utilização desta metodologia proporciona uma técnica automática para a estimação de parâmetros com maior rapidez que o ajuste manual e com maior eficiência sem depender do critério do projetista.

Os AG são um método de busca robusto, eficiente e eficaz na otimização de classificadores fuzzy.

Referências

[1] Davis, L., Handbook of Genetic Algorithms, VNR Comp. Library, 1990.

[2] Gonzalez, R. C., Woods, R. E., Digital Image Processing Reading, MA: Addison-Wesley, 1992.

[3] Mendel, J.M., Fuzzy Logic Systems for Enge- neering: a Tutorial, Proc. IEEE, V. 83, No. 3, 1995.

[4] Michalewicz, Z., Genetic Algorithms+Data Structures=Evolution Programs, Springer- Verlag-1994.

[5] Mota, G. L. A., Interpretação baseada em conhecimento aplicada a imagens multitemporais de satélite de baixa resolução.

Tese de Doutorado, PUC-RIO, Departamento de Engenharia Elétrica, 2004.

[6] Pacheco, M. A. C., Algoritmos Genéticos:

Princípios e Aplicações. Apostila disponível em:

http://www.ica.ele.puc-rio.br.

[7] ZADEH, L. Fuzzy sets as a basis for a theory of possibility. In: Fuzzy Sets and Systems, 1:3-28.

1978.

[8] Zadeh, L.A., “Fuzzy Sets”. Information and Control 8 (3), 338-353, 1965.

Referências

Documentos relacionados

Em função das dúvidas ainda existentes, foi realizada uma palestra com as gestantes da unidade, onde foram abordados os seguintes temas: Alimentação saudável durante e

Como cada município teve a APAA quantificada de forma absoluta (em hectares) e relativa (em porcentagem da área do município), para testar a adequação desta

Podemos então utilizar critérios tais como área, arredondamento e alongamento para classificar formas aparentadas a dolinas; no processamento digital de imagem, esses critérios

Se este produto contiver ingredientes com limites de exposição, pode ser requerido o monitoramento biológico ou da atmosfera do local de trabalho e do pessoal, para determinar

PARÁGRAFO ÚNICO: caso as propostas inscritas não atinjam os critérios de avaliação, conforme cita o item 4.4.2 deste descritivo, o Sesc poderá realizar convites diretos

Neste sistema, é possível manter-se até 2.000 ostras para o estoque de animais já condicionados, e até 1.000 ostras para o condicionamento integral (a partir de ostras previamente

3. Exibição do filtro permite que você digite texto para refinar a lista de arquivos exibidos. Além disso, há um menu suspenso de seleção de coluna que limita o filtro a uma

Para a utilização de algoritmos genéticos é importante a análise dos parâmetros utilizados pois podem influir no comportamento em relação às necessidades do problema.. Os