Algoritmo Genético Multiobjetivo proposto

4.2 Weighted Linear Combination optimized by Integer Linear Programming

4.3.2 Algoritmo Genético Multiobjetivo proposto

No algoritmo proposto são criados um conjunto externo vazio e a população inicial, conforme pode ser visto na Figura 4.3. O AG evolui a população de indivíduos (cromos- somos) que representam, cada um, uma solução do problema. Neste caso, pretende-se selecionar classificadores que, combinados, apresentem uma precisão elevada. Para isso, foi utilizado um cromossomo binário, em que cada posição (gene) do cromossomo representa um classificador, isto é, a posição um representa o classificador um, a dois o classificador dois e assim por diante. Assim, se as posições três, quatro, sete e nove do cromossomo recebem um, conforme Figura 4.2, a combinação será realizada com as abordagens de classificação três, quatro, sete e nove, mostradas na Tabela 4.1.

Figura 4.2: Representação do genoma, 1 signiﬁca presença e 0 ausência de

determinada abordagem de classiﬁcação.

Uma vez definidos quais classificadores serão combinados, o próximo passo é efetuar a combinação deles, utilizando o método proposto. O WLC-ILP é chamado, realizando a combinação entre os classificadores selecionados e gerando dois outputs: a acurácia da classificação e o respectivo intervalo de confiança. Desta forma, utilizando estes dois valores, pode-se analisar se de fato uma combinação possui precisão significativamente maior que outra, ou seja, se elas são estatisticamente diferentes.

O indivíduo é avaliado conforme as condições descritas na Seção 3.3.3. Se estas condi- ções forem atendidas o indivíduo passará a fazer parte do Conjunto de Pareto (conjunto

4. METODOLOGIA

externo) e receberá um valor de fitness alto. Este é um algoritmo genético de estado ﬁxo steady-state, ele mantém o tamanho de sua população constante, substituindo ape- nas uma porção da população a cada nova geração (Brownlee, 2011; Goldberg, 1989). Baseado em seus valores de fitness, os indivíduos são selecionados pelo método de sele- ção Roulette Wheel no qual a probabilidade de selecionar um indivíduo é proporcional à sua fitness.

A combinação dos indivíduos é feita pelo processo de cruzamento de um ponto. No cruzamento de um ponto, os dois pais são separados em um determinado ponto de cruzamento. Na sequencia, um ﬁlho é produzido ao juntar a segunda parte do segundo pai à primeira parte do primeiro pai. Após o cruzamento, acontece a mutação que é um importante método para a preservação da diversidade das soluções candidatas. Os mecanismos de seleção, crossover e mutação, são utilizados para evoluir a população, gerando indivíduos mais aptos até que o número máximo de gerações seja alcançado.

Figura 4.3: Fluxograma do Algoritmo Genético baseado na Fronteira de Pareto

Cap´ıtulo 5

Experimentos

Neste capítulo são descritas as bases de dados utilizadas, os critérios de avaliação, os parâmetros e os experimentos realizados. O protocolo de experimentação foi definido baseando-se no procedimento padrão de separar conjuntos de treinamento, teste e va- lidação. O procedimento de classificação foi realizado 30 vezes de forma que em cada vez os conjuntos de treinamento, teste e validação foram construídos aleatoriamente, obtendo-se como resultado final a média a partir de cada execução.

Para realização dos experimentos, um framework em MATLAB foi construído no qual um conjunto de operações realiza todo o processamento das imagens hiperespec- trais. Na aplicação do método PCA, foi utilizada a ferramenta Hyperspectral Image

Analysis Toolbox (HIAT) (Arzuaga-Cruz et al., 2004) disponível para o ambiente MA-

TLAB (MATLAB, 2008). O SVM foi implementado a partir da biblioteca A Library for Support Vector Machines (LIBSVM) (Chang and Lin, 2011) enquanto o RN e KNN do próprio MATLAB (MATLAB, 2012) foram usados para implementação do MLP e KNN, respectivamente. O AGM foi escrito na linguagem C++ com a biblioteca GAlib: A C++ Library of Genetic Algorithm Components (GALIB) (of Technology , MIT). O programa linear do método WLC-ILP foi resolvido através do software livre GLPK (GLPK) e pelo CPLEX (cpl, 2010), versão acadêmica, para MATLAB.

5.1 Bases de Dados

Dois diferentes tipos de bases de dados hiperespectrais foram utilizados, com a ﬁnalidade de veriﬁcar o grau de generalização das abordagens propostas. As base de dados Indian

5. EXPERIMENTOS

Pines e Pavia University, ou seja, as imagens hiperespectrais foram adquiridas pelos

sensores AVIRIS (Green et al., 1998) e ROSIS (Gege et al., 1998), respectivamente, e são detalhadas a seguir:

1 A base de dados Indian Pines refere-se a uma área de vegetação e cultivos na região Noroeste de Indiana, EUA, possuindo dimensões de 145 × 145 pixels, com resolução espacial de 20m por pixel, e 220 canais que cobrem uma faixa espectral de 0, 4µm a 2; 5µm. Na Figura 5.1 pode ser vista uma composição Red-Green-Blue (RGB) em false color usando as bandas espectrais: 50 para o canal R, 20 para o G e 10 para o B. O Ground-truth é mostrado na Figura 5.1. Essa base de dados possui vinte bandas ruidosas (canais 104-108, 150-163, e 220) que, geralmente, são removidas (Camps-Valls et al., 2006), permanecendo 200 canais espectrais para os experimentos. A Tabela 5.1 mostra as dezesseis classes de interesse dessa base de dados e a quantidade de amostras por classe. Mais detalhes podem ser ser encontrados em (Fauvel, 2007) e (Tarabalka, 2010).

2 A base de dados de Pavia University é a imagem de uma área urbana referente à Universidade de Pavia, Itália. A imagem tem dimensões de 610 × 340 pixels com resolução espacial de 1, 3m por pixel, e 115 canais sobre uma faixa espectral de 0, 43µm a 0, 86µm. Doze canais ruidosos são removidos, permanecendo 103 bandas para os experimentos. A Figura 5.2 mostra uma composição RGB em false

color e a Figura 5.2, o Ground-truth dessa imagem. A Tabela 5.2 mostra as nove

classes de interesse da imagem bem como a quantidade de amostras por classe. Mais detalhes podem ser ser encontrados em (Fauvel, 2007).

É importante notar que o background (áreas coloridas na cor branca nas Figuras 5.1 e 5.2) não é uma classe, sendo usado apenas para identiﬁcar amostras não rotuladas. Desta forma, tais amostras serão usadas somente para a construção do mapa temático completo, não fazendo parte de cálculos estatísticos, como a acurácia da classiﬁcação.

No documento Sandro Luiz Jailson Lopes Tinôco Universidade Federal de Ouro Preto (páginas 57-60)