Algoritmos Evolucion´ arios Mono-objetivo

Conforme visto no Cap´ıtulo 2, a nomenclatura Algoritmos Evolucionários não é única. Neste Cap´ıtulo, optou-se novamente pelo termo Algoritmos Evolucionários para tratar os algoritmos relacionados à busca em um espa¸co de solu¸cões. A maioria dos algoritmos evolucionários foi proposta para resolver problemas onde um único objetivo é considerado (otimiza¸cão mono-objetivo). Para mais detalhes ver Jong (2009), Engelbrecht (2007), Grosan e Abraham (2007), Fogel (2005), Cordon, Herrera e Stutzle (2002), Dasgupta Dipankar; Michalewicz (2001), Mitchell e Taylor (1999), Bäck, Schwefel e Informatik (1996), Spears et al. (1993). Um levantamento bibliográfico mais amplo de algoritmos

idealizados para solucionar problemas mono-objetivo está fora do escopo desta tese, mas alguns casos especiais são discutidos nas Se¸cões 2.1.3, 2.2.7 e 4.3.

3.2.1 Testes Estat´ısticos

Os resultados de algoritmos evolucionários mono-objetivo são estocásticos e podem ser modelados como variáveis aleatórias. Para comparar dois algoritmos evolucionários utilizam-se testes estat´ısticos sobre indicadores (média, mediana, etc.) das amostras co- letadas durante as execu¸cões dos algoritmos.

Segundo Garc´ıa et al. (2009), na compara¸cão entre diferentes abordagens evolu- cionárias há uma série de condi¸cões que devem ser assumidas para o uso seguro de testes estat´ısticos paramétricos:

• Independência: Em estat´ıstica, dois eventos são independentes quando o fato de um ocorrer não modifica a probabilidade de ocorrência do outro.

• Normalidade: Uma observa¸cão é normal quando seu comportamento se assemelha a uma distribui¸cão Gaussiana com um certo valor de média µ e variância σ . Um teste de normalidade aplicado sobre uma amostra pode indicar a presen¸ca ou ausência destas condi¸cões nos dados observados. Garc´ıa et al. (2009) propõem três testes de normalidade:

– Kolmogorov-Smirnov: Este teste compara a distribui¸cão acumulada dos dados observados com a distribui¸cão acumulada esperada para uma distribui¸cão Gaussiana, obtendo um p-valor1 baseado nas duas discrepâncias;

– Shapiro-Wilk: Este teste analisa os dados observados para computar o n´ıvel de simetria e formato da curva com o objetivo de computar a diferen¸ca com re- speito a uma distribui¸c˜ao Gaussiana obtendo o p-valor da soma dos quadrados destas discrepˆancias;

– D’Agostino-Pearson: Este teste, primeiro computa a falta de simetria e o formato da curva para quantificar quão longe de uma distribui¸cão Gaussiana os dados estão em termos de assimetria e formato. Então o teste calcula o quanto cada um destes valores difere do valor esperado para uma distribui¸cão Gaus- siana, e computa um único p-valor a partir da soma destas discrepâncias. • Homocedasticidade (Homoscedasticity): Esta propriedade indica a existência da

hipótese de igualdade das variâncias. O teste de Levene (LEVENE, 1960) é usado 1_{O p-valor de um teste estat´ıstico indica a confiabilidade do teste.}

para verificar se as amostras testadas apresentam homogeneidade (homoscedasticity) ou heterogeneidade de variˆancias (heteroscedasticity).

Assumindo que as condi¸cões descritas anteriormente são satisfeitas, pode-se aplicar diferentes testes estat´ısticos paramétricos: teste-t (CASELLA; BERGER, 2001) ou teste-z (CASELLA; BERGER, 2001) para a compara¸cão entre dois algortms (amostras); quando se deseja comparar três ou mais algoritmos pode-se utilizar o teste ANOVA (CASELLA; BERGER, 2001).

No caso da viola¸cão das condi¸cões sugeridas por Garc´ıa et al. (2009), deve-se utilizar um teste não-paramétrico. Os testes não-paramétricos são considerados ferramentas úteis quando os dados resultantes de um experimento não satisfazem as condi¸cões discutidas anteriormente. No caso de duas amostras, os testes não paramétricos de Wilcoxon signed- rank ou Mann-Whitney rank sum podem ser utilizados (GIBBONS, 1985). Em caso de dados não-pareados e um conjunto com mais de duas amostras, o teste de Kruskal-Wallis é bem aceito quando as condi¸cões para testes paramétricos são satisfeitas e apresenta um poder maior na presen¸ca de distribui¸cões assimétricas, outliers, etc.

O teste de Kruskal-Wallis também é baseado na média dos ranks obtidos por cada amostra. Considerando ni como sendo o tamanho da i-ésima amostra e N como sendo a soma dos tamanhos de todas as amostras, o teste primeiramente obtém o rank de cada uma das amostras (Ri, para a i-ésima amostra) e calcula o indicador H conforme a Equa¸cão 3.2.

H = 12

N∗ (N + 1)∗

∑

R2_i

n_i − 3 ∗ (N + 1) (3.2)

Se a hipótese nula de que todas as amostras apresentam a mesma distribui¸cão for verdadeira então o indicador H pertence à distribui¸cão χ2 com o número de amostras - 1 graus de liberdade. Assim a hipótese nula é rejeitada se o valor de H calculado for grande demais para pertencer a distribui¸cão.

Como exemplo do uso do teste de Kruskal-Wallis, pode-se observar a Figura 14. Pela análise dos intervalos de confian¸ca entre as médias de ranks das três amostras, verifica-se que as amostras 1 e 2 são consideradas semelhantes e ambas estatisticamente diferentes da amostra 3. Ao considerar que os ranks mostrados na Figura 14 indicam a qualidade de algoritmos evolucionários sendo comparados, e quanto mais baixos os valores de rank melhor são os algoritmos associados, tem-se que os algoritmos 1 e 2 possuem desempenho semelhante e ambos são superiores ao algoritmo 3.

Figura 14: Resultado da compara¸c˜ao entre trˆes amostras.

Apesar dos testes de Kruskal-Wallis e Mann-Whitney serem eficientes, existem formas mais modernas e eficiente para lidar com a n˜ao-normalidade dos dados, como o Bootstrap (MOORE et al., 2003).

A idéia de um método Bootstrap vem do fato de que uma amostra representa a popula¸cão da qual ela foi amostrada. Então, re-amostragens desta amostra representam o que seria obtido se várias amostragens da popula¸cão fossem feitas. A distribui¸cão de Bootstrap de um indicador é a distribui¸cão obtida para aquele indicador através das várias re-amostragens. Ela representa a distribui¸cão estat´ıstica do indicador baseada em várias amostragens da popula¸cão. Isto é válido por causa do princ´ıpio de plug-in que diz que se pode utilizar um indicador calculado da amostra para aproximar o mesmo indicador para a popula¸cão (MOORE et al., 2003). Por exemplo, pode-se usar a média da amostra para estimar a média da popula¸cão. Como os métodos Bootstrap não impõem nenhuma restri¸cão sobre a amostra, eles podem ser utilizados em qualquer tipo de dado. Geralmente, os métodos Bootstrap são utilizados para calcular intervalos de confian¸ca dos indicadores. Estes intervalos possuem equivalência com os testes estat´ısticos: se um valor não está contido no intervalo de confian¸ca de um indicador então pode-se afirmar com a mesma precisão com que o intervalo foi gerado que o valor não é equivalente ao indicador (WOOD, 2005). Por exemplo, suponha que um intervalo de confian¸ca para a média da amostra de um algoritmo foi obtido por um método de Bootstrap com 95% de confiabilidade como sendo [10 - 20]. Deseja-se então testar se o valor de média X (obtido da amostra de um outro algoritmo) é estatisticamente equivalente à média do primeiro algoritmo. Para isso, basta testar se X está ou não dentro do intervalo: se ele estiver as médias são equivalentes, senão pode-se afirmar com 95% de confian¸ca que existe diferen¸ca significativa entre as médias dos dois algoritmos.

Considerando as quest˜oes levantadas anteriormente, optou-se neste trabalho pelo uso do teste Kruskal-Wallis (CASELLA; BERGER, 2001; KNOWLES; THIELE; ZITZLER,

2006) para a compara¸cão entre as abordagens mono-objetivo e multiobjetivo propostas (três ou mais amostras sendo comparadas). Para as abordagens mono-objetivo também foi utilizada a abordagem Bootstrap (BRADLEY; TIBSHIRANI, 1994).

3.3 Princ´ıpios de Otimiza¸c˜ao Multiobjetivo no Con-

No documento Algoritmos culturais para o problema do despacho de energia elétrica (páginas 62-66)