An´ alise e Compara¸c˜ ao de Resultados em AEMO

3.4 Algoritmos Evolucion´ arios Multiobjetivo

3.4.2 An´ alise e Compara¸c˜ ao de Resultados em AEMO

As medidas de desempenho de algoritmos evolucionários multiobjetivo levam em con- sidera¸cão os objetivos da otimiza¸cão de um problema multiobjetivo, isto é, a distância

da fronteira de Pareto ótima, e uma boa distribui¸cão e espalhamento dos pontos. Exis- tem basicamente três aspectos para a análise da eficiência do desempenho de AEMO, são eles: ranking de dominância, fun¸cão emp´ırica de conquista (empirical attainment function) e indicadores de qualidade sobre a fronteira de Pareto. A seguir algumas medidas de compara¸cão sobre estes aspectos serão brevemente descritos.

3.4.2.1 Ranking de Dominˆancia

Considerando-se todos os conjuntos de aproxima¸cão resultantes das execu¸cões de cada um dos AEMO que se deseja comparar o desempenho é poss´ıvel determinar uma rela¸cão de ordem parcial entre esses conjuntos. Ou seja, pode-se determinar que alguns conjuntos são melhores, piores ou incomparáveis com rela¸cão a outros. Essa ordem parcial pode ser utilizada para determinar um rank para cada um dos elementos dos conjuntos, quanto menores os ranks melhor é o conjunto. Esses ranks podem ser relativos a diferentes rela¸cões de dominância, tais como:

• Por quantos indiv´ıduos um indiv´ıduo ´e dominado? • Quantos indiv´ıduos um indiv´ıduo domina?

• Qual o valor obtido pela aplica¸c˜ao de algum indicador a um indiv´ıduo?

Baseando-se nos ranks obtidos por cada AEMO e utilizando testes estat´ısticos basea- dos em rank pode-se inferir qual ou quais AEMO s˜ao estatisticamente melhores.

O ranking de dominância se baseia somente no conceito de dominância de Pareto e, portanto, é independente de informa¸cões de preferência (diferentemente de outras métricas como o hipervolume que será tratado adiante). Esta métrica é recomendada porque se um AEMO obtém diferen¸ca significativa nesta métrica já é poss´ıvel concluir que ele é melhor ou pior que os demais (KNOWLES; THIELE; ZITZLER, 2006). Caso a diferen¸ca não seja significativa deve-se utilizar as outras métricas. De qualquer modo, outras métricas podem agregar mais informa¸cões sobre as diferen¸cas de desempenho.

3.4.2.2 Fun¸c˜ao Emp´ırica de Conquista (Empirical Attainment Function )

Uma fun¸cão de conquista (attainment function) é uma medida de momento de primeira ordem (como a média e a mediana) para a avalia¸cão de resultados de AEMO (FONSECA; FONSECA; HALL, 2001). Elas requerem dados estat´ısticos sobre a evolu¸cão dos AEMO

para apresentar uma medida gráfica da eficiência destes algoritmos. Uma fun¸cão de conquista emp´ırica define uma superf´ıcie que divide o espa¸co objetivo em metas (pontos), como por exemplo a fronteira de Pareto ótima, e a probabilidade de atingir cada meta.

Pode-se utilizar esta métrica para identificar em quais regiões do espa¸co objetivo um conjunto de aproxima¸cão é melhor que o outro e qual a probabilidade disto acontecer. Por aproximar a distribui¸cão de probabilidade de um algoritmo estocástico, uma fun¸cão de conquista pode responder perguntas do tipo: qual a probabilidade de se encontrar solu¸cões que dominem um determinado ponto em uma única execu¸cão ou em quantas execu¸cões, aproximadamente, serão encontradas solu¸cões dominadas por um determinado ponto. Nesse sentido a fun¸cão de conquista é uma métrica mais robusta que as demais, porém possui um custo computacional elevado (COELLO; LAMONT; VELDHUIZEN, 2007).

Um exemplo do uso de fun¸cão de conquista para a compara¸cão entre conjuntos de aproxima¸cão da fronteira de Pareto pode ser visto na Figura 19. É poss´ıvel observar que o conjunto A é melhor que o conjunto B na região central do espa¸co objetivo, enquanto o conjunto B apresenta melhores resultados na extremidades do espa¸co objetivo. As diferen¸cas são representadas em escalas de cinza: quanto mais escura a região maior é a diferen¸ca4.

Figura 19: Exemplo do uso de fun¸c˜ao de conquista (KNOWLES; THIELE; ZITZLER, 2006)

Este método de análise e compara¸cão dos resultados não foi utilizado neste trabalho devido a sua complexidade de implementa¸cão e apresenta¸cão.

3.4.2.3 Indicadores de Qualidade sobre a Fronteira de Pareto

Os indicadores de qualidade são fun¸cões que atribuem um número real a um ou mais conjuntos de aproxima¸cão. Os indicadores de qualidade podem ser unários, quando analisam somente um conjunto, ou podem ser n-ários, quando analisam de uma vez n conjuntos de aproxima¸cão.

Sua modelagem matemática unifica vários indicadores já existentes na literatura e apresenta um resultado bastante interessante: nem todos os indicadores de qualidade podem ser utilizados para fazer afirma¸cões como A ≺≺ B, ou “o conjunto de solu¸cões A é estritamente melhor que o conjunto de solu¸cões B”. Existe até o caso de indicadores que afirmam que A supera B mesmo quando todas as solu¸cões de A são dominadas por uma ou mais solu¸cões de B - um indicador simples para entender este caso é o indicador “número de solu¸cões”, que mapeia um conjunto de solu¸cões no número de solu¸cões do conjunto, e onde se entende que quanto maior o número de solu¸cões, melhor. Indicadores que podem afirmar “A é melhor que B” mesmo quando B ≺≺ A (ou seja, podem dar indica¸cões falsas a respeito de qual algoritmo é melhor) são chamados indicadores Pareto non-compliant (ou indicadores Pareto não-concordantes).

Alguns indicadores unários são bastante utilizados por possu´ırem algoritmos publi- camente dispon´ıveis para seu cálculo e por serem Pareto compliant, dentre eles estão (KNOWLES; THIELE; ZITZLER, 2006): o indicador hipervolume (IH),o indicador ε- unário (Iε),o indicador ε-unário (Iε +), os indicadores R2 (IR2) e R3 (IR3). Todos eles são

executados em rela¸cão a um conjunto de referência R, normalmente um conjunto melhor do que os que estão sendo analisados. Mais detalhes conforme descrito a seguir.

• Indicador Hipervolume (IH):

este indicador proposto por Zitzler e Thiele (1999) mede o hipervolume (o qual deve ser maximizado) da por¸cão do espa¸co objetivo que é fracamente dominada por um conjunto de aproxima¸cão A. Para que esse cálculo possa ser feito, o espa¸co de objetivos deve ser limitado por um ponto limitante, chamado ponto nadir, dominado por todos os outros pontos. Uma das grandes desvantagens do indicador IH é o tempo computacional para seu cálculo, que cresce exponencialmente com o número de objetivos. Cabe observar que algumas implementa¸cões deste indicador consideram a diferen¸ca do hipervolume com rela¸cão a um conjunto de referência (R), neste caso o valor resultante deve ser minimizado. Um exemplo do indicador IH pode ser visto na Figura 20. Nesta figura observa-se que o limite das áreas se dá pelo ponto de referência (reference) e que a área dominada pelo ponto A é menor do que a área dominada pelo ponto B, ou seja, I_H(A) < I_H(B);

Figura 20: Exemplo do indicador hipervolume (KNOWLES; THIELE; ZITZLER, 2006).

• Indicadores Épsilon-Unário (Iε) e (Iε +): os indicadores ε-unário aditivo (Iε +) e multiplicativo (Iε) foram propostos por Zitzler et al. (2003)5. O indicador calcula o menor valor e que, quando multiplicado/adicionado a todas as solu¸cões do conjunto de referência R, faz com que este passe a ser fracamente dominado. Assim, deseja- se que a sa´ıda deste indicador seja minimizada. Este indicador é barato de ser computado;

• Indicadores (IR2) e (IR3): foram propostos por Hansen e Jaszkiewicz (1998). Se

utilizam de uma série de fun¸cões de utilidade (utility functions) para calcular várias poss´ıveis preferências do tomador de decisão e analisar quão bem elas estão sendo atingidas. Para isso, são utilizados vetores de escalariza¸cão que parametrizam as fun¸cões de utilidade. A Equa¸cão 3.4.2.3 define matematicamente este indicador. A utilidade u( ˜λ , B) do conjunto de aproxima¸cão A, no vetor de pontos escalarizados ˜λ ´

e a distância m´ınima entre um ponto do conjunto A e um ponto de referência (esta distância é medida através da proje¸cão deste ponto no vetor de escalariza¸cão);

R2 = ∑ ˜λ ∈Vu( ˜λ ,B)−u( ˜λ ,A)

|˜λ | (3.6)

Os indicadores de qualidade primeiramente reduzem os conjuntos de aproxima¸cão a um único valor de qualidade. Na sequência, testes estat´ısticos são aplicados sobre as amostras destes valores de qualidade. Os testes estat´ısticos para a compara¸cão entre os indicadores de qualidade serão os mesmos descritos na Subse¸cão 3.2.1.

No documento Algoritmos culturais para o problema do despacho de energia elétrica (páginas 76-81)