Indicadores de qualidade - I-Multi: Iterated Multi-Swarm

6.3 I-Multi: Iterated Multi-Swarm

7.1.3 Indicadores de qualidade

A análise emp´ırica visa medir aspectos como convergência e diversidade da busca de cada nova estratégia proposta em rela¸cão à fronteira de Pareto. A sele¸cão dos indicadores de qualidade utilizados para medir o desempenho da busca de MOEAs é um grande obstáculo na Otimiza¸cão com Muitos Objetivos. Para a medi¸cão desses aspectos são utilizados indicadores de qualidade. Indicadores de qualidade são fun¸cões que mapeiam i conjuntos de solu¸cões em um número real [89]. Normalmente, é definido i = 1, um indicador unário ou i = 2, indicador binário. Na literatura, diferentes indicadores de qualidade são utilizados [1] [82] [46], porém não existe consenso sobre qual conjunto de medidas possibilita uma melhor interpreta¸cão dos resultados. Dentre esses indicadores se destacam o Hipervolume, o Epsilon [89], o Generational Distance (GD), Spacing [84], Inverted Generational Distance (IGD) [20], entre outros.

Um dos maiores problemas na medi¸cão de desempenho de MOEAs em Problemas com Muitos Objetivos refere-se à dificuldade de visualiza¸cão da fronteira aproximada gerada (P Faprox), já que com mais de três fun¸cões objetivos não há uma maneira natural de se esbo¸car o conjunto de pontos obtido. Isso dificulta o processo de entendimento dos resultados dos indicadores de qualidade. Além disso, há dificuldade na interpreta¸cão de

alguns resultados esperados, por exemplo, algumas técnicas induzem a gera¸cão dos pontos para uma região mais próxima ao joelho da fronteira de Pareto.

Em nossos experimentos, já que estamos trabalhando com problemas de benchmark onde a fronteira de Pareto pode ser obtida de forma anal´ıtica, é utilizada uma combina¸cão de um conjunto de métricas que buscam medir a distância em rela¸cão à fronteira de Pareto.

O uso desse conjunto de métricas tem como objetivo observar se a busca dos algoritmos propostos se deteriora em termos de convergência e diversidade quando o número de objetivos cresce. Além disso, são utilizados indicadores de qualidade com o objetivo espec´ıfico de identificar onde está localizada a P F_aprox em rela¸cão a pontos de referência, como por exemplo, o joelho da fronteira de Pareto. Os indicadores utilizados são descritos a seguir:

Generational Distance (GD) mede o quão próximo o conjunto de aproxima¸cão gerado (P F_aprox) está em rela¸cão à fronteira de Pareto real (P F_real). O GD é uma medida de minimiza¸cão. Se o GD é igual a 0, todos os pontos doP F_aproxpertencem à fronteira de Pareto. O GD permite observar se o algoritmo converge para alguma região da fronteira de Pareto. A Equa¸cão 7.1 define o GD, onde n é o número de solu¸cões pertencentes à P F_aprox e dâ,r_i é a menor distância Euclidiana entre o ponto i pertencente à P F_aprox e um ponto da P F_real. A Figura 7.4 mostra um exemplo do cálculo do GD. Para cada ponto do conjunto de aproxima¸cão é calculada a menor distância em rela¸cão à fronteira de Pareto,dâ,r_i , e é feita a soma dessas distâncias. O exemplo da figura apresenta um bom GD, pois o conjunto de aproxima¸cão está próximo à fronteira de Pareto, logo há uma boa convergência.

GD =

pPn i=1 d^a,r_i

n (7.1)

Convergence foi inicialmente apresentada em [40]. Esse indicador de qualidade mede a menor distância de um ponto daP F_aproxaP F_real. Ele é utilizado para auxiliar a análise do GD para medir convergência. A menor distância de um ponto é a menor contribui¸cão do cálculo do GD, assim é poss´ıvel verificar se a busca alcan¸cou a fronteira de Pareto em pelo menos uma região da fronteira.

Figura 7.4: Exemplo do c´alculo do GD.

Figura 7.5: Exemplo do c´alculo do IGD.

Inverted Generational Distance (IGD) mede a distância m´ınima entre cada ponto da fronteira de Pareto real em rela¸cão ao conjunto de aproxima¸cão gerado. O IGD é uma medida de minimiza¸cão. O IGD permite observar se P F_aprox converge para a fronteira Pareto real e se este conjunto é diversificado. A Equa¸cão 7.2 define o IGD, onde n é o número de solu¸cões pertencentes à P F_aprox e d^r,a_i é a menor distância Euclidiana entre o pontoipertencente àP Freal e um ponto daP Faprox. A Figura 7.5 mostra um exemplo do cálculo do IGD. Para cada ponto da fronteira de Pareto é calculada a menor distância em rela¸cão ao conjunto de aproxima¸cão, dâ,r_i , e é feita a soma dessas distâncias. O exemplo da Figura 7.5 apresenta um bom IGD, pois o conjunto de aproxima¸cão está próximo à fronteira de Pareto e também bem distribu´ıdo, logo há uma boa convergência e uma boa diversidade.

IGD=

pP2 n i=1 d^r,a_i

n (7.2)

No entanto nem sempre é poss´ıvel obter uma visão real da diversidade da busca uti-lizando somente o IGD. Em alguns casos, onde uma P F_aprox está limitada a uma região

espec´ıfica da fronteira e muito próximo ao P Freal (o que implica num valor muito baixo de GD), o IGD tende também a ser pequeno, já que a contribui¸cão dos pontos da P F_real dessa região é muito pequena para o cálculo do IGD. Nessa situa¸cão, um valor baixo de IGD pode implicar num interpreta¸cão errada de boa diversidade. Assim, para ajudar na análise da diversidade da busca, é proposto um novo indicador de qualidade chamado de Largest Distance.

Largest Distance (LD) é o oposto do indicadorConvergence. Ao invés de se obter a menor distância de um ponto do P Faprox em rela¸cão à P Freal, é obtida a maior distância de um ponto daP F_realem rela¸cão àP F_aprox. Essa medida indica a maior contribui¸cão de um ponto no cálculo do IGD. Com essa medida, umaP F_aprox concentrada numa pequena região da fronteira de Pareto irá gerar um alto valor de LD, já que estará longe de outras regiões daP F_real. Da mesma forma que, uma P F_aprox bem diversificada irá gerar valores baixos de LD, já que está próxima de diferentes regiões da P F_real.

Spacing mede o intervalo de variância entre solu¸cões vizinhas em um conjunto de aproxima¸cão. É uma medida de minimiza¸cão. Se o valor do Spacing é igual a 0, todas as solu¸cões estão igualmente distribu´ıdas. Se a P F_aprox contiver uma ou duas solu¸cões o valor é igual a zero e quanto menor o número de solu¸cões, mais fácil o algoritmo consegue controlar o Spacing de seu conjunto de aproxima¸cão. A Equa¸cão 7.3 define o Spacing, onde n é o número de solu¸cões pertencentes à P F_aprox, d_i =min_j(|f₁ⁱ(x)−f₁^j(x)|+...+

Além dos indicadores de qualidade baseados na distância entre as solu¸cões geradas, esta tese utiliza dois indicadores com objetivo de auxiliar a visualiza¸cão daP F_aprox. Esses indicadores medem a distribui¸cão dos pontos daP F_aproxem rela¸cão a pontos de referência.

Assim, é poss´ıvel observar como diferentes métodos estão distribu´ıdos no espa¸co de obje-tivos.

A distribui¸cão da distância Tchebycheff é utilizada para medir a distribui¸cão da

P Faprox em rela¸cão ao joelho da fronteira de Pareto [20]. Joelho é o ponto localizado no maior arqueamento da curva daP F_real. Estudos apresentados em [24] e [47] afirmam que tomadores de decisão, em geral, preferem os pontos no centro da fronteira. Esse indicador calcula a distância de Tchebycheff entre todos os pontos daP F_aprox e o joelho da P F_real. A distância de Tchebycheff é uma métrica definida pela distância entre dois vetores.

O cálculo da distância é obtido através da maior diferen¸ca entre todas as coordenadas das dimensões, definida pela Equa¸cão 7.4.

d(z, z^∗, λ) = max_1≤j≤m{λ_j|z_j^∗−z_j|} (7.4)

onde z^∗ é o joelho da fronteira, z é um ponto do P F_aprox, m é o número de objetivos e λ_j = 1/R_i, onde R_j é o intervalo para j−ésimo objetivo da fronteira de Pareto. Após o cálculo da distância de todos os pontos da P F_aprox é gerado um histograma com a dis-tribui¸cão desses valores. Curvas que se localizam perto de pequenos valores da distância indicam uma distribui¸cão dos pontos próximos ao joelho, enquanto curvas mais alongadas indicam uma distribui¸cão mais diversificada. A Figura 7.6 mostra um exemplo com três distribui¸cões. O eixo x indica o valor da distância de Tchebycheff, o eixo y a quantidade de solu¸cões localizadas nessa distância. A primeira curva possui um pico em um valor com baixa distância, isso indica uma distribui¸cão dos pontos perto do joelho. A segunda curva também possui os pontos concentrados em poucos valores de distância, porém loca-lizados longe do joelho. A terceira curva é mais alongada, contendo valores em diferentes distâncias. Essa distribui¸cão apresenta pontos mais diversificados.

Além da distribui¸cão da distância de Tchebycheff é utilizada outra medida que busca mostrar a distribui¸cão do P F_aprox, porém ao invés de ser utilizado o joelho da busca, é utilizado um ponto de referência.

Distribui¸cão dos pontos sobre um ponto de referência busca medir como di-ferentes P F_aprox geradas por diferentes algoritmos estão distribu´ıdas sobre um ponto de referência. Assim, dadas diferentes P F_aprox e um ponto de referência: primeiro é calcu-lada a distância euclidiana entre todos os pontos, de todos os algoritmos, e o ponto de

Figura 7.6: Exemplo da distribui¸c˜ao deTchebycheff.

referência. Após, são obtidos o menor e o maior valores da distância. Em seguida, o inter-valo variando entre o menor e o maior inter-valor é dividido em 10 intervalos, correspondendo a regiões de proximidade ao ponto de referência. Por fim, o indicador conta para cada algoritmo quantos pontos da P F_aprox estão localizados em cada região de proximidade.

Algoritmos que gerarem mais pontos em intervalos menores (10% ou 20%) mais próximos do ponto de referência, estão mais próximos deste ponto. Da mesma forma que no cálculo da distância de Tchebycheff essas distribui¸cões são tra¸cadas num histograma e é feita a mesma análise apresentada no exemplo anterior.

Dentre os indicadores apresentados nessa se¸cão, essa tese irá focar nos valores de GD e IGD. O GD será utilizado para medir a convergência dos algoritmos utilizados, enquanto o IGD será utilizados para medir a diversidade. Os demais indicadores serão utilizados para auxiliar a análise do GD e do IGD.

Na valida¸cão das técnicas propostas, cada algoritmo é executado várias vezes e os re-sultados dos indicadores de qualidade são comparados utilizando o teste de Friedman [32].

O teste de Friedman é um teste estat´ıstico não paramétrico utilizado para a compara¸cão de múltiplos conjuntos de dados. Nesse teste as observa¸cões entre os blocos podem ser rankeadas. Por exemplo, o conjunto de execu¸cões de cada algoritmo gera um bloco de dados para cada medida que é independente e sem intera¸cão, pois a cada algoritmo é executado separadamente, e só pode ser obtido um rank entre os valores das medidas. No teste não se utilizam os valores dos dados na compara¸cão, mas sim os rankings obtidos

para cada amostra no conjunto de dados. A hipótese nula é que não existe diferen¸ca entre os algoritmos analisados. Assim, o teste mostra se há uma diferen¸ca entre os conjuntos de dados analisados. Em nossa análise ele é utilizado com 5% de n´ıvel de significância. O pós-teste é efetuado através de fun¸cões da ferramenta R [78]. É utilizado o pacote pgirmess da ferramenta R. O teste de Friedman é executado através da fun¸cão friedman.test que recebe como parâmetro o conjunto de dados. O pós-teste é executado através da fun¸cão friedmanmc. O pós-teste indica se há diferen¸ca estat´ıstica entre os diferentes blocos do conjuntos de dados, para identificar quais conjuntos de dados obtiveram os melhores va-lores são utilizados gráficos boxplots. Um boxplot é um gráfico utilizado para descrever grupos de dados. Dado um conjunto de dados, este gráfico apresenta a mediana, os quartis inferiores e superiores (vigésimo quinto e septuagésimo quinto percentis, respectivamente), os valores limites do conjunto de dados (maiores e menor valores) e os poss´ıveis outliers do conjunto.

No documento ANDRÉ BRITTO DE CARVALHO NOVAS ESTRATÉGIAS PARA OTIMIZAÇ ÃO POR NUVEM DE PARTÍCULAS APLICADAS A PROBLEMAS COM MUITOS OBJETIVOS (páginas 132-138)