Medidas com Rela¸c˜ao ao Tempo de Execu¸c˜ao

5.5 Estat´ıstica no Estudo de Parˆametros

6.5.1 Medidas com Rela¸c˜ao ao Tempo de Execu¸c˜ao

As medidas que focam na velocidade com que o algoritmo consegue solucionar o problema s˜ao listadas a seguir:

6.5 Medidas de Desempenho Metodologia de Experimenta¸c˜ao

Tempo de Execu¸c˜ao

O tempo de execu¸cão corresponde à medida do tempo de processamento da metaheur´ıstica em uma dada plataforma computacional. O uso dessa medida é dos mais controversos.

Vários autores (Coffin e Saltzman, 2000; Eiben e Jelasity, 2002; Hooker, 1995; Mc- Geoch, 1996; Rardin e Uzsoy, 2001) não recomendam o uso do tempo de execu¸cão como medida de desempenho. O tempo de execu¸cão é dif´ıcil de reproduzir, mesmo quando se utiliza a mesma configura¸cão da plataforma computacional. Fatores como a linguagem de programa¸cão utilizada, habilidades do programador e processos em execu¸cão em segundo plano, tornam dif´ıcil reproduzir um teste e obter o mesmo tempo de execu¸cão. Outra dificuldade é dimensioná-lo para outra plataforma computacional.

O tempo de execu¸cão é uma medida que pode ser influenciada pela ordem das observa¸cões. É preciso ter o cuidado de aleatorizar a ordem de execu¸cão dos testes para minimizar essa influência.

Alguns dos testes estat´ısticos que podem ser aplicados na análise dos dados coletados assumem que os dados tenham uma distribui¸cão normal. Os tempos de execu¸cão são frequentemente não-normais (Bartz-Beielstein, 2006; Bartz-Beielstein e Preuss, 2010; Chiarandini et al., 2007; Coffin e Saltzman, 2000). De acordo com Chiarandini et al. (2007), o tempo de execu¸cão de metaheur´ısticas frequentemente apresenta uma distribui¸cão exponencial. Eiben e Jelasity (2002) sugerem que para medir a velocidade do algoritmo é melhor usar a quantidade de avalia¸cões executadas até encontrar a melhor solu¸cão.

Mesmo com todos os pontos desfavoráveis ao uso do tempo de execu¸cão como medida de desempenho, Johnson (2002) defende que ele seja coletado e relatado em todos os experimentos, pois pode trazer mais informa¸cões ao leitor. Pode dar ao leitor uma ideia se o tempo de execu¸cão é competitivo ou se um algoritmo é claramente mais rápido do outro.

A natureza estocástica dos AE introduz uma variabilidade aleatória na resposta produzida pelo algoritmo: a solu¸cão obtida pode variar entre uma execu¸cão e outra, e mesmo quando a mesma solu¸cão é obtida, o esfor¸co computacional requerido é, em geral, diferente entre execu¸cões do mesmo algoritmo. Nesse caso, têm-se duas poss´ıveis medidas de desempenho: qualidade da solu¸cão e esfor¸co computacional. Em alguns

Metodologia de Experimenta¸c˜ao 6.5 Medidas de Desempenho

casos, quando a convergˆencia pode ser assegurada, seria poss´ıvel considerar o esfor¸co computacional como o ´unico indicador de desempenho relevante para o algoritmo.

Na avalia¸cão de desempenho de computadores tradicional, Hennessy e Patterson (2006) consideram o tempo de execu¸cão real dos programas como a única medida de desempenho consistente e confiável. Tempos de execu¸cão têm sido continuamente atrapalhados pela variabilidade do desempenho do computador, em especial no caso de programas paralelos que são afetados por concorrências no acesso aos dados, esca- lonamento de processos, mecanismos de sincroniza¸cão, disputas por recursos compar- tilhados, entre outros. Mazouz et al. (2011) confirmam que os processadores multicore trazem ainda mais variabilidade aos tempos de execu¸cão.

Os tempos de execu¸cão podem ser definidos de maneiras diferentes, dependendo do que é contabilizado. A defini¸cão mais direta de tempo é chamada de tempo wall clock, que consiste no tempo decorrido para completar uma tarefa, incluindo o tempo de acesso a disco, acesso a memória, atividades de entrada e sa´ıda, dentre outros. Vários termos denotam esse tempo, tais como, tempo de resposta, tempo decorrido e tempo total de processamento.

Na computa¸cão paralela, o tempo total de processamento é utilizado em uma fór- mula chamada speedup. O speedup é a medida mais utilizada na avalia¸cão do desempenho paralelo.

Quantidade de Avalia¸c˜oes

A quantidade de avalia¸cões corresponde ao número de avalia¸cões executadas pela metaheur´ıstica. Essa medida fornece um bom indicativo do custo computacional do algoritmo, se for considerado que todas as avalia¸cões gastam a mesma quantidade de tempo, e que as avalia¸cões consomem a maior parte do tempo de execu¸cão do algoritmo. Entretanto, quando algumas avalia¸cões demoram mais do que outras, as quantidade de avalia¸cões dos dois algoritmos seriam próximos, mas um algoritmo seria mais lento do que o outro. Quando um algoritmo usa alguma técnica de reparo chamada pela rotina de avalia¸cão, um algoritmo em que o reparo é chamado com frequência terá avalia¸cões que demoram mais do que outro algoritmo em que pouco reparo é necessário. Outro caso em que a quantidade de avalia¸cões pode não ser representativo do custo computacional é quando o tempo gasto com a avalia¸cão é muito pequeno, e outros componentes do algoritmo possuem um grande impacto no tempo de execu¸cão (Eiben

6.5 Medidas de Desempenho Metodologia de Experimenta¸c˜ao

e Jelasity, 2002).

Quantidade de Gera¸c˜oes ´

E uma métrica muito utilizada em AE e é simples de interpretar: quanto menor a quantidade de gera¸cões melhor o seu desempenho computacional. Porém, na compara- ¸cão entre experimentos publicados pode não existir uma rela¸cão direta com o número de avalia¸cões por gera¸cão, uma vez que o tamanho da popula¸cão pode ser diferente. Além disso, o tamanho da popula¸cão pode variar ao longo das gera¸cões para um mesmo algoritmo. A quantidade de gera¸cões é quase sempre inferior à quantidade de avalia¸cões, no melhor caso são equivalentes.

Essa métrica pode não ser válida para compara¸cão de algoritmos distintos, mas poderia ser usada na compara¸cão de duas configura¸cões para uma mesmo algoritmo, como no ajuste de parâmetros do algoritmo.

No documento ANDIA FACULDADE DE ENGENHARIA EL´ ETRICA P ´ OS-GRADUA ¸ C ˜ AO EM ENGENHARIA EL´ ETRICA (páginas 113-116)