• Nenhum resultado encontrado

Análises estatísticas de experimentos computacionais com AGs

6 RESULTADOS E DISCUSSÕES

6.1 Análise de reabilitação através da otimização convencional – estudo

6.1.1 Análises estatísticas de experimentos computacionais com AGs

Uma das principais dificuldades na utilização dos AGs é determinar parâmetros de entrada adequados (dimensão da população, número máximo de gerações, probabilidade de recombinação e probabilidade de mutação) de forma a garantir que a solução obtida seja obtida. Em geral, pesquisadores realizam análises de sensibilidades como procedimento inicial de forma a identificar tais parâmetros.

Neste trabalho, uma metodologia científica foi buscada de forma a dar suporte à investigação dos fatores que mais interferem nesse processo (LIN e RARDIN, 1980; PETROVSKI, WILSON e McCALL, 1998), para que, posteriormente, apenas esses parâmetros possam ser avaliados criteriosamente.

As características estocásticas dos AGs estão presentes no processo de variação do método (busca por regiões do espaço inexploradas) através dos seus operadores genéticos (recombinação e mutação). Esses operadores desenvolvem um papel importante na eficiência do método. Infelizmente, não existe expressão analítica ou um modelo teórico que descreva a performance dos AGs em termos dos seus fatores (dimensão da população, número de gerações, probabilidade de recombinação e probabilidade de mutação). Uma maneira de estimar os efeitos que esses fatores promovem sobre a solução final é utilizar análises estatísticas (planejamentos fatoriais). Neste trabalho, foi utilizado o planejamento composto central ortogonal (baseado nos planejamento 3k), descrito no item (5.7.1.3), ao invés dos planejamentos fatoriais 2k. Essa escolha se deve ao fato de que os planejamentos 2k permitem que se investiguem apenas dois níveis (alto e baixo) para um determinado fator k. Por exemplo, considere uma situação hipotética onde se quer conhecer a influência de um determinado fator k (por exemplo, probabilidade de recombinação) na solução final. Se for utilizado um

planejamento fatorial 2k, as análises ficariam restritas ao estudo de um nível alto (probabilidade de recombinação igual a 0,9) e de um nível baixo (probabilidade igual a 0,1). Observe que analisar apenas dois níveis seria injusto, uma vez que existem outros valores intermediários nesse intervalo importantes e que devem influenciar a resposta. Por isso, optou-se por utilizar planejamentos compostos centrais ortogonais (PCCO) que levam em consideração níveis intermediários entre o limite superior e o limite inferior. Para se utilizar essa metodologia estatística (planejamento fatoriais) na análise dos fatores que mais interferem na solução ótima produzida pelo algoritmo de otimização, deve-se em primeiro lugar, escolher quais os fatores (xn) a serem analisados. Para o problema (eq. 6.2) proposto por GESSLER (1985), quatro fatores (k = 4) foram escolhidos: o número máximo de gerações, a dimensão da população, a probabilidade de recombinação e a probabilidade de mutação. O próximo passo foi determinar, de acordo com os trabalhos da literatura que apresentam à aplicação de AGs nos problemas relacionados a sistemas de distribuição de água (SIMPSON, DANDY e MURPHY, 1994; REIS, PORTO e CHAUDHRY, 1997; HALHAL et al., 1997, WALTERS et al., 1999; SILVA, 2003; SOARES, 2003), os intervalos numéricos de cada fator k, descrito pelas eqs.(6.3), (6.4), (6.5) e (6.6).

Número máximo de gerações: x1c→(100,L,5000) (6.3) Dimensão da população: xc2 →(30,L,500) (6.4) Probabilidade de recombinação: x3c →(0,1,L,0,9) (6.5) Probabilidade de mutação: x4c →(0,01,L,0,2) (6.6) Depois de determinados os fatores e os intervalos respectivos necessita-se codificar os níveis dos fatores para o planejamento. A codificação mais utilizada é –1, 0 e 1, considerando um planejamento 3k, conforme descrito no item (5.7.1). Como neste trabalho foi utilizado o PCCO, além dos níveis intermediários (-1, 0 e 1) mais dois níveis (-a*, a*) são determinados conforme descrito no item (5.7.1.3). A Tabela 6.2 apresenta os valores numéricos para os respectivos níveis.

Para construção da Tabela 6.3 é necessário atribuir para o nível zero (centro do planejamento) o valor numérico médio aproximado referente ao intervalo de cada fator

(eqs. 6.3, 6.4, 6.5 e 6.6). O mesmo é feito para os níveis –1 e 1, atribuindo valores equidistantes do centro do planejamento. Observe que para o primeiro fator ( c

1

x ) a distância entre o nível –1 e 0 é 1800, o mesmo acontece entre o intervalo 0 e 1 (distância igual a 1800). Segundo MARTÍNEZ (2001) a codificação de um planejamento 3k é descrita pela eq.(6.7).

* i * i * i c i s x x x = − (6.7)

sendo x*i o valor médio entre os níveis 0, 1 e –1; s*i a distância equidistantes entres os

níveis e * i

x os valores numéricos correspondentes ao intervalo da variável i. Por exemplo para i igual a 1, com valor de *

1

x sendo 1200, x1* sendo 3000 e s*1sendo 1800

tem-se c 1

x igual –1.

Tabela 6.2 – Codificação dos fatores referente ao problema (eq. 6.2)

Fatores -a* -1 0 1 a* c 1 x 480 1200 3000 4800 5520 c 2 x 40 100 250 400 460 c 3 x 0,08 0,2 0,5 0,8 0,92 c 4 x 0,03 0,05 0,10 0,15 0,17

Para o cálculo dos outros níveis (-a*, a*) do PCCO, a variável c i

x assume um a valor conhecido (Tabela 5.13). Como para esse estudo assumiu-se uma análise de quatro fatores, os valores de -a* e a* são -1,4 e 1,4, respectivamente. Assim, pode-se determinar os valores correspondentes de *

i

x na Tabela 6.2.

Observe na Tabela 6.3 que da configuração 1 até a configuração 16 os dados se referem ao planejamento fatorial 2k completo, com k igual a 4, na configuração 17 encontra-se o centro do planejamento e da configuração 18 até a configuração 25, essa parcela completa todo planejamento composto central ortogonal. Essa metodologia fornece o número exato das simulações a serem realizadas com suas respectivas combinações de parâmetros.

Para cada combinação de fatores (mesmos parâmetros de entrada) pode-se repetir o experimento várias vezes (réplicas). O número necessário de réplicas não é determinado por essa metodologia. PETROVSKI, WILSON e McCALL (1998) utilizaram 50 réplicas para cada configuração (simulação). SRINIVAS e DEB (1995), comparando dois métodos evolucionários de otimização multiobjetivo, afirmaram que para uma comparação justa a população inicial dos dois algoritmos deveria ser igual (mesma semente aleatória).

Tabela 6.3 – Planejamento de simulações computacionais para rede exemplo 1

Configuração Variável Resposta

(Simulação) c 1 x xc2 xc3 xc4 x1* x*2 x*3 x*4 (Mínimo Custo) 1 -1 -1 -1 -1 1200 100 0,2 0,05 1.87E+06 2 1 -1 -1 -1 4800 100 0,2 0,05 1.84E+06 3 -1 1 -1 -1 1200 400 0,2 0,05 1.81E+06 4 1 1 -1 -1 4800 400 0,2 0,05 1.78E+06 5 -1 -1 1 -1 1200 100 0,8 0,05 1.90E+06 6 1 -1 1 -1 4800 100 0,8 0,05 1.72E+06 7 -1 1 1 -1 1200 400 0,8 0,05 1.78E+06 8 1 1 1 -1 4800 400 0,8 0,05 1.80E+06 9 -1 -1 -1 1 1200 100 0,2 0,15 1.86E+06 10 1 -1 -1 1 4800 100 0,2 0,15 1.75E+06 11 -1 1 -1 1 1200 400 0,2 0,15 1.78E+06 12 1 1 -1 1 4800 400 0,2 0,15 1.75E+06 13 -1 -1 1 1 1200 100 0,8 0,15 1.80E+06 14 1 -1 1 1 4800 100 0,8 0,15 1.80E+06 15 -1 1 1 1 1200 400 0,8 0,15 1.75E+06 16 1 1 1 1 4800 400 0,8 0,15 1.80E+06 17 0 0 0 0 3000 250 0,5 0,10 1.81E+06 18 -a* 0 0 0 480 250 0,5 0,10 1.81E+06 19 a* 0 0 0 5520 250 0,5 0,10 1.85E+06 20 0 -a* 0 0 3000 40 0,5 0,10 1.86E+06 21 0 a* 0 0 3000 460 0,5 0,10 1.72E+06 22 0 0 -a* 0 3000 250 0,08 0,10 1.75E+06 23 0 0 a* 0 3000 250 0,92 0,10 1.75E+06 24 0 0 0 -a* 3000 250 0,5 0,03 1.75E+06 25 0 0 0 a* 3000 250 0,5 0,17 1.72E+06

No caso da Tabela 6.3, para cada combinação de parâmetros (número máximo de gerações, dimensão da população, probabilidade de recombinação e probabilidade de mutação) cinco réplicas foram realizadas. Cada réplica partiu de cinco sementes aleatórias distintas. Assim, a variável resposta (solução mínimo custo) foi definida como sendo a média das cinco soluções de mínimo custo produzidas pelo programa (GAlib - Epanet 2).

Tabela 6.4 – Resultados PCCO

Fator Efeito Coeficiente Valor t Valor p

Constante 1773616 26290 67,463 0 c 1 x -17851 13941 -1,281 0,229 c 2 x -34157 13941 -2,45 0,034 c 3 x -6325 13941 -0,454 0,660 c 4 x -17711 13941 -1,27 0,233 c 1 x *x1c 65301 31180 2,094 0,063 c 2 x *xc2 25301 31180 0,811 0,436 c 3 x *xc3 -14699 31180 -0,471 0,647 c 4 x *xc4 -29699 31180 -0,952 0,363 c 1 x *xc2 40425 21777 1,856 0,093 c 1 x *xc3 11025 21777 0,506 0,624 c 1 x *xc4 15925 21777 0,731 0,481 c 2 x *xc3 13475 21777 0,619 0,550 c 2 x *xc4 3675 21777 0,169 0,869 c 3 x *xc4 13475 21777 0,619 0,550

Analisando os resultados obtidos (soluções de mínimo custo) correspondentes às diferentes combinações de fatores consideradas na Tabela 6.3 através do software de análise estatística MINITAB (versão demonstrativa) foi possível construir a Tabela 6.4, através do planejamento composto central ortogonal (item 5.8.1).

Através dessa metodologia (PETROVSKI, WILSON e McCALL, 1998) foi possível analisar os fatores e os efeitos das variáveis dependentes sobre a variável independente utilizando análise de variância, considerando termos lineares, termos quadráticos e iterações entre os termos.

A Tabela 6.4 apresenta o resultado do MINITAB. O valor de p representa a significância da variável dependente ou da combinação de variáveis (no caso de efeito quadrático) na solução final. Segundo HAIR (1998) valores de p pequenos, por exemplo, p igual a 0,034 ( c

2

x )e p igual a 0,063( c 1

x *x1c),indicamefeito significativo na solução final. O valor de t é um teste estatístico que avalia a significância das variáveis sobre o modelo estatístico inferido. Por exemplo, avaliar o quanto o(s) coeficiente(s) de regressão (Tabela 6.4) interfere no processo. O efeito é uma medida que exerce a mesma função do valor de t, no entanto, tal valor é parametrizado como forma de visualizar os valores em outras escalas.

Pode-se então afirmar que, para o problema estudado, a dimensão da população (p = 0,034) e o número máximo de gerações (p = 0,063) são os fatores mais interferem na resposta e devem ser investigados criteriosamente. Vale ressaltar que o efeito significativo referente ao número de gerações, apresentado pelas análises, foi o efeito quadrático ( c

1

x *x1c) .

Documentos relacionados