An´ alise do modelo de regress˜ ao m´ ultipla

4.4 Teste de significˆ ancia

5.1.1 An´ alise do modelo de regress˜ ao m´ ultipla

Na primeira coluna da tabela 5.1, estão apresentadas as estimativas de máxima verossimilhan¸ca dos parâmetros do modelo de regressão linear múltipla (descrito no cap´ıtulo anterior). Na segunda coluna, os erros padrões de cada estimativa. Na ter- ceira coluna, são apresentadas as estat´ısticas de teste T que avaliam individualmente a

5.1 An´alise visual 47

significância do i-ésimo parâmetro no modelo, para i ∈ {0, ..., 10}, de modo que quanto maior o valor de T, mais significante a variável Xi (ou a intera¸cão Xa Xb) que multi-

plica o parˆametro βi. Finalmente, na ´ultima coluna, o Valor P que indica o n´ıvel de

confian¸ca para rejei¸c˜ao da hip´otese nula (βi = 0) do teste T, ou seja, quanto menor o

valor P, mais convictos estaremos de que βi difere de zero e, consequentemente, mais

convictos estaremos de que a variável independente ou a intera¸cão que multiplica esse parâmetro é significativa.

Tabela 5.1: Parâmetros do modelo de regrassão linear multipla Coeficientes Estimativa Erro padrão Estat´ıstica T Valor P

β0 29,7913 0,3538 82,203 <0,001 β1 0,9540 0,3228 2,955 0,003126 β2 -8,7359 0,3228 -27,061 <0,001 β3 -2,4245 0,5734 -4,228 <0,001 β4 -5,9762 0,5734 -10,423 <0,001 β5 -1,7225 0,1899 -9,073 <0,001 β6 -0,2008 0,4111 -0,489 0,625150 β7 7,1452 0,4111 17,382 <0,001 β8 -2,2061 0,4111 -5,567 <0,001 β9 23,7753 0,4111 57,837 <0,001 β10 3,4485 0,8901 3,874 <0,001

Para facilitar a leitura dessa disserta¸cão apresentamos novamente o modelo de re- gressão linear múltipla descrito no cap´ıtulo anterior.

Y = β0+ β1X1+ β2X2+ β3X3+ β4X4+ β5X1X2+ β6X1X3+

β7X1X4 + β8X2X3 + β9X2X4+ β10X3X4+

Sendo a variável dependente (Y) a média do número de itera¸cões até que o algoritmo genético obtenha o ótimo global em mil experimentos e as variáveis independentes:

• X1 o indicador da dimensão da fun¸cão objetivo. X1 = 0, se a fun¸cão é unidimen-

sional e X1 = 1, se a fun¸c˜ao ´e bidimensional.

• X2o indicador do número de ótimos locais na imagem da fun¸cão objetivo. X2 = 0,

se a fun¸cão possui um único ótimo local (o ótimo global) e X2 = 1, se possui 12

otimos locais (incluindo o ´otimo global).

• X4 a probabilidade de muta¸c˜ao. X3 ∈ {0, 11; 0, 12; ...; 0, 90}

Note na tabela 5.1 que, o β6 (que estima o impacto da probabilidade de cruzamento

na velocidade de convergencia do algoritmo, dado que a fun¸c˜ao ´e bidimenssional) foi o ´

unico parâmetro que obteve significância rejeitada a 99, 5% de confian¸ca. Isso significa que, segundo o modelo, o fato de a fun¸cão ser unidimensional ou bidimensional não altera a influência da probabilidade de cruzamento na velocidade de convergência do algoritmo genético. Esse resultado é coerente com as Figuras 5.9 e 5.10, Onde se pode observar um paralelismo entre as retas, quando se compara o efeito do operador cruzamento em fun¸cões unidimensionais e bidimensionais, tanto no caso de as fun¸cões terem um único ótimo local (Figura 5.9) quanto no caso de as fun¸cões terem 12 ótimos locais (Figura 5.10). Com exe¸cão da intera¸cão entre as variáveis X1 e X3, todas as

vari´aveis avaliadas foram significativas no modelo, bem como suas intera¸c˜oes duas a duas.

Na an´alise da qualidade do ajuste desse modelo (R quadrado), estima-se que so- mente 24% das fun¸c˜oes se enquadram nesse modelo.

Cap´ıtulo 6

Conclus˜oes

Com respeito aos gráficos apresentados no cap´ıtulo anterior, podemos dizer que a parametriza¸cão que otimiza a velocidade de convergência do algoritmo genético varia de acordo com a fun¸cão objetivo em questão. Apesar disso, esses gráficos são argu- mentos a favor da importância do Operador muta¸cão, nos quais podemos observar que, para todas as fun¸cões, varia¸cões na probabilidade de muta¸cão afetam a velocidade de convergência do algoritmo genético e, curiosamente, o operador cruzamento se mostrou dispensável na otimiza¸cão da velocidade de convergência do algoritmo.

Com respeito ao modelo de regressão múltipla, apresentado do cap´ıtulo anterior, podemos dizer que as variáveis estudadas: probabilidade de muta¸cão, probabilidade de cruzamento, tipo da fun¸cão (unidimensional ou bidimensional) e a quantidade de ´

otimos locais (1 ou 12) se mostraram significativos na modelagem da velocidade de convergência do algoritmo genético, como também as suas intera¸cões de segunda ordem, exceto a itera¸cão entre as variáveis tipo de fun¸cão (unidimensional ou bidimensional) e probabilidade de cruzamento. Além disso, devido ao r quadrado ter sido tão pequeno (0, 28) podemos afirmar que as variáveis escolhidas não são suficientes para descrever as varia¸cões na velocidade de convergência. Ou seja, existem variáveis que interferem na velocidade de convergência do algoritmo genético e que não estão no modelo estocástico.

6.1 Considera¸c˜oes finais

E importante lembrar que em aplica¸cões reais do algoritmo genético, geralmente não é do conhecimento do pesquisador se a fun¸cão objetivo possui apenas um ou mais de um ótimo local, por isso esse estudo pode parecer irrelevante, mas é inegável a importância de entendemos o impacto desse fato na velocidade de convergência do algoritmo genético, bem como o comportamento do algoritmo genético mediante esse

tipo de obst´aculo.

Vale ressaltar que, neste trabalho, estudamos o efeito da dimensão da fun¸cão objetivo (uni ou bidimensional) na velocidade de convergência, sendo o dom´ınio de ambas as fun¸cões discretizados numa mesma quantidade de pontos, sem levar em conta o espa¸camento entre os pontos, ou seja, existe implicitamente uma suposi¸cão de que a discretiza¸cão do dom´ınio de todas as fun¸cões estudadas contenham o verdadeiro ótimo global ou algum ponto muito próximo do mesmo.

Aos interessados na implementa¸cão computacional, os comandos encontrados no apêndice A deste trabalho apresentam um pequeno problema, que não foi de meu interesse corrigi-lo (não afeta o meu objetivo), caso a fun¸cão objetivo apresente mais de um ótimo global com mesmo valor funcional (muito raro de acontecer) o programa não apresentará resultado satisfatório uma vez que ele escolherá um dos dois para ser o verdadeiro ótimo e mesmo que a cadeia atinja o outro ótimo, a condi¸cão de parada ainda não será satisfeita.

Referˆencias Bibliogr´aficas

BOYABATLI, O.; SABUNCUOGLU, I. Parameter selection in genetic algorithms. Journal of Systemics, Cybernetics and Informatics, v. 4, n. 2, p. 78, 2004.

CRUZ, J. A. R.; DINIZ, I. C. Mean convergence time of inhomogeneous genetic algorithm with elitism. Numerical Functional Analysis and Optimization, Taylor & Francis, v. 37, n. 8, p. 966–974, 2016.

EL-MIHOUB, T. A. et al. Hybrid genetic algorithms: A review. Engineering Letters, v. 13, n. 2, p. 124–137, 2006.

FOGARTY, T. C. Varying the probability of mutation in the genetic algorithm. In: MORGAN KAUFMANN PUBLISHERS INC. Proceedings of the third international conference on Genetic algorithms. [S.l.], 1989. p. 104–109.

HOLLAND, J. H. Adaptation in natural and artificial systems: an introductory analysis with applications to biology, control, and artificial intelligence. [S.l.]: U Michigan Press, 1975.

KOZA, J. R. Genetic programming ii: Automatic discovery of reusable subprograms. Cambridge, MA, USA, 1994.

LEVIN, D. A.; PERES, Y.; WILMER, E. L. Markov chains and mixing times. Pro- vidence, R.I. American Mathematical Society, 2009. With a chapter on coupling from the past by James G. Propp and David B. Wilson. ISBN 978-0-8218-4739-8. Dispon´ıvel em: <http://opac.inria.fr/record=b1128575>.

LUKE, S.; SPECTOR, L. A comparison of crossover and mutation in genetic programming. Genetic Programming, v. 97, p. 240–248, 1997.

MITCHELL, M. An introduction to genetic algorithms. [S.l.]: MIT press, 1998.

NETO, R.; CEC´ILIO, J. Modelagem dos algor´ıtmos gen´etico simples e simulated an- nealing por cadeias de markov. Universidade Federal do Rio Grande do Norte, 2010. POLI, R. et al. A field guide to genetic programming. [S.l.]: Lulu. com, 2008.

RAJ, A. Evolutionary Optimization Algorithms for Nonlinear Systems. Tese (Douto- rado) — Citeseer, 2013.

RUDOLPH, G. Convergence analysis of canonical genetic algorithms. IEEE transacti- ons on neural networks, IEEE, v. 5, n. 1, p. 96–101, 1994.

SCHAFFER, J. D. et al. A study of control parameters affecting online performance of genetic algorithms for function optimization. In: MORGAN KAUFMANN PU- BLISHERS INC. Proceedings of the third international conference on Genetic algorithms. [S.l.], 1989. p. 51–60.

SHONKWILER, R. W.; MENDIVIL, F. Explorations in Monte Carlo Methods. [S.l.]: Springer Science & Business Media, 2009.

SOBRINHO, P. d. S. Algoritmos gen´eticos canˆonico e elitista: uma abordagem com- parativa. Universidade Federal do Rio Grande do Norte, 2014.

Apˆendice A

Comandos no R

A.1 Algoritmo gen´etico

#FUN¸C~AO DISCRETIZA¸C~AO DE FUN¸C~AO 1 DIMENCIONAL dom1 = function (inf,sup,div){

k = (sup-inf)/div return(seq(inf,sup,k)) #OBS: length(vet) = div+1 }

#FUN¸C~AO DISCRETIZA¸C~AO DE FUN¸C~AO 2 DIMENSIONAL #dom2 = function (infx, supx, infy, supy, div){

# r=s=NULL # kx = (supx-infx)/div # ky = (supy-infy)/div # X = seq(infx,supx,kx) # Y = seq(infy,supy,ky) # for (i in 1:length(Y)){ # r = c(r, rep(X[i],length(Y))) # s = c(s,Y) # } # return (matrix(as.numeric(cbind(r,s)),nrow=(div+1)^2,ncol=2))

# #OBS: length(vet) = (div+1)^2

#FUN¸C~AO CONVERSOR NATURAL -> BIN´ARIO bin = function(natural, N_bits){

bit=NA

natural = natural - 1 for (i in N_bits:1){

if (((natural/2)-(natural %/% 2)) == 0){

bit[i] = 0 }else{ bit[i] = 1 } natural = natural %/% 2 } return(bit) }

#FUN¸C~AO CONVERSOR BIN´ARIO -> NATURAL nat = function (binario){

k = seq((length(binario)-1),0,-1) return (sum(binario*2^k)+1) }

#FUN¸C~AO DE TROCA DE BIT troca = function(x){ if(x==0){ return (1) }else{ return (0) } }

#FUN¸C~AO ELITIZA¸C~AO 1 DIMENSIONAL maior = function (amostra){

return(amostra[f(intervalo[amostra])== max(f(intervalo[amostra]))])

}

#FUN¸C~AO ELITIZA¸C~AO 2 DIMENSIONAL #maior = function (amostra){

# return(amostra[which(valor[amostra]==

# max(valor[amostra]))[1]])

#ETAPA DE SELE¸C~AO 1 DIMENSIONAL sel = function (indice,valor){

dist_f = f(valor)/sum(f(valor)) return(sample(indice, length(indice),

replace = T, prob = dist_f)) }

A.1 Algoritmo gen´etico 55

#sel = function (indice,intervalo){

# dist_f = valor[amostra]/sum(valor[amostra])

# return(sample(indice, length(indice),

# replace = T, prob = dist_f))

#ETAPA DE MUTA¸C~AO

mut = function (amostra, P_mut, N_bits){ for (i in 1:length(amostra)){ sacola = bin(amostra[i],N_bits) for (j in 1:N_bits){ if(runif(1,0,1) < P_mut){ sacola[j] = troca(sacola[j]) } } amostra[i] = nat(sacola) } return (amostra) } #ETAPA DE CRUZAMENTO

cru = function(amostra, P_cru,N_bits){ escolhidos = which(rbinom(amostra,1,prob = P_cru)==1) if(length(escolhidos) >= 2){ for (i in 1:(length(escolhidos)%/%2)){ sacola = sample(1:N_bits,1, replace=TRUE):N_bits sacola1 = bin(amostra[ escolhidos[2*i-1]],N_bits) sacola2 = bin(amostra[ escolhidos[2*i]],N_bits) sacola3 = sacola1 sacola1[sacola] = sacola2[sacola] sacola2[sacola] = sacola3[sacola] amostra[escolhidos[2*i-1]] = nat(sacola1) amostra[escolhidos[2*i]] = nat(sacola2) } } return(amostra) } #INICIO

zvet = dom1(0.11,0.90,79) yvet = dom1(0.11,0.90,79) for(z in 1:3){ for(y in 1:80){ passos = NULL for (w in 1:1000){ #ENTRADA pop = 10 N_bits = 8 P_cru = zvet[z] P_mut = yvet[y] #CASO 1 DIMENSIONAL intervalo = dom(0,4,(2^N_bits)-1) #CASO 2 DIMENSIONAL #4 bits #intervalo = dom1(0,4,0,4,3) #8 bits #intervalo = dom2(0,10,0,10,15) #16 bits #intervalo = dom1(0,4,0,4,255) #valor=NULL #for (i in 1:length(intervalo[,1])){ # valor = c(valor,f(intervalo[i,])) #}

mi = min(which( valor == max(valor))[1]) - 1 ma = max(which( valor == max(valor))[1]) + 1

amostra = sample(seq(1,2^N_bits,1),pop) elite = maior(amostra)

#ITERA¸C~OES k=0

while(elite <= mi || elite >= ma){ amostra=cru(amostra,P_cru,N_bits) amostra=sel(amostra,intervalo) amostra=mut(amostra,P_mut,N_bits)

A.2 Fun¸c˜oes utilizadas 57

No documento Estudo de parâmetros ótimos em algoritmos genéticos elitistas (páginas 55-66)