O problema de interesse - Algoritmo Gen´ etico

6.2 Algoritmo Gen´ etico

6.2.2 O problema de interesse

Nesta aplica¸c˜ao, especificamente, deseja-se obter x0, t0 e, claro, α que minimizem

a soma dos quadrados das diferen¸cas obtidos da aplica¸c˜ao dos dados a (5.18) e (5.19): fg1 = X i √ t0 + p Ti x0Xi − p Ti − √ t0 x2₀ − 4t0 p Tiα 2 (6.3) fg2 = X i p Ti − √ t0 Xi2 + √ t0 + p Ti x0Xi − 4 √ t0Tiα 2 (6.4)

Chamando de g uma fun¸cão genérica que se deseje minimizar, é simples com- preender que um indiv´ıduo zk cumprirá tão melhor esse objetivo quanto maior for

o valor de

F it(zk) = 1 −

g(zk)

maxig(zi)

, (6.5)

e esta fun¸cão, (6.5), é usada aqui a fim de determinar o fitness de um indiv´ıduo, ou seja, quão bem adaptado ao meio ele está.

A popula¸cão, ao se reproduzir, deve gerar mais indiv´ıduos mais parecidos com os mais adaptados e para garantir computacionalmente essa caracter´ıstica, uma alternativa é usar o Algoritmo da Roleta. Neste algoritmo, a cada indiv´ıduo é atribu´ıdo um percentual de uma roleta, proporcional ao seu fitness, e, então, a probabilidade de um indiv´ıduo ser selecionado é tanto maior quanto maior for a adequa¸cão do indiv´ıduo.

Uma vez selecionados os indiv´ıduos mais adaptados, eles são pareados e ocorre o processo de crossover. Existem muitas possibilidades para este processo. Aqui, para cada par de progenitores é gerado um vetor de zeros e uns, de acordo com a distribui¸cão binomial e com uma probabilidade pc pré-estipulada e, se à posi¸cão desse vetor gerado aparece o valor um e os progenitores têm o i-ésimo gene diferente, os genes são trocados.

Além disso, é sabido que, em processos genéticos existe uma probabilidade, aqui chamada de pm, de ocorrer uma muta¸cão. A muta¸cão neste trabalho é programada do seguinte modo: para cada novo indiv´ıduo, cria-se também um vetor com número de entradas igual ao número de genes do indiv´ıduo, gerado com zeros e uns, de acordo com a distribui¸cão binomial com probabilidade pm, e a cada posi¸cão em que houver um 1 no vetor de muta¸cão, o gene do indiv´ıduo é trocado.

Aqui tomou-se pm = 0.2. Já o parâmetro de crossover utilizado é pc = 0.3. Os demais parâmetros usados na implementa¸cão são:

• Tamanho da popula¸cão: 50 indiv´ıduos; • Número máximo de gera¸cões: 5000;

• Cada parˆametro a ser ajustado era representado por 12 cromossomos; • O dom´ınio permitido para o coeficiente de difus˜ao: [0, 1];

• O dom´ınio permitido para o x0: [10−3, miniXi];

• O dom´ınio permitido para o t0: [10−3, miniTi]

Vale observar que o controle sobre o valor assumido pelos parâmetros que esta- vam sendo ajustados era feito por meio da fun¸cão converte que consta no Apêndice D. Uma estimativa foi considerada bem sucedida quando, em menos gera¸cões

Figura 6.1: Exemplo de progressão dos ajustes dos parâmetros usando o algoritmo genético.

do que o número máximo estabelecido, o fitness da popula¸cão atingia 0.95 ou a estimativa de algum dos parâmetros diferia de menos do que a tolerância pré- estabelecida, a saber, para x0 e t0, 0.05 e para α, 0.0001, posto que este era o

dos parˆametros para uma amostra aleat´oria gerada com α = 0.5. Os dom´ınios para x0 e t0 eram, respectivamente, [10−3, 0.28] e [10−3, 0.4].

Assim, realiza-se uma busca cega em um espa¸co quadridimensional posto que deseja-se determinar os três parâmetros originais e, para tanto, emprega-se a ava- lia¸cão do ajuste dos indiv´ıduos à expressão de fitness. A fim de que o objetivo seja atingindo, a popula¸cão inicial gerada aleatoriamente vai sendo selecionada a cada gera¸cão e, também, vai tendo os valores dos indiv´ıduos pertubados, pelos processos de muta¸cão e crossover, a fim de que, combinados, estes procedimentos permitam que todo o espa¸co seja explorado e que os melhores resultados possam indicar a melhor tendência a seguir.

Tendo em mãos as expressões que modelam o problema e conhecendo as técnicas que serão usadas para ajustar tais expressões aos dados, parte-se para a discussão do tratamento dos dados. Tal tratamento, por ora, será empregado aos dados gerados, a fim de validar, ou não, a técnica e/ou determinar seu grau de precisão. Uma vez determinada a (extensão da) validade da técnica, o mesmo tratamento poderá ser aplicado aos dados reais sem que atrapalhem o desempenho do método de determina¸cão dos coeficientes de difusão. Ao tratamento, então.

Cap´ıtulo 7

Ensaios Num´ericos

Antes de mais nada é importante que se esclare¸ca a que vão se referir, via de regra, os três termos seguintes:

‘Evento’: o termo será usado aqui para designar cada par (t, x) obtido através das simula¸cões cujo desenvolvimento consta do Cap´ıtulo 4;

‘Amostra’: referir-se-á a um conjunto de eventos. Representa o conjunto de dados que se obtém quando da ocorrência de uma epizootia numa determinada região ao longo de certo per´ıodo de tempo, por exemplo;

‘Cenário’: um conjunto de amostras; seria a combina¸cão de conjuntos de dados de diversas regiões, supondo que um mesmo coeficiente de difusão estivesse relacionado a todos os casos.

Assim, de posse de um conjunto de dados formado por locais e datas de ocorrência de eventos, como determinar, partindo da hipótese de que o processo pode ser entendido como um processo difusivo, o coeficiente de difusão?

Para responder a essa pergunta é que se desenvolveu todo este trabalho e, mais especificamente, o modelo sobre o qual trata o Cap´ıtulo 5. Pouco falta para que os resultados possam ser apresentados. E parte importante do que falta são os detalhes por trás da gera¸cão dos dados usados na valida¸cão da técnica e que são esclarecidos a seguir.

7.1 Realiza¸c˜ao dos ensaios

Para a valida¸cão da técnica são necessários, como se vem dizendo, dados relativos a cenários difusivos e cujos coeficientes que os geraram sejam conhecidos. A ne- cessidade da disponibilidade desses dados e, por isso, de ser capaz de obtê-los foi causa da existência dos Cap´ıtulos 3 e 4. Resta, então, apenas, abordar os detalhes computacionais.

Primeiramente deve se ter em mente que, a solu¸cão numérica base para a gera¸cão dos dados, daqui por diante, tem o dom´ınio temporal e o espacial subdi- vididos em 128 intervalos. E, já se sabe que, para cada tempo, a solu¸cão numérica permite conhecer a concentra¸cão que resolve o problema (3.2)-(3.5). É importante esclarecer, também, que todos os programas foram escritos e executados no Matlab 7.0.1 e todos os códigos podem ser vistos nos Apêndices A, [?] e [?].

Geralmente, num processo difusivo real(ista) não-laboratorial, não se pode ter conhecimento de todos os eventos em todos os pontos do dom´ınio espa¸co-temporal. Para retratar com fidelidade tal situa¸cão, aqui, opta-se, então, por sortear os tempos de ocorrência dos eventos. Sorteio este que é baseado numa distribui¸cão uniforme de inteiros entre 1 e DT , onde DT é o maior número de intervalos de tempo entre eventos permitido.

Enquanto que quanto menor DT mais eventos próximos no tempo serão obtidos; numa situa¸cão real, DT = N T , ou seja, o tempo máximo entre dois eventos poderia chegar a ser todo o intervalo temporal.

O valor do parâmetro DT , transposto para um caso real, estaria relacionado com a capacidade de vigilância acerca do evento de interesse. Uma maior porcen- tagem de casos conhecidos relacionar-se-ia com um valor de DT bastante pequeno. E um valor alto para DT , relativamente ao número de subdivisões temporais, cor- responderia a situa¸cões em que pouco se pode saber sobre o que acontece dentro do dom´ınio.

Por outro lado, DT ’s baixos podem levar a erros na determina¸cão do coeficiente de difusão, uma vez que, se muitos eventos são for¸cosamente gerados, a probabilidade de eventos mais distantes em tempos menores acaba por ser incrementada. Aqui trabalha-se com 2 valores para DT: DT=10 e DT aleatório entre 1 e 128 para, assim, poder analisar o impacto da falta de controle sobre o tempo entre eventos em rela¸cão à qualidade dos resultados.

Por fim, do jeito que o código foi montado, as exigências feitas sobre os tempos entre os eventos são de que, quando somados, não ultrapassem o tempo final e de que assumam, no máximo, o valor DT ; assim, cada amostra, e consequentemente cenário, poderá ter um número diferente de eventos e, claro, eventos em tempos distintos, como ocorre com os eventos de que se toma conhecimento na natureza. A cada passo temporal sorteado, é gerado um evento de acordo com a distribui¸cão da concentra¸cão naquele instante, conhecida gra¸cas à solu¸cão numérica obtida através do processo apresentado no Cap´ıtulo 3. Ao fim do processo, ter- se-á em mãos um conjunto de dados relacionando os tempos dos eventos e suas localiza¸cões, do mesmo tipo que seria obtida numa situa¸cão real.

De posse das expressões que relacionam o coeficiente de difusão e um conjunto de dados, antes de aplicar o método, é preciso ainda lapidar os dados. A seguir dedica-se a aten¸cão necessária a tal tratamento.

No documento Estimativa do coeficiente de difusão para problemas (prioritariamente) ecológicos (páginas 89-95)