A computação evolucionária inspirou-se em sistemas naturais como a evolução biológica para o desenvolvimento de métodos computacionais. O algoritmo genético faz parte desse campo, sendo o método de otimização e pesquisa baseada na teoria da evolução de Darwin, no processo de evolução natural e sobrevivência dos indivíduos mais adaptados (CHIANDUSSI et al., 2012). Esse método envolve operações básicas sendo: avaliação de desempenho (fitness), seleção, recombinação (crossover) e mutação (MITCHELL, 1996).
Logo, um grupo de soluções é gerado aleatoriamente no espaço de busca. Cada elemento da populaçao é representado por um ponto no espaço de busca, e a codificação desse vetor de solução é apresentada como a de um cromossomo. A cada iteração, há substituição total ou parcial das soluções da iteraçao (geração) anterior, através de recombinação (crossover) ou mutação dos elementos. Logo ocorre a evolução da população de soluções, até que se atinja
um número limite de gerações. A avaliação do desempenho da solução é realizada em cada geração através do valor defitness, podendo esse ser apenas o valor da função objetivo ou incorporar elementos de avaliações adicionais. Dessa forma, os descendentes são fruto dos elementos com melhor desempenho selecionados por recombinação e por mutação, segundo uma dada probabilidade. O valor da fitness define a probabilidade de um cromossomo da população anterior ser reproduzido na geração seguinte, em cada etapa de evolução. Ou seja, a probabilidade de que as características dos melhores indivíduos se perpetuem nas novas gerações é maior (MITCHELL, 1996) .
Várias metodologias de alocação ótima de sensores utilizaram a abordagem algoritmo genético. Al-zahrani e Moied (2003) se basearam no conceito de cobertura de demanda, onde a qualidade da água do nó a jusante é menor que a do nó a montante. Para auxiliar na identificação de estações de monitoramento da qualidade da água, em uma RDA, foi gerada uma matriz de cobertura e aplicada a abordagem algoritmo genético. Dessa forma, foram identificados os melhores nós para a alocação das estações de monitoramento, possibilitando a maximização da cobertura da demanda. A metodologia foi verificada em duas redes da literatura.
Ostfeld e Salomons (2005) propuseram uma metodologia para identificar o layout ideal de um sistema de alerta precoce, composto por um conjunto de estações de detecção, com intuito de melhorar a segurança dos SDA do municípios. Para tanto, a metodologia foi dividida em duas etapas, sendo: construção de uma matriz de poluição aleatória (MPA) e a cobertura máxima da coluna da MPA usando algoritmo genético. Ostfeld e Salomons (2006) basearam-se na metodologia proposta por Ostfeld e Salomons (2005), mas consideraram a aleatoriedade da taxa de fluxo dos contaminantes injetados, nas demandas dos consumidores e a sensibilidade de detecção e tempo de resposta dos sensores frente a alocação de estação de monitoramento. Já Schwartz, Lahav e Ostfeld (2014b) apresentaram uma metodologia que integra a análise hidráulica e a química detalhada ao simular a injeção do pesticida organofosforado como possível contaminante ao longo do SDA. Dessa forma, foi gerada uma matriz de poluição, capaz de fornecer uma estimativa da população afetada, sendo os resultados utilizados para determinar a alocação ótima dos sensores e a minimização da população exposta, por meio da abordagem algoritmo genético.
Em problemas reais de projeto de engenharia são necessários métodos que busquem soluções que otimizem simultaneamente uma ampla gama de critérios diferentes. Por
resolver problemas matemáticos complexos de forma simples os algoritmos evolutivos têm sido largamente explorado em problemas de otimização multiobjetivo (MITCHELL, 1996). No entanto as funções objetivo podem ser conflitantes, ou seja, a melhoria de um dos objetivos degrada os demais. Com isso, é necessário encontrar o melhor conjunto de soluções não dominadas a partir do método de otimização multiobjetivo.
A abordagem NSGA-II (DEB et al., 2002) aplicada ao problema de alocação de sensores em RDA, permite uma seleção equilibrada sobre as funções objetivos. Logo, o conjunto de soluções Pareto-ótimas consideram igualmente a importância de cada função objetivo, gerando as melhores soluções não-dominadas para a alocação de sensores. Uma solução não-dominada é caraterizada por: “não existir outra solução admissível (i.e., satisfazendo um dado conjunto de restrições) que melhore simultaneamente todos os objetivos: a melhoria numa função objetivo só pode ser alcançada à custa da degradação do valor de pelo menos uma outra função objetivo do modelo matemático” (ANTUNES; ALVES; JOÃO, 2012). A diferença entre a abordagem NSGA-II e as abordagens de algoritmos genéticos mono-objetivo, está no modo com que o operador seleção é empregado na recombinação e na mutação (COELLO COELLO; LAMONT; VELDHUIZEN, 2002).
Com isso, o procedimento irá se repetir até que todos os indivíduos estejam classificados em alguma frente. Em segunda instância, no caso de pertencerem à mesma frente, ocorre a classificação pelo ordenador de diversidade (crowding distance), que ordena os indivíduos de forma a atribuir precedência aqueles que estiverem em regiões menos “povoadas” do espaço de objetivo. Logo, a aptidão a ser empregada no processo de seleção é calculada pelos procedimentos denon-dominated sorting e de crowding distance, onde os indivíduos mais aptos da geração atual são selecionados (Figura 3.1).
Esses indivíduos são utilizados para gerar uma nova população por cruzamento e a seleção é realizada por meio da técnica chamada de “torneio binário”, onde dois indivíduos da população são escolhidos aleatoriamente e o melhor entre os dois é selecionado para passar a próxima geração. Terminado esse processo a nova população gerada é combinada com a população anterior. A mutação irá ocorrer após o cruzamento já que causa uma perturbação nas soluções da população vigente, gerando novas soluções (COELLO COELLO; LAMONT; VELDHUIZEN, 2002).
Figura 3.1: Processo do Algoritmo NSGA-II
Pt
Q
t
Classificação em frente
de Pareto
Não selecionados
F1
F2
F3
Ordenação por
"crowding distance"
P
t+1Rt
Fonte: adaptado de (DEB et al., 2002).
Como ilustrado na Figura 3.1 primeiramente cria descendentes e uma população combinada 𝑅𝑡 e é realizado a seleção por fronteiras de dominância. Cada fronteira armazena
as soluções da população que são não dominadas entre si e a primeira fronteira armazena as soluções que dominam todas as outras fronteiras. O método utiliza também a crowding distance, a qual consiste em priorizar os resultados mais diferentes como critério de desempate na escolha do indivíduo caso estejam na mesma fronteira de dominância e, melhorando a variabilidade genética da população. O objetivo dessa métrica é que os indivíduos na primeira fronteira da população sejam mais diversificados possível e próximos das soluções da Fronteira de Pareto associada ao problema.
Mas, segundo Chiandussi et al. (2012) a otimização multiobjetivo fornece ao decisor um conjunto de soluções Pareto-ótimas, não dominadas, já que, não há uma solução única, mas um conjunto de soluções. Logo, sem aferir e especificar as preferências do decisor frente às diferentes funções objetivo, não é possível avaliar a qualidade das soluções propostas (DOLORES, 2014). Com isso, é necessário incluir informações sobre as preferências do decisor, como por exemplo, valores, convicções e perspectivas, no processo de apoio à tomada de decisão (COELLO COELLO; LAMONT; VELDHUIZEN, 2002). Essa etapa é
geralmente realizada por especialistas, mas existem métodos que possibilitam classificar um número menor de soluções de forma automatizada.