• Nenhum resultado encontrado

2.4 Algoritmos Evolucionários

2.4.4 Programação Genética

A programação genética (PG) possui grande semelhança com os algoritmos genéticos (AGs). A diferença principal está na representação dos indivíduos: enquanto nos AGs codificam-se os indivíduos em código binária, Gray, real, ou outro, a PG codifica os indivíduos na forma de uma árvore. Essa codificação apresentada na PG gera algumas alterações significativas nos operadores genéticos, além de possibilitar alguns grandes benefícios, tais como conter não somente valores de variáveis, mas também funções. As alterações e benefícios apresentados pela PG em relação ao AG serão detalhas a seguir.

2.4.4.1 Representação dos Indivíduos

Conforme já mencionado, o fato do indivíduo na PG ser representado na forma de árvore possibilita a esse indivíduo conter não somente valores de variáveis, mas também funções. Segundo Koza (1992), o conjunto das funções (nós internos da árvore (ZIVIANI; BOTELHO, 2006)) que compõem o indivíduo é chamado de conjunto de funções7. Montana (1995) considera que o termo que melhor se aplica a esse conjunto é conjunto não terminal8, uma vez que o conjunto de nós terminais (nós externos (ZIVIANI; BOTELHO, 2006)) pode conter funções que não recebem parâmetros. Esse

texto utilizará o termo “conjunto de funções”, por ser o mais utilizado na literatura,

devido à grande influência exercida pelo livro de Koza (1992).

Segundo Koza (1992), o indivíduo da PG, composto pelos conjuntos terminal e não terminal, deve satisfazer pelo menos duas propriedades:

 Suficiência9

: indica que o poder de expressividade do indivíduo deve ser bom o suficiente para representar uma solução para o problema em questão.

 Fechamento10

: indica que uma função deve poder receber como parâmetro de entrada o valor produzido como saída de outra função ou um valor que pode ser assumido por um dos terminais.

Na prática, obedecer à propriedade de fechamento pode ser uma tarefa muito difícil.

7 do inglês Function Set 8 do inglês Nonterminal Set 9 do inglês Sufficiency 10 do inglês Closure

Entretanto, não observar essa propriedade leva a situações que geram indivíduos inconsistentes. Certamente essa é uma das maiores dificuldades dos projetistas de algoritmos baseados em PG, principalmente na aplicação das operações de mutação e cruzamento. Segundo Freitas (2002), a garantia de fechamento dos nós terminais e nós funções é especialmente importante, pois não há sentido em uma operação do tipo Idade

+ Salário uma vez que esses dois atributos possuem domínios diferentes. Dessa forma,

ainda segundo Freitas (2002), o domínio utilizado pelo banco de dados pode ser útil a fim de se validar o tipo dos parâmetros passados para cada função.

Além das duas características necessárias (suficiência e fechamento), Freitas (2002) aponta como característica desejável que o conjunto de nós que compõem o indivíduo tenha mais uma característica: parcimônia11. Essa característica indica que o indivíduo deve conter somente as funções e os terminais estritamente necessários, e.g. (NÃO X) ao invés de (NÃO (NÃO (NÃO X))). Uma solução parcimoniosa é mais simples de ser avaliada e consequentemente mais simples de ser entendida pelo usuário final. A Figura 2.14 mostra um exemplo de indivíduo da PG. A expressão codificada pelo indivíduo é: 10 x ( 7 / (3 +5)).

Figura 2.14 – Exemplo de Indivíduo na PG.

2.4.4.2 Cruzamento

A operação de cruzamento na PG, assim como no AG, consiste na troca de material genético entre os indivíduos pais. Entretanto, conforme destacado na seção 2.4.4.1, a fim de se garantir a propriedade de fechamento, é preciso verificar se o tipo das sub- árvores que serão inseridas são compatíveis com o tipo esperado. Considerando o exemplo da Figura 2.14, não se pode substituir o nó folha cujo valor é um número inteiro igual 5 por um nó do tipo lógico cujo valor é true. Em contrapartida, o mesmo nó pode ser substituído pela sub-árvore que representa a expressão seno().

Uma característica bastante significativa da operação de cruzamento é a sua capacidade de alterar o tamanho dos indivíduos durante a execução do algoritmo. Considerando novamente o exemplo da Figura 2.14, trocar o nó folha cujo valor é 5 por uma sub-árvore que representa a expressão seno(), fará com que a profundidade da árvore aumente. O sucessivo aumento da profundidade da árvore poderá gerar casos em que se tem uma expressão complexa, mas que pode ser simplificada (este é o típico caso onde não se obedece a propriedade parcimônia – seção 2.4.4.1). Para se evitar que a árvore que compõe o indivíduo cresça, porém sem apresentar um ganho significativo de desempenho na função fitness, algumas técnicas foram propostas e serão detalhadas na seção 2.6. Uma das ideias mais comuns é considerar a minimização do número de nós como um dos objetivos do algoritmo, ou seja, além de procurar otimizar a função principal o algoritmo deverá procurar pelo menor indivíduo (em termos de número de nós, ou até mesmo profundidade da árvore) que otimiza a função.

2.4.4.3 Mutação

O operador de mutação consiste na troca de um nó (terminal ou não) por outro nó (terminal ou uma sub-árvore) gerado. É notório que aqui, assim como no cruzamento, os indivíduos podem aumentar ou diminuir de tamanho. Freitas (2002) classifica a operação de mutação em quatro categorias principais, baseadas na capacidade de alteração de tamanho da árvore:

 Mutação de Ponto12

: Consiste na troca de um nó externo por outro nó externo;

 Mutação de Colapso13

: Um nó externo substitui um nó interno (sub-árvore). Nessa caso, a árvore diminui sua altura;

 Mutação de Expansão14

: Um nó interno (sub-árvore) substitui um nó externo. Nesse caso, a árvore aumenta sua altura;

 Mutação de sub-árvore15

: Um nó interno substitui outro nó interno. Nesse caso a árvore pode aumentar ou diminuir sua altura ou ainda não ter seu tamanho alterado.

12 do inglês Point Mutation 13 do inglês Collapse Mutation 14 do inglês Expansion Mutation 15 do inglês Subtree Mutation

Uma implementação da PG pode utilizar somente uma categoria de mutação a fim de inserir uma tendência de comportamento do tamanho dos indivíduos (FREITAS, 2002). Por exemplo, utilizar somente a mutação de colapso fará com que a aplicação desse operador diminua o tamanho dos indivíduos.

2.5 Aplicação de Algoritmos Evolucionários em Mineração de Dados