Alan Robert Resende de Freitas Universidade Federal de Ouro Preto

(1)

Resolvendo o Problema do Caixeiro

Viajante via Procedimento de Busca

Adaptativa Aleat´

oria Gulosa com

Constru¸

c˜

ao Baseada em Redes Neurais

Auto-Organiz´

aveis

Alan Robert Resende de Freitas

Universidade Federal de Ouro Preto

Monografia submetida ao Departamento de Computa¸cão da Universidade Federal de Ouro Preto para obten¸cão do t´ıtulo de bacharel em Ciência da Computa¸cão

(2)

(3)

Dedico este trabalho a meus pais, que tanto contribu´ıram para minha forma¸c˜ao.

(4)

(5)

Resolvendo o Problema do Caixeiro Viajante via

Procedimento de Busca Adaptativa Aleat´

oria Gulosa

com Constru¸

c˜

ao Baseada em Redes Neurais

Auto-Organiz´

aveis

Resumo

Problemas da classe Não-Polinomial (NP) são muito dif´ıceis de se resolver com métodos enumerativos pois o tempo de processamento é absolutamente inviável a não ser quando instâncias muito pequenas de problemas estão sendo resolvidas, já que o aumento do tempo do processamento é exponencial.

Para contornar este problema, podem ser usadas heur´ısticas que em vários casos podem encontrar solu¸cões de boa rela¸cão custo(ou tempo de processamento)/benef´ıcio, considerando-se os tamanhos da instâncias.

Neste trabalho, é proposta uma abordagem para o Problema do Caixeiro Viajante (PCV) através de um procedimento de busca adaptativa gulosa (GRASP) que usa redes neurais baseadas em mapas auto-organizáveis (SOM) em sua fase construtiva e busca Tabu para o refinamento das solu¸cões.

Experimentos para a dedu¸cão dos melhores parâmetros para as redes neurais e busca Tabu também são apresentados neste trabalho. Entre os parâmetros que podem mudar o comportamento do método estão o numero de neurônios em rela¸cão ao número de cidades, o modo como é selecionado o neurônio vencedor na fase de competi¸cão e o número de neurônios que são influenciados na fase de coopera¸cão.

(6)

Outra preocupa¸cão é também fazer com que as redes neurais gerem solu¸cões com alta diversidade, o que é fundamental para o GRASP. Após todas as defini¸cões básicas, um estudo de abordagens para o Problema de Roteamento de Ve´ıculos é apresentado.

Palavras-chave: Problema do Caixeiro Viajante, redes auto-organizáveis, otimiza¸cão combinatória, Metaheur´ısticas, Problema de Roteamento de Ve´ıculos, Busca Tabu, GRASP

(7)

Solving the Travelling Salesman Problem via a Greedy

Randomized Adaptive Search Procedure with a

constructive heuristic based on Self-Organizing Maps

Abstract

Problems of the Non-Polinomial (NP) class are very hard to solve with enumeration methods since the processing time is absolutely impracticable unless the instances being solved are very small, since the growth of the processing time is exponential.

To deal with this problem, it is possible to use some heuristics that are able to find solutions with a good relation between processing time and quality, regarding the size of the instances.

This work proposes an approach for the Travelling Salesman Problem (TSP) through an Greedy Randomized Adaptive Search Procedure (GRASP) that uses Artificial Neural Networks (ANN) based on Self-organizing Maps (SOM) for the construction phase and a Tabu Search for the local search phase.

Experiments for the deduction of the best parameters for the ANN and the Tabu Search are also shown in this work. The number of neurons according to the number of cities, the way the winner neuron is selected in the competition phase and the number of neurons influenced by the winner in the cooperation phase are some of the parameters that may change the behavior of the method.

Another concern is also to make the ANN create high diversity solutions, which is fundamental for the GRASP to work appropriately. Apart from all of the basic definitions, a study of approaches for the Vehicle Routing Problem is presented.

(8)

Keywords: Travelling Salesman Problem, Self-organizing Maps, Combinatorial Op-timization, Meta heuristics, Vehicle Routing Problem, Tabu Search, GRASP

(9)

Declara¸

c˜

ao

Esta monografia é resultado de meu próprio trabalho, exceto onde referência expl´ıcita é feita ao trabalho de outros, e não foi submetida para obten¸cão de t´ıtulo nesta nem em outra universidade.

(10)

(11)

Agradecimentos

Agrade¸co a todos que direta ou indiretamente contribu´ıram para o desenvolvimento deste trabalho.

A meus pais, pelo apoio em todos os momentos de dificuldade.

A meu orientador, Frederico Gadelha Guimarães, por todo o conhecimento passado durante a produ¸cão deste trabalho e por toda a paciência e dedica¸cão.

`

As tias Consola¸c˜ao e Aparecida pela ajuda e abrigo quando necess´arios. Ao DECOM e UFOP pelo ensino gratuito de qualidade.

(12)

(13)

Sum´

ario

Lista de Figuras xvii

Lista de Tabelas xix

Nomenclatura 1 1 Preliminares 3 1.1 Introdu¸c˜ao . . . 3 1.2 Objetivos . . . 5 1.2.1 Objetivos Gerais . . . 5 1.2.2 Objetivos Espec´ıficos . . . 5

1.3 Revis˜ao Bibliogr´afica . . . 5

1.4 Organiza¸c˜ao do Trabalho . . . 7

2 PCV E PRV 9 2.1 Problema do Caixeiro Viajante . . . 9

2.1.1 Modelagem . . . 9

2.1.2 Computando uma solu¸c˜ao . . . 11

2.1.3 Instˆancias do problema . . . 14

(14)

3 Redes Neurais Auto-Organiz´aveis 17

3.1 Conceitos b´asicos . . . 17

3.2 Redes SOM para resolu¸c˜ao do PCV . . . 17

3.3 Algoritmo . . . 19 3.3.1 Inicializa¸cão da Rede . . . 19 3.3.2 Competi¸cão . . . 20 3.3.3 Coopera¸cão . . . 20 3.3.4 Adapta¸cão . . . 21 3.4 Exemplo de Execu¸cão . . . 23

4 Metaheur´ısticas GRASP e Busca TABU 27 4.1 GRASP . . . 27 4.2 Busca TABU . . . 29 4.3 GRASP reativo . . . 31 5 Resultados 33 5.1 PCV . . . 33 5.2 PRV . . . 34 5.3 Gera¸c˜ao de Diversidade . . . 35

5.3.1 Pela taxa de aprendizado . . . 37

5.3.2 Pelo número de neurônios em rela¸cão às cidades . . . 37

5.3.3 Pelo número de neurônios influenciados pelo neurônio vencedor . 38 5.3.4 Pela escolha do neurônio vencedor . . . 40

6 Conclus˜oes e Trabalhos Futuros 47

A Artigo Publicado 49

(15)

(16)

(17)

Lista de Figuras

1.1 Ciclo Hamiltoniano . . . 6

2.1 Representa¸c˜ao de um PCV . . . 10

2.2 Representa¸cão de um PRV com 1 depósito e 3 pétalas. . . 15

3.1 Estrutura de uma rede SOM bi-dimensional . . . 18

3.2 Estrutura de uma rede SOM unidimensional . . . 18

3.3 Estrutura de uma rede SOM toroidal . . . 19

3.4 Fun¸c˜ao de vizinhan¸ca . . . 21

3.5 Rela¸cão entre a taxa de aprendizado e o número de itera¸cões . . . 23

3.6 Rela¸cão entre a fun¸cão de vizinhan¸ca e o número de itera¸cões . . . 24

3.7 Aplica¸c˜ao de redes SOM (25 itera¸c˜oes) a um PCV de 70 cidades . . . 25

4.1 Representa¸c˜ao de dois m´ınimos locais . . . 30

5.1 Custo médio das solu¸cões para diferentes valores da taxa de aprendizado 38 5.2 Tempo médio consumido para diferentes valores da taxa de aprendizado . 39 5.3 Distribui¸cão das solu¸cões geradas pela rede SOM variando-se o número de neurônios . . . 39 5.4 Custo médio das solu¸cões para diferentes valores de propor¸cão de neurônios 40 5.5 Tempo médio consumido para diferentes valores de propor¸cão de neurônios 41

(18)

5.6 Distribui¸cão das solu¸cões geradas pela rede SOM variando-se o número de neurônios influenciados pelo vencedor . . . 42 5.7 Custo médio das solu¸cões para diferentes números de neurônios

influen-ciados pelo vencedor . . . 42 5.8 Tempo m´edio consumido para diferentes valores de neurˆonios

influencia-dos pelo vencedor . . . 43 5.9 Número de neurônios disputando o troféu (k) em rela¸cão ao tempo (t) . . 44 5.10 Qualidade das solu¸cões geradas por redes SOM com diferentes valores de ψ 45 5.11 Qualidade das solu¸cões geradas pelo GRASP com diferentes valores de ψ 45 5.12 Qualidade das solu¸cões para diferentes valores de ψ . . . 46

(19)

Lista de Tabelas

5.1 Erro médio dos resultados obtidos . . . 34 5.2 Erro médio dos resultados obtidos com 3 pétalas . . . 35 5.3 Erro médio dos resultados obtidos com 5 pétalas . . . 36

(20)

(21)

Lista de Algoritmos

4.1 GRASP . . . 28 4.2 Busca TABU . . . 31 4.3 GRASP Reativo . . . 32

(22)

(23)

Nomenclatura

ACO Otimiza¸c˜ao por Colˆonia de Formigas (Ant Colony Optimization)

BT Busca Tabu

EA Algoritmos Evolucion´arios (Evolutionary Algorithms) GRASP Procedimento de Busca Adaptativa Aleat´oria Gulosa

(Greedy Randomized Adaptive Search Procedure)

FI First Improvement

MTS Match Twice and Stitch

NN Vizinho mais pr´oximo (Nearest Neighbor)

NP N˜ao-Polinomial

PCV Problema do Caixeiro Viajante

RNA Redes Neurais Artificiais (Artificial Neural Networks)

PRV Problema do Roteamento de Ve´ıculos

SA Recozimento Simulado (Simulated Annealing)

SOM Mapas Auto-Organiz´aveis (Self-Organizing Maps)

TS Busca Tabu (Tabu Search)

(24)

(25)

Cap´ıtulo 1

Preliminares

1.1 Introdu¸

c˜

ao

Problemas combinatórios podem ser encontrados em várias situa¸cões práticas em que se deve procurar uma combina¸cão de valores ótimos em um conjunto finito de solu¸cões. Estes problemas são normalmente NP-completo ou NP-dif´ıcil, ou seja, não existe um método matemático que encontre a solu¸cão ótima em um tempo polinomial.

Para contornar este problema, é interessante fazer o uso de heur´ısticas, que ape-sar de nem sempre encontrarem o ótimo global do dado problema, podem encontrar solu¸cões aceitáveis com um tempo de processamento polinomial em rela¸cão ao tamanho da instância de entrada.

Neste trabalho, será abordado em princ´ıpio o problema do caixeiro viajante (PCV) com um procedimento de busca adaptativa aleatória gulosa (Greedy Randomized Adap-tive Search Procedure - GRASP). O GRASP é um procedimento que gera solu¸cões iniciais e refina estas solu¸cões um dado número de vezes sem considerar a solu¸cão das itera¸cões anteriores, atingindo resultados que não têm necessariamente rela¸cão com o resultado da itera¸cão anterior. Isto faz com que o procedimento seja não-determin´ıstico e possa assim percorrer melhor o espa¸co de busca das solu¸cões.

O PCV é também muito interessante pois é um caso particular do problema de roteamento de ve´ıculos (PRV) e é utilizado para testar novas técnicas de otimiza¸cão combinatória. A defini¸cão do problema é basicamente achar a menor rota poss´ıvel que passe por todas as cidades de um conjunto, visitando cada cidade uma única vez. Para um conjunto de n cidades, existem (n_{− 1)!/2 rotas poss´ıveis, o que torna inviável o}

(26)

4 Preliminares

cálculo da melhor solu¸cão poss´ıvel através de um método de for¸ca bruta pois o número de rotas cresce fatorialmente em rela¸cão ao número de cidades. Atualmente, o PCV não tem ainda uma solu¸cão matemática que possa ser calculada em tempo polinomial.

Neste trabalho, uma Rede Neural Artificial Auto-Organizável (Self-Organizing Maps - SOM) é utilizada na gera¸cão de solu¸cões iniciais do GRASP, gerando solu¸cões iniciais relativamente boas, já a princ´ıpio. Na fase de refinamento do GRASP, o método de Busca Tabu (BT) é utilizado, levando a solu¸cão a um ótimo local. Após algumas execu¸cões do GRASP temos uma boa rela¸cão entre o custo de processamento e a qualidade da solu¸cão.

Já existem trabalhos que propõem solu¸cões para o PCV, como o k-opt (Lin & Ker-nighan, 1973), em que k sub-rotas da rota corrente são substitu´ıdas por outras k sub-rotas de modo que uma rota menor seja produzida. Baseada neste método, foi proposta a heur´ıstica de Lin-Kernighan onde o valor ideal de k é determinado a cada itera¸cão.

Quando redes SOM são aplicadas ao PCV temos um método eficiente pois não existe a necessidade de avalia¸cão das solu¸cões a cada itera¸cão. Este é um fator que pode representar uma economia de tempo de processamento relativamente grande em alguns casos com um grande número de cidades. Além disto, redes SOM geralmente encontram solu¸cões boas o suficiente para que possam ser usadas como solu¸cões finais em várias situa¸cões práticas.

Assim, será proposta aqui uma solu¸cão do PCV utilizando o GRASP, sendo que será utilizada uma rede SOM para a defini¸cão da solu¸cão inicial do procedimento e uma busca Tabu para o refinamento da mesma.

As redes SOM produzem solu¸cões para o PCV que são normalmente de relativa qualidade porém não são localmente ótimas. Assim, o procedimento GRASP usará as redes SOM para gera¸cão de uma solu¸cão inicial e uma busca Tabu será usada para que se chegue a uma solu¸cão que seja então um ótimo local.

Para que o GRASP ache boas solu¸cões, é fundamental que as solu¸cões iniciais tenham uma diversidade elevada (Feo & Resende, 1995), podendo assim convergir para diferentes ´

otimos locais no processo de refinamento. Será objeto de estudo deste trabalho, então, os parâmetros convenientes para que se controle a diversidade das solu¸cões iniciais geradas.

(27)

Preliminares 5

1.2 Objetivos

1.2.1 Objetivos Gerais

Neste trabalho será apresentada uma solu¸cão para o Problema do Caixeiro Viajante (PCV) e Problema do Roteamento de Ve´ıculos (PRV). Ambos são bastante estudados na literatura e é proposta neste trabalho uma solu¸cão baseada em Redes Neurais Artificiais Auto-Organizáveis, usadas juntamente com o refinamento de buscas locais de primeira melhora (First Improvement - FI) e Busca Tabu (BT). Para uma maior explora¸cão do espa¸co de busca é também usado o Procedimento de Busca Adaptativa Aleatória Gulosa (GRASP) com a inten¸cão de se gerar diversidade para as solu¸cões estudadas.

1.2.2 Objetivos Espec´ıficos

Além dos testes com as Redes Neurais e seus resultados, é também estudada neste trabalho a rela¸cão entre os valores de configura¸cão das Redes Neurais que geram maior diversidade nas solu¸cões encontradas, mesmo que esta diversidade penalize de certo modo a qualidade das solu¸cões geradas. Isso é extremamente importante já que as Redes Neurais serão usadas como ferramenta de cria¸cão de solu¸cões iniciais para o GRASP, procedimento em que a diversidade de suas solu¸cões iniciais é primordial para que após o refinamento o mesmo tenha uma convergência para diferentes ótimos locais, o que aumenta a probabilidade de se encontrar uma melhor solu¸cão entre as solu¸cões refinadas geradas.

1.3 Revis˜

ao Bibliogr´

afica

Definir quais foram os primeiros estudos sobre o PCV é uma tarefa complicada já que existem estudos antigos de matemáticos sobre o assunto do século XIX, como por exem-plo, os estudos de W.R. Hamilton e Thomas Kirkman, que deram origem ao conceito de ciclo hamiltoniano (Hankins, 1980). Em 1857, Hamilton criou um jogo matemático denominado Jogo Icosiano, onde o objetivo era encontrar o ciclo hamiltoniano de um dodecaedro em que cada vértice é visitado uma e apenas uma vez, sendo o ponto de partida também o ponto final.

Na década de 1930, a forma geral do problema parece surgir de estudos novos, destacando-se Karl Menger (Schrijver, 2005), que define o problema considerando um algoritmo que o resolve por for¸ca-bruta e observando que o algoritmo guloso de procura pela vizinhan¸ca mais próxima a cada passo não é ótimo. Logo depois, Hassler

(28)

Whit-6 Preliminares

Figura 1.1: Ciclo Hamiltoniano

ney (Schrijver, 2005), da Universidade de Princeton, come¸ca a usar o termo Travelling Salesman Problem (TSP) ou Problema do Caixeiro Viajante (PCV).

Nas décadas de 1950 e 1960, surgiram importantes contribui¸cões de George Dantzig, Delbert Ray Fulkerson e Selmer M. Johnson da RAND Corporation em Santa Mônica. Eles expressaram o PCV como uma problema de programa¸cão linear e desenvolveram o método de plano de cortes para solucioná-lo (Dantzig, 1959). O método se baseia em refinar um conjunto de solu¸cões fact´ıveis por meio de expressões de desigualdade lineares, chamados de cortes. Assim, conseguiram uma solu¸cão ótima para uma instância de 49 cidades construindo uma rota e provando que nenhuma outra rota poderia ser menor.

Nas décadas seguintes, o problema foi estudado por vários pesquisadores, sendo que em 1972, Richard M. Karp mostrou que o ciclo hamiltoniano era NP-completo (Apple-gate, 2006), o que implica na complexidade não-polinomial do PCV. Deste estudo surge explica¸cão para a dificuldade computacional de se achar rotas ótimas. Nas décadas de 1970 e 1980, foi feito progresso quando Grötschel, Padberg, Rinaldi e outros consegui-ram encontrar solu¸cões para instâncias de até 2392 cidades, usando o método de plano de cortes e o método de ramifica¸cão e podas (Grötschel, 1980); (Grötschel & Holland, 1991); (Padberg & Rinaldi, 1987); (Padberg & Rinaldi, 1991).

Na década de 1990, Applegate, Bixby, Chvátal e Cook desenvolveram um programa chamado Concorde que tem sido usado em muitas solu¸cões atuais que são recordes (Ap-plegate, 2006). Em 1991, foi publicada uma biblioteca chamada TSPLib (Reinelt, 1991): uma cole¸cão de instâncias de variadas dificuldades que tem sido usada por diferentes gru-pos de pesquisa para comparar resultados. Essa é a biblioteca de instâncias que será usada neste trabalho.

(29)

Preliminares 7

Em 2005, Cook e outros calcularam uma rota ótima para uma instância de 33,810 cidades que resolvia um problema relacionado ao desenvolvimento de um micro-chip (Applegate, 2006). Atualmente, esta é a maior instância da biblioteca TSPLib. Para outras instâncias com milhões de cidades, solu¸cões que provavelmente variam em 1% do ´

otimo podem ser encontradas.

O GRASP (Feo & Resende, 1995) foi um algoritmo primeiramente usado para o problema da cobertura de conjuntos (Feo & Resende, 1989). É um algoritmo que consiste basicamente de duas fases: de constru¸cão e de busca local. Após várias itera¸cões no GRASP, a melhor solu¸cão encontrada é tida como resultado.

A Busca Tabu (BT) (Glover & Laguna, 1997) foi uma solu¸cão inicialmente usada para problemas de programa¸cão inteira e teve depois seu algoritmo descrito de maneira generalizada para uso em outros problemas de otimiza¸cão combinatória (Adams et al., 1988). A principal caracter´ıstica deste método é que ele permite solu¸cões de piora em rela¸cão à solu¸cão atual para tentar fugir de um ótimo local. Para que não se retorne a solu¸cões anteriores, estruturas de memória são usadas. As redes SOM podem ser usadas para resolver PCVs, porém elas não levam a um ótimo local sem a ajuda de uma outra heur´ıstica de refinamento (Veira et al., 2003). Em algumas instâncias da biblioteca TSPLib, o uso de redes SOM apenas levam a resultados que, na média, divergem em apenas 3,7% das rotas ótimas conhecidas. Foram também estudados parâmetros que fazem as redes SOM levarem a melhores solu¸cões para PVC porém estes parâmetros podem não ser válidos caso haja a inten¸cão de se refinar a solu¸cão obtida com um outro método, como o GRASP.

1.4 Organiza¸

c˜

ao do Trabalho

Este é um trabalho dividido em sete cap´ıtulos, incluindo a introdu¸cão, onde são contextualizados os problemas, a solu¸cão proposta, objetivos, suas aplica¸cões e estudos prévios.

No Cap´ıtulo 2 são explicados em detalhes quais são os problemas e o que os tornam aplicáveis a várias situa¸cões práticas. O PCV é explicado em detalhes, assim como sua transforma¸cão em um PRV.

No Cap´ıtulo 3 há uma breve explica¸cão sobre Redes Neurais seguida de uma apre-senta¸cão das Redes Neurais Auto-Organizáveis, que são usadas no trabalho para a gera¸cão de solu¸cões iniciais para o procedimento GRASP.

(30)

8 Preliminares

No Cap´ıtulo 4, as metaheur´ısticas GRASP e busca Tabu são detalhadas. São defini-dos os parâmetros que podem ser configurados e suas consequências.

No Cap´ıtulo 5 são apresentados os resultados da aplica¸cão do método proposto a instâncias padrão dos problemas propostos. São inclu´ıdos neste cap´ıtulo, compara¸cões com outros resultados obtidos com diferentes métodos.

No Cap´ıtulo 6 são apresentadas as conclusões sobre o trabalho desenvolvido e ideias de trabalhos futuros que podem ser desenvolvidos, baseando-se nestas conclusões.

(31)

Cap´ıtulo 2

PCV E PRV

2.1 Problema do Caixeiro Viajante

Apesar de parecer modesto, o PCV é muito estudado por cientistas. A defini¸cão do problema é basicamente encontrar a menor rota que passa por todas as cidades de um mapa sendo que nenhuma cidade pode ser visitada mais de uma vez.

O PCV foi inicialmente formulado como um problema matemático e é um dos pro-blemas mais estudados em otimiza¸cão como um padrão para testar a eficiência de me-taheur´ısticas. Assim, vários métodos para a solu¸cão do problema são conhecidos.

Este é um problema que tem várias aplica¸cões desde planejamento e log´ıstica até o desenvolvimento de micro-chips. Podem também ser usadas metáforas, onde as cidades do PCV podem representar clientes, pontos de solda ou fragmentos de DNA e o con-ceito de distância pode representar o tempo de viagem, o custo ou a similaridade entre fragmentos de DNA.

Partimos do pressuposto de que não existe algoritmo eficiente que resolve o PCV em tempo polinomial pois o mesmo pertence a classe NP-completo (Applegate, 2006). O pior caso de execu¸cão de pequenas instâncias de apenas centenas de cidades do PCV pode demorar anos para ser conclu´ıdo.

2.1.1 Modelagem

O PCV pode ser modelado como um grafo em que cidades são representadas por vértices e as liga¸cões são as arestas. Assim, a distância entre as cidades fica sendo representada pelo comprimento das arestas. Com esta representa¸cão, a rota do PCV se

(32)

10 PCV E PRV

Figura 2.1: Representa¸c˜ao de um PCV

torna um ciclo hamiltoniano e o ótimo global do problema é também o ciclo hamiltoniano mais curto poss´ıvel.

Em problemas simétricos, a distância de ida e de volta entre duas cidades é a mesma, o que forma um grafo não direcionado. Esta simetria faz com que o número de rotas poss´ıveis caia pela metade. Já em um PCV assimétrico, podem não existir caminhos entre duas cidades ou as distâncias podem ser diferentes, o que gera um grafo direcionado. Acidentes de automóveis, ruas de mão-única ou pre¸cos de passagem que podem ser diferentes de acordo com a cidade de partida e chegada são exemplos que podem fazer o uso de PCV assimétricos necessário.

No PCV métrico, o comprimento da aresta define a métrica do cálculo da distância entre as cidades. Quando as cidades são vistas como pontos no plano, muitas fun¸cões de distância naturais são métricas. No PCV Euclidiano, a distância entre duas cidades é a distância Euclidiana entre dois pontos correspondentes e é essa a métrica considerada neste trabalho. Além deste, existem também o PCV retil´ıneo, onde a distância entre

(33)

PCV E PRV 11

duas cidades é a soma da diferen¸ca entre suas coordenadas x e y, e a métrica máxima, onde a distância é o máximo entre as diferen¸cas das coordenadas x e y. Estas duas ´

ultimas podem ser úteis para definir a opera¸cão de uma máquina que perfura circuitos. As medidas de distância não satisfazem apenas com estas métricas em vários proble-mas em que se deve definir rotas pois para alguns modos de transporte, como o avião, viagens podem ser mais rápidas mesmo cobrindo uma distância maior, por exemplo. Em sua defini¸cão, o PCV não permite que cidades sejam visitadas mais de uma vez, porém várias aplica¸cões práticas precisam desta constante. Nestes casos, uma instância n˜ ao-métrica simétrica pode ser reduzida em uma métrica. Isso substitui o grafo original com um grafo completo no qual a distância é trocada pela menor distância entre as cidades no grafo original.

´

E importante citar que o fato de ser necessário retornar à cidade inicial do problema não aumenta a complexidade computacional do problema.

2.1.2 Computando uma solu¸

c˜

ao

Os métodos mais comuns para tratar estes problemas consistem em desenvolver algo-ritmos para procurar solu¸cões exatas, o que vai ser relativamente rápido para instâncias pequenas, ou desenvolver heur´ısticas, que calculam solu¸cões boas que não podem ser confirmadas como ótimas.

O problema tem se mostrado ser NP-dif´ıcil mesmo para o caso onde as cidades estão em um plano com distâncias Euclidianas ou para outros casos mais restritivos. Retirar a condi¸cão de que cada cidade seja visitada apenas uma vez não remove a dificuldade do problema pois pode ser facilmente percebido que neste caso a melhor rota ainda seria uma que visitaria cada cidade apenas uma vez desde que pela desigualdade triangular, um atalho que pula a cidade já visitada era o que diminuiria o comprimento total da rota (Applegate, 2006).

Geralmente, se a medida de distância é métrica e simétrica, o problema se torna um problema APX-completo (Lawler, 1985), o que quer dizer que se pode conseguir boas aproxima¸cões com o uso de heur´ısticas. Existe também o problema de maximiza¸cão, que é o de encontrar a rota mais comprida poss´ıvel.

A solu¸cão exata mais intuitiva para o problema é a de tentar todas as permuta¸cões, o que caracteriza o método de for¸ca bruta. A ordem de complexidade deste tipo de abordagem é de O(n!), ou seja, o fatorial do número de cidades, o que pode tornar

(34)

12 PCV E PRV

esta solu¸cão imprática mesmo para 20 cidades. Uma solu¸cão baseada em programa¸cão dinâmica pode resolver o problema em um tempo O(n22n) (Bellman, 1962), porém a solu¸cão de programa¸cão dinâmica requer um espa¸co exponencial, pois são necessários métodos de inclusão e exclusão.

Algumas outras abordagens também são poss´ıveis, como algoritmos de ramifica¸cão e poda que podem ser usados para instâncias de 40 a 60 cidades, algoritmos de melhora progressiva que usam técnicas rememorativas da programa¸cão linear e funcionam bem para instâncias de até 200 cidades ou implementa¸cões de algoritmos de ramifica¸cão e poda com poda de gera¸cões espec´ıficas para o problema (Applegate, 2006).

Uma solu¸cão exata para 15.112 cidades na Alemanha do TSPLib foi descoberta em 2001 usando o método de planos de corte já proposto na década de 50 (Dantzig et al., 1954), baseado em programa¸cão linear. O processamento foi feito em uma rede de 110 processadores na Universidade de Rice e na Universidade de Princeton. O processamento total foi de 22,6 anos para um único processador de 500MHz. Em maio de 2004, o problema de se visitar todas as 24.978 cidades da Suécia foi resolvido. Uma rota de aproximadamente 72.500 kilometros foi descoberta e foi-se provado que não existe uma rota menor (Applegate et al., 2004).

Em mar¸co de 2005, o PCV de se passar por todos os 33.810 pontos em um circuito foi resolvido usando o Concorde TSP Solver. Uma rota de tamanho 66.048.945 unidades foi encontrada e foi provado que n˜ao existe rota mais curta. O processamento levou aproximadamente 15,7 anos de CPU (Applegate et al. 2006). Em abril de 2006, uma instˆancia com 85.900 pontos foi resolvida com o Concorde TSP Solver, levando mais de 136 anos de CPU (Applegate et al., 2006).

Várias heur´ısticas e algoritmos de aproxima¸cão que levam a boas solu¸cões em pouco tempo foram desenvolvidas. Métodos modernos podem encontrar solu¸cões para proble-mas de até milhões de cidades em um tempo razoável e uma grande probabilidade de estarem apenas 3% próximas do ótimo.

Existem heur´ısticas construtivas, como o algoritmo do vizinho mais próximo (Nea-rest Neighbour - NN), uma solu¸cão gulosa onde deixamos o caixeiro decidir a cidade mais próxima ainda não visitada no seu próximo movimento. Este algoritmo leva rapi-damente a uma rota efetivamente pequena. Para n cidades distribu´ıdas em um plano aleatoriamente, o algoritmo leva a uma solu¸cão 25% maior do que a melhor rota na média (Rosenkrantz, 1977).

(35)

PCV E PRV 13

Contudo, existem várias distribui¸cões arranjadas de cidades que fazem o NN retor-nar a pior rota (Gutin et al., 2002) tanto para PCVs simétricos quanto assimétricos. Existe também um fator de aproxima¸cão θ(log_{|V |) para instâncias que satisfazem a} desigualdade triangular (Rosenkrantz et al., 1977).

Existe uma nova heur´ıstica construtiva chamada Match Twice and Stitch (MTS) (Kahng & Reda, 2004) que empiricamente tem desempenho superior a todas as ou-tras heur´ısticas construtivas existentes. MTS faz duas combina¸cões sequenciais, onde a segunda combina¸cão é executada depois de se deletar todas as arestas da primeira combina¸cão para que se produza uma cole¸cão de ciclos. Os ciclos são então costurados para produzir a rota final.

Outra classe de heur´ısticas que pode ser utilizada para a resolu¸cão deste tipo de problema é a da Melhora Iterativa. Como o método de Pairwise Exchange ou técnica 2-opt que se baseia em remover duas arestas e substitu´ı-las por outras duas (Lin & Kernighan, 1973). Depois, se reconectam os fragmentos criados pela remo¸cão das arestas iterativamente para se encontrar uma rota nova e menor. Este é um caso particular do método k-opt.

Existe também a heur´ıstica k-opt, que tem um comportamento semelhante, sendo o método mais popular o 3-opt. O k-opt é na verdade um caso espec´ıfico da heur´ıstica V-opt, que é um método mais generalizado.

Além de todas já citadas, ainda existem as heur´ısticas de melhora aleatória, que podem ser melhorias de algoritmos baseados em cadeias de Markov (Kemeny, 1959) que usam algoritmos heur´ısticos de busca local e podem chegar a rotas extremamente próximas do ótimo para instâncias de 850 cidades facilmente ou algoritmos de mudan¸ca aleatória de rotas que são atualmente os mais sofisticados algoritmos de busca e funcio-nam com até 100.000 cidades.

Escolhendo-se uma rota e alguns pontos próximos, troca-se os caminhos entre eles para se criar um novo caminho aleatório à medida que diminu´ımos o valor da menor rota conhecida o que leva após certo tempo a um m´ınimo local.

Assim, o PCV é um critério de avalia¸cão para várias heur´ısticas desenvolvidas para otimiza¸cão combinatória como Algoritmos Genéticos (AG) (Banzhaf et al., 1998), onde cada indiv´ıduo pode representar um rota e após várias itera¸cões temos uma evolu¸cão da popula¸cão por processos de muta¸cão e/ou cruzamento, Recozimento Simulado (Si-mulated Annealing - SA) (Kirkpatrick et al., 1983), onde usa-se uma analogia com a

(36)

14 PCV E PRV

termodinâmica para que se fuja de ótimos locais e se encontre um ótimo global, Busca Tabu (Glover & Laguna, 1997), método de otimiza¸cão com estruturas de memória que evitam o retorno para um ótimo local já pesquisado, o método de colônia de formigas (Dorigo, 1992) e o de entropia cruzada (De Boer et al., 2005) entre outros.

2.1.3 Instˆ

ancias do problema

Para medida de padroniza¸cão dos problemas e ter-se assim confiabilidade nas com-para¸cões entre os métodos propostos, existe a biblioteca TSPLIB (Reinelt, 1991) que contém vários modelos de instâncias. Os problemas relacionados são mantidos e várias instâncias representam cidades que realmente existem ou disposi¸cões de circuitos im-pressos reais.

2.2 Problema de Roteamento de Ve´ıculos

Um problema que deriva do PCV é o Problema do Roteamento de Ve´ıculos (PRV). O problema básico é o de atender um dado número de clientes com ve´ıculos que partem de dados depósitos. Uma de suas restri¸cões é que cada ve´ıculo tem uma capacidade máxima e não pode atender aos clientes se a demanda for maior que esta capacidade. O problema foi inicialmente formulado (Dantzig & Ramser, 1959), para a aplica¸cão no problema de distribui¸cão de gasolina para esta¸cões de venda.

A partir desta defini¸cão inicial podemos ter diferentes fun¸cões objetivos a serem mini-mizadas, como o custo da opera¸cão, o tempo total de transporte, a distância percorrida, tempo de espera, benef´ıcio, servi¸co ao cliente, utiliza¸cão dos ve´ıculos ou utiliza¸cão dos recursos.

O PRV tem sido foco de vários estudos devido à necessidade de redu¸cão com custos de transporte, que alteram significantemente o custo final de um produto ao consumidor. Com solu¸cões mais eficientes para o PRV podemos reduzir o valor final destes produtos. Existem variantes do PRV, como o Problema do Roteamento de ve´ıculos com Janela de Tempo (PRVJT), que considera o tempo gasto para atender os clientes. No PRVJT, cada consumidor tem uma janela de tempo para que possa ter um tempo de atendimento (Oliveira, 2007).

Outras variantes que valem a pena serem citadas s˜ao o PRV com Coleta e Entrega (Psaraftis, 1988), onde um certo n´umero de bens devem ser movidos de alguns locais de coleta para outros locais de entrega, ou o PRV com Coleta e Entrega First in First Out,

(37)

PCV E PRV 15

Figura 2.2: Representa¸cão de um PRV com 1 depósito e 3 pétalas.

onde o item que está sendo entregue deve ser necessariamente o último que foi coletado. Apesar destes, podemos considerar vários outros fatores relacionados ao transporte que aumentam o pre¸co final de produto: o pre¸co dos combust´ıveis em diferentes locais, pedágios, manuten¸cão de ve´ıculos e a conserva¸cão das vias.

(38)

(39)

Cap´ıtulo 3

Redes Neurais Auto-Organiz´

aveis

3.1 Conceitos b´

asicos

Redes Neurais baseadas em mapas auto-organizáveis (redes SOM) (Kohonen, 2007) pertencem à uma classe de Redes Neurais chamadas Redes Neurais Competitivas, na qual os neurônios competem entre si para serem ativados. Assim, a princ´ıpio, só acontece a ativa¸cão de um neurônio.

Em um mapa auto-organizável, os neurônios são dispostos em forma de uma grade normalmente uni ou bidimensional. Apesar de outras dimensões serem poss´ıveis, elas não são comuns. Os neurônios são então atualizados de maneira seletiva de acordo com o valores de entrada que constituem o processo competitivo de aprendizagem. Assim, cria-se um mapa a partir de valores de entrada onde a posi¸cão espacial de cada neurônio guarda propriedades estat´ısticas dos dados de entrada.

São três os processos básicos do Algoritmo do SOM, o competitivo, onde é definido o neurônio vencedor baseando em cálculos de distância Euclidiana, o adaptativo, onde ´

e feita a devida atualiza¸cão nos neurônios de acordo com um parâmetro, e o processo cooperativo, que determina a influência do neurônio vencedor em sua vizinhan¸ca.

3.2 Redes SOM para resolu¸

c˜

ao do PCV

Pode ser desenvolvida uma topologia unidimensional para redes SOM que ´e apresen-tada como a seguir.

(40)

18 Redes Neurais Auto-Organiz´aveis

Figura 3.1: Estrutura de uma rede SOM bi-dimensional

Figura 3.2: Estrutura de uma rede SOM unidimensional

estrutura adotada. Quando os neurônios são atra´ıdos pelas cidades, pode ser percebido que a configura¸cão final dos neurônios será um mapa topológico conectando todas as cidades. Contudo, como a solu¸cão do PCV é o menor caminho que percorra todas as cidades e retorne ao ponto inicial, pode ser observado que a solu¸cão unidimensional não ´

(41)

Redes Neurais Auto-Organiz´aveis 19

que a ´ultima cidade visitada ´e o ponto de partida.

Para resolver esta restri¸cão, é necessário adotar uma estrutura em forma de anel (Vieira, 2003), o que garante que come¸cando de qualquer ponto, o ponto final após todas as cidades tendo sido visitadas será o ponto de partida.

Figura 3.3: Estrutura de uma rede SOM toroidal

Esta nova estrutura faz com que o vencedor possa influenciar homogeneamente seus vizinhos. A implementa¸cão desta modifica¸cão pode ser feita a partir de um vetor onde ficam os valores dos neurônios em cada posi¸cão. Assim, a fun¸cão de vizinhan¸ca pode ser feita a partir das posi¸cões deste vetor.

3.3 Algoritmo

3.3.1 Inicializa¸

c˜

ao da Rede

O modo como o método será inicializado tem grande influência nos resultados do algoritmo, como o tempo de convergência para uma solu¸cão.

Para efeitos de estudos de gera¸cão de diversidade nas redes SOM, como serão expli-cadas mais adiante, foram estudados modos diferentes de inicializa¸cão da rede.

A primeira maneira foi uma inicializa¸cão dos neurônios em posi¸cões aleatórias do espa¸co. A desvantagem deste método foi que os neurônios estavam inicialmente

(42)

emba-20 Redes Neurais Auto-Organiz´aveis

ralhados, o que faz com que haja um maior tempo de processamento gasto no processo de atingir uma configura¸cão topológica que assegure a vizinhan¸ca entre os neurônios.

Outro método implementado foi a inicializa¸cão dos neurônios em volta do centro do mapa definido pela média das coordenadas das cidades. Era esperado que assim se resultasse em uma distribui¸cão mais homogênea dos neurônios no mapa, porém esta abordagem também resultou em um alto custo computacional devido à desorganiza¸cão dos neurônios em seu estado inicial.

Para redu¸cão dos efeitos colaterais mencionados, a simples abordagem adotada foi a da inicializa¸cão dos neurônios em um retângulo envolvendo todas as cidades. A partir das cidades, são determinados os limites do mapa e os neurônios são dispostos homoge-neamente como um quadro retangular em volta das cidades. Então o retângulo funciona como um anel que converge para as cidades à medida que o processo de aprendizagem acontece, mantendo a vizinhan¸ca dos neurônios e resultando em uma convergência mais rápida.

3.3.2 Competi¸

c˜

ao

Neste processo, é definido um neurônio vencedor em rela¸cão a uma dada cidade. Esse neurônio vencedor será o que tem a menor distância Euclidiana até esta cidade, como sugere a equa¸cão 3.1. Para este neurônio, o algoritmo segue à fase de coopera¸cão e adapta¸cão. Depois, uma nova cidade é selecionada e o algoritmo volta à fase de competi¸cão.

J = arg min

j ||Xi− Wj||∀j (3.1)

As cidades são escolhidas de forma aleatória, o que dá o caráter não-determin´ıstico do algoritmo.

3.3.3 Coopera¸

c˜

ao

Antes do processo de adapta¸cão se inicializar, é necessário estabelecer o parâmetro que definirá quão ajudados serão os vizinhos dos neurônios vencedor. A fun¸cão de vizinhan¸ca é responsável por determinar isto e é normalmente definida por uma fun¸cão gaussiana com uma variável de variância.

(43)

Figura 3.4: Fun¸c˜ao de vizinhan¸ca

por valores cada vez menores, reduzindo a influência do neurônio vencedor nos outros. Contudo, todos os neurônios são atualizados mesmo quando a influência do neurônio vencedor é muito baixa.

Desta maneira, uma atualiza¸cão seletiva é implementada de modo em que temos um ponto de corte para a fun¸cão de vizinhan¸ca onde apenas vizinhos até este ponto de corte são atualizados. Assim, com o passar do tempo, o número de neurônios até o ponto de corte decresce, o que leva a um menor tempo de processamento.

3.3.4 Adapta¸

c˜

ao

O algoritmo SOM tem 2 parâmetros de adapta¸cão, a taxa de aprendizado ?n e a fun¸cão de vizinhan¸ca ?n, onde uma fun¸cão gaussiana é adotada. Foi convencionada (Haykin, 1998) uma evolu¸cão exponencial destes parâmetros como a das equa¸cões 3.2 e 3.3 para que seja atingida uma convergência mais rapidamente.

αn=α0× exp −n τ1 (3.2)

(44)

22 Redes Neurais Auto-Organiz´aveis σn=σ0× exp −n τ2 (3.3)

Onde n = 0, 1, 2, . . . , representa o número de itera¸cões e τ1 e τ2 são constantes de

tempo exponenciais. Contudo, estas equa¸cões são heur´ısticas e outros métodos podem ser adotados. Deve ser lembrado que os parâmetros de adapta¸cão são fundamentais para a convergência do algoritmo.

Em experimentos existentes de aplica¸cão de redes SOM para solu¸cões de PCV (Vieira et al., 2003), foram identificadas as equa¸cões 3.4 e 3.5 de adapta¸cão de parâmetros que levaram a uma convergência mais rápida. Isto é muito importante, pois o objetivo deste trabalho é conciliar um sub-ótimo de uma problema de PCV com um tempo de processamento m´ınimo. αn = 1 3 √ n (3.4) σ_n =σ_n−1_{× (1 − 0.01 × n)} (3.5)

A equa¸cão 3.4 determina a evolu¸cão da taxa de aprendizado, que neste caso não precisa de um valor inicial, já que depende apenas do número de itera¸cões.

Já a equa¸cão 3.5 determina a evolu¸cão da fun¸cão de vizinhan¸ca. Este parâmetro requer uma inicializa¸cão adequada, já que o seu valor em uma dada itera¸cão depende de seu valor na itera¸cão passada.

Uma sugestão da literatura é que todos os neurônios sofram influência do neurônio vencedor nas primeira itera¸cões. Já que a inicializa¸cão do método dos neurônios consiste de um quadro retangular envolvendo todas as cidades, outros experimentos (Vieira et al., 2003) também demonstraram que a inicializa¸cão do parâmetro ? deve promover ao menos uma influência do neurônio vencedor em 1₄ dos outros neurônios. Uma formula¸cão inicial desta maneira demandaria um ? inicial de acordo com a equa¸cão 3.6:

(45)

Figura 3.5: Rela¸cão entre a taxa de aprendizado e o número de itera¸cões

σ0 =

l

4_{× c} (3.6)

onde l é o número de neurônios e c é uma constante (sendo c = 8 o valor adotado). Assim, pode ser visto que a inicializa¸cão da variância é diretamente relacionada ao número de neurônios de entrada.

3.4 Exemplo de Execu¸

c˜

ao

A Figura 3.7 apresenta a representa¸cão de estados de execu¸cão de uma rede auto-organizável para a resolu¸cão de um PCV de 70 cidades pertencente à biblioteca TSPLib. Os pontos representam as cidades e o la¸co representa o estado dos neurônios. Na Figura 3.7 se percebe a situa¸cão dos neurônios nas itera¸cões 0, 5, 10, 15, 20 e 25, respectivamente.

(46)

24 Redes Neurais Auto-Organiz´aveis

(47)

(48)

(49)

Cap´ıtulo 4

Metaheur´ısticas GRASP e Busca

TABU

4.1 GRASP

O GRASP (Greedy Randomized Adaptive Search Procedure), é um algoritmo comu-mente usado para problemas de otimiza¸cão combinatória. Podendo ser usado de várias maneiras, no GRASP se tem a constru¸cão de uma solu¸cão inicial e esta é refinada a partir de uma busca local (Feo & Resende, 1995).

Em outros métodos, temos simplesmente o foco na busca local, para que se possa encontrar solu¸cões melhores a medida que percorremos o espa¸co de busca. Já no GRASP, ´

e privilegiada a constru¸cão de uma solu¸cão inicial já boa para que depois se fa¸ca o uso de uma busca local apenas para o refinamento desta solu¸cão no âmbito de pequenas melhorias.

Para se usar o método GRASP, é preciso uma solu¸cão inicial aleatória que já atenda a todas as restri¸cões do problema. No caso do PCV, isto seria uma rota qualquer no conjunto de cidades que mesmo sendo uma solu¸cão boa já atendesse às restri¸cões que definem o PCV. Pode-se partir de uma solu¸cão vazia e se fazer inser¸cões nesta solu¸cão até que se tenha uma solu¸cão viável para o problema. Nesta fase, é fundamental que se trabalhe o caráter não-determin´ıstico do problema.

Para a constru¸cão de uma solu¸cão inicial, se utiliza algum método semi-guloso, que gere uma solu¸cão relativamente boa, tendo em vista a fun¸cão que pretende-se otimizar, porém não totalmente guloso de modo a tornar o método determin´ıstico. Neste trabalho,

(50)

28 Metaheur´ısticas GRASP e Busca TABU

para a fase de constru¸cão de uma solu¸cão inicial viável para o problema, serão usadas redes SOM, do modo como estão apresentadas no cap´ıtulo III.

A partir desta solu¸cão inicial, a solu¸cão é então refinada a partir de um método de busca local, que neste trabalho será a busca Tabu. Na implementa¸cão desta abordagem, ´

e importante que se leve em considera¸cão quão determin´ıstica é a solu¸cão inicial e quais parâmetros levam a melhores resultados após o processo de busca local.

Isso acontece porque, em determinados casos, podem se desenvolver solu¸cões boas, no processo de constru¸cão de solu¸cão inicial, que levam sempre para um conjunto restrito de ótimos locais e não encontram assim solu¸cões novas que poderiam ser melhores do que as antigas à medida que as itera¸cões do GRASP vão ocorrendo e o espa¸co de busca vai sendo percorrido. O contrário também pode ocorrer, quando se deixa o processo de constru¸cão de solu¸cão inicial muito aleatório, o que incentiva a cria¸cão de solu¸cões de baixa qualidade que não chegam a se tornar solu¸cões boas ou melhores que seriam sem o GRASP após o processo de refinamento.

Pode se fazer varia¸cões do método com fun¸cões de probabilidade para a escolha de uma melhor solu¸cão inicial ou mesmo para a adapta¸cão dos parâmetros. Vários autores aplicaram o modelo do GRASP para diferentes problemas de otimiza¸cão desde que o modelo foi descrito por Feo e Resende em 1989 (Festa & Resende, 2002). O Algoritmo 4.1 ilustra o funcionamento do método:

Algoritmo 4.1: GRASP

enquanto uma condi¸c˜ao de parada n˜ao for atingida fa¸ca

1

solu¸c˜ao_{← criar solu¸c˜ao inicial();}

2

solu¸c˜ao_{← busca local(solu¸c˜ao);}

3

se solu¸cão é a melhor todas as solu¸cões já conhecidas então

4 gravar(solu¸c˜ao); 5 fim 6 fim 7

Neste trabalho, o método que cria uma solu¸cão inicial será baseado em redes neurais e o método que faz a busca local será uma busca Tabu, como a que é apresentada logo a seguir.

(51)

Metaheur´ısticas GRASP e Busca TABU 29

4.2 Busca TABU

A busca Tabu (Fred Glover, 1997) é um método pertencente às técnicas de busca local, sendo que estruturas de memória são usadas para aprimorar a qualidade das solu¸cões encontradas. Quando certa solu¸cão é testada, esta é marcada como tabu e não ´

e examinada novamente. Assim, mais solu¸cões do espa¸co de busca são examinadas. O nome do método vem das listas tabu, que são as listas com as solu¸cões não per-mitidas. Na forma mais básica do problema, estas listas são basicamente formadas pelos últimos elementos visitados. De acordo com problemas espec´ıficos, as listas po-dem conter mais solu¸cões proibidas devido a restri¸cões do problema que resultariam em movimentos ilegais em certos contextos.

A busca Tabu usa inicialmente um método de busca local, que leva até um ótimo local. O método de busca local implementado foi o método FI (First Improvement). Nesta abordagem, tem-se uma solu¸cão inicial de uma dada qualidade que ocupa inicialmente o lugar da melhor solu¸cão atual. A partir disto, são estudados todos os vizinhos poss´ıveis desta solu¸cão. Se ao percorrer as solu¸cões vizinhas ocorre alguma solu¸cão de maior qualidade do que a melhor solu¸cão atual, esta solu¸cão vizinha ocupa o lugar da melhor solu¸cão atual e o processo é iniciado novamente. Caso contrário, se não é encontrada melhor solu¸cão do que a atual, esta é declarada um ótimo local e o processo finaliza.

Este é um método para refinamento simples e relativamente eficiente para alguns casos. Este método, porém, pára sempre em um ótimo local e não tem uma grande preocupa¸cão em fugir deste ótimo.

Para a representa¸cão do problema neste método de descida, matrizes n_{× 2 foram} usadas para a representa¸cão das rotas, sendo n o número de cidades e em cada linha se representando as coordenadas x e y que definem a posi¸cão de uma cidade no espa¸co Euclidiano. Cada solu¸cão com n cidades tem (n(n_{− 1))/2 poss´ıveis solu¸cões vizinhas,} se estudarmos as solu¸cões que são geradas pela troca de duas cidades de posi¸cão na rota inicial. Quando todos os vizinhos são piores do que a solu¸cão atual, a declaramos como um ótimo local.

Grande parte dos métodos de busca local terminam ao encontrar um ótimo local. Para explorar melhor o espa¸co de busca com regiões que não seriam exploradas por um método convencional FI, a busca Tabu modifica a estrutura de vizinhan¸ca de acordo com estruturas de memória. Isso faz com que uma solu¸cão pior do que a atual seja permitida, desde que esteja pesquisando por uma área do espa¸co de busca ainda não explorada.

(52)

Figura 4.1: Representa¸c˜ao de dois m´ınimos locais

Para guardar a solu¸cões que seriam uma volta a uma solu¸cão já visitada, é criada uma lista Tabu, que define movimentos que são proibidos pois retornam a alguma condi¸cão anterior. Inicialmente, para casos mais simples, uma busca Tabu poderia ser apenas todas as últimas solu¸cões visitadas e a cada nova itera¸cão ocorreria uma compara¸cão com todas as solu¸cões já visitadas para que se evitasse o retorno a uma solu¸cão já visitada. O problema com este tipo de abordagem é o alto custo computacional para comparar todas as solu¸cões Tabu com a solu¸cão atual e o gasto de memória que isso poderia ter para instâncias maiores, o que poderia fazer o processo não valer a pena.

Uma solu¸cão para este problema é criar uma lista de movimentos Tabu, sendo que solu¸cões que precisam de um movimento Tabu para serem atingidas são consideradas também solu¸cões Tabu pois possivelmente é uma solu¸cão que já foi visitada. Contudo, isso levanta um novo problema: quando apenas um atributo é marcado como Tabu, um conjunto de solu¸cões (dentro dele a solu¸cão que já foi visitada) é marcado como Tabu. Algumas destas solu¸cões que são evitadas poderiam ser de excelente qualidade e podem não serem visitadas. Para reduzir este problema, é criado um critério que faz com que solu¸cões Tabu sejam aceitas em determinados casos. Um critério normalmente usado é que uma solu¸cão pode ser aceita se melhorar a melhor solu¸cão até então conhecida.

(53)

Metaheur´ısticas GRASP e Busca TABU 31

justamente o PCV. Uma busca Tabu pode ser usada para encontrar solu¸cões muito satisfatórias para um PCV, ainda mais quando se está partindo de uma solu¸cão inicial de qualidade, como as que serão geradas neste trabalho através de redes SOM e refinadas por uma busca local. Novamente na busca Tabu usa-se a troca entre duas cidades para a procura de cidades vizinhas e a distância para percorrer toda a rota para determinar a qualidade das solu¸cões. Novas solu¸cões vão sendo criadas até que um critério de parada seja atingido, como por exemplo o número de itera¸cões, e a rota de maior qualidade conhecida é retornada.

Desta maneira descrita, pode-se descrever a busca Tabu como no Algoritmo 4.2: Algoritmo 4.2: Busca TABU

S _{← S}0; // solu¸c~ao atual = solu¸c~ao inicial

1

S∗ _{← S;} // melhor solu¸c~ao j´a vista = solu¸c~ao atual

2

listaTabu_{← {};} // lista inicialmente vazia

3

enquanto crit´erio de parada n˜ao for satisfeito fa¸ca

4

S0 = Melhor solu¸c˜ao n˜ao tabu entre os vizinhos de (S);

5

se custo(S0) <custo(S∗) ent˜ao

6

S∗ _{← S}0;

7

sen˜ao

8

se custo(S0) >custo(S) ent˜ao

9 listaTabu _{← listaTabu ∪ {S} ;} 10 fim 11 fim 12 S _{← S}0; 13 fim 14

4.3 GRASP reativo

O GRASP reativo (Feo & Resende, 1995), é uma modifica¸cão do GRASP convencio-nal, no qual o parâmetro de aleatoriedade utilizado na fase de constru¸cão é auto-ajustado de acordo com as solu¸cões previamente encontradas. Este é um método que tem várias possibilidades de partida para a fase construtiva, etapa inicial de cada itera¸cão.

Um diferente parâmetro de aleatoriedade pode ser usado na fase construtiva de cada itera¸cão. Inicialmente, todos os parâmetros têm a mesma probabilidade de serem es-colhidos. A qualidade das solu¸cões encontradas com cada parâmetro é guardada e de

(54)

tempos em tempos as probabilidades de um parˆametro ser usado s˜ao atualizadas de acordo.

Pode-se descrever o GRASP reativo como no Algoritmo 4.3. Algoritmo 4.3: GRASP Reativo

fmin ← valor maior que qualquer solu¸c˜ao poss´ıvel do algoritmo; 1

iter _{← 1;}

2

A _{← {a}₁, a₂, a₃, . . . , a_v_};

3

para todo k = 1 at´e v fa¸ca

4 count[k] _{← 0;} 5 score[k] _{← 0;} 6 p[k] _{← 1/v;} 7 fim 8

enquanto crit´erio de parada n˜ao for satisfeito fa¸ca

9

Selecione a[k] com probabilidade de escolha p[k];

10

s1 _{← Fase construtiva(a[k]);}

11

s2 _{← Busca local(s1); se f(s2) <f}min ent˜ao 12 s _{← s2;} 13 fmin ← f(s2); 14 fim 15 count[k] _{← count[k] + 1;} 16 score[k] _{← score[k] + f(s2);} 17

se iter mod (frequência de atualiza¸cão) = 0 então

18

avg[k] _{← score[k]/count[k] para todo k poss´ıvel;}

19

Q[k] _{← (fmin/avg[k]) para todo k poss´ıvel;}

20

sigma _{← somat´orio de todos os elementos de Q;}

21

p[k] _{← Q[k]/sigma para todo k poss´ıvel;}

22 fim 23 fim 24 retorna s; 25

(55)

Cap´ıtulo 5

Resultados

5.1 PCV

Inicialmente, foram feitos testes com a biblioteca TSPLib, que fornece PCVs para que exista critério de compara¸cão entre os diferentes métodos que solucionam o problema.

Para as resolu¸cões dos problemas que são apresentadas a seguir, sendo m o número de cidades de cada instância, foram usados os seguintes parâmetros:

Taxa de aprendizado inicial da rede: a0 = 1, 5

Número de neurônios para uma instância de m cidades: n = [1.4m, 1.8m, 2.0m, 2.2m] Variância inicial da fun¸cão de vizinhan¸ca: σ₀ = n/10

Variˆancia de escolha do neurˆonio vencedor: ψ = [0.2, 0.5, 0.8]

Um maior detalhamento sobre a justificativa destes valores está na se¸cão 5.3, onde estão definidos os métodos usados para gera¸cão de uma maior diversidade nas redes neurais e assim, se percorrer mais o espa¸co poss´ıvel de busca.

Apesar dos estudos para se descobrir os valores convenientes para os parâmetros, os valores de ψ e n não reduzem de acordo com o número atual de itera¸cões. Como os valores convenientes para diferentes instâncias podem ser diferentes, foram feitos testes de eficiência do algoritmo usando-se mais de um valor poss´ıvel para ψ e n utilizando-se de um GRASP reativo.

Com estes parˆametros, e executando o GRASP com 100 itera¸c˜oes, foram obtidos os resultados apresentados na Tabela 5.1.

(56)

34 Resultados

Fase Construtiva Busca Local GRASP

Instˆancia erro (%) std (%) min (%) erro (%) std (%) min (%) tempo(m)

bier127 16,68 7,98 5,72 8,08 2,80 3,29 1,19 eil51 8,69 3,94 3,45 5,37 1,68 2,58 0,06 eil76 12,49 5,62 4,12 6,93 1,54 3,78 0,22 kroA200 23,12 15,54 5,75 7,99 2,74 1,20 4,07 lin105 15,21 9,96 2,34 6,57 4,18 0,02 0,36 pcb442 39,64 33,61 19,33 10,98 3,08 7,16 15,25 pr107 9,33 6,60 1,00 2,63 2,73 0,17 0,35 pr136 16,67 7,87 5,89 5,92 2,16 2,46 0,50 pr152 15,536 9,65 4,06 4,62 2,93 1,00 0,65 rat195 25,60 14,49 11,36 11,63 2,47 7,57 2,16 rd100 14,31 7,58 3,09 6,72 2,94 1,23 0,79 st70 10,03 5,69 1,95 5,00 2,72 1,12 0,29

Tabela 5.1: Erro m´edio dos resultados obtidos

Todas as instâncias testadas pertencem à biblioteca TSPLib. Nas tabelas deste trabalho, “erro”indica o erro médio das solu¸cões geradas em cada itera¸cão, “std”indica o desvio padrão das solu¸cões geradas pelo método, “min”indica o erro médio da solu¸cão que teve o menor erro médio em todas as 100 itera¸cões e “tempo”é o tempo em minutos gasto para que ocorra uma itera¸cão. O erro médio m´ınimo da busca local é também o resultado do GRASP, já que este foi executado apenas uma vez para cada instância.

No geral, o erro médio após a busca local foi de 6,87% e após o GRASP foi de 2,63%.

5.2 PRV

O maior benef´ıcio que se pode obter na utiliza¸cão de redes SOM para solu¸cões de PRV é a divisão da rota em pétalas, já que redes SOM com menos neurônios que cidades podem classificar estas cidades em grupos de acordo com suas caracter´ısticas, neste caso, a posi¸cão no plano Euclidiano.

Foram também feitos experimentos com 50 execu¸cões de GRASP para as mesmas instâncias, dividindo as cidades em 3 e 5 pétalas e analisando as rotas geradas. As redes SOM têm a tarefa de dividir as cidades em pétalas e criar um depósito central, onde todas as pétalas se encontram. A Tabela 5.2 e Tabela 5.3 mostram o erro médio das

(57)

Resultados 35

Tabela 5.2: Erro m´edio dos resultados obtidos com 3 p´etalas

solu¸cões geradas com pétalas em rela¸cão às solu¸cões de apenas uma pétala.

Claramente, as solu¸cões geradas têm um erro médio maior que as solu¸cões de apenas uma pétala. Isso se justifica pelo fato de haver uma cidade a mais para cada pétala e pela condi¸cão de que as pétalas serão bem divididas, o que elimina a possibilidade de um ve´ıculo fazer a rota ótima enquanto os outros ficam parados.

No geral, o erro médio após a busca local foi de 15,85% para o problema de 3 pétalas e de 25,93% para o problema de 5 pétalas. Já o erro médio das solu¸cões encontradas após 50 itera¸cões de GRASP foi de 9,34% para o problema de 3 pétalas e de 16,57% para o problema de 5 pétalas.

5.3 Gera¸

c˜

ao de Diversidade

Em estudo prévio sobre a aplica¸cão de redes SOM a PCVs (Vieira et al., 2003), foram feitos estudos sobre valores para os parâmetros que seriam convenientes para que houvesse a gera¸cão de solu¸cões de maior qualidade.

(58)

36 Resultados

Tabela 5.3: Erro m´edio dos resultados obtidos com 5 p´etalas

solu¸cões não só de qualidade mas também de diversidade na fase construtiva. Isso faz com que o espa¸co de busca seja mais bem percorrido e aumenta a possibilidade de se achar melhores solu¸cões mesmo que as solu¸cões iniciais que serão refinadas sejam normalmente piores do que seriam com outros parâmetros que não valorizam a diversidade.

Assim, é clara a necessidade de se definir novos parâmetros para o funcionamento do método que valorizem a diversidade das solu¸cões geradas e não só a qualidade inicial das solu¸cões que saem da fase construtiva.

Para avaliar a capacidade de diversidade das solu¸cões geradas pelas redes SOM, os principais parâmetros do algoritmo foram estudados (Batista et al., 2009) para que se tivesse maior diversidade na média das solu¸cões geradas . Para o estudo foi utilizada uma instância aleatória de 30 cidades e os parâmetros foram variados a cada 100 itera¸cões do GRASP.

Durante os testes foi observada uma relevante independência dos parâmetros, que tiveram comportamento muito semelhante com pequeno desvio padrão mesmo com a varia¸cão dos outros parâmetros.

(59)

Resultados 37

a das equa¸cões 5.1, 5.2 e 5.3 para que seja atingida uma convergência mais rapidamente. As equa¸cões 5.1 e 5.2 representam respectivamente como as taxas de aprendizado e número de neurônios influenciados pelo neurônio vencedor mudam de acordo as itera¸cões. Nestas equa¸cões t representa a quantidade de itera¸cões já realizadas. A equa¸cão 5.3 re-presenta que existirão n neurônios para m cidades e a equa¸cão 5.4 faz com que o neurônio vencedor passe sua condi¸cão de vencedor para outro neurônio, como será explicado mais adiante. αn=α0× − t τ1 (5.1) σn=σ0× exp − t τ2 (5.2) n = βm (5.3) γ = ψ exp −_τt 3 (5.4)

As constantes usadas foram τ1 = 10, τ2 = 10/ log10(σ0) e τ3 = 10.

5.3.1 Pela taxa de aprendizado

A taxa de aprendizado inicial α0 foi variada no intervalo de 0,5 a 2,0 e pelos

expe-rimentos foi poss´ıvel observar que o mapa de Kohonen foi capaz de gerar solu¸c˜oes para a faixa de valores de 1,0 a 1,5 e teve um custo computacional bem semelhante para os diferentes valores, como o esperado.

5.3.2 Pelo n´

umero de neurˆ

onios em rela¸

c˜

ao `

as cidades

O número de neurônios empregados em rela¸cão ao número de cidades pode também mudar a qualidade e diversidade das solu¸cões geradas. Para um conjunto de m cidades

(60)

38 Resultados

Figura 5.1: Custo m´edio das solu¸c˜oes para diferentes valores da taxa de apren-dizado

e n neurˆonios, foram feitos testes para determinar qual fator de proporcionalidade β levaria a melhores resultados para um dado n´umero de cidades sendo n = βm.

Este parˆametro em quest˜ao foi avaliado entre os valores 1 e 2:

De acordo com os histogramas e as curvas de custo médio das solu¸cões, é observado que o parâmetro tem uma influência no grau de diversidade das solu¸cões geradas. Para menores valores de β, se observa melhores solu¸cões após a busca local apesar de piores solu¸cões na fase construtiva, o que é o foco deste trabalho. Considerando-se também que com um menor número de neurônios o tempo médio gasto para se obter as solu¸cões ´

e menor, para se obter solu¸c˜oes com certa diversidade em um tempo aceit´avel, sugere-se uma valor de β entre 1,2 e 1,6.

5.3.3 Pelo n´

umero de neurˆ

onios influenciados pelo neurˆ

onio

vence-dor

Para que na primeira itera¸cão das redes SOM, cerca de 25 a 100% dos neurônios sejam influenciados pelo neurônio vencedor, o valor de deverá variar entre 0,05n e 0,30n.

(61)

Resultados 39

Figura 5.2: Tempo m´edio consumido para diferentes valores da taxa de apren-dizado

Figura 5.3: Distribui¸cão das solu¸cões geradas pela rede SOM variando-se o número de neurônios

Como se pode observar no histograma e no custo médio das solu¸cões para diferentes números de neurônios influenciados pelo neurônio vencedor, é obtida maior diversidade

(62)

40 Resultados

Figura 5.4: Custo médio das solu¸cões para diferentes valores de propor¸cão de neurônios

nas solu¸cões geradas para valores menores de neurônios influenciados. Porém, neste caso, o custo computacional aumenta a medida que o número de neurônios influenciados decresce. Assim, para uma melhor rela¸cão entre tempo/diversidade, sugere-se valores entre 0,08n e 0,15n neste trabalho.

5.3.4 Pela escolha do neurˆ

onio vencedor

No processo simples de competi¸cão das redes SOM, o neurônio que tem a menor distância Euclidiana em rela¸cão à cidade em questão é declarado o neurônio vencedor. Assim o neurônio vencedor seria sempre o que atendesse a condi¸cão J = arg minj||Xi−

Wj||∀j.

Contudo, já que os neurônios neste caso espec´ıfico são organizados de forma toroidal, foi feita a proposta de que o neurônio vencedor passasse a sua condi¸cão para um de seus vizinhos. Isso criaria mais diversidade nas solu¸cões geradas sem comprometer muito a qualidade das solu¸cões geradas.

(63)

Resultados 41

Figura 5.5: Tempo médio consumido para diferentes valores de propor¸cão de neurônios

ψ exp(_{−t/τ) que vai definir a probabilidade de que o neurônio vencedor passar o troféu.} Assim, pode-se definir o número de neurônios que têm chance de pegar o troféu pela equa¸cão k(t) = max 1,_{d0.1n ∗ γ(t)eque vai sempre retornar um número inteiro. Após} algumas itera¸cões, o valor de k sempre será 1, como está representado na Figura 5.9.

Do modo como estão organizadas as equa¸cões, podemos variar o valor de ? entre 0 e 1, onde um valor próximo de 0 indica uma constru¸cão mais gulosa (onde sempre um neurônio apenas tem o troféu) e um valor próximo de 1 indica uma constru¸cão mais aleatória, com uma maior disputa pelo troféu. Fazendo o histograma dos dois extremos de ? em rela¸cão à qualidade das solu¸cões apos a fase de constru¸cão, tem-se os seguintes resultados representados na Figura 5.10.

De acordo com o histograma da Figura 5.10, percebe-se que para solu¸cões gulosas em rela¸cão ao neurônio vencedor, tem-se uma maior qualidade nas solu¸cões geradas. Porém, após um refinamento feito por uma busca FI no mesmo conjunto de solu¸cões, temos o histograma representado na Figura 5.11.

(64)

42 Resultados

Figura 5.6: Distribui¸cão das solu¸cões geradas pela rede SOM variando-se o número de neurônios influenciados pelo vencedor

Figura 5.7: Custo médio das solu¸cões para diferentes números de neurônios influenciados pelo vencedor

de solu¸cões de uma média de qualidade mais alta com ψ = 0.0. Porém, o conjunto que contém a solu¸cão de melhor qualidade está no grupo que usou ψ = 1.0, pois a

(65)

aleatorie-Resultados 43

Figura 5.8: Tempo m´edio consumido para diferentes valores de neurˆonios in-fluenciados pelo vencedor

dade possibilitou que o GRASP percorresse melhor o espa¸co de busca das solu¸c˜oes. Um estudo do comportamento do algoritmo para diferentes valores de ψ est´a representado na Figura 5.12.

Na Figura 5.12, estão representados tanto o erro médio (pelos quadrados, com valores mais altos) das solu¸cões após as duas fases do GRASP quanto o erro médio da melhor das solu¸cões após as diferentes fases do GRASP (pelas riscas, com valores mais baixos). Na fase construtiva, o erro médio das solu¸cões geradas e da melhor solu¸cão são maiores para condi¸cões mais aleatórias de teste, ou seja, maiores valores de 5.12.

Já após a busca local, mesmo com o erro médio das solu¸cões crescendo à medida que se aumenta o valor de ψ, o erro médio da melhor das solu¸cões é menor para valores maiores de ψ, devido à possibilidade dada ao GRASP de percorrer melhor o espa¸co de busca.

Assim, maiores valores de aleatoriedade podem gerar piores resultados para as Redes Neurais, isoladamente, por´em melhores resultados para o GRASP.

(66)

44 Resultados

Figura 5.9: Número de neurônios disputando o troféu (k) em rela¸cão ao tempo (t)

podem atrapalhar o desempenho do GRASP, como est´a claro da Figura 5.12. Assim, a partir dos experimentos e resultados apresentados, sugere-se um valor de ψ = 0.8, evitando-se tamb´em desta maneira valores extremos de aleatoriedade.

(67)

Resultados 45

Figura 5.10: Qualidade das solu¸c˜oes geradas por redes SOM com diferentes valores de ψ

Figura 5.11: Qualidade das solu¸c˜oes geradas pelo GRASP com diferentes va-lores de ψ

(68)

46 Resultados