• Nenhum resultado encontrado

O termo relax-and-cut tem sido usualmente utilizado na literatura para denotar uma larga classe de algoritmos baseados em relaxa¸c˜ao Lagrangiana, onde desigualdades2 s˜ao duali-

zadas somente quando violadas pela solu¸c˜ao corrente do Problema Lagrangiano Relaxado [9, 12, 24, 32, 34, 35, 39, 40]. Vale ressaltar que o termo relax-and-cut foi mencionado ori- ginalmente em um artigo de Escudero et al. [18]. Entretanto, neste artigo, como em [30], os algoritmos de relaxa¸c˜ao Lagrangiana propostos s˜ao empregados de uma forma distinta daquela implementada nas cita¸c˜oes anteriores. A distin¸c˜ao entre estas duas abordagens ´e explicitada por Lucena em [35].

2

20 Cap´ıtulo 2. Fundamenta¸c˜ao te´orica

Devido ao esquema dinˆamico de dualiza¸c˜ao proposto, algoritmos relax-and-cut apa- recem como uma alternativa que pode viabilizar o uso da relaxa¸c˜ao Lagrangiana para resolver problemas onde h´a um n´umero muito grande (potencialmente exponencial) de restri¸c˜oes a serem dualizadas. Tentativas neste sentido datam do in´ıcio da d´ecada de 1980 [2]. Todavia, a formaliza¸c˜ao de id´eais propondo um esquema seletivo de desigualdades a serem dualizadas s´o surgiu com os trabalhos desenvolvidos por Lucena [32, 33] para resolver o Problema de Steiner em Grafos.

2.4.1

Estrat´egias de implementa¸c˜ao

Essencialmente duas estrat´egias de implementa¸c˜ao de algoritmos R&C s˜ao discutidas na literatura. Elas diferem, basicamente, no momento em que as desigualdades s˜ao identifica- das e dualizadas. Em uma delas, a cada passo do algoritmo, v´arias execu¸c˜oes do M´etodo do Subgradiente s˜ao realizadas. A cada execu¸c˜ao do m´etodo, desigualdades v´alidas que violam a solu¸c˜ao do PDL atual s˜ao identificadas e armazenadas. Ou seja, a identifica¸c˜ao destas desigualdades ´e postergada at´e que o PDL atual seja considerado resolvido e a incorpora¸c˜ao destas desigualdades `a formula¸c˜ao atual s´o ocorre no in´ıcio da execu¸c˜ao subseq¨uente do MS. A outra abordagem corresponde ao algoritmo descrito por Lucena em [32, 33]. Nesta, uma ´unica execu¸c˜ao do MS ´e realizada e, a cada itera¸c˜ao do m´etodo, busca-se identificar desigualdades v´alidas que violam a solu¸c˜ao do PL(λ) atual, as quais s˜ao incorporadas `a formula¸c˜ao na itera¸c˜ao seguinte (detalhes em [12, 24, 32, 35, 40]).

Para ambas as abordagens, os processos se repetem at´e que algum crit´erio de parada seja satisfeito. Note tamb´em que, independente da estrat´egia adotada, trˆes poss´ıveis mu- dan¸cas podem ocorrer na formula¸c˜ao atual com a descoberta de novas restri¸c˜oes: (i) altera¸c˜oes na fun¸c˜ao objetivo devido `a dualiza¸c˜ao das novas desigualdade encontradas (ii) modifica¸c˜ao da estrutura do(s) novo(s) Subproblema(s) Lagrangiano(s), quando as desigualdades identificadas s˜ao mantidas na formula¸c˜ao ou (iii) ambas, quando apenas um subconjunto pr´oprio das novas desigualdades ´e dualizado. Desta forma, indepen- dente da mudan¸ca sofrida, um novo PDL a ser resolvido ´e formulado. Com o objetivo de enfatizar as diferen¸cas entre as duas estrat´egias, Lucena [35] denominou a primeira abordagem de Delayed Relax-and-Cut (DR&C). Em contrapartida, a abordagem por ele adotada em [32, 33] foi denominada Non-Delayed Relax-and-Cut (NDR&C). Vale observar que no Cap´ıtulo 4 propomos uma terceira forma alternativa de utiliza¸c˜ao de planos de corte combinados com algoritmos Lagrangianos.

2.4.2

Modifica¸c˜oes no M´etodo do Subgradiente

Nesta tese, independente da estrat´egia de implementa¸c˜ao adotada, trabalhamos com uma adapta¸c˜ao do M´etodo do Subgradiente descrita em [24]. Para fins de exposi¸c˜ao das mu-

dan¸cas efetuadas no MS, considere que as restri¸c˜oes {aix ≤ bi : i = 1, 2, . . . , m1} candi-

datas `a dualiza¸c˜ao (em um esquema Lagrangiano) s˜ao aquelas explicitadas em (2.5). Assumindo-se que m1 pode ser muito grande, fica evidente o elevado esfor¸co computa-

cional requerido, a cada itera¸c˜ao do M´etodo do Subgradiente, para a dualiza¸c˜ao de todas estas restri¸c˜oes. Afora esta quest˜ao, como j´a comentado, problemas de convergˆencia po- dem ocorrer no MS quando se tem um n´umero muito grande de componentes/entradas n˜ao nulas no vetor de subgradiente. Nesta situa¸c˜ao, o uso expl´ıcito dos subgradientes no c´alculo de θ provocaria mudan¸cas apenas marginais no vetor de multiplicadores de Lagrange entre itera¸c˜oes consecutivas do m´etodo.

Como alternativa para contornar estas dificuldades, o R&C prop˜oe uma estrat´egia dinˆamica de uso das restri¸c˜oes candidatas `a dualiza¸c˜ao nos c´alculos feitos pelo MS: ao inv´es de todas as restri¸c˜oes serem explicitamente dualizadas, uma estrat´egia de sele¸c˜ao ´e estabelecida para escolha daquelas a serem efetivamente dualizadas a cada itera¸c˜ao.

A estrat´egia adotada ´e baseada na classifica¸c˜ao das desigualdades candidatas `a du- aliza¸c˜ao, a cada itera¸c˜ao do MS, de acordo com os trˆes grupos seguintes: o primeiro (grupo 1) ´e formado pelas desigualdades violadas por ¯xk, ou seja, desigualdades tais que

sk

i = (bi − aix¯k) > 0, ∀i ≤ m1; o segundo (grupo 2) cont´em as desigualdades `as quais

est˜ao correntemente associados multiplicadores de Lagrange com valores n˜ao nulos e, fi- nalmente, o terceiro grupo (grupo 3) ´e composto pelas demais desigualdades. Um ponto interessante a ressaltar nesta divis˜ao ´e que pode haver interse¸c˜ao entre os grupos 1 e 2 de desigualdades.

A partir desta classifica¸c˜ao ´e pertinente observar que multiplicadores de Lagrange as- sociados `as restri¸c˜oes pertencentes, na itera¸c˜ao corrente do MS, ao grupo 3, continuam com valores nulos ao final da itera¸c˜ao (uma simples an´alise da express˜ao (2.13) ´e sufici- ente para se chegar a esta conclus˜ao). Note tamb´em que, diferentemente das restri¸c˜oes pertencentes aos grupos 1 e 2, restri¸c˜oes do grupo 3 n˜ao podem contribuir para os custos Lagrangianos na itera¸c˜ao corrente pois, para restri¸c˜oes deste grupo, o termo λi(bi − aix)

´e sempre nulo. Por estes motivos, restri¸c˜oes dos grupos 1 e 2 recebem a denomina¸c˜ao de desigualdades ativas, enquanto restri¸c˜oes do grupo 3 s˜ao denominadas desigualdades inativas. Cabe notar tamb´em que, de uma itera¸c˜ao a outra do MS, uma desigualdade pode passar de ativa a inativa e vice-versa.

Estabelecida essa classifica¸c˜ao, algoritmos relax-and-cut sugerem, a cada itera¸c˜ao do MS, proceder a dualiza¸c˜ao efetiva apenas das desigualdades ativas. Assim, somente as restri¸c˜oes violadas pela solu¸c˜ao do PLR corrente ou aquelas que tenham multiplicadores de Lagrange associados n˜ao nulos s˜ao consideradas nos c´alculos efetuados dentro do MS.

´

E importante mencionar que, no caso de relaxa¸c˜ao Lagrangiana cl´assica, Beasley [8] observou que quando, simultaneamente, λi = 0 e ski > 0, o multiplicador λi permanece

com valor nulo ap´os sua atualiza¸c˜ao. Entretanto, o valor de (sk

22 Cap´ıtulo 2. Fundamenta¸c˜ao te´orica

express˜ao de c´alculo do tamanho do passo. Assim sendo, neste caso, Beasley sugere fixar o subgradiente sk

i em zero antes do c´alculo de θ. Na pr´atica, esta sugest˜ao equivale `a

estrat´egia adotada nos algoritmos R&C que consiste em ignorar a dualiza¸c˜ao de restri¸c˜oes do grupo 3, i.e., de desigualdades inativas.

Observe que, a atualiza¸c˜ao dos multiplicadores de Lagrange com base apenas em desigualdades ativas, possibilita que apenas uma diminuta parte do total de desigualdades sejam explicitamente consideradas a cada itera¸c˜ao. Entretanto, vale a ressalva de que o emprego do esquema descrito acima n˜ao impede que o n´umero de restri¸c˜oes ativas a cada itera¸c˜ao seja muito grande. Em trabalhos recentes, A. Lucena [34] e da Cunha [15] discutem esta quest˜ao e apresentam sugest˜oes para lidar com esta situa¸c˜ao em particular.

2.4.3

Planos de Corte e Relax-and-Cut

A abordagem implementada pelos algoritmos relax-and-cut pode ser uma alternativa ade- quada a problemas de otimiza¸c˜ao combinat´oria, independente de se dispor de uma for- mula¸c˜ao para o problema com um n´umero muito grande de restri¸c˜oes candidatas a du- aliza¸c˜ao. Uma situa¸c˜ao t´ıpica desta adequa¸c˜ao ´e quando novas restri¸c˜oes v´alidas para o problema (potencialmente em n´umero exponencial) podem ser descobertas dinamica- mente, de forma an´aloga ao que acontece no emprego de algoritmos para gera¸c˜ao de planos de corte em programa¸c˜ao linear.

De forma idˆentica ao esquema proposto por algoritmos para gera¸c˜ao de planos de corte, rotinas de separa¸c˜ao podem ser desenvolvidas e incorporadas ao m´etodo usado para resolver a relaxa¸c˜ao Lagrangiana (aqui, o MS). Assim, elas podem ser utilizadas na obten¸c˜ao, a cada itera¸c˜ao, de novas restri¸c˜oes v´alidas violadas pela solu¸c˜ao do PLR corrente. Estas novas restri¸c˜oes podem, ent˜ao, ser dualizadas ou mantidas no novo PLR caso a permanˆencia delas n˜ao o tornem muito mais dif´ıcil de ser resolvido.

Tamb´em como os algoritmos de planos de corte, algoritmos relax-and-cut podem ser utilizados para melhorar os limitantes duais de problemas de otimiza¸c˜ao combinat´oria e, eventualmente, conseguir provar a otimalidade de uma solu¸c˜ao. Obviamente, a efic´acia do m´etodo ´e bastante dependente da qualidade dos cortes encontrados e dos algoritmos (heur´ısticas) utilizados para obten¸c˜ao de solu¸c˜oes vi´aveis.

Para ver que desigualdades encontradas por um algoritmo relax-and-cut podem, na pr´atica, melhorar o limitante obtido, basta resgatarmos a interpreta¸c˜ao do resultado de- monstrado no teorema 2.3.1. De acordo com este teorema, resolver o Problema Dual La- grangiano (`a otimalidade) dado por zDP DL = minλ∈Rm1+ {max [cx + λ(b − Ax) : x ∈X]}

´e equivalente a resolver o problema de programa¸c˜ao linear zDLP = max {cx : Ax ≤

b, x ∈ conv(X)}. Ou seja, em teoria, ambos apresentam o mesmo valor de solu¸c˜ao ´otima, zDP DL = zDLP = zD, o qual ´e um limitante dual para o PLI original (2.3).

Agora, note que a adi¸c˜ao de cortes `a formula¸c˜ao significa aumentar o n´umero de linhas da matriz A. Assim, um novo PL dado por z′

DLP = max {cx : A

x ≤ b, x ∈ conv(X)}

´e gerado, onde a A′ = A π



´e a matriz de cortes inseridos em A, b′ = h b π0

i

e πx ≤ π0.

Desta forma, sendo z′

DP DL o valor do PDL equivalente ao PL com a adi¸c˜ao dos cortes

πx ≤ π0, tem-se tamb´em que zD′ P DL = z

DLP = z

D. Portanto, em teoria, pode-se afirmar

que z′

D ≤ zD. Em outras palavras, o novo limitante obtido com a adi¸c˜ao dos cortes ´e pelo

menos t˜ao bom quanto o anterior. Na pr´atica, este limitante pode n˜ao ser alcan¸cado ou requerer muito tempo para ser obtido. Entretanto, espera-se que a inclus˜ao dos cortes consiga melhorar o limitante, ou seja, que, embora n˜ao garantido, a solu¸c˜ao ´otima de valor zD seja efetivamente cortada. Observe tamb´em que, junto com a melhora dos limitantes

duais, os cortes adicionados podem ajudar a acelerar a convergˆencia do algoritmo. Vale ressaltar que mesmo com a adi¸c˜ao de desigualdades ´e poss´ıvel que, ao final da execu¸c˜ao do M´etodo do Subgradiente, o problema ainda n˜ao tenha sido resolvido. Mas, partindo-se da suposi¸c˜ao de que as desigualdades geradas pelo relax-and-cut s˜ao boas, estas podem ser adicionadas `a formula¸c˜ao original e passadas a um resolvedor baseado em PLI. O que se prop˜oe aqui ´e um algoritmo h´ıbrido que usa relax-and-cut como uma forma de pr´e-processamento para um resolvedor de PLI. Este resolvedor, portanto, usaria a relaxa¸c˜ao Lagrangiana tamb´em para produzir, com baixo custo computacional, cortes que o auxiliariam a resolver instˆancias que, de outro modo, n˜ao poderiam ser resolvidas. De maneira diferente ao que acontece com algoritmos de planos de corte que usam relaxa¸c˜oes lineares, a redu¸c˜ao do custo computacional na gera¸c˜ao de cortes em um al- goritmo relax-and-cut ´e poss´ıvel em alguns casos, pois os algoritmos de separa¸c˜ao, neste contexto, precisam cortar solu¸c˜oes inteiras. Em [40], por exemplo, os autores mostram que a separa¸c˜ao de uma desigualdade para o Vehicle Routing Problem ´e um problema dif´ıcil no caso geral, mas ´e polinomial no caso de solu¸c˜oes 0-1 puras.

Documentos relacionados