Algoritmos Relax-and-Cut (R&C) - Algoritmos relax-and-cut para problemas de programação int

O termo relax-and-cut tem sido usualmente utilizado na literatura para denotar uma larga classe de algoritmos baseados em relaxa¸c˜ao Lagrangiana, onde desigualdades2 _{s˜ao duali-}

zadas somente quando violadas pela solu¸cão corrente do Problema Lagrangiano Relaxado [9, 12, 24, 32, 34, 35, 39, 40]. Vale ressaltar que o termo relax-and-cut foi mencionado ori- ginalmente em um artigo de Escudero et al. [18]. Entretanto, neste artigo, como em [30], os algoritmos de relaxa¸cão Lagrangiana propostos são empregados de uma forma distinta daquela implementada nas cita¸cões anteriores. A distin¸cão entre estas duas abordagens é explicitada por Lucena em [35].

20 Cap´ıtulo 2. Fundamenta¸c˜ao te´orica

Devido ao esquema dinâmico de dualiza¸cão proposto, algoritmos relax-and-cut apa- recem como uma alternativa que pode viabilizar o uso da relaxa¸cão Lagrangiana para resolver problemas onde há um número muito grande (potencialmente exponencial) de restri¸cões a serem dualizadas. Tentativas neste sentido datam do in´ıcio da década de 1980 [2]. Todavia, a formaliza¸cão de idéais propondo um esquema seletivo de desigualdades a serem dualizadas só surgiu com os trabalhos desenvolvidos por Lucena [32, 33] para resolver o Problema de Steiner em Grafos.

2.4.1 Estrat´egias de implementa¸c˜ao

Essencialmente duas estratégias de implementa¸cão de algoritmos R&C são discutidas na literatura. Elas diferem, basicamente, no momento em que as desigualdades são identificadas e dualizadas. Em uma delas, a cada passo do algoritmo, várias execu¸cões do Método do Subgradiente são realizadas. A cada execu¸cão do método, desigualdades válidas que violam a solu¸cão do PDL atual são identificadas e armazenadas. Ou seja, a identifica¸cão destas desigualdades é postergada até que o PDL atual seja considerado resolvido e a incorpora¸cão destas desigualdades à formula¸cão atual só ocorre no in´ıcio da execu¸cão subseqüente do MS. A outra abordagem corresponde ao algoritmo descrito por Lucena em [32, 33]. Nesta, uma única execu¸cão do MS é realizada e, a cada itera¸cão do método, busca-se identificar desigualdades válidas que violam a solu¸cão do PL(λ) atual, as quais são incorporadas à formula¸cão na itera¸cão seguinte (detalhes em [12, 24, 32, 35, 40]).

Para ambas as abordagens, os processos se repetem até que algum critério de parada seja satisfeito. Note também que, independente da estratégia adotada, três poss´ıveis mudan¸cas podem ocorrer na formula¸cão atual com a descoberta de novas restri¸cões: (i) altera¸cões na fun¸cão objetivo devido à dualiza¸cão das novas desigualdade encontradas (ii) modifica¸cão da estrutura do(s) novo(s) Subproblema(s) Lagrangiano(s), quando as desigualdades identificadas são mantidas na formula¸cão ou (iii) ambas, quando apenas um subconjunto próprio das novas desigualdades é dualizado. Desta forma, independente da mudan¸ca sofrida, um novo PDL a ser resolvido é formulado. Com o objetivo de enfatizar as diferen¸cas entre as duas estratégias, Lucena [35] denominou a primeira abordagem de Delayed Relax-and-Cut (DR&C). Em contrapartida, a abordagem por ele adotada em [32, 33] foi denominada Non-Delayed Relax-and-Cut (NDR&C). Vale observar que no Cap´ıtulo 4 propomos uma terceira forma alternativa de utiliza¸cão de planos de corte combinados com algoritmos Lagrangianos.

2.4.2 Modifica¸c˜oes no M´etodo do Subgradiente

Nesta tese, independente da estratégia de implementa¸cão adotada, trabalhamos com uma adapta¸cão do Método do Subgradiente descrita em [24]. Para fins de exposi¸cão das mu-

dan¸cas efetuadas no MS, considere que as restri¸c˜oes {aix ≤ bi : i = 1, 2, . . . , m1} candi-

datas à dualiza¸cão (em um esquema Lagrangiano) são aquelas explicitadas em (2.5). Assumindo-se que m1 pode ser muito grande, fica evidente o elevado esfor¸co computa-

cional requerido, a cada itera¸cão do Método do Subgradiente, para a dualiza¸cão de todas estas restri¸cões. Afora esta questão, como já comentado, problemas de convergência podem ocorrer no MS quando se tem um número muito grande de componentes/entradas não nulas no vetor de subgradiente. Nesta situa¸cão, o uso expl´ıcito dos subgradientes no cálculo de θ provocaria mudan¸cas apenas marginais no vetor de multiplicadores de Lagrange entre itera¸cões consecutivas do método.

Como alternativa para contornar estas dificuldades, o R&C propõe uma estratégia dinâmica de uso das restri¸cões candidatas à dualiza¸cão nos cálculos feitos pelo MS: ao invés de todas as restri¸cões serem explicitamente dualizadas, uma estratégia de sele¸cão é estabelecida para escolha daquelas a serem efetivamente dualizadas a cada itera¸cão.

A estratégia adotada é baseada na classifica¸cão das desigualdades candidatas à dualiza¸cão, a cada itera¸cão do MS, de acordo com os três grupos seguintes: o primeiro (grupo 1) é formado pelas desigualdades violadas por ¯xk_{, ou seja, desigualdades tais que}

i = (bi − aix¯k) > 0, ∀i ≤ m1; o segundo (grupo 2) cont´em as desigualdades `as quais

estão correntemente associados multiplicadores de Lagrange com valores não nulos e, fi- nalmente, o terceiro grupo (grupo 3) é composto pelas demais desigualdades. Um ponto interessante a ressaltar nesta divisão é que pode haver interse¸cão entre os grupos 1 e 2 de desigualdades.

A partir desta classifica¸cão é pertinente observar que multiplicadores de Lagrange associados às restri¸cões pertencentes, na itera¸cão corrente do MS, ao grupo 3, continuam com valores nulos ao final da itera¸cão (uma simples análise da expressão (2.13) é sufici- ente para se chegar a esta conclusão). Note também que, diferentemente das restri¸cões pertencentes aos grupos 1 e 2, restri¸cões do grupo 3 não podem contribuir para os custos Lagrangianos na itera¸cão corrente pois, para restri¸cões deste grupo, o termo λi(bi − aix)

é sempre nulo. Por estes motivos, restri¸cões dos grupos 1 e 2 recebem a denomina¸cão de desigualdades ativas, enquanto restri¸cões do grupo 3 são denominadas desigualdades inativas. Cabe notar também que, de uma itera¸cão a outra do MS, uma desigualdade pode passar de ativa a inativa e vice-versa.

Estabelecida essa classifica¸cão, algoritmos relax-and-cut sugerem, a cada itera¸cão do MS, proceder a dualiza¸cão efetiva apenas das desigualdades ativas. Assim, somente as restri¸cões violadas pela solu¸cão do PLR corrente ou aquelas que tenham multiplicadores de Lagrange associados não nulos são consideradas nos cálculos efetuados dentro do MS.

E importante mencionar que, no caso de relaxa¸c˜ao Lagrangiana cl´assica, Beasley [8] observou que quando, simultaneamente, λi = 0 e ski > 0, o multiplicador λi permanece

com valor nulo ap´os sua atualiza¸c˜ao. Entretanto, o valor de (sk

22 Cap´ıtulo 2. Fundamenta¸c˜ao te´orica

express˜ao de c´alculo do tamanho do passo. Assim sendo, neste caso, Beasley sugere fixar o subgradiente sk

i em zero antes do cálculo de θ. Na prática, esta sugestão equivale à

estratégia adotada nos algoritmos R&C que consiste em ignorar a dualiza¸cão de restri¸cões do grupo 3, i.e., de desigualdades inativas.

Observe que, a atualiza¸cão dos multiplicadores de Lagrange com base apenas em desigualdades ativas, possibilita que apenas uma diminuta parte do total de desigualdades sejam explicitamente consideradas a cada itera¸cão. Entretanto, vale a ressalva de que o emprego do esquema descrito acima não impede que o número de restri¸cões ativas a cada itera¸cão seja muito grande. Em trabalhos recentes, A. Lucena [34] e da Cunha [15] discutem esta questão e apresentam sugestões para lidar com esta situa¸cão em particular.

2.4.3 Planos de Corte e Relax-and-Cut

A abordagem implementada pelos algoritmos relax-and-cut pode ser uma alternativa ade- quada a problemas de otimiza¸cão combinatória, independente de se dispor de uma formula¸cão para o problema com um número muito grande de restri¸cões candidatas a dualiza¸cão. Uma situa¸cão t´ıpica desta adequa¸cão é quando novas restri¸cões válidas para o problema (potencialmente em número exponencial) podem ser descobertas dinamica- mente, de forma análoga ao que acontece no emprego de algoritmos para gera¸cão de planos de corte em programa¸cão linear.

De forma idêntica ao esquema proposto por algoritmos para gera¸cão de planos de corte, rotinas de separa¸cão podem ser desenvolvidas e incorporadas ao método usado para resolver a relaxa¸cão Lagrangiana (aqui, o MS). Assim, elas podem ser utilizadas na obten¸cão, a cada itera¸cão, de novas restri¸cões válidas violadas pela solu¸cão do PLR corrente. Estas novas restri¸cões podem, então, ser dualizadas ou mantidas no novo PLR caso a permanência delas não o tornem muito mais dif´ıcil de ser resolvido.

Também como os algoritmos de planos de corte, algoritmos relax-and-cut podem ser utilizados para melhorar os limitantes duais de problemas de otimiza¸cão combinatória e, eventualmente, conseguir provar a otimalidade de uma solu¸cão. Obviamente, a eficácia do método é bastante dependente da qualidade dos cortes encontrados e dos algoritmos (heur´ısticas) utilizados para obten¸cão de solu¸cões viáveis.

Para ver que desigualdades encontradas por um algoritmo relax-and-cut podem, na prática, melhorar o limitante obtido, basta resgatarmos a interpreta¸cão do resultado de- monstrado no teorema 2.3.1. De acordo com este teorema, resolver o Problema Dual La- grangiano (à otimalidade) dado por zDP DL = minλ∈Rm1₊ {max [cx + λ(b − Ax) : x ∈X]}

´e equivalente a resolver o problema de programa¸c˜ao linear zDLP = max {cx : Ax ≤

b, x ∈ conv(X)}. Ou seja, em teoria, ambos apresentam o mesmo valor de solu¸cão ótima, zDP DL = zDLP = zD, o qual é um limitante dual para o PLI original (2.3).

Agora, note que a adi¸cão de cortes à formula¸cão significa aumentar o número de linhas da matriz A. Assim, um novo PL dado por z′

DLP = max {cx : A

′_{x ≤ b}′_{, x ∈ conv(}_X)}

´e gerado, onde a A′ ₌ A π

´e a matriz de cortes inseridos em A, b′ ₌ h b π0

e πx ≤ π0.

Desta forma, sendo z′

DP DL o valor do PDL equivalente ao PL com a adi¸c˜ao dos cortes

πx ≤ π0, tem-se tamb´em que zD′ P DL = z

′

DLP = z

′

D. Portanto, em teoria, pode-se afirmar

que z′

D ≤ zD. Em outras palavras, o novo limitante obtido com a adi¸c˜ao dos cortes ´e pelo

menos tão bom quanto o anterior. Na prática, este limitante pode não ser alcan¸cado ou requerer muito tempo para ser obtido. Entretanto, espera-se que a inclusão dos cortes consiga melhorar o limitante, ou seja, que, embora não garantido, a solu¸cão ótima de valor zD seja efetivamente cortada. Observe também que, junto com a melhora dos limitantes

duais, os cortes adicionados podem ajudar a acelerar a convergência do algoritmo. Vale ressaltar que mesmo com a adi¸cão de desigualdades é poss´ıvel que, ao final da execu¸cão do Método do Subgradiente, o problema ainda não tenha sido resolvido. Mas, partindo-se da suposi¸cão de que as desigualdades geradas pelo relax-and-cut são boas, estas podem ser adicionadas à formula¸cão original e passadas a um resolvedor baseado em PLI. O que se propõe aqui é um algoritmo h´ıbrido que usa relax-and-cut como uma forma de pré-processamento para um resolvedor de PLI. Este resolvedor, portanto, usaria a relaxa¸cão Lagrangiana também para produzir, com baixo custo computacional, cortes que o auxiliariam a resolver instâncias que, de outro modo, não poderiam ser resolvidas. De maneira diferente ao que acontece com algoritmos de planos de corte que usam relaxa¸cões lineares, a redu¸cão do custo computacional na gera¸cão de cortes em um algoritmo relax-and-cut é poss´ıvel em alguns casos, pois os algoritmos de separa¸cão, neste contexto, precisam cortar solu¸cões inteiras. Em [40], por exemplo, os autores mostram que a separa¸cão de uma desigualdade para o Vehicle Routing Problem é um problema dif´ıcil no caso geral, mas é polinomial no caso de solu¸cões 0-1 puras.

No documento Algoritmos relax-and-cut para problemas de programação inteira 0-1 (páginas 33-37)