TrabalhodeConclusãodeCurso,2009 LeonardoMarchettiOrientadora:CristinaGomesFernandes Análisedealgoritmosdeaproximaçãoutilizandoométododual-ﬁtting

(1)

Análise de algoritmos de aproximação utilizando o método dual-fitting

Leonardo Marchetti

Orientadora: Cristina Gomes Fernandes

Instituto de Matemática e Estatística Universidade de São Paulo, Brasil

Trabalho de Conclusão de Curso, 2009

(2)

O que é o método dual-fitting?

É um sofisticado método para analisar algoritmos de aproximação para problemas de otimização.

Ele se baseia no princípio de dualidade em programação linear.

(3)

Cobertura por conjuntos

SejaE um conjunto finito eS uma coleção de subconjuntos deE. UmacoberturadeE emS é um subconjuntoτ deS tal que para todoe∈E temos que e∈Spara algumS∈τ.

Seτ é uma cobertura deE emSe temos um custoc tal quec_S ∈Q≥para cadaS ∈ S, definimosc(τ)como o númeroP

S∈τc_S.

(4)

Cobertura por conjuntos - exemplo

(5)

Cobertura mínima por conjuntos

Problema MINCC(E,S,c): Dados um conjunto finito E , uma coleção finitaSde subconjuntos não-vazios de E (que

cobre E ) e um custo c_S ∈Q≥para cada S∈ S, encontrar uma coberturaτ de E emS que minimize c(τ).

(6)

Algoritmo guloso de Chvátal

Veremos um algoritmo guloso proposto por Chvátal [1] para o MinCC.

Algoritmo MINCC-CHVATAL(E,S,c) 1.S⁰ ← S

2.E⁰ ←E 3.τ ← ∅

4. enquantoE⁰ 6=∅

5. sejaZ emS⁰ tal quec_Z/|Z ∩E⁰|é mínimo 6. E⁰ ←E⁰\Z

7. S⁰← {S∈ S⁰ :S∩E⁰6=∅}

8. τ ←τ ∪ {Z} 9. devolvaτ

(7)

Razão de aproximação

Teorema 1: O algoritmoMINCC-CHVATALé uma H_n-aproximação para o problemaMINCC(E,S,c), onde n=|E|e Hné o n-ésimo número harmônico.

Vamos provar o teorema utilizando o método dual-fitting.

(8)

Programa linear inteiro

Considere o seguinte programa linear inteiroPI(E,S,c):

encontrar um vetorx indexado porSque minimize cx

sob as restrições P

S:e∈Sx_S ≥1 para todoe∈E, x_S∈ {0,1}para todoS∈ S.

(9)

Relaxação linear

SejaP(E,S,c)uma relaxação linear dePI(E,S,c).

P(E,S,c)consiste em encontrar um vetorx indexado porS que

minimize cx sob as restrições P

S:e∈Sx_S ≥1 para todoe∈E, x_S≥0 para todoS∈ S.

(10)

Dual da relaxação linear

SejaD(E,S,c)o programa linear dual deP(E,S,c).

D(E,S,c)consiste em encontrar um vetory indexado porE que

maximize P

e∈Ey_e sob as restrições P

e∈Sye≤c_S para todoS∈ S, y_e≥0 para todoe∈E.

(11)

Solução primal

Podemos construir, a partir do que o algoritmo devolve, uma soluçãox deP(E,S,c), que é dada pelos conjuntos

escolhidos pelo algoritmo.

Seτ é a cobertura devolvida pelo algoritmo, x_S =1, seS∈τ

x_S =0, caso contrário.

(12)

Candidato à solução dual

O algoritmo determina implicitamente um candidato à solução dualy.

Para um elementoe∈E, considere a iteração em queeé removido deE⁰. SejaC_e:=E\E⁰ paraE⁰ no início desta iteração eS_e o conjuntoZ escolhido nesta iteração.

Observe queτ ={S_e :e∈E}.

O candidato a solução dual é definido para cadaeemE como

y_e = c_S_e

|S_e\C_e|.

y em geral não é uma solução dual, pois não satisfaz a restriçãoP

e∈Sy_e≤c_S.

(13)

Lema 2

Lema 2: O valor da função objetivo de D(E,S,c)para y é maior ou igual o valor da função objetivo de P(E,S,c)para x . Demonstração: Para cadaS∈τ, considere a iteração em que Sé o conjunto escolhido pelo algoritmo e sejaC=E \E⁰ para E⁰ no início dessa iteração. Então,

c_S = X

e∈S\C

c_S

|S\C| = X

e∈S\C

c_S_e

|S_e\C_e| = X

e∈S\C

y_e.

X

S∈τ

c_s≤X

e∈E

y_e

2

(14)

Fator de escala

Vamos mostrar que apesar dey não ser uma solução de D(E,S,c), se escolhermos um fator de escalaαadequado, o vetor ^y_α é uma solução dual.

Sejay⁰indexado porE tal que, y_e⁰ = y_e

H_n para todoeemE.

(15)

Lema 3

Lema 3: y⁰é uma solução de D(E,S,c).

Demonstração: Temos quey_e⁰ ≥0 para todoe∈E poisy_e ≥0 para todoe∈E. Falta mostrar queP

e∈Sy_e⁰ ≤c_S para todo S∈ S. SejaS∈ S, e sejame₁,e₂, . . . ,e_k os elementos deS na ordem em que são cobertos pelo algoritmo.

No início da iteração em que o elementoe_i é coberto, existem pelo menosk−i+1 elementos descobertos emS. Assimye_i é no máximoc_S/(k −i+1). De fato, como o algoritmo escolhe sempre um conjuntoZ tal quec_Z/|Z ∩E⁰|é mínimo e

c_S

|S∩E⁰| ≤ _k−i+1^c^S , temos queye_i ≤c_S/(k−i+1)e portanto, y_e⁰

i ≤ c_S

(k−i+1)Hn

.

(16)

Lema 3

Lema 3:y⁰ é uma solução de D(E,S,c).

Demonstração: (. . . ) y_e⁰

i ≤ c_S

(k−i+1)H_n. Mas então

X

e∈S

y_e⁰ ≤

k

X

i=1

c_S (k−i+1)Hn

= c_S Hn

k

X

i=1

1

k −i+1 =c_SH_k Hn

≤c_S.

2

(17)

Conclusão

Portanto,y⁰ é uma solução viável para o problema dual D(E,S,c)e consequentemente,

V(D(E,S,c),y⁰)≤opt(D(E,S,c)) =opt(P(E,S,c))≤opt(E,S,c).

Finalmente, podemos concluir sobre o custo da coberturaτ devolvida pelo algoritmo MinCC-Chvatal é tal que

c(τ) =V(P(E,S,c),x)≤V(D(E,S,c),y).

Como temosV(D(E,S,c),y) = H_n·V(D(E,S,c),y⁰), pois a função objetivo deD(E,S,c)é linear, segue que

c(τ)≤Hn·V(D(E,S,c),y⁰)≤Hn·opt(E,S,c) e o algoritmo é umaH_n-aproximação para o problema.

(18)

Generalização

De forma geral, dado um problema de minimização (o método é análogo para problemas de maximização) e um algoritmo de aproximação para este problema, o método consiste em:

1 Obter um programa linear inteiroPI(I)para uma instância genéricaIdo problema, tal quePI(I)seja equivalente ao problema para toda instânciaIviável.

2 Considerar o programa linearP(I), que á a relaxação linear dePI(I), e seu dualD(I).

3 Determinar uma soluçãox deP(I)a partir do que o algoritmo devolve.

4 Perceber como o algoritmo determina implicitamente um candidato a soluçãoy deD(I).

(19)

Generalização

De forma geral, dado um problema de minimização (o método é análogo para problemas de maximização) e um algoritmo de aproximação para este problema, o método consiste em:

(. . . )

5 Mostrar que o valor da função objetivo deD(I)paray é pelo menos o valor da função objetivo deP(I)parax.

6 Mostrar que, para algumc ≥1, ^y_c é uma solução deD(I).

7 Concluir que o algoritmo é umac-aproximação para o problema.

Note quec pode ser uma constante ou uma função de<I>, onde<I>é o tamanho da instânciaI.

No trabalho mostramos a prova de que os passos 1-6 de fato levam a conclusão do passo 7.

(20)

Outros problemas estudados

Na monografia estudamos também a análise de algoritmos para os seguintes problemas:

Problema da Multi-cobertura Mínima por Conjuntos.

Analisamos o algoritmo guloso encontrado no livro de V.

Vazirani [3].

Problema Métrico da Localização de Instalações.

Estudamos o algoritmo guloso encontrado no artigo de Mahdianet al. [2].

(21)

Referências

V. Chvátal.

A greedy heuristic for the set-covering problem.

Mathematics of Operations Research, 4(3):233–235, 1979.

M. Mahdian, E. Markakis, A. Saberi, and V. Vazirani.

Greedy facility location algorithms analyzed using dual fitting with factor-revealing LP.

Journal of the ACM, 50:127–137, 2001.

V.V. Vazirani.

Approximation Algorithms.

Springer, 2001.

(22)

TrabalhodeConclusãodeCurso,2009 LeonardoMarchettiOrientadora:CristinaGomesFernandes Análisedealgoritmosdeaproximaçãoutilizandoométododual-ﬁtting

Análise de algoritmos de aproximação utilizando o método dual-fitting

Dúvidas?