OTIMIZAÇÃO DE SISTEivIAS DECOMPONÍVEIS
Dilerm.ando Ferreira Lopes ]'ilho
TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAÇÃO DOS PROGRAMAS DE P6S-GRADUAÇÃO DE ENGENHARIA DA UNIVERSIDADE FEDERAL DO RIO DE JANEIRO COMO
PARTE DOS REQUISITOS NECESSÍRIOS PARA A OBTENÇÃO DO GRAU DE MESTRE EM CI.í!!NCIA (M .. Se .. )
Aprovada por:
ClÓvis Caesar Gonzaga - presidente 7
,/'{/l(/~,Lt
ll
' e ~ Ronaldo Cesar Marinho PersianoRodrigo A. Restrepo RIO DE JANEIRO
ESTADO DA GUANABARA. - BRASIL AGOSTO DE 1972
RESUMO
tste trabalho trata da otimização desiste-mas decomponíveis. Um problema decomponível de progra mação matemática
é
proposto e sua solução obtida porcoordenação dual. Dois coinceitos básicos que apare -cem em programação matemática de sistemas de grande porte são usados: linearização externa e relaxação.
Um algoritmo tipo plano cortante que permi-te o abandono de vínculos plenamenpermi-te satisfeitos é ob tido com base em resultados de teoria de dualidade. Sua aplicação ao problemas linearizado externam.ente resulata ém um método convergente para solução do pro blema original. Um programa de computador foi desen -volvido com êste propósito.
ABSTRllCT
This work deals with the optim.ization of deoomposable systems. A deoomposable mathematical programming problem is proposed ans it$ solution is achieved by means of dual coordination. Two basic concepts arising in large scale mathematical program-ming are used: outer linearization and relaxation.
A cutting plane algorithm. without nested constraint seta is sinthetized based on results from duali ty,, theory. Its ap:pication to the ou ter linearized problem resulta in a convergent method for the solution
of the original problem. A com:puter program has been developed.
SOORIO
Capítulo I Introdução
Secção l - Objetivo primário . • • • • • • • • 1 Secção 2 - Forma organizacional associada a ºS 5
Secção·
3 -
Resolução do problema S • • • • • ~Secção 4 - Notação • • • • • • • • • • • • • • 10 Capítulo II O problema S e sua resolução por
coordenação dual
Secção l - O problema de tomada de decisão •• 13 Secção 2 - Resolução do problema S • • • • • 16 Capítulo III Secção 1 Secção 2 Secção 3 Secção 4 Secção B OapítulolV Estabilidade do problema S Equivalência entre S e D
Algoritmo mestre de resolução de D - Introdução • • • • • •
.
•.
• • •- Estabilidade do problema
s
.
.
.
•- Equivalência entre
s
e D.
• • • - Linearização externa do problema D - Algoritmo mestre para resolução do23
24
27
28
problema D • • • • • • • • • • •
• 32
Implementação do algoritmo mestre
Secção 2 - Algoritmo mestre plano cortante
...
• 43
Secção 3 - Versão implementada de Al\/IPO •
.
• • 45Secção 4 - Mecanismo d_e geração de cortantes • 49
Oa:eítulo V Implemantação do algoritmo dual
Secção 1 - Introdução • • • • • • • • • • • • 55
Secção 2 - Resolução dos subproblemas Di • • 56
Secção 3 - Adição-e-abandono de vínculos • • • 60
Secção 4 - Fluxograma final • •
.
• • • • • • 62A;eêndice A
Secção 1 - Teoria de dualidade • • • •
.
• • • 671Secção 2 - Mapeamentos ponto-conjunto • • • • 7/1
A;eêndice B
Se?ção 1 - Entradas e saídas do programa • • •
73
Secção 2 - Mensagens de êrro • • • • • • • • • 7:5
Secção 3 - Dimensionamento • • • • • • • • • • 75 Secção 4 - Subrotinas • • • • • • • • • • • • 78 Secção 5 - Fluxogramas • • • • • • • • • • • • 81 Bibliografia • • •• , • . • • • • • • • • • • • • . • ,139
I INTRODUÇÃO
1. Objetivo primário
. -· .,.,, ·.
Consiste nosso obj_etivo pr,imário em definir um problema de tomada de deci~~-º, dar-lhe uma interpretação e então propor u.ril. algo~itmo de resolução implementável, discuti_g do-lhe os aspectos computacionais.
Definir um.problema de tomada de decisão, segundo Vara:i]ya ((43) , signifi,ca identificar em. um dado contex-to os seguintes elemencontex-tos:
~ um1conjunto de agent~s, aos quais cabem,as toma -das de decisão;
b - para Cada
um
destes agentes, um critério de p_refe rência (por· exemplo, uma função-objetivo);.2,· - um ··conjunto de decisões viáveis associado a cada um destes agentes;
~ - uma estrutura de informaçãQ, que permita a cada agente realizar. obser-va4oes sõbr.e o seu "meio am-biente";
~ - uma descrição ou modêlo do sistema, por intermédio do qual é possível examinar as interaçoes entre o meio ambiente e as decisôes tomadas por um dado agente.·
de cada agente é definido por uma regra de decisão, que corres-ponde à sua resposta a uma dada observação (estímulo) efetuada. Podemos ainda, segundo Marschak e Radner [34] ,, definir.· como for. ma or@nizacional uma particular escolha de uma estrutura dei~ formação e um conjunto de regras de decisªº' uma para cada age~ te.
1
Passamos agora a definir o nosso problema de tomada de decisâo, identificando os seus diversos elementos cons titutivos. Problema
S -
Geoffrion[15]
k maximize ~ f..'. (x. ) i=l i. 1 . sujeito a: onde (l:!!:i:!!:k): x. ~ X.:, (16i~k) 1 .&l. kL
g.,(x.) ~ b --1 Jl. 1 1=-xi - é o vetor de decisão, de dimensão ni, ass_Q ciado ao agente i;
"- n.
i.e
R 11 é o conjunto de decisôes viáveis associado
ao agente i;
fi:X:ftR -
é
uma função-critério com valores em R as-sociada ao agente i;g1:X=-R1°"- é um.a função-demanda com valor.es em
tD-,
ª.!!,_ 1
sociada ao agente i_, expressando o uso de m recursos pDDdutivos dados correspondente b e ~
-àl decisâo x. ;
. i m .
é um vetor de R representando as disponi~ bilidadas de m recursos produtii..vos dados.
2
S é a formulaçâo genal de uma grande clas-se de problemas, cujo protótipo clas-seria um modelo economico comp~ titivo. Um.m primeira interpretação de S seria a segu.inte: um
agente central (gerente) deseja repartir uma certa quantidade de m recursos produtivos em disponibilidade (vetor.·b) entre k subsistemas, onde cada subsistema toma suas próprias decisões viáveis (x.e
X.,
16i~k) referentes à utilizaçâo de sua quota de. J. J.
recursos produtivos, de modo a maximizar o "lucro" do sistema como um todo.
Apresentaremos agora dois exemplos de proble mas de interesse prático, que podem ser colocados sob a forma
do problema· S .
Exemplo: um problema de exploração de recursos flore.§. tais
[36] •
Deseja-se estabelecer um plano plurianuai, abrangendo
um período de manos, de derrubada de árvores planta -das em n áreas diferentes, maximizando-se a produção t.otal. Sejam:
c .. - cubagem totai_ (m
3
de madeira) correspondente J.Jà área jj (l~j~) quando a derrubada
é
efetu~ da no ano i .(l~it.~);rj - número de acres da área j (l~jén);
xiji - fração da área j (l~j½) a ser derrubada no ano L (l~~);
a1 - número total de acres que podem ser derruba-dos no ano i (16i6:zn.).
O problema de exploração de recursos florestais poderá assim ser formulado:
lD!. n, maximize
Lr=
i=l j=l C •• X •.•. J.J' 1.JJ sujei t.o a:3 n
L
n·J.;x:i.J·, ~ a. {l~i'm) j=l J J • J.. x .. 6 l. l..J x ... ~o
l..Jj . {l6i~)Exemplo: um problema de planejamento de produção de~ nergia elétrica
[35] •.
Deseja-se escalonar a produção de energia elétr:hc.a ,:· destinada ao consumo de n áreas conectadas entre si. , minimizªndo-se o custo total dffi produção. Sejam:
e jj - cotj.sumo total de energia elétrica correspo_!! dente à área j ( l~j ~); ,--,
xlj produção total de ·energia elétrica corres -pendente à área j (l~jé:n);
x2 jj - quantidade total de ene'rgia elétria.a inter..'-cambiada entre a área j (l~j~n) e outras
á-reas, pelas linhas de transmissão (x
2,. ~ O
. J
P. (xl .. ,x2 .. )
J JJ .J]
significa que a área j esta recebendo enen~ gia elétrica proveniente de outras áreas); - dissipação de energia elétrica por:perdas
váriª-s na área j) (léj½);
F .. (xli .. ) - custo de_ pr:odução de energia elétrica ná
á-J1 .JJ
rea j {l~j½) por unidade de medida de ene~· gia elétrica.
O problema de escalonamento da produção de energia e-létrica poderia assim ser formulado:
n
minimize
L
F .. (xl.J
j=l JJ J,
n ~
'
L__, x 2 .. - O j=l .J; . xl ··. J} - x2.j - P .. ,(xl .. ,x2 .. J, . JI J.,.J
~ c .. J; x1 __ · ~ O J . . . (l~j~) (16j~)nenhuma nestrição de sinal a x2 ..
JJ (l~j~n)
Uma outra ilustração ii.nteressante poderia ser vista, por exemplo, em
[3].
2. Forma organizacional associada a S
Vemos pois que o modelo proposto para o pro-blema S
é
bastante gerai, o que permite associá-lo a diversas formas organizacionais. Dentre estas, adotaremos a seguinte:S é o modelo de planejamento-de uma companhia (siste ma) consistindo de um gerente
e
k divisões {subsiste -. mas·}, cada uma delas produzindo · e vendendo determina -.-.;-.dôs bens.
Dentro deste particular enfoque, o programa de produção dai-ésima divisão . . é representado pelo vetor de ati
• .
-vidades xi_ (16:i~k), cada função f.:i (xi) (l~i6ak) representando a parcela de contribuição dai-ésima divisão ao "lucro" total da companhia.
Podemos distinguir na formulação do p~oblema S dois tipos de restrição. O primeiro, representado pela ine-quação vetorial
é uní.a restrição de recursos. Realmente, para realizar.·um. certo programa de produção xi, cada divisão necessitará receber do@ rente um.a certa quota gi (xi..) dos necursos produtivos c.omuns que são oferecidos a todas as'divisões, cujas disponibilidades ex -pressam-se pelo vetor_ b. O segundo tipo _de restrição, répresen,.. tado pelos conjuntos viáveis XiL' expressam restrjj_ções impostas pela tecnologia de cada divisão, bem como lev.amJ. em conta limita ções de recursos produtivos p:n.óprios, partiêu.lares à divisão.
Dentro deste contexto, a função-objetivo do problema S expressa o imperativo de otimizar o funcionamento da companhia, no sentido de determinar-se um ponto de operação que maximize seu "lucro" total.
Tal interpretação adotada para S foi pela prim~ira vez dada por. Baum.ol e Fabian
[1] ,
e também por.· Zschau-[49] •
Outras interpretações ligeiramente diferentes foram dadas por Gale[11] ,
Korna:L_ e L~ptak[28] ,
Malinv1:tud[3IJ
e Wei tzman[46] •
Duas observações interessantes podem ainda ser feitas a respeito do problema S. Primeiro, é possível mo-_ dificar'o formato de S para abranger os casos em que há movi-mentação de produtos semi-acabados de uma para outra ou outras divisões para posterior acabamento, como o que ocorre, por· exe!,!'!t plo, em linhas de produção. O e~emplo (3) é um.a ilustração des-ta possibilidade, represendes-tando~se a troca ou intercâmbio de e-nergia elétrica entre as diversas áreas pela restrição
n
L,
x2 •. ~ O
j=l JJ .
Segundo, é possível também modificar o formato do problema S para abranger situações não-determinístiêas. Uma discussão a respeito desta possibilidade pode ser encontrada, por exemplo, em Jennergren [24] •
Uma vez proposta e interpretada a forma organizacional correspondente ao problema S , resta sin-tetizar um algorit~o implementável, de convergência garantida, que se prest·e à resolú.çao de
-~':S ,
uma_
vez explicitados todosos
seus elementos constitutivos.A síntese deste algoritmo
é
ore -sultado Último de um estudo sistem~tico, que começa pela análi-se do tamanho e da estrutura do·problema S, à luz dos concei-tos de progràmação matemática de sistemas de grande porte [16.,] ,[30].
Não há o que se possa chamar de d~ finiçã.o de sistemas (ou problemas)·de grande porte, que apare -cem _frequentemente
em
planejamento economico, e~ gestão empres_! ria.leem engenharia. Sendo assim; contentar.i-nos-emos em a.firmar que problemas de grande porte earaoterfzam~e não só pelo tama-nho, poréJJL., melhor, pelo tamanho em conjunção com s~~ estrutura não sendo possível resolver-se o problema de grande porte pelas técnicas usuais de programação matemática (por exemplo, progra-mação linear e algoritmos implementáveis de prograprogra-mação não-li-near).A idéia básica da_program.ação mat~ m~tica de sistemas de grande porte reside em explorar convenien
temente a estrutura do problema que se deseja resolver. Em uma primeira fas:e, chamada manipulação, buscase reescrever o pro -blema dado sob uma forma equivalente, mais adequada para a nes_Q lução, e que recebe o nome de programa mestre.~~ Este pr.ograma mestre, em um.a segu.nda fase, é :r.eduzido a uma sequencia de pro-blemas implementáveis, de menor.· porte, pelo uso de diversas
.fil!.-trategias de solução, ouja aplicação fornece enfim um algoritmo implementável de resolução do problema originalmente proposto.
Estes conceitos - manipulações e estratégias de solução - unificados foram por Geof'frion [16] , e resultam das contribuições individuais de dezenas de nomes importantes.
A característica mais importante da estrutu-ra do problema S é que a funçãoobjetivo e a inequação veto -rial que leva emcconta a restrição de recursos produtivos co muns são aditivamente separáveis por divisão, ou seja, estamos
tratando de uma estrutura tipicamente multidivisional. O proble ma. S, mercê desta particularidade notável, classificase en
-tão como decomponível, sendo possível resolve-lo por decentrali zação.
Decentralização, com vistas à nossa fomn.a 012·
ganizacional, significa atribuir a cada divisão da companhia uma larga autonomia, delegando autoridade, responsabilidades e poder·de decisão aos níveis inferio:r.es da hie:nar.g_uia (gerentes das divisões). Aos níveis superiores desta mesma hierarquia (no caso, o gerente da companhia), é deixada apenas a tarefa de de-finir uma política global e a tomada de decisões importantes, que afetem a companhia como um todo
[25]
.,Além do mais, a polí-tica de decentralização pe::vmite tratar o caso, mais geral, em que nenhum agente possui informações ou conhecimentos comple tos. Essa observação será melhor.' explicada posteriormente.Sob um ponto de vista mais imediatista, de -centralizar significa resolver o problema S desmembrando-o em . k subproblemas de menor porte (um subproblema correspondendo a
cada divisão), assumindo o gerente da companhia a tarefa de coordenar a formulação de tais subproblemas de maneira que qual quer combinação de soluções Ótimas dos mesmos seja uma soluçâo
ótima para S • Essa tarefa de coordenação é executada via um processo iterativo de troca de informações entre o gerente e as divisões.
permite explorar em nosso proveito a estrutura e característi -cas dos subproblemas assim obtidos, de resolução comprovadamen-te mais imediata que S • Outra vantagem, sob o ponto de vista computacional., é a viabilidade de processamento em paralelo.
Mais especificamente, o programa mestne a ser obtido, isto
é,
a versão decentralizada de S, será obtida pela manipulação chamada dualização. O programa mestre, após a dualização,é
novamente manipuladé por linea!!_zação externa, li nearizando-se totalmente sua funçao-objetivo pelo uso de giper'--planos-suporte, que, como veremos, aparecem naturalmente como resultado da dualização. Nesta fase o algoritmo de resolução do prog.t'.ama mestreé
ainda conceitual., pois esta linearizaçao totalé obtida com o emprego de um nú.mero infinito de hiperplan~-porte. Estas manipulações são àpresentadas, discuti.das e justi-ficadas nos capítulos II e III.
Essa dificuldade é removida pela aplicação da estratégia de relaxação
[7],,o
que constitui assunto para o capítulo IV. Relaxar o programa mestre linearizado externamente significará trabalhar, a cada iteração do algoritmo de resolu -ção, com um número finito de hiperplanos-suporte. A cada i~er§ ção são gerados novos hiperplanpssuporte e, sob certas condL -ções estabelecidas por Eaves e Zangwill.. [:LO] , abandonados hipe!: planos-suporte mais antigos, mantendo-se pois o tamanho do pro-grama a ser otimizado dentro de limites computacionalmente acei táveis. Essa combinação linearização externa/rela~ação foi. ini-cialmente sugerida por Kelley[26]
e Dantzig e Madansky[8].
A coordenação desse processo iterativo de ge ração e abandono de aproximaçóes lineares inspira-se em algorix mos tipo p_lano-cortante, primeiramente sugeridos por Kelley [26]
e Cheney e Goldstein
[5].
Importantíssimos sâo os resultados r~ centemente obtidos por Eaves e Zangwill (10] , por· nós aprovei t_ê: dos, e que garantem a convergência do algonitmo de resoluçâo com o abandono de aproximaçôes lineares. Esses aspectos sâo di~ cutidos minuciosamente no capítulo IV.Comentaremos ainda uma dificuldade adicional até à presente data ainda não superada, ou seja, _q_ue o processo de geração de hiperplanossuporte apresentado no capítulo V -é um processo essencialmente infinito. Com vistas a aplicações práticas esse processo de geração é então truncado, restando nos tão-somente apontar a_necessidade de compatibilizar·conver:... gência e truncamento.
As hipóteses assumidas no decorrer deste tr§ balho, explicitadas no capítulo II, são, basicamente, convexid§ de, compacidªde, e diferenciabilidade.
No apêndice A são apresentados alguns resul-tados teóricos sôbre teoria de dualidade transcritos de [17]e s6bre mapeamentos ponto-conjunto
[22], (2].
No apêndiceB
são~ presentados e comentados os diagramas de bloco do:. allgori tmo, im,.. plementado de resolução do problemaS,
mais as listagens cor-respondentes a um problema de tomada de decisão por·nós propos~ to e resolvido.4.
NotaçãoA notação empregada no decorrer-deste traba-lho
é,
sempre q_ue possível, a de uso corrente. Outras notações. aqui não comentadas são de compreensão imediata pelo simples e-xame do contexto onde situadas.Os conjuntos são denotados por letras maiús-culas gregas ou latinas, as matrizes por·letras maiúsmaiús-culas lati nas. Vetores são assimilados a matrizes-coluna, e representados por letras minúsculas latinas. O produto escalar de dois veto -res é denotado por um ponto(.). Componentes ou famílias indeX§ das de vetores são indicadas por superíndices minúsculos lati -nos.
romanos, e suas diversas secções por algarismos arábicos. Exem~ plos, definições importantes, teoremas e lemas são numerados s~ quencialmente por meio de algarismos arábicos colocados à es querda do corpo do texto.
Referências ao próprio texto são dadas entre parênteses, citando-se o nú.mero correspondente e, se necessário também o capítul'o. As referências bibliográficas, arroladas após o apendice B, são referenciadas por seus respectivos núme-ros colocados entre colchetes.
II O PROBLEMA. S E SUA RESOLUÇÃO VIA DUAL
1. O problema de tomada de decisão
Seja o seguinte problema de tomada de deci -são S, determinístico, de estrutura multidivisional, constan-te de k divisões (subsisconstan-temas) sob a coordenação de um agenconstan-te central [15] :
s
onde (l~i~k): maximize sujeito a: kL
f.(x. > . L J. i J.= x.e J.._X.
l,i..:ti:
L
g .. (x .. ) :? b · 1 l. J._ 1=xi - é o vetor de decisão, de dimensão n1_,, assoei ado ao agente i;
n.
X.E R 1 - é o conjunto de decisões viáveis associado
J.
ao agente i;
:f .. J._ :X.:--.R -J._ é uma função-critério com valores em R asso .... ciada ao agente i;
X ~ ~
g1_: :ii.-+-,L\; - é uma função-demanda com valores em .tt - , ass.Q.
ciada ao agente i, expressando o uso de m r~ cursos produtivos dados correspondente à
de-b.e
It11
-cisão xi;
é um vetor' de
IfL1
representando as disponiilii.-lidades de m recursos produtivos dados.Já vimos no capítulo I que S pode ser con-siderado como um ,EEoblema de alocação de recursos, já que o ob-jetivo do agente central (gerente) é distribuir· quotas de m re-cursos produtivos comuns (cujas&disponibilidades representam-se pelas m ~omponentes do vetor b) entre os k subsistemas da compa nhia, visando-se maximizar o lucro da companhia como um. todo. Foram também apresentadas várias interpretações e exemplos para o problema S, e, em linhas gerais, foi delineada a maneira de obtenção de um. ~lgoritmo implementado de resolução para S, a-través dos conceitos e técnicas de programação matemática de sistemas de,grande porte.
Assumiremos doravante como válidas as. segui~ tes hipóteses básicas associadas ao problema S, hipóteses es-tas que hão de acompanhar-nos no decorrer de todo êste trabalho.
Hipóteses associadas-ª S : (a)
(b)
( c)
os conjuntos X. (l~i~k) são convexos, compa~ l. . tos e não-vazios;
as funções fie cada componente das funções -g. (l~i~k) são côncavas, diferenciáveis e J.._ explícitamente conhecidas em XL (l~i~k); o problema S é consistente, isto
é,
seu conjunto de soluções viáveis é não-vazio; (d) não há indivisibilidades.Cabe aquLum. comentário a respeito das hipó-teses supracitadas. Exigências de concavidade de funçõescritério a serem otimizadas, e de convexidade e compacidade de con
-juntos viáveis são ti.picas em economia
[36]. A
validade destas hipóteses em exemplos clássicos de otimização aplicados à econ_g mia, com.o por exemplo a teor:La da escolha do consumidor· e t.eo. -ria da produção, é que permite eliminan'dificuldades acarreta -das pela existência de máximos locais. Hi.póteses sôbne convexii.-dade e fechamento de conjµntos viáveis de produção aparecem, por exemplo, em modelos de economia competitiva, v.g. modêlo de Arrow-Debreu-Mackenzi.e[29] •.
Exigimos diferenciabilidade por·simultânea -mente garantir-nos continuidade e aplicabilidade de métodos de
otimização tipo direçOes viáveis, que aplicaremos à resoluçao dos subproblemas, conforme discutido no capitulo V. A combina
-ção continuidade/compacidade permitir-nos-á ainda garantir que êstes subproblemas possuem solução Ótima, e que poderemos con -fundir· supremos (ínfimos) e máximos (mínimos).
Talvez nâo seja muito realista exigir.· que se conheçam explicitamente as expressões matemáticas para as fun -ções f. e g
1. ( l6i6k). Em. um problema de alocação de recuFsos se
J.
ria mais natural.supor que estas entidades são conhecidas ape -nas implicitamente, isto
é,
cada divisão seria capaz de respon~ der apenas a pergu.n.iTas especificas concernentes a estas entida-des, quando formuladas de maneira a terem um sentido no contex-to da economia ( "Quais seriam seus planos de produção sob con-dições tais e tais?" ), sendo ainda necessário proceder-se a e~ timativas dos valores locais destas mesmas funções, de modo a ainda permitir a aplicabilidade de métodos tipo direções viáve-is.Admitimos conhecimento explícito apenas como hipótese simplificativa. De1~1fato, nossa abordagem do problema
de alocação de recursos proposto poderia ser modificada de modo a tratar do caso, mais geral, de conhecimento implícito, ou me~ mo ainda problemas de alocação de recursos formulados em termos
[L8]
e[19] •.
Finalmente, cumpre lembrar que há problemas que, embora não possam ser encarados como problemas de alocação de recursos, mesmo assim são estruturalmente idênticos a S, e e portanto passíveis de receberem.tratamento identico.
2:. Resolução do problema S
J'
identificamos na Introdução a estrutura do problema S como sendo do tipomultidivisional, sendo a fu!,! çãocri tério e as restrições do sistema, como um todo., linea:n: mente separáveis nas variáveis de decisão de cada divisão. Vii mos também que esta característica estrutural permitenos bus -car resolver S via decentralização, cujas vantagens já foraml apontadas em ( i . 3).É possível,pois,, resolver S a nível ãe sub sistemas (divisôes), coordenando adequadamente a otimização de cada um destes subsistemas. Passamos agora a apresentar e inter pretar as técnicas de coordenação aplicáveis à resolução do pro
. .
-blema S •
Coordenação via primal:
A grande dificuldade na resolução do proble-ma S, conforme formulado no item anterior, res:ilde no fato de que a companhia (sistema) opera sob um.a política de limitação dos diversos recursos produtivos que sâo oferecidos às divisões ( subsiste1n:as). De fato, caso inexisti_sse essa restrição, ou
seja, se a companhia dispusesse de quantidades ilimitadas de re -cursos produtivos, o problema S seria resolúvel imediatamente por uma série de k subproblemas absolutamente desvinculados, do tipo:
maximize X.E X. J.. J. f .. (x.) J._ 1 para l!:i~k.
Admitindo que a companhia opera sob um regi~ me de limitaçâo de recurses pr,odutivos, vamos examinar·a coord~ naçâo primal proposta para resolução de S, após o que exam.in~ remos a coordenação dual.
(a) o gerente destina a cada divisão uma certa quota de re cursos produtivos y±..e ~ (l~i~k);
(b) cada divisão, fazendo uso da qu·ota a ela destinada, ma ximiza seu lucro, isto
é,
resolve o subproblema:maximize f_i ( x 1 ) sujeito a: x 1. -e X. J. gi (xi) ~
YSi.
para l=i=k, informando ao gerent~ como alterar~se-ia êste valor ótimo assim computado, para um aument.o ou diminuição (no sentido marginal_) da quota y:ii (16i~k) de recursos produtivos a ela destinada;
(d) com1base nas informações supridas pelas divisões, o ge rente reavalia iterativamente o valor das quotas der~ cursos produtivos distribuídos às divisões, até que as alterações (no sentido marginal) no valor· das quotas não sejam mais efetivas no sentido de que não mais co_g tribuam para aumentar o lucro da companhia.
É preciso impor·uma restrição adicional que diz respeito exclusivamente ao gerente, isto
é,
exigir-se-á quesejam permanentemente respeitadas as limitações de recursos pr~ dutivos da companhia e que todos os subproblemas sejam,consis -tentes: (Yj_) e Y-
t
léiék manipulação de S projeção do mesmo ~ Vr_ ,vi. tEssa coordenação via primal corresponde a uma via projeção, isto
é,
parametrizamos S poF' no espaço Y das wariáveis y. (l~i6k) •.J. . .
O programa mestre assim obtido,. equivalente ao problema S
[15]
,;será escrito como:p maximize
>.
k .. v:-•. (y .. )'w_
1 .. J..sujeito a:
Y-jf Y
onde definimos (léi~k):
v .;, ( ;w~. )
~
máximof
f1 ( x-. ) .... ... x.ex.
·
:L.J. J._
A versão correspondente a P quando. o probl~ ma S é completamente. linear encontra-se em [ 49] •
O programa mestre P pode sen·r-esolvido po::rr aplicação do princípio de decomposição de Dantzig e Wolfe
(6],
ou como sugerido por Geoffrion em [15] •. Em particular:· oi ta.mos Campos[l],
que resolve P pelo método de direções viáveis.A coordenação via primal permite que os algo-ritmos implementados de resolução de P façam uso de uma solu-ção viável inicial conhecida para S • Soluçees viáveis para o
problema S são obtidas a cada iteração do algoritmo, o q_ue é vantajoso se desejarmos truncar, em um dado momento, o processo iterativo.
Coordenação via dual:
A inserção da teoria de dualidade emgprogr.§: mação não-linear teve seu iníc10 com o teorema clássico de min~ max de von Neumann
[45]
e foi pela primeira vez explicitamenteenunciada por Gale, Kuhn e Tuckér [13] • Somente em data malhá r_ê. cente a teoria de dualidade começou a ser empregada em programa ção não-linear, iniciando-se por programação quadráti.ca
[9].
A. idéia básic.a da coordenação via dual sur'-ge como uma bem sucedida extensão da teor~a de preços em uma e-conomia de mercado. Sugerfuu-se então que a decentralização pod_ê. ria ser levada a cabo criando-se uma economia em miniatura, com seu próprio sistema de preços,, dentro da companhia
[33] ,
[21J •. A descoberta de q_ue os multiplicadores de Lagrange podem.se:r.·i.E: terpretados como preços levou a considerar0 a possibilidade de~tilizaro novo valor informacional nêles descoberto como um ins trumento a serviço da decentralização. Citamos
[11] , [12] ,
[27].
Segu.indo esta linha de r~ciocínio, vamos e-xaminar o seguinte tipo de coordenação via dual proposto para resolução do problema S :
(a) o gerente estipula preços ~jj (l~j~) para os diver -sos recur-sos produtivos q_ue serão colocados à disposi
ção das k divisões, e formula a cada divisão a segui.E: te pergunta: "Qual a q_uota de recursos produtivos q_ue desejam adquirir, a tais e tais preços, de modo a ma-ximizar·o lucro líquido da divisão?"
(b) para responder a esta pergunta cada divisão resolve o seguinte problema (16i6k):
6 maximize
xie
xi f. (x. ) -À
•·g. (x .. ) J. J. - J. lL ondeÀ
~
(
1
1_,À.
2, • • • , Àm)
é
o vet"OD de preços anu_gciado pelo gerente. Cada divisão informa entâo ao ge -rente qual a quota de recursos produtivos que deseja adquirir aos preços vigentes;
(c) com base nas informações supridas pelas divisões, o ge
rente reavalia i teratiyamente o vetu·r, de preços até
que as demandas totais das divisões: k
C
1 gí(xi)
J.=
não ultr~passem as limitações de recursos produtivos cujas disponibilidades são representadas pelo vetor b. Os recursos produtivos porventura em excesso são off.er~ cidos gratuitamente (isto é, a preço zero) às divisõ -es.
Essa coordenação via dual corresponde a uma manipulação do problema S via dualização, obtendo-se o
seguin-te programa mestre [15] :
D minimize
onde definimos (l~i~k):
~
w. ( \ ) +A
•b. ·1 1 1= .
7 wi (À)
t
supremoxi..e x:L.
A equivalência entre S e D será estabele cida no capítulo III, fazendo-se uso dos resultados fornecidos pela teoria de dualidade. O programa mestre D assim definido é
Uma desvantagem acarretada pelo empr-êgo de coordenação via dual
é
que não nos podemos beneficiar. do event}! al conhecimento de um.a solução viável inicial de S ,, e que, ti picamente, a resolução de D só fornecerá um.a solução viável de S ao cabo do processo iterativo. Neste caso, a única solu~ ção viável de S que temos certeza seja obtida é a própria so-lução ótima procurada. Ou seja, nijo há garantias de que sejam preservadas as prop'J?,iedades de viabilidade no decorrer do pro -cesso itera:lii;_vo; Todavia, ao truncarmos o pr.gc~sso iterativo, ,, após um número razoável de iterações, é de se·supor que a solu-ção quase-Ótima assim obtida não apresente desvios marcantes no que tange à viabilidade, desta maneira sendo um resultado apro-veitável em termos p~áticos.~áii.t& na coordenação via primal, quanto na
coordenação via dual, o processo de coordenação pode ser encar~ do como um diálogo estruturado entre os dois níveis hierárquL -cos da nossa forma organizacional: o gerente (nível superior) e as divisões ( nível inferior.:), com tomadas de decisão e trocas de inforfilação de parte a parte. Ambos os tipos de coordenação, conforme formulados ( P, D ) permitem-nos ainda tirar-uma conclusão interessante: em qualquer caso o gerente prescinde tQ talmente do conhecimento das funções f1..··, g. e dos conjuntos viá
1
-veis X., isto
é,
o gerente não precisa saber do "modus operan-1 .. •·
di" de cada divisão: os subproblemas
P~;
e D~ são resolvidos ~otalm.ente a nível de divisão, bastando=lhe tãosomente conhe -ceras disponibilidades de recursos produtivos da companhia (v~ tor b) e ser informado dos valores locais (supridos pelas divi-sões) no decorrer do processo iterativo.Encerrando estes comentários, apontamos ainda outras políticas de decentralização aplicàveis à resolução do problema S , a saber,
[39] ,.
[21J , [46] •III ESTABILIDADE DO PROBLEMA S EQUrVAL15NCIA ENTRE S E D
!'1"?"
Â'LGORITMO MESTRE DE RESOLUÇÃO DE D
l. Introdução
Para estabelecer a equivalência entre o pro-blema S (l) e o propro-blema D
(,§J,
faremos uso dos resultados obtidos por Geoffrion [17} ,, baseando-se apenas em resultados de análise convexa.Em linhas gerais, apresentarem.os preliminar~ mente alguns conceitos básicos, em particular a definição deu-m.a certa funçao-pertlitl.tbação associada ao problema S ,, cujas i!!!: portantes propriedades serão examinadas. Gom. o auxílio desta funçãoperturbação definirem.os o que seja estabilidade do, pro -blem.a S •. O requ:L.sito de estabilidade figurará com.o hipótese básica do t:eorem.a de dualidade forte, o qual estabelecerá for -malmente a equivalência entre S e D.
Um.a vez estabelecida esta equirvalencia, mostrarem.os que o problema D pode ser manipulado por·· lineariza
-ção externa. Esta lineariza-ção externa, obtida pelo em.prego de hiperplanos-suporte,, permitir~nos-á aproximar a função-objetivo do problema D por um.a outra função-objetivo, sec.cionalm.ente linear, em termos da qual será formulado o algoritmo mestre de resolução do problema D.
Será útiLreapresentar os problemas S e D, conforme anteriormente definidos:
s
D k maximizee
fi_(x:ii.) i=l sujeito a: Xi_E Xi kC
g.(x.J é b ·-J. 1 ll l.- .. k minimizeL
wií.( À)+
Â
•b i=L sujeito a:onde a função wi
:A -,..
RU {
+co}é
calculada coJiro (l~i~k):[f· .. li. (x.) -1.
À
•g .. 1. (x. )] l.Admitindo válidas as hipótese apresentadas em (II.l), e fazendo uso de resultados a serem apresentados o .. --portunamente, podemos adiantar que garantiremos a finitude das funções wi em seus respectii:vos domínios de definição~ e que
poderemos assimilar'o supremo ao máximo. Da mesma forma, podere -mos definir o valor: ótimo do problema S como o valo:rz·· de sua
funçãoobjetivo calculado para uma solução ótima de S •. Ova -lor ótimo do problema D é definido de maneira idêntica.
2. Estabilidade do problema S
O conceito de estabilidade, apresentado pela primeira vez por Gale [12], sur.ge naturalmente quando se estuda
a variaçâo do valor ótimo do problema Sem funçâo de alteraçôes introduzidas em seu "segundo membro". As definiçõalteraçôes seguin -tes explicarão melhor o que temos em mente •-t~
Definição: o problema perturbado SF associado ao problema S
é:
8 SP maximizer='.
ti(xi_) i=l 9 10 Definição: sujeito a: x.e X. 1. J.._ kC
~(x._) - b é p . l . li. J.=·onde o vetor peifl! é chamado de ~tor.· perturbação. o conjunto de perturbações viáveis é o conjunto de valo~es assumidos pelo vetor perturbação tais que o problema perturbado SP é consistente, ist:o
é:
7T
t
f
pe:a1111
J ( ::)x.eX. )(l~i&k)(i=:
g ..
(x.J - bt
p}
l
J. 1 i=l J... i..O conjunto
1í
é necessàriamente nâo-vaz~o, pois Oelf, uma vez admitida a consistência do problema S , hi pótese esta apresentada em (II.l).Definição: a função-perturbação v:
lf __...
R associada ao problema perturbado SP é calculada como:k.
v(p) ~ supremo
Í=i
f1 (x1)X.E X. J. J. ' k
r::
gi (xi) - b ~ p i=lpe7T
Observai:p.os que a função-perturbação acima e~ tá bem definida,, uma vez que, para qual.quer perturbação viável. p o valor correspondente v(p) é finito, devido às hipóteses feitas em (IL.l) de compacidade dos conjuntos Xi .(l~i~k) e con-tinuidade das funções fi (16i~k).
A função-perturbação associa a cada perturb~ ção viável no "lado direi to" do problema S umJ-valoJ:r• ótimo o:or respondente ao problema perturbado SP • Para p=O, v,( O) é o va-lor· ótimo do problema S •
A função-perturbação assim definida é
conve-~'- e não decrescente [17J, sendo uma construção de fundamental
importância na demonstração da equivalência entre S e D.
11
Definição: o problema S é dito estável se v(O) é finito e se:
lar norma usada. :para o problema plo a condição de lim.i
e-.+o
v(O) - v(8y)<
00ellYII
('Vy:/:o)A. definição acima [1 7] · independe da particu-Todas as condições de qualificação de vínculos S implicam em estabilidade do mesmo, por· exe!!
qualificação de Slater
(32) •
O limite assim definido é o negativo da deri vada direcional de v na direção da perturbação y. Uma vez sati~ feita a condição de estabilidade, isso significa que o valor
ó-timo do problema S é finito e que nenhuma perturbação no "la-do direitoº "la-do mesmo fará com que seu valor ótimo varie com
in-clinação infinita.
3.
Equivalência entre S e DPoderemos agora estabelecer a equivalência formal entre os problemas S e D, enunciando o teorema da du alidade forte, cuja demonstração consta do apêndice A. Este teo rema foi demonstrado por Geoffrion
[17J
fazendo uso da defini -ção e propriedades da fun-ção-perturba-ção v associada ao proble-ma S , conforme definida no item anterior.12 Teorema: (dualidade forte)
se o problema S (l_) é estável (11), então: (a) o problema D possullum.a solução ótima; (b) os valon~s ótimos dos problemas S e D
são iguais;
(e)~ é uma solução ótima do problema D se e somente se -
"/1:
é subgradiente de v emL y=O;~
"*
(d) qualquer solução otima A do problema D ca
racteriza o conjunto de todas as soluções
ó-timas (caso existam) do problema P como SQ
luções dor, subproblemfü,',-t
. \*
Nota: - A. é subgradiente de v ea y=O se v( O) é finito e se:
v( y)
~
v( O) -~
•ymaximize
~
[:r.
(x .. ) -'t,.,g,;
{x.,)] ··-1 J. J. 1 J;__ J..:-sujei to a: que satisfazem:x.ex.
J. 1.t:
gi (xi) § b i=l.t •·(
r=
gi (xi) - b ) = O i=lAs conclusões (a), (b) e (d) do teorema da dualidade forte validam pois a ~.esolução do problema S por c o, ordenação via dual. Em especial, a conclusão (b) elimina a
pos-sibilidade da existência de uma "brecha de dualidade" entre os valores ótimos dos problemas S e D.
t
interessante ainda no tar que é possível, pela conclusão (d), determinar o conjunto de todas as soluções ótimas (caso existam) do problema S a partir do conhecimento de qualquer uma das soluções ótimas do problema D. A conclusão (c) revela a conexão existente entre o conjunto de soluções Ótimas do problema D e a função-pertu~· bação v(10)
associada ao problema S. Ainda essa mesma concl~ são permite interpretar o conjunto de soluções ótimas do probl~ ma D como o conjunto de multiplicadores Ótimos de Kuhn e Tuo-ker· para o problema S.4. Linearização externa do problema D
O problema D (6) não é de resolução ime -diata, já que sua função-09jetivo não é explicitamente conheci-da como função de seu argumento
À.
Isso porque as :funções w~(7)
também não são explícitamente conhecidas como função de seu argumentoÀ.,
podendo apenas ser calculadas ponto a ponto.Veremos em seguida que cada uma das funções wi {l~i~k), que se pode facilmente demonstrar serem convexas, pode ser reformulada como,a envoltória de todos os seus suportes lineares, de onde surge a idéia de aproximá-las por linearização externa, fazendo uso de um número finito de seus suportes linea-res.
O efeito global dessa manipulação será~ pois introduzir uma função seccionalm.ente linear, explicitamente co nhecida, definida em1A e com valores em R, que aproxima a fun -ção-objetivo do problema D. Essa aproximação assim introduzida é satisfatória sob o ponto de vista computacional e, sob condL -ções a serem estabelecidas no capítulo IV, não compromete as p~ priedades de convergência do algoritmo implementado de resolução do problema S que nos propomos construir.
O teorema que se segue mostra que hiperpla nossuporte a cada uma das funções wi (l~i~k) aparecem natural -mente como1subprodutos da resolução dos correspondentes subpro
-blemas
Di (
7) •13 Teorema: seja
\e./\..
Entãont
admite pelo menos uma solução x1e Xi com wi{Â..) finito, para J.:i~k. Nestas condições -gi(x1 ) é subgradiente dewi em À.A demonstração deste teorema baseia-se nos~ guinte resultado, provado em
[32] :
14 Lema: um.a função
e
semicontínua superiormente, definida em um conjunto compactor
e: Rn, é limitada superiormentee atinge em
I'
o valor": = supremo 8{x)xer
apresentadas em (II.1), com a aplicação do lema anterior. Por.ta!! to,
n!
(l~i~k) admite solução ótima para qualquer'5'.eB.1ll,
emÂ, - _/1.
particular para todo ÂEl\• A conclusão final é obtida com as se -guintes desigualdades: = supremo
[:f.
(x. ) - À •g. (x. )]~
X l. l. l.. 1 x.e J.. 1· . . · ~:f
._(xi) ;..'Ã.
•g ..(x. )
= lL 1-_ J. -=t.·.
(x1 ) À •·g.,(x.) l.c_ . 1. J.. g. J. (x .. ) J._ •·(Â-Â.) = = w. ( \ ) - g .. (x. )•(À-\) l. lL 1pela própria definição de wi. Logo:
w.(A)
~
w.(\) - g ..(x.)•(À ..
À)
1 J.. l . . l . ..
(\J
Â,eÍ\)A demonstração êstá completa.
· 15 Teorema: a função wi (l~i6k) coincide em
Í\.
com a envoltória de todos os seus suportes lineares ealculados emA •
Demonstração: aplicando-se os resultados obtidos do teorema ant~ rior, poderemos escrever·:para todo
Â
,Â
EA,
ondex
1e
Xi é uma solução ótima den\ (
7~Tomando-se o supremo desta desigualdade sôbre todo
lel\.,
t.ere -mos:w.(À.)
~
supremo_[w.(\) -
g.(x.)•(À-À)]
J.. J. i J.
ieA
ve ocorrer, e o suprem.o deverá ser atingido. Logo:
w
1. (·.
À )
=
máximo- A
•.[w .. (
A. ) -
g.(x. )
•,(\-\)j
i. i i.
?te
para todo
À.e-/\,
desta maneira completando a prova do teorema. Como resultado de tud:o o que f'oi exposto nês te item, poderemos então aproximar cada f'unção w. (l~i~k) por.· um.a f'unção seccionalmente linearw:,
definida em1Í\
e
com valo -res em R, e calculada como:16 w:L..( \.) ~ ~ máximo
[
wi(-·
\J)j=O,l, ••• ,~
Os vetores ~j, j=O,l, ••• ,
~
, constituem um.a base para a linea-rização externa da função w1 . • Cada veto:irxJex1 .. é um.a soluçãoó-. l. .
tima dos correspondentes subproblemas
ntj ,
para j=O,l, ••• ,~ •l!1 interessante notar desde já que toda liber dade é concedida na escolha desta base, tanto quanto ao número total~ de vetores participantes, quanto aos particulares walo~ res escolhidos. Sob o ponto de vista computacional, é vantaj_oso que a base seja constituída por um número mínimo de elementos
-o que minimizará -o tamanh-o d-o pr-oblema a ser -otimizad-o - , e que êstes elementos tendam. a concentrar-se na região de
A
onde inte-ressa-nos seja mais fina a aproximação, ou seja, nas vizinhanças do ponto de ótimo procurado.A linearização externa assim introduzida é a construção básica para a síntese do algoritmo implementado de resolução do problema S por coordenação via dual. A.prenderemos no capítulo seguinte como proceder a alteraçôes de base no deco_!: rer do processo iterativo, à medida que nos aproximamos de uma soluçâo ótima para o problema D.
5.
A~goritmo mestre para resoluqâo de DPassamos agora a apresentar o algoritmo mes-tre para resoluçao do problema D, obtido por lineari:zaçâo ex -terna de sua funçâo-objetivo e posterior aplicaçâo da estratégia de relaxaça.o, conforme visto no item anterior.
A estrategia de relaxaçâo é particularmente eficaz quando aplicada a problemas de otimização que envolvem um número muito grande de restrições. A idéia básica consiste em r~ solver uma versao dita relaxada do problema originalmente propos to, isto
é,
levando-se em conta um subconjunto das restrições, desta maneira diminuindo-se a complexidade do problema a serre-solvido. Se a solução ótima obtida para esta versão relaxada sa-tisfaz as restrições não levadas em conta, temos em mãos uma so-luçao ótima do problema originalmente proposto. Caso contrário, constrói-se uma nova versão relaxada, passando-se a considerar restrições que se verifiquem. tenham sido violadas.Uin. refinamento importante consiste em abando nar restrições plenamente satisfeitas, o que será explorado no capítulo segu.inte. Vemos, pois, que a estrategia de relaxação substitui um dado problema de otimização com restrições por uma sequência de problemas menores, alterando-se iterativamente o subconjunto de restrições em pauta, até que se obtenha uma solu,-çâo ótima que satisfaça a todas as restriçôes, ou seja, uma solu çâo ótima para o problema originalmente proposto. Um dos exem plos mais marcantes de aplicaçâo da estrategia de relaxaçâo é o método sillijplex para programaçâo linear,.
O algoritmo mestre apresentado em seguidas~ rá posteriormente modificado, quando entao pstabeleceremos a oo,a vergência da versão implementável a ser obtida no próximo capítu
lo-17 Algoritmo mestr9:-passo l
passo 2
passo
,6
passo 4
Escolha \ºe.A. Resolva os subproblemas Di~:
w. ( 1
'\º)
= máximo [f. (x.) -X
•g. (x. )] x .. ex.
1 1 1 1J;_ J.L
para léi6k, usando um algoritmo de otimiza -ção adequado (por exemplo, método de
ritireçõ-. , . ) S . (-0 -O -O) l es v1ave1s • eJa x1_, x2, ••• , xk uma ao 3!
çâo ótima assim obtida, e (-g1_(xf ),, -g2(x~), ••• , gk(x~)) o correspondente conjunto de subgradientes. Faça ~=O.
Resolva a aproximação linear corrente ao prQ blema D, isto
é{
minimize
1:11
wi,(
Â.)
+Â.
•b onde definimos (l~i~k):w
1
(
Â. )
= máximo [ w i ( \ j ) - gi (xf ) • (
À,-\ã ') ]
t=O,l, ... ,~
usando um algoritmo de otimização adequado. S · eaa ~ A
v+
1 uma so uçao o ima assim e erm.1na l · - 't . . d t . d a.t . l ., 't· (_-:>+I -~+I
De ermine uma so uçao o ima Xi, x2 , ••• , x~+I) para os subproblemas D~~+I (16i~k). S~
( ( -~-H) (-~"°') 1\. ( ~HI))
ja -gl xl , -g2 x2 ' ••• , -gk ~k oco~ respondente conjunto de subgradientes.
Se
\v+\é
uma boa aproximação da soluçâo ex§ta do problema D, pare. Caso contrário, fa ça !:) =
v
+
1 e vá para 2 •O algoritmo mestre (1~) assim proposto gera iterativamente uma sequência de hiperplanos-suporte a cada uma das funçoes wi (l~i~k). Assim sendo, a cada iteraçâo a aproxima-çao corrente ao minim.ando do problema D é sucessivamente refi-nada pela adiçâo de novos hiperplanos-suporte.
Desta maneira, o tamanho do problema a ser resolvido no passo 2 ão algoritmo mestre proposto crescerá dei-teraçâo a idei-teraçâo, segundo uma progressáo aritmética. Sob o po:g to de vista computacional o algoritmo mestre (17) é, pois, .Q.QB
-ceitual. No capítulo
IV
veremos como contornar esta dificuldade, pelo abandono, sob condições controladas, de hiperplanos-suporte mais antigos.No passo 4 do algoritmo mestre foi. sugerida, de maneira vaga, uma certa regra de parada. Uma possível regra de parada derivaria da observação
[15]
de que.a sequência deva-lores Ótimos correspondentes à resolução do passo 2 do algoritmo mestre é uma sequência monotôriica crescente de limites inferi:..o -res ao valor ótimo do problema D. Analogamente, a e.ada solução't · 'i\ ~+I . t d 2· d ,· 1 't.
o ima A assim compu a a no passo . correspon era ou v.a or o 1
-mo calculado quando da r~esolução dos prohlemas
ntv--1-1
(l~i~k) no passo2
do algoritmo mestre, v:alores Ótimos .êstes ·que se consti-tuem em limites superiores ao valor· ótimo do problema D•-Desta maneira, a regra de parada sugerida por esta observação seria: pare se:
~+I
LS LI ~+\ L - ~ e
onde E é um escalar não negativo árbitràriamente escolhido e:
LI..:i+l A= ~ ~ "i\~+I 'i\.~+I
L...J w ( A ) + /\. •0b i=l ii_
Todavia, implementaremos uma regra de parada mais simples, isto
é,
pare se:onde
e
1 e ~ 2 são escalares não negativos arbitràriam.ente escolhidos.
Como comentário final, enfatizam.os, mais um.a vez, que o principal obstácule à implementação do algoritmo
mes-tre
(17) é,
como já foi apontado, o crescimento do tamanho do programa de iteração para iteração. No capítuloIV
estudaremos condições sob as· quais é possível aplicar a estratégia de relax~ ção com abandono de vínculos ao algor.itmo mestre. Esta técnica, em linhas gerais, constitui~se no abandono de hiperplanos-supor-te mais "antigos", desta maneira fazendo com que o tamanho do programa esteja sempre dentro de limites computacionalmente ad -missíveis. Naturalmente, as condições que nos interessa determi-nar deverão ser compatíveis com a convergência do algoritmo mes-tre.mas
Aspectos relativos à resolução dos subproble serão abordados no capítulo V •.
IV
IMPLEMENTAÇÃODO
ALGORITMOMESTRE
l. Separador e mapeamentos cortantes
Vimos no capitulo II como a dualização perm.i tiu-nos reescrever o problema S sob uma forma equivalente, ma-is adequada para resolução, obtendo-se entã0·0 problema D. No capí.tulo
IIr
aproximamos a funçãoobjetivo do problema D , oo -nhecida ,apenas implioi tamente em função de seu argumento Â., por meio de hiperplanos-suporte, obtendo uma nova função-objetivo e~ plicitamente conhecida.Esta nova função-objetivo foi então incorpo-rada ao passo 2 do algoritmo mestre apresentado em
(III.5),
cuja implementação é obstaculada,., como já vimos, pelos sucessivos au-mentos em tamanho do programa a ser resolvido nêste mesmo passo.Este capítulo dedica-se a estudar condições sob as quais é possível abandonar-se hiperplanos-suporte gerados em iterações mais antigas do algoritmo mestre, desta forma impedindose que o tamanho do programa a ser resolvido atinja lim~ -tes computacionalmente inaceitáveis. Em outras palavras, desej13,-mos aplicar ao algoritmo mestre a estratégia de relaxação com
abandono de vínculos
[10],
ao.mesmo tempo garantindo oonvergên -eia da versão implementada assim obtida._generaliza-d~ de convergência para algoritmos tipo plano cortante aplicada a problemas de programação matemática, conforme Eaves e Zang"Will
~o].
Esta teoria baseia-se em dois conceitos centrais: a função separador e o mapeamento cortante. A partir dêstes dois concei -tos constroí-se o algoritmo mestre plano cortante[10] ,
que ser-ve de denominador comum aos demais algoritmos tipo plano c~ortante. Suas propriedades permitirão seja estabelecida a convergên -eia da versão implementada do algoritmo mestre desenvolvido em(IÍI.5).
Métodos de programação não-linear que fazem uso de planos cortantes foram pela primeira vez introduzidos po:rr Xelley
[26]
e Cheney e Goldstein[5].
Nesta mesma linh~ citam~se as contribuições de Veinott[44] -
método do hiperplano suporte, de Dantzig e Vfolf,e[6] -
método, plano cortante dual., e de Zang -will0-7].
Contudo, todos êste métodos são estritamente cum.ulati vos, istoé,
não permitem que cortantes previam.ente gerados se-jam. abandonados ao longo do processo iterativo, embora Xelley [26] houvesse sugerido, heuristicamente, que "tal procedimento eventualmente forneceria uma solução
e.
-efeti va11•
Posteriormente Topkis
~1]
apresentou garan-tias de convergência para algoritmos tipo plano cotante com aban dono de vínculos para :funções uniformemente côncavas, definidas em um. conjunto viável convexo. Esta hipótese nãoé
verificada noNota: uma função f definida em um conjµnto convexo T e com~ valores em1R é uniformemente côncava se existe um.a
fun-ção Ó não decrescente, estritamente positiva emc ( O, CD )
tal que, para todo x, y pertencentes a T tenham.os:
18
nosso caso, já que, como veremos, transformaremos o algoritmo mestre em um programa completamente linear. Após a publicação do
trabalho de Eaves e Zangwill
[10] ,
Topkis~2]
reformulou alguns de seus resultados anteriormente apresentados em ~l], relaxando algumas hipóteses anteriores.Parece caber a Zangwill
[48]
a iniciativa de fazer uso de mapementos ponto-conjunto no campo de programação matemática, reconhecendo que diversos métodos de programação podem ser interpretados nestes termos. As propriedades apresenta -das por tais mapeamentos, sistematicamente estuda-das, permitiram, uma derivação mais imediata de resultados sôbre convergência.Finalmente, Eave~ e Zangwill
[1-0]
expandiram êstes conceitos, desenvolvendo um.a teoria geral de convergência para algoritmos tipo plano cortante aplicada a problemas de pro-gramação matemática, resultados êstes discutidos e apliaados a seguir.Reescreveremos inicialmente o problema D apresentado em
(II.2)
sob um.a forma equivalente. Considerando(~1
,Â)
como pontos do epigrafo das funçõesw
1(7)
(l~i~k), isto• e,
<S.
~w.(~) J. J. ,i' • = maximo x.ex. J. J. [ :f. ( J. X . ) -J.À •
g. J. (X. ) ] J. podemos imediatamente reescrever D como:D k minimi,ze
C
U'
+ \ • b O' t; Rk i=li.. i"-eA
sujei to a: (f'. ~f.(x.) - 'À,•g.(x.) J. J. J. . J. J. (Vx.ex.) (l~i~k) 1. J.2,0
tste problema com um número infinito de vín-culos lineares pode ser escrito sob forma mais corrente definin-do: '\ ) E Rk+mc • • .,Am r :Rk-HD.__..R calculad~ como-:, k n( z) =
e
<r.
+A
•b G ~ ~:-'1:· J. .Li...= .{ zeRk+m
I
Â.e/\., (f i +~
•gi (xi)(V
x.ex.) (l~i~k)}1 l.
~f.(x.), J.L
l,
com o que obtemos a forma equivalente procurada:
.,
D minimize r(z)
,z
e>GDa mesma forma, o problema correspondente ao passo 2 do algoritmo mestre, definido em (III.5,:) será reescrito como: D:':) onde definimos: minimize r(t.) ~ ZE Z z':J .6 f Rk-tm t 1\
f\
rr "' (-jj)~
f (-j) =1
ZE I AÉ ' '-1 i + A. • gi xi - i xi ' ( j ~O , 1, ••• , ~ ) ( 1 i!;i ~k ) }O conjunto·Z~ corresponde a uma aproximação do conjunto viável G por linearizaçáo externa com a base
l~f},
{ 19) relaxado, considerando-se apenas ~ entre a infinidade de vínculos lineares.
O conjunto viável. G, por sua vez, pode ser considerado como o "limite" de Z
~
para~
-ao , isto é, G repr2, senta a regiáo viável do problema D. E imediato que Z~ e G sao conjuntos fechados, e que Z~ ~ Gf~ , uma vez adm.i tida a hipótese sôbre consistência do problema S •Os algoritmos tipo plano cortante são algo -ritmos de relaxação que ap:pn]!;imam. o conjunto viável.. de UIIll dado
problema pela intersecção de uma coleção de conjuntos, constrin-do i1;erativamente uma sequência de pontos de tal forma que toconstrin-do ponto de acumulaçâo pertence ao conjunto viável e é solução do :.::-Jlr
pr·oblema originalmente -propesto. Podlemos identificar cil.aramente
G como sendo o nosso conjunto viável, e Z ~ como uma de suas PO.,€!/' síveis aproximações lineares externas, dado pela intersecção de uma coleção de k•v semiespaços definidos por hiperplanos-supor' te.
Observam.os que a função r assim definida é
linear, ou seja, D::, é um programa completam.ente linear. Afirm~ mos que a estratégia de ~esoluçâo do problema D via algoritmo
tipo plano cortante consistirá em resolver iterativamente os prQ blemas linearizados :1.:J)~ , gerando um conjunto de k novos
víncu-los a cada iteração do algoritmo, tendendo a refinar:,;a aproxima-ção ao conjunto viável G nas vizinhanças do ponto de Ótimo procu rado.
Podemos imaginar k mapeamentos cortantes que associam a cada ponto essa etc oleçâo de novos vínculos. Um.a das c:a racterísticas do mapeamento plano cortante
é
que os vínculos as-sim gerados - no nosso caso semiespaços suporte de G - excluem.i estritamente {ver V.44-), por construção, o ponto que lhes deu ori gem. Observam.os ainda que um.a solução ótima de D~ não determi: na de maneira unívoca o conjunto de novos vínculos ora gerados e que deverão ser incorporados, na iteração seguinte do algoritmo,ao novo problema D ~+i • Na realidade,
é
possível gerar-se um.a coleção de conjuntos de novos vínculos.Função separador
A sequencia de pontos zj (j=O,l, ••• ) gerada pelo algoritmo tipo piano cortante estará contigerada em um con
-junto fechado X, to.é, se z\/.G, DJ , então zj pelo menos certa
e satisfará um.a propriedade muito especial, is-ou:iseja, se zj não é solução ótima do problema
, l 2 j-1
estara separado dos pontos z. ·, z , ••• , z de distãncia, definida por um.a função separador. ~êfiniçao: dados os conjuntos fechados ft}~Gc:X em.um espaço
métri-co, a função
ó
:X N G~R é um.a função separador se:(a) é não negativa;
(b) se z~-z00 e
ó(z~)-o,
então z 00êG.Um exemplo de funçâo separador é a distância d(z,G) entre um ponto zeX e o conjunto viável G. Decorre da defi ni çao acima que ~ é positiva em X N G; que qualquer função p
+
definida em XN G e com valores em R, e semicontínua inferior.men-te, é um.a função separador; que o mínimo de um.a coleção finita de separadores é um separador; e que se ~ é um separador e
ó·'>
&
entao Ó' é também um separador ( ~erf
10] ), •Mapeamento plano cortante
A introduçao do mapeamento cortante envolve o espaço de· subconjuntos
#
dado por:;{j,
~
{
Z fGc:
Z e: X , Z fechado1
Supondo-se X um espaço métrico compacto, e que Gc:X é um subespaço compacto, poderemos estender a /;, um.a to-pologia com a métrica de Hausdorff 20 • Nestas condiçôes
J'Í,
s~rá compacto, em têrmos de topologia de conjuntos.
Com o auxílio da funçâo separador e do espaço podemos caracterizar agora o mapeamento cortante.
Definiçao: um mapeamento ponto-conjunto
cp
:X N G-+~ é um mapea-mento cortante se existe um.a funçâo separador Ó defi_ nida em XN G e com valores em R+tal que, para todo zeXNG e todo ZeC()(z), temos:
Z
fl
B{ z,ô (
z))=
~onde B(z,
ô
(iz)) é uma bola aberta centrada em z e com raioô
(z).Nessas condições, cada conjunto ZE cp(z) será chamado de cortante. Note-se que o conjunto viável G
é
na reali-dade a intersecção de todos os cortantes, istoé:
G =
nu ce
cx"'G'
Observe-se que~ associa a cada ponto de XNG uma coleção de conjuntos de;//, (mapeamento ponto-conjunto), ou seja, para cada ponto não pertencente ao conjunto viável G, o ma peamento cortante gera uma coleção (possivelmente infinita) de novos vínculos. Tipicamente, mapeamentos ~ortantes geram conjun-tos de hiperplanos-s~porte do conjunto viável.
2. Algoritmo mestre plano cortante
Passamos agora a apresentar, o algoritmo mes·ê:~ tre plano cortante [10] , de'senvolvido por Eaves e Zangwill com base nos conceitos ora apresentados •. Tal algoritmo constitui-se