• Nenhum resultado encontrado

Tópicos em programação dinâmica

N/A
N/A
Protected

Academic year: 2021

Share "Tópicos em programação dinâmica"

Copied!
97
0
0

Texto

(1)

V

>

FUNDAÇÃO

GETÚLIO

VARGAS

^1— **+<■?*

TÓPICOS EM PROGRAMAÇÃO DlNÂMICA

DISSERTAÇÃO SUBMETIDA Ã CONGREGAÇÃO DA ESCOLA DE PÓS-GRADUAÇÃO EM ECONOMIA CEPGED

DO INSTITUTO BRASILEIRO DE ECONOMIA

PARA OBTENÇÃO DO GRAU DE

MESTRE EM ECONOMIA

POR

MARCOS DE OLIVEIRA LEMOS

RIO DE JANEIRO. RJ ABRIL, 1991

(2)
(3)

rUNDAÇAO GETOLIO VARGAS

TESE D£ MESTRADO

APRESENTADA À EPGE

(4)

ESCOLA OE PÓS-QRAOUAÇÃO EM ECONOMIA

DA FUNDAÇÃO GETULIO VARGAS

PRAIA DE BOTAFOGO, 190/10.° ANDAR RIO DE JANEIRO - BRASIL - CEP 22.250

CIRCULAR N 9 3 1

Assunto: Defesa Pública de Dis sertação de Mestrado" em Economia

Comunicamos formalmente à Congregação da Escola que está

marcada para o dia 20 de maio de 1991 (2§ feira),às 10:30 horas,

no Auditório Eugênio Gudin (105 andar), a apresentação e

defesa

pública da Dissertação de Mestrado em Economia, intitulada "TÓpi

cos em Programação Dinâmica", por MARCOS DE OLIVEIRA LEMOS.

A Banca Examinadora "ad hoc" designada pela Escola será composta pelos doutores: SÉRGIO RIBEIRO DA COSTA WERLANG,ALOÍSIO PESSOA DE ARAÚJO e CARLOS IVAN SIMONSEN LEAL (Presidente).

Com esta convocação oficial, além da Congregação de Pro

fessores da Escola, estão ainda convidados

a

participar

deste

ato acadêmico os alunos da EPGE, interessados da FGV e de outras

instituições.

Rio de Janeiro, 06 de maio de 1991

rio Henrimre Simonsen

(5)

ESCOLA DE PÓS-GRADUAÇÃO EM ECONOMIA

DA FUNDAÇÃO GETULIO VARGAS

PRAIA DE BOTAFOGO. 190/10.° ANDAR RIO DE JANEIRO - BRASIL - CEP 22.250

LAUDO SOBRE DISSERTAÇÃO DE MESTRADO

Como integrante da Banca Examinadora, designado pela EPGE

para julgar a Dissertação de Mestrado, intitulada "TÕPICOS EM PROGRA

MAÇÃO DINÂMICA", do candidato ao titulo, Sr.

Marcos

de

Oliveira

Lemos, apresento as seguintes ponderações que justificam meu parecer

e voto:

1)

Apresenta em língua portuguesa uma excelente resenha

de

dois métodos alternativos de maximização intertemporal: as

equações

de Euler-Lagrange e o método de programação dinâmica;.

2)

Apresenta resultados recentes e importantes sobre a

dife-renciabilidade duas vezes da função Valor (de Aloisio Araújo) e,

O aluno demonstra que compreendeu bem as vantagens e des vantagens de cada método.

Assim e nessas condições, sou de parecer que a referida

Dissertação seja aprovada e outorgado o título nretendido pelo candi

dato e autor deste trabalho.

Rio de Janeiro, 20 de maio de 1991.

r

■'Se

gio Ribeiro da Costa Werlang0;

(6)

^FUNDAÇÃO

GETVUO VARGAS

ESCOLA DE PÓS-GRADUAÇÃO EM ECONOMIA CAIXA POSTAL 9O52-ZC-OS

RIO DS JANIIRO - RJ - BRASIL

LAUDO SOBRE TESE DE MESTRADO

Como integrante da Banca Examinadora/ designado pela EPGE

para julgar a Tese de Mestrado, intitulada "TÓPICOS EM PROGRAMA

ÇÃO DINÂMICA", do candidato ao título, Sr. MARCOS DE OLIVEIRA LE

MOS, apresento as seguintes ponderações que justificam meu pare

-cer e voto:

1.

0 aluno demonstrou a maturidade matemática necessária do apren

dizado das técnicas de

otimização dinâmica;

2. Entendimento das aplicações a Economia, do material básico de

Tese;

3.

Capacidade de síntese e redação de assuntos avançados em Econo

mia.

Assim e nessas condições,sou de parecer que a referida Tese

seja aprovada e outorgado o título pretendido pelo candidato e au

tor deste trabalho.

Rio de Janeiro, 20 de maio de 1991

Aloísio Pessoa de Araújo,

(7)

ESCOLA OE PÓS-GRADUAÇÃO EM ECONOMIA

DA FUNDAÇÃO GETULIO VARGAS

PRAIA DE BOTAFOGO, 190/10.» ANDAR RIO DE JANEIRO - BRASIL - CEP 22.250

LAUDO SOBRE DISSERTAÇÃO DE MESTRADO

Como presidente da Banca Examinadora, designado pela EPGE para julgar a Dissertação de Mestrado intitulada "TÓPI

COS EM PROGRAMAÇÃO DINÂMICA" do candidato Sr. MARCOS DE OLIVEIRA

LEMOS, apresento as seguintes ponderações, que justificam meu pa

recer e voto:

1). A dissertação em questão é um excelente resumo de alguns tópi

cos cuja literatura em português ainda é muito escassa.

21 Ela apresenta resultados novos obtidos por A. Araújo, extrema

mente relevantes.

3} O Sr. Marcos de Oliveira Lemos, no desenvolver desta disserta çao, alcançou denotado nível ds conhecimento.

Assim e nessas condições, sou de parecer que a re

ferida Dissertação seja aprovada e outorgado o título pretendido

pelo candidato e autor deste trabalho.

Rio de Janeiro, 20 de maio de 19

CARLOS IVAN SIMONSEN LEAL ,

Professor da EPGE &

(8)
(9)

AGRADECIMENTOS

Essa dissertação foi elaborada sob a orientação de Carlos Ivan Simonsen Leal, que foi fundamental para que eu pudesse superar as dificuldades surgidas ao longo do caminho. Sou grato a Carlos Ivan pela sua dedicação, pelo incentivo para pesquisar sobre o tema e pela confiança depositada em mim.

Agradeço também a Sérgio Ribeiro da Costa Werlang e a Aloisio Pessoa de Araújo pei a leitura da versão final do texto e pelas críticas e sugestSes recebidas.

Finalmente sou grato a Maria Alice da Justa Lemos por seu amor e

(10)

INTRODUÇÃO

Muitos problemas de Dinâmica em Economia se encaixam dentro de uma

estrutura

de

modelos

de

decisão

seqüencial,

sendo

resolvidos

recursivãmente. A Programação Dinâmica é uma técnica de otimização condicionada que se encarrega de solucionar problemas desse tipo. Esse trabalho tem como objetivo apresentar uma resenha dos principais resultados teóricos em Programação Dinâmica.

Os métodos da Programação Dinâmica são válidos tanto para problemas deter mini sticos como para os que incorporam a variável

incerteza. A esperada objetividade de uma dissertação de Mestrado,

no entanto, nos impediu de extender a análise, deixando assim de considerar explicitamente neste trabalho modelos estocásticos, o que teria enriquecido bastante a parte destinada à aplicaçSes à Teor ia Econômica.

No capítulo I desenvolvemos o instrumental matemático, introduzindo uma série de conceitos e resultados sobre os quais se constrói a análise nos capítulos subsequentes. Ilustramos tais conceitos com exemplos que seguem um certo encadeamento. Nas seçSes 1.1 e 1.2 apresentamos as idéias e propriedades de espaços

métricos

e

espaços

vetoriais.

Na

seção

1.3,

prosseguimos

com

tópicos em análise funcional, introduzindo a noção de norma de um

vetor e de espaços de Banach. A seção 1.4 entra com a idéia de contração, o Teor ema do Ponto Fixo de Banach e o teor ema de Blackwell. O Teorema de Hahn-Banach, tanto na sua forma de extensão quanto na sua forma geométrica, é a preocupação na seção 1.5. Em particular, a forma geométrica desse teorema e seus corolários são importantes para a análise conduzida no terceiro capítulo. Por fim, na seção 1 . 6, apresentamos o Teorema do Máximo. Ao final deste capítulo, como também dos demais, procuramos sempre citar as fontes consultadas bem como extensSes ou tratamentos alternativos ao contido no texto.

(11)

No capítulo II apresentamos os resultados e métodos da Programação

Dinâmica em si . A seção 2.1 cuida da base da teoria, com o

Princípio da Otimal idade de Eellman e a derivação de um algoritmo

de Programação Dinâmica.

Na seção 2.2 mostramos que esse algoritmo

converge para a função valor ótima de um problema de horizonte infinito, sendo que esta última satisfaz a chamada Equação de Bellman. A seção seguinte se preocupa em fornecer caracterizaçBes para a função valor mencionada acima, mostrando-se propriedades acerca de sua monotonicidade e concavidade. A seção 2.4 trata da questão da diferenciabi 1 idade da função valor, que permite se obter alguns resultados de estática Cou dinâmica} comparativa a partir da Equação de Bellman. Finalmente, na seção 2.5 apresentamos uma primeira aplicação à Teoria Econômica, através de um modelo de crescimento econômico ótimo.

No capítulo III introduzimos uma outra técnica de otimização - a Programação Convexa- e mostramos a dificuldade em se tentar estabelecer alguma relação de dorninancia entre a Programação Dinâmica e a Programação Convexa.

Na seção 3.2 "apresentamos os Teoremas de Separação, dos quais nos utilizamos na seção seguinte para demonstrar a existência de Multiplicadores de Lagrange no problema geral da Programação Convexa.

No final desta seção dizemos porque nao podemos inferir que em espaços de dimensão infinita a Programação Convexa nao pode ser aplicada, ao contrário da Programação Dinâmica, o que evidenciaria uma dominaancia dessa última técnica nesses espaços.

Finalmente, o capítulo IV é destinado a uma aplicação imediata das técnicas desenvolvidas principalmente no segundo capítulo. Com o auxílio dessas técnicas resolve-se um problema de maximização intertemporal, e faz-se uma comparação dos resultados obtidos através de uma solução cooperativa e de uma solução não-cooper ati va.

(12)

í NDICE

PÁGI NA

CAPÍTULO I: RESULTADOS MATEMÁTICOS PRELIMINARES

01

1.1- ESPAÇOS MÉTRICOS, SEQÜÊNCIAS CONVERGENTES

E DE

CAUCHY 01

1 . 2- ESPAÇOS VETORI AI S 04

1.3- ESPAÇOS VETORIAIS NORMADOS E ESPAÇOS DE BANACH. . . . OS 1.4- TEOREMA DO PONTO FIXO DE BANACH E TEOREMA DE

BLACKWELL 10

1. S- TEOREMA DE HAHN-BANACH 15

1. 6- CORRESPONDÊNCIAS E TEOREMA DO MÁXIMO 22

1. 7- COMENTÁRIOS E REFERÊNCIAS

"

25

r* Ap-f -n it r\ t t . rs por^pi t?MA r^c dci t mam 57

2.1- PROCESSO DE DECISÃO SEQÜENCIAL E O ENFOQUE

RECURSI VO 27

2.2- PROGRAMAÇÃO DINÂMICA DESCONTADA: CONVERGÊNCIA,

EXISTÊNCIA E UNI CIDADE 31

2.3- OUTRAS CARACTERIZAÇÕES PARA A SOLUÇÃO DO

PROBLEMA DE BELLMAN 38

2. 4- Dl FERENCI ABI LI DADE DA FUNÇÃO VALOR 45 2. 5- CRESCIMENTO ECONÔMICO ÓTIMO: UM EXEMPLO 51

2. 6- COMENTÁRIOS E REFERÊNCIAS 57

CAPÍTULO III: PROGRAMAÇÃO DINÂMICA E PROGRAMAÇÃO CONVEXA 59

3.1-1 NTRODUÇAO 59

3.2- TEOREMAS DE SEPARAÇÃO, FUNCIONAIS CONVEXOS E

CONE POSI TI VO 61

3. 3- TEOREMA DOS MULTIPLICADORES DE LAGRANGE 65

(13)

PÁGI NA

CAPÍTULO IV: APLICAÇÃO A ECONOMIA

71

4.1-1 NTRODUÇAO 71

4.2- MAXIMIZAÇÃO DA UTILIDADE NO CASO DE APENAS UMA

ECONOMI A 72

4.3- MAXIMIZAÇÃO DA UTILIDADE NO CASO DE DUOPÓLIO 73

(14)

I ) RESULTADOS MATEMÁTICOS PRELIMINARES

1♦1 - Espaços Métricos, Seqüências Convergentes e de Cauchyl

Definição ltUma funçíío d, qu& associa a quais:c?u&r dois &l&mento& x & y de> um conjunto não-vazio X um número r&al, dCx,yJ> é uma- fxinç 8c> dis t ãnc i a &m X s& sat isfas- as s&guint&s propr i eda-des:

CAÍ2 dCx,yJ> >O, onde dCx,yJ>=0, s& e> som&nt& se, x=y; CAc.3 dCx,y3 = d<y, x.-'; CSim& tria?

CA3? d<x,yS> < dCx,F-S>+d(2z,yJ>. CD&sig\ialda.ds tri angular.1

Definição gt Um espaço métrico CX,dJ> é \tm conjunto n&Lo-va&io X, no qual uma função distância dCx,y3 está definida.

Exemplo 1: O conjunto D de números reais com função distância dCx,y3=|x-y| forma o espaço métrico K .

Exemplo g» O conjunto das n-uplas ordenadas de números reais

n

x=Cx ,. . ,x 5 com função distancia dCx,y3=[y] Cy -x 3 ]

k= 1

é chamado de espaço euclideano \R .

De fato, a validade dos axi ornas CAI D e CAS3 6 dbvia. Para mostrar que vale CA3D, utilizamos a desigualdade de Schwarz:

k=i k=i k=l

Tomando-se y, -x =a e z -y =b , obtemos que z -x =a +b ■

kkk kkk kkkk

Pela desigualdade d© Schwarz:

SCW2= *<+ 2 £ak.bk+ ^bk S

k = i

(15)

k=i k=l

e czk-xk^2 < c <e cykk

k=i k=l k=l

dZCx,z) < [dCx,y3 + dCy,z?]Z

Exemplo 3t Considere o conjunto das n-uplas ordenadas de números reais. Seja p>\ um número real fixo, e a seguinte função distância que associa a dois pontos x =(x ,. . . ,x 3 e

1 n

n

y <y f.,.-,y5 do Kn a distancia dCx,y3=[ Elx ~V

1 n

k=i

O espaço mítrico assim obtido é chamado d©

lPCnD. Note

que para p=2 recaCmos no exemplo 2. Para verificarmos que vale a desigualdade triangular podemos utilizar a

desigualdade de Minkowski: n Kx

Então:

dCx,y^= [ E Kx -z 5 + Cz -y )|p J1/'p 2S

E lvzklp ]1/P + [S l

k = 1 k=i

Exemplo 4t C [a,b], o conjunto de todas as funçSe-s reais contínuas definidas no intervalo limitado [a,bJ, e um espaço métrico na métrica dCf,g} = sup |f QyO -gCxD | .

Com efeito, dCf,g3^O e» sup |f Cx3-gCx3 j=0 «* | f C>O -gCx3 | =0,

para todo x «=> fCx^=gCxD, para todo x. Além disso,

dCf,g3 = supIfCxD-gCxD | ■ sup |gCx^ -f CxD | = dCg,f3. Verificando-se agora a desigualdade triangular:

dCf,h3>= supJfCsO-hCx} j = supC |fCxD-gCx 3 + gCx>-hCx? |3 <

(16)

< sup | f C vD -gC >O | + sup |gCx2-hCx3 | = = dCf,g3 + dCg,h3

Diz-se que uma seqüência de pontos Cx 3 em um espaço métrico X

n

converge para um ponto x e X se toda vizinhança de x contém todos os pontos de x a partir de um certo índice, isto é, se dado £:>0

n

existe um inteiro N tal que a vizinhança V Cx3 contém todos os pontos x com n > N . O ponto x é chamado de limite de [x ],

n & n

sendo claro que [x ] converge para x, se e somente se,

n

lim dCx, x 5 =0.

n

n-»CD

Definição 3t Uma s&qxfência fx 1 em \t.m espaço métrico X satis/as o critério d& Ca~uchy s& dado &>Q 3 n , tal qiu?, rr£>n e

o o

ri>n implicam dCx ,x ~> <s.

O n m

Proposição 1tToda seqüência convergente é de Cauchy Csatisfaz o critério de CauchyO.

DEMONSTRAÇÃO: Se lim x = x então para qualquer e->0

n

existe n tal que dCx , >D < e/Z para n> n e dCx ,x3< £:/2 para m>n ; portanto n, m>n implicam que dCx ,x ) 5 dCx ,xí + dCx,x ) < e/£ + ér/2= s.

n m n m

Uma seqüência de funçees f : X ■* R converge uniformemente para uma

n

função f: X -> IR quando para todo e>O dado, existe no tal que n>no implica |f Cx3-fCx5 |<£:, V x «= X. Além disso, f : X -> K converge uniformemente , se e somente se, para todo sr>O, existir N tal quo m>N e n>N implicam |f Cx3-f Cx3|<£:, V x e X, que é o critério

n m

de Cauchy para convergência uniforme. Um importante resultado é que seC f 2 é uma seqüência de funçôe:

n

uniformemente, então f é contínua em X.

é que seC f 5 é uma seqüência de funções contínuas em X,e se f -* f

n n

Definição Ai Um g&pg-ço métrico X é compl&to sp toda seqxtância de Cauchy em X conv&rg& para xun &l&m&nto cte> X.

(17)

sabemos da andlise real, que toda seqüência d© Cauchy de números reais converge para um número real.

Exemplo 6t O espaço lPCn5 definido no exemplo 3 <í completo. Do fato

se

^^y

é

uma

seqüência

de Cauchy

em

lpCn3, onde

r <k > <k)_ ...

x = tx ,.,, ,x J>, veri fica-se que cada uma das n

kl n

seqüências de elementos <x >, v = 1,. . . ,n, 6 uma seqüência de Cauchy em K, e, portanto converge para um

escalar x .

Exemplo 7t O espaço de funções C [a,b] definido no exemplo 4 4 completo. Seja <x Ct3> um seqüência de Cauchy no espaço CCa,b3. Então, dado £:>0 qualquer, existe um N tal que |x CO-x CtD |<fr, V m,n>N e V t e [a,b]. Segue-se que a

n m

seqüência <x CtD> é uniformemente convergente para xCtU. Resta mostrar que xCtD 6 contínua em t. Mas

sabe-se que o limite de uma seqüência

uniformemente convergente de funçees contínuas em [a,b] é também uma função contínua em [a,b], estabelecendo o resultado desejado.

1♦E - Espaços Vetoriais:

Definição 5t Um conjunto nüo—uazio L ct& &l&m&ntos x,y,z,. . . , dis-se um espaço \>etorial se satisfaz- os seguintes axiornas:

CA4J>Ch.iaisQXi(?r dois &leme>ntos x,y e L C chamado d& vetor&sl d&terminam, um, terceiro elemento Cx+y? e L, chamado de soma, de x e y, tal que:

aS> x+y - y+x ; CComutai ividadel b? Cx+y}+& = x+Cy+3^ ; CAssociaiividade?

cJ> Existe um vetor nulo B em L tal que x+Q-x, Vx e L ;

(18)

escalar a & qxialoxi&r vetor x e L d&t&rminam \un el&m&nto ctx e L, chamado d& produto escalar d& a & x, tal çií©;

g>^ Ca/?J>. x = a.CjlxJ ; ÇAssociatividad-eJ f> t. x « x ;

operações de- adição e prc>d-uf.o escalar a dv.as proprieda^íes de distributividade; g? Ch+/?J).-x = eu +

- cxx

Exemplo 8t O espaço vetor i ai R 4 composto por vetores da forma x=Cx ,.,.,x3, sendo o número real x o k-ésimo

i r> k

componente? desse vetor. O vetor nulo é definido por

6<O,O O). Se x=Cx x 3 e y=Cy y ), o

In l n

vetor x+y 6 definido como a n-upla cujo k-ésimo componente é x.+y, "> ° vetor cxx, onde « é um escalar, é

Exemplo 9: Considere o intervalo real [a,b3. Entãío o conjunto de todas as funçESes reais contínuas neste intervalo forma um espaço vetor i ai. Tem-se que x=y se xCtD=yCt5 Vt <z [a,bD. O vetor nulo © é a funçSo identicamente nula em [a,b]. Se x e y são vetores nesse espaço e a é um escalar real,entSo Cx+y5C t5 =xC t3+yC IO e C coOQ t3> =«. xC t? . Essas funçSes siío obviamente contínuas. Esse e o espaço vetorial das funçSes reais contínuas em [a,bl.

1*3 - Espaços Vetoriais Normados e Espaços de Banacht

A noção de espaços vetoriais conforme visto acima ressente-se da falta de conceitos topológicos como convergência, completude e outros. Para que esses conceitos estejam presentes, introduz-se uma

(19)

medida de distância no espaço vetorial.

Definição 5? Um espaço vetorial normado é .um espaço vetorial L no qual está definida xima funç&o real que leva cada elemento x em L a utn número real n&o-negativo llxll chamado de norma de x. A norma deve satisfazer os seguintes axiornas:

CAÍ£2 llxll >0 Vx e L, sendo qxie llxll =0, se e somente

se, x=O ;

CAÍ3S> llaxll = |a|. llxll Vx <e L e para todo escalar <x; CA143 llx+yll < llxll + llyll Vx,y e L C Desigualdade

tri angu l arS>

É fácil

ver,

que todo espaço vetorial

normado L é também,

um

espaço métrico; basta que se tome dCx,y2 = llx-yll.

Observaçàol Nem todo espaço vetorial com uma métrica é um espaço

normado.

Exemplo lOtPara transformar o K em um espaço vetorial normado

toma-se llxll =[ £ xZ ] x'z

Vx=Cx ,. . . ,x 5 e IR71.

Desse

, k í n

k= 1

n

2 4 /2

modo, a frfrmula llx-yll =C ECx -y 5 ] ' = dCx,yD define

k = i

a mesma função distância. no \R conforme visto no

exemplo £.

Exemplo 1110 espaço vetorial normado C [a,bD consiste das funço»s

contínuas

no intervalei

real [a,b]

junto

com a norma

11x11= sup |xCt3|.Para verificar que a norma proposta o<t<b

satisf azCA12.")-C A142 , note que obviamente llxll>0, sendo igual a zero somente para a funçíio que é identicamente nula, isto é: 11x11=0 <» sup |xCt3 | =0 » |xCt5 | =0 » xCt^^O.

(20)

O segundo axioma e facilmente verificado:

lloxll= sup \a. xCt5|= sup a|xCt5 | = |a|.sup |xCt3 | = |«l. Ixl

cv<t<b cv<t<b

Por fim, verificamos a desigualdade t-riangular: llx+gll = sup IxCO+gCO | < sup C|xCt;>| + IgCOp <

b cv<t<b

< sup |xCO| + sup |gCO| = llxll + llgll. o<t<b a<t<b

llxll 6 uma norma em C [a,b>].

Exemplo 1'Si Soja p um número real l£p<oo. O espaço lp consiste de

oo

todas as seqüências <Ç , Ç ,..> para. as quais J] |Ç.|p<oo.

i = 1

A norma de um elemento x= <Ç.> em lp é definida como

oo

llxllp - C £ |Ç.|P 3

P. Note que a norma em

lp satisfaz

V

V = í

llcxxll =|a|. llxll e que llxll > O V x ^ ©. Observe que a

n

desigualdade

de>

Minkowski,

[ £ | c*

+ /? |p 3i/p

<

r> n

S CE !«klP 31/p + [ E I^JP 3±/P '

* exatamente a

k=i k=i

desigualdade triangular para tal norma.

Então a norma em lp satisfaz os três axiornas requeridos para uma norma. Veja também, a partir das propriedades de norma, que lp é de fato um espaço vetoriai, pois se x= <Ç\> e y= {r?.> são vetores em lp, então para quaisquer escalar «,/? tem-se que II «x + fiyW 5 < | a. |. llxll + |/?j. llyll < 00, de modo que ax+/?y também 6 um vetor em lp. Portanto, lp 6 um espaço vetorial normado.

Em um espaço vetorial normado uma seqüência infinita de vetores <x > converge para um vetor x se a sequ*nci a <llx-x ll> de números reais converge para zero. Note que se uma seqüência converge o seu limite é único, pois se supusermos que x -> x e que x -♦ y, então

n n

llx-yll = llx-x + x -yll < llx-x II + IIx -yll -♦ 0 .-. x=y.

n n n n

(21)

■Cx > em um espaço vetorial normado satisfaz o critério de Cauchy

n

se dado é:>0, existir N tal que IIx -x II < e para n,m>N.

n m

Espziços vetor i ais normados onde toda seqüência de Cauchy 4 convergente s&o particularmente interessantes, pois em tais espaços é possível identificar-se seqüências convergentes sem que seja preciso identificar explicitamente seus limites.

Definição 7i Um espaço vetorial normadv L é completo se toda a de Caxtchy em L converge para. wn ponto de L.

Defini cão Bx Um

Banach.

vetorictl normada completo é -um

Exemplo 13iSeja X o espaço das funçSes contínuas em [0,1] com norma definida por llxll =/ |xCtO|dt. Pode-se verificar que X é um espaço vetorial normado. Mostremos agora que X é imcompleto. Defina uma seqüência de elementos em X:

x CU =

n

t/t. 4.

Cada termo da seqüência 6 uma função contínua ©m [0,1] e portanto pertence ao espaço X. A seqüência satisfaz o critério de Cauchy pois IIx -x II = l/2|l/n - 1/m | -> O. No

n m

entanto. neto existe função continua para onde a

(22)

Exemplo 141 Seja CCX3 o conjunto das funçSes contínuas e limitadas f:X -» K, X S 0? , com a norma llfll= sup | f Cx3 | . CCxD «í um

espaço de Banach. Que CCXÜ é um espaço vetoriai normado segue do exemplo 11. Resta mostrar que se <f > é uma seqüência de Cauchy então existe f e CCX3

n

tal que para todo <r>O existe Ne tal que IIf -f II < e, para n > Ne. Inicialmente, fixando-se x e X, tem-se que

|f Cx5-f Cx3| S sup|f Cy3>-f Çy} | = II f -f II.

Al *rn disso,

n m n " m nm

y<EX

como <f CxD> é uma seqüência de Cauchy de números reais para todo x, e como K 6 completo, <f Cx3> converge para um certo número real fCx3, que define uma funçíio f: X ■» R.

A seguir .mostraremos que If -fli -» 0 a medida que n -* co.

Ora, se dado e>0 existe N tal que |f CxD-f Cx3 | < e

n m

V m,n >N,

então sabemos pelo critério de Cauchy para

convergências uniformes que Ve>O existe no tal que n>no Í .T.pl j. C ?. Jf C XJ* —f* 1 rO 'íf , Í3"*" 6f f ■♦ f uni fnrmDtnonlo Por fim devemos mostrar ainda que f <í limitada e contínua. Quanto a ser limitada é óbvio, entoo nos detemos a mostrar que f é continua. Para tanto, devemos mostrar que V &>0 e x <e X existe Ô>0 tal que | fCx3-f CyD | <í: se llx-yÜE < <5,onde II. He ó a norma euclideana no 0? . Sejam c e x dados, e escolha k tal que llf-f II < e-/3, o que é posstvel visto que f -> f uniformemente. Enteio

n

escolha ô tal que llx-yÜE < 6 implica |f Cx2-f Cy3 |<£:/3. Logo | f C x3 f C y3 | < | f C xD

-< llf-f, II + |f, CxJ-f Cy

que completa o resultado desejado.

Lema 1X Toda seqüência de Cauchy é limitada.

PROVA: Seja -Cx > uma sequ©ncia de Cauchy e seja N um

n

inteiro tal que llx -x.,ll < 1 para n>N. Para n>N tem-se

n N

então llx II = llx - xXI +xVIll < llx.,11 + llx -xv,ll < llxv,ll + 1. ■

(23)

Exemplo 15l Vamos mostrar que lp, l<p<oo ó um espaço de Banach. Seja <x > uma seqüência de Cauchy em lp. Então se x ■

r> n

00

<<

q1-1^ l?v- ?. I- < E iç. -?. I

V

V =i

Portanto, para cada k, a seqüência <£!""> <* uma seqüência

d© cauchy de? números reais e que, &&&S& modo, converge para um limite Ç , Devemos mostrar que x= <Ç , Ç ,...> é um vetor em lp.. Pelo lema 1, existe uma constante M que

k

limita a seqüência <x > ,■, Vn e Vk, £ |Çn|P < IIx llp< Mp.

n . v n

v = 1

Como o lado esquerdo da desigualdade é uma soma finita, a desigualdade permanece válida à medida que n -> co

k

£ |Ç. |

< Mp. Como essa desigualdade vale uniformemente

CO

em k, £

|Ç. |p < MP,

e x <= lp.

Falta mostrar que

V = i

a seqüência <x > converge para x na norma de ip.

n

k

, 3 N tal que £ |Çn - ÇTn|p < ilx -x II P< e para n,m>N

x v n m

v = 1

e para cada k. Se m -> co na soma finita à esquerda, vem

k

que £ |Ç. - Ç. |p < e

para n>N. Deixando que k ■* oo, vem

i= 1

que Ilx -xll < & para n>N .-. x -* x.

1.4- Teorema do Fonto Fixo de Banach CTeorema de Contração^ e> Teorema de Blackwell?

Para se tentar determinar a soluçSCo de uma equação do tipo fCx3=0, pode-se tomar x=gCx3> com gCxO =x-\. fQ>O , \>0, e em seguida iniciar-se o seguinte processo iterativo: escolhe-se um x pertencente ao domínio de a tomando-se x =gCx 3, x «ílCx ?»•..»

1 ' O 2 1

x =gCx D para n- O,l ,2,. . . , esperando-se que a seqüência <x >

(24)

convirja para uma solução d© x=gCx_), que seria um ponto fixo de g.

Definição 9* Seja, A xan operador qxie leva xim espaço métrico completo E em si mesmo. Então x é xim ponto fixo de A se Ax = x.

Definiçgo lOí Seja A um, operador que' leva \un espaço métrico completo E em, si mesmo, e suponha, que exista um q fixo, O S q <".. 1 , que satisfaça a condiç&o de Lipschits-dCAx,Ay} < q. dCx,yS> V x,y <e E. Neste caso diz-se que A é xuna contraçSí-o.

TeoremaCT. 13: Teorema do Ponto Fixo de Banach í Se A é uma contraç&o em um- espaço métrico completo E, entõ.o a eqxiaçQo x=Ax tem exatamente uma solução x e E, Além, disso, esta solxiçõo pode ser obtida pelo método das aproximaç-Qes sucessivas: escolhendo-se um ponto de

oartida arbitrário x e E e tomando-se x - Ax ,

U n+x n

n~O,í,£,. . . , ent&o <x > converge para x.

n

DEMONSTRAÇÃO: Tomartdo-se um x arbi tràrio em E e

■ o

definindo-se a seqüência íx > i teratix>amente por

x = Ax , x - Ax - A x , . . , x

= Ax - A™ . x r obtém-se

í o z i o n+i n o

as se$\i i n t es est i ma t i va-5:

dCx , x J> = dCAx , Ax 2 < q.dCx ,x S>

2 1 i O i O

dCx , x .5 = dCAx ,Ax 2 < q.dCx , x .? < qZ.d£x ,x J>

Genericamente, dCx , x J> < q .dCx ,x 2. Ghieremos:

n+i n IO

mostrar qxie (x } é uma seqüência de Caxichy. Note que:

n dCx »x ?< dCx x P+dCx ,x 3 + . . +dCx ,x n+k n n+i n n+Z n+i n+k n+k-1

< qn. dCx ,x P+q™*1. d(x »x 5 + . . +on+ ~?dCx ,x 3 =

1O^ iO * i O ,, % . n n+i n+Z n+k-i, = dCx , x j> Iq +q +q +. . . +q J

-= dCx ,x J [ E q>n+J *}" qn.Cl-qk/l-ql.dCx ,x J><

j

(25)

< Cq Sl-qJ.dCx , x J> , k = í ,2,. . .

Como a última expressão do lado direi to pode s&r tomada arbitvariamente pequena para n suficientemente grande C lembre-se que O < q< ÍS>, segue que <x > 6 uma

n

sequéncia de Caxichy em E. Coma E é um espaço completo, <x > converge para um ponto x <e E. Note agora que dCAx,x? < dCAx,x 3+dCx , xj> = dCAx,Ax J>+dCx , xJ> <

n+l n+1 n n+1

5 q,dCx,x .? + dCx ,x7 -» C?, .fá oxie os dois

n n+1

últimos termos do lado direi to convergem para zero. Ent&o, dCAx,xJ>-0, donde vem que Ax=x, isto é, x é um ponto fixo de A. For fim, mostraremos que x é o único ponto fixo de A em E. Se para y <e E também tivéssemos Ay-y, ent&o dCx,yS> - dCAx,Ay} < q. dCx,yJ>, o que implicaria em que dCx,y3=0 ,\ x=y. ■

Note qu© t,ant-o esse teor ema quanto a definição 9 s© exiendsm trivialmente para o caso em que ao invés de A estar definido em um espaço métrico completo, A estiver definido em um espaço de Banach.

Corolário: Seja CX,dD um espaço métrico completo,e T: X -> X uma contração com ponto fixo v e X. Se X' 6 um subconjunto fechado de X e TCX'3 ^ X', então u e X'. Além disso, se TCX'3 £ X" ^ X', enteto v e X".

DEMONSTRAÇÃO: Tomando-se v X', veja que <T v > 6 uma seqüência em X' convergindo para v. Como X' # fechado, segue que v e X'. Se além disso TCX'3 £ X", temos também que v=Tv <a X", ■

Exemplo 151 Seja f uma função definida no intervalo fechado [a,b] pertencente a um espaço métrico completo qu© leva [a,b] em si mesmo, e que satisfaz |fCx 3-fCx 3 | < k. |x -x | ,

Então f é uma contração e portanto a seqüência .., converge para a única raiz da x , x =f C x 3 , x =f C x

(26)

equação fCxD^x. Em particular. |fCx 3-fCx 3 | < k|x-x |

í 2 1 Z

vale se f tem derivadas contCnuas f* em [a,b] tal que ' < k

A figura ao lado representa o processo da solução da equação x=fCx3 a partir de um x e[a,b]

o

arbi irdrio,

Exemplo 371 Seja um sistema de n equaç&es lineares em n incógnitas,

n

representado por 6. - £ a . ô = y , i=l,.«. ,n Cl.23,que

k =

pode ser reescrito sob a forma de um problema de ponto

n

fixo como ó. - £ a

. ô

+ y. , i =1 , . . . , n. De fato, resolver

k = l

tal problema eqüivale a encontrar um ponto fixo da

transformação

A: [Rn -> [Rn, definida por

ACó ,,,,,<5 ) =

1 r»

n n

1 í.j

Para que o teor ema do ponto fixo de Banach possa ser aplicado, é preciso antes assegurar que IR seja um espaço métrico completo. Isso pode ser feito

n

utilizando-se a função distancia dCx,y3=[£ \ô -ft |p]*/p,

k = i

k

k

que transforma o Rn no espaço métrico lP<n>,

que é

completo.

Sejam x -Cô ,...,<$ 3 e y -Cft , . . . , R 3 e Kn. Verificamos

i n 1 n

agora, para p=l e p=2, as condições sob as quais A é

uma contração.

n n

p*ls então dCAx,Ay3= £| £a Ç<S-^3| <

v=l k=i Vk

k k

n n

í E

E

(27)

n n

mas E 16 -(3 | .-. dCAx,Ay^< Cmax £ |a.. p. dCx,y3 ,

k = l k=i i=l

onde max £ | a. | = q

k = i i, = I

n n

ii} Se p-2: então dCAx,Ay]> = CEIE

v = 1 k = 1

~P -">

pela desigualdade de Cauchy-Schwarz:

|Z

E l«k| . C n n < C v=i k=l vem que com p«2,

E

Então, dCAx,Ay5 < C £

| «^ |Z ]1/z

onde n

CE

l«.kl

3

= q.

i,k=l

De CT. 15 tem-se que se q <1 ou q <1 então o sistema

1 2

de equações C1.25 apresenta exatamente uma soluçcxo. Falta agora descrever a soluç&o iterativa deste

sistema.

Defina

k:

Rn->Rn

por kC<5 ó 5 =

1 n

=C

k=i

. 6 Z> , & tome x = Có ,, . . ,6 3

Podemos então reescrever

Ax ■ kx + g = g + kx.

ACó como

Tomando-se x =q,os vetores x = Ax , n-O,l,£,... .ficam

O n+l n

sendo os seguintes: x - Ax ■ Ag = g+kg

x = Ax = g+kx = g+kCg+kgD= g+kg+k g

(28)

Em termos genéricos, x

= Ax

- g + kg + k g +...+knq,

n n—i

n=l,2,. . . , logo <x > é a seqüência das somas parciais

n

00

da

siri©

convergente

£

kn. g

C Série de Keumann),

CT«ED> Condições Suficientes de Blackwell para uma Contração»

Seja X £ R & BCXS> o espaço das funçües L imi iadas f:X -> [R,com 11/11= sup \fCxl\. Seja também T:BCX> +BCXJ

sex

um operador satisfazendo:

aJ> Monotonicidad&: f & g e BCXJ & /CxP < $CxS> V x e X implicam, CT/^CxP < CTgJCxl V x e X; WDescondo; existe /? e CO,IJ tal q~u& ITCf+a21Cx2 <

< CTf^Cx> +fia, V / e FCX^, a>0 « x « X. Enietc? T * lima condracôo com mòdtilo (3, oxi s&ja,

II7/ -7*11 <

DEMONSTRAÇÃO: Se> /Cx^SéKxP V x e X, PscrPVPmos /<í?. é dbvio çxze- para quaisq-uer f & g e?m BCX2r f<g+\\f-g\\. Ent&o pela monotonicidade, Tf 5 7"C# + H/-£llJ>; e pelo desconto,rc^+ ii/-#ii;>< r^+ /?. il/-#li .•. r/< r^ +/?. \\f-g\\. Se ^CxJ>< /Cx^ V x <e X ^ £?< /+ ll/-#ll. Do mesmo modo, pelas propriedades <aJ> e CbS> \>em que:

Te < TCf + I/-*O < r/ + ft. if-$i,

Portanto,

temos que Tf-TgS p, \\f-$\\ e Tg-TfS {3. H/-#il,

o g\<e implica que -fí. Wf-gW < Tf-Tg < (3. Wf-gW .:

II7/-1.5 - Teorema de Hahn-Banach:

Os dois principais resultados desta seção sSCo o Teorema de

Hahn-Banach na forma de extensão e o Teorema de Mazur.

Introduziremos inicialmente alguns conceitos indispensáveis para

(29)

Definição llxUm sub-conJunto nao vas--io M de um espado vetorial L ê um subespaço de» L se, quaisquer que sejam x e y pertencentes a tf, ax+fty também, pertence a M, para

todo escalar et,/?.

Definição lZtOs elementos x,y,... tw de um espaço vetorial são linearmente dependentes se existem escalares a,fir. . ,X nem todos iguais a zero, tal que a. x +/?. y +. . . + \. w=0. Se tais escalares ntio existem, isto é, se a. x + fi. y +

+ . . . + \. w-O impl icar em a.=ft-. . . =\=0, então x, y, . . . , u>

s&o l inearmente independ-entes.

Um espaço vetoriai tem dimensão n se n elementos linearmente independentes são encontrados em L, com quaisquer n+1 elementos de L sendo linearmente dependentes.

Definição 13l Um subconjunto G de um espaço vetorial L ê um, gerador

de L quando todo elemento de L for uma comoinaçtxo

linear de elementos de O.

Note que um espaço vetoriai diz-s© de dimensão finita quando admite um gerador finito.

Def ini ção 14? Uma, uar iedade l in-ear ê a translaçSío de um- sxibespaço, isto ê,se L é um espaço vetorial, M um su.bespa.co de L e x e L, entSío a variedade linear que passa por x paralela a M é o conjunto x+M. A variedade linear V pode ser escrita como V -x+M.

Se> C <è um subconjunto nSo-vazi o do espaço vetorial L, a variedade» linear gerada por C, VCÓ, é a interseção de todas as variedades

(30)

Definiçà'o 15? Um funcional em L ê uma transformação de um espaço vetorial L no conjunto dos reais, enquanto que um func i ona l li near é um, funcional f que seja aditivo e homogêneo, isto ê, qxie satisfaça /Cx+yJ> = fCx? + /CyJ>

V x,y <= L e fCa. xJ> = a.fCxJ,

V x e L.

Definição ÍQxUma funçQo real p definida em um espaço vetorial real L é um funcional sublinear se:

iJ pCx +x .3 < pCx J? + pCx .5, V x , x e L; £ tJ>pCcxx;> = &p(x3, V cí>0 e x <= L.

Da definição acima fica claro que qualquer norma conforme a definição 6 é um funcional sublinear.

Definição \7\Seja f um funcional linear definido em um sub&spciço M de v.m espaço vetorial L. Um funcional linear F é uma extensão de f, se F está definido em \an subespaço N,

diferente do próprio N e que contém pelo menos um elemento diferente de s-ero?, e se em M, F ê idêntico a f. Nesse caso, F é uma extensão de f a N.

A seguir enunciamos o teorema de Hahn-Banach na sua forma de extensão.

CT«3.">t Teorema de Hahn-Banach na Forma de Extensãot Seja L um espaço vetorial real; M um subespaço de L; p um funcional sublinear em L; e f um funcional linear definido em M tal que fCnO < pCnO, V m <e M. Entüo existe uma extensão linear F de f a L tal que FCxJ 5 < pCxJ>, V x e L.

DEMONSTRAÇÃO:

Suponha que y é

um vetor

de

L

ncío

pertencente a M, e considere os elementos do subespaço gerado por [M+yJ. Tais elementos sào

(31)

Uma extensão g de f a [M+yJ tem a forma gCxJ> -/CnO + a. gCyS>, e portanto a extensão é especificada impondo-se a constante $CyS>. Devemos provar que essa coTistantc pode; £íc\t voculhiuUt dv modo que $CxJ><pCx2 em CM+y].

Para quaisquer dois elementos m ,m e M tem-se que:

1 2

/Cm ?+/Cm 2= /Cm +m } < pCm +m J> = p[Cm -yJ>+Cm, +yS>]<

1 2 12 12 1 2 '

< pCm -yJ> + pCm. +yJ? a /Cm J-pCm -yPS pCm +y}-/Cm J) .-.

i 2 11 Z ' Z

.-. s\;p [/Cnú-pCm-y}] < in/ [pCm+y}-/CrrO]

míEM th-, M

>4ss;tm,, exisie» imo consiaate c dai çue: [/CnO-pCm-yJ] < c < in/ LpCm+y^-/CnOJ

Para o vetor x= m+oy de/inimos &CxP= /CmJ>+a. c. Resta mostrar que §Cm+a. yJ> £ pCm,+a. yP.

Se a>0, ent&o:

$Cm + a. yJ> - /CmJ> + cx. c = a. c + /CnO = aCc + /C-JJ <

< a. tpC1^ + y;> - /C^J> + /Cg>J* a-^ + V^ = PCm + ay;

Se ct= -f3<0, então:

gCm - (i*y> ■ /CmJ> - /?. c ■ -/?. c + /CmJ> = ft[-c+ /C~?]<

< (t. ipC^ - yP - /Cp ♦ /C|>J = ^.pcg - y^= pCm - ' fi&

Portanto, gCm+a.. y} < pCm+«. yJ>, V «, e g 4 xuna

extens&o de / a [M+yJ.

Se L é \an espaço de dimensão /inita, seja H \an subespaço de L com a maior dimens&o possível, tal que: i2 M c H;

iilexiste uma extens&o linear F de / a H tal que FCxl < pCx? V x <z H,

Como vimos acima qxie 6 possível construir extensões com essa propriedade sempre acrescentando mais uma dime-nsixo ao subespaço, é impossível que H tenha dimensão in/erior a L, isto 6, H é o próprio L. A g&n&ral izzaçào do teor&ma. pa.ro. espaços; de> dim&ns&o in/inita, que omitimos aqui, utiliza-se do lema de

(32)

Iremos provar ainda nesta seção a forma geométrica do Teorema de

Hahn-Banach, que diz que dado um conjunto convexo C contendo um

ponto interior e dado um ponto x não pertencente a C, existe um hiperplano contendo xq e separado de C. Antes disso, porém, será necessário introduzir mais alguns conceitos importantes.

Def i ni ç âo 181Sejam x,y dois vetores quaisquer de um espado

vetorial real L, e seja C um subconjunto de L. Diz-se

que C é convexo quando, se x e y pertencem a C, a. x + Ct-cQ.y, Q<a<l, também pertence a C.

Seja C um subconjunto convexo de um espaço vetor i ai L.

Denominaremos

por

M CO

a

interseção

de

todas

as

variedades

lineares que contêm C.

J

vetorial real L, com MCc3=L, diz-se um ponto regular, se e somente se, para todo h e L existir um real a>0

tal que x + ah e C. Neste caso, designaremos por C o conjunto dos pontos regulares de C.

Definição 20*Seja C um subconjunto convexo do espaço vetorial real L e suponha que MCCS>=L e que O seja um ponto regular de C. O funcional de MinkowsKi m relat ivo a C é de/inicto coma mCxS>- inf < r: — <s C; r->0 >.

A ideía geométrica do funcional

de Minkowski

pode ser obtida da

figura abaixo: mCx2 define uma espécie de distância da origem a x medida em relação a Cisto é, mCxD dá o fator pelo qual C deve ser expandido para que passe a incluir x.

(33)

Teor orna C T. 431 Seja C um subconjunto conuexo de um espaço vetorial real L contenda O como ponto reg-ular e MCCJ>=L. Ent&o o funcional de Hinhowshi mCxJ> relativo a C satisfaz: 1. mCxl > 0, V x e L;

2. Se x e C,' então mCxJ> < 1 ; 3. Se mCxl < 1, entS,a x e C;

4. nvCctxJ = a. mCxJ>, VxeL6-a>C5; 5. mCx+y? < mCxl + m£yl, V x,y «= L;

õ. Para c?v<© x e C £ necessário e s\i/ictente1 que

í. Da própria def i

obtém-se que mCxJ> >0, V x e L;

, m/CxS> = inf <r: —

r C; r>0> ,

cr. :>e x e u, então — e c para r=i . rortanto, mí.x^^i;

3. Se mCxSXÍ então existe r<l tal que — <e C. Como O e C, i em-se gue x e C; Para a = in/ í ■ a. mCxJ> Para a = = a. mCxJ> > O, mCccK , x ar : —, <e r 0, note = 0: J> - i nf C;r'>0> que m£02 r; ax C ; X

F1

mC0J>=0, donde \>em que mCaxJ> =

5. Da-dos x , x

1 z ri,r tal

* < r < mCxJ+s, i-í ,2. De (43 sabemos qxte se

v i i mCx S> <r , entõ.o — . mCx J> = m (— J> <í .-. — e C, v v rv i ri ri como conseqüência de C3J>. Seja m C r = r + r í z ri rz pela conuexidade de C, i, Cxi+xzJ> _ e C .-. por J> < 1 . Usando C4J> novamente, mCx +x ^ 5 í z

(34)

< r < mCx 3 + mCx J> + Ze. Como s foi tomado

i Z

ãrbi Lrari.ament&, segrue-se gw J7i é

6. Cpiasictere" inicialmente qxte x e C. Então, V ft e £, existe a-X? íai otíe? x+aft e C; tomando-se h=x vem que Cí+cO.x <b C. Para, O < r= -^ < f, coric l^i-&© q»x<e — <£ C para algum r<I ,\ mCxJ> < 1.

Suponhamos agora que mCxJ>< í. Usando C3S>r x e C. Por C4J> e> C5J> sabemos cite )7iCx+a^..? < ?tiCx.>+ a. m£hJ>, Ora, mas se mCx?< í, para todo h e L é possível encontrar a. >0 tal qxi.e m£x+c*hJ> < l , que por

significa que x+ah € C .•« X e C , ■

Definicão SI iUm hiperplano em um espaço vetorial real é um conjunto da forma H**<xi /CxJ>*cj XfsL>, onde /Cx.2 é um funcional linerar n&o identicamente nulo em L, e c ê uma. constante. O hiperplano H divide o espajço L em dois semi-espaços, H =<x: fCxJ>>c; x^L> Csemi-espaço

Teorema CT.53tTeorgma d© Hazur CForma Geométrica do Teorema d© Hahn-Banach) í Seja C ^U7^. subconjunto corwexo do espaço \>etorial real L, tal que: iJ>MCC2=L; H2C seja nao-va&io. Seja V uma variedade linear tal qxie V D C = 0. Então existe um hiperplano que contém V e que deixa C no seu semi-es paço esquerdo. Em outras palavras, existe um funcional linear $CxS> definido em L tal que gCvl-c V v e V e tal quo

Sc V x e C.

DEMONSTRAÇÃO: Por xima

transi ação apropriada podemos

supor qxie O seja um ponto re$xilar de C. Suponha que V- y+W, y e L e W um sxibespaço de L. Como V n C = O, O e V. Seja Z o subespaço de L gerado por V, tal qxie-seus elementos se expressem na forma, z. =ay+w, a real e w e W. Definamos em Z o funcional linear gC

(35)

sendo óbvio que §CvD=l V v e V. Devemos mostrar que se mCxJ é o funcional de Minkowski em relação a C,

gCz-3 < mCzJ>

V z e Z.

Como V n C - 0 do teorema CT. 4. 63 #Cv>J>= $Cy+ftw2=l < < m£y+{3wJ para qualquer w <e W e ft real.

Pela homogeneidade de mCx2:

Se a>0, a. gÇy+fiw> - f?C«v+u».5 = « £ mCcxy+u»J>

Se a<0, mCay+wJ> > ^Cay+wJ> = a pois mCxJ>>0. Por tanto gCzJ < mÇz-2 V z e Z.

Pelo teorema de Hahn-Banach na forma de extensõ.ot comei tTt.CxJ> ê sublinear, existe uma extensão gCx3 de

.-*

g(z--3 a L tal que gCxJ < rnCxJ V x e L. Como urruz extensão de gCzJ, gCvl-1 V v e V, enquanto que para todo x e C tem-se que mCxJSt .'. &CxJ> < mCxP < 1. Portanto, gCv'J =1 V v e V e $Cx3 <í V x e C estabelecendo-se o resultado desejado. m

1*0 - Correspondências e Teorema do Máximo!

Definição ggl Se a cada elemento de x de \im dado conjunto X es d d associado um, subconjunto nao-vazio FCxJ de um dado conjunto Y, uma funç&o F de X no conjunto dos subconjuntos de Y está definida. Essa função é chamada de correspondência F: X -» /.

Definição S3t Uma correspond&ncia F: X ■* Y ê semi-contínua inferiormente Cs.c. i. J> em x se PCx? ê não-vaz-ia e s& para todo y e FCx.J> e toda seqxcência x -*x, existe» N£t

n

e uma seqüência <y > tal cyu& y ->y com y e FCx S>

n n=N n * n n

V ri>N. Em outras palavras, x ->x e y e FCx^> implicam

n

que existe (y } tal que y ->y com y e FCx P.

n n n n

(36)

superiormente Cs. c. s. em. x se FCxJ> é nSLo-vasia e se

para ioda seqüência x ->x e toda seqüência <y } tal

r> n

q~ue y e FCx J>, Vn, existe uma

n n

de <y > cujo limite y está em FCxJ>. Ou y e FCx J> e y ->y implicam que y e FCxl.

n r> n

Definição £5t fma correspon^gnc: i a V: X-*Y é cont ínxia em x e X se for tanto s.c.i. quanto s.c.s. em x; F é dita ser

contínua se a propriedade anterior valer

V x e X.

A figura Cl.A3 ao lado mostra uma correspondência que é s.c.i., mas nSo s.c.s. , em s.c.s. ma

s.c.i. , em x ; e é tanto s.c.i. quanto s.c.s. nos demais pontos.

FIGURA Cl. A3

Definição S6t O gráfico de uma corresparui^n^ia F: X -» conjunto A= fCx,yJ> e X x /: y e TCxJ>J.

Y é o

Seja X £ tRl,

Y £ R™,

f: XxY -> R uma função, e T: X -»• Y uma

correspondência. Considere o seguinte problema: sup fCx,y3. Se y*=T< x >

para todo x, fCx,.? é contínua em y e o conjunto TCx.") 4 neio-vazio e compacto, então para cada x o máximo é atingido. Nesse caso a funççio: C12 hCx3 = max fCx,yD é bem definida, do mesmo modo que o

yeTt x)

conjunto nao-vazio;

CS? GCx3= <y e TCx."): fCx,y3=hCx^> dos valores de y que atingem o máximo,

Desejamos saber sob que condiçeses a função hCx.">, definida no problema de maximizaçao Cl?, e o correspondente conjunto GCxD definido em C£3, variam continuamente com x.

(37)

Teorema CT.6:>1 Teorema do Máximoí Seja X £ Rl, Y £ tRm, /: X*y -» \R

uma funç&o continua, e F: X -> y i<ma correspondência continua e compacLa. Ent&o a funç&o h: X -*■ K definida em CÍJ> é continua, e a corre-sponcfência G; X -» y definida em C2"J> é nao-Dazia.compacta e seroi-contcniia

super i ormen t &.

DEMONSTRAÇâO: Frim&iram&nte vamos mostrar cpue» GCx^ é n&o-va&io e> compa-cicrixandci x 6 X, PCxJ é n-ào-vasia & compacta &, fCx,.J> 6 continua; s&g\i& <y\í6> o máximo em CIJ> é atingido, e> portanto o conjunto GCxJ> 6 nà.o va&io. Como GCtO S FCxJ e> TCxJ>é compacto, eniíio

é i imitado. Suponha agora c?ue y ->y com, y e

n n

para todo n. Segxie-se que y e TCxJ>, dado que FCx? é fechado. Além disso, como hCxJ>=fCx,y J> V n sendo f

n

contínua, temos que fCx,y}=hCx2. Portanto y também p&rt&nc& a GCxJ>,o qu& implica em qu& GCxJ> é fechado, ficando provado que CCxP é compac to e n&o-vaz-io, Vx. A seguir mostraremos que GCxS> 6 semi-contínua superiormente. Dado x, seja <x > uma s&qvténcia qualquer convergindo para x. Escolha uma seqx&nc ia

<y > tal que y

e CCx ^ V n.

Como F é

semi-continua

n n n

superiormente existe \ma subsequ*ncia <y > convergindo para y «s FCxJ. Seja também Z e FCx};como F é semi-contínua inferiormente existe uma sequénc ia Z -> Z, com Z e FCx J>, V h. Uma vez que

nk nk nk

/Cx ,y ^ > fCx ,Z S>, V h, e sendo f contínua,vem

nk nk nk nk

que f<x,yP > fCx,Z>. Dado que isso 6 válido para qualquer Z <e FCxJ> tem-se que y <= GCx2, implicando em que G é semi-continxta sxiperiorm&nte.

Resta mostrar qxte h 6 conlínxia. Dado X, seja <x } xtma seqxiência qxialqu&r convergindo para x. Escolha uma seqxiência Cy } tal que y e GCx .>, V n. Seja

_ n n n

também h-ltm, suphCx J> e h=lim infhCx S>. Ent«.o existe

n r>

uma subsequéncia <x > tal que h= lim fCx ,y 3.

nk nk nk

Como GCxS> é s.c.s. existe uma subsequ&ncia de <y ), <y >, convergindo para y e GCxJ>. Ent&o, h- l im

(38)

fCx,,y'.J>-=/Cx,yJ>=hCxJ>. Por raciocínio análogo estabelece-se que h=hCxJ>. Portanto, <hCx converge para

estabelecendo a continuidade de h. U

Suponha que além das hipóteses dn Teor ema do Máximo, a correspondência F seja convexa e a função f seja estritamente concava em y; então GCx3 deixa de ser uma correspondência tornando-se apenas uma função, gCx3. Há ainda um resultado interessante que trata sobre convergência de funçQes como gCx3, e que nos será útil mais tarde, que enunciaremos aqui sob a forma de um teorema mas cuja demonstração será omitida.

Teorema Ç T. 7D * Seja X £ R e Y <= \Rm; seja ainda F: X -* Y n&o—va&ia,

compacta, convexa e continua, com A sendo o gráfico de F; Tome <f } como sendo uma seqüência de funções reais continuam definidas em A. Suponha que para cada n e cada x e X, / Cx,. j> seja estritamente

n

concava em seu segundo argumento. Suponfia também cpae f tenha essas mesmas propriedades e que f -* f

n

uni formementeC na norma do supremo?. Defina as funçòes g e g como: g CxJ>= arg max f Cx,y? n=l ,2",. . . , e

n n ,_, n

yer< x >

= arg fCx,yJ>

Ent&o g -» g simplesmente e se, no entanto, X for

n

compa-cto, g -» g uni formemente.

Demonstraç'6.0: Ver Lucas, Prescott , StoheyCpag 53-Õ52

1.7 - Comentários g Rgferftnciast

O material apresentado nas três primeiras seçcSes pode ü encontrado de forma bem abrangente em Kolmogorov & Fomin C19?"0rj

(39)

em LuenbergerC19643. Uma referência para um tratamento mais formal sobre seqüências de funçcSes e convergência uniforme é Rudin

C19B43.

Heuser C19733 contém uma excelente apresentação do Teorema

do Ponto Fixo de Banach, enquanto que o Teorema de Blackwell conforme exposto na seção 1.4 segue Lucas & Stokey C1S893, embora a referência básica seja Blackwell Cl 9633.

O Teorema de Hahn-Banach na sua forma de estensão foi provado na seção 1.5 apenas para espaços de dimensão finita. Sua generalização para espaços de dimensão infinita utiliza-se do Lema de Zorn, e pode ser encontrada em Simonsen C19833. O Teorema de Mazur também pode ser encontrado em Luenberger C19S93.

Para uma discussão detalhada das propriedades das correspondências boas referências são Takayama Cl9743 e Debreu Cl9393. O Teorema do

Máximo, conforme apresentado na seção 1.6, foi extraído de Lucas &

(40)

II ) O PROBLEMA DE BELLMAN:

2.1 - Processo de Decisão Seqüencial e o Enfoque Recursivot

A característica principal das técnicas de Programação Dinâmica é

a estruturação dos problemas de otimização em múltiplos estágios, que são resolvidos seqüencialmente um de cada vez, permitindo assim transformar-se um problema complexo em uma seqüência de problemas mais simples.

Na verdade, a idéia da Programação Dinâmica,

conforme introduzida

por Bellman, está diretamente ligada à Teoria dos Sistemas. Um sistema qualquer progride através de uma série de estágios consecutivos. Em cada estágio o sistema pode ser descrito por um conjunto de parâmetros denominados de variáveis de estado.Em cada estágio, também, não importando em que estado o sistema está,

do estágio quanto do estado, como de ambos.

A história passada do

sistema, isto é, como se chegou aos atuais estágio e estado,

nrío

tem qualquer importância. Quando uma decisão é tomada, um retorno

é obtido e o sistema passa por uma transformação que o leva para o

estágio

seguinte.

O

objetivo

do

processo

de

um

modo

geral

é

maximizar ou minimizar alguma função das variáveis de estado e de contrSle Cou de decisão}, que normalmente é a função de retorno.

Seja x o vetor das variáveis de estado na época t, t= 0,1,...,N; x é um elemento de um conjunto X qualquer, isto é, X é o conjunto dos valores possíveis para a variável de estado x . Seja u a variável de controle na época t, t- 0,1,. . . , N-l , sendo que u está restrito a tomar valores em UCxD <z X. Cada função \a especifica o controle u = pCxí que será escolhido quando no t-ésimo estágio o estado for x. Note que as funçees ^Cx): X -> X devem satisfazer U Cx 3 <= UCx3, V x e X. Seja g Cx , u ~> a funçüo de retorno na

V V V V \ \, t

(41)

função d© transformação dada por x = f Cx ,u3, t= 0,1,...,N-l. Esquematicamente, o procc^^o de decisão seqüencial, conforme descrito no segundo parágrafo, pod© ser representado como abaixo, onde o objetivo é maximizar o retorno total ao longo dos N estágios: j 1 *1 1

I

N- i

I

gCx.uD g Cx ,u ^O O O **! 1 1 N

i

g Cx , u N-1 N-l N-l g Cx ^N N

Analiticamente, nds procuramos uma seqüência finita de funções de controle n- C^u ,f* , , . . , /u _ 3 , também denominada de política, que maximiza o retorno total ao Jongo dos N estágios do sistema. Note que nòs iremos considerar apenas a classe das políticas

* JL

tal que uCx) UCxD, V x eX, isto é, a

V V

classe das políticas f actívei s. Uma política Cu ,... , u 5 pode

O N-l *

ser encarada como um plano que especifica o controle a ser adotado em cada período para todo estado que possa ocorrer naquele período. Dado um estado inicial x , o nosso problema é portanto achar uma política factível fr* C/u ,,..,/u ."> que maximiza a equaç&o funcional:

N-l

sujeito a restrição do sistema de equações

, t= 0,1,. . . ,N- CE?

Como * possível que V Cx ) não atinja um máximo, já que nada garante a priori que tal máximo exista, usaremos "sup" ao inv<*s

(42)

problema em C12-C23 por V Cx ü> = sup V Cx D, onde n é o conjunto d© "max", Desse modo, denominaremos a funç&o valor dtima do nosso problema em C12-C23 por

das políticas factíveis.

Os métodos da Programação Dinâmica se baseiam no Princípio da Oti mal idade de Eellman, que diz o seguinte:

Suponha que C(j , fu , . ., , fj ~) seja uma política títima para C13-C22. Considere o subproblema em que estamos no estado x na

i

época i, CXKN-1 , e desejamos maximizar a equaçüo funcional "que

N- 1

resta" de i até N, £ g [x ,uCx3] + g Cx 3. Então a política

t t t t N N

t = V

"truncada" Cu , u ,... ,u 5 6 também ótima para esse

V i+i N+i

subproblema. "

A proposição abaixo deixa claro como que o valor dtimo da equaçôo funcional em C1D pode ser obtido recursi vãmente a partir de um algoritmo de Programação Dinâmica.

Proposição 2* Seja V Cx 5 o valor ótimo da equação funcional em

Cl}. Então, VCxD=VCx^, onde a função V Cx D ©

o o o o o

dada pela última etapa do algoritmo abaixo, que funciona recursivãmente "de trás para frente", do período N-l até o período O:

Cx)-gCx) C33

N N " N N

V Cx 3= sup <qCx,u3+V IfCx.u)]) C43

ti

*t

i

t

t+i

t

t

t

u e Otx >

t t

(43)

valor ótima V Cx 3 como:

o

V Cx 3= sup V Cx 3> = sup <£ g [x ,/iCx)] + g Cx

O -—Tf O __. ' '. t t NN t=o = sup <g Cx ,fj Cx ?] + g tx ,/j Cx o o r o o ^i i i i

ou ainda:

V Cx 3= sup (g Ix ,/j Cx )] + sup CgCx,^Cx."5] + + sup íq [x ,u Cx ?] + . . . + "2 2 2 2

Nas equações acima os supremos s£vo sobre» as funç&es /j tal que «Cx 3 e UCx5, V x e t, e ©st&Q sujeitos

v tf t/ v V

a restrição x = f Cx ,pCx3), t= O, .... N-l . Agora

usemos o fato de que para qualquer função F de x e u tem-se que sup F [x,/Xx3 3 = sup FCx.uD, onde M é o conjunto de todas as funçees t-id*D tal que (jQíO e ÜCx3 V x. Aplicando-se esse fato em CS3, usando-se a restrição x+ = f Cx ,u) e introduzindo-se as funçees YCxJ de C43 em C52 obtém-se o resultado

desejado, isto 4,que V Cx 3= sup <g Cx ,u

)+VCx)>-u fc V < x >

O O

= V Cx D, pois recursi vãmente de trás para frente vem:

V Cx 3=sup<çi Cx ,u ) + sup<. . . + sup <g Cx ,u

O r - O O O ^ ^ VN-Í N-l N-l

u U VI

O 1 N-l

+ VCx)>..,» =

N N

=sup<g Cx ,u 3 + sup<...+ sup<g Cx ,u 0

r CTO O O N-2 N-2 N-Z

u u u

O 1 N-Z

+ V Cx }>...»*■

(44)

= sup<çj Cx , u 3 + V [f Cx ,u 3]> = V Cx

~OOO 1OOO O O

A equação funcional definida em C43> 6 uma vers&o da chamada equação de Bellman.

£• E - Programação Dinâmica Descontadas Convergência, Existência e Unicidadeí

O problema que estaremos considerando agora é uma classe de problema onde o horizonte é infinito e que envolvem equaçSes funcionais descontadas. Em outras palavras, dado um estado inicial x ,o nosso problema agora é encontrar uma polctica n= </j , fj , . . . > com /jQxD e UCxD, V x e X Conde U: X-»X é uma correspondência nao-vazia5 que maximize a equação funcional:

N-i

= lim

E

f?.g tx.^Cx^]

.

C6?

1=O

sujeito a restrição do sistema de equações

x = f Cx , u Z> , t= 0,1 ,S, . . . C73

sendo que a função real g: X«>X ■* \R é dada, e que o fator de desconto (3 satisfaz 0</?<l. Note que a presença do fator de desconto garante que a equação funcional seja finita, dado que os

retornos por estágio sejam limitados.

Para qualquer x e X © polttica ti, a equação funcional V Cx 5 <sm C62 será dada pelo limite das equações funcionais descontadas de horizonte finito, conforme ser d visto mais adiante.

(45)

introduzir-se a seguinte hipdtes© acerca da função de retorno g.

CH.13 A função de retorno g satisfaz

O < gCx,u) < M, V Cx.uJ e X®X C8

onde M é um escalar.

Dessa forma, a função valor títima V dada por V CxD= sup V Cx),

n

V x e X,

onde V

está definida conforme C63,

é bem definida

n

CH.13.

Uma classe d© políticas factíveis particularmente interesant© * a de políticas estacionar ias de forma n- -C/u./j,. . . , ^>, com fj: X -»X tal que /lKxD e UCx5, V x e X. Para tais políticas, a regra para escolha de variáveis de decisão é a mesma em todos os estágios. O problema associado com uma política factível estacionaria <ju, . . , /..j> e um estado inicial x se denotará por:

N-i

V Cx ;= Um £ fí.glx ,/j(.x;j

IA O t» tr

N-»00 l=O

Considere para todo N inteiro positivo o seguinte problema de N estágios obtido truncando—se no N—ésimo estágio o problema de horizonte infinito definido acima. Deseja-se encontrar uma política n- C^í , jU , ... ,/j >, com (J e UCx3, Vx e X, que maximize;

N-l

V

C v ") =

V1

/^^nf^ // Ty 11

no ■ t' t i

n t=o

sujeito a x =fCx,u^ , t=O,...,N-l.

O valor dtimo desse problema é denotado por V Cx 3 © 6 dado por:

NO

V Cx 5 = V Cx 5

(46)

r

onde, para todo N, V Cx ~> 6 dado pelo N-ísimo passo do algoritmo

1*4 O

V Cx3 = O C113

o

V Cx3 = sup < gCx,uI> + p. V [fCx,u5 3> Cl23

u e U< x >

V x e X, t= 0,1 ,. . .

,N-1.-Note que em C112-C1S3 nds invert-eraos os índices das funçS©s valor,

em contraste com o algoritmo C33-C42, de tal forma que o mesmo

procede de valores mais baixos para mais altos.

Definamos também um operador T, para quaisquer funções V: X ■* IR,

p: X -» X com pCxD e UCxJ por:

■ sup < gCx,u3 + (1. V

u e uix)

onde TCVOC.3 * uma transformação que leva uma funçôo V em X em outra função TCV3 em X. Com a notação introduzida em C133, o algoritmo C112-C122 pode ser reescrito como:

V Cx3 = 0 Cl 43

o

3Cx3 , t= 0,1,...

onde Tl é definida, V t e V: X-»K, como TlC\OCx3 = T [ Tt~*C VO 3

(47)

Lema 2t Para quaisquer funções V: X-»R, V: X-»R limitadas, tal que VCX3 < VCxi), V x e X, temos que:

V x e X, t= 0,1,2,...

DEMONSTRAÇÃO: Para qualquer x e u temos .V

< V ífCx,uJ>J, donde obtemos que ígCx,uJ> + /?. V l/Cx.xOJ> <

< < gCx.u; + (3. V ffCx.u.? J>.

Tomando-se o supremo de ambos os lados dessa expressão em relação a u <= UCx^, obtém-se TCV.>Cx.5 < TCV.^Cx.?, V x <e X, ficando a 1- desigualdade provada para t=l.

Similarmente, prova-se para todo t. H

Para quaisquer funçSes V: X -» R e V':X-»R escreveremos V < V'

se VCx3 < V'Cx), V x e X.

Denotaremos ainda por e:

X -♦ R a função

tomando valor 1 em X, isto é: e CxD = 1, V x e X. C163 Temos de C133, para qualquer função V: X -♦ K e qualquer

escalar r ,

TCV+ríCKx} = TCVQCx.") + (3. r , V x e X C17.")

Finalmente estamos em condição de enunciar o teorema abaixo, que diz que a função valor ótima V Cx 3 do problema "truncado" de N estágios converge para o valor dtimo do problema de horizonte infinito. Além disso, esse teorema também diz que o algoritmo C113-C123 [ ouC14^-C155 3 converge para a função valor ótimo V do problema de horizonte infinito para uma função V qualquer inicial limitada.

TeoremaCT. 831 Considere -válido CH.IS>. Então a, função valor ótima V

do probl&ma CÕJ-C72 satisfas

0<

V Cx; <

"

, C/8J>

V X e X,

ond-e M é o mesmo qrue aparece em. C3S>.

Além.

(48)

= lim ^(VJCxJ , V x e X

DEMONSTRAÇÃO: De C83 temos que para qxialquer estado inicial x e X e> toda politica -C (.-t ty , ^ ,...},

N-l N-i CO

Um £ /íífxufx;? < E /5

tf V V

C

V tf V

l

t=O i=O t=N

Tomando-se o supremo sobre <\à , \à ,...} em ambos os

lados vem q>ue> K*Cx3 < V CxJ> + C ^ ;> . «,

V x e X,

//= 0,/,... onde V/ é definido V jY por CHXIZ3 [ou Cl4J>-C 15S>] . Combinando-se essa relaç&o com Cí 1 S> obtém-se CÍS>. Ainda tendo em -vista (82. V CxS><V CxS>

N

V x e X. Combinando-se as duas desigualdades acima

vem que:

K*CxJ>= Um V CxJ),

V x <= X.

'

C^0^

N-+00

Fará uma fvcnçüo arbitrária e limitada V: X-*K, seja r xtm escalar tal axte CK-rePCx^£0. CK+re.>CxJ>>0, V x e X, onde "e" é tal como definido em CÍ6J>. Temos ent&o, aplicando o lema í?? que:

TlCV-r€^CxS> < K CxJ> < ^CV+reJCxl,

V x e X

C^ÍJ>

e1 por (172,

{ f. r

V x <s X.

Tomando-se tini in/ 6> iim. si/p em (é?IS>, e usando-se CEOD oblén<,-s& que:

lim sup TlCV-reJCx2 < V*<xJ < lim sxip V

t-KX) t-*m

lim inf T^CV-nOCxl < V*CxJ < lim inf

t -»oo t ->oo

(49)

lim. supT CV-reS>CxS> = li

l -»co t

lim in/T

t -»oo

t

--lim in/T CV+reJ>CxJ>=lim i\

i -»oo t

Usando essas duas úl ti mas desigualdades C.232 obtém-se:

expressões nas

Cx;= l im, inf portanto

-»CO

V*Cx}= lim

t-»co

Dada qualquer política estacionaria factível podemos considerar o

problema análogo a

C63-C73,

exceto pelo

fato de o conjunto de

restricSes para a variável de controle conter apenas um elemento

para cada estado x, o controle /jCx}, isto ê, é um conjunto da

forma

UCx2=

Í^Cx?>,

V

x

e

X.

Neste

caso

UCx3

deixa

de

ser

uma correspondência, sendo apenas uma funcSo. Esse problema está

política factível, teor ema CT. 83 .

, . . . >, temos o seguinte corolário do

Corolário* O valor V Cx3 da equac3o funcional C6D correspondente a

uma política estacionaria factível

<jU,/J,,..> quando o

estado inicial é x satisfaz 0< V Cx) < M/Cl-/?}.

Além disso, para qualquer função limitada inicial V: X-*R

vai© que V Cx}= lim TlCV5Cx3 , V x e X.

O teorema a seguir nos diz que» a função V é a única solução de uma certa equaçíxo funcional. Essa equação fornece condições para se obter uma política estacionaria dtima.

(50)

TeoremaC T. 93i A fxtnç&o valor ótima V satisfaz-= u sup <g£x,' e u< x > \O + {3. V , V x e X ou eçxtivaleníemeníe, K Cx^ = TCV J><xJ> , V x <e X. di&&&, V é a única soluç&o limi tada da funcional acima.

DEMONSTRAÇÃO: Seja V a funç&o cfxie é identicamente nula em X, isto é, V CxS>-0 , V x e X. Nós temos de

o

e CÍÍJ-CIEO [ov.Ci4^-C15>] que: v cx;< tcv }<x?.,. rcv ;cxj tcv

o o o o

V x e X. Entdo V t e x e X t&m-s& c?ue:

t+1V

[fCx,vS>3? <

u e v < x >

U <E U < X >

Tomando-se o limite à medida qrue> i-»oo e> usancio-se CÍ9J> vem que K CxJ < si<p <"^Cx,xl> * ft.V

ou equivalentemente, V Cx^> < TCV J>CxJ> , V x e X de CBõJ> que ;

<.

..<rlCKWl+1-Tomando—se o limite à medida que t-*<x> e usando—se V' CxJ> < TCK

Portanto, K*Cx; = TCK*^Cx^ , V x «s X.

Fará provarmos a ^/nicidade? bctsda observarmos que se-V e V fossem duas soluç&es limi todas de> C24S> nós

teríamos

enttxo

V t

que

V CxJ> = Tl(V*}Cx}

e>

t

*

*

'

v cxj>=rc/ ;cx; , v x e x.

z z

Pelo teorema CT.8J>, entretanto, teriamos que:

lim TiCV*yCx3 = lim T^CV^Kx? • K*Cx^

,

V x e X,

* * #

(51)

Os principais resultados provados até esse ponto sãío os seguintes: a função valor ótima V , para o problema C63-C73, 6 limitada e é a única solução limitada da equaçdo funcional C243. Além disso, o algoritmo da programação dinâmica Cl 13-C 123 [ ouCl 43-C153 ] converge para a função V , ini ei ando-se as iterações a partir de uma função V qualquer limitada.

Na seçíio seguinte prosseguiremos com outras caracterizações da funç&o valor ótima V .

2. 3 - Outras Caracterizações para a Solução do Problema de BellmarU

Nesta seçSo estaremos considerando a seguinte notação: X é o conjunto dos valores possíveis para as variáveis de estado x ; U: X-+X é uma correspondência tal que para cada x e X, UCxD é o conjunto dos valores possíveis para as variáveis de controle u ; ^Cx3: X-»X é uma função de controle que especifica o controle u = üCx3v X 1/ que ser d escolhido quando o estado for x\f no t-ésimo período, e que deve satisfazer ^jCx) e UCx); A é o gráfico de U,

V V tf

isto é, A= <Cxtu3 e X ® X:

u« uCx? « UCx3>;

g :

A -♦ K

é a

v t V t t i

função de retorno dada por g Cx ,u); O</?<1 é um fator de

V v

desconto; e f Cx , u?=x é uma funçfio de transição.

A partir de agora consideraremos a equaçcio funcional dada por:

■ max <gCx,u3 +ft. V

u e u ( x >

ou ainda,

VCx3 - max <gCx,u3 + ft. V CxD, sujeito a x = fCx.uD = valor do

u e u < x >

Imagem

FIGURA Cl. A3

Referências

Documentos relacionados

Mostre como o algoritmo da subseqüência comum máxima pode ser usado para resolver o problema da subseqüência crescente máxima de uma seqüência numérica..

Mostre como o algoritmo da subsequência comum máxima pode ser usado para resolver o problema da subsequência crescente máxima de uma sequência numérica.

Como fazer para obter uma ABB ótima e não apenas o seu custo. Complete

Exercício: Como fazer para obter uma ABB ótima e não apenas o seu custo. Complete

Mostre que o algoritmo “guloso” óbvio não é capaz, em geral, de encontrar uma subsequência crescente máxima de uma sequência dada. (Algoritmo guloso óbvio: escolha o menor

No dia da Bandeira na Rússia o proprietário de uma loja decidiu decorar a vitrine de sua loja com faixas de tecido das cores branca, azul e vermelha. Ele deseja satisfazer as

Mostre como o algoritmo da subsequência comum máxima pode ser usado para resolver o problema da subsequência crescente máxima de uma sequência numérica. Dê uma delimitação justa,

Mostre como o algoritmo da subsequência comum máxima pode ser usado para resolver o problema da subsequência crescente máxima de uma sequência numérica.