• Nenhum resultado encontrado

Jogos diferenciais estocásticos: controle e parada ótimos

N/A
N/A
Protected

Academic year: 2021

Share "Jogos diferenciais estocásticos: controle e parada ótimos"

Copied!
56
0
0

Texto

(1)

Universidade Federal da Para´ıba

Centro de Ciˆ

encias Exatas e da Natureza

Programa de P´

os–Gradua¸

ao em Matem´

atica

Mestrado em Matem´

atica

Jogos diferenciais estoc´

asticos:

controle e parada ´

otimos

Alan Teixeira Nic´

acio de Messias

Jo˜

ao Pessoa – PB

(2)

Universidade Federal da Para´ıba

Centro de Ciˆ

encias Exatas e da Natureza

Programa de P´

os–Gradua¸

ao em Matem´

atica

Mestrado em Matem´

atica

Jogos diferenciais estoc´

asticos:

controle e parada ´

otimos

por

Alan Teixeira Nic´

acio de Messias

sob a orienta¸c˜ao do

Prof. Dr. Alberto Masayoshi Faria Ohashi

Jo˜

ao Pessoa – PB

Agosto de 2018

(3)
(4)
(5)

Voltei-me, e vi debaixo do

sol que n˜

ao ´

e dos ligeiros

a carreira, nem dos fortes

a batalha, nem tampouco

dos s´

abios o p˜

ao, nem

tam-pouco dos prudentes as

ri-quezas, nem tampouco dos

entendidos o favor, mas que

o tempo e a oportunidade

ocorrem a todos.

(6)

Agradecimentos

Agrade¸co em primeiro lugar a meu Deus, pela finaliza¸c˜ao bem sucedida de mais uma etapa de minha vida. Agrade¸co muito a meu orientador, pois me orientou n˜ao apenas nessa disserta¸c˜ao mas na vida profissional e carreira acadˆemica; agrade¸co tamb´em pelas conversas, nos fins das reun˜oes, sobre economia brasileira, situa¸c˜ao fiscal do estado brasileiro e a nova crise financeira mundial em curso (suspeito que estes temas tenham me feito parecer meio paran´oico n˜ao s´o `a meu orientador mas ao departamento em geral).

E como menssagem a todos aqueles que querem ser pesquisadores, que querem manter a chama do desejo pela pesquisa acesa eu digo: sempre mantenham em suas mentes perguntas as quais vocˆes queiram realmente obter a resposta.

(7)

Resumo

Neste trabalho analisamos um jogo diferencial estoc´astico de soma-zero n˜o Mar-koviano, atrav´es da teoria dos martingales. H´a dois jogadores, chamados controller e stopper, que controlam o jogo atrav´es de controles estoc´asticos, chamadas estrat´egias e tempos de parada respectivamente. Nosso objetivo ´e provar: que para cada instante de tempo o jogo tem um valor e que o jogo tem um ponto de cela. Este trabalho ´e baseado no artigo de Ioannis Karatzas e Ingrid-Mona Zamfirescu [1].

(8)

Abstract

In this work, we analyze a zero-sum non-Markovian stochastic differential game via martingale methods. The stochastic game consists of two players, namely the controller and stopper which keep track the game via stochastic controls summarized by strategies and stopping times respectively. Our main goal is to prove the game has a value and it admits a saddle point. Our work is based on Karatzas & Ingrid-Mona Zamfirescu’s paper [1].

(9)

Conte´

udo

Introdu¸c˜ao 1

1 O que estudamos 3

1.1 Jogo Diferencial Estoc´astico . . . 3 1.2 O Problema de Otimiza¸c˜ao e a fun¸c˜ao Hamiltoniana . . . 5 1.3 Exemplo de aplica¸c˜ao . . . 6

2 O jogo 8

2.1 O modelo (o “tabuleiro”, as “pe¸cas” e as “regras”) . . . 8 2.2 Como funciona o jogo (como jogar) . . . 10 2.3 Dividir e conquistar . . . 11

3 O valor do jogo 16

3.1 Vamos jogar . . . 16

4 Encontrando os pontos de cela 27

4.1 Caracteriza¸c˜ao . . . 27 4.2 Otimizando o controle . . . 32 4.3 O “equil´ıbrio” do jogo . . . 34

A Resultados Usados 40

(10)

Nota¸

oes

A seguir, listamos algumas nota¸c˜oes utilizadas neste trabalho.

• Dado t ∈ R para cada ω ∈ Ω, lim inf

s↓t J (s, τ ) = lim infs∈Q,s≥tJ (s, τ ). Aqui J (s, τ ) ´e como

na equa¸c˜ao 2.11.

• a ∨ b = max{a, b}; • a ∧ b = min{a, b};

• X =↓n Xn q.c. significa X ≤ Xn q.c. e lim

n→∞Xn= X q.c.;

(11)

Introdu¸

ao

A pesquisa moderna em teoria dos jogos come¸ca com o artigo de Von Newman de 1928 sobre solu¸c˜oes de jogos de soma zero [17]. O trabalho de Newman com jogos de soma zero culminaria no livro Theory of Games and Economic Behavior [18], escrito em 1944 em parceria com o economista Oskar Morgenstern. At´e o fim dos anos 40 os avan¸cos na teoria haviam focado apenas em jogos de soma zero com dois jogadores, mas em 1950 John Forbes Nash demonstrou em sua tese de doutorado [19] que qualquer jogo, n˜ao necessariamente de soma zero, com uma quantidade finita qualquer de jogadores e com uma matriz de payoffs tem um equil´ıbrio de Nash. Por´em, at´e esse momento os jogos estudados tinham um n´umero finito de estrat´egias para cada jogador, al´em de que todo o ambiente era discreto: estrat´egias, payoffs, o funcionamento do jogo, etc.

As pesquisas em jogos diferenciais tˆem in´ıcio com o trabalho de Rufus Isaacs en-quanto trabalhava para RAND Corporation. Esses primeiros estudos apareceram em memorandos da RAND em 1951 [6]. Os primeiros problemas estudados foram pro-blemas do tipo “perseguidor-evasor”, o interesse na ´epoca era a aplica¸c˜ao no desen-volvimento de sistemas e m´etodos de defesa de m´ısseis. Tamb´em nesse momento a pesquisa em teoria do controle ´otimo estoc´atico estava surgindo com os trabalhos Lev Pontryagin [8] e Richard Bellman [9]

Nos anos 60 come¸cam as pesquisas em teoria dos jogos diferenciais estoc´asticos sendo um dos primeiros trabalhos feito por Yu-Chi Ho em 1966 [7]. O trabalho analisa estrat´egias e manobras de evas˜ao de aeronaves e t´ecnicas de guiamento de m´ısseis. A aplicabilidade dos jogos diferenciais estoc´asticos e da an´alise de controle ´otimo estoc´ as-tico alcan¸cou diversas ´areas de pesquisa sendo a ´area de Quantitative Finance uma das que recebeu mais contribui¸c˜oes. Um dos primeiros problemas resolvidos utilizando-se destas teorias foi o problema de otimiza¸c˜ao de portif´oleo de Merton em 1969 [20].

Neste trabalho fazemos uma profunda e detalhada an´alise do artigo [1]. Neste o au-tor constroi um jogo diferencial estoc´astico de soma zero n˜ao-Markoviano, repesentado por seu estado (Xt)0≤t≤T, a partir de uma equa¸c˜ao diferencial estoc´astica utilisando-se

(12)

estrat´egias e regras de parada. Da´ı seguimos para dois problemas formulados sobre o processo de valor do jogo V (t), cujas as solu¸c˜oes s˜ao os objetivos do artigo.

Os problemas s˜ao provar que V (t) existe para todo t e que o jogo tem um ponto de cela.

O texto est´a organizado da seguinte maneira:

• Cap´ıtulo 1: ´E apresentado o tipo de problema tratado na teoria dos jogos dife-renciais estoc´asticos;

• Cap´ıtulo 2: ´E apresentado o modelo de jogo sobre o qual desenvolvemos este trabalho;

• Cap´ıtulo 3: ´E feita a an´alise do processo de valor do jogo; • Cap´ıtulo 4: ´E construido um ponto de cela para o jogo;

• Apˆendice (Resultados Usados): Uma lista de resultados utilizados ao longo do trabalho.

Como pr´e-requisitos para este trabalho recomendamos que o leitor esteja familiari-zado com a teoria das probabilidades e que conhe¸ca um pouco da teoria dos martingales e C´alculo de Itˆo; como referˆencias indicamos [4], [22] e [5].

(13)

Cap´ıtulo 1

O que estudamos

Na teoria dos jogos diferenciais n˜ao existem defini¸c˜oes e resultados gerais para todos os modelos de jogos. H´a, no m´aximo, alguns conceitos em comum aos modelos. Por isto, neste cap´ıtulo n˜ao temos a inten¸c˜ao de trazer uma introdu¸c˜ao resumida da teoria, nem apresentar resultados de conte´udos preliminares, mas apenas fornercer ao leitor uma pequena vis˜ao do que ´e feito na teoria: an´alise de modelos de jogos. Devido a isto n˜ao escolhemos para o t´ıtulo do cap´ıtulo termos usuais como “Preliminares”. Vamos descrever o modelo de jogo apresentado nos cap´ıtulos 3 e 5 de [2], escolhemos este modelo por ser simples e por apresentar v´arios dos conceitos em comum com outros modelos de jogos. Para o leitor interessado em conhecer outros tipos de jogos diferenciais recomendamos [3].

1.1

Jogo Diferencial Estoc´

astico

Considere um movimento Browniano m−dimensional W = (Wt)0≤t≤T, sobre um

espa¸co de medida (Ω, F , P), equipado com a filtragem F = (Ft)t≤t≤T gerada pelo

movi-mento Browniano. Tome A um espa¸co m´etrico compacto e A sua σ-´algebra de Borel, chamaremos A o conjunto de a¸c˜oes do jogador.

Considere b : [0, T ] × Ω × Rn × A → Rn

e σ : [0, T ] × Ω × Rn× A → Rn

× Rm

sastifazendo as seguintes propriedades:

1. b e σ s˜ao P × B(Rm) × A−mensur´aveis, onde P ´e a σ-´algebra dos subconjuntos

de [0, T ] × Ω F-progressivamente mensur´aveis, 2. ∃ C > 0 tal que

(14)

1. O que estudamos

3. Para cada x ∈ Rn e α A,

E[R0T||b(t, x, α)||

2ds] < e

E[R0T||σ(t, x, α)||2ds] < ∞.

O processo σ ´e chamado volatilidade e b “drift ”, nas rela¸c˜oes acima consideramos σ um vetor.

As estrat´egias admiss´ıveis s˜ao processos da forma α = (α)0≤t≤T que tomam valores

em A e satisfazem: 1. α ´e P-mensur´avel, 2. E[R0T||b(t, 0, αt)||

2dt + ||σ(t, 0, α

t)||2dt] < ∞.

O conjunto de estrat´egias admiss´ıveis ser´a denotado por A. Chamaremos de estado do jogo com apenas um jogador ao processo de Itˆo X = (Xt)0≤t≤T, com Xt ∈ Rn,

satisfazendo

(

dXt= b(t, Xt, αt)dt + σ(t, Xt, αt)dWt,

X0 = x0 ∈ Rd.

(1.1)

Esta equa¸c˜ao diferencial estoc´astica ´e chamada dinˆamica do estado do jogo. Por A.1 no apˆendice, para cada estrat´egia admiss´ıvel α existe um ´unico processo X = (Xt)0≤t≤T

que satisfaz (1.1).

Suponha agora que h´a k jogadores. Os processos da forma α = (α1, ..., αk), onde

αi ´e uma estrat´egia admiss´ıvel para o jogador i, s˜ao chamados perfis de estrat´egias

admiss´ıveis. Neste caso consideramos A = A1 × ... × Ak e A = A1 × ... × Ak. Dado

o perfil de estrat´egia α = (α1, ..., αk), quando escrevemos (α−i, βi) estamos indicando

o mesmo perfil de estrat´egia mas com a i-´esima estrat´egia admiss´ıvel trocada pela estrat´egia admiss´ıvel βi. Analogamente para a k-upla de a¸c˜oes (α1t, ..., αkt).

Para cada jogador i temos um movimento Browniano Wi = (Wi

t)0≤t≤∞ com Wti ∈

Rmi, um drift bi : [0, T ] × Rm × Ai → Rmi e uma volatilidade σi : [0, T ] × Rm× Ai →

Rm2i, m = m1 + ... + mk. Al´em disso o estado do jogo ´e dada pelo processo de Itˆo

X = (X1, ..., Xk), com X0 ∈ Rm, e X0 = (x10, ..., xk0), tal que dXti = bi(t, Xt, αit)ds +

σi(t, Xt, αit)dWti ´e a dinˆamica do estado do jogo para o jogador i.

Utilizando a nota¸c˜ao de matrizes podemos escrever

Xt=     Xt1 .. . Xk t     , Wt=     Wt1 .. . Wk t     , b(t, x, α) =     b1(t, x, α) .. . bk(t, x, α)     e σ(t, x, α) =        σ1(t, x, α) 0 . . . 0 0 σ2(t, x, α) . . . 0 . .. . .. . .. . .. 0 0 . . . σk(t, x, α)       

(15)

1. O que estudamos

sendo a ´ultima matriz uma matriz de blocos. Da´ı,

dXt= b(t, Xt, α)dt + σ(t, Xt, α)dWt.

1.2

O Problema de Otimiza¸

ao e a fun¸

ao

Hamil-toniana

Sejam g : Ω×Rn→ R limitada e F

T×B(Rn)−mensur´avel e f : [0, T ]×Ω×Rn×A →

R uma fun¸c˜ao que satisfaz as mesmas condi¸c˜oes do drift b. Chamaremos g(XT) de custo

terminal e f de custo corrente.

Para cada α ∈ A, definimos o custo funcional para um jogo de um ´unico jogador como sendo J(α) = E Z T 0 f (t, Xt, αt)dt + g(XT)  . (1.2)

O objetivo do jogador ´e minimizar J. Em um jogo com um ´unico jogador, o pro-blema de minimizar J ´e um problema de controle ´otimo estoc´astico. No caso de k jogadores temos para cada jogador i = 1, ..., k um custo terminal gi(XT), um custo

corrente fi e um custo funcional Ji(α) = EhR0T fi(t, ω, Xt, αt)dt + gi(XT)

i .

Defini¸c˜ao 1.1. Um jogo com dois jogadores ´e dito ser de soma zero se J1(α) = −J2(α) para todo perfil de estrat´egia α ∈ A. Neste caso escrevemos J := J1 como o custo funcional do jogo.

Defini¸c˜ao 1.2. Um perfil de estrat´egia α∗ = (α∗,1, ..., α∗,n) ´e dito ser um equil´ıbrio de Nash para o jogo se para todo i e para todo αi ∈ Ai Ji(α∗) ≤ Ji(α∗,−i, αi).

Ou seja, um perfil de estrat´egia ´e um equil´ıbrio de Nash se nenhum jogador se beneficia mudando de estrat´egia individualmente.

Defini¸c˜ao 1.3. Dados a volatilidade σ e o drift b do estado (Xt)0≤t≤T de um jogo,

podemos definir um tipo de fun¸c˜ao, chamada fun¸c˜ao Hamiltoniana, da seguinte maneira H : [0, T ] × Ω × Rn× Rn× Rn×m× A → R dada por H(t, ω, x, y, z, α) = σ(t, ω, x, α) •

z + hb(t, ω, x, α), yi + f (t, ω, α).

Onde f ´e o custo corrente, σ e z s˜ao matrizes n × m, a opera¸c˜ao • ´e dado por tr[σ(t, ω, x, α)>· z] e a opera¸c˜ao em h, i ´e o produto interno euclidiano de Rn.

No caso particular em que apenas o drift depende das a¸c˜oes do jogador a Hamilto-niana ´e dada por H(t, ω, x, y, α) = b(t, ω, x, α)y + f (t, ω, x, α)

(16)

1. O que estudamos

Defini¸c˜ao 1.4. Dado o custo funcional J de um jogo de dois jogadores de soma zero, definimos o valor superior e o valor inferior do jogo como sendo respectivamnete.

V = inf α∈A1 sup β∈A2 J(α, β) V = sup β∈A2 inf α∈A1J(α, β).

1.3

Exemplo de aplica¸

ao

Quantitative Finance ´e uma ´area de conhecimento onde podemos encontrar uma grande quantidade de problemas cujas solu¸c˜oes provem da teoria de controle estoc´ as-tico e da teoria dos jogos. S˜ao v´arios os tipos de problemas: minimiza¸c˜ao de riscos, maximiza¸c˜ao de utilidades, precifica¸c˜ao, constru¸c˜ao de hedge, etc. Apresentaremos, de modo resumido e sem solu¸c˜ao, um problema cl´assico.

O problema de portif´olio de Mertron (Exemplo 3.2 do cap´ıtulo 2 de [10])

Este foi um dos primeiros problemas de finan¸cas solucionado com o emprego de controle estoc´astico. Ele foi apresentado e solucionado em 1969 pelo economista Robert C. Merton. O problema trata da otimiza¸c˜ao de investimentos em assets.

stock : qualquer posse com valor com a qual o propiet´ario espera obter algum bene-f´ıcio, por exemplo a¸c˜oes de empresas.

Suponha que em um mercado h´a n + 1 assets sendo negociadas no intervalo de tempo [0, T ], as assets 1, ..., n s˜ao chamadas stocks, o pre¸co do i-´esimo stock ´e dado pela equa¸c˜ao diferencial estoc´astica seguinte:

(

dPi(t) = Pi(t){bi(t)dt + hσi(t), W (t)i},

Pi(t) = Pi(0) > 0.

t ∈ [0, T ]

Onde bi : Ω × [0, T ] → R, bi(t) > 0, ´e chamada taxa de aprecia¸c˜ao e σi : Ω × [0, T ] →

Rm´e a volatilidade do stock e W : Ω × [0, T ] → Rm ´e um movimento browniano. Todos estes processos est˜ao definidos em um espa¸co de probabilidade (Ω, F , (Fs)0≤s≤T) e s˜ao

adaptados a (Fs)0≤s≤T. A presen¸ca do movimento browniano simboliza a aleatoriedade

dos pre¸cos dessas assets e por isso elas s˜ao consideradas arriscadas.

A 0-´esima asset ´e chamada bond, ela ´e a ´unica que n˜ao traz risco e seu pre¸co ´e dada pela seguinte equa¸c˜ao diferencial estoc´astica:

(

dP0(t) = r(t)P0(t)dt,

P0(0) = x0 > 0

q.c. t ∈ [0, T ].

A cada instante t ∈ [0, T ] um investidor tem uma riqueza X(t) distribuida nas assets e, para cada i, uma quantidade Ni(t) da asset i. Assim X(t) =

n

X

i=0

(17)

1. O que estudamos

riqueza investida na asset i ´e dada por ui(t) = Ni(t)Pi(t). O portif´olio do investidor ´e

o processo vetorial u(t) = (u0(t), ..., un(t)). Suponha que existe uma taxa de retirada,

c(t), de recursos desses investimentos para consumo.

Temos ent˜ao o seguinte problema, o investidor deve escolher um portif´olio u(t) e uma taxa de retirada c(t) de modo que X(t) > 0 e que

J (u, c) = E Z T 0 exp−γtφ(c(t))dt + exp−γTh(X(T ))  .

seja m´axima. Aqui φ(c(t)) ´e a utilidade instatˆanea pelo consumo c(t) e exp−γTh(x, T ) ´e a utilidade descontada.

(18)

Cap´ıtulo 2

O jogo

2.1

O modelo (o “tabuleiro”, as “pe¸

cas” e as

“re-gras”)

Considere Ω = (C[0, T ], Rn), o espa¸co das fun¸c˜oes cont´ınuas de [0, T ] em Rn e

a medida de probabilidade de Wiener P. Tome ent˜ao sobre o espa¸co (Ω, P) o mo-vimento browniano padr˜ao W = (Wt)0≤t≤T dado por W (t, ω) = ω(t) e a filtragem

(FW

t )0≤t≤T gerada pelo movimento browniano. Escrevemos F = (Ft)0≤t≤T para a

fil-tragem P−aumentada de (FW

t )0≤t≤T e ||ω||∗t:= sup 0≤s≤t

|ω(s)|, ω ∈ Ω, 0 ≤ t ≤ T . A.2 no apˆendice garante que W ainda ´e movimento browniano sobre F. Aqui, P ´e a σ−´algebra de [0, T ] × Ω dos subconjuntos previz´ıveis.

S ser´a o conjunto de aplica¸c˜oes mensur´aveis da forma τ : Ω → [0, T ] tais que {τ ≤ t} ∈ Ft, 0 ≤ t ≤ T , chamadas regras de parada. Perceba que se t ∈ [0, T ] ent˜ao

t ∈ S. Dadas duas regras de parada ν, τ tais que ν ≤ τ q.c. denotamos por Sν,τ o

conjunto de regras de parada ρ tais que ν ≤ ρ ≤ τ q.c.

A volatilidade ser´a uma aplica¸c˜ao σ : [0, T ] × Ω → M(Rn, Rn), onde M(Rn, Rn) ´e

o espa¸co das matrizes n × n, P−mensur´avel e tal que para todo (t, ω) ∈ [0, T ] × Ω σ(t, ω) seja n˜ao-singular. Al´em disso vamos exigir o seguinte:

• ∃ C > 0 tal que

|σi,j(t, ω) − σi,j(t, ω)| ≤ C||ω − ω0||∗t,

∀t ∈ [0, T ]; ∀ω, ω0 ∈ Ω

• ∀(t, ω) ∈ [0, T ] × Ω, ||(σ)−1(t, ω)|| ≤ C.

Aqui (σ)−1(t, ω) ´e a inversa de (σ)(t, ω) (aqui tomamos a matriz como um vetor e a norma euclideana). Sob estas hip´oteses e por A.3 no apˆendice existe uma ´unica

(19)

2. O jogo

solu¸c˜ao, X = (Xt)0≤t≤T, para a seguinte equa¸c˜ao diferencial estoc´astica,

(

dXt= σ(t, X)dWt,

X0 = x0 ∈ Rn

; 0 ≤ t ≤ T. (2.1)

Al´em disso, a filtragem P−aumentada natural gerada por X coincide com F. O conjunto de estrat´egias admiss´ıveis, as quais chamaremos apenas de estrat´egias, ´e A e as estrat´egias s˜ao processos do tipo α : [0, T ] × Ω → A. Onde A ´e um espa¸co m´etrico separ´avel e uni˜ao enumer´avel de subconjuntos n˜ao vazios compactos sobre o qual est´a definida a σ−´algebra A de Borel.

Assumimos que o drift b : [0, T ] × Ω × A → Rn ´e P × A−mensur´avel e satisfaz o seguinte:

• ∃ K > 0 tal que ∀ (t, ω, α) ∈ [0, T ] × Ω × A, ||b(t, ω, x, α)|| ≤ K(1 + ||ω||∗ t);

• Para cada α ∈ A, (t, ω) → b(t, ω, α) ´e previz´ıvel.

Pelas hip´oteses assumidas e por A.4 no apˆendice concluimos que, para cada α ∈ A, o processo exponencial Λαt = exp Z t 0 hσ−1(s, X)b(s, X, αt), dWsi − 1 2 Z t 0 ||σ−1(s, X)b(s, X, αs)||2ds  ; 0 ≤ t ≤ T. (2.2) ´e um martingale. Al´em disso podemos definir uma medida de probabilidade Pα como:

Pα(B) := E[ΛαT · 1B], B ∈ FT.

Portanto, pelo teorema de Girsanov (A.7 no apˆendice),

Wtα = Wt+

Z t

0

σ−1(s, X)b(s, X, αs) ; 0 ≤ t ≤ T. (2.3)

´e um movimento Browniano na medida Pα adaptado `a F.

Portanto, por (2.1) e (2.3) chegamos a

Xt = x0+ Z t 0 b(s, X, αs)ds + Z t 0 σ−1(s, X)dWsα 0 ≤ t ≤ T. (2.4)

Este ser´a o nosso processo de estado do jogo. Note que as estrat´egias n˜ao interferem na volatilidade.

(20)

2. O jogo

2.2

Como funciona o jogo (como jogar)

Vamos exigir que o custo corrente f : [0, T ] × Ω × A → R satisfa¸ca as mesmas propriedades do drift b exceto que |f (t, ω, α)|≤ K. O custo terminal ser´a dado por g : Rn → R limitada e cont´ınua.

O jogo funciona da seguinte maneira: o jogador “controller ” escolhe uma estrat´egia admiss´ıvel α e da´ı o jogador “stopper ” escolhe uma regra de parada τ , ent˜ao o stopper recebe do controller uma quantia Yα(τ ) ≡ Yα(0, τ ), onde

Yα(t, τ ) := g(Xτ) +

Z τ

t

f (s, X, αs)ds; τ ∈ St,T. (2.5)

Obs.: quando escrevemos t estamos nos referindo `a uma regra de parada, a qual n˜ao ´e necessariamente determin´ıstica. Por outro lado, quando escrevemos t estamos nos referindo `a um ponto do intervalo [0, T ].

Defini¸c˜ao 2.1. O valor superior e o valor inferior do jogo s˜ao, respectivamente: V := inf α∈Asupτ ∈S E α [Yα(τ )]. (2.6) V := sup τ ∈S inf α∈AE α[Yα(τ )]. (2.7)

Perceba que, por g, f serem limitadas os valores s˜ao finitos. Podemos checar facil-mente, usando redu¸c˜ao ao absurdo por exemplo, que V ≥ V . Se V = V ent˜ao dizemos que o jogo tem um valor o qual denotamos por V = V = V .

O objetivo do controller ´e minimizar Eα[Yα(τ )] enquanto que o stopper quer ma-ximizar. Podemos pensar as regras de parada como sendo um tipo de estrat´egia, definirmos J1(α, τ ) = J(α, τ ) = Eα[Yα(τ )], J2(α, τ ) = −J(α, τ ) e definirmos J1 e

J2 como sendo os custos funcionais do controller e do stopper respectivamente. Dessa forma temos um jogo com dois jogadores e de soma zero semelhante ao apresentado no cap´ıtulo 1.

Defini¸c˜ao 2.2. Um par (α∗, τ0) ´e dito ser ponto de cela se Eα∗[Yα∗(τ )] ≤ Eα∗[Yα∗(τ0)] ≤ Eα[Yα(τ0)] ∀ (α, τ ) ∈ A × S.

Note que os pontos de cela funcionam como equil´ıbrios de Nash, pois se (α∗, τ0) ´e ponto de cela ent˜ao J1(α∗, τ0) = Eα∗[Yα∗0

)] ≤ Eα[Yα0)] = J1(α, τ0) e J2, τ0) =

[Yα∗0

)] ≤ Eα∗[Yα∗(τ )] = J2, τ )

(21)

2. O jogo

Demonstra¸c˜ao. Seja (α∗, τ0) ponto de cela, se por absurdo tiv´essemos inf

α∈Asupτ ∈SE α[Yα(τ )] > sup τ ∈S inf α∈AE α[Yα(τ )], ent˜

ao para alguma β ∈ A inf

α∈Asupτ ∈S E α[Yα

(τ )] > Eβ[Yβ(τ0)]. Da´ı,

para algum τ ∈ S Eα[Yα(τ )] > Eα[Yα(τ0)], uma contradi¸c˜ao. 

No ´ultimo cap´ıtulo mostraremos que, com algumas poucas hip´oteses a mais so-bre o drift e o custo funcional, o jogo tem um ponto de cela. Por A.5 no apˆendice temos Eα[Yα(t, τ )|F

t] = E[Y

α(t, τ )Λα(t)|F t]

E[Λα(t)|Ft]

. Ou seja, podemos escrever cada espe-ran¸ca condicional sobre uma ´unica medida de probabilidade (P), portanto faz sentido definirmos o seguinte.

Defini¸c˜ao 2.3. O processo de valor inferior e o processo de valor superior s˜ao definidos, respectivimente, por: V (t) = ess sup τ ∈St,T ess inf α∈A E α[Yα(t, τ )|F t]. (2.8) V (t) = ess inf

α∈A ess supτ ∈St

,T

Eα[Yα(t, τ )|Ft]. (2.9)

Como FW

0 = {∅, Ω} e como a diferen¸ca entre F0W e F0 s˜ao subconjuntos de Ω de

me-dida de Wiener nula ent˜ao, quase certamente, Eα[Yα(0, τ )|F0] = Eα[Yα(0, τ )|F0W] =

Eα[Yα(0, τ )]. Portanto, quase certamente, V (0) = V e V (0) = V (0).

Como g(Xt) ´e Ft-mensur´avel ent˜ao g(Xt) = Eα[g(Xt)|Ft] q.c. para toda a estrat´

e-gia α ∈ A. Temos tamb´em que g(Xt) = g(Xt) +

Rt

t f (s, X, αs)ds para toda estrat´egia

α, logo g(Xt) = Eα[g(Xt)+

Rt

t f (s, X, αs)ds|Ft] = E

α[Yα|F

t] q.c. para toda estrat´egia

α ∈ A. Portanto g(Xt) = ess inf α∈A E

α

[Yα(t, t)|Ft] q.c. e tamb´em g(Xt) ≤ V (t) q.c..

Al´em disso, podemos facilmente verificar que V (t) ≤ V (t) q.c..

2.3

Dividir e conquistar

Como os pontos de cela s˜ao pontos de otimiza¸c˜ao de um processo que envolve a escolha de estrat´egias e tempos de parada, utilisaremos como metodologia para encon-trarmos um ponto de cela algo semelhante aquilo que na heur´ıstica ´e chamada divide and conquer. Vamos come¸car a tratar o problema a partir de duas perspectivas di-ferentes: controle ´otimo estoc´astico e tempo de parada ´otimo. Ao fim do trabalho o leitor ver´a que o problema original ser´a resumido a um problema de controle ´otimo. Defini¸c˜ao 2.4. Definimos um intervalo estoc´astico como sendo

(22)

2. O jogo

Lembre que sobre o espa¸co [0, T ]×Ω estamos considerando a σ-´algebra dos conjuntos P−mensur´aveis. Estamos tamb´em considerando como medida de probabilidade neste espa¸co a medida produto L × P, onde L ´e a medida de probabilidade de Lebesgue do intervalo [0, T ].

Dada uma regra de parada t ∈ S definimos para cada τ ∈ St,T o custo m´ınimo

condicional esperado como sendo

J (t, τ ) = ess inf

α∈A E

α[Yα(t, τ )|F

t]. (2.11)

Note que V (t) = ess sup

τ ∈St,T

J (t, τ ).

A Proposi¸c˜ao a seguir ´e um resultado cl´assico, por isso n˜ao vamos prov´a-la aqui. Por´em, logo a seguir o enunciado faremos uma pequena considera¸c˜ao sobre ela. O leitor interessado pode encontrar a prova original, em [14].

Proposi¸c˜ao 2.2. Para cada α ∈ A o processo

Ψ(t, τ ) := J (t, τ ) + Z t

0

f (s, X, αs)ds. (2.12)

´e um Pα−submartingale

Dado t ∈ [0, T ] seja A[t,T ] a restri¸c˜ao de A ao intervalo [t, T ] (estrat´egias admiss´ıveis

restritas ao intervalo [t, T ]). A aplica¸c˜ao da proposi¸c˜ao acima depende de que para cada t ∈ [0, T ] a fam´ılia {Eα[Yα(t, τ )|F

t], α ∈ A[t,T ]} tenha a seguinte propriedade:

Defini¸c˜ao 2.5. Uma fam´ılia (Xi)i∈I tem a propriedade lattice se para todo par de

´ındices i, j ∈ I existe um ´ındice k ∈ I tal que Xk ≤ Xi∧ Xj q.c.

Vamos ent˜ao provar a propriedade lattice.

Proposi¸c˜ao 2.3. Para cada t ∈ [0, T ] a fam´ılia {Eα[Yα(t, τ )|F

t], α ∈ A[t,T ]} tem a

propriedade lattice.

Demonstra¸c˜ao. Sejam α, β ∈ A[t,T ]. Tome ent˜ao B = {ω; Eα[Yα(t, τ )|Ft] ≤ Eβ[Yβ(t, τ )|Ft]}.

Defina γ(s, ω) = ( α(s, ω) se ω ∈ B, β(s, ω) se ω ∈ Bc. Temos Eγ[Yγ(t, τ )|F t] ≤ Eα[Yα(t, τ )|Ft] ∧ Eβ[Yβ(t, τ )|Ft]. 

Para cada estrat´egia α ∈ A definimos a recompensa m´axima condicional esperada como sendo

Zα(t) := ess sup

τ ∈St,T

(23)

2. O jogo

que pode ser obtida pelo jogador stopper de t em diante. Bem como o custo acumulado

Qα(t) := Z(t) + Z t

0

f (s, ω, αs)ds. (2.14)

Perceba que V (t) = ess inf

α∈A Z α

(t) e que Zα(t) ≥ Yα(t, t) = g(Xt). Vamos agora

proceder para mostrar que V (t) se comporta como um limite.

Defini¸c˜ao 2.6. Dada α ∈ A, como os processos g(Xs)s, Z(s)s s˜ao adaptados ent˜ao

para cada t ∈ S e  > 0 definimos a seguinte regra de parada

τtα() := inf{s ∈ [t, T ] : g(Xs) ≥ Zα(s) − }, τtα := τ α t (0).

Note que para cada t ∈ S e ω ∈ Ω, T pertence ao conjunto {s ∈ [t, T ] : g(Xs) ≥

(s) − },  > 0. Al´em disso, [0, T ] ´e limitado ent˜ao estas regras de parada est˜ao bem

definidas.

Defini¸c˜ao 2.7. Dado um processo adaptado e cont´ınuo a direita (Zt)t≥0 que satisfaz

Zt≥ 0 para todo t ≥ 0 e E[suptZt] < ∞. Seja Ut= ess sup τ ∈S[t,∞)

E[Zτ|Ft]. O envelope Snell

de Z = (Zt)t≥0 ´e a modifica¸c˜ao cont´ınua a direita de U = (Ut)t≥0.

Precisaremos tamb´em dos dois seguintes resultados cl´assicos que podem ser encon-trados em [15] no apˆendice D.

Proposi¸c˜ao 2.4. Para cada α ∈ A o processo (Qα(s))0≤s≤T ´e Pα−supermartingale,

c`adl`ag e o menor supermartingale que majora Yα(·), ou seja, ´e envelope Snell de Yα(·). Proposi¸c˜ao 2.5. Para quaisquer regras de parada t, ν, θ com t ≤ ν ≤ θ ≤ τtα temos Eα[Qα(θ)|Fν] = Qα(ν) q.c.; em partircular Qα(· ∧ τ0α) ´e Pα−martingale. Al´em disso

(t) = Eα[Yα(t, τα

t )|Ft] q.c.

Um lema que tamb´em nos ser´a muito ´util ´e o seguinte:

Lema 2.6. Suponha que t, θ s˜ao regras de parada tais que 0 ≤ t ≤ θ ≤ T . Dadas α, β ∈ A

i ) Se α = β em quase todo ponto de [[t, θ]] ent˜ao para qualquer vari´avel aleat´oria Ξ limitada e Fθ-mensur´avel,

(24)

2. O jogo

ii ) Dado B ∈ Ft, se α = β em quase todo ponto de {(r, ω); t(ω) ≤ r ≤ θ(ω), ω ∈ B},

ent˜ao a equa¸c˜ao de (i) vale em B.

Demonstra¸c˜ao. i) A partir de (2.2) definimos Λα(t, θ) := Λ

α(θ)

Λα(t). Sabemos que Q

definida por dQ = Λα

TdP ´e uma medida de probabilidade equivalente a P. Al´em disso

Qt definida por dQt = Λαt dP ´e a restri¸c˜ao de Q a Ft.

Seja A ∈ Ft, Z A Eα[Λα(t, θ)|Ft]dQ = Z A Eα Λ α θ Λα t |Ft  dQ = Z A Eα Λ α θ Λα t |Ft  dQt = = Z A Λα θ Λα t dQt = Z A Λα θ Λα t ΛαtdP = Z A ΛαθdP = Z A 1dQθ = Z A 1dQ.

Logo, pela defini¸c˜ao de esperan¸ca condicional Eαα(t, θ)|F

t] = 1 q.c. Por A.5 no

apˆendice temos:

Eα[Ξ|Ft] = E[Λ α(θ)Ξ|F t] E[Λα(θ)|Ft] = Λ α(t)E[Λα(t, θ)Ξ|F t] Λα(t)E[Λα(t, θ)|F t] = E[Λα(t, θ)Ξ|Ft] = = E[Λβ(t, θ)Ξ|Ft] = Λβ(t)E[Λβ(t, θ)Ξ|F t] Λβ(t)E[Λβ(t, θ)|F t] = E[Λ β(θ)Ξ|F t] E[Λβ(θ)|Ft] = E β[Ξ|F t].

A terceira igualdade acima ´e verdadeira por que α = β em quase todo ponto sobre [[t, θ]]. Da´ı concluimos tamb´em que se t = θ ent˜ao Eα[Ξ] = Eβ[Ξ].

ii) Prova-se de maneira semelhante. 

Fixemos ν ∈ A e denotemos por V[0,θ] o conjunto de estrat´egias α tais que ν = α

em [[0, θ]]. Observe que por (2.5) e (2.13) Zα(θ) independe dos valores que α toma em

[[0, θ]]. Logo, dada uma estrat´egia qualquer α ∈ A podemos construir uma estrat´egia β tal que Zβ(θ) = Zα(θ) q.c., basta tomar γ ∈ V[0,θ] qualquer e fazer β = γ[[0,θ]]+ α[[θ,T ]].

Por isso a seguinte igualdade ´e verdadeira:

V (θ) = ess inf

α∈A Z

α(θ) = ess inf α∈V[0,θ]

Zα(θ). (2.15)

Lema 2.7. Para cada θ ∈ S, dadas α, β ∈ V[0,θ] existe γ ∈ V[0,θ] tal que Zγ(θ) =

(θ) ∧ Zβ(θ).

Demonstra¸c˜ao. Considere o evento A = {Zα(θ) ≤ Zβ(θ)} ∈ F

θ e defina a estrat´egia

α0 e a regra de parada τθ0 como seguem

α0 = (

ν(s, ω), se 0 ≤ s ≤ θ(ω)

(25)

2. O jogo

τθ0 = τθα· 1A+ τθβ· 1Ac.

Temos quase certamente o seguinte:

Zα0(θ) = Eα0[Yα0(θ, τθα0)|Fθ] = Eα[Yα(θ, τα 0 θ )|Fθ] · 1A+ Eβ[Yβ(θ, τα 0 θ )|Fθ] · 1Ac ≤ ≤ Zα(θ) · 1 A+ Zβ(θ) · 1Ac = Eα[Yα(θ, τθα)|Fθ] · 1A+ Eβ[Yβ(θ, τθβ)|Fθ] · 1Ac = = Eα0[Yα0(θ, τθα)|Fθ] · 1A+ Eα 0 [Yα0(θ, τθβ)|Fθ] · 1Ac = Eα 0 [Yα0(θ, τθ0)|Fθ] ≤ Zα 0 (θ). (2.16) Pela Proposi¸c˜ao 2.5 a primeira igualdade de (2.16) ´e verdadeira. A primeira de-sigualdade de (2.16) segue de (2.13) seguida da aplica¸c˜ao de da Proposi¸c˜ao 2.5. Pelo Lema 2.6 a quarta igualdade de (2.16) ´e verdadeira e a quinta igualdade segue da defini¸c˜ao de τθ0. Como Zα(θ) · 1A + Zβ(θ) · 1Ac = Zα(θ) ∧ Zβ(θ) q.c. o resultado

segue. 

Note que acabamos de provar que para cada θ ∈ S a fam´ılia {Zα(θ), α ∈ V[0,θ]}

tem a propriedade lattice. Por isso o seguinte Lema ´e verdadeiro.

Lema 2.8. Para cada θ ∈ S existe uma sequˆencia decrescente (Zαn(θ))n∈N tal que V (θ) = ↓n Zα

n

(θ) q.c. (2.17)

A prova deste lema ´e an´aloga `a prova de A.6 no apˆendice, apenas com uma pequena adapta¸c˜ao. A demonstra¸c˜ao ´e bastante simples mas utiliza um outro teorema n˜ao apresentado aqui. Para n˜ao adicionarmos ao trabalho resultados n˜ao essˆenciais n˜ao vamos prov´a-lo.

(26)

Cap´ıtulo 3

O valor do jogo

Como a existˆencia de pontos de cela se caracterizam pela iguadade V (0) = V (0) ent˜ao nossos dois objetivos est˜ao relacionados aos processos de valor do jogo. Portanto parece sensato come¸carmos o trabalho a partir deles. Neste cap´ıtulo faremos uma ampla an´alise desses processos, estudaremos suas propriedades e construiremos outras ferramentas e resultados a partir delas os quais nos ajudar˜ao a caracterizar e a encontrar os pontos de cela. O dois primeiros resultados s˜ao os principais do cap´ıtulo.

A grande quantidade de resultados apresentados a seguir pode ser um pouco can-sativa de se analisar, mas isso n˜ao deve desanimar o leitor quanto ao estudo do jogo. Pois lembre-se que estamos aprendendo como o jogo funciona e, como em todo o jogo com n´ıvel de complexidade consider´avel, ter paciˆencia ´e essencial para aprender a jogar bem.

3.1

Vamos jogar

Nesta se¸c˜ao vamos alcan¸car um dos nossos objetivos: para todo θ ∈ S V (θ) = V (θ). Como visto no cap´ıtulo anterior, para cada θ ∈ S existe uma sequˆencia (Zαn(θ))n∈N,

com (αn)n∈Nem V[0,θ], tal que V (θ) = ↓n Zα

n

(θ) q.c. Dada θ ∈ S considere a sequˆencia de regras de parada (ταn

θ )n∈N (como antes, est˜ao bem definidas) dadas por

τθαn := inf{s ∈ [θ, T ]; g(Xs) = Zα

n

(s)}. Como Zαm(s) ≥ Zαn(s) q.c., se n ≥ m, ent˜ao por defini¸c˜ao ταm

θ ≥ τα

n

θ q.c., da´ı a

sequˆencia de regras de parada acima definida ´e decrescente. Logo, est´a bem definida q.c. a seguinte regra de parada em S[θ,T ]:

τθ∗ := ↓n τα

n

(27)

3. O valor do jogo

Como θ ≤ τθ∗ q.c. ent˜ao, para todo n, ταn

θ ≤ inf{s ∈ [τ

θ, T ]; g(Xs) = Zα

n

(s)} q.c.. Se, por absurdo, ταn

θ < inf{s ∈ [τ ∗

θ, T ]; g(Xs) = Zα

n

(s)} em algum B ∈ Ω de medida de Wiener n˜ao nula ent˜ao para cada ω ∈ B existiria r ∈ [τθ∗(ω), T ] tal que τθ∗(ω) ≤ τθαn(ω) < r < inf{s ∈ [τθ∗(ω), T ]; g(Xs) = Zα

n

(s)} com g(Xr) = Zα

n

(r), contradi¸c˜ao. Logo τθαn = inf{s ∈ [τθ∗, T ]; g(Xs) = Zα

n

(s)} q.c.

Assim, os valores das estrat´egias admiss´ıveis αn sobre o intervalo [[0, τ

θ]] s˜ao

irre-levantes para o c´alculo de ταn

θ . Ent˜ao, fixado ν ∈ A, do mesmo modo que para V[0,θ],

existe uma sequˆencia (αk)

k∈N em V[0,τ∗

θ] de estrat´egias admiss´ıveis que coincidem com

ν no intervalo [[0, τθ∗]] para a qual (3.1) vale.

Teorema 3.1. Para todo θ ∈ S V (θ) = V (θ) q.c. De um modo mais geral, para todo t ∈ S e θ ∈ St,T temos

ess inf

α∈A ess supτ ∈S

θ,T Eα[Yα(t, τ )|Ft] = ess sup τ ∈Sθ,T ess inf α∈A E α[Yα(t, τ )|F t] q.c. (3.2)

Demonstra¸c˜ao. J´a sabemos que V (θ) ≥ V (θ) q.c., vamos ent˜ao mostrar a desigualdade inversa. Fixemos ν ∈ A e tomemos uma sequˆencia (αn) ∈ V

0,τ∗

θ tal que (3.1) vale.

Pela Proposi¸c˜ao 2.5 Zαn(θ) = Eαn[Yαn(θ, τθαn)|Fθ] q.c. da´ı, V (θ) ≤ Eαn[Yα(θ, τθαn)|Fθ] = E[Λα n (θ, τθαn)Yαn(θ, τθαn)|Fθ] = = E " Λν(θ, τθ∗)Λαn(τθ∗, τθαn){Yν(θ, τθ∗) + g(X τα n θ θ ) − g(Xτ∗ θ) + Z τ α n θ τθ∗ f (s, X, αns)}|Fθ # q.c. (3.3) A primeira igualdade de (3.3) segue da demonstra¸c˜ao do Lema 2.6. Para a segunda igualdade note o seguinte

Λν(θ, τθ∗)Λαn(τθ∗, ταnθ θ ) = exp Z τθ∗ θ hσ−1(s, X, νs)b(s, X, νs), dWsi − 1 2 Z τθ∗ θ ||σ−1(s, X, νs)b(s, X, νs)||2ds  · · exp " Z τ α n θ τ∗ θ hσ−1(s, X, αns)b(s, X, αns), dWsi − 1 2 Z τ α n θ τ∗ θ ||σ−1(s, X, αns)b(s, X, αns)||2ds # q.c. (3.4) Como αn coincide com ν no intervalo [[θ, τ

(28)

3. O valor do jogo

processo exponencial de (3.4) pode ser substituido por (αn

s)s. Ficamos ent˜ao com

Λν(θ, τθ∗)Λαn(τθ∗, τθαn) = = exp " Z τ α n θ θ hσ−1(s, X, νs)b(s, X, αns), dWsi − 1 2 Z τα n θ θ ||σ−1(s, X, νs)b(s, X, αns)|| 2 ds # = = Λαn(θ, τθαn) q.c.

Como σ−1 ´e limitada, pelo teorema da convergˆencia limitada podemos tomar o limite quando n → ∞ em (3.3) e ficamos com

V (θ) ≤ E[Λν(θ, τθ∗)Yν(θ, τθ∗)|Ft] = Eν[Yν(θ, τθ∗)|Ft] q.c. (3.5)

Perceba que ν ∈ A foi tomado arbitrariamente, logo podemos tomar o ´ınfimo na ´

ultima igualdade de (3.5) e obtermos: V (θ) ≤ ess inf ν∈A E ν[Yν(θ, τ∗ θ)|Ft] ≤ ess sup τ ∈S[θ,T ] ess inf ν∈A E ν[Yν(θ, τ )|F t] = V (θ) q.c.

Portanto V (θ) = V (θ) q.c.. Vamos agora provar (3.2).

ess inf

α∈A ess supτ ∈Sθ,T

Eα  Yα(θ, τ ) + Z θ t f (s, X, αs)ds|Ft  ≤ ≤ ess sup τ ∈Sθ,T Eα n Yαn(θ, τ ) + Z θ t f (s, X, αns)ds|Ft  ≤ ≤ Eαn[ess sup τ ∈Sθ,T Eα n Yαn(θ, τ )|F θ + Z θ t f (s, X, αs)|Ft] = = Eαn  Eα n Yαn (θ, τθαn)|Fθ + Z θ t f (s, X, αns)|Ft  = = Eαn  Yαn(θ, τθαn) + Z θ t f (s, X, αns)|Ft  = Eαn[Yαn(t, τθαn)|Ft] q.c. (3.6)

A segunda desigualdade de (3.6) segue do seguinte, ess sup τ ∈Sθ,T Eα n Yαn (θ, τ )|Ft = ess sup τ ∈S[θ,T ] Eα n Eα n Yαn (θ, τ )|Fθ |Ft ≤ ≤ Eαn " ess sup τ ∈Sθ,T Eα n Yαn (θ, τ )|Fθ |Ft # q.c.

J´a a primeira igualdade de (3.6) segue da Proposi¸c˜ao 2.5 lembrando de (2.13). Note que Eαn[Yαn(t, ταn

θ )|Ft] = Eν[Yν(t, τα

n

(29)

3. O valor do jogo

tomando o limite quando n → ∞ em (3.6) temos:

ess inf

α∈A ess supτ ∈Sθ,T

Eα  Yα(θ, τ ) + Z θ t f (s, X, αs)ds|Ft  ≤ Eν[Yν(t, τ∗ θ)|Ft] q.c.

Como ν ´e arbrit´ario podemos tomar o ´ınfimo essencial sobre ν ∈ A e depois o supremo essencial sobre τ ∈ Sθ,T obtendo:

ess inf

α∈A ess supτ ∈Sθ,T E α  Yα(θ, τ ) + Z θ t f (s, X, αs)ds|Ft  ≤ ess sup τ ∈Sθ,T ess inf ν∈A E ν [Yν(t, τ )|Ft] q.c.  A partir de agora escreveremos V (·) = V (·) = V (·) para o processo de valor do jogo.

Proposi¸c˜ao 3.2. O processo V (·) ´e cont´ınuo a direita Demonstra¸c˜ao. Como o processo (Zα(s))

0≤s≤T ´e limitado e j´a provamos que a fam´ılia

{Eα[Yα(t, τ )|F

t], α ∈ A[t,T ]} tem a propriedade de lattice, ent˜ao n˜ao ´e necess´aria a

hip´otese de que para todo s Zα(s) ≥ 0 q.c. para podermos usar A.8 no apˆendice,

o qual nos garante a existˆencia de uma modifica¸c˜ao c`adl`ag de (Zα(s))

0≤s≤T. Temos

ent˜ao que, para cada t ∈ [0, T ] lim inf

s↓t V (s) ≤ lim infs↓t Z α

(s) = Zα(t) q.c. Tomando o ´ınfimo sobre A obtemos lim inf

s↓t V (s) ≤ V (t) q.c..

Sabemos que o processo descrito em (2.12) ´e um Pα−submartingale, ent˜ao, por A.9

no apˆendice, existe e ´e finito q.c. o limite lim

s↓t Ψ(s, τ ). A finitude vem do fato de o

pr´oprio J (s, τ ) ser limitado para todo s, como R0sf (r, X, αr)dr ´e cont´ınuo em s ent˜ao

o limite lim

s↓t J (s, τ ) tamb´em existe e ´e finito q.c.

Ent˜ao podemos definir: J (t+, τ ) = lim

s↓t J (s, τ ) sobre {t < τ } , J (t+, τ ) = g(X(τ )) sobre {t = τ }.

Para qualquer t ∈ [0, T ] e τ ∈ St,T, pela defini¸c˜ao de J em (2.11) temos

lim inf

s↓t V (s) ≥ lim infs↓t J (s, s ∨ τ ) = lim infs↓t J (s, τ ){t<τ }+ J (s, s){t=τ } =

= lim

s↓t J (s, τ ) + lim infs↓t g(X(s)) = J (t+, τ ) + g(X(t)) = J (t+, τ ) + J (t, t) q.c.

(3.7)

(30)

3. O valor do jogo

Da´ı, sobre {t < τ }, obtemos

lim inf s↓t V (s) ≥ lims↓t J (s, τ ) = E α  lim s↓t J (s, τ )|Ft+  = = Eα  lim s↓t J (s, τ ) + Z s t f (r, X, αr)dr|Ft  = = lim s↓t E α  J (s, τ ) + Z s t f (r, X, αr)dr|Fr  ≥ J(t, τ ) q.c. (3.8)

A primeira igualdade em (3.8) ´e verdadeira por que o processo lim

s↓t J (t, τ ) ´e adaptado

a Ft+. A segunda igualdade em (3.8) ´e verdadeira por que a filtragem F ´e cont´ınua a

direita (ver A.10 no apˆendice) e para a terceira igualdade de (3.8) usamos o teorema da convergˆencia dominada. A ´ultima desigualdade de (3.8) segue do fato de que o processo Ψ(t, τ ) = J (t, τ ) +Rt

0 h(s, X, αs)ds ´e um P

α−submartingale, pois isto tem

como consequˆencia

Eα  J (s, τ ) + Z s t f (r, X, αr)dr|Fr  ≥ J(t, τ ) q.c.

Portanto, tomando o supremo essencial sobre St,T obtemos a desigualdade lim inf

s↓t V (s) ≥

V (t). Segue ent˜ao o resultado. 

Vamos definir agora mais uma classe de regras de parada.

Defini¸c˜ao 3.1. Para cada t ∈ S e 0 <  < 1, de maneira an´aloga as outras regras de parada definidas anteriormente, est˜ao bem definidas

%t() := inf{s ∈ [t, T ]; g(X(s)) ≥ V (s) − } ; %t := %t(0) (3.9)

Como V (·) ≥ g(X(·)) q.c. ent˜ao, para cada α ∈ A, s˜ao verdadeiras quase certa-mente as seguintes desigualdades:

%t∨ τtα() ≤ τ α

t , %t() ≤ τtα∧ %t. (3.10)

Para cada α ∈ A vamos definir o seguinte processo: Rα(t) := V (t) + Z t 0 f (s, X, αs)ds; t ∈ S (3.11) Perceba que Rα(t) ≥ g(X(t)) +Rt 0 f (s, X, αs)ds = Y α(t) q.c.. Rα(t) ´e o custo

cumulativo do controller em usar a estrat´egia α no intervalor [[0, t]] mais o valor do jogo em t.

(31)

3. O valor do jogo

Proposi¸c˜ao 3.3. Para cada α ∈ A o processo Rα(· ∧ %

0) ´e um Pα−submartingale. De

modo mais geral, para quaisquer regras de parada t, ϑ tais que, t ≤ ϑ ≤ %t

Eα[Rα(ϑ)|Ft] ≥ Rα(t) q.c. (3.12) Em outras palavras, Eα  V (ϑ) + Z ϑ t f (s, X, αs)ds|Ft  ≥ V (t) q.c. (3.13)

Mais ainda, se ς ∈ S tal que 0 ≤ ς ≤ t ≤ ϑ ≤ %t ent˜ao,

ess inf α∈A E α  V (ϑ) + Z ϑ ς f (s, X, αs)ds|Fς  ≥ ess inf α∈A E α  V (t) + Z t ς f (s, X, αs)ds|Fς  q.c. (3.14) Demonstra¸c˜ao. Por (3.10) e pela Proposi¸c˜ao 2.5, para qualquer α ∈ A, e regras de parada t, ϑ tais que 0 ≤ t ≤ ϑ ≤ %α

t vale: Eα[Qα(ϑ)|Ft] = Qα(t). Isto ´e o mesmo que

Eα  Zα(ϑ) + Z ϑ 0 f (s, X, αs)ds|Ft  = Zα(t) + Z t 0 f (s, X, αs)ds Logo, Eα  Zα(ϑ) + Z ϑ t f (s, X, αs)ds|Ft  = Zα(t) ≥ V (t) q.c. (3.15)

Fixado ν ∈ A tome uma sequˆencia (αn)n em V[0,ϑ] tal que V (ϑ) =↓nZα

n

(ϑ) q.c., como no Lema 2.8. Pelo Lema 2.6 e pela desigualdade em (3.15) ficamos com o seguinte,

Eν  Zαn(ϑ) + Z ϑ t f (s, X, νs)ds|Ft  ≥ V (t) q.c. ∀n (3.16)

Aplicando o limite quando n → ∞ e teorema da convergˆencia dominada em (3.16) obtemos Eν  V (ϑ) + Z ϑ t f (s, X, νs)ds|Ft  ≥ V (t) Logo, Eν  V (ϑ) + Z ϑ t f (s, X, νs)ds|Ft  + Z t ς f (s, X, νs)ds ≥ V (t) + Z t ς f (s, X, νs)ds E portanto, ν  Z ϑ  ν  Z t 

(32)

3. O valor do jogo

A conclus˜ao do teorema segue se tomarmos o ´ınfimo essencial sobre A em ambos

os lados da desigualdade em (3.17). 

Proposi¸c˜ao 3.4. Para cada t ∈ S

V (t) = ess inf α∈A E α  V (%t) + Z %t t f (s, X, αs)ds|Ft  q.c. (3.18)

e para qualquer ν ∈ A vale

Rν(t) = ess inf

α∈V[0,t]

Eα[Rα(%t)|Ft] q.c. (3.19)

Demonstra¸c˜ao. Como g(X(%t)) = V (%t) q.c. (por causa da continuidade a direita de

V ), perceba que a defini¸c˜ao de V nos d´a diretamente uma das desigualdades para a (3.18), pois: V (t) ≥ ess inf α∈A E α  g((%t)) + Z %t t f (s, X, αs)ds|Ft  = = ess inf α∈A E α  V (%t) + Z %t t f (s, X, αs)ds|Ft  q.c.

Para a desigualdade inversa basta substituirmos ϑ por %t em (3.13) e depois

tomar-mos o ´ınfimo essecial sobre A.

Perceba que, por (3.18), V (t) independe dos valores assumidos pelas estrat´egias no intervalo [[0, t]]. Ent˜ao, a mesma observa¸c˜ao feita para (2.15) aplica-se aqui e da´ı podemos escrever: V (t) = ess inf α∈V[0,t]E α  V (%t) + Z %t t f (s, X, αs)ds|Ft  q.c.

Al´em disso, se α ∈ V[0,t] ent˜ao

Z t 0 f (s, X, νs)ds = Z t 0 f (s, X, αs)ds q.c. Logo, Rν(t) = V (t) + Z t 0 f (s, X, νs)ds = = ess inf α∈V[0,t]E α  V (%t) + Z %t t f (s, X, αs)ds|Ft  + Z t 0 f (s, X, νs)ds = = ess inf α∈V[0,t] Eα  V (%t) + Z %t 0 f (s, X, αs)ds|Ft  =

(33)

3. O valor do jogo = ess inf α∈V[0,t]E α[Rα(% t)|Ft] .  Observe que pela Proposi¸c˜ao 3.3 e por A.9 no apˆendice Rα(· ∧ %

0) tem limite `a

esquerda. N˜ao apenas isso, pela continuidade a direita de V Rα(· ∧ %

0) ´e tamb´em um

processo c`adl`ag. Como Rα(· ∧ %

0) = V (· ∧ %0) +

R·∧%0

0 f (s, X, αs)ds ent˜ao V (· ∧ %0)

tamb´em ´e c`adl`ag.

Proposi¸c˜ao 3.5. Para quaisquer regras de parada t, θ ∈ S tais que 0 ≤ t ≤ θ ≤ T e para qualquer estrat´egia α ∈ A

Eα[Rα(θ)|Ft] ≤ ess sup τ ∈St,T Eα[Yα(τ )|Ft] q.c., (3.20) Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  ≤ ess sup τ ∈St,T Eα[Yα(t, τ )|Ft] q.c., (3.21) ess inf α∈A E α  V (θ) + Z θ t h(s, X, αs)ds|Ft  ≤ V (t) q.c. (3.22) e fixado ν ∈ A ess inf α∈V[0,t]E α  V (θ) + Z θ t f (s, X, αs)ds|Ft  ≤ V (t) q.c. (3.23)

Demonstra¸c˜ao. Por (2.15) V (θ) = ess inf

α∈A Z

α(θ), al´em disso a Proposi¸c˜ao 2.4 nos diz

que Qα(·) = Zα(·) +R· 0f (s, X, αs)ds ´e um P α−supermartingale. Da´ı: Eα[Rα(θ)|Ft] = Eα  V (θ) + Z θ 0 f (s, X, αs)ds|Ft  ≤ ≤ Eα  Zα(θ) + Z θ 0 f (s, X, αs)|Ft  ≤ Zα(t) + Z t 0 f (s, X, αs) = = ess sup τ ∈St,T Eα[Yα(τ )|Ft]

A qual leva `a (3.20). Observe que:

ess sup τ ∈St,T Eα[Yα(τ )|Ft] = ess sup τ ∈St,T Eα[Yα(t, τ )|Ft] + Z t 0 f (s, X, αs); Eα[Rα(θ)|Ft] = Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  + Z t 0 f (s, X, αs)ds.

(34)

3. O valor do jogo

Proposi¸c˜ao 3.6. Para todas as regras de parada t, θ ∈ S tais que 0 ≤ t ≤ θ ≤ T valem: ess inf α∈A E α  V (θ) + Z θ 0 f (s, X, αs)ds|Ft  = = ess inf

α∈A ess supτ ∈Sθ,T E α [Yα(t, τ )|Ft] = ess sup τ ∈Sθ,T ess inf α∈A E α [Yα(t, τ )|Ft] q.c (3.24)

Demonstra¸c˜ao. A segunda igualdade de (3.24) vem de (3.2), vamos mostrar a primeira igualdade. Para qualquer estrat´egia α ∈ A, pela Proposi¸c˜ao 3.4 sabemos que V (θ) ≤ Eαg(X(%θ)) + R%θ θ f (s, X, αs)ds|Fθ. Da´ı: V (θ) + Z θ t f (s, X, αs)ds ≤ Eα  g(X(%θ)) + Z %θ t f (s, X, αs)ds|Fθ  Da´ı, Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  ≤ Eα  g(X(%θ)) + Z %θ t f (s, X, αs)ds|Ft  = = Eα[Yα(t, %t)|Ft] ≤ ess sup τ ∈St,T Eα[Yα(t, τ )|Ft] q.c.

Tomando o ´ınfimo essencial sobre A na express˜ao acima obtemos ess inf α∈A E α  V (θ) + Z θ 0 f (s, X, αs)ds|Ft  ≤ ess inf

α∈A ess supτ ∈Sθ,T

Eα[Yα(t, τ )|Ft] q.c.

Vamos mostrar a desigualdade inversa. Note que, para qualquer τ ∈ Sθ,T temos:

Eα[Yα(t, τ )|Fθ] − Z θ t f (s, X, αs)ds = Eα[Yα(θ, τ )|Fθ] ≤ Zα(θ) q.c. (3.25) Logo Zα(θ) +Rθ t f (s, X, αs)ds ≥ E α[Yα(t, τ )|F

θ] q.c. Tomando a esperan¸ca

con-dicional com respeito `a Ft e depois o supremo essencial sobre Sθ,T em (3.25) obtemos:

Eα  Zα(θ) + Z θ t f (s, X, αs)ds|Ft  ≥ ess sup τ ∈Sθ,T Eα[Yα(t, τ )|Ft] q.c. (3.26)

Fixando ν ∈ A, tomamos uma sequˆencia (αn)

(35)

3. O valor do jogo

como no Lema 2.8. Pelo Lema 2.6 e por (3.26) temos:

Eν  Zαn(θ) + Z θ t f (s, X, νs)ds|Ft  = Eαn  Zαn(θ) + Z θ t f (s, X, αsn)ds|Ft  ≥ ≥ ess sup τ ∈Sθ,T Eα n Yαn (t, τ )|Ft ≥ ess inf

α∈A ess supτ ∈Sθ,T E

α[Yα(t, τ )|F

t] q.c.

Tomando agora o limite quando n → ∞ chegamos so seguinte:

Eν  V (θ) + Z θ t f (s, X, νs)ds|Ft  ≥ ess inf

α∈A ess supτ ∈Sθ,T E

αnYαn(t, τ )|F t



q.c. (3.27)

Para concluir basta tomarmos o ´ınfimo essencial sobre A no lado esquerdo de (3.27).  Proposi¸c˜ao 3.7. Fixada ν ∈ A, para quaisquer regras de parada t, θ tais que 0 ≤ t ≤ θ ≤ T temos: ess inf α∈A E α [Rα(θ)|Ft] ≤ Rν(t) (3.28) inf α∈AE α [Rα(θ)] ≤ inf α∈AE α [Rα(t)] ≤ V (0) q.c. (3.29)

E se θ ≤ %t (respectivamente t ≤ %0) a primeira desigualdade de (3.29)

(respecti-vamente a segunda desigualdade) torna-se igualdade.

De um modo mais geral, para quaisquer regras de parada τ, t, θ tais que 0 ≤ τ ≤ t ≤ θ ≤ T temos ess inf α∈A E α  V (θ) + Z θ τ f (s, X, αs)ds|Fτ  ≤ ess inf α∈A E α  V (t) + Z t τ f (s, X, αs)ds|Fτ  ≤ V (τ ) (3.30) A primeira desigualdade de (3.30)(respectivamente a segunda) torna-se igualdade sobre {θ ≤ %t} (respectivamente {t ≤ %τ}).

Demonstra¸c˜ao. Fixada ν ∈ A temos q.c.

ess inf α∈A E α[Rα(θ)|F t] = ess inf α∈A  Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  + Z t 0 f (s, X, αs)ds  ≤ ≤ ess inf α∈V[0,t]  Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  + Z t 0 f (s, X, αs)ds  = = ess inf α∈V[0,t]  Eα  V (θ) + Z θ t f (s, X, αs)ds|Ft  + Z t 0 f (s, X, νs)ds ≤ V (t) + Z t 0 f (s, X, ν) = Rα(t)

(36)

3. O valor do jogo

Pα−supermartingale ent˜ao,

Eα  V (θ) + Z θ 0 f (s, X, αs)ds|Ft  ≤ Zα(t) + Z t 0 f (s, X, αs)ds. Logo, Eα  V (θ) + Z θ τ f (s, X, αs)ds|Ft  ≤ Zα(t) + Z t τ f (s, X, αs)ds, e portanto, Eα  V (θ) + Z θ τ f (s, X, αs)ds|Fτ  ≤ Eα  Zα(t) + Z t τ f (s, X, αs)ds|Fτ 

Como j´a fixamos um ν ∈ A tome ent˜ao uma sequˆencia (αn)

n em V[0,t] tal que V (t) =↓n

Zαn

(t). Quase certamente temos:

ess inf α∈A E α  V (θ) + Z θ τ f (s, X, αs)ds|Fτ  ≤ Eαn V (θ) + Z θ τ f (s, X, αns)ds|Fτ  ≤ ≤ Eαn Eα n Zαn(θ) + Z θ τ f (s, X, αsn)ds|Ft  Fτ  ≤ Eαn Zαn(t) + Z t τ f (s, X, αns)ds|Fτ  = = Eν  Zαn(t) + Z t τ f (s, X, νs)ds|Fτ  fazendo n → ∞ chegamos `a: ess inf α∈A E α  V (θ) + Z θ τ f (s, X, αs)ds|Fτ  ≤ Eν  V (t) + Z t τ f (s, X, νs)ds|Fτ  .

Basta ent˜ao tomarmos o ´ınfimo essencial sobre A no lado direito desta ´ultima de-sigualdade e obtemos a primeira dede-sigualdade de (3.30), a segunda dede-sigualdade segue da primeira substituindo θ por t e t por τ . A (3.29) segue de (3.30) se tomarmos τ = 0. Se {θ ≤ %t} ent˜ao a inversa da primeira desigualdade de (3.29) segue de 3.14

substituindo nesta ´ultima t por θ, ϑ por t e ς por 0. Se {θ ≤ %t} a inversa da primeira

desigualdade de (3.30) segue de (3.14) substituindo nesta ´ultima ϑ por θ e ς por τ . Se {t ≤ %τ} ent˜ao a inversa da segunda desigualdade de (3.30) tab´em segue de (3.14)

substituindo nesta ´ultima ς e t por τ e ϑ por t. Se {t ≤ %0}, para a inversa da segunda

(37)

Cap´ıtulo 4

Encontrando os pontos de cela

Neste ´ultimo cap´ıtulo vamos completar nossos objetivos: vamos encontrar os pontos de cela. O cap´ıtulo tem trˆes se¸c˜oes, na primeira vamos caracterizar os pontos de cela, na segunda vamos proceder para otimizar nossa escolha da estrat´egia α (lembra que comentamos na se¸c˜ao 2.3 que nosso problema original seria resolvido como um problema de otimiza¸c˜ao de estrat´egia?) e por fim construiremos o ponto de cela.

4.1

Caracteriza¸

ao

Chegamos ao resultado mais importante da disserta¸c˜ao at´e o momento: uma ca-racteriza¸c˜ao dos pontos de cela. A demonstra¸c˜ao deste resultado faz juz a sua grande importˆancia.

Teorema 4.1. O par (α∗, τ0) ∈ A × S ´e um ponto de cela se, e somente se, os trˆes itens a seguir s˜ao satisfeitos.

1. g(Xτ0) = V (τ0) q.c.

2. Rα∗(· ∧ τ0) ´

e Pα∗−martingale

3. Rα(· ∧ τ0) ´

e Pα−submartingale para qualquer α ∈ A

Demonstra¸c˜ao. Prova da necessidade

As seguintes desigualdades s˜ao verdadeiras,

EαYα ∗ (τ0) ≤ EαRα∗0 ) ≤ EαRα∗(% τ0) = EαYα ∗ (%τ0) ≤ EαYα ∗ (τ0) (4.1) α∗ 0 α0

(38)

4. Encontrando os pontos de cela

que g(X%τ 0) = V (%τ0) q.c. e a ´ultima desigualdade segue da defini¸c˜ao de ponto de cela.

Logo EαYα∗0) = EαRα∗0) q.c.

Como Yα∗0) ≤ Rα∗0) q.c. ent˜ao Yα∗0) = Rα∗0) q.c., e por conseguinte,

g(Xτ0) = V (τ0) q.c. O item 1 ´e satisfeito.

Seja τ ∈ S tal que 0 ≤ τ ≤ τ0, as seguintes desigualdades s˜ao verdadeiras,

Eα ∗ Rα∗(τ ) ≤ Eα∗Rα∗(% τ) = Eα ∗ Yα∗(% τ) ≤ Eα ∗ Yα∗0 ) = Eα∗Rα∗(τ0) (4.2) A primeira das desigualdades em (4.2) segue de (3.12), a primeira igualdade acima segue do fato de que g(X%τ) = V (%τ) q.c. A segunda das desigualdades em (4.2) segue

da defini¸c˜ao de ponto de cela e a ´ultima igualdade provamos um pouco antes nesta mesma se¸c˜ao. Pela defini¸c˜ao de ponto de cela, pelo item 1 e por 3.29 as seguintes desigualdades s˜ao verdadeiras, Eα ∗ Yα∗ (τ0) ≤ inf α∈AE α [Yα(τ0)] = inf α∈AE α [Rα(τ0)] ≤ inf α∈AE α [Rα(τ )] ≤ Eα∗Rα∗(τ0) (4.3) Combinando (4.2) e (4.3) temos que, para toda τ ∈ S tal que 0 ≤ τ ≤ τ0 vale o seguinte, Eα ∗ Rα∗ (τ ) = inf α∈AE α [Rα(τ )] = inf α∈AE α [Rα(τ0)] = Eα∗Rα∗(τ0) (4.4)

Logo, dados θ, t ∈ S tais que 0 ≤ t ≤ θ, τ0(4.4) nos garante que Eα∗Eα∗Rα∗(θ ∧ τ0)|Ft =

Rα∗

(t ∧ τ0), al´em disso, A.11 no apˆendice nos garante que Eα∗Rα∗(θ∧τ0)|Ft ≥

Rα∗(t ∧ τ0) q.c. Portanto, Eα∗Rα∗(θ ∧ τ0)|Ft = Rα

(t ∧ τ0) q.c. e da´ı o processo Rα∗(· ∧ τ0) ´

e um Pα∗−martingale. O item 2 ´e satisfeito.

Vamos agora ao item 3. Perceba que ele ´e equivalente a seguinte afirma¸c˜ao: Para quaisquer tempos de parada t, τ tais que 0 ≤ t ≤ τ ≤ τ0 e qualquer estrat´egia α ∈ A

Eα  V (τ ) + Z τ t f (s, X, αs)ds|Ft  ≥ V (t) q.c. Fixe τ ∈ S tal que 0 ≤ τ ≤ τ0; como na Proposi¸c˜ao 3.5 definimos

ˆ V (t, τ ) := ess inf α∈N∗ [0,t] Eα  V (τ ) + Z τ t f (s, X, αs)|Ft  ≤ V (t).

Onde N[0,t]∗ ´e conjunto de estrat´egias coincidentes q.c. a α∗ no intervalo estoc´astico [[0, t]]. Perceba que o item 3 ´e satisfeito se conseguirmos mostrar que

ˆ

(39)

4. Encontrando os pontos de cela

para isso considere para  > 0 qualquer o seguinte evento e regra de parada: A := { ˆV (t, τ ) +  ≤ V (t)} ∈ Ft θ := t · 1A+ τ · 1Ac

Observe que 0 ≤ t ≤ θ ≤ τ ≤ τ0 ≤ T . Aplicando (4.4) chegamos ao seguinte,

Eα ∗ Rα∗ (t) = Eα∗Rα∗ (θ) = = Eα∗Rα∗(t) · 1A+ R α∗(τ ) · 1 Ac  = E α∗Rα∗(t) · 1 A+ E α∗Rα∗(τ )|F t · 1Ac  = = Eα∗  (Vα∗(t) + Z t 0 f (s, X, α∗s)ds) · 1A+ E α∗  Vα∗(τ ) + Z τ 0 f (s, X, α∗s)ds|Ft  · 1Ac   = = Eα∗  Vα∗(t) · 1A+ E α∗  Vα∗(τ ) + Z τ t f (s, X, α∗s)ds|Ft  · 1Ac  + Z t 0 f (s, X, α∗s)ds  ≥ ≥ Eα∗  V (t) · 1A+ ˆV (t, τ ) · 1Ac + Z t 0 f (s, X, α∗s)ds  ≥ ≥  · Pα∗(A) + Eα ∗ ˆ V (t; τ ) + Z t 0 f (s, X, α∗s)ds 

A ´ultima desigualdade acima ´e verdadeira porque V (t) · 1A ≥ ( ˆV (t; τ ) + ) · 1A.

Assim, Eα ∗ Rα∗(t) −  · Pα∗(A ) ≥ Eα ∗ ˆ V (t, τ ) + Z t 0 f (s, X, α∗s)ds  . (4.6)

Como no caso da fam´ılia {Eα[Yα(t, τ )|Ft]; α ∈ A}, a fam´ılia

Eα  V (τ ) + Z τ t f (s, X, αs)ds|Ft  ; α ∈ N[0,t]∗ ,

tamb´em tem a propriedade de lattice.

Portanto, pela vers˜ao do ess inf de A.6 no apˆendice, existe uma sequˆencia (αn) n de

estrat´egias de N[0,t]∗ tal que

ess inf α∈N∗ [0,t] Eα  V (τ ) + Z τ t f (s, X, αs)|Ft  = lim n→∞E αn  V (τ ) + Z τ t f (s, X, αsn)|Ft  q.c.

(40)

4. Encontrando os pontos de cela A partir de (4.6) temos Eα ∗ Rα∗ (t) −  · Pα∗(A) ≥ Eα ∗ ˆ V (t, τ ) + Z t 0 f (s, X, α∗s)ds  = = Eα∗  lim n→∞E αn  V (τ ) + Z τ t f (s, X, αns)|Ft  + Z t 0 f (s, X, α∗s)ds  = = Eα∗  lim n→∞E αn  V (τ ) + Z τ 0 f (s, X, αns)|Ft  = = Eα∗ h lim n→∞E αn Rαn (τ )|Ft i = = lim n→∞E α∗ Eα n Rαn(τ )|F t = lim n→∞E α∗Rαn(τ ) ≥ ≥ inf α∈AE α[Rα (τ )] = Eα∗Rα∗(τ ) = Eα∗Rα∗(t) (4.7)

A quarta igualdade de (4.7) segue do teorema da convergˆencia dominada e as duas ´

ultimas igualdades de (4.7) seguem de (4.4). Portanto Pα∗(A

) = 0 e da´ı V (t) <

ˆ

V (t, τ ) +  q.c. para  > 0 qualquer. A equa¸c˜ao (4.5) ´e ent˜ao satisfeita e da´ı o ´ultimo item ´e comprovado.

Prova da suficiˆencia

Suponha agora que o par (α∗, τ0) ∈ A × S satisfaz os trˆes itens do teorema 4.1, ent˜ao, pelo item 3 para τ ≤ τ0 Eα[Rα(τ )] ≤ Eα[Rα0)|F

τ] q.c. Aplicando a esperan¸ca

e o ´ınfimo sobre A nesta ´ultima desigualdade ficamos com inf α∈AE α [Rα(τ )] ≤ inf α∈AE α [Rα(τ0)] .

Como, pelo item 2, V (τ0) = g(Xτ0) q.c. e como para todo α ∈ A Rα(0) = V q.c.,

tomamos na desigualdade acima τ = 0 e da´ı, inf α∈AE α[Yα0 )] = inf α∈AE α[Yα0 )|F0] = inf α∈AE α[Rα0 )|F0] = inf α∈AE α[Rα0 )] ≥ Eα[V ] = V = Eα∗Rα∗(0) = Eα ∗ Rα∗0 )|F0 = Eα ∗ Yα∗0 )|F0 = Eα ∗ Rα∗0 ) = Eα∗Yα∗(τ0) . Pela express˜ao acima mostramos Eα∗[Yα∗0

)] ≤ Eα[Yα0

)] para todo α ∈ A, isto ´e desigualdade direita da defini¸c˜ao 2.2. Ainda com 0 ≤ τ ≤ τ0, pelo item 2 e por que V (τ0) = g(Xτ0) q.c. Yα∗(τ ) ≤ Rα∗(τ ) = Eα∗Rα∗(τ0)|Fτ = Eα ∗ Yα∗0 )|Fτ  q.c. (4.8)

(41)

4. Encontrando os pontos de cela

[Yα∗0)] que ´e a desigualdade esquerda da defini¸c˜ao 2.2. Vamos agora mostrar esta

mesma desigualdade para o caso τ0 ≤ τ .

Considere agora τ0 ≤ τ ≤ T . Perceba que a desigualdade segue se conseguirmos mostrar que Eα ∗ Yα∗ (τ )|Fτ0 ≤ Yα ∗ (τ0) q.c. (4.9) o que ´e equivalente a g(Xτ0) ≥ Eα ∗ Yα∗

(τ0, τ )|Fτ0 q.c., o que nos leva a g(Xτ0) ≥

Zα∗(τ0) q.c.. Como j´a sabemos que g(Xτ0) ≥ Zα ∗

(τ0) q.c. ent˜ao vamos provar o seguinte,

g(Xτ0) = Zα ∗

(τ0) q.c.; (4.10)

Pelo item 2 e por (3.11) Rα∗(· ∧ τ0) ´e um Pα∗−martingale que domina Yα∗

(τ0), mas pela Proposi¸c˜ao 2.4 Qα∗(· ∧ τ0) ´e o envelope snell de Yα∗0) e portanto o menor

−supermartingale que domina Yα∗0).

Portanto Rα∗(· ∧ τ0) ≥ Qα∗(· ∧ τ0) q.c. o que ´e equivalente a V (· ∧ τ0) ≥ Zα∗(· ∧ τ0)

q.c.. Mas por (2.15) V (· ∧ τ0) ≤ Zα∗(· ∧ τ0) q.c.. Portanto V (τ0) = Zα∗(τ0) q.c. e pelo item 1, (4.10) segue.

Por fim, vamos ao caso geral τ ∈ S. Temos que

Eα ∗ Yα∗(τ )  = Eα∗Yα∗(τ ∧ τ0 ) · 1τ ≤τ0 + Yα ∗ (τ ∨ τ0) · 1τ >τ0 Por (4.8) e (4.9) Yα∗(τ ∧ τ0) ≤ Eα∗Yα∗(τ0)|Fτ ∧τ0 q.c. Eα ∗ Yα∗(τ ∨ τ0 )|Fτ0 ≤ Yα ∗ (τ0) q.c. (4.11) Os eventos {τ ≤ τ0}, {τ > τ0} pertencem a F τ ∧τ0 e {τ > τ0} ∈ Fτ0. Logo, Eα ∗ Yα∗(τ ) = Eα∗Yα∗(τ ∧ τ0 ) · 1{τ ≤τ0}+ Yα ∗ (τ ∨ τ0) · 1{τ >τ0} = = Eα∗Eα ∗ Yα∗(τ ∧ τ0 ) · 1{τ ≤τ0}+ Yα ∗ (τ ∨ τ0) · 1{τ >τ0}|Fτ ∧τ0 ≤ ≤ Eα∗ Eα ∗ Yα∗ (τ0)|Fτ ∧τ0 · 1{τ ≤τ0} + Eα ∗ Yα∗ (τ ∨ τ0)|Fτ ∧τ0 · 1{τ >τ0} = = Eα∗Eα ∗ Yα∗0 ) · 1{τ ≤τ0}|Fτ ∧τ0 + Eα ∗ Eα ∗ Yα∗(τ ∨ τ0 )|Fτ0 · 1{τ >τ0} ≤ ≤ Eα∗Yα∗ (τ0) · 1{τ ≤τ0} + Eα ∗ Yα∗ (τ0) · 1{τ >τ0} = Eα ∗ Yα∗ (τ0) q.c. A primeira e a ´ultima desigualdades acima vem das desiguadades em 4.11. Segue da´ı que Eα∗[Yα∗(τ )] ≤ Eα∗[Yα∗0)] que ´e a desiguadade esquerda da defini¸c˜ao 2.2.

(42)

4. Encontrando os pontos de cela

4.2

Otimizando o controle

Agora damos in´ıcio `aquilo que estamos enfatizando desde o cap´ıtulo dois: vamos resolver o problema de encontrar um ponto de cela tratando-o como um problema de otimiza¸c˜ao. Nesta se¸c˜ao vamos tratar do problema de otimizar a escolha da estrat´egia α em Rα(· ∧ τα

0 ).

Defini¸c˜ao 4.1. Dizemos que uma estrat´egia α ∈ A ´e ´otima se V = Zα(0).

Defini¸c˜ao 4.2. Dizemos que uma estrat´egia α ∈ A ´e um thrifty se Rα(· ∧ τ0α) ´e um Pα−martingale.

Teorema 4.2. Uma estrat´egia α ∈ A ´e ´otima se, e s´o se, ´e um thrifty e para todo  > 0 tivermos τα

0 () = %α0() q.c.

Demonstra¸c˜ao. Prova da suficiˆencia

Por (3.10) sabemos que τ0α() ≤ τ0α q.c.. Ent˜ao temos o seguinte

V ≤ Zα(0) = Eα[Yα(0, τ0α)|F0] = Eα " g(Xτ α 0 ) + Z τ α0 τ α0 () f (s, X, αs)ds + Z τ α0 () 0 f (s, X, α)ds|F0 # = = Eα " EαYα(τ0α(), τ α 0 )|Fτ α0 () + Z τ α0 () 0 f (s, X, αs)ds|F0 # = = Eα " Z(τ0α()) + Z τ α0 () 0 f (s, X, α)ds # ≤ Eα "  + g(Xτ α0 ()) + Z τ α0 () 0 f (s, X, α)ds # ≤ ≤  + Eα " V (τ0α()) + Z τ α0 () 0 f (s, X, α)ds # =  + Eα[Rα(τ0α())] = =  + Eα[Eα[Rα(τ0α())|F0]] =  + Eα[Rα(0)] =  + V q.c. (4.12) A primeira desigualdade de (4.12) segue de (2.15), a primeira igualdade de (4.12) segue da proposi¸c˜ao 2.5 e a segunda segue das considera¸c˜oes a respeito de F0 feitas

logo ap´os a defini¸c˜ao 2.3. A segunda desigualdade de (4.12) vem da defini¸c˜ao 2.6 e a ´

ultima igualdade ´e verdade pois estamos considerando α thrifty. Como 0 ≤  < 1 foi arbrit´ario ent˜ao V = Zα(0) e da´ı α ´e ´otima.

Prova da necessidade

Suponha agora que α ∈ A ´e ´otima, vamos provar primeiro que τα

(43)

4. Encontrando os pontos de cela

seja, τα

0 () = %0() com  = 0. Como %0 ≤ τ0α q.c. e Qα(· ∧ τ0α) ´e Pα−martingale ent˜ao,

Eα  Zα(%0) + Z %0 0 f (s, X, αs)ds  = Eα  Zα(%0) + Z %0 0 f (s, X, αs)ds|F0  = Zα(0) q.c. Logo, Zα(0) − Eα Z %0 0 f (s, X, αs)ds  = Eα[Zα(%0)] q.c. Observe que, Eα[Zα(%0)] = EαZα(%0) · 1{τ α0 =%0}+ Z α(% 0) · 1{τ α0 >%0} ≥ ≥ EαZα (%0) · 1{τ α0 =%0}+ g(X%0) · 1{τ α0 >%0} = E αZα (%0) · 1{τ α0 =%0}+ V (%0) · 1{τ α0 >%0} ≥ ≥ EαV (% 0) · 1{τ α0 =%0}+ V (%0) · 1{τ α0 >%0} = E α[V (% 0)] q.c. (4.13) A primeira desigualdade de (4.13) segue da pr´opria defini¸c˜ao de Zα; a segunda igualdade de (4.13) vem da defini¸c˜ao de %0 e a segunda desigualdade segue da defini¸c˜ao

de V (·). Da´ı, Zα(0) ≥ Eα  V (%0) + Z %0 0 f (s, X, αs)ds  = = Eα  V (%0) + Z %0 0 f (s, X, αs)ds|F0  = Eα[Rα(%0)|F0] ≥ Rα(0) = V q.c. (4.14)

Sabemos das rela¸c˜oes 3.10 que %0 ≤ τ0α q.c., vamos usar agora um argumento por

contradi¸c˜ao. Suponha que Pα(%0 < τ0α) > 0, pela defini¸c˜ao de τ0α concluimos que

g(X%0) < Z

α(%

0) em {%0 < τα0} e da´ı a primeira desigualdade de (4.13) (e portanto

a segunda desigualdade de (4.14)) seria estrita, mas isto contradiz a hip´otese de α ser ´otima. Portanto %0 = τ0α q.c., um argumento an´alogo pode ser usado para o caso

0 <  < 1.

Vejamos agora a propriedade de thrifty. Como τ0α = %0 q.c. e como, por (4.14),

Eα[Rα(%0)] = Rα(0) q.c., ent˜ao Eα[Rα(τ0α)] = Rα(0) q.c..

Dados t, s ∈ S tais que s ≤ t ≤ τα

0 q.c., como Rα(· ∧ %0) = Rα(· ∧ τ0α) q.c. ´e um Pα−submartingale ent˜ao Eα[Rα(s)] ≤ Eα[Eα[Rα(t)|Fs]] ≤ Eα[Eα[Rα(τ0α)|Ft]] = Rα(0) q.c. Da´ı, Eα[Rα(s)] ≤ Rα(0) q.c. Analogamente por Rα(· ∧ %

Referências

Documentos relacionados

Considerando-se que a fração acetato de etila apresentou um valor de IS semelhante ao detectado para a fração butanólica e superior aos valores de IS encontrados para o extrato

Acreditamos que 2021 seja mais favorável para a economia brasileira, bem como globalmente, e nossas projeções indicam crescimento de 15% nas re- ceitas e acima de 60% nos

Em reunião com o presidente do Tribunal Regional do Trabalho da 10ª Região, desembargador Brasilino Santos Ramos, os coordenadores-gerais do Sindjus-DF Costa Neto e Abdias Trajano,

Quanto às atividades da comunidade, no período de novembro de 2014, as postagens têm uma frequência geralmente diária, sendo que são feitas no mínimo dois posts por

A disputa se deslocava, então, para a questão de saber quais autores tinham mais autoridade, ou eram mais aceitos pelo público.. Daí se deduz que a citação em si, e nem mesmo

Em seguida, foi aplicada a Avaliação Diagnóstica (Apêndice) contendo três questões de conhecimento do assunto abordado e três questões sobre o método

Após a realização das dinâmicas, os participantes relataram quais dificuldades foram encontradas e como poderiam solucionar a questão da falta de acessibilidade, para garantir

hyDRAULIc sUspensIons SUSPENSÃO HIDRÁULICA SuSPenSIÓn HIDrÁulIca hyDRAULIc sUspensIon CapaCidade Capacidad Capacity eiXo eje axle Cilindros Cilindros Cylinders eXCurções