Esperan¸ ca Condicional
A dire¸c˜ao de minha apresenta¸c˜ao de Esperan¸ca Condicional n˜ao muito tradicional, ou, para ser exato, a apresenta¸c˜ao n˜ao tem par em nenhum de livros did´aticos.
Aviso que os assuntos da Se¸c˜ao 1.2.4 foram gravadas em formato de video-aula.
Eis os endere¸cos destas aulas na web-net:
https://drive.google.com/file/d
/12-Lr6sVxVkphRJpIQsfHuWOEUbCLK3Cp/view?usp=sharing https://drive.google.com/file/d
/1daes9wJ3HdDpXK5Oj_tpARGetwDbBzMH/view?usp=sharingAs transparˆencias des- tas duas aulas est˜ao inclusas no texto do cap´ıtulo, no seu apˆendice (Se¸c˜ao 1.3). As transparˆencias est˜ao guardadas em Videos/EsperancaCondicionalAula01/Ensaio01 e Ensaio02
Falando dos exercicios:
(1) Eu pediria que vocˆe desse a aten¸c˜ao ao Exc. 1 que est´a no inicio do cap´ıtulo; ele s´o pede de vocˆe revisar aquilo que voce ja ouviu sobre coisas ”condicionais”.
(2) D´e a aten¸c˜ao ao Exc. 15. Ele fornce uma lista de propriedades da Esperan¸ca Condicional. Por favor, escolhe e fa¸ca de no m´ınimo um item desta lista. Mas fa¸ca da seguinte maneira: primeiramente, aceite que o espa¸co Ω ´e finito e fa¸ca a demostra¸c˜ao usando a constru¸c˜ao expl´ıcita de esperan¸ca condicional que ´e poss´ıvel quando espa¸co ´e finito. E em segunda maneira, fa¸ca a demonstra¸c˜ao que se aplica ao caso gen´erico. Para isto vocˆe s´o tem a defini¸c˜ao gen´erica de esperan¸ca condicional.
Se voce estiver com a dificuldade de execu¸c˜ao da demonstra¸c˜ao aplic´avel ao caso gen´erico, consulte o livro de Shiryaev que apresenta todas as demonstra¸c˜oes.
(3) Por fim, ´e OBRIGAT ´ORIO ”fazer Exerc´ıcio 4. Ele convida vocˆe mostrar que a abordagem de B.J. `a constru¸c˜ao de esperan¸ca condicional est´a errada, no sentido que a abordagem permite uma liberdade na escolha de limite (especificamente falando,
∆y → 0, em termos usados por B.J.) e que tal liberdade faz com que, para certas distribui¸c˜oes de (X, Y), duas escolhas diferentes levam aos valores diferentes da IE[X
Y]. Talvez vocˆe n˜ao vai conseguir construir exemplos de tais distribui¸c˜oes, mas pelo menos, deve tentar. Por favor, dedique de no m´ınimo 2 horas de seu valioso tempo para pensar na solu¸c˜ao deste exerc´ıcio.
65
5.1 Revis˜ ao dos conceitos da Teoria de Probabi- lidade que cont´ em a palavra “condicional”
Exerc´ıcio 49. O presente exerc´ıcio convida vocˆe revisar os conceitos da Teoria de Proabilidade que contˆem a palavra “condicional”. Esta tarefa est´a naturalamente associado `a apresenta¸c˜ao a vir, pois essa versar´a sobre o conceito Esperan¸ca Condi- cional em rela¸c˜ao aσ-´algebra. As pontes de associa¸c˜ao s˜ao m´ultiplas e se revelar˜ao no decorrer da apresenta¸c˜ao.
(a) Define o conceito de probabilidade condicional de um evento Adado um evento B quandoIP[B]>0 (´e o que tradicionalmente denota-se porIP[A
B]).
(b) Define o conceito de distribui¸c˜ao condicional de uma vari´avel aleat´oria X dis- creta dado um evento B quando IP[B]>0. Qual ´e a nota¸c˜ao que vocˆe daria para esse objeto? Existe uma nota¸c˜ao comumente usada?
(c) Para um par de vari´aveis aleat´orias discretas (X, Y), define o conceito de distribui¸c˜ao condicional da vari´avel aleat´oria X dado que Y assumiu valory.
Existe nota¸c˜ao para esse conceito? Sen˜ao, sugere uma.
(d) Define o conceito de esperan¸ca condicional de uma vari´avel aleat´oria X discreta dado um eventoB quandoIP[B]>0 (recorde que a nota¸c˜ao para esse conceito era, ´e, e sempre ser´a IE[X
B]).
(e) Para um par de vari´aveis aleat´orias discretas (X, Y), define o conceito de esperan¸ca condicional da vari´avel aleat´oria X dado que Y assumiu valor y (recorde que a nota¸c˜ao para esse conceito era, ´e e sempre ser´a IE[X
Y =y]).
(f) Para um par de vari´aveis aleat´orias continuas (X, Y), define o conceito de fun¸c˜ao de densidade da distribui¸c˜ao condicional da vari´avel aleat´oria X dado queY assumiu valory. Existe nota¸c˜ao para esse conceito? Sen˜ao, sugere uma.
(g) Para um par de vari´aveis aleat´orias continuas (X, Y), define o conceito de distribui¸c˜ao condicional da vari´avel aleat´oria X dado que Y assumiu valory.
Existe nota¸c˜ao para esse conceito? Sen˜ao, sugere uma.
(h) Para um par de vari´aveis aleat´orias continuas (X, Y), define o conceito de esperan¸ca condicional da vari´avel aleat´oria X dado que Y assumiu valor y.
Existe nota¸c˜ao para esse conceito? Sen˜ao, sugere uma.
(i) Prove a F´ormula de Probabilidade Total para eventos de probabilidade n˜ao nula: se eventos B1, . . . , Bn de probabilidade n˜ao nula formam parti¸c˜ao de Ω (isto ´e, os eventos s˜ao disjuntos e sua uni˜ao equivale a Ω), ent˜ao para qualquer evento A, ocorre que
IP[A] =
n
X
i=1
IP[A
Bi]×IP[Bi] (5.1) (j) Prove a F´ormula Geral de Probabilidade Total (para eventos de probabilidade n˜ao nula) que eu acabei de inventar: se eventos B1, . . . , Bn de probabilidade n˜ao nula formam parti¸c˜ao de Ω, ent˜ao para qualquer eventoA, e para qualquer
evento Dcomposto de alguns dosBi’s (por exemplo,D=B1∪B3∪B7) ocorre que
IP[A∩D] = X
i:Bi⊆D
IP[A
Bi]×IP[Bi] (5.2) (refor¸co: a soma ´e tomada por todos osBi’s que comp˜oem D).
(k) Prove a F´ormula de Esperan¸ca Total que em termos e nota¸c˜oes do item (i) alega o seguinte: para qualquer vari´avel aleat´oria discreta X, ocorre que (a nota¸c˜ao IE[X
Bi] usada abaixo j´a foi lhe recordada no item (d) acima):
IE[X] =
n
X
i=1
IE[X
Bi]×IP[Bi] (5.3) (tenho certeza que essa f´ormula j´a existe, eu s´o inventei nome para ela, e ainda creio eu que o nome por mim inventado coincide com o nome tradicional).
(l) Prove que a F´ormula de Esperan¸ca Total adquire a forma da Eq. (1.4) abaixo no caso quando quando (X, Y) ´e um par de vari´aveis aleat´orias discretas com as seguintes carater´ısticas: X assume valores a1, . . . , am,Y assume os valores b1, . . . , bn.
IE[X] =
n
X
i=1
IE[X
Y =bj]×IP[Y =bj] (5.4) (m) Prove a F´ormula Geral de Esperan¸ca Total que eu acabei de inventar e que aplica-se a par de vari´aveis aleat´orias discretas (X, Y) com as seguintes cara- ter´ısticas: X assume valores a1, . . . , am,Y assume valoresb1, . . . , bn.A f´ormula vale para qualquer conjunto B ⊂ R composto dos valores de Y, quer dizer, composto dos n´umeros b1, . . . , bn, como, por exemplo, {b2, b3}. A f´ormula tem a seguinte aparˆencia:
IE[X1IY−1(B)] = X
j:bj∈B
IE[X
Y =bj]×IP[Y =bj] (5.5)
5.2 A esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra
5.2.1 A constru¸ c˜ ao direta da esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra no caso do espa¸ co finito
Com a presente se¸c˜ao come¸camos nossa an´alise do comportamento da esperan¸ca condicional em rela¸c˜ao aσ-´algebra no caso quando o espa¸co Ω ´e finito. A conclus˜ao a qua aspiramos ´e que no espa¸co finito tal esperan¸ca sempre pode ser contruida ex- plicitamente. A constru¸c˜ao explicita ´e o conte´udo da presente se¸c˜ao. A demostra¸c˜ao da conclus˜ao aspirada estar´a na Se¸c˜ao 1.2.4
Seja Ω um espa¸co de estados finito, isto ´e Ω = {ω1, . . . , ωk} para algum k ∈ N. SejaF aσ-´algebra mais refinada dos conjuntos de Ω (isto ´e, aσ-´algebra tal que{ω} ∈ F para cada ω ∈ Ω). Seja IP uma probabilidade em F. Seja D = {D1, . . . , Dn} uma parti¸c˜ao de Ω, quer dizer, uma cole¸c˜ao de conjuntos diferentes de ∅, que s˜ao disjuntos dois a dois, e cuja uni˜ao ´e Ω.
Para cada Di ∈ D, construa IP[·
Di], a probabilidade condicional dado que ocorreuDi. A constru¸c˜ao desta baseia-se na defini¸c˜ao da probabilidade condicional dado um evento com probabilidade n˜ao nula, a saber: IP[A
Di] =IP[A∩Di]/IP[Di] para todoA∈ F.
Seja agora ξ : Ω → R uma vari´avel aleat´oria qualquer. Para cada i = 1, . . . , k, construimosa esperan¸ca condicional de ξ dado que ocorreu Di que denota-se porIE[ξ
Di] e calcula-se pela seguinte f´ormula:
IE[ξ
Di] = X
ω∈Ω
ξ(ω)IP[ω
Di] (5.6)
A constru¸c˜ao feita at´e agora resultou emn valores num´ericos, os quais s˜ao as es- peran¸cas condicionais{IE[ξ
Di], i= 1,2, . . . , n}. Usaremos esta cole¸c˜ao de valores para criar vari´avel aleat´oria Zξ,D : Ω→R:
para cada ω ∈Ω, Zξ,D(ω) := IE[ξ
Di] onde i´e tal que ω∈Di (5.7) Equivalentemente, podemos dizer que
Zξ,D assume valor IE[ξ
Di] em cada ω que pertence a Di, i= 1,2, . . . , n (5.8) No futuro ser´a mostrado que Zξ,D ´e a esperan¸ca condicional de ξ em rela¸c˜ao `a parti¸c˜ao D no sentido da Defini¸c˜ao 2, mas como tal defini¸c˜ao ainda n˜ao tinha sido formulada, ent˜ao no momento n˜ao podemos usar o nome “esperan¸ca condicional em rela¸c˜ao a parti¸c˜ao”. Por isto, precisamos de um nome tempor´ario paraZξ,D. Vamos chama-la por esperan¸cas condicionais de ξ distribu´ıdas por conjuntos de condicionamento.
E importante observar (para a futura compara¸c˜´ ao deZξ,D com a defini¸c˜ao formal de esperan¸ca condicional em rela¸c˜ao aσ-´algebra) que nossa defini¸c˜ao deZξ,D implica diretamente no que esta vari´avel aleat´oria possui as seguintes propriedades:
Zξ,D ´e D-mensur´avel (5.9) IE[ξ1IDi] = IE[Zξ,D1IDi] para cada Di ∈ D (5.10) A despeito da rela¸c˜ao (1.10) expressar a propriedade da qual necessitaremos na hora da compra¸c˜ao de Zξ,D com a defini¸c˜ao de esperan¸ca condicional, ainda prefiro re- escrever ela na forma mais pr´oxima `as express˜oes usadas na referida defini¸c˜ao. Eis esta abaixo (a equivalˆencia entre (1.10) e (1.11) ´e um fato trivial):
IE[ξ1IC] = IE[Zξ,D1IC], para qualquer C (5.11) feito de uni˜ao de qualquer subcole¸c˜ao da cole¸c˜ao {D1, D2, . . . , Dn} Agora, s´o com o intu´ıto de mostrar que os objetos que apareceram at´e o momento s˜ao simples vou reescrever (1.11) no formato mais usado nos cursos de probabilidade no n´ıvel de gradua¸c˜ao:
X
ω∈C
ξ(ω)IP[ω] = X
ω∈C
Zξ,D(ω)IP[ω], para qualquer C (5.12)
feito de uni˜ao de qualquer subcole¸c˜ao da cole¸c˜ao{D1, D2, . . . , Dn}
Por fim, gostaria de comentar que as rela¸c˜oes derivadas at´e o momento permitem a gente provar a F´ormula de Esperan¸ca Total que apareceu no item (k) do Exc. 1.
Portanto, se vocˆe n˜ao a provou at´e o momento, observe o argumento abaixo. Pri- meiramente, ao tomar C= Ω na f´ormula (1.12), a gente chaga na seguinte rela¸c˜ao:
IE[ξ] =
n
X
i=1
Zξ,D(Di) IP[Di]
onde a nota¸c˜ao Zξ,D(Di) significa o valor de Zξ,D em qualquer ω ∈ Di; recorde que a constru¸c˜ao de Zξ,D garante que esta assume o valor IE[ξ
Di] em qualquer ω ∈ Di, e, portanto, a nota¸c˜ao ´e correta. Mas por que n˜ao substituir esta nota¸c˜ao incomum pela valor IE[ξ
Di]? Ao executar esta substitui¸c˜ao, chegamos `a Formula de Esperan¸ca Total:
IE[ξ] =
n
X
i=1
IE[ξ
Di]IP[Di]
5.2.2 A defini¸ c˜ ao geral da esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra
Meu plano era continuar a exposi¸c˜ao permanencendo no caso finito o tempo m´aximo poss´ıvel. Portanto, o proximo assunto a vir seria a defini¸c˜ao da esperan¸ca condicional em espa¸co finito. Entretanto, j´a que tal defini¸c˜ao ´e a adapta¸c˜ao para caso finito da defini¸c˜ao geral de esperan¸ca condicional, ent˜ao, quebrando meu pr´oprio plano inicial, eu decidi apresentar em primeiro lugar a defini¸c˜ao geral. Ela est´a na presente se¸c˜ao.
O caso finito, que deriva-se dela, fica ent˜ao adiado at´e a se¸c˜ao seguinte.
Defini¸c˜ao 4 geral da esperan¸ca condicional em rela¸c˜ao a σ-´algebra.
A Esperan¸ca condicional de uma vari´avel aleat´oria ξ em rela¸c˜ao a uma σ-´algebra G ´e a vari´avel aleat´oria, a nota¸c˜ao para a qual ´e IE
ξ G
, que defina-se por duas propriedades a seguir:
(a) IE ξ
G
´e mensur´avel em rela¸c˜ao a G;
(b) para cada conjunto A de G vale Z
A
ξ dIP = Z
A
IE ξ
G
dIP. (5.13)
Quando a σ-´algebra G da presente defini¸c˜ao ´e a σ-´algebra gerada por uma vari´avel aleat´oria η, ent˜ao no lugar de IE
ξ G
escreve-se IE ξ
Fη ou IE
ξ η
.
. Eu, pessoalmente, prefiro quando pessoas falam sobre IE ξ
η
que sobre IE ξ
G , pois minha mente possui um modelo simplisto mas intuitivo de IE
ξ η
. Eu s´o vou poder compartilhar contigo meu modelo ap´os ter introduzido o objeto denotado por IE
ξ η=y
. Ele surgir´a na Se¸c˜ao 1.2.9. Minha concep¸c˜ao deIE ξ
η
baseia-se nos fatos e propriedades apresentados no texto ao redor da Eq. (1.25).
5.2.3 Reformula¸ c˜ ao da defini¸ c˜ ao geral para o caso quando o espa¸ co de estados ´ e finito
Nesta se¸c˜ao, eu adapto para espa¸cos finitos os termos da defini¸c˜ao geral da espe- ran¸ca condicional em rela¸c˜ao a σ-´algebra. Recordo lhe que meu plano ´e analizar a esperan¸ca condicional nos espa¸cos finitos antes de partir para o caso geral. O plano foi motivado pela cren¸ca que nossa intui¸c˜ao funciona melhor em espa¸cos finitos de que em cont´ınuos. O caminho de an´alise culmina-se na Se¸c˜ao 1.2.4.
Defini¸c˜ao 5 que reformula a defini¸c˜ao gen´erica para o caso quando o espa¸co de estados ´e finito.
SejaΩum espa¸co de estados finito, sejaF aσ-´algebra mais refinada de seus conjun- tos (isto ´e, a σ-´algebra tal que {ω} ∈ F para cada ω∈ Ω). Seja D={D1, . . . , Dn} uma parti¸c˜ao de Ω. Seja ξ uma vari´avel aleat´oria. Esperan¸ca condicional de ξ em rela¸c˜ao `a parti¸c˜ao D ´e a vari´avel aleat´oria, a nota¸c˜ao para a qual ´e IE
ξ D
, que defina-se por duas propriedades a seguir:
(a) IE ξ
D
´
e mensur´avel em rela¸c˜ao a D;
(b) para qualquer conjunto D expresso como uni˜ao de conjuntos de D vale Z
D
ξ dIP = Z
D
IE ξ
D
dIP (5.14)
o que pode ser re-escrito da seguinte maneira (aproveitando que Ω ´e discreto no caso):
X
ω∈D
ξ(ω)IP[ω] = X
ω∈D
IE ξ
D
(ω)IP[ω]. (5.15)
Quando a parti¸c˜ao D da presente defini¸c˜ao est´a gerada por uma vari´avel aleat´oria η, isto ´e, quando {y1, . . . , yn} s˜ao todos os valores poss´ıveis de η e Di = {η−1(yi}, i = 1, . . . , n, ent˜ao no lugar de IE
ξ D
pode escrever IE
ξ η
.
5.2.4 Em espa¸ co de estado finito, a constru¸ c˜ ao direta e a defini¸ c˜ ao geral coincidem
A presente se¸c˜ao ´e a culmina¸c˜ao da an´alise de estrutura que a esperan¸ca condicional em rela¸c˜ao aσ-´algebra adquire nos espa¸cos finitos. Aqui, provaremos que a vari´avel aleat´oria construida diretamente na Se¸c˜ao 1.2 coincide com a vari´avel aleat´oria de- finida indiretamente pela defini¸c˜ao tradicional que foi formulada na Se¸c˜ao 1.2.3.
Isto nos d´a o controle absoluto sobre a esperan¸ca condicional em espa¸cos finitos, e, ao mesmo tempo, desenvolve nossa intui¸c˜ao que nos ajudar´a nos trabalhos que envolvem esperan¸ca condicional em espa¸cos cont´ınuas.
Foram gravadas duas aulas sobre a coincidˆencia supracitada. A primeira est´a pelo seguinte endere¸co:
https://drive.google.com/file/d
/12-Lr6sVxVkphRJpIQsfHuWOEUbCLK3Cp/view?usp=sharing A segunda video-aula est´a pelo seguinte endere¸co:
https://drive.google.com/file/d
/1daes9wJ3HdDpXK5Oj_tpARGetwDbBzMH/view?usp=sharing
As transparˆencias destas duas video-aulas est˜ao no Apˆendice ao caopitulo 1
5.2.5 O conceito da vida real o qual desejamos imitar pelo objeto matem´ atico chamado “esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra”
De acordo com meu plano de ensino, no presente momento vocˆe, meu leitor, j´a deve estar com uma plena concep¸c˜ao do conceito de esperan¸ca condicional em rela¸c˜ao a partic˜ao. (S´o lhe recordo que este conceito aplica-se somente no caso quando o espa¸co de estados ´e finito.) Como acredito que meus leitores devem ter adquirido bastante experiˆencia com modelos em espa¸cos finitos antes de ler meu texto, ent˜ao espero que minha exposi¸c˜ao sobre a esperan¸ca condicional nos espa¸cos finitos seja suficientemente esclarecidora para meus leitores. A dispeito desta convic¸c˜ao, decidi apresentar ainda um exemplo que pode ser ´util para solidifica¸c˜ao da compreen¸c˜ao de estrutura da esperan¸ca condicional em rela¸c˜ao a parti¸c˜ao.
↓ Exemplo 1. F´abio, dono de um barzinho, tinha anotado o consumo di´ario de cerveja (a quantidade de garrafas vendidas). As anota¸c˜oes foram colocadas num caderno, mas separadas por p´aginas, sendo que cada p´agina corresponde `a tempe- ratura do dia no qual foi feita a anota¸c˜ao (imagine para simplicidade que durante dia a temperatura n˜ao muda). No final de cada p´agina, F´abio fez a m´edia simples dos valores da p´agina. N´os vamos denotar por ¯xt a m´edia calculada pelo F´abio na p´agina correspondente `a temperatura t (t = 7,8, . . . ,45); nesta nossa nota¸c˜ao, x signifca a quantidade de garrafas consumidas. As m´edias ajudam a F´abio calcular o estoque de cerveja para dia seguinte de acordo com seu desejo de que o estoque deve corresponder ao consumo esperado. Tal consumo, a ser denotado por ¯x, calcula-se pelo F´abio segundo a seguinte f´ormula:
¯
x= X
t=7,...,45
¯
xtIP[t] (5.16)
onde IP ´e a distribui¸c˜ao probabil´ıstica que expressa a previs˜ao da temperatura do dia seguinte.
Fim do Exemplo 1↑ No resto da presente se¸c˜ao, vou associar alguns conceitos do Exemplo 1 com suas contrapartes desenvolvidas na teoria apresentada at´e o momento.
Vou denotar por (Ω,F, IP) o modelo probabil´ıstico da situa¸c˜ao descrita no exem- plo. A informa¸c˜ao cont´ıda no exmeplo n˜ao nos permite a construir o modelo em todos os detalhes, mas para n´os ´e suficente saber que ele existe e que Ω dele ´e finito.
Definirimos em Ω duas vari´aveis aleat´orias, X e Y. X corresponde ´a quantidade di´aria de garrafas vendidas e Y corresponde ´a temperatura. Partimos o espa¸co Ω nas faxas Dt := {ω ∈ Ω : Y(ω) = t}. Naturalmente, existe a distribui¸c˜ao de X condicionada pelo Dt (que ´e a mesma coisa que condicionar por {Y = t}). Os va- lores anotados pelo F´abio na p´agina de seu caderno correspondente `a temperatura t s˜ao uma amostra da distribui¸c˜ao de X condicionada por {Y = t}. A m´edia dos
valores anotados ´e uma aproxima¸c˜ao `a IE[X
Y =t], quer dizer, ¯xt ´e a contraparte amostral do conceito te´oricoIE[X
Y =t], e finalmente, a f´ormula (1.16) usada pelo F´abio ´e a contraparte da F´ormula de Esperan¸ca Total.
5.2.6 O que impede o funcionamento da constru¸ c˜ ao direta nos espa¸ cos cont´ınuos
Imagine um par de vari´aveis aleat´orias cont´ınuas (X, Y), por exemplo, normal bi- variada. Para tal par, escolho arbitrariamente y ∈ R e pergunto: “Consigo definir IE[X
Y = y] seguindo o caminho que mostrou ser eficiente no caso de espa¸co discreto?” A resposta ´e “n˜ao”. O problema ´e que este caminho n˜ao sabe construir a probabilidade condicionalIP[·
{Y =y}] quandoIP[Y =y] = 0.
O mesmo problema ocorre com IE[X
G] caso G cont´em conjuntos de medida nula que s˜ao diferentes de ∅.
5.2.7 Como a defini¸ c˜ ao geral contorna o problema de im- possibilidade de condicionamento por eventos de pro- babilidade nula
Realmente, como? Minha impress˜ao ´e que a defini¸c˜ao geral delega o problema de condicionamento por eventos de probabilidade nula para o Teorema de Radon- Nikodym. Especificamente, a defini¸c˜ao geral n˜ao procura construir a esperan¸ca condicional diretamente, mas fica satisfeita com o simples fato de sua existˆencia o qual ela estabelece com ajuda do teorema de Radon-Nikodym. Eis como isto tudo acontece no caso quandoξ´e n˜ao negativa (o caso geral est´a apresentado no livro de Shiryaev).
Seja ent˜ao (Ω,F, IP) um tr´ıplice probabil´ıstico (no qual Ω n˜ao ´e finito, e ´e rico o suficiente para abrigar vari´aveis aleat´orias cont´ınuas e σ-´algebras com conjuntos de medida nula), sejaG uma sub-σ-´algebra de F e sejaξ uma vari´avel aleat´oria n˜ao negativa. Vamos us´a-la para definir Q:
Q(A) :=
Z
A
ξdIP para cada A∈ G (aten¸c˜ao! A∈ G) (5.17) E f´´ acil verificar que Q´e uma medida em (Ω,G) e que Q´e absolutamente cont´ınua em rela¸c˜ao `a medida originalIP (a rela¸c˜ao das duas medidas est´a sendo considerada em (Ω,G)). Ent˜ao, via a aplica¸c˜ao do teorema de Radon-Nikodym, sabemos que existe vari´avel aleat´oria Z que ´eG-mensur´avel e para qual vale
Q(A) = Z
A
ZdIP para cada A∈ G (5.18)
e, consequntemente, vale Z
A
ξdIP = Z
A
ZdIP para cada A ∈ G
conforme segue-se da compara¸c˜ao entre (1.17) e (1.18). Isto tudo quer dizer que a vari´avel aleat´oria Z ´e o que a Defini¸c˜ao 1 chama deIE[ξ
G].
Real¸co que o argumento acima ´e a prova da existˆencia de IE[ξ
G] em qualquer (Ω,F, IP) e para quaisquer G e ξ. Real¸co que a prova ´e indireta e ampara-se forte- mente no Teorema de Radon-Nikodym e que este ´e um t´ıpico teorema de existˆencia, quer dizer, teorema que afirma existˆencia de um objeto (no caso, a derivada de Radon-Nikodym) sem fornecer-nos ferramentas para sua explicita constru¸c˜ao.
. O argumento agora apresentado serve de motiva¸c˜ao para seu estudo do Teorema de Radon-Nikodym. Ao ver a demonstra¸c˜ao deste, vocˆe vai sentir que a constru¸c˜ao de esperan¸ca condicional em rela¸c˜ao a σ-´algebra requer uso de ferramentas bem refinadas.
5.2.8 Mais dois exemplos
Os futuros argumentos v˜ao precisar de dois exemplos. A presente se¸c˜ao destina- se `a apresenta¸c˜ao de ambos. A apresenta¸c˜ao emprega conceitos que n˜ao foram rigorosamente definidos at´e o momento. Isto tem seus motivos, os quais s˜ao pura- mentemente did´aticos. Saiba que at´e o final da Se¸c˜ao 1.2, cada conceito adquirir´a sua digna defini¸c˜ao.
↓ Exemplo 2. Defina-se par de vari´aveis aleat´orias (X, Y) da seguinte maneira Y vari´avel aleat´oria exponencial de parˆametro 1, (5.19) enquanto que acerca de X n˜ao fala-se nada sobre sua distribui¸c˜ao, e postula-se somente que
a esperan¸ca de X sabendo queY =y´e (1 +y2)−1 (5.20) Claro que por n˜ao ter definido a distribui¸c˜ao de X, o modelo est´a incompleto, e, em particular, a informa¸c˜ao aqui fornecida n˜ao ´e suficiente para construir a distribui¸c˜ao conjunta de (X, Y).
Fim do Exemplo 2↑
↓ Exemplo 3. Defina-se par de vari´aveis aleat´orias (X, Y) da seguinte maneira: Y tem a distribui¸c˜ao (1.19), enquanto que
X
Y =y ∼ N (1 +y2)−1; 1
(5.21) quer dizer, dado que Y assumiu valor y, X tem distribui¸c˜ao normal com m´edia (1 +y2)−1 e variˆancia 1.
Fim do Exemplo 3↑
5.2.9 Uma viz˜ ao alternativa na esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra
A esperan¸ca condicional deξ em rela¸c˜ao aη pode ser concebida em duas formas. A primeira delas ´e a que est´a definida pela Defini¸c˜ao 1; ela ´e uma vari´avel aleat´oria (se- gundo `a pr´opria defini¸c˜ao). Recordo que ela denota-se porIE[ξ
Fη] ou porIE[ξ η].
A segunda das duas formas de express˜ao/concep¸c˜ao de esperan¸ca condicional su- pracitada ´e fun¸c˜ao R → R. Nesta se¸c˜ao, vou defin´ı-la, explicar sua rela¸c˜ao com a primeira, e falar das vantagens de cada uma. A fun¸c˜ao ser´a denotada aqui por m
seguindo a nota¸c˜ao usada pelo Shiryaev. Acredito que sua escolha foi motivada pelo termo “mathematical expectation” que ´e um dos nomes que pode ser dado a tal fun¸c˜ao.
Exemplo da fun¸c˜ao m ´e m(y) = (1 +y2)−1, y ∈ R que aparece nos Exemplos 2 e 3. Eu antecipei a apresenta¸c˜ao formal por men¸c˜ao destes exemplos pois desejava que meu leitor preste a aten¸c˜ao que m ´e fun¸c˜ao de R em R. Seria bom se este fato supreendesse vocˆe, pois isto garantiria que preste a aten¸c˜ao a todos os detalhes de constru¸c˜ao de m.
Vamos `a execus˜ao do programa tra¸cada no in´ıcio da se¸c˜ao: definir m, justificar que a defini¸c˜ao est´a correta, descobrir para que serve m, e, por fim, descobrir sua contraparte no mundo real.
Pego (Ω,F, IP) qualquer e duas vari´aveis aleat´orias ξ e η. Pego IE[ξ Fη] cuja existˆencia est´a garantida (pela nossa discuss˜ao da Se¸c˜ao 1.2.7). Observo que a condi¸c˜ao (a) da Defini¸c˜ao 1.13) garante que IE[ξ
Fη] ´e fun¸c˜ao Fη mensur´avel.
Essa imposi¸c˜ao da defini¸c˜ao junto com Teorema formulado na se¸c˜ao sobre vari´aveis aleat´orias (veja sua formula¸c˜ao no Exc. 2) garantem que
existe fun¸c˜ao boreleana m :R→R tal que IE ξ
Fη
(ω) =m(η(ω)),∀ω ∈Ω (5.22) Note que embora a afirma¸c˜ao acima est´e quantificada “∀ω”, o argumento dem est´a em R, pois os valores deη(ω) est˜ao em R.
Observa¸c˜ao. A afirma¸c˜ao contida na Eq. (1.22) deve ser corrigida substituindo
“m : R → R” por “m : R → R (a corre¸c˜ao que de fato, Shiryaev faz no livro dele). A raz˜ao para a corre¸c˜ao ´e assim: emboraξ e η s˜ao fun¸c˜oes que n˜ao assumem nem ∞ nem −∞, suas integrais podem assumir esses valores. Acontece que a esperan¸ca condicional que aparece na Eq. (1.22) est´a ligada as integrais (eu n˜ao pretendo detalhar a afirmada liga¸c˜ao) ent˜ao para algunsω pode haver a necessidade de definir que m(η(ω)) = +∞ ou −∞. ´E da´ı que surge a necessiade de considerar m como fun¸c˜ao R → R. Entretanto, com o intuito de facilitar minha exposi¸c˜ao via a exclus˜ao de casos “patal´ogicos” que desviam aten¸c˜ao sem trazer nenhuma informa¸c˜ao nova a valiosa, eu vou considerar m como fun¸c˜aoR→R
Otimo! Mas para que m serve e qual seria sua interpreta¸c˜ao? Para podermos responder nesta pergunta, vamos substituir (1.22) na parte da direita de condi¸c˜ao (b) da Defini¸c˜ao 1.13, quer dizer, na parte da direita de (1.13). Tem-se que
Z
A
ξ(ω)dIP(ω) = Z
A
m(η(ω))dIP(ω) para cada A∈ Fη (5.23) Na integral do lado direito da (1.23), vamos fazer a troca de vari´aveis. Eis os detalhes da troca:
◦do espa¸co (Ω,F) para o espa¸co (R,B);
◦da medida IP para a medida IPη induzida emB pela vari´avel aleat´oria η;
e eis a f´ormula (fornecida pelo Teorema sobre a troca de vari´avel em integral de Lebesgue):
Z
C
g(x)IPη(dx) = Z
η−1(C)
g(η(ω))IP(dω), C ∈ B
O resultado da troca de vari´avel est´a na Eq. (1.24) abaixo; nesta equa¸c˜ao, n´os escrevemos A = η−1(B) na integral ao lado esquerdo com o intu´ıto de indicar a rela¸c˜ao entreA e B que surgiu devido `a troca de vari´avel.
Z
A=η−1(B)
ξ(ω)dIP(ω) = Z
B
m(y)dIPη(y) para cada B ∈ B(R) (5.24) A rela¸c˜ao (1.24) ser´a o ponto de partida para meus futuros argumentos que respon- der˜ao `a pergunta “Para que serve m?”
Vamos ver agora se temos respostas nas perguntas acerca de m. Quanto `a de- fini¸c˜ao, esta est´a na Eq. (1.22). O texto que precede esta equa¸c˜ao serve de justifica- tiva que nos permite alegar que a defini¸c˜ao est´a correta.
Em rela¸c˜ao `a discuss˜ao sobre a defini¸c˜ao, surge naturalmente a quest˜ao se a mesma ´e construtiva. Minha opini˜ao a respeito ´e que sim. De fato, se vocˆe possui (Ω,F, IP), η (como fun¸c˜ao Ω → R) e IE[ξ
Fη] (tamb´em como fun¸c˜ao de Ω a R), ent˜ao vocˆe consegue descobrir o valor de m(y) para qualquer y da imagem de η:
m(y) =IE[ξ
Fη](ω) ondeω deve ser escolhido de tal sorte que η(ω) =y.
A resposta dada no final do parˆagrafo acima levanta a d´uvida: “´E poss´ıvel que existam ω1 6= ω2 tais que η(ω1) = η(ω2) mas IE[ξ
Fη](ω1) 6= IE[ξ
Fη](ω2)?” A motiva¸c˜ao da d´uvida est´a clara: se isto fosse poss´ıvel ent˜ao a constru¸c˜ao m(y) = IE[ξ
Fη](ω) n˜ao seria poss´ıvel. Como a constru¸c˜ao est´a correta, n´os temos que admitir que a resposta `a pergunta ´e “n˜ao”. Mas o que garante o tal “n˜ao”? A resposta na ´ultima pergunta ´e: “A exigˆencia queIE[ξ
Fη] deva serFη-mensur´avel.”
E esta exigˆ´ encia que garante a propriedade de que IE[ξ
Fη](ω) assume o mesmo valor em cadaω ∈ {η−1(y)}. Alias, esta propriedade sugere usar a nota¸c˜ao
IE[ξ
η =y] (5.25)
para o valor deIE[ξ
Fη](ω) em cada ω ∈ {η−1(y)}. Note que (1.25) est´a obrigada a ser o valor dem(y) e ´e por isto que (1.25) ´e a nota¸c˜ao alternativa para m(y).
Fant´astico! Adorei a maneira que achei para introduzir a nota¸c˜aoIE[ξ
η=y] e explicar seu sentido.
Agora vamos voltar ´a nossa discuss˜ao acerca da rela¸c˜ao entre IE[ξ
Fη] e m e vamos colocar a pergunta no sentido oposto daquela pergunta que respondida agora, a saber: “Se vocˆe possui (Ω,F, IP), η (como fun¸c˜ao Ω → R) e m (como fun¸c˜aoR→R), vocˆe ent˜ao consegue construirIE[ξ
Fη] (tamb´em como fun¸c˜ao de Ω aR)?” A resposta ´e “sim” e o m´etodo de constru¸c˜ao segue-se naturalmente a partir das propriedades acima descritas. Eis este: Em primeiro lugar, tem que percorrer por todos os valores de y ∈ R e construir {η−1(y)} para cada y. Tais conjuntos formar˜ao uma parti¸c˜ao de Ω (a parti¸c˜ao n˜ao tem obriga¸c˜ao de conter um n´umero finito de conjuntos). Em cada conjunto desta parti¸c˜ao, o valor deIE[ξ
Fη] ´em(y).
As duas perguntas e suas respectivas respostas tratadas acima ajudam-me a vizualisar a vari´avel aleat´oria IE[ξ
Fη]. O problema com a vizualisa¸c˜ao surge por causa dos conjuntos de medida nula (isto foi explicado na Se¸c˜ao 1.2.6. Para contornar este problema, eu imagino uma fun¸c˜ao m do tipo de (1 + y2)−1 que aparece nos Exemplos 2 e 3 (tipicamente, eu escolho uma fun¸c˜ao ainda mais simples), depois eu imagino (Ω,F, IP) e η tal que {ω ∈ Ω : η(ω) = y} tem IP-medida nula, mas s˜ao visuliz´aveis (por exemplo Ω = [0,1]×[0,1] e η(u, v) = u2). Por fim, eu visualizo
IE[ξ
Fη] como a vari´avel aleat´oria que assume valorm(y) em cima de cada{η−1(y)}.
Espero que isto tudo lhe sirva tamb´em, quando for necess´ario.
Recorde que at´e o momento n˜ao respondemos na pergunta “Para que serve m?”
De fato, existeIE[ξ
Fη] e existe m e elas s˜ao intercambi´aveis, conforme mostramos acima. “Qual ´e a diferen¸ca entre as duas na perspectiva de sue uso?” ´e a pergunta intriscicamente ligada `a pergunta sobre a utilidade de m. O caminho de resposta est´a indicado pelo gigante da Teoria de Probabilidade, nosso amigo Shiryaev. Eis a cita¸c˜ao da p´agina 263: “From an intuitive point of view, the conditional expectation IE
ξ
η = y
(isto ´e, m(y) – acrescimo meu) is simpler and more natural than IE
ξ Fη
. However, IE ξ
Fη
, considered as a Fη-measurable random variable, is more convenient to work with.”
Sendo guido por esta frase, eu olho na rela¸c˜ao Z
A
ξ dIP = Z
A
IE ξ
Fη
dIP. (5.26)
que copiei da Defini¸c˜ao 1, comparo-la com (1.24) e concluo que se precisasse calcular R
Aξ dIP, usaria ent˜ao (1.24) pois no seu lado direito h´a integral de Lebesgue-Stiltijes, a qual eu consigo calcular, diferentemente da integral de Lebesgue que fica no lado direito de (1.26), a qual eu n˜ao saberia calcular. Esta ´e a “praticidade” que m possui. Uma outra practicidade ´e que ´e mais f´acil conceber m de que IE
ξ Fη
; sobre isto eu j´a discursei acima.
Exerc´ıcio 50. Nos argumentos da presente se¸c˜ao, foi usado o seguinte
Teorema. Seja φ vari´avel aleat´oria Fη-mensur´avel. Ent˜ao existe fun¸c˜ao boreliana f :R→R tal que φ =f ◦η, isto ´e, φ(ω) = f(η(ω)), para cada ω ∈Ω.
Este resultado foi formulado no Cap´ıtulo 3 no qual apresentei as propriedades b´asicas de vari´aveis aleat´orias. Agora que vocˆe viu a utilidade do teorema, pode voltar ao Cap´ıtulo 3 e ler a demonstra¸c˜ao.
Exerc´ıcio 51. Nos argumentos da presente se¸c˜ao, foi usado o teorema sobre troca de vari´avel em integral de Lebesgue. Agora que vocˆe viu sua utilidade, pode voltar ao Cap´ıtulo 4 e ler a demonstra¸c˜ao.
5.2.10 O caminho da defini¸ c˜ ao de esperan¸ ca condicional via probabilidade condicional
Existem outras maneiras para a defini¸c˜ao da esperan¸ca condicional em rela¸c˜ao a σ-´algebra? Se vocˆe fez meu Exerc´ıcio 1, sua resposta nesta pergunta ´e “sim, h´a uma a mais”. A maneira que vocˆe tem em mente est´a motivada por itens (b), (c), (f) e (g) do exerc´ıcio, e sua descri¸c˜ao informal ´e assim: primeiramente, construir a distribui¸c˜ao condicional de ξ dado que η assume valor y, e depois calcular a esperan¸ca em rela¸c˜ao da distribui¸c˜ao constru´ıda. Eu concordo com sua resposta, e ainda acrescento que a maneira de c´alculo por vocˆe sugerida vai resultar naquilo que denotamos por IE[ξ
η = y] na Se¸c˜ao 1.2.9, quer dizer, a maneira por vocˆe sugerida ´e realmente uma alternativa `a constru¸c˜ao deIE[ξ
η=y] que foi executada naquela se¸c˜ao. Entretanto, tudo que eu falei acima acerca de sua maneira, est´a por enquanto v´alido somente nos casos considerados pelos itens (b), (c), (f) e (g) do
Exerc´ıcio 1. Qual gen´erica esta maneira ´e continua ser uma pergunta que n˜ao pode ser respondida por m´etodos e ferramentas desenvolvidos at´e agora.
E importante que vocˆ´ e saiba que ´e poss´ıvel construir abordagem matematica- mente rigorosa que produz o objeto chamadoa probabilidade condicional con- dicionada ao evento {η =y} quando ´e aplicada ao espa¸co arbitr´ario (Ω,F, IP) e vari´avel aleat´oria arbitr´aria η. Ainda mais, ´e poss´ıvel mostrar que ao tomar espe- ran¸ca de uma vari´avel aleat´oria ξem rela¸c˜ao desta probabilidade condicional, ent˜ao o resultado coincidir´a com IE[ξ
η = y] que foi definida nas se¸c˜oes anteriores pela abordagem diferente daquela sobre a qual estamos falando agora.
A abordagem matematicamente rigorosa supracitada obriga a entrar na cons- tru¸c˜ao e discuss˜ao de regular condicional probability. Toda a abordagem en- contra problemas t´ecnicos cujas solu¸c˜oes exigem muito cuidado. Vocˆe pode ver os detalhes no livro de Shiryaev. Eu n˜ao vou incluir tudo isto no meu curso devido ao limite do tempo de sua dura¸c˜ao (que ´e tipicamente um semestre). Entretanto, vocˆe deve saber que ´e a teoria de probabilidades condicionais regulares que ampara a existˆencia e revela as propriedades das distribui¸c˜oes condicionais sobre as quais versam os itens (b), (c), (f) e (g) do Exerc´ıcio 1, o Exemplo 3 (veja a Eq. (1.21)).
5.2.11 Desconhe¸ co m´ etodo universal capaz de construir a esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra em qual- quer espa¸ co com medida e qualquer vari´ avel aleat´ oria
Sim, esta seria minha resposta se vocˆe viesse com o seguinte pedido: “Vou lhe trazer (Ω,F, IP),G ⊆ F eξ ao meu gosto e vou lhe pedir a construirIE[ξ
G]. Vai poder?”
Minha dificuldade est´a situada principalmente no fato que a demonstra¸c˜ao do Teorema de Radon-Nikodym n˜ao ´e construtiva, e portanto n˜ao permite construir explicitamente aquele objeto cuja existˆencia est´a alegada pelo teorema e cujo papel
´e garantir a existˆencia de IE[ξ G].
Minha experiˆencia relacionada a sua pergunta diz que cada caso requer abor- dagem adaptada a suas particularidades para que se possa construir IE[ξ
G]. Um dos casos ´e quando Ω ´e finito. Este foi resolvido na Se¸c˜ao 1.2.4. Os casos nos quais Ω ´e mais que enumer´avel tipicamente efrentam a dificuldade relatada no par´agrafo acima. Em tais casos, eu usaria qualquer m´etodo e id´eia para adivinhar a cara de IE[ξ
G], e depois confirmaria que este ´e a esperan¸ca condicional desejada via a verifica¸c˜ao da igualdade
Z
A
ξ dIP = Z
A
IE ξ
G
dIP (5.27)
Esta ´e a rela¸c˜ao da pr´opria defini¸c˜ao de IE[ξ
G], e a verifica¸c˜ao de sua validade parece me ser o ´unico caminho que leva `a confirma¸c˜ao que uma vari´avel aleat´oria atende aos quesitos para ser IE[ξ
G].
Observe entretanto que a verifica¸c˜ao da igualdade supraformulada deve ser feita para cada A ∈ G o que ´e um trabalho n˜ao trivial. Uma outra complica¸c˜ao com tal verifica¸c˜ao ´e a dificuldade no c´alculo de valores num´ericos das integrais envolvidas; a dificuldade surge devido ao fato de que as integrais s˜ao de Lebesgue e n´os n˜ao temos m´etodo gen´erico para tal c´alculo. Al´ıas, o ´unico caminho universal para o c´alculo de integral de Lebesgue ´e via a transforma¸c˜ao desta `a integral de Riemann-Stiltjes.
Este fato explica a raz˜ao pela qual o problema de constru¸c˜ao de IE[ξ
G] formula-se predominantemente nos espa¸cos Rn.
Uma maneira para lidar com o pedido “construaIE[ξ
G]” ´e n˜ao tentar construir a vari´avel aleat´oria solicitada, mas, em vez dela, construir a fun¸c˜ao m (definida e analisada na Se¸c˜ao 1.2.9). A vantagem desta substitui¸c˜ao est´a no que com ela ser´a necess´ario a verifica¸c˜ao da rela¸c˜ao
Z
A=η−1(B)
ξ(ω)dIP(ω) = Z
B
m(y)dIPη(y) para cada B ∈ B(R) (5.28) em vez da rela¸c˜ao (1.27). Observe que a integral `a lado direito ´e de Riemann- Stiltjes, logo, calcul´avel, enquanto que a integral `a lado esquerdo pode substitu´ıdo pela integral de Riemann-Stiltjes, tamb´em calcul´avel, se passar para a distribui¸c˜ao induzida pelaξ em (R,B):
Z
ξ(ω)dIP(ω) −→
Z
xdIPξ(x)
5.2.12 Como viver esta vida sem poder construir a espe- ran¸ ca condicional em rela¸ c˜ ao a σ-´ algebra?
Acontece que ´e extremamente raro que surge a necessidade em construir explicita- mente a esperan¸ca condicional em rela¸c˜ao a σ-´algebra. Na realidade, eu, at´e agora, n˜ao vi nenhuma.
Em estudos te´oricos, ´e suficiente saber que tal esperan¸ca condicional existe, e um estudo te´orico que envolve tal esperan¸ca est´a completamente “satisfeito” com as propriedades desta esperan¸ca, do tipo daqueles que aparecem nos exerc´ıcios da Se¸c˜ao 1.4. Um exemplo de tal estudo ´e qualquer an´alise de processos estoc´asticos com emprego de martingais.
Em estudos pr´aticos a esperan¸ca condicional n˜ao est´a calculada, mas sim imposta como um dos ingradientes da constru¸c˜ao de modelo probabil´ıstico. Exemplos 2 e 3 s˜ao casos de tal imposi¸c˜ao. Para entender aquilo que acontece em estudos de modelos continuos com objetivos de revela¸c˜ao de conclus˜oes pr´aticas, ´e precisa entender a constru¸c˜ao de tais modelos. Acontece que a realidade nunca ´e cont´ınua. Isto faz com que um modelo probabil´ıstico fiel a situa¸c˜ao real ´e sempre finito. Se em tal modelo vocˆe modelar um atributo por X e um outro por Y, ent˜ao X e Y s˜ao vari´aveis aleat´orias discretas, e, devido `a tal discretidade, vocˆe sempre pode calcular IE[X
Y]. Num certo etapa de estudo, vocˆe pode querer substituir seu modelo finito pelo modelo cont´ınuo (querer pela simples raz˜ao de haver muito mais ferramentas matem´aticas aplic´aveis aos modelos cont´ınuas de que aos modelos finitos). Se vocˆe substituirX eY porξeηrespectivamente, ent˜aoIE[ξ
η] deve ser aproxima¸c˜ao para IE[X
Y]. Em outras palavras, na passagem de modelo finito para cont´ınuo, vocˆe j´a deve “inventar” as distribui¸c˜oes de ξ, η e IE[ξ
η] de tal forma que estes estejam boas aproxima¸c˜oes para X, Y e IE[X
Y]. Em muitos situa¸c˜oes desta matureza, constroi-se primeiramente a distribui¸c˜ao de Y, depois, constroi-se a distribui¸c˜ao de X dado que Y =y, e a partir destas duas, constroi-se a distribui¸c˜ao de X.
5.2.13 Se vocˆ e viu constru¸ c˜ ao universal da esperan¸ ca con- dicional que funciona para qualquer espa¸ co cont´ınuo ent˜ ao ela provavelmente est´ a errada
H´a um livro did´atico absolutamente maravilhoso. E “Probabilidade; Um Curso´ Intermedi´ario” de Barry James. Eu ainda devo ao autor do livro uma p´agina de texto cheia de elogios pela sua escolha de material apresentado e pela forma de apresenta¸c˜ao. Mas isto vou fazer no futuro. Agora s´o vou falar da maneira como o livro constroi a esperan¸ca condicional em rela¸c˜ao a σ-´algebra.
E precisa ter em mente que livro destina-se aos alunos de n´ıvel intermedi´´ ario e que, consequentemente, suas constru¸c˜oes e demonstra¸c˜oes s˜ao adaptadas a tal n´ıvel.
Em particular, h´a no livro a constru¸c˜ao adaptada para constru¸c˜ao da distribui¸c˜ao de vari´avel X dado que outra vari´avel Y assumiu valory. Depois, via tal distribui¸c˜ao, o livro calculaIE[X
Y =y]. Este ´e a fun¸c˜ao m de nossa Se¸c˜ao 1.2.9. Segundo aos argumentos daquela se¸c˜ao, conclui-se que est´a constru´ıda tambem IE[X
GY].
Infelizmente, existem pessoas que estudaram pelo este livro e ficaram com a impress˜ao que sua maneira de constru¸c˜ao da esperam¸ca condicional ´e universal. Pior que isto, parece-me que h´a professores que contribuem para o espalhamento desta maneira, e, consequentemente, h´a programas de doutorado no Brasil cujos alunos aprendem esta maneira na aulas sem serem avisados sobre n˜ao universalidade dela e sobre o fato que a maneira ensinada ´e a adapta¸c˜ao did´atica mas n˜ao rigorosa feita para atender alunos que desejam entender a Teoria de Probabilidade somente no n´ıvel intermedi´ario.
Para salvar a p´atria, ´e, portanto, imprescind´ıvel fazer o seguinte exerc´ıcio:
Exerc´ıcio 52. Recorde a abordagem de constru¸c˜ao da distribui¸c˜ao de vari´avel X dado que outra vari´avelY assumiu valory que foi sugerida em “Probabilidade; Um Curso Intermedi´ario” de Barry James. Mostre que a abordagem apresenta falhas.
Dica: Eu lembro ter mostrado que a abordagem possui falhas. Infelizmente, n˜ao lembro onde guardei o exemplo que contrui. Mas lembro que a deficiˆencia da abor- dagem est´a a arbitrariedade da forma como ∆y converge a y (ambas as nota¸c˜oes est˜ao definidas na constru¸c˜ao da abordagem). Meu exemplo era uma distribui¸c˜ao conjunta de X eY, e duas maneiras de diminuir ∆y ao valor de y da sorte tal que as maneiras resultavas em distribui¸c˜oes diferentes de X dado Y =y.
5.3 Apˆ endice ao Cap´ıtulo 1
5.3.1 As transparˆ encias da primeira video-aula sobre Espe-
ran¸ ca Condicional
5.3.2 As transparˆ encias da segunda video-aula sobre Espe-
ran¸ ca Condicional
5.4 Exerc´ıcios do Cap´ıtulo 1
Exer. 53. O presente exerc´ıcio est´a aqui para lhe lembrar que ´e importante que vocˆe responda em todos os itens do Exc. 1.
Alguns conceitos e termos usados no exerc´ıcio supracitado precisam de esclare- cimentos. Vamos nessa.
A distribui¸c˜aode vari´avel aleat´oria X entende-se como a medida nos conjuntos deB(R) induzida pela fun¸c˜ao boreleanaX : Ω→Ra partir de medidaIP (da trinca (Ω, IP,F)).
No caso quandoX´e discreta, a suadistribui¸c˜aopode ser apresentada pela tabela que contem todos os valores queX pode assumir junto com as respectivas probabili- dades (se desejar o nome mais cient´ıfica, pode falar de fun¸c˜ao que mapeia o conjunto de valores de X ao intervalo [0,1], mas eu gosto da maniera mais profana, isto ´e,
“tabela”). Da mesma maneira, por distribui¸c˜ao de um vetor (X, Y) de vari´aveis aleat´orias discretas est´a entendida uma tabela que cont´em todos os pares de valores e todas as respectivas probabilidades, como, por exemplo, a de baixo:
Y y1 y2 X
x1 p11 p12 x2 p21 p22 x3 p31 p32
Observe que a distribui¸c˜ao de par (X, Y) pode ser dada em forma de valores e probabilidades {pij}, como no caso da tabela acima, e pode tamb´em ser dada por uma maneira alternativa que ser´a apresentada em seguida. Antes da apresenta¸c˜ao, s´o quero avisar que a informa¸c˜ao por ela carregada ´e importante somente para o destaque de uma particularidade da tarefa formulada no item (l) da Lista de Nomes e Propriedades. Ent˜ao, a maneira alternativa ´e a seguinte: apresenta-se Ω (discreto), apresenta-se IP para cada ω ∈ Ω, e por fim, apresentam-se os conjuntos {Aij} que satisfazem a seguinte propriedade: em Aij, o valor de X ´e xi e o valor de Y ´e yj. Observe a respeito disso, que eu propositamente evitei esse caminho alternativo quando formulei o item (l), pois com o uso dessa maneira a f´ormula final n˜ao seria a Eq. 1.5, mas a seguinte equa¸c˜ao
IE[X1ID] =X
j∈J
IE[X
Y =bj]×IP {A1j∪A2j∪ · · · ∪Aij} (5.29) A Eq. (1.5) foi privilegiada em detrimento da Eq. (1.29) pois a primeira tem mais semelhan¸cas com a Eq. (1.13), cuja constru¸c˜ao pode ser explicada por analogia com a constru¸c˜oe de Eq. (1.5) ou de Eq. (1.29).
Exer. 54. O exerc´ıcio serve para convencer vocˆe que caso (X, Y) tem distri- bui¸c˜ao discreta, a´ı ent˜ao a defini¸c˜ao implicita da esperan¸ca condicional permite que essa seja calculada explicitamente. Observe que a discuss˜ao em torno da implici- tude/explicitude da defini¸c˜ao da esperan¸ca condicional est´a no centro de toda nossa discuss˜ao desse objeto. Seja Ω = {ω1, ω2, . . . , ω9}, e defina IP[ωi] = i/45. Seja
vari´avel aleat´oria Y tal que seu valor ´e
1, ∀ω∈B1 ={ω1, ω2, ω3} 2, ∀ω∈B2 ={ω4, ω5, ω6} 3, ∀ω∈B3 ={ω7, ω8, ω9} Seja
D={{ω1}, {ω2, ω3, ω4},{ω5, ω7, ω8},{ω6, ω9}}
CalculeIE Y
D
. Preste a aten¸c˜ao que voce consegue achar toda a estrutura dessa vari´avel aleat´oria .
Exer. 55. (veja→ ) Por que h´a diferen¸ca nas defini¸c˜oes da esperan¸ca condicional de A discuss˜ao aqui est´a
em torno da maneira como a defini¸c˜ao de esperan¸ca condicional trata o caso quando a integral envolvida na defini¸c˜ao assume valor
∞ ou −∞.
Shiriaev e de Williams? Qual ´e a diferen¸ca? No que esta diferen¸ca pode influenciar?
N˜ao se assuste com esta quest˜ao! A diferen¸ca n˜ao est´a na pr´opria defini¸c˜ao, mas sim nas condi¸c˜oes impostas na vari´avel aleat´oria X para qual os gigantes (Shiryaev e Williams, quer dizer) definemIE
X G
. Entenda o por quˆe da diferen¸ca.
Exer. 56 Conve¸ca-se (e tente me convencer) que a defini¸c˜ao da probabilidade condicional
IP A
B
= IP
A∩B IP
B , quando IP B
6= 0,
est´a de acordo com nossa concep¸c˜ao intuitiva da probabilidade condicional.
Para me entender melhor, imagine que vocˆe decidiu introduzir o conceito de probabilidade condicional no curso de Estat´ıstica B´asica para uma faculdade de ciˆencias n˜ao exatas. Que seja esta de Psicologia, para t´ıtulo de exemplo. Se vocˆe fosse recem-doutor em Estat´ıstica, vocˆe escreveria, convencido em sua retid˜ao e orgulhoso de sua sabedoria, a f´ormula acima como a defini¸c˜ao da probabilidade condicional. Imagine agora que um de seus alunos ´e um bis-neto de Freud e de P. L´evy. Como para este L´evy-Freud, vocˆe n˜ao ´e uma autoridade incontest´avel, ent˜ao ele tem coragem de perguntar: “Por que esta ´e a defini¸c˜ao da probabilidade condicional?”Veja que no fundo da pergunta residem-se duas d´uvidas, a saber: o que ´e a probabilidade condicional na concep¸c˜ao profana e por que esta bate com a defini¸c˜ao do professor. Como vocˆe responderia?
Os exerc´ıcios 9 - 14 s˜ao do livro de Shiryaev do Cap´ıtulo I, Se¸c˜ao 9. Em todos estes exerc´ıcios, as vari´aveis aleat´orias s˜ao discretas e as esperan¸cas condicionais s˜ao tomadas em rela¸c˜ao de decomposi¸c˜ao (ou, parti¸c˜ao, se vocˆe preferir esse termo
`
aquele) do espa¸co amostral; vale lembrar ainda a respeito desta remarca, que a palavra “decoposi¸c˜ao” entende-se como “a decomposi¸c˜ao em um n´umero finito de subconjuntos disjuntos de Ω os quais cobrem todo o Ω”, e lembrarei ainda que qualquer um de tais subconjuntos chama-se “´atomo”. Eu re-escrevi os exerc´ıcios pois quiz acrescentar meus coment´arios.
Ex. 57. Give an example of random variables ξ and η which are not independent but for which IE
ξ η
= IE ξ
.
E ´´ obvio que a pergunta tem a ver com a propriedade de que IE ξ
η
= IE ξ valida sempre quando ξ e η s˜ao independentes. Alias, lembrei agora que h´a uma pergunta que gostaria de colocar para vocˆe: Por que falam “vari´aveis aleat´oriasξ e η independentes”? N˜ao seria suficiente dizer “ξ ´e independente deη”? Ou ser´a que
o equivalente correto seria “ξ independente deη e, ao mesmo tempoη independente de ξ”?
Ex. 58. The random variable V ξ
D
defined as Var
ξ D
:= IE
ξ−IE ξ
D2 D
is calledthe conditional variance of ξ with respect of D. Show that Varξ =IEVar
ξ D
+ VarIE ξ
D .
N˜ao ´e que os s´ımbolos Var e IE colocados em sequencia IEVar ou VarIE deixaram vocˆe de cabelo em p´e por alguns instantes? Espero que vocˆe adivinhou r´apido a significˆacia de cada um deles.
Observe tambem, que a variˆancia condicional n˜ao ´e um termo padr˜ao como ´e a esperan¸ca condicional, no sentido de que esta ´ultima aparece em todos os livros sobre a Teoria de Probabilidades e que todos estes d˜ao a mesma defini¸c˜ao. J´a quanto
`
a variˆancia condicional, se eu perguntar de uma pessoa, que numca via este objeto, que poderia ser a defini¸c˜ao dele, ´e prov´avel que a resposta ser´aIE
ξ−IE ξ2
D , o que ´e diferente da defini¸c˜ao dada acima. Bom, seja que for o seu passado, a partir de agora a ´unica e correta defini¸c˜ao da variˆancia condicional ´e aquela dada acima neste exerc´ıcio.
Ex. 59. Using the property thatIE ξη
D
=η IE ξ
D
, when ηisD-measurable, show that for every functionf, it holds that
IE
f(η)IE ξ
η = IE
ξ f(η) .
(Aqui, tem que lembrar que as vari´aveis aleat´orias tratadas s˜ao discretas e por isto, f(η) tambem ´e vari´avel aleat´oria discreta.)
Ex. 60. Let ξ and η be random variables. Show that inffIE
η− f(ξ)2
is attained forf∗(ξ) =IE
η ξ
. (Consequently, the best estimator for ηin terms of ξ, in the mean-square sense, is the conditional expectation IE
η ξ
.)
Eis o que eu dizia para meus alunos dos anos passados: Prezados! Este fato ´e muito importante. O problema com ele ´e que eu n˜ao sei como prov´a-lo. ´E um t´ıpico problema variacional: tem que achar o m´ınimo de um funcional. Mas este funcional est´a definido em espa¸co de fun¸c˜oes e n˜ao em R or Rd. N˜ao deve ser dif´ıcil para qualquer um menos eu, pois acho que durante meus estudos na universidade matava as aulas da disciplina “Optimiza¸c˜ao”.
Hoje, parece que tenho vis˜ao pouco mais esclarecida a respeito desse exerc´ıcio.
Acontece que h´a um fato, cuja existˆencia era por mim desconhecida, que diz que o infinum da express˜ao
IE
(X−a)2
, onde X ´e qq vari´avel aleat´oria e a ´e qq n´umero real alcan¸ca-se para a = IE[X]. Isso ´e algo fant´astico pois mostra que h´a uma liga¸c˜ao n˜ao trivial entre a variˆanica e a esperan¸ca de uma vari´avel aleat´oria !
Ex. 61. Let ξ1, . . . , ξn, τ be independent random variables, where ξ1, . . . , ξn are identically distributed and τ takes the values 1,2, . . . , n. Show that if Sτ := ξ1 +
· · ·+ξτ is the sum of random number of random variables, then IE
Sτ τ
= τ IE ξ1
, Var Sτ
τ
=τVar ξ1
and IE
Sτ
=IE τ
·IE ξ1
, Var Sτ
=IE τ
·Var ξ1
+ Var τ
· IE ξ12
. E ´´ obvio que Var
Sτ
τ
deve ser entendido conforme a defini¸c˜ao dada no Ex. 10.
Gostaria de acrescentar que as f´ormulas s˜ao validas mesmo quando ξ1, ξ2, . . .´e uma sequencia infinita de vari´aveis aleat´orias independentes e τ n˜ao depende desta se- quencia e assume valores 0,1,2, . . .. Preste a aten¸c˜ao `as mudan¸cas: a sequencia ficou infinita eτ agora assume valores emN. Esta ´ultima mudan¸ca ´e natural, poisτ conta quantas vari´aveis aleat´orias da sequencia devem ser tomadas na soma. O que n˜ao ´e natural ´e permitir que τ assuma tambem o valor 0. Isto devido ao fato de que Sτ parece estranho quando τ = 0. De fato, o valor de S0 n˜ao segue-se intuitivamente e naturalmente da defini¸c˜ao de Sτ para τ diferente de 0. Esta valor determina-se pela defini¸c˜ao “avulsa” que diz que S0 = 0. O caso particular no qual τ tem a distribui¸c˜ao de Poisson ´e muito utilizado na teoria de risco. Precisamente falando, a vari´avel aleat´oriaSτ ´e muito utilizada como o modelo da perda acumulada, sendo que τ interpreta-se neste modelo como o n´umero de sinistros e cada ξi como a se- veridade (ou perda, em outras palavras) do i-´esimo sinistro. Tal ampla utiliza¸c˜ao deve-se as propriedades da distribui¸c˜ao de Poisson que s˜ao muitas e todas boas.
Ent˜ao, acontece que quando a distribui¸c˜ao de τ n˜ao ´e Poisson, a maioria das pro- priedades principais deixam de existir e levam com elas um monte de propriedades secund´arias e tado a constru¸c˜ao fica muito incˆomoda para o uso na pr´atica.
Meu coment´ario do par´agrafo anterior levanta a d´uvida sobre o por que Shiriayev n˜ao formulou seu exerc´ıcio j´a para sequencia infinita deξ’s. A resposta n˜ao ´e trivial.
Eis esta: Para colocar um n´umero infinito de vari´aveis aleat´orias num espa¸co de probabilidades ´e precisa de constru¸c˜oes e teoremas que fogem do escopo da Teoria de Probabilidades Elementar, e, j´a que Cap´ıtulo I do livro pensava-se como a cole¸c˜ao de fatos cab´ıveis a tal teoria, ent˜ao o autor evitou a falar sobre tal situa¸c˜ao.
Ex. 62. Prove queIE ξ
D
=IE ξ
quandoξ´e independente da parti¸c˜aoD(o que entende-se, pela pr´opria defini¸c˜ao, que ξ e 1ID para qualquer ´atomo D da parti¸c˜ao D).
Exc. 63 Vocˆe precisa saber que existe uma lista de propriedades “cl´assico-b´asicas”
da esperan¸ca condicional. Essa lista est´a no livro de Shiryaev, e tamb´em em todo e qualquer livro did´atico que toca no assuno “esperan¸ca condicional”. Por exemplo, a lista que vocˆe vˆe abaixo foi copiada por mim do livro de Williams (§9.7). de seu livro delimita bem o conjunto das que chamaria por “b´asicas”. A lista est´a repetida por mim logo abaixo, e depois desta, eu sugiro a maneira que vocˆe deve seguir para conhecer satisfatoriamente as propriedades da lista.
(a) If Y is any version of IE X
G
then IE[Y] =IE[X].
(b) If X is G measurable, then IE X
G
=X, a.s.
(c) (Linearity) IE
a1X1+a2X2
G
=a1IE X1
G
+a2IE X2
G
, a.s.
Clarification: if Y1 is a version ofIE X1
G
and Y2 is a version ofIE X2
G , then a1Y1+a2Y2 is a version of IE
a1X1+a2X2 G
. (d) (Positivity) If X ≥0, then IE
X G
≥0, a.s.
(e) (conditionalMON) If 0≤Xn↑X, then IE Xn
G
↑IE X
G , a.s.
(f) (conditionalFATOU) If Xn ≥ 0, then IE
lim infXn G
≤ lim infIE Xn
G , a.s.
(g) (conditionalDOM) If|Xn(ω)| ≤V(ω),∀n,IE[V]<∞, andXn→X, a.s., then IE
Xn G
→IE X
G , a.s.
(h) (conditionalJENSEN) If c : R→R is convex and IE[|c(X)|]<∞then IE
c(X) G
≥c IE X
G , a.s.
Important corollary:
IE X
G
p ≤ kXkp, for p≥1.
(i) (Tower Property) If H is a sub-σ-algebra of G, then IEh
IE X
G Hi
=IE X
H , a.s.
Note: We shorthand LHS toIE X
G H
(Esta eu n˜ao entendi!) for tidiness.
(j) (‘Taking out what is known´) If Z is G-measurable and bounded, then IE
ZX G
=Z IE X
G , a.s.
If p >1, p−1+q−1 = 1, X ∈ Lp(Ω,F,P) and Z ∈ Lq(Ω,F,P), then the above equality holds. If X ∈ (mF)+, Z ∈ (mG)+ (procure o significado disto no livro) and IE[ZX]<∞, then the above equality holds.
(k) (Rˆole of independence) IfH is independent ofσ(σ(X),G) (nem Williams, nem eu errou: aqui h´a duas ‘σ´), then
IE X
σ(G,H
=IE X
G , a.s.
Agora, gostaria de chamar sua aten¸c˜ao `a rela¸c˜ao (17) do § 8, Cap. I do livro de Shiryaev:
IE ξη
D
=η IE ξ
D
, onde η ´e D mensur´avel
E extamente a propriedade (j) da lista acima, mas formulada e provada para o´ caso quando Ω ´e finito. Neste caso, as vari´aveis aleat´orias envolvidas assumem n´umero finito de valores e a σ-´algebra pode ser visualizada pela correspondente parti¸c˜ao. Consequentemente, a demonstra¸c˜ao torna-se elementar (isto n˜ao significa trivial! isto significa que as manipula¸c˜oes envolvidas na demostra¸c˜ao n˜ao exigem conhecimentos acima dos que o leitor adquiriu no curso de Probabilidade Elementar).
Eu pe¸co que vocˆe fa¸ca as demonstra¸c˜oes elementares das propriedades (a)–(k) da lista acima. Note que algumas demonstra¸c˜oes exiger˜ao sua sa´ıda de espa¸co finito
para espa¸co infinito, o qual, por´em, pode ser s´o enumer´avel; explicitamente falando, s˜ao as demostra¸c˜oes das propriedades sobre a convergˆencia.
Sugiro ainda que vocˆe simplifique demonstra¸c˜oes, onde for poss´ıvel. Por exemplo, na demonstra¸c˜ao do Shiryaev mencionada acima, era suficiente tomar ξ e η da maneira que cada uma assume duas valores s´o.
Exer. 64 Fa¸ca os 5 primeiros exerc´ıcios do §8, Cap. I do livro “Probabilidade”
de Shiryaev (o ´ultimo, sexto, pede estabelecer uma rela¸c˜ao que j´a est´a na lista do Exerc´ıcio 15 acima).
Convergˆ encia de vari´ aveis aleat´ orias
6.1 Sugest˜ oes e coment´ arios do ministrante
6.1.1 Adendum ` a aula sobre Lei 0–1 de Kolmogorov
A presente sub-se¸c˜ao foi inicialmente planejada como a apresenta¸c˜ao duma pergunta levantada por um de meus alunos na aula sobre a Lei 0–1 de Kolmogorov. A aten¸c˜ao a ser despejada `a tal pergunta motiva-se pelo seguinte: a pergunta serve de um exce- lente exerc´ıcio, pois por si s´o ela n˜ao ´e muito dif´ıcil, mas, ao mesmo tempo, a procura pela sua resposta obriga meu leitor a vascular por toda a mat´eria relacionada `a Lei.
Entretanto, para poder formular a pergunta e atrelar a mesma aos diversos vertentes da Lei e de sua demostra¸c˜ao, eu precei recordar quase toda a demonstra¸c˜ao da Lei, inclusive as constru¸c˜oes usadas na formula¸c˜ao e na demostra¸c˜ao. Tal recorda¸c˜ao detalhada gerou um bom n´umero de exerc´ıcios, que s˜ao mais curtos e simples de que o exerc´ıcio mtivado pela pergunta supramencionada levantada por um dos alunos.
Ent˜ao, ao final, o texto da sub-se¸c˜ao ficou parecido com “coment´arios do ministrante sobre Lei 0–1 de Kolmogorov”.
O plano ent˜ao ´e o seguinte: vou apresentar a defini¸c˜ao tradiconal deσ(ξ1, ξ2, . . .), prosseguir para a defini¸c˜ao de σ-´algebra caudal, formular a Lei 0–1 de Kolmogorov e interpret´a-la. No final, formularei a “pergunta de um dos alunos”; ela estar´a a partir da Marca Marginal 2.
Come¸co ent˜ao com a constru¸c˜1 ao daquela σ-´algebra que est´a denotada por σ(ξ1, ξ2, . . .). A constru¸c˜ao daσ-´algebra desejada faz-se em duas etapas. Na primeira etapa, faz-se a ´algebra (veja→)
Exc. 19 lhe convida a confirmar as proprieda- des da ´algebra desse ob- jeto.
∪∞n=1σ(ξ1, ξ2, . . . , ξn) (6.1) Na segunda etapa, completa-se a constru¸c˜ao completando a ´algebra at´e σ-´algebra (recorde, o s´ımblo σ(A) significa a menor σ-´algebra que cont´em a cole¸c˜ao A de conjuntos quaisquer; no nosso caso,A ´e a ´algebra de (2.1))(veja→):
Infelizmente, o meso s´ımbolo est´a usado com sentidos diferen- tes: σ() com lista de vari´aveis aleat´orias entre parˆenteces tem significado definido por (2.1) ou (2.2); j´a se entre as parˆenteces encontra-se uma
´
algebra, ent˜ao aquele s´ımbolo significa a menor σ-´algebra que cont´em a ´algebra.
σ(ξ1, ξ2, . . .) := σ(∪∞n=1σ(ξ1, ξ2, . . . , ξn)) (6.2)
90