Esperan¸ ca Condicional

(1)

Esperan¸ ca Condicional

A dire¸cão de minha apresenta¸cão de Esperan¸ca Condicional não muito tradicional, ou, para ser exato, a apresenta¸cão não tem par em nenhum de livros didáticos.

Aviso que os assuntos da Se¸c˜ao 1.2.4 foram gravadas em formato de video-aula.

Eis os endere¸cos destas aulas na web-net:

https://drive.google.com/file/d

/12-Lr6sVxVkphRJpIQsfHuWOEUbCLK3Cp/view?usp=sharing https://drive.google.com/file/d

/1daes9wJ3HdDpXK5Oj_tpARGetwDbBzMH/view?usp=sharingAs transparências destas duas aulas estão inclusas no texto do cap´ıtulo, no seu apêndice (Se¸cão 1.3). As transparências estão guardadas em Videos/EsperancaCondicionalAula01/Ensaio01 e Ensaio02

Falando dos exercicios:

(1) Eu pediria que você desse a aten¸cão ao Exc. 1 que está no inicio do cap´ıtulo; ele só pede de você revisar aquilo que voce ja ouviu sobre coisas ”condicionais”.

(2) Dé a aten¸cão ao Exc. 15. Ele fornce uma lista de propriedades da Esperan¸ca Condicional. Por favor, escolhe e fa¸ca de no m´ınimo um item desta lista. Mas fa¸ca da seguinte maneira: primeiramente, aceite que o espa¸co Ω é finito e fa¸ca a demostra¸cão usando a constru¸cão expl´ıcita de esperan¸ca condicional que é poss´ıvel quando espa¸co é finito. E em segunda maneira, fa¸ca a demonstra¸cão que se aplica ao caso genérico. Para isto você só tem a defini¸cão genérica de esperan¸ca condicional.

Se voce estiver com a dificuldade de execu¸cão da demonstra¸cão aplicável ao caso genérico, consulte o livro de Shiryaev que apresenta todas as demonstra¸cões.

(3) Por fim, é OBRIGAT ÓRIO ”fazer Exerc´ıcio 4. Ele convida você mostrar que a abordagem de B.J. à constru¸cão de esperan¸ca condicional está errada, no sentido que a abordagem permite uma liberdade na escolha de limite (especificamente falando,

∆y → 0, em termos usados por B.J.) e que tal liberdade faz com que, para certas distribui¸c˜oes de (X, Y), duas escolhas diferentes levam aos valores diferentes da IE[X

Y]. Talvez você não vai conseguir construir exemplos de tais distribui¸cões, mas pelo menos, deve tentar. Por favor, dedique de no m´ınimo 2 horas de seu valioso tempo para pensar na solu¸cão deste exerc´ıcio.

65

(2)

5.1 Revis˜ ao dos conceitos da Teoria de Probabi- lidade que cont´ em a palavra “condicional”

Exerc´ıcio 49. O presente exerc´ıcio convida você revisar os conceitos da Teoria de Proabilidade que contêm a palavra “condicional”. Esta tarefa está naturalamente associado à apresenta¸cão a vir, pois essa versará sobre o conceito Esperan¸ca Condi- cional em rela¸cão aσ-álgebra. As pontes de associa¸cão são múltiplas e se revelarão no decorrer da apresenta¸cão.

(a) Define o conceito de probabilidade condicional de um evento Adado um evento B quandoIP[B]>0 (´e o que tradicionalmente denota-se porIP[A

B]).

(b) Define o conceito de distribui¸cão condicional de uma variável aleatória X discreta dado um evento B quando IP[B]>0. Qual é a nota¸cão que você daria para esse objeto? Existe uma nota¸cão comumente usada?

(c) Para um par de variáveis aleatórias discretas (X, Y), define o conceito de distribui¸cão condicional da variável aleatória X dado que Y assumiu valory.

Existe nota¸c˜ao para esse conceito? Sen˜ao, sugere uma.

(d) Define o conceito de esperan¸ca condicional de uma variável aleatória X discreta dado um eventoB quandoIP[B]>0 (recorde que a nota¸cão para esse conceito era, é, e sempre será IE[X

B]).

(e) Para um par de variáveis aleatórias discretas (X, Y), define o conceito de esperan¸ca condicional da variável aleatória X dado que Y assumiu valor y (recorde que a nota¸cão para esse conceito era, é e sempre será IE[X

Y =y]).

(f) Para um par de variáveis aleatórias continuas (X, Y), define o conceito de fun¸cão de densidade da distribui¸cão condicional da variável aleatória X dado queY assumiu valory. Existe nota¸cão para esse conceito? Senão, sugere uma.

(g) Para um par de variáveis aleatórias continuas (X, Y), define o conceito de distribui¸cão condicional da variável aleatória X dado que Y assumiu valory.

(h) Para um par de variáveis aleatórias continuas (X, Y), define o conceito de esperan¸ca condicional da variável aleatória X dado que Y assumiu valor y.

(i) Prove a Fórmula de Probabilidade Total para eventos de probabilidade não nula: se eventos B₁, . . . , B_n de probabilidade não nula formam parti¸cão de Ω (isto é, os eventos são disjuntos e sua união equivale a Ω), então para qualquer evento A, ocorre que

IP[A] =

n

X

i=1

IP[A

Bi]×IP[Bi] (5.1) (j) Prove a Fórmula Geral de Probabilidade Total (para eventos de probabilidade não nula) que eu acabei de inventar: se eventos B₁, . . . , B_n de probabilidade não nula formam parti¸cão de Ω, então para qualquer eventoA, e para qualquer

(3)

evento Dcomposto de alguns dosBi’s (por exemplo,D=B1∪B3∪B7) ocorre que

IP[A∩D] = X

i:Bi⊆D

IP[A

B_i]×IP[B_i] (5.2) (refor¸co: a soma ´e tomada por todos osB_i’s que comp˜oem D).

(k) Prove a Fórmula de Esperan¸ca Total que em termos e nota¸cões do item (i) alega o seguinte: para qualquer variável aleatória discreta X, ocorre que (a nota¸cão IE[X

Bi] usada abaixo j´a foi lhe recordada no item (d) acima):

IE[X] =

n

X

i=1

IE[X

B_i]×IP[B_i] (5.3) (tenho certeza que essa fórmula já existe, eu só inventei nome para ela, e ainda creio eu que o nome por mim inventado coincide com o nome tradicional).

(l) Prove que a Fórmula de Esperan¸ca Total adquire a forma da Eq. (1.4) abaixo no caso quando quando (X, Y) é um par de variáveis aleatórias discretas com as seguintes carater´ısticas: X assume valores a₁, . . . , a_m,Y assume os valores b₁, . . . , b_n.

IE[X] =

n

X

i=1

IE[X

Y =b_j]×IP[Y =b_j] (5.4) (m) Prove a Fórmula Geral de Esperan¸ca Total que eu acabei de inventar e que aplica-se a par de variáveis aleatórias discretas (X, Y) com as seguintes carater´ısticas: X assume valores a₁, . . . , a_m,Y assume valoresb₁, . . . , b_n.A fórmula vale para qualquer conjunto B ⊂ R composto dos valores de Y, quer dizer, composto dos números b₁, . . . , b_n, como, por exemplo, {b₂, b₃}. A fórmula tem a seguinte aparência:

IE[X1I_Y⁻¹_(B)] = X

j:bj∈B

IE[X

Y =b_j]×IP[Y =b_j] (5.5)

5.2 A esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra

5.2.1 A constru¸ c˜ ao direta da esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra no caso do espa¸ co finito

Com a presente se¸cão come¸camos nossa análise do comportamento da esperan¸ca condicional em rela¸cão aσ-álgebra no caso quando o espa¸co Ω é finito. A conclusão a qua aspiramos é que no espa¸co finito tal esperan¸ca sempre pode ser contruida explicitamente. A constru¸cão explicita é o conteúdo da presente se¸cão. A demostra¸cão da conclusão aspirada estará na Se¸cão 1.2.4

Seja Ω um espa¸co de estados finito, isto é Ω = {ω₁, . . . , ω_k} para algum k ∈ N. SejaF aσ-álgebra mais refinada dos conjuntos de Ω (isto é, aσ-álgebra tal que{ω} ∈ F para cada ω ∈ Ω). Seja IP uma probabilidade em F. Seja D = {D₁, . . . , D_n} uma parti¸cão de Ω, quer dizer, uma cole¸cão de conjuntos diferentes de ∅, que são disjuntos dois a dois, e cuja união é Ω.

(4)

Para cada Di ∈ D, construa IP[·

Di], a probabilidade condicional dado que ocorreuD_i. A constru¸cão desta baseia-se na defini¸cão da probabilidade condicional dado um evento com probabilidade não nula, a saber: IP[A

D_i] =IP[A∩D_i]/IP[D_i] para todoA∈ F.

Seja agora ξ : Ω → R uma vari´avel aleat´oria qualquer. Para cada i = 1, . . . , k, construimosa esperan¸ca condicional de ξ dado que ocorreu D_i que denota-se porIE[ξ

Di] e calcula-se pela seguinte f´ormula:

IE[ξ

D_i] = X

ω∈Ω

ξ(ω)IP[ω

D_i] (5.6)

A constru¸cão feita até agora resultou emn valores numéricos, os quais são as esperan¸cas condicionais{IE[ξ

D_i], i= 1,2, . . . , n}. Usaremos esta cole¸cão de valores para criar variável aleatória Zξ,D : Ω→R:

para cada ω ∈Ω, Z_ξ,D(ω) := IE[ξ

D_i] onde i´e tal que ω∈D_i (5.7) Equivalentemente, podemos dizer que

Zξ,D assume valor IE[ξ

D_i] em cada ω que pertence a D_i, i= 1,2, . . . , n (5.8) No futuro será mostrado que Zξ,D é a esperan¸ca condicional de ξ em rela¸cão à parti¸cão D no sentido da Defini¸cão 2, mas como tal defini¸cão ainda não tinha sido formulada, então no momento não podemos usar o nome “esperan¸ca condicional em rela¸cão a parti¸cão”. Por isto, precisamos de um nome temporário paraZξ,D. Vamos chama-la por esperan¸cas condicionais de ξ distribu´ıdas por conjuntos de condicionamento.

E importante observar (para a futura compara¸c˜´ ao deZξ,D com a defini¸cão formal de esperan¸ca condicional em rela¸cão aσ-álgebra) que nossa defini¸cão deZξ,D implica diretamente no que esta variável aleatória possui as seguintes propriedades:

Zξ,D é D-mensurável (5.9) IE[ξ1I_D_i] = IE[Zξ,D1I_D_i] para cada D_i ∈ D (5.10) A despeito da rela¸cão (1.10) expressar a propriedade da qual necessitaremos na hora da compra¸cão de Zξ,D com a defini¸cão de esperan¸ca condicional, ainda prefiro reescrever ela na forma mais próxima às expressões usadas na referida defini¸cão. Eis esta abaixo (a equivalência entre (1.10) e (1.11) é um fato trivial):

IE[ξ1IC] = IE[Zξ,D1IC], para qualquer C (5.11) feito de união de qualquer subcole¸cão da cole¸cão {D₁, D₂, . . . , D_n} Agora, só com o intu´ıto de mostrar que os objetos que apareceram até o momento são simples vou reescrever (1.11) no formato mais usado nos cursos de probabilidade no n´ıvel de gradua¸cão:

X

ω∈C

ξ(ω)IP[ω] = X

ω∈C

Z_ξ,D(ω)IP[ω], para qualquer C (5.12)

feito de união de qualquer subcole¸cão da cole¸cão{D₁, D₂, . . . , D_n}

(5)

Por fim, gostaria de comentar que as rela¸cões derivadas até o momento permitem a gente provar a Fórmula de Esperan¸ca Total que apareceu no item (k) do Exc. 1.

Portanto, se você não a provou até o momento, observe o argumento abaixo. Pri- meiramente, ao tomar C= Ω na fórmula (1.12), a gente chaga na seguinte rela¸cão:

IE[ξ] =

n

X

i=1

Zξ,D(D_i) IP[D_i]

onde a nota¸c˜ao Zξ,D(D_i) significa o valor de Zξ,D em qualquer ω ∈ D_i; recorde que a constru¸c˜ao de Zξ,D garante que esta assume o valor IE[ξ

D_i] em qualquer ω ∈ Di, e, portanto, a nota¸cão é correta. Mas por que não substituir esta nota¸cão incomum pela valor IE[ξ

D_i]? Ao executar esta substitui¸c˜ao, chegamos `a Formula de Esperan¸ca Total:

IE[ξ] =

n

X

i=1

IE[ξ

D_i]IP[D_i]

5.2.2 A defini¸ c˜ ao geral da esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra

Meu plano era continuar a exposi¸cão permanencendo no caso finito o tempo máximo poss´ıvel. Portanto, o proximo assunto a vir seria a defini¸cão da esperan¸ca condicional em espa¸co finito. Entretanto, já que tal defini¸cão é a adapta¸cão para caso finito da defini¸cão geral de esperan¸ca condicional, então, quebrando meu próprio plano inicial, eu decidi apresentar em primeiro lugar a defini¸cão geral. Ela está na presente se¸cão.

O caso finito, que deriva-se dela, fica então adiado até a se¸cão seguinte.

Defini¸cão 4 geral da esperan¸ca condicional em rela¸cão a σ-álgebra.

A Esperan¸ca condicional de uma variável aleatória ξ em rela¸cão a uma σ-álgebra G é a variável aleatória, a nota¸cão para a qual é IE

ξ G

, que defina-se por duas propriedades a seguir:

(a) IE ξ

G

é mensurável em rela¸cão a G;

(b) para cada conjunto A de G vale Z

A

ξ dIP = Z

A

IE ξ

G

dIP. (5.13)

Quando a σ-álgebra G da presente defini¸cão é a σ-álgebra gerada por uma variável aleatória η, então no lugar de IE

ξ G

escreve-se IE ξ

F_η ou IE

ξ η

.

. Eu, pessoalmente, prefiro quando pessoas falam sobre IE ξ

η

que sobre IE ξ

G , pois minha mente possui um modelo simplisto mas intuitivo de IE

ξ η

. Eu s´o vou poder compartilhar contigo meu modelo ap´os ter introduzido o objeto denotado por IE

ξ η=y

. Ele surgirá na Se¸cão 1.2.9. Minha concep¸cão deIE ξ

η

baseia-se nos fatos e propriedades apresentados no texto ao redor da Eq. (1.25).

(6)

5.2.3 Reformula¸ c˜ ao da defini¸ c˜ ao geral para o caso quando o espa¸ co de estados ´ e finito

Nesta se¸cão, eu adapto para espa¸cos finitos os termos da defini¸cão geral da esperan¸ca condicional em rela¸cão a σ-álgebra. Recordo lhe que meu plano é analizar a esperan¸ca condicional nos espa¸cos finitos antes de partir para o caso geral. O plano foi motivado pela cren¸ca que nossa intui¸cão funciona melhor em espa¸cos finitos de que em cont´ınuos. O caminho de análise culmina-se na Se¸cão 1.2.4.

Defini¸cão 5 que reformula a defini¸cão genérica para o caso quando o espa¸co de estados é finito.

SejaΩum espa¸co de estados finito, sejaF aσ-álgebra mais refinada de seus conjuntos (isto é, a σ-álgebra tal que {ω} ∈ F para cada ω∈ Ω). Seja D={D₁, . . . , D_n} uma parti¸cão de Ω. Seja ξ uma variável aleatória. Esperan¸ca condicional de ξ em rela¸cão à parti¸cão D é a variável aleatória, a nota¸cão para a qual é IE

ξ D

, que defina-se por duas propriedades a seguir:

(a) IE ξ

D

´

e mensur´avel em rela¸c˜ao a D;

(b) para qualquer conjunto D expresso como uni˜ao de conjuntos de D vale Z

D

ξ dIP = Z

D

IE ξ

D

dIP (5.14)

o que pode ser re-escrito da seguinte maneira (aproveitando que Ω ´e discreto no caso):

X

ω∈D

ξ(ω)IP[ω] = X

ω∈D

IE ξ

D

(ω)IP[ω]. (5.15)

Quando a parti¸cão D da presente defini¸cão está gerada por uma variável aleatória η, isto é, quando {y₁, . . . , y_n} são todos os valores poss´ıveis de η e Di = {η⁻¹(yi}, i = 1, . . . , n, então no lugar de IE

ξ D

pode escrever IE

ξ η

.

5.2.4 Em espa¸ co de estado finito, a constru¸ c˜ ao direta e a defini¸ c˜ ao geral coincidem

A presente se¸cão é a culmina¸cão da análise de estrutura que a esperan¸ca condicional em rela¸cão aσ-álgebra adquire nos espa¸cos finitos. Aqui, provaremos que a variável aleatória construida diretamente na Se¸cão 1.2 coincide com a variável aleatória definida indiretamente pela defini¸cão tradicional que foi formulada na Se¸cão 1.2.3.

Isto nos dá o controle absoluto sobre a esperan¸ca condicional em espa¸cos finitos, e, ao mesmo tempo, desenvolve nossa intui¸cão que nos ajudará nos trabalhos que envolvem esperan¸ca condicional em espa¸cos cont´ınuas.

Foram gravadas duas aulas sobre a coincidˆencia supracitada. A primeira est´a pelo seguinte endere¸co:

/12-Lr6sVxVkphRJpIQsfHuWOEUbCLK3Cp/view?usp=sharing A segunda video-aula est´a pelo seguinte endere¸co:

(7)

/1daes9wJ3HdDpXK5Oj_tpARGetwDbBzMH/view?usp=sharing

As transparências destas duas video-aulas estão no Apêndice ao caopitulo 1

5.2.5 O conceito da vida real o qual desejamos imitar pelo objeto matem´ atico chamado “esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra”

De acordo com meu plano de ensino, no presente momento você, meu leitor, já deve estar com uma plena concep¸cão do conceito de esperan¸ca condicional em rela¸cão a particão. (Só lhe recordo que este conceito aplica-se somente no caso quando o espa¸co de estados é finito.) Como acredito que meus leitores devem ter adquirido bastante experiência com modelos em espa¸cos finitos antes de ler meu texto, então espero que minha exposi¸cão sobre a esperan¸ca condicional nos espa¸cos finitos seja suficientemente esclarecidora para meus leitores. A dispeito desta conviçcão, decidi apresentar ainda um exemplo que pode ser útil para solidifica¸cão da compreen¸cão de estrutura da esperan¸ca condicional em rela¸cão a parti¸cão.

↓ Exemplo 1. Fábio, dono de um barzinho, tinha anotado o consumo diário de cerveja (a quantidade de garrafas vendidas). As anota¸cões foram colocadas num caderno, mas separadas por páginas, sendo que cada página corresponde à temperatura do dia no qual foi feita a anota¸cão (imagine para simplicidade que durante dia a temperatura não muda). No final de cada página, Fábio fez a média simples dos valores da página. Nós vamos denotar por ¯x_t a média calculada pelo Fábio na página correspondente à temperatura t (t = 7,8, . . . ,45); nesta nossa nota¸cão, x signifca a quantidade de garrafas consumidas. As médias ajudam a Fábio calcular o estoque de cerveja para dia seguinte de acordo com seu desejo de que o estoque deve corresponder ao consumo esperado. Tal consumo, a ser denotado por ¯x, calcula-se pelo Fábio segundo a seguinte fórmula:

¯

x= X

t=7,...,45

¯

x_tIP[t] (5.16)

onde IP é a distribui¸cão probabil´ıstica que expressa a previsão da temperatura do dia seguinte.

Fim do Exemplo 1↑ No resto da presente se¸c˜ao, vou associar alguns conceitos do Exemplo 1 com suas contrapartes desenvolvidas na teoria apresentada at´e o momento.

Vou denotar por (Ω,F, IP) o modelo probabil´ıstico da situa¸cão descrita no exemplo. A informa¸cão cont´ıda no exmeplo não nos permite a construir o modelo em todos os detalhes, mas para nós é suficente saber que ele existe e que Ω dele é finito.

Definirimos em Ω duas variáveis aleatórias, X e Y. X corresponde á quantidade diária de garrafas vendidas e Y corresponde á temperatura. Partimos o espa¸co Ω nas faxas D_t := {ω ∈ Ω : Y(ω) = t}. Naturalmente, existe a distribui¸cão de X condicionada pelo D_t (que é a mesma coisa que condicionar por {Y = t}). Os valores anotados pelo Fábio na página de seu caderno correspondente à temperatura t são uma amostra da distribui¸cão de X condicionada por {Y = t}. A média dos

(8)

valores anotados é uma aproxima¸cão à IE[X

Y =t], quer dizer, ¯xt ´e a contraparte amostral do conceito te´oricoIE[X

Y =t], e finalmente, a fórmula (1.16) usada pelo Fábio é a contraparte da Fórmula de Esperan¸ca Total.

5.2.6 O que impede o funcionamento da constru¸ c˜ ao direta nos espa¸ cos cont´ınuos

Imagine um par de vari´aveis aleat´orias cont´ınuas (X, Y), por exemplo, normal bi- variada. Para tal par, escolho arbitrariamente y ∈ R e pergunto: “Consigo definir IE[X

Y = y] seguindo o caminho que mostrou ser eficiente no caso de espa¸co discreto?” A resposta é “não”. O problema é que este caminho não sabe construir a probabilidade condicionalIP[·

{Y =y}] quandoIP[Y =y] = 0.

O mesmo problema ocorre com IE[X

G] caso G cont´em conjuntos de medida nula que s˜ao diferentes de ∅.

5.2.7 Como a defini¸ c˜ ao geral contorna o problema de im- possibilidade de condicionamento por eventos de pro- babilidade nula

Realmente, como? Minha impressão é que a defini¸cão geral delega o problema de condicionamento por eventos de probabilidade nula para o Teorema de Radon- Nikodym. Especificamente, a defini¸cão geral não procura construir a esperan¸ca condicional diretamente, mas fica satisfeita com o simples fato de sua existência o qual ela estabelece com ajuda do teorema de Radon-Nikodym. Eis como isto tudo acontece no caso quandoξé não negativa (o caso geral está apresentado no livro de Shiryaev).

Seja então (Ω,F, IP) um tr´ıplice probabil´ıstico (no qual Ω não é finito, e é rico o suficiente para abrigar variáveis aleatórias cont´ınuas e σ-álgebras com conjuntos de medida nula), sejaG uma sub-σ-álgebra de F e sejaξ uma variável aleatória não negativa. Vamos usá-la para definir Q:

Q(A) :=

Z

A

ξdIP para cada A∈ G (aten¸cão! A∈ G) (5.17) E f´´ acil verificar que Qé uma medida em (Ω,G) e que Qé absolutamente cont´ınua em rela¸cão à medida originalIP (a rela¸cão das duas medidas está sendo considerada em (Ω,G)). Então, via a aplica¸cão do teorema de Radon-Nikodym, sabemos que existe variável aleatória Z que éG-mensurável e para qual vale

Q(A) = Z

A

ZdIP para cada A∈ G (5.18)

e, consequntemente, vale Z

A

ξdIP = Z

A

ZdIP para cada A ∈ G

conforme segue-se da compara¸cão entre (1.17) e (1.18). Isto tudo quer dizer que a variável aleatória Z é o que a Defini¸cão 1 chama deIE[ξ

G].

(9)

Real¸co que o argumento acima ´e a prova da existˆencia de IE[ξ

G] em qualquer (Ω,F, IP) e para quaisquer G e ξ. Real¸co que a prova é indireta e ampara-se forte- mente no Teorema de Radon-Nikodym e que este é um t´ıpico teorema de existência, quer dizer, teorema que afirma existência de um objeto (no caso, a derivada de Radon-Nikodym) sem fornecer-nos ferramentas para sua explicita constru¸cão.

. O argumento agora apresentado serve de motiva¸cão para seu estudo do Teorema de Radon-Nikodym. Ao ver a demonstra¸cão deste, você vai sentir que a constru¸cão de esperan¸ca condicional em rela¸cão a σ-álgebra requer uso de ferramentas bem refinadas.

5.2.8 Mais dois exemplos

Os futuros argumentos vão precisar de dois exemplos. A presente se¸cão destina- se à apresenta¸cão de ambos. A apresenta¸cão emprega conceitos que não foram rigorosamente definidos até o momento. Isto tem seus motivos, os quais são pura- mentemente didáticos. Saiba que até o final da Se¸cão 1.2, cada conceito adquirirá sua digna defini¸cão.

↓ Exemplo 2. Defina-se par de variáveis aleatórias (X, Y) da seguinte maneira Y variável aleatória exponencial de parâmetro 1, (5.19) enquanto que acerca de X não fala-se nada sobre sua distribui¸cão, e postula-se somente que

a esperan¸ca de X sabendo queY =yé (1 +y²)⁻¹ (5.20) Claro que por não ter definido a distribui¸cão de X, o modelo está incompleto, e, em particular, a informa¸cão aqui fornecida não é suficiente para construir a distribui¸cão conjunta de (X, Y).

Fim do Exemplo 2↑

↓ Exemplo 3. Defina-se par de variáveis aleatórias (X, Y) da seguinte maneira: Y tem a distribui¸cão (1.19), enquanto que

X

Y =y ∼ N (1 +y²)⁻¹; 1

(5.21) quer dizer, dado que Y assumiu valor y, X tem distribui¸cão normal com média (1 +y²)⁻¹ e variância 1.

Fim do Exemplo 3↑

5.2.9 Uma viz˜ ao alternativa na esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra

A esperan¸ca condicional deξ em rela¸cão aη pode ser concebida em duas formas. A primeira delas é a que está definida pela Defini¸cão 1; ela é uma variável aleatória (segundo à própria defini¸cão). Recordo que ela denota-se porIE[ξ

F_η] ou porIE[ξ η].

A segunda das duas formas de expressão/concep¸cão de esperan¸ca condicional supracitada é fun¸cão R → R. Nesta se¸cão, vou defin´ı-la, explicar sua rela¸cão com a primeira, e falar das vantagens de cada uma. A fun¸cão será denotada aqui por m

(10)

seguindo a nota¸cão usada pelo Shiryaev. Acredito que sua escolha foi motivada pelo termo “mathematical expectation” que é um dos nomes que pode ser dado a tal fun¸cão.

Exemplo da fun¸cão m é m(y) = (1 +y²)⁻¹, y ∈ R que aparece nos Exemplos 2 e 3. Eu antecipei a apresenta¸cão formal por men¸cão destes exemplos pois desejava que meu leitor preste a aten¸cão que m é fun¸cão de R em R. Seria bom se este fato supreendesse você, pois isto garantiria que preste a aten¸cão a todos os detalhes de constru¸cão de m.

Vamos à execusão do programa tra¸cada no in´ıcio da se¸cão: definir m, justificar que a defini¸cão está correta, descobrir para que serve m, e, por fim, descobrir sua contraparte no mundo real.

Pego (Ω,F, IP) qualquer e duas variáveis aleatórias ξ e η. Pego IE[ξ F_η] cuja existência está garantida (pela nossa discussão da Se¸cão 1.2.7). Observo que a condi¸cão (a) da Defini¸cão 1.13) garante que IE[ξ

F_η] é fun¸cão F_η mensurável.

Essa imposi¸cão da defini¸cão junto com Teorema formulado na se¸cão sobre variáveis aleatórias (veja sua formula¸cão no Exc. 2) garantem que

existe fun¸c˜ao boreleana m :R→R tal que IE ξ

F_η

(ω) =m(η(ω)),∀ω ∈Ω (5.22) Note que embora a afirma¸cão acima esté quantificada “∀ω”, o argumento dem está em R, pois os valores deη(ω) estão em R.

Observa¸c˜ao. A afirma¸c˜ao contida na Eq. (1.22) deve ser corrigida substituindo

“m : R → R” por “m : R → R (a corre¸cão que de fato, Shiryaev faz no livro dele). A razão para a corre¸cão é assim: emboraξ e η são fun¸cões que não assumem nem ∞ nem −∞, suas integrais podem assumir esses valores. Acontece que a esperan¸ca condicional que aparece na Eq. (1.22) está ligada as integrais (eu não pretendo detalhar a afirmada liga¸cão) então para algunsω pode haver a necessidade de definir que m(η(ω)) = +∞ ou −∞. É da´ı que surge a necessiade de considerar m como fun¸cão R → R. Entretanto, com o intuito de facilitar minha exposi¸cão via a exclusão de casos “patalógicos” que desviam aten¸cão sem trazer nenhuma informa¸cão nova a valiosa, eu vou considerar m como fun¸cãoR→R

Otimo! Mas para que m serve e qual seria sua interpreta¸cão? Para podermos responder nesta pergunta, vamos substituir (1.22) na parte da direita de condi¸cão (b) da Defini¸cão 1.13, quer dizer, na parte da direita de (1.13). Tem-se que

Z

A

ξ(ω)dIP(ω) = Z

A

m(η(ω))dIP(ω) para cada A∈ F_η (5.23) Na integral do lado direito da (1.23), vamos fazer a troca de vari´aveis. Eis os detalhes da troca:

◦do espa¸co (Ω,F) para o espa¸co (R,B);

◦da medida IP para a medida IP_η induzida emB pela vari´avel aleat´oria η;

e eis a f´ormula (fornecida pelo Teorema sobre a troca de vari´avel em integral de Lebesgue):

Z

C

g(x)IPη(dx) = Z

η⁻¹(C)

g(η(ω))IP(dω), C ∈ B

(11)

O resultado da troca de variável está na Eq. (1.24) abaixo; nesta equa¸cão, nós escrevemos A = η⁻¹(B) na integral ao lado esquerdo com o intu´ıto de indicar a rela¸cão entreA e B que surgiu devido à troca de variável.

Z

A=η⁻¹(B)

ξ(ω)dIP(ω) = Z

B

m(y)dIP_η(y) para cada B ∈ B(R) (5.24) A rela¸cão (1.24) será o ponto de partida para meus futuros argumentos que respon- derão à pergunta “Para que serve m?”

Vamos ver agora se temos respostas nas perguntas acerca de m. Quanto à defini¸cão, esta está na Eq. (1.22). O texto que precede esta equa¸cão serve de justifica- tiva que nos permite alegar que a defini¸cão está correta.

Em rela¸cão à discussão sobre a defini¸cão, surge naturalmente a questão se a mesma é construtiva. Minha opinião a respeito é que sim. De fato, se você possui (Ω,F, IP), η (como fun¸cão Ω → R) e IE[ξ

F_η] (também como fun¸cão de Ω a R), então você consegue descobrir o valor de m(y) para qualquer y da imagem de η:

m(y) =IE[ξ

F_η](ω) ondeω deve ser escolhido de tal sorte que η(ω) =y.

A resposta dada no final do parâgrafo acima levanta a dúvida: “É poss´ıvel que existam ω₁ 6= ω₂ tais que η(ω₁) = η(ω₂) mas IE[ξ

F_η](ω₁) 6= IE[ξ

F_η](ω₂)?” A motiva¸cão da dúvida está clara: se isto fosse poss´ıvel então a constru¸cão m(y) = IE[ξ

F_η](ω) não seria poss´ıvel. Como a constru¸cão está correta, nós temos que admitir que a resposta à pergunta é “não”. Mas o que garante o tal “não”? A resposta na última pergunta é: “A exigência queIE[ξ

F_η] deva serF_η-mensur´avel.”

E esta exigˆ´ encia que garante a propriedade de que IE[ξ

F_η](ω) assume o mesmo valor em cadaω ∈ {η⁻¹(y)}. Alias, esta propriedade sugere usar a nota¸c˜ao

IE[ξ

η =y] (5.25)

para o valor deIE[ξ

F_η](ω) em cada ω ∈ {η⁻¹(y)}. Note que (1.25) está obrigada a ser o valor dem(y) e é por isto que (1.25) é a nota¸cão alternativa para m(y).

Fant´astico! Adorei a maneira que achei para introduzir a nota¸c˜aoIE[ξ

η=y] e explicar seu sentido.

Agora vamos voltar á nossa discussão acerca da rela¸cão entre IE[ξ

F_η] e m e vamos colocar a pergunta no sentido oposto daquela pergunta que respondida agora, a saber: “Se você possui (Ω,F, IP), η (como fun¸cão Ω → R) e m (como fun¸cãoR→R), você então consegue construirIE[ξ

F_η] (também como fun¸cão de Ω aR)?” A resposta é “sim” e o método de constru¸cão segue-se naturalmente a partir das propriedades acima descritas. Eis este: Em primeiro lugar, tem que percorrer por todos os valores de y ∈ R e construir {η⁻¹(y)} para cada y. Tais conjuntos formarão uma parti¸cão de Ω (a parti¸cão não tem obriga¸cão de conter um número finito de conjuntos). Em cada conjunto desta parti¸cão, o valor deIE[ξ

Fη] ´em(y).

As duas perguntas e suas respectivas respostas tratadas acima ajudam-me a vizualisar a vari´avel aleat´oria IE[ξ

F_η]. O problema com a vizualisa¸cão surge por causa dos conjuntos de medida nula (isto foi explicado na Se¸cão 1.2.6. Para contornar este problema, eu imagino uma fun¸cão m do tipo de (1 + y²)⁻¹ que aparece nos Exemplos 2 e 3 (tipicamente, eu escolho uma fun¸cão ainda mais simples), depois eu imagino (Ω,F, IP) e η tal que {ω ∈ Ω : η(ω) = y} tem IP-medida nula, mas são visulizáveis (por exemplo Ω = [0,1]×[0,1] e η(u, v) = u²). Por fim, eu visualizo

(12)

IE[ξ

Fη] como a vari´avel aleat´oria que assume valorm(y) em cima de cada{η⁻¹(y)}.

Espero que isto tudo lhe sirva tamb´em, quando for necess´ario.

Recorde que at´e o momento n˜ao respondemos na pergunta “Para que serve m?”

De fato, existeIE[ξ

F_η] e existe m e elas são intercambiáveis, conforme mostramos acima. “Qual é a diferen¸ca entre as duas na perspectiva de sue uso?” é a pergunta intriscicamente ligada à pergunta sobre a utilidade de m. O caminho de resposta está indicado pelo gigante da Teoria de Probabilidade, nosso amigo Shiryaev. Eis a cita¸cão da página 263: “From an intuitive point of view, the conditional expectation IE

ξ

η = y

(isto ´e, m(y) – acrescimo meu) is simpler and more natural than IE

ξ F_η

. However, IE ξ

F_η

, considered as a F_η-measurable random variable, is more convenient to work with.”

Sendo guido por esta frase, eu olho na rela¸c˜ao Z

A

ξ dIP = Z

A

IE ξ

F_η

dIP. (5.26)

que copiei da Defini¸c˜ao 1, comparo-la com (1.24) e concluo que se precisasse calcular R

Aξ dIP, usaria então (1.24) pois no seu lado direito há integral de Lebesgue-Stiltijes, a qual eu consigo calcular, diferentemente da integral de Lebesgue que fica no lado direito de (1.26), a qual eu não saberia calcular. Esta é a “praticidade” que m possui. Uma outra practicidade é que é mais fácil conceber m de que IE

ξ F_η

; sobre isto eu j´a discursei acima.

Exerc´ıcio 50. Nos argumentos da presente se¸c˜ao, foi usado o seguinte

Teorema. Seja φ variável aleatória F_η-mensurável. Então existe fun¸cão boreliana f :R→R tal que φ =f ◦η, isto é, φ(ω) = f(η(ω)), para cada ω ∈Ω.

Este resultado foi formulado no Cap´ıtulo 3 no qual apresentei as propriedades básicas de variáveis aleatórias. Agora que você viu a utilidade do teorema, pode voltar ao Cap´ıtulo 3 e ler a demonstra¸cão.

Exerc´ıcio 51. Nos argumentos da presente se¸cão, foi usado o teorema sobre troca de variável em integral de Lebesgue. Agora que você viu sua utilidade, pode voltar ao Cap´ıtulo 4 e ler a demonstra¸cão.

5.2.10 O caminho da defini¸ c˜ ao de esperan¸ ca condicional via probabilidade condicional

Existem outras maneiras para a defini¸cão da esperan¸ca condicional em rela¸cão a σ-álgebra? Se você fez meu Exerc´ıcio 1, sua resposta nesta pergunta é “sim, há uma a mais”. A maneira que você tem em mente está motivada por itens (b), (c), (f) e (g) do exerc´ıcio, e sua descri¸cão informal é assim: primeiramente, construir a distribui¸cão condicional de ξ dado que η assume valor y, e depois calcular a esperan¸ca em rela¸cão da distribui¸cão constru´ıda. Eu concordo com sua resposta, e ainda acrescento que a maneira de cálculo por você sugerida vai resultar naquilo que denotamos por IE[ξ

η = y] na Se¸cão 1.2.9, quer dizer, a maneira por você sugerida é realmente uma alternativa à constru¸cão deIE[ξ

η=y] que foi executada naquela se¸cão. Entretanto, tudo que eu falei acima acerca de sua maneira, está por enquanto válido somente nos casos considerados pelos itens (b), (c), (f) e (g) do

(13)

Exerc´ıcio 1. Qual genérica esta maneira é continua ser uma pergunta que não pode ser respondida por métodos e ferramentas desenvolvidos até agora.

E importante que vocˆ´ e saiba que é poss´ıvel construir abordagem matematicamente rigorosa que produz o objeto chamadoa probabilidade condicional condicionada ao evento {η =y} quando é aplicada ao espa¸co arbitrário (Ω,F, IP) e variável aleatória arbitrária η. Ainda mais, é poss´ıvel mostrar que ao tomar esperan¸ca de uma variável aleatória ξem rela¸cão desta probabilidade condicional, então o resultado coincidirá com IE[ξ

η = y] que foi definida nas se¸c˜oes anteriores pela abordagem diferente daquela sobre a qual estamos falando agora.

A abordagem matematicamente rigorosa supracitada obriga a entrar na constru¸cão e discussão de regular condicional probability. Toda a abordagem encontra problemas técnicos cujas solu¸cões exigem muito cuidado. Você pode ver os detalhes no livro de Shiryaev. Eu não vou incluir tudo isto no meu curso devido ao limite do tempo de sua dura¸cão (que é tipicamente um semestre). Entretanto, você deve saber que é a teoria de probabilidades condicionais regulares que ampara a existência e revela as propriedades das distribui¸cões condicionais sobre as quais versam os itens (b), (c), (f) e (g) do Exerc´ıcio 1, o Exemplo 3 (veja a Eq. (1.21)).

5.2.11 Desconhe¸ co m´ etodo universal capaz de construir a esperan¸ ca condicional em rela¸ c˜ ao a σ-´ algebra em qual- quer espa¸ co com medida e qualquer vari´ avel aleat´ oria

Sim, esta seria minha resposta se vocˆe viesse com o seguinte pedido: “Vou lhe trazer (Ω,F, IP),G ⊆ F eξ ao meu gosto e vou lhe pedir a construirIE[ξ

G]. Vai poder?”

Minha dificuldade está situada principalmente no fato que a demonstra¸cão do Teorema de Radon-Nikodym não é construtiva, e portanto não permite construir explicitamente aquele objeto cuja existência está alegada pelo teorema e cujo papel

´e garantir a existˆencia de IE[ξ G].

Minha experiˆencia relacionada a sua pergunta diz que cada caso requer abordagem adaptada a suas particularidades para que se possa construir IE[ξ

G]. Um dos casos é quando Ω é finito. Este foi resolvido na Se¸cão 1.2.4. Os casos nos quais Ω é mais que enumerável tipicamente efrentam a dificuldade relatada no parágrafo acima. Em tais casos, eu usaria qualquer método e idéia para adivinhar a cara de IE[ξ

G], e depois confirmaria que este ´e a esperan¸ca condicional desejada via a verifica¸c˜ao da igualdade

Z

A

ξ dIP = Z

A

IE ξ

G

dIP (5.27)

Esta é a rela¸cão da própria defini¸cão de IE[ξ

G], e a verifica¸cão de sua validade parece me ser o único caminho que leva à confirma¸cão que uma variável aleatória atende aos quesitos para ser IE[ξ

G].

Observe entretanto que a verifica¸cão da igualdade supraformulada deve ser feita para cada A ∈ G o que é um trabalho não trivial. Uma outra complica¸cão com tal verifica¸cão é a dificuldade no cálculo de valores numéricos das integrais envolvidas; a dificuldade surge devido ao fato de que as integrais são de Lebesgue e nós não temos método genérico para tal cálculo. Al´ıas, o único caminho universal para o cálculo de integral de Lebesgue é via a transforma¸cão desta à integral de Riemann-Stiltjes.

(14)

Este fato explica a raz˜ao pela qual o problema de constru¸c˜ao de IE[ξ

G] formula-se predominantemente nos espa¸cos Rⁿ.

Uma maneira para lidar com o pedido “construaIE[ξ

G]” é não tentar construir a variável aleatória solicitada, mas, em vez dela, construir a fun¸cão m (definida e analisada na Se¸cão 1.2.9). A vantagem desta substitui¸cão está no que com ela será necessário a verifica¸cão da rela¸cão

Z

A=η⁻¹(B)

ξ(ω)dIP(ω) = Z

B

m(y)dIP_η(y) para cada B ∈ B(R) (5.28) em vez da rela¸cão (1.27). Observe que a integral à lado direito é de Riemann- Stiltjes, logo, calculável, enquanto que a integral à lado esquerdo pode substitu´ıdo pela integral de Riemann-Stiltjes, também calculável, se passar para a distribui¸cão induzida pelaξ em (R,B):

Z

ξ(ω)dIP(ω) −→

Z

xdIP_ξ(x)

5.2.12 Como viver esta vida sem poder construir a espe- ran¸ ca condicional em rela¸ c˜ ao a σ-´ algebra?

Acontece que é extremamente raro que surge a necessidade em construir explicitamente a esperan¸ca condicional em rela¸cão a σ-álgebra. Na realidade, eu, até agora, não vi nenhuma.

Em estudos teóricos, é suficiente saber que tal esperan¸ca condicional existe, e um estudo teórico que envolve tal esperan¸ca está completamente “satisfeito” com as propriedades desta esperan¸ca, do tipo daqueles que aparecem nos exerc´ıcios da Se¸cão 1.4. Um exemplo de tal estudo é qualquer análise de processos estocásticos com emprego de martingais.

Em estudos práticos a esperan¸ca condicional não está calculada, mas sim imposta como um dos ingradientes da constru¸cão de modelo probabil´ıstico. Exemplos 2 e 3 são casos de tal imposi¸cão. Para entender aquilo que acontece em estudos de modelos continuos com objetivos de revela¸cão de conclusões práticas, é precisa entender a constru¸cão de tais modelos. Acontece que a realidade nunca é cont´ınua. Isto faz com que um modelo probabil´ıstico fiel a situa¸cão real é sempre finito. Se em tal modelo você modelar um atributo por X e um outro por Y, então X e Y são variáveis aleatórias discretas, e, devido à tal discretidade, você sempre pode calcular IE[X

Y]. Num certo etapa de estudo, você pode querer substituir seu modelo finito pelo modelo cont´ınuo (querer pela simples razão de haver muito mais ferramentas matemáticas aplicáveis aos modelos cont´ınuas de que aos modelos finitos). Se você substituirX eY porξeηrespectivamente, entãoIE[ξ

η] deve ser aproxima¸c˜ao para IE[X

Y]. Em outras palavras, na passagem de modelo finito para cont´ınuo, você já deve “inventar” as distribui¸cões de ξ, η e IE[ξ

η] de tal forma que estes estejam boas aproxima¸c˜oes para X, Y e IE[X

Y]. Em muitos situa¸cões desta matureza, constroi-se primeiramente a distribui¸cão de Y, depois, constroi-se a distribui¸cão de X dado que Y =y, e a partir destas duas, constroi-se a distribui¸cão de X.

(15)

5.2.13 Se vocˆ e viu constru¸ c˜ ao universal da esperan¸ ca con- dicional que funciona para qualquer espa¸ co cont´ınuo ent˜ ao ela provavelmente est´ a errada

Há um livro didático absolutamente maravilhoso. E “Probabilidade; Um Curso´ Intermediário” de Barry James. Eu ainda devo ao autor do livro uma página de texto cheia de elogios pela sua escolha de material apresentado e pela forma de apresenta¸cão. Mas isto vou fazer no futuro. Agora só vou falar da maneira como o livro constroi a esperan¸ca condicional em rela¸cão a σ-álgebra.

E precisa ter em mente que livro destina-se aos alunos de n´ıvel intermedi´´ ario e que, consequentemente, suas constru¸cões e demonstra¸cões são adaptadas a tal n´ıvel.

Em particular, há no livro a constru¸cão adaptada para constru¸cão da distribui¸cão de variável X dado que outra variável Y assumiu valory. Depois, via tal distribui¸cão, o livro calculaIE[X

Y =y]. Este é a fun¸cão m de nossa Se¸cão 1.2.9. Segundo aos argumentos daquela se¸cão, conclui-se que está constru´ıda tambem IE[X

G_Y].

Infelizmente, existem pessoas que estudaram pelo este livro e ficaram com a impressão que sua maneira de constru¸cão da esperam¸ca condicional é universal. Pior que isto, parece-me que há professores que contribuem para o espalhamento desta maneira, e, consequentemente, há programas de doutorado no Brasil cujos alunos aprendem esta maneira na aulas sem serem avisados sobre não universalidade dela e sobre o fato que a maneira ensinada é a adapta¸cão didática mas não rigorosa feita para atender alunos que desejam entender a Teoria de Probabilidade somente no n´ıvel intermediário.

Para salvar a p´atria, ´e, portanto, imprescind´ıvel fazer o seguinte exerc´ıcio:

Exerc´ıcio 52. Recorde a abordagem de constru¸cão da distribui¸cão de variável X dado que outra variávelY assumiu valory que foi sugerida em “Probabilidade; Um Curso Intermediário” de Barry James. Mostre que a abordagem apresenta falhas.

Dica: Eu lembro ter mostrado que a abordagem possui falhas. Infelizmente, não lembro onde guardei o exemplo que contrui. Mas lembro que a deficiência da abordagem está a arbitrariedade da forma como ∆y converge a y (ambas as nota¸cões estão definidas na constru¸cão da abordagem). Meu exemplo era uma distribui¸cão conjunta de X eY, e duas maneiras de diminuir ∆y ao valor de y da sorte tal que as maneiras resultavas em distribui¸cões diferentes de X dado Y =y.

(16)

5.3 Apˆ endice ao Cap´ıtulo 1

5.3.1 As transparˆ encias da primeira video-aula sobre Espe-

ran¸ ca Condicional

(17)

(18)

5.3.2 As transparˆ encias da segunda video-aula sobre Espe-

ran¸ ca Condicional

(19)

(20)

5.4 Exerc´ıcios do Cap´ıtulo 1

Exer. 53. O presente exerc´ıcio está aqui para lhe lembrar que é importante que você responda em todos os itens do Exc. 1.

Alguns conceitos e termos usados no exerc´ıcio supracitado precisam de esclare- cimentos. Vamos nessa.

A distribui¸cãode variável aleatória X entende-se como a medida nos conjuntos deB(R) induzida pela fun¸cão boreleanaX : Ω→Ra partir de medidaIP (da trinca (Ω, IP,F)).

No caso quandoXé discreta, a suadistribui¸cãopode ser apresentada pela tabela que contem todos os valores queX pode assumir junto com as respectivas probabilidades (se desejar o nome mais cient´ıfica, pode falar de fun¸cão que mapeia o conjunto de valores de X ao intervalo [0,1], mas eu gosto da maniera mais profana, isto é,

“tabela”). Da mesma maneira, por distribui¸cão de um vetor (X, Y) de variáveis aleatórias discretas está entendida uma tabela que contém todos os pares de valores e todas as respectivas probabilidades, como, por exemplo, a de baixo:

Y y₁ y₂ X

x₁ p₁₁ p₁₂ x₂ p₂₁ p₂₂ x₃ p₃₁ p₃₂

Observe que a distribui¸cão de par (X, Y) pode ser dada em forma de valores e probabilidades {p_ij}, como no caso da tabela acima, e pode também ser dada por uma maneira alternativa que será apresentada em seguida. Antes da apresenta¸cão, só quero avisar que a informa¸cão por ela carregada é importante somente para o destaque de uma particularidade da tarefa formulada no item (l) da Lista de Nomes e Propriedades. Então, a maneira alternativa é a seguinte: apresenta-se Ω (discreto), apresenta-se IP para cada ω ∈ Ω, e por fim, apresentam-se os conjuntos {A_ij} que satisfazem a seguinte propriedade: em A_ij, o valor de X é x_i e o valor de Y é y_j. Observe a respeito disso, que eu propositamente evitei esse caminho alternativo quando formulei o item (l), pois com o uso dessa maneira a fórmula final não seria a Eq. 1.5, mas a seguinte equa¸cão

IE[X1I_D] =X

j∈J

IE[X

Y =b_j]×IP {A_1j∪A_2j∪ · · · ∪A_ij} (5.29) A Eq. (1.5) foi privilegiada em detrimento da Eq. (1.29) pois a primeira tem mais semelhan¸cas com a Eq. (1.13), cuja constru¸c˜ao pode ser explicada por analogia com a constru¸c˜oe de Eq. (1.5) ou de Eq. (1.29).

Exer. 54. O exerc´ıcio serve para convencer você que caso (X, Y) tem distribui¸cão discreta, a´ı então a defini¸cão implicita da esperan¸ca condicional permite que essa seja calculada explicitamente. Observe que a discussão em torno da implici- tude/explicitude da defini¸cão da esperan¸ca condicional está no centro de toda nossa discussão desse objeto. Seja Ω = {ω₁, ω₂, . . . , ω₉}, e defina IP[ω_i] = i/45. Seja

(21)

variável aleatória Y tal que seu valor é

1, ∀ω∈B₁ ={ω₁, ω₂, ω₃} 2, ∀ω∈B₂ ={ω₄, ω₅, ω₆} 3, ∀ω∈B₃ ={ω₇, ω₈, ω₉} Seja

D={{ω1}, {ω2, ω3, ω4},{ω5, ω7, ω8},{ω6, ω9}}

CalculeIE Y

D

. Preste a aten¸cão que voce consegue achar toda a estrutura dessa variável aleatória .

Exer. 55. (^veja→ ) Por que há diferen¸ca nas defini¸cões da esperan¸ca condicional de A discussão aqui está

em torno da maneira como a defini¸c˜ao de esperan¸ca condicional trata o caso quando a integral envolvida na defini¸c˜ao assume valor

∞ ou −∞.

Shiriaev e de Williams? Qual ´e a diferen¸ca? No que esta diferen¸ca pode influenciar?

Não se assuste com esta questão! A diferen¸ca não está na própria defini¸cão, mas sim nas condi¸cões impostas na variável aleatória X para qual os gigantes (Shiryaev e Williams, quer dizer) definemIE

X G

. Entenda o por quˆe da diferen¸ca.

Exer. 56 Conve¸ca-se (e tente me convencer) que a defini¸c˜ao da probabilidade condicional

IP A

B

= IP

A∩B IP

B , quando IP B

6= 0,

est´a de acordo com nossa concep¸c˜ao intuitiva da probabilidade condicional.

Para me entender melhor, imagine que você decidiu introduzir o conceito de probabilidade condicional no curso de Estat´ıstica Básica para uma faculdade de ciências não exatas. Que seja esta de Psicologia, para t´ıtulo de exemplo. Se você fosse recem-doutor em Estat´ıstica, você escreveria, convencido em sua retidão e orgulhoso de sua sabedoria, a fórmula acima como a defini¸cão da probabilidade condicional. Imagine agora que um de seus alunos é um bis-neto de Freud e de P. Lévy. Como para este Lévy-Freud, você não é uma autoridade incontestável, então ele tem coragem de perguntar: “Por que esta é a defini¸cão da probabilidade condicional?”Veja que no fundo da pergunta residem-se duas dúvidas, a saber: o que é a probabilidade condicional na concep¸cão profana e por que esta bate com a defini¸cão do professor. Como você responderia?

Os exerc´ıcios 9 - 14 são do livro de Shiryaev do Cap´ıtulo I, Se¸cão 9. Em todos estes exerc´ıcios, as variáveis aleatórias são discretas e as esperan¸cas condicionais são tomadas em rela¸cão de decomposi¸cão (ou, parti¸cão, se você preferir esse termo

`

aquele) do espa¸co amostral; vale lembrar ainda a respeito desta remarca, que a palavra “decoposi¸cão” entende-se como “a decomposi¸cão em um número finito de subconjuntos disjuntos de Ω os quais cobrem todo o Ω”, e lembrarei ainda que qualquer um de tais subconjuntos chama-se “átomo”. Eu re-escrevi os exerc´ıcios pois quiz acrescentar meus comentários.

Ex. 57. Give an example of random variables ξ and η which are not independent but for which IE

ξ η

= IE ξ

.

E ´´ obvio que a pergunta tem a ver com a propriedade de que IE ξ

η

= IE ξ valida sempre quando ξ e η são independentes. Alias, lembrei agora que há uma pergunta que gostaria de colocar para você: Por que falam “variáveis aleatóriasξ e η independentes”? Não seria suficiente dizer “ξ é independente deη”? Ou será que

(22)

o equivalente correto seria “ξ independente deη e, ao mesmo tempoη independente de ξ”?

Ex. 58. The random variable V ξ

D

defined as Var

ξ D

:= IE

ξ−IE ξ

D2 D

is calledthe conditional variance of ξ with respect of D. Show that Varξ =IEVar

ξ D

+ VarIE ξ

D .

Não é que os s´ımbolos Var e IE colocados em sequencia IEVar ou VarIE deixaram você de cabelo em pé por alguns instantes? Espero que você adivinhou rápido a significâcia de cada um deles.

Observe tambem, que a variância condicional não é um termo padrão como é a esperan¸ca condicional, no sentido de que esta última aparece em todos os livros sobre a Teoria de Probabilidades e que todos estes dão a mesma defini¸cão. Já quanto

`

a variância condicional, se eu perguntar de uma pessoa, que numca via este objeto, que poderia ser a defini¸cão dele, é provável que a resposta seráIE

ξ−IE ξ2

D , o que é diferente da defini¸cão dada acima. Bom, seja que for o seu passado, a partir de agora a única e correta defini¸cão da variância condicional é aquela dada acima neste exerc´ıcio.

Ex. 59. Using the property thatIE ξη

D

=η IE ξ

D

, when ηisD-measurable, show that for every functionf, it holds that

IE

f(η)IE ξ

η = IE

ξ f(η) .

(Aqui, tem que lembrar que as variáveis aleatórias tratadas são discretas e por isto, f(η) tambem é variável aleatória discreta.)

Ex. 60. Let ξ and η be random variables. Show that inf_fIE

η− f(ξ)2

is attained forf^∗(ξ) =IE

η ξ

. (Consequently, the best estimator for ηin terms of ξ, in the mean-square sense, is the conditional expectation IE

η ξ

.)

Eis o que eu dizia para meus alunos dos anos passados: Prezados! Este fato é muito importante. O problema com ele é que eu não sei como prová-lo. É um t´ıpico problema variacional: tem que achar o m´ınimo de um funcional. Mas este funcional está definido em espa¸co de fun¸cões e não em R or R^d. Não deve ser dif´ıcil para qualquer um menos eu, pois acho que durante meus estudos na universidade matava as aulas da disciplina “Optimiza¸cão”.

Hoje, parece que tenho vis˜ao pouco mais esclarecida a respeito desse exerc´ıcio.

Acontece que há um fato, cuja existência era por mim desconhecida, que diz que o infinum da expressão

IE

(X−a)²

, onde X é qq variável aleatória e a é qq número real alcan¸ca-se para a = IE[X]. Isso é algo fantástico pois mostra que há uma liga¸cão não trivial entre a variânica e a esperan¸ca de uma variável aleatória !

(23)

Ex. 61. Let ξ1, . . . , ξn, τ be independent random variables, where ξ1, . . . , ξn are identically distributed and τ takes the values 1,2, . . . , n. Show that if S_τ := ξ₁ +

· · ·+ξ_τ is the sum of random number of random variables, then IE

S_τ τ

= τ IE ξ₁

, Var S_τ

τ

=τVar ξ₁

and IE

S_τ

=IE τ

·IE ξ₁

, Var S_τ

=IE τ

·Var ξ₁

+ Var τ

· IE ξ₁2

. E ´´ obvio que Var

Sτ

τ

deve ser entendido conforme a defini¸c˜ao dada no Ex. 10.

Gostaria de acrescentar que as fórmulas são validas mesmo quando ξ1, ξ2, . . .é uma sequencia infinita de variáveis aleatórias independentes e τ não depende desta sequencia e assume valores 0,1,2, . . .. Preste a aten¸cão às mudan¸cas: a sequencia ficou infinita eτ agora assume valores emN. Esta última mudan¸ca é natural, poisτ conta quantas variáveis aleatórias da sequencia devem ser tomadas na soma. O que não é natural é permitir que τ assuma tambem o valor 0. Isto devido ao fato de que S_τ parece estranho quando τ = 0. De fato, o valor de S0 não segue-se intuitivamente e naturalmente da defini¸cão de S_τ para τ diferente de 0. Esta valor determina-se pela defini¸cão “avulsa” que diz que S₀ = 0. O caso particular no qual τ tem a distribui¸cão de Poisson é muito utilizado na teoria de risco. Precisamente falando, a variável aleatóriaS_τ é muito utilizada como o modelo da perda acumulada, sendo que τ interpreta-se neste modelo como o número de sinistros e cada ξ_i como a se- veridade (ou perda, em outras palavras) do i-ésimo sinistro. Tal ampla utiliza¸cão deve-se as propriedades da distribui¸cão de Poisson que são muitas e todas boas.

Então, acontece que quando a distribui¸cão de τ não é Poisson, a maioria das propriedades principais deixam de existir e levam com elas um monte de propriedades secundárias e tado a constru¸cão fica muito incômoda para o uso na prática.

Meu comentário do parágrafo anterior levanta a dúvida sobre o por que Shiriayev não formulou seu exerc´ıcio já para sequencia infinita deξ’s. A resposta não é trivial.

Eis esta: Para colocar um número infinito de variáveis aleatórias num espa¸co de probabilidades é precisa de constru¸cões e teoremas que fogem do escopo da Teoria de Probabilidades Elementar, e, já que Cap´ıtulo I do livro pensava-se como a cole¸cão de fatos cab´ıveis a tal teoria, então o autor evitou a falar sobre tal situa¸cão.

Ex. 62. Prove queIE ξ

D

=IE ξ

quandoξé independente da parti¸cãoD(o que entende-se, pela própria defini¸cão, que ξ e 1ID para qualquer átomo D da parti¸cão D).

Exc. 63 Você precisa saber que existe uma lista de propriedades “clássico-básicas”

da esperan¸ca condicional. Essa lista está no livro de Shiryaev, e também em todo e qualquer livro didático que toca no assuno “esperan¸ca condicional”. Por exemplo, a lista que você vê abaixo foi copiada por mim do livro de Williams (§9.7). de seu livro delimita bem o conjunto das que chamaria por “básicas”. A lista está repetida por mim logo abaixo, e depois desta, eu sugiro a maneira que você deve seguir para conhecer satisfatoriamente as propriedades da lista.

(a) If Y is any version of IE X

G

then IE[Y] =IE[X].

(b) If X is G measurable, then IE X

G

=X, a.s.

(24)

(c) (Linearity) IE

a1X1+a2X2

G

=a1IE X1

G

+a2IE X2

G

, a.s.

Clarification: if Y₁ is a version ofIE X₁

G

and Y₂ is a version ofIE X₂

G , then a₁Y₁+a₂Y₂ is a version of IE

a₁X₁+a₂X₂ G

. (d) (Positivity) If X ≥0, then IE

X G

≥0, a.s.

(e) (conditionalMON) If 0≤X_n↑X, then IE X_n

G

↑IE X

G , a.s.

(f) (conditionalFATOU) If X_n ≥ 0, then IE

lim infX_n G

≤ lim infIE X_n

G , a.s.

(g) (conditionalDOM) If|X_n(ω)| ≤V(ω),∀n,IE[V]<∞, andX_n→X, a.s., then IE

X_n G

→IE X

G , a.s.

(h) (conditionalJENSEN) If c : R→R is convex and IE[|c(X)|]<∞then IE

c(X) G

≥c IE X

G , a.s.

Important corollary:

IE X

G

p ≤ kXk_p, for p≥1.

(i) (Tower Property) If H is a sub-σ-algebra of G, then IEh

IE X

G Hi

=IE X

H , a.s.

Note: We shorthand LHS toIE X

G H

(Esta eu n˜ao entendi!) for tidiness.

(j) (‘Taking out what is known´) If Z is G-measurable and bounded, then IE

ZX G

=Z IE X

G , a.s.

If p >1, p⁻¹+q⁻¹ = 1, X ∈ L^p(Ω,F,P) and Z ∈ L^q(Ω,F,P), then the above equality holds. If X ∈ (mF)⁺, Z ∈ (mG)⁺ (procure o significado disto no livro) and IE[ZX]<∞, then the above equality holds.

(k) (Rˆole of independence) IfH is independent ofσ(σ(X),G) (nem Williams, nem eu errou: aqui h´a duas ‘σ´), then

IE X

σ(G,H

=IE X

G , a.s.

Agora, gostaria de chamar sua aten¸cão à rela¸cão (17) do § 8, Cap. I do livro de Shiryaev:

IE ξη

D

=η IE ξ

D

, onde η ´e D mensur´avel

E extamente a propriedade (j) da lista acima, mas formulada e provada para o´ caso quando Ω é finito. Neste caso, as variáveis aleatórias envolvidas assumem número finito de valores e a σ-álgebra pode ser visualizada pela correspondente parti¸cão. Consequentemente, a demonstra¸cão torna-se elementar (isto não significa trivial! isto significa que as manipula¸cões envolvidas na demostra¸cão não exigem conhecimentos acima dos que o leitor adquiriu no curso de Probabilidade Elementar).

Eu pe¸co que você fa¸ca as demonstra¸cões elementares das propriedades (a)–(k) da lista acima. Note que algumas demonstra¸cões exigerão sua sa´ıda de espa¸co finito

(25)

para espa¸co infinito, o qual, porém, pode ser só enumerável; explicitamente falando, são as demostra¸cões das propriedades sobre a convergência.

Sugiro ainda que você simplifique demonstra¸cões, onde for poss´ıvel. Por exemplo, na demonstra¸cão do Shiryaev mencionada acima, era suficiente tomar ξ e η da maneira que cada uma assume duas valores só.

Exer. 64 Fa¸ca os 5 primeiros exerc´ıcios do §8, Cap. I do livro “Probabilidade”

de Shiryaev (o último, sexto, pede estabelecer uma rela¸cão que já está na lista do Exerc´ıcio 15 acima).

(26)

Convergˆ encia de vari´ aveis aleat´ orias

6.1 Sugest˜ oes e coment´ arios do ministrante

6.1.1 Adendum ` a aula sobre Lei 0–1 de Kolmogorov

A presente sub-se¸cão foi inicialmente planejada como a apresenta¸cão duma pergunta levantada por um de meus alunos na aula sobre a Lei 0–1 de Kolmogorov. A aten¸cão a ser despejada à tal pergunta motiva-se pelo seguinte: a pergunta serve de um exce- lente exerc´ıcio, pois por si só ela não é muito dif´ıcil, mas, ao mesmo tempo, a procura pela sua resposta obriga meu leitor a vascular por toda a matéria relacionada à Lei.

Entretanto, para poder formular a pergunta e atrelar a mesma aos diversos vertentes da Lei e de sua demostra¸cão, eu precei recordar quase toda a demonstra¸cão da Lei, inclusive as constru¸cões usadas na formula¸cão e na demostra¸cão. Tal recorda¸cão detalhada gerou um bom número de exerc´ıcios, que são mais curtos e simples de que o exerc´ıcio mtivado pela pergunta supramencionada levantada por um dos alunos.

Então, ao final, o texto da sub-se¸cão ficou parecido com “comentários do ministrante sobre Lei 0–1 de Kolmogorov”.

O plano então é o seguinte: vou apresentar a defini¸cão tradiconal deσ(ξ₁, ξ₂, . . .), prosseguir para a defini¸cão de σ-álgebra caudal, formular a Lei 0–1 de Kolmogorov e interpretá-la. No final, formularei a “pergunta de um dos alunos”; ela estará a partir da Marca Marginal 2.

Come¸co então com a constru¸c˜1 ao daquela σ-álgebra que está denotada por σ(ξ₁, ξ₂, . . .). A constru¸cão daσ-álgebra desejada faz-se em duas etapas. Na primeira etapa, faz-se a álgebra (^veja→)

Exc. 19 lhe convida a confirmar as propriedades da ´algebra desse objeto.

∪^∞_n=1σ(ξ₁, ξ₂, . . . , ξ_n) (6.1) Na segunda etapa, completa-se a constru¸cão completando a álgebra até σ-álgebra (recorde, o s´ımblo σ(A) significa a menor σ-álgebra que contém a cole¸cão A de conjuntos quaisquer; no nosso caso,A é a álgebra de (2.1))(^veja→):

Infelizmente, o meso s´ımbolo está usado com sentidos diferentes: σ() com lista de variáveis aleatórias entre parênteces tem significado definido por (2.1) ou (2.2); já se entre as parênteces encontra-se uma

´

algebra, então aquele s´ımbolo significa a menor σ-álgebra que contém a álgebra.

σ(ξ₁, ξ₂, . . .) := σ(∪^∞_n=1σ(ξ₁, ξ₂, . . . , ξ_n)) (6.2)

90