SejaX uma vari´avel aleat´oria qualquer e sejaF(·) sua fun¸c˜ao de distribui¸c˜ao.
SejaX1, X2, . . .uma seq¨uˆencia infinita de vari´aveis aleat´orias , todas elas inde-pendentes entre si, onde cada possui a mesma distribui¸c˜ao queX. Considere o seguinte problema:
(P5) Encontrar duas seq¨uˆencias num´ericas {cn} e {dn} tais que a seq¨uˆencia de vari´aveis aleat´orias
c−1n [max(X1, . . . , Xn)−dn], n= 1,2, . . . (20) convirja em distribui¸c˜ao para alguma vari´avel aleat´oria n˜ao degenerada.
Este ´e o problemada distribui¸c˜ao assint´otica de extremos.
Antes de analisar o problema, explicaremos os significados de “convergir em distribui¸c˜ao” e “vari´avel aleat´oria degenerada”.
SejamV eV1, V2, . . .vari´aveis aleat´orias quaisquer. Diz-se que a seq¨uˆencia {Vn, n≥1}converge em distribui¸c˜ao`a vari´avel aleat´oriaV seFVn(·), a fun¸c˜ao de distribui¸c˜ao da vari´avel aleat´oria Vn, converge conforme n → ∞ a FV(·), a fun¸c˜ao de distribui¸c˜ao da vari´avel aleat´oria V, em cada ponto x ∈ R onde FV(x) ´e cont´ınua. Esta ´ultima restri¸c˜ao, que limita a convergˆenica somente aos pontos de continuidade da fun¸c˜ao-limite, pode parecer estranha a primeira vista, contudo ela n˜ao ´e uma restri¸c˜ao, mas sim um al´ıvio. Sem ela muitas convergˆencias ´uteis seriam “desclassificadas”, um aspecto que n˜ao discutiremos no nosso presente trabalho.
Muitas perguntas sobre o conceito de convergˆencia em distribui¸c˜ao ser˜ao es-clarecidas se vocˆe leitor, recordar o Teorema Central do Limite. Lembraremos este teorema para um caso espec´ıfico. Suponha que as vari´aveis aleat´orias X1, X2, . . .representem os resultados dos lan¸camentos de uma moeda honesta de forma tal queXi assuma o valor 1 caso oi-´esimo lan¸camento seja “cara”, e assuma 0 caso seja “coroa”. ´E ´obvio, a partir desta constru¸c˜ao, que estas vari´aveis aleat´orias s˜ao independentes e identicamente ditribu´ıdas e que, por-tanto, se definirmosSn=X1+· · ·+Xn, as condi¸c˜oes do Teorema Central do
Limite ser˜ao validadas, e o teorema nos garantir´a que Sn−IE[Sn]
pVar [Sn] converge em distribui¸c˜ao `a vari´avel aleat´oria Z, (21) ondeZ denota vari´avel aleat´oria Normal Padr˜ao. Lembrando o significado de
“convergir em distribui¸c˜ao” e lembrando que o valor de fun¸c˜ao de distribui¸c˜ao em qualquerx significa a probabilidade da sua vari´avel aleat´oria asusmir val-ores menval-ores quex, conclu´ımos que o teorema alega que
IP
(Sn−IE[Sn] pVar [Sn] ≤x
)
→IP {Z ≤x}, (22) para qualquer que seja x, pois, como se sabe, a fun¸c˜ao de distribui¸c˜ao da vari´avel aleat´oria Normal Padr˜ao ´e cont´ınua em todo x. Segue-se da rela¸c˜ao (22) que sen for fixo e suficientemente grande, poderemos aproximar a prob-abilidade do lado esquerdo desta rela¸c˜ao pela probprob-abilidade do lado dire-ito. Esta aproxima¸c˜ao ´e o exemplo da principal aplica¸c˜ao pr´atica do Teo-rema Central do Limite: ele nos permite aproximar a probabilidade, que envolve vari´aveis aleat´orias complicadas, pela probabilidade que envolve a vari´avel aleat´oria Normal Padr˜ao. De fato, suponha que queremos estimar a probabilidade de que emn= 100 lan¸camentos haver´a no m´aximo 45 caras:
IP{S100 ≤45}. A estimativa pode ser feita ent˜ao usando o Teorema Central do Limite e o fato de os valores deIE[Sn] e de Var [Sn] serem iguais a n/2 e an/4, respectivamente, via a rela¸c˜ao:
IP {S100≤45} = IP
(S100−IE[S100]
pVar [S100] ≤ 45−IE[S100] pVar [S100]
)
= IP
(S100−IE[S100]
pVar [S100] ≤ 45−50 5
)
(23)
≈ IP{Z ≤ −1}= 0,15866
onde na ´ultima passagem usamos a tabela de valores da fun¸c˜ao de distribui¸c˜ao da vari´avel aleat´oria Normal Padr˜ao.
Nos argumentos do par´agrafo acima chamamos a aten¸c˜ao do leitor ao fato da convergˆencia em distribui¸c˜ao, quando vale, ser uma propriedade ´util para estimar probablilidades que envolvam vari´aveis aleat´orias complicadas, como, por exemplo, a vari´avel aleat´oria S100 analisada acima. Note a respeito
deste exemplo que de antem˜ao sabemos que esta vari´avel aleat´oria possui dis-tribui¸c˜ao binomial (de parˆametros 100 e 1/2), e que portanto, o c´alculo de IP{S100 ≤45}poderia ter sido feito a partir desta distribui¸c˜ao, sem a necessi-dade da ajuda do Teorema Central do Limite. ´E claro que se complic´assemos um pouco o problema, lan¸cando um dado em vez de uma moeda, onde as faces dos lan¸camentos obtidos seriam as vari´aveis aleat´oriasX1, X2, . . ., ent˜ao o c´alculo direto de IP {S100 ≤45} seria imposs´ıvel, enquanto que o Teorema Central do Limite continuaria v´alido, fornecendo uma boa aproxima¸c˜ao para esta probabilidade.
Devemos avisar os leitores de que na Teoria de Probabilidades existem diversos tipos de convergˆencia, cada um deles com suas aplica¸c˜oes: uma seq¨uˆencia de vari´aveis aleat´orias pode convergir a uma vari´avel aleat´oria em probabilidade, pode convergir quase certamente, e pode convergir ainda de outras formas, em particular pode convergir em distribui¸c˜ao – conceito que foi explicado acima e que, dentre todos os demais tipos de convergˆencia, ser´a o
´
unico relevante em nossa exposi¸c˜ao a seguir.
Voltando `a defini¸c˜ao de convergˆencia em distribui¸c˜ao, ´e totalmente natural que o leitor tenha se estranhando com fato de a defini¸c˜ao deste conceito exigir a convergˆencia somente nos pontos de continuidade da fun¸c˜ao de distribui¸c˜ao limite. Realmente n˜ao ´e ´obvio que os pontos de discontinuidade possam ser
“omitidos”. Felizmente, as fun¸c˜oes de distribui¸c˜ao limite, que podem surgir na solu¸c˜ao do problema da distribui¸c˜ao assint´otica de extremos, s˜ao todas cont´ınuas. Isto nos permite ocultar a discuss˜ao das raz˜oes que levaram a este estranho previl´egio dado aos pontos de descontinuidade.
Por fim, apresentaremos o conceito de ditribui¸c˜ao degenerada e expli-caremos porque esta foi rejeitada no enunciado do problema da distribui¸c˜ao assint´otica de extremos. Lembramos ao leitor que uma vari´avel aleat´oria se chamadegenerada se ela ´e uma constante, isto ´e, se ela assume um ´unico valor com probabilidade total igual a 1 – da´ı o termo “degenerada”. Uma fun¸c˜ao de distribui¸c˜ao ´e dita degenerada se sua vari´avel aleat´oria correspondente for degenerada. Todas as fun¸c˜oes de distribui¸c˜ao degeneradas tˆem a mesma cara:
s˜ao fun¸c˜oes-escada que possuem um ´unico salto de tamanho 1 (um). De fato, se uma vari´avel aleat´oria degenerada ´e igual a uma constante c, ent˜ao sua fun¸c˜ao de distribui¸c˜ao vale 0 `a esquerda de c e assume o valor 1 em c e `a direta dec.
As fun¸c˜oes de distribui¸c˜ao degeneradas s˜ao geralmente in´uteis quando as-sumem o papel da fun¸c˜ao-limite em resultados assint´oticos como aquele que
queremos deduzir para distribui¸c˜ao de extremos. Exibiremos esta inutilidade com aquelas vari´aveis aleat´orias para as quais exibimos o Teorema Central do Limite. ´E sabido que caso o denominador na express˜ao (21) do teorema fosse substituido porn,15 ter´ıamos que:
Sn−IE[Sn]
n converge em distribui¸c˜ao
`a vari´avel aleat´oria degenerada igual a 0. (24) Tentaremos usar este resultado para calcular aproximadamente a probabili-dadeIP {S100 ≤45}. Designando por F≡0(·) a fun¸c˜ao de distribui¸c˜ao degen-erada concentrada em 0, teremos, repetindo os c´alculos de (23):
IP{S100≤45} = IP
S100−IE[S100]
100 ≤ 45−IE[S100] 100
= IP
S100−IE[S100]
100 ≤ 45−50 100
(25)
≈ F≡0(−0,05) = 0
E f´acil ver que se pus´essemos 55 em vez de 45, ter´ıamos resposta 1, e que,´ em geral, para qualquer que fosse o valor no lugar de 45, a resposta sempre seria ou 0 ou 1. Concorde tal aproxima¸c˜ao ´e totalmente in´util, o que nos leva a admitir que n˜ao ´e interessante procurar constantes de deslocamento e renormaliza¸c˜ao (como as dn e cn do problema da distribui¸c˜ao assintˆotica e extremos) que fa¸cam a distribui¸c˜ao limite ser degenerada. Na verdade, se algu´em estiver procurando por tais contantes, a resposta est´a dada: escolhendo um crescimento absurdamente r´apido das constantes de normaliza¸c˜ao ´e sempre poss´ıvel obrigar as vari´aveis aleat´orias (20) convergirem em distribui¸c˜ao para uma distribui¸c˜ao degenerada.
Voltaremos do desvio dedicado `a explica¸c˜ao de conceitos “convergˆencia em distribui¸c˜ao” e “vari´avel aleat´oria degenerada” para a via principal, isto
´e, voltaremos ao enunciado (P5) do problema da distribui¸c˜ao assint´otica de extremos. Uma vez agora munidos com a compreens˜ao dos conceitos desta-cados acima, podemos ent˜ao enxergar o lado pr´atico do problema: caso a distribui¸c˜ao assint´otica seja descoberta, esta pode servir para o c´alculo aprox-imado de probabilidades do tipoIP [max(X1, . . . , Xn)≤x]. Esta aproxima¸c˜ao
15Observe que no Teorem Central de Limite este denominador ´e da ordem de √ n, pois Var[Sn] =nVar[X1] devido ao fato queX1, X2, . . .s˜ao vari´aveis aleat´orias independentes e identicamente distribu´ıdas. A substitui¸c˜ao de√
nporndiminui a variˆancia de forma tal que o limite s´o pode ser uma vari´avel aleat´oria degenerada.
seria baseada nas mesmas id´eias que fizeram a distribui¸c˜ao normal servir para a aproxima¸c˜ao deIP[S100≤45], partindo do Teorema Central do Limite (veja texto acima). Esta aproxima¸c˜ao ser´a exibida e discutida em detalhes na Sub-se¸c˜ao 5.5. Notamos para nossos leitores que al´em da utilidade pr´atica, o prob-lema(P5)apresenta interesse do ponto de vista do desenvolvimento te´orico da Teoria de Probabilidade; sobre o que o leitor pode se informar melhor no livro [4].
0 5 10 15 20 25 30 35 40 45 50 55 60
0 0.25 0.5
0 5 10 15 20 25 30 35 40 45 50 55 60
0 0.25 0.5
0 5 10 15 20 25 30 35 40 45 50 55 60
0 0.25 0.5
Figura 13: Figuras que ilustram a propriedade (26). As figuras (a), (b), (c) apresentam densidades das distribui¸c˜oes das vari´aveis aleat´orias max{X1}, max{X1, . . . , X50}emax{X1, . . . , X500}, esbo¸cadas pelos histogramas das amostras correspondentes a estas vari´aveis. As amostras foram obtidas pelo computador, e a distribui¸c˜ao de cadaX deste exemplo ´e lognormal.
O par´agrafo acima respondeu – dentro das limita¸c˜oes de um texto did´atico – do porquˆe se interessar pelo problema (P5). H´a ainda outra pergunta t˜ao
natural e b´asica como esta: “por que na express˜ao (20) deste problema a quantia max(X1, . . . , Xn) ´e acompanhada pelas constantes cn e dn?”. Isto ser´a esclarecido agora, e para tal consideremos o exemplo em que cada Xi possui distribui¸c˜ao Lognormal. Isto siginifica que cada Xi ´e distribuida como eZ, onde Z ´e vari´avel aleat´oria normal padr˜ao. Observe que ´e muito f´acil simular um valor desta vari´avel aleat´oria Lognormal: basta simular um valor z da vari´avel aleat´oria Normal Padr˜ao Z e calcular eZ. Observe tamb´em que se formos simular um valor para cada uma das 50 vari´aveis aleat´orias X1, . . . , X50 e escolhermos o m´aximo destes 50 valores, ent˜ao este m´aximo pode ser visto como uma realiza¸c˜ao da vari´avel aleat´oria max{X1, . . . , X50}. Usamos este fato para simular 10.000.000 realiza¸c˜oes independentes da vari´avel aleat´oria max{X1, . . . , X50} e construir o histograma das realiza¸c˜oes desta vari´avel aleat´oria com base nestes 10.000.000 valores. Este histograma ´e ap-resentado na Figura 13(b). Devido aos argumentos da Teoria de Estat´ıstica, este histograma pode ser visto como uma aproxima¸c˜ao da fun¸c˜ao de densidade da distribui¸c˜ao da vari´avel aleat´oria max{X1, . . . , X50}. Pedimos ent˜ao que vocˆe aceite esse argumento, e que tamb´em aceite os histogramas apresenta-dos em Figura 13(a) e Figura 13(c) como esbo¸cos das densidades das vari´aveis aleat´orias max{X1}e max{X1, . . . , X500}, respectivamente. A primeira destas
´e igual `a pr´opriaX1, e assim seu histograma tem como base a amostra original.
O histograma da segunda foi constru´ıdo da mesma maneira que o historgama de max{X1, . . . , X50}. Observe agora que na sequˆencia (a)-(b)-(c) da Figura 13 os histogramas deslocam-se `a direita e ficam cada vez mais dispersos. Isto ilus-tra um fenˆomento gen´erico t´ıpico para distribui¸c˜oes concenilus-tradas no semi-eixo dos valores positivos e com cauda direita infinita – assim como ´e a distribui¸c˜ao lognormal; este fenˆomeno ´e:
a fun¸c˜ao de densidade da distribui¸c˜ao de max{X1, . . . , Xn}
desloca-se `a direita e fica mais dispersa a medida quencresce. (26) Portanto, ´e l´ogico perguntar sobre a possibilidade de empurrar cada densidade
“de volta” `a esquerda e a de contra´ı-la de maneira que o formato delas convirja, com o crescimento den, `a densidade de uma distribui¸c˜ao probabil´ıstica. N˜ao
´e l´ogico? Sim, e ´e justamente essa a pergunta que o problema de distribui¸c˜ao assint´otica de extremos(P5) faz! De fato: a constante dn em (20) empurra a distribui¸c˜ao da vari´avel aleat´oria max{X1, . . . , Xn} `a esquerda (caso dn>0), enquanto que a constante cn a contraicn vezes (que s˜ao estes os “efeitos” das constantesdnecnsegue-se da explica¸c˜ao do Coment´ario 2). A ´unica diferen¸ca em rela¸c˜ao a nossa exibi¸c˜ao ´e que o problema (P5) lan¸ca suas quest˜oes sobre
a convergˆencia de distribui¸c˜oes, e n˜ao sobre as densidades – o que ´e mais cooreto do ponto de vista do rigor matem´atico. Pronto! Explicamos as raz˜oes do surgimento das constantes dn e cn em (20) na formula¸c˜ao do problema da distribui¸c˜ao assint´otica de extremos. S´o nos falta acrescentar, que, para algu-mas distribui¸c˜oes deX’s, n˜ao se faz necess´ario deslocamento e/ou contra¸c˜ao para que a seq¨uˆencia de max{X1, . . . , Xn} convirja em distribui¸c˜ao. Nestes casos ´e suficiente tomar dn= 0 e cn= 1.