O exemplo e sua discuss˜ao que comp˜oem a presente sub-se¸c˜ao s˜ao de extrema importˆancia para o compreen¸c˜ao do m´etodo POT. A grosso modo o exem-plo ´e sobre o caso em que o m´etodo funciona de forma errada, enquanto que a discuss˜ao intenciona convencer o leitor que n˜ao h´a nada de errado neste funcionamento. Insistiremos para que o leitor acompanhe nossos argumen-tos, devido `a certeza de que no seu final o leitor concordar´a conosco sobre a importˆancia desta sub-se¸c˜ao. Em particular usaremos seu conte´udo essencial-mente no Coment´ario 35 da Se¸c˜ao 9.
O exemplo prometido ao leitor ´e sobre a aproxima¸c˜ao pelo m´etodo POT da cauda de uma fun¸c˜ao de distribui¸c˜ao cuja cauda ´e mais fina que a cauda da distribui¸c˜ao exponencial. Para t´ıtulo de exemplo poder´ıamos tomar qual-quer fun¸c˜ao atendendo este quesito, h´a uma infinidade de tais fun¸c˜oes. Mas escolhemos a bela e bem conhecida fun¸c˜ao da distribui¸c˜ao Normal Padr˜ao – palmas a ela:
Φ(x) = 1
√2π Z x
−∞
exp−y
2
2 dy, x∈R. (124)
Primeiramente explicaremos porque sua cauda direita ´e mais fina que a cauda direita da distribui¸c˜ao exponencial. Bem, a cauda da exponencial aproxima-se ao n´ıvel 1 como e−x, conforme x → ∞.32 J´a a da distribui¸c˜ao normal aproxima-se ao n´ıvel 1 comoe−x2/2/(x√
2π), o que decorre do seguinte resul-tado: parax suficientemente grande tem-se que
√1
2πe−12x2 1
x − 1 x3
≤1−Φ(x)≤ 1
√2π e−12x2
x , (125)
32Isso quer dizer que a distˆancia entre a fun¸c˜ao da distribui¸c˜ao exponencial, 1−e−x, e a linia horizontaly= 1 ´e igual ae−x.
uma rela¸c˜ao que aparece em diversas situa¸c˜oes, da´ı o nosso convite para que o leitor a prove no no Exerc´ıcio 45.
No que se segue iremos repetir com a fun¸c˜ao da distribui¸c˜ao normal o mesmo procedimento proferido na sub-se¸c˜ao anterior com as fun¸c˜oesFcomp+ruido(·) eFcomp(·): vamos criar uma amostra de Φ(·) e depois processar esta amostra pelo m´etodo POT, produzindo com isto uma aproxima¸c˜ao da cauda direita de Φ(·), e, por fim, comparar esta aproxima¸c˜ao com a verdadeira cauda direita.
Este ´e o programa. Seus resultados surpreender˜ao – aguarde.
Come¸camos com a gera¸c˜ao de uma amostra. O c´odigo do programa, que empregamos para tal fim est´a apresentado na Sub-se¸c˜ao 11.2 do Apˆendice 11.
A amostra obtida est´a exibida na Figura 26.
−3 0 3
1
−3 0 3
1
Figura 26: Esta figura exibe a fun¸c˜ao da distribui¸c˜ao amostral correspondente `a amostra composta de 500 pontos gerados da distribui¸c˜ao Normal Padr˜ao. A fun¸c˜ao est´a apresentada em formato de fun¸c˜ao-escada e por pontos.
O segundo passo consiste em estabelecer o limiar ´otimo, uopt, com base na an´alise da fun¸c˜ao da m´edia amostral de excessos. Aqui est´a a primeira surpresa a nossa espera. O que ela tem de supreendente est´a descrito no par´agrafo abaixo.
Recorde das explica¸c˜oes da Sub-se¸c˜ao 7.2 que uopt foi definido como a menor abcissa `a esquerda da qual a fun¸c˜ao da m´edia amostral de excessos
´e aproximadamente linear. A constru¸c˜ao desta fun¸c˜ao foi explicada na Sub-se¸c˜ao 7.2. Para nossa amostra ela adquire o formato apresentado na Figura 27.
Observando a figura nota-se que a fun¸c˜ao da m´edia amostral de excessos ap-resenta padr˜ao decrescente. Portanto, se pudessemos deduzir, com base de an´alise da figura que a fun¸c˜ao ´e linear a partir de um limiar qualquer, ent˜ao ser´ıamos obrigados a concluir que o parˆametro ξ da fun¸c˜ao-aproximador da
0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0
0.5 1.0 1.5 2.0
Figura 27: A fun¸c˜ao da m´edia amostral dos excessos, ˆe(·), correspondente a amostra gerada da fun¸c˜ao de distribui¸c˜ao Normal Padr˜ao. A amostra est´a na Figura 26.
cauda deve ser negativo (esta conclus˜ao vem do Fato e da Propriedade for-mulados na Sub-se¸c˜ao 7.2). A negatividade de ξ significaria que a cauda da fun¸c˜ao-aproximador ´e finita, uma conclus˜ao que estaria em conflito com a afirma¸c˜ao (1) do Coment´ario 19, que alega que a cauda da fun¸c˜ao-aproximador ser´a infinita quando a cauda da fun¸c˜ao aproximada for infinita - que ´e o caso da fun¸c˜ao de distribui¸c˜ao Normal. Esta ´e a surpresa a qual nos referimos no paragrafo anterior.
O argumento do par´agrafo acima indica que talvez n˜ao possamos empregar a fun¸c˜ao da m´edia amostral de excessos para estabelecer uopt via o proced-imento definido na Sub-se¸c˜ao 7.2. Esta incerteza nos leva a prosseguir da seguinte maneira: vamos atribuir ao limiar diversos valores, e para cada valor, calcular as estimativas dos parˆametrosξ eβ da GPD que aproxima, do ponto de vista do m´etodo POT, os excessos da amostra acima do limiar.
Para o c´alculo das estimativas, usaremos o mesmo procedimento que foi empregado no exemplo anterior (veja Sub-se¸c˜ao 8.1.3). Os resultados est˜ao na Tabela 5.
Observando a Tabela 5 percebe-se que o m´etodo POT produz valores de ˆξ muito pr´oximos ao zero. Para entender e interpretar este fenˆomeno ´e preciso lembrar que ( ˆξ,β) s˜ao as coordenadas do ponto, determinado por um m´etodoˆ num´erico de otimiza¸c˜ao, no qual a fun¸c˜ao (94) assume seu m´aximo. Tamb´em ´e preciso lembrar que a busca por este ponto ´e realizada num retˆangulo por n´os pr´e-estabelecido. Aqui adotamos o valor 1E−10 como sendo o menor valor poss´ıvel para a busca de ˆξ. Lembramos que este limite foi imposto devido ao fato da fun¸c˜ao maximizada mudar sua cara dependendo do verdadeiro ξ ser positivo, zero, ou negativo (esta mudan¸ca foi explicada na Sub-se¸c˜ao 7.3).
Usamos a express˜ao (94) para a fun¸c˜ao maximizada, por acreditar queξ deva ser positivo. Mas pelo que os resultados apresentados na Tabela 5 indicam, esta cren¸ca ´e errada, pois a proximidade de ˆξ a zero sugere que o verdadeiro valor do parˆamentro ξ da fun¸c˜ao-aproximador deve ser negativo ou igual ao zero.
Temos ent˜ao que a aplica¸c˜ao do m´etodo POT para amostra, gerada da distribui¸c˜ao Normal Padr˜ao, desencadeou as seguintes d´uvidas:
Primeira d´uvida: por que ´e que a fun¸c˜ao da m´edia amostral de excessos ´e decrescente.
Segunda d´uvida: por que ´e que a fun¸c˜ao-aproximador da cauda se recusa a admitir valores positivos para seu parˆametro ξ.
limiar 0.5 0.55 0.6 0.65 0.7 0.75 0.8 ξˆ 1E-10 1E-08 1E-10 1E-10 2E-08 1E-10 7E-10 βˆ 0.629 0.601 0.506 0.561 0.545 0.498 0.532
excedentes 159 153 145 138 130 120 111
limiar 0.85 0.9 0.95 1 1.05 1.1 1.15
ξˆ 1E-10 8E-10 9E-09 1E-09 3E-09 1E-10 9E-10 βˆ 0.501 0.611 0.506 0.515 0.663 0.405 0.497
excedentes 107 99 89 77 74 66 59
limiar 1.2 1.25 1.3 1.35 1.4 1.45 1.5
ξˆ 1E-07 1E-10 1E-10 2E-10 1E-10 1E-10 2E-09 βˆ 0.514 0.500 0.415 0.443 0.459 0.421 0.383
excedentes 52 48 45 44 38 37 36
limiar 1.55 1.6 1.65 1.7 1.75 1.8 1.85
ξˆ 3E-06 1E-10 1E-09 6E-10 4E-10 1E-10 3E-09 βˆ 0.394 0.349 0.321 0.336 0.316 0.316 0.277
excedentes 32 30 28 26 24 21 17
limiar 1.9 1.95 2
ξˆ 1E-09 1E-09 1E-10 βˆ 0.289 0.346 0.296
excedentes 15 12 10
Tabela 5: Os valores das estimativas dos parˆametrosξ eβ da GPD que aproxima os excessos acima do limiar para diversos valores deste. As estimativas, ˆξ e ˆβ, foram produzidas com base numa amostra de 500 pontos gerada pela distribui¸c˜ao Normal Padr˜ao. A amostra est´a apresentada na Figura 26.
As d´uvidas acima levantadas tˆem explica¸c˜ao completa na parte te´orica da constru¸c˜ao do m´etodo POT. Come¸caremos com an´alise da Segunda d´uvida.
Volte `a f´ormula (56) do Resultado de Pickands (Sub-se¸c˜ao 6.2). Perceba que ξest´a unicamente determinado pelo dom´ınio de atra¸c˜ao no qual se encontra a fun¸c˜ao de distribui¸c˜ao cuja cauda est´a sendo aproximada. Ent˜ao o caminho da solu¸c˜ao da d´uvida ´e determinar a EVD em cujo dom´ınio de atra¸c˜ao encontra-se a fun¸c˜ao de distribui¸c˜ao Normal. Aqui afirmamos que a fun¸c˜ao de distribui¸c˜ao Normal Padr˜ao est´a no dom´ınio de atra¸c˜ao de Gumbel. Uma das maneiras de provar esta afirma¸c˜ao ´e demonstrar que 1−Φ(x) admite a representa¸c˜ao (42).
Para tanto ´e necess´ario encontrar as express˜oes das fun¸c˜oesh(·), g(·) e a(·), referentes `a expans˜ao (42) da fun¸c˜ao de sobrevivˆencia de Φ(·), e verificar que estas satisfazem as condi¸c˜oes listadas no texto depois da f´ormula (42). Como esta verifica¸c˜ao ´e um tanto t´ecnica e enfadonha, preferimos omit´ı-la no nosso texto. Um tratamento detalhado pode ser encontrado em [3].
Sabendo que a distribui¸c˜ao Normal Padr˜ao est´a no dom´ınio de atra¸c˜ao de Gumbel, a f´ormula (56) do Resultado de Pickands nos diz que o parˆametroξ da GPD que aproxima sua cauda deve ser igual a 0. Isto explica porque as estimativas de ξ que encontramos – aquelas denotadas por ˆξ e apresentadas na Tabela 5 –, s˜ao todas pr´oximas de 0. A explica¸c˜ao ´e: o valor de ˆξ deve ser 0, j´a que o verdadeiroξ ´e zero, mas quando procuramos por ˆξ a nossa procura foi restrita ao intervalo [1E−10,4.0]; naturalmente obtivemos ˆξ como o valor do intervalo mais pr´oximo de 0.
A explica¸c˜ao daSegunda d´uvida dada acima indica que houve um erro na nossa execu¸c˜ao do m´etodo POT para a aproxima¸c˜ao de cauda da distribui¸c˜ao Normal a partir de sua amostra. O erro est´a na determina¸c˜ao de ˆξ e ˆβ pelo m´etodo da m´axima verossimilhan¸ca. A fun¸c˜ao de log-verossimilhan¸ca,`(ξ, β) n˜ao podia ser (94), uma vez que esta s´o serve quando sabe-se apriori que o verdadeiroξ´e positivo. No nosso caso o verdadeiroξ´e zero, o que nos obriga a usar a fun¸c˜ao de log-verossimilhan¸ca definida por (96). A maximiza¸c˜ao desta fun¸c˜ao fornece ˆβ; n˜ao precisamos de ˆξ pois sabemos de antem˜ao que seu valor
´e 0. Refizemos as contas e observamos que os valores de ˆβ coincidiram, at´e a terceira casa depois da v´ırgula, com os respectivos valores de ˆβ determinados pela “via errada”. Esta coincidˆencia tem explica¸c˜ao heur´ıstica: a fun¸c˜ao (96) est´a muit´ıssimo pr´oxima da fun¸c˜ao (94) com valor deξ na faixa de 1E−10.
Portanto o valor ˆβ, para o qual (96) assume seu valor de m´aximo, deve estar pr´oximo da segunda coordenada do ponto ( ˆξ,βˆ) no qual a fun¸c˜ao (94) assume seu ponto m´aximo. Esta explica¸c˜ao poderia ser aceita como rigorosa se o
m´etodo de maximiza¸c˜ao fizesse a procura pelo ponto m´aximo ( ˆξ,βˆ) em duas etapas: primeiro, buscar ˆξcomβ fixo, depois buscar ˆβ com ˆξ fixo. ´E claro que n˜ao ´e assim que funciona a otimiza¸c˜ao de uma fun¸c˜ao de duas vari´aveis. Por isso ficamos somente com a explica¸c˜ao heur´ıstica da coincidˆencia dos valores de ˆβ encontrados pelas vias certa e errada.
Agora passaremos aos argumentos cujo objetivo ´e esclarecer a Primeira d´uvida formulada acima.
Em primeiro lugar, vamos aproveitar a nossa rec´em descoberta de que a fun¸c˜ao aproximador da cauda da distribui¸c˜ao Normal Padr˜ao ´e a GPD com ξ = 0, quer dizer, a fun¸c˜ao de distribui¸c˜ao exponencial. Convidamos o leitor a voltar `a f´ormula (81) da Sub-se¸c˜ao 7.2 e substituirξ por 0 na mesma. Isto comprova que a fun¸c˜ao da m´edia de excessos da distribui¸c˜ao exponencial ´e uma reta horizontal. Aparentemente isto implica que a fun¸c˜ao da m´edia amostral de excessos de qualquer amostra retirada da distribui¸c˜ao Normal Padr˜ao deve ser aproximadamente uma reta horizontal. Mas isto n˜ao foi observado na caso da nossa amostra! Muito pelo contr´ario, conforme a Figura 27 exibe, nossa fun¸c˜ao da m´edia amostral de excessos ´e uma fun¸c˜ao decrescente. Isto refor¸ca ainda mais a Primeira d´uvida. Qual ´e a explica¸c˜ao? Ela est´a no par´agrafo depois do pr´oximo coment´ario, que ir´a expor um fato necess´ario para a explica¸c˜ao prometida.
Coment´ario 28. Recorde que a fun¸c˜ao de distribui¸c˜ao Normal Padr˜ao admite a expans˜ao em formato (42). Recorde que as fun¸c˜oes a(·), g(·) eh(·) partici-pantes nesta expans˜ao atendem `as exigˆencias bastante gen´ericas. Isto implica no que h´a diversas escolhas para estas fun¸c˜oes. Em uma delas a fun¸c˜aoa(·) ´e dada pela seguinte f´ormula:33
a(x) = Z ∞
x
Φ(t)¯
Φ(x)¯ dt, x <∞, (126)
(e outras duas s˜ao construidas de acordo com a escolha de a(·) acima, para que toda a express˜ao (42) d´e ˆΦ(·)). A vantagem desta escolha ´e que a fun¸c˜ao a(·) assim constru´ıda tem rela¸c˜ao direta com a fun¸c˜ao da m´edia de excessos da fun¸c˜ao de distribui¸c˜ao Normal Padr˜ao. Isto significa que
a(u) =IE
Z−uZ > u
, u <∞,
onde a vari´avel aleat´oria Z tem distribui¸c˜ao Normal Padr˜ao Φ (127)
33Na f´ormula (126) e em todos os outros lugares do texto, ¯Φ(·) = 1−Φ(·).
(veja a demostra¸c˜ao na p´agina 143 de [3]). Aproveitando a f´ormula da dis-tribui¸c˜ao Normal Padr˜ao, ´e poss´ıvel provar que a fun¸c˜aoa(·) definida em (127)
´e mon´otona, decresce a 0 e ´e convexa (para u >0).
O coment´ario acima expˆos uma propriedade n˜ao trivial de Φ(·). Desta iremos aproveitar somente aquela sua consequˆencia que alega que a fun¸c˜ao de m´edia de excessos da distribui¸c˜ao Normal Padr˜ao ´e mon´otona, decresce a 0 e
´e convexa. Isto implica que a fun¸c˜ao da m´edia amostral de amostra, retirada desta distribui¸c˜ao, deve repetir este comportamento. ´E isso que observamos na Figura27. Assim est´a explicada aPrimeira d´uvida: A fun¸c˜ao da m´edia amostral de excessos, ˆe(·), apresentada na Figura 27 “acompanha” o comportamento da fun¸c˜ao da m´edia de excessos da distribui¸c˜ao Normal, o que ´e natural e leg´ıtimo, pois a amostra que determinou ˆe(·) veio desta distribui¸c˜ao. Em particular ˆe(·)
´e decrescente porque a fun¸c˜ao da m´edia de excessos da distribui¸c˜ao Normal ´e decrescente.
A explica¸c˜ao dada acima refor¸ca, de passagem, um fato que pode ter sido percebido por nosso leitor h´a muito tempo. O fato de que o m´etodo POT aproxima a cauda da distribui¸c˜ao Normal usando a distribui¸c˜ao exponencial, apesar da cauda da Normal ser muito, muito mais fina que a da exponencial.
O primeiro coment´ario a esse respeito ´e que o m´etodo faz isto porque ele s´o pode construir aproximadores de cauda usando fun¸c˜oes GPD’s, entre as quais n˜ao se encontra a distribui¸c˜ao Normal. Sendo assim, o m´etodo escolheu dentre todas as GPDs aquela que tem cauda infinita mas mais fina, o que ´e, conforme j´a sabemos da exposi¸c˜ao da Se¸c˜ao 4, a distribui¸c˜ao exponencial. Agora, porque a partir da distribui¸c˜ao exponencial ´e poss´ıvel construir um aproximador para a cauda de uma distribui¸c˜ao muito mais fina que a exponencial? Bem, este fato n˜ao ´e trivial e sua demostra¸c˜ao ´e uma parte da prova do Resultado de Pickands. Contudo sempre h´a um leitor curajoso que, apesar de n˜ao questionar a legitimidade da demostra¸c˜ao do Resultado de Pickands, atreve-se a declarar:
– Minha intui¸c˜ao recusa-se a entender como a cauda da distribui¸c˜ao Normal pode ser aproximada por uma fun¸c˜ao constru´ıda com base na distribui¸c˜ao exponencial. A raz˜ao desta recusa ´e o fato das duas distribui¸c˜oes terem caudas totalmente diferentes, no sentido de que uma ´e mais fina que outra, ali´as, muito mais fina. Bem, como os pr´oprios autores deste texto explicaram na Sub-se¸c˜oes 4.3 e 4.4, dedicadas as caudas em geral e `as caudas das GPDs, se h´a duas fun¸c˜oes com caudas de grossuras diferentes – aqu´ı estou usando a jarg˜ao explicado e autorizado por autores –, ent˜ao a partir de uma certa abcissa, uma das fun¸c˜oes crecer´a muito mais r´apido que outra. Isto ´e, at´e
seria poss´ıvel fazer, via re-escala, com que as duas fossem pr´oximas uma da outra num intervalo finito, mas cedo ou tarde a diferen¸ca da grossura entre caudas vai se manifestar e, causando aquele efeito, ou seja, vai obrigar uma das fun¸c˜oes a crescer muito mais r´apido que a outra.
Explicaremos. Os argumentos que fundamentam a desconfian¸ca do leitor est˜ao corretos. O desentendimento veio da omiss˜ao de um fato que ser´a apre-sentado agora. As duas fun¸c˜oes, aquela cuja cauda est´a sendo aproximada, e a que aproxima a cauda, crescem monotonicamente ao n´ıvel 1 – isto por que as duas s˜ao fun¸c˜oes de distribui¸c˜ao. Isto implica que apesar da diferen¸ca rela-tiva entre elas crescer, a diferen¸ca absoluta fica muito pequena. Por exemplo, imagine duas fun¸c˜oes de distribui¸c˜ao que partem de 0, coincidem at´e um certo ponto, e que a partir deste ponto come¸cem a se divergir de maneira tal que a distˆancia entre o n´ıvel 1 e primeira delas, aquela que possui a cauda mais leve, seja igual a 1 mil´ımetro (num determinado ponto), e a distˆancia do nivel 1 at´e a outra, aquela cuja cauda ´e mais grossa, seja 2 milimetros, onde a da primeira for 0.1 mm, a da outra seja 1.5 mm, onde a da primeira for 0.01 mm, a segunda seja 1.2 mm, e assim por diante. ´E claro que a primeira das fun¸c˜oes se aproxima de 1 muito mais r´apido que a segunda. ´E n´ıtido que a diferen¸ca relativa entre elas cresce:
2−1
2 , 1.5−0.1
0.1 , 1.2−0.01 0.01 , etc.
enquanto que a distˆancia absoluta entre as duas n˜ao ultrapassaε= 2 mil´ımetros.
Queremos que o leitor entenda que o efeito explicado no par´agrafo anterior est´a sendo usado pelo m´etodo POT para aproximar a cauda da distribui¸c˜ao Normal Padr˜ao. Funciona assim. Sejauum valor `a direita do qual a cauda da Normal precisa ser aproximada. A cauda come¸ca do ponto (u,Φ(u)) e cresce r´apido ao n´ıvel 1. Ent˜ao o m´etodo toma a distribui¸c˜ao exponencial
G0,β,0(x) =
0, quando x <0,
1−exp{−x/β}, quandox≥0,
e escolhe o valor do parˆametroβ de modo tal que quando esta fun¸c˜ao formar a aproxima¸c˜ao da cauda – e se vocˆe lembra que para isto a distribui¸c˜ao deve ser apropriadamente encolhida e sua parte `a direita de 0 deve ser transportada para “come¸car” do ponto (u,Φ(u)) –, esta esteja acompanhando de perto a cauda da distribui¸c˜ao Normal do ponto (u,Φ(u)) at´e o mais longe poss´ıvel.
Quando este acompanhamento n˜ao for mais fact´ıvel – o que acontecer´a devido a diferen¸ca entre as grossuras da cauda e da distribui¸c˜ao exponencial –, as duas
fun¸c˜oes ser˜ao t˜ao pr´oximas do n´ıvel 1 que a distˆancia absoluta entre elas ser´a muito pequena. Em conseq¨uˆencia, a cauda e seu aproximador ser˜ao pr´oximos um do outro em toda a extens˜ao `a direita deu.
Vocˆe agora est´a convidado a observar novamente a Tabela 5 e notar como o m´etodo POT muda o valor de ˆβ de acordo com que explicamos acima.
Coment´ario 29. Aqui daremos uma alternativa `a explica¸c˜ao do mecanismo usado pelo m´etodo POT para aproximar, pela distribui¸c˜ao exponencial, as caudas da distribui¸c˜ao Normal Padr˜ao Φ(·). Chamaremos esta explica¸c˜ao de coment´ario, j´a que os coment´arios s˜ao as partes do texto que podem ser omitidas numa primeira leitura – coisa que vocˆe, talvez, gostasse de fazer depois de se cansar da nossa insistˆencia na explica¸c˜ao de todos os detalhes.
Come¸caremos recordando que o aproximador da cauda de uma fun¸c˜ao de distribui¸c˜aoF(·) `a direita de um limiaru´e uma fun¸c˜ao do tipo (62), denotada porG∗ξ,β(u),0(·). Destacamos tamb´em que esta fun¸c˜ao ´e construida a partir da GPDGξ,β(u),0(·), que aproxima a fun¸c˜aoFu(·) – que expressa a distribui¸c˜ao dos excessos deF(·) acima deu. O motivo de tanta referˆencia ´e o esclarecimento de que a acuidade da aproxima¸c˜ao pode ser analisada em termos da proximidade de G∗ξ,β(u),0(·) `a cauda de F(·), assim como pode ser analisada em termos da proximidade deGξ,β(u),0(·) aFu(·). A primeira an´alise foi apresentada acima.
Agora ´e a vez da segunda, que possui suas vantagens.
Se Φ(·) ´e a fun¸c˜ao de distribui¸c˜ao Normal Padr˜ao, e se pedimos ao m´etodo POT que aproxime Φu(·) para u fixo (u ´e positivo, claro, e grande), ent˜ao o m´etodo deve construir seu aproximador usandoG0,β(u),0(·), j´a que o Resultado de Pickands obriga o m´etodo a tomarξ= 0. Em outras palavras, o m´etodo s´o pode mudar o valor do parˆametro β para conseguir a desejada aproxima¸c˜ao.
Que isto ´e poss´ıvel ´e o conte´udo do Resultado de Pickands. N˜ao entraremos na sua demostra¸c˜ao. O que queremos fazer agora ´e analisar a dependˆencia do valor de β(u) em rela¸c˜ao a u. De acordo com a Tabela 5 percebe-se que β(u) decresce com o aumento de u. Seria isto uma regra geral, ou se trata de uma caracter´ıstica da amostra? Abaixo temos a comprova¸c˜ao da generalidade desta regra.
Vejamos a Figura 28. Os pontilhados nos quatro gr´aficos representam a fun¸c˜ao da distribui¸c˜ao amostral dos excessos da nossa amostra retirada da dis-tribui¸c˜ao Normal Padr˜ao. Os excessos s˜ao relativos ao limiaru, cujos valores s˜ao 0.5, 0.8, 1.1 e 1.4 nas ilustra¸c˜oes (a), (b), (c) e (d), respectivamente. As distribui¸c˜oes amostrais representam aproximadamente as distribui¸c˜oes Φ0.5(·),
0 2.1 1
(a)
0 1.8
1
(b)
0 1.5
1
(c)
0 1.1
1
(d)
Figura 28: As figuras apresentam, por pontos, a distribui¸c˜ao amostral dos excessos acima de limiaruda amostra retirada da distribui¸c˜ao Normal Padr˜ao Φ(·), e apresen-tam por linhas pontilhadas as GPD’sG0,β(u),0(·) contru´ıdas pelo m´etodo POT para aproximar Φu(·). Os valores do limiar u s˜ao 0.5 em (a), 0.8 em (b), 1.1 em (c), e 1.4 em (d), com os respectivos valores de β(u): 0.629, 0.532, 0.405 e 0.459. Note que as escalas do eixo de abcissas s˜ao diferentes e decrescem de (a) para (d). Isso implica que os gr´aficos em (b) s˜ao mais pr´oximos do eixo vertical que os gr´aficos em (a). A mesma rela¸c˜ao vale quando compara-se os gr´aficos em (b) e em (c). A mesma rela¸c˜ao deveria valer para o par (c) e (d), mas, infelizmente, ela n˜ao se manifestou no desenho. A raz˜ao ´e que os gr´aficos em (d) foram constru´ıdos com base na amostra constitu´ıda de n´umero muito pequeno de pontos; esta escasez ocorre porque o caso (d) corresponde ao maior valor do limiarudentre todos os quatro casos.
Φ0.8(·), Φ1.1(·) e Φ1.4(·).34 Infelizmente, a quantidade dos pontos excedentes da amostra diminui com o crescimento deu. Por isto a quantidade de pontos diminui de (a) para (d), e, al´em disso, a acuidade da aproxima¸c˜ao de Φu(·) pela fun¸c˜ao da distribui¸c˜ao amostral tamb´em piora. Mas, apesar desta piora, os desenhos exibem a propriedade que importa para nossa presente discuss˜ao:
quanto maior u, mais pr´oxima ao eixo vertical estar´a a fun¸c˜ao Φu(·) depois de ter deixado o ponto (0,0). Portanto, caso o m´etodo POT queira fazer a fun¸c˜aoG0,β(u),0(·) “acompanhar” de perto `a fun¸c˜ao Φu(·), conforme u cresce, ent˜ao o parˆametro β(u) deve diminuir com o aumento de u. Isto por que quanto menor β mais perto do eixo vertical estar´a a fun¸c˜ao G0,β,0(·) – fato que foi explicado na Sub-se¸c˜ao 4.4 e exibido na Figura 9(a). Pronto! Prova-mos que β(u) decresce com aumanto de u quando o m´etodo POT aproxima cauda da distribui¸c˜ao Normal Padr˜ao. Este foi o principal objetivo do presente coment´ario.
Depois de muitas explica¸c˜oes do porque o m´etodo POT conseguiria aprox-imar cauda da distribui¸c˜ao Normal Padr˜ao usando a distribui¸c˜ao exponencial,
´e natural verificar se no caso da nossa amostra houve de fato a t˜ao prometida aproxima¸c˜ao. A resposta est´a na Tabela 6. No nosso ponto de vista, os valores desta tabela confirmam uma boa aproxima¸c˜ao. Boa, apesar do procedimento de execus˜ao da id´eia do m´etodo POT ser inadequado para o presente caso.
Sobre isto versa o nosso ´ultimo coment´ario da presente sub-se¸c˜ao.
Coment´ario 30. A an´alise proferida na presente sub-se¸c˜ao indica que a es-trat´egia tra¸cada na Sub-se¸c˜ao 7.1 ´e inadequada para executar a id´eia do m´etod POT quando trata-se da estima¸c˜ao da cauda de uma fun¸c˜ao de distribui¸c˜ao com cauda mais fina que a exponencial. Os problemas surgem j´a no primeiro passo da estrat´egia (o passo (A) definido na Sub-se¸c˜ao 7.1 e detalhado na Sub-se¸c˜ao 7.2). A raz˜ao ´e a inexistˆancia do limiar ´otimo, uopt, definido pelos crit´erios explicados nas Sub-se¸c˜oes 7.2 e 7.6. A inexistˆencia deuopt complica tamb´em a juistificativa do segundo passo da estrat´egia, j´a que este usa uopt em seus procedimentos.
A inadequan¸ca acima citada ocorre porque a cauda aproximada ´e muito mais fina que a cauda do aproximador. Isto sugere que o estudo do tipo de cauda deve preceder `a execu¸c˜ao do m´etdo POT, e que o caminho da execu¸c˜ao deve ser trilhado de acordo com as conclus˜oes sobre o tipo de cauda. As
34Recorde que Φu(·) denota a fun¸c˜ao da distribui¸c˜ao dos excessos acima deude Φ(·), quer dizer, da fun¸c˜ao da distribui¸c˜ao Normal Padr˜ao.
p F−1(p) Fˆ0.5−1(p) Fˆ0.55−1(p) Fˆ0.6−1(p) Fˆ0.65−1 (p) Fˆ0.7−1(p) Fˆ0.75−1(p)
0.9 1.281 1.227 1.222 1.139 1.219 1.221 1.186
0.95 1.644 1.664 1.639 1.490 1.608 1.599 1.532
0.995 2.576 3.112 3.025 2.657 2.900 2.856 2.681
p Fˆ0.8−1(p) Fˆ0.85−1(p) Fˆ0.9−1(p) Fˆ0.95−1(p) Fˆ1−1(p) Fˆ1.05−1(p) Fˆ1.1−1(p)
0.9 1.224 1.231 1.317 1.241 1.222 1.310 1.212
0.95 1.593 1.579 1.741 1.592 1.580 1.770 1.494
0.995 2.819 2.734 3.149 2.758 2.768 3.298 2.428
p Fˆ1.15−1 (p) Fˆ1.2−1(p) Fˆ1.25−1(p) Fˆ1.3−1(p) Fˆ1.35−1 (p) Fˆ1.4−1(p) Fˆ1.45−1(p)
0.9 1.232 1.220 1.250 – – – –
0.95 1.576 1.576 1.576 1.544 1.600 1.592 1.615
0.995 2.721 2.760 2.729 2.500 2.622 2.650 2.585
p Fˆ1.5−1(p) Fˆ1.55−1(p) Fˆ1.6−1(p) Fˆ1.65−1(p) Fˆ1.7−1(p) Fˆ1.75−1(p) Fˆ1.8−1(p)
0.9 – – – – – – –
0.95 1.639 1.647 1.663 1.644 1.644 1.644 1.644
0.995 2.522 2.555 2.468 2.427 2.446 2.424 2.424
p Fˆ1.85−1 (p) Fˆ1.9−1(p) Fˆ1.95−1(p) Fˆ1.95−1(p)
0.9 1.281 1.281 1.281 1.281
0.95 1.644 1.644 1.644 1.644 0.995 2.382 2.398 2.430 2.411
Tabela 6: A compara¸c˜ao entre quantis da distribui¸c˜ao Normal Padr˜ao e suas estima-tivas produzidas por fun¸c˜oes -aproximadores da cauda desta produzidas pelo m´etodo POT. Analisamosp-quantis com valores 0.9,0.95,0.995 dep. Os verdadeiros valores est˜ao na coluna “Φ−1(p)”. Cada ˆFu denota o aproximador da cauda `a direita de u da distribui¸c˜ao Normal Padr˜ao, Φ(·). Os aproximadores s˜ao produzidos por m´etodo POT com base em uma amostra de Φ(·).
ferramentas e id´eias desse estudo n˜ao est˜ao no escopo do nosso presente tra-balho, assim como os caminhos alternativos `a estrat´egia (A)-(C) definida na Sub-se¸c˜ao 7.1.
Apesar da inadequa¸c˜ao comprovada da estrat´egia (A)-(C) para o caso em que a cauda aproximada ´e mais fina que a exponencial, muitas pessoas usam esta estrat´egia sem uma pr´evia ana´lise da cauda. Uma raz˜ao para isso ´e que tal an´alise ´e complexa e muito sens´ıvel as imperfei¸c˜oes de amostras. A segunda raz˜ao ´e que a estrat´egia ´e bem capaz de dar uma boa aproxima¸c˜ao, como, por exemplo, no caso estudado acima. De fato a Tabela 6 mostra que as estimativas dos quantis, produzidas por esta estrat´egia, n˜ao diferem muito dos quantis verdadeiros, e, mesmo que n˜ao soubes´emos os verdadeiros valores, poder´ıamos alegar a precis˜ao da aproxima¸c˜ao pelo fato de que os valores n˜ao se alteram muito conforme a mudan¸ca do limiar u. A terceira raz˜ao est´a no emprego da fun¸c˜ao da m´edia amostral de excessos. A id´eia do seu uso vale quando a verdadeira cauda ´e pesada ou ´e finita, mas n˜ao no caso quando a cauda ´e mais leve que a exponencial. Nos ´ultimos casos esta fun¸c˜ao ser´a tipicamente decrescente – isto pode ser provado para a muitas distribui¸c˜oes com cauda fina por interm´edio dos argumentos exibidos no Coment´ario 28.
Acontece que este comportamento da fun¸c˜ao da m´edia amostral de excessos tem seu proveito. Se vocˆe conseguir detectar, analizando seu formato, que ela ´e convexa e aproxima-se a uma linha horizontal, ent˜ao vocˆe ter´a uma forte indica¸c˜ao de que a cauda aproximada ´e mais leve que a exponencial. Se vocˆe se enganar e identificar linearidade no seu gr´afico, vocˆe aproximar´a a cauda por uma GPD de cauda finita, mas isto pode ser uma aproxima¸c˜ao razoavelmente boa, conforme explicamos no Coment´ario 6.
8.3 Aplica¸c˜ao do m´etodo POT a uma amostra de dados reais