Aplica¸cão do método POT para amostra gerada da fun¸cão

O exemplo e sua discussão que compõem a presente sub-se¸cão são de extrema importância para o compreen¸cão do método POT. A grosso modo o exem-plo é sobre o caso em que o método funciona de forma errada, enquanto que a discussão intenciona convencer o leitor que não há nada de errado neste funcionamento. Insistiremos para que o leitor acompanhe nossos argumen-tos, devido à certeza de que no seu final o leitor concordará conosco sobre a importância desta sub-se¸cão. Em particular usaremos seu conteúdo essencial-mente no Comentário 35 da Se¸cão 9.

O exemplo prometido ao leitor é sobre a aproxima¸cão pelo método POT da cauda de uma fun¸cão de distribui¸cão cuja cauda é mais fina que a cauda da distribui¸cão exponencial. Para t´ıtulo de exemplo poder´ıamos tomar qual-quer fun¸cão atendendo este quesito, há uma infinidade de tais fun¸cões. Mas escolhemos a bela e bem conhecida fun¸cão da distribui¸cão Normal Padrão – palmas a ela:

Φ(x) = 1

√2π Z _x

−∞

exp^−y

2 dy, x∈R. (124)

Primeiramente explicaremos porque sua cauda direita é mais fina que a cauda direita da distribui¸cão exponencial. Bem, a cauda da exponencial aproxima-se ao n´ıvel 1 como e^−x, conforme x → ∞.³² Já a da distribui¸cão normal aproxima-se ao n´ıvel 1 comoe^−x²^/2/(x√

2π), o que decorre do seguinte resul-tado: parax suficientemente grande tem-se que

√1

2πe⁻¹²^x² 1

x − 1 x³

≤1−Φ(x)≤ 1

√2π e⁻¹²^x²

x , (125)

32Isso quer dizer que a distância entre a fun¸cão da distribui¸cão exponencial, 1−e^−x, e a linia horizontaly= 1 é igual ae^−x.

uma rela¸c˜ao que aparece em diversas situa¸c˜oes, da´ı o nosso convite para que o leitor a prove no no Exerc´ıcio 45.

No que se segue iremos repetir com a fun¸cão da distribui¸cão normal o mesmo procedimento proferido na sub-se¸cão anterior com as fun¸cõesF^comp+ruido(·) eF^comp(·): vamos criar uma amostra de Φ(·) e depois processar esta amostra pelo método POT, produzindo com isto uma aproxima¸cão da cauda direita de Φ(·), e, por fim, comparar esta aproxima¸cão com a verdadeira cauda direita.

Este ´e o programa. Seus resultados surpreender˜ao – aguarde.

Come¸camos com a gera¸cão de uma amostra. O código do programa, que empregamos para tal fim está apresentado na Sub-se¸cão 11.2 do Apêndice 11.

A amostra obtida est´a exibida na Figura 26.

−3 0 3

Figura 26: Esta figura exibe a fun¸cão da distribui¸cão amostral correspondente à amostra composta de 500 pontos gerados da distribui¸cão Normal Padrão. A fun¸cão está apresentada em formato de fun¸cão-escada e por pontos.

O segundo passo consiste em estabelecer o limiar ótimo, uôpt, com base na análise da fun¸cão da média amostral de excessos. Aqui está a primeira surpresa a nossa espera. O que ela tem de supreendente está descrito no parágrafo abaixo.

Recorde das explica¸cões da Sub-se¸cão 7.2 que uôpt foi definido como a menor abcissa à esquerda da qual a fun¸cão da média amostral de excessos

é aproximadamente linear. A constru¸cão desta fun¸cão foi explicada na Sub-se¸cão 7.2. Para nossa amostra ela adquire o formato apresentado na Figura 27.

Observando a figura nota-se que a fun¸cão da média amostral de excessos ap-resenta padrão decrescente. Portanto, se pudessemos deduzir, com base de análise da figura que a fun¸cão é linear a partir de um limiar qualquer, então ser´ıamos obrigados a concluir que o parâmetro ξ da fun¸cão-aproximador da

0.0 0.5 1.0 1.5 2.0 2.5 3.0 0.0

0.5 1.0 1.5 2.0

Figura 27: A fun¸cão da média amostral dos excessos, ê(·), correspondente a amostra gerada da fun¸cão de distribui¸cão Normal Padrão. A amostra está na Figura 26.

cauda deve ser negativo (esta conclusão vem do Fato e da Propriedade for-mulados na Sub-se¸cão 7.2). A negatividade de ξ significaria que a cauda da fun¸cão-aproximador é finita, uma conclusão que estaria em conflito com a afirma¸cão (1) do Comentário 19, que alega que a cauda da fun¸cão-aproximador será infinita quando a cauda da fun¸cão aproximada for infinita - que é o caso da fun¸cão de distribui¸cão Normal. Esta é a surpresa a qual nos referimos no paragrafo anterior.

O argumento do parágrafo acima indica que talvez não possamos empregar a fun¸cão da média amostral de excessos para estabelecer uôpt via o proced-imento definido na Sub-se¸cão 7.2. Esta incerteza nos leva a prosseguir da seguinte maneira: vamos atribuir ao limiar diversos valores, e para cada valor, calcular as estimativas dos parâmetrosξ eβ da GPD que aproxima, do ponto de vista do método POT, os excessos da amostra acima do limiar.

Para o cálculo das estimativas, usaremos o mesmo procedimento que foi empregado no exemplo anterior (veja Sub-se¸cão 8.1.3). Os resultados estão na Tabela 5.

Observando a Tabela 5 percebe-se que o método POT produz valores de ˆξ muito próximos ao zero. Para entender e interpretar este fenômeno é preciso lembrar que ( ˆξ,β) são as coordenadas do ponto, determinado por um métodoˆ numérico de otimiza¸cão, no qual a fun¸cão (94) assume seu máximo. Também é preciso lembrar que a busca por este ponto é realizada num retângulo por nós pré-estabelecido. Aqui adotamos o valor 1E−10 como sendo o menor valor poss´ıvel para a busca de ˆξ. Lembramos que este limite foi imposto devido ao fato da fun¸cão maximizada mudar sua cara dependendo do verdadeiro ξ ser positivo, zero, ou negativo (esta mudan¸ca foi explicada na Sub-se¸cão 7.3).

Usamos a expressão (94) para a fun¸cão maximizada, por acreditar queξ deva ser positivo. Mas pelo que os resultados apresentados na Tabela 5 indicam, esta cren¸ca é errada, pois a proximidade de ˆξ a zero sugere que o verdadeiro valor do parâmentro ξ da fun¸cão-aproximador deve ser negativo ou igual ao zero.

Temos então que a aplica¸cão do método POT para amostra, gerada da distribui¸cão Normal Padrão, desencadeou as seguintes dúvidas:

Primeira dúvida: por que é que a fun¸cão da média amostral de excessos é decrescente.

Segunda dúvida: por que é que a fun¸cão-aproximador da cauda se recusa a admitir valores positivos para seu parâmetro ξ.

limiar 0.5 0.55 0.6 0.65 0.7 0.75 0.8 ξˆ 1E-10 1E-08 1E-10 1E-10 2E-08 1E-10 7E-10 βˆ 0.629 0.601 0.506 0.561 0.545 0.498 0.532

excedentes 159 153 145 138 130 120 111

limiar 0.85 0.9 0.95 1 1.05 1.1 1.15

ξˆ 1E-10 8E-10 9E-09 1E-09 3E-09 1E-10 9E-10 βˆ 0.501 0.611 0.506 0.515 0.663 0.405 0.497

excedentes 107 99 89 77 74 66 59

limiar 1.2 1.25 1.3 1.35 1.4 1.45 1.5

ξˆ 1E-07 1E-10 1E-10 2E-10 1E-10 1E-10 2E-09 βˆ 0.514 0.500 0.415 0.443 0.459 0.421 0.383

excedentes 52 48 45 44 38 37 36

limiar 1.55 1.6 1.65 1.7 1.75 1.8 1.85

ξˆ 3E-06 1E-10 1E-09 6E-10 4E-10 1E-10 3E-09 βˆ 0.394 0.349 0.321 0.336 0.316 0.316 0.277

excedentes 32 30 28 26 24 21 17

limiar 1.9 1.95 2

ξˆ 1E-09 1E-09 1E-10 βˆ 0.289 0.346 0.296

excedentes 15 12 10

Tabela 5: Os valores das estimativas dos parâmetrosξ eβ da GPD que aproxima os excessos acima do limiar para diversos valores deste. As estimativas, ˆξ e ˆβ, foram produzidas com base numa amostra de 500 pontos gerada pela distribui¸cão Normal Padrão. A amostra está apresentada na Figura 26.

As dúvidas acima levantadas têm explica¸cão completa na parte teórica da constru¸cão do método POT. Come¸caremos com análise da Segunda dúvida.

Volte à fórmula (56) do Resultado de Pickands (Sub-se¸cão 6.2). Perceba que ξestá unicamente determinado pelo dom´ınio de atra¸cão no qual se encontra a fun¸cão de distribui¸cão cuja cauda está sendo aproximada. Então o caminho da solu¸cão da dúvida é determinar a EVD em cujo dom´ınio de atra¸cão encontra-se a fun¸cão de distribui¸cão Normal. Aqui afirmamos que a fun¸cão de distribui¸cão Normal Padrão está no dom´ınio de atra¸cão de Gumbel. Uma das maneiras de provar esta afirma¸cão é demonstrar que 1−Φ(x) admite a representa¸cão (42).

Para tanto é necessário encontrar as expressões das fun¸cõesh(·), g(·) e a(·), referentes à expansão (42) da fun¸cão de sobrevivência de Φ(·), e verificar que estas satisfazem as condi¸cões listadas no texto depois da fórmula (42). Como esta verifica¸cão é um tanto técnica e enfadonha, preferimos omit´ı-la no nosso texto. Um tratamento detalhado pode ser encontrado em [3].

Sabendo que a distribui¸cão Normal Padrão está no dom´ınio de atra¸cão de Gumbel, a fórmula (56) do Resultado de Pickands nos diz que o parâmetroξ da GPD que aproxima sua cauda deve ser igual a 0. Isto explica porque as estimativas de ξ que encontramos – aquelas denotadas por ˆξ e apresentadas na Tabela 5 –, são todas próximas de 0. A explica¸cão é: o valor de ˆξ deve ser 0, já que o verdadeiroξ é zero, mas quando procuramos por ˆξ a nossa procura foi restrita ao intervalo [1E−10,4.0]; naturalmente obtivemos ˆξ como o valor do intervalo mais próximo de 0.

A explica¸cão daSegunda dúvida dada acima indica que houve um erro na nossa execu¸cão do método POT para a aproxima¸cão de cauda da distribui¸cão Normal a partir de sua amostra. O erro está na determina¸cão de ˆξ e ˆβ pelo método da máxima verossimilhan¸ca. A fun¸cão de log-verossimilhan¸ca,`(ξ, β) não podia ser (94), uma vez que esta só serve quando sabe-se apriori que o verdadeiroξé positivo. No nosso caso o verdadeiroξé zero, o que nos obriga a usar a fun¸cão de log-verossimilhan¸ca definida por (96). A maximiza¸cão desta fun¸cão fornece ˆβ; não precisamos de ˆξ pois sabemos de antemão que seu valor

é 0. Refizemos as contas e observamos que os valores de ˆβ coincidiram, até a terceira casa depois da v´ırgula, com os respectivos valores de ˆβ determinados pela “via errada”. Esta coincidência tem explica¸cão heur´ıstica: a fun¸cão (96) está muit´ıssimo próxima da fun¸cão (94) com valor deξ na faixa de 1E−10.

Portanto o valor ˆβ, para o qual (96) assume seu valor de máximo, deve estar próximo da segunda coordenada do ponto ( ˆξ,βˆ) no qual a fun¸cão (94) assume seu ponto máximo. Esta explica¸cão poderia ser aceita como rigorosa se o

método de maximiza¸cão fizesse a procura pelo ponto máximo ( ˆξ,βˆ) em duas etapas: primeiro, buscar ˆξcomβ fixo, depois buscar ˆβ com ˆξ fixo. É claro que não é assim que funciona a otimiza¸cão de uma fun¸cão de duas variáveis. Por isso ficamos somente com a explica¸cão heur´ıstica da coincidência dos valores de ˆβ encontrados pelas vias certa e errada.

Agora passaremos aos argumentos cujo objetivo ´e esclarecer a Primeira d´uvida formulada acima.

Em primeiro lugar, vamos aproveitar a nossa recém descoberta de que a fun¸cão aproximador da cauda da distribui¸cão Normal Padrão é a GPD com ξ = 0, quer dizer, a fun¸cão de distribui¸cão exponencial. Convidamos o leitor a voltar à fórmula (81) da Sub-se¸cão 7.2 e substituirξ por 0 na mesma. Isto comprova que a fun¸cão da média de excessos da distribui¸cão exponencial é uma reta horizontal. Aparentemente isto implica que a fun¸cão da média amostral de excessos de qualquer amostra retirada da distribui¸cão Normal Padrão deve ser aproximadamente uma reta horizontal. Mas isto não foi observado na caso da nossa amostra! Muito pelo contrário, conforme a Figura 27 exibe, nossa fun¸cão da média amostral de excessos é uma fun¸cão decrescente. Isto refor¸ca ainda mais a Primeira dúvida. Qual é a explica¸cão? Ela está no parágrafo depois do próximo comentário, que irá expor um fato necessário para a explica¸cão prometida.

Comentário 28. Recorde que a fun¸cão de distribui¸cão Normal Padrão admite a expansão em formato (42). Recorde que as fun¸cões a(·), g(·) eh(·) partici-pantes nesta expansão atendem às exigências bastante genéricas. Isto implica no que há diversas escolhas para estas fun¸cões. Em uma delas a fun¸cãoa(·) é dada pela seguinte fórmula:³³

a(x) = Z ∞

Φ(t)¯

Φ(x)¯ dt, x <∞, (126)

(e outras duas são construidas de acordo com a escolha de a(·) acima, para que toda a expressão (42) dé ˆΦ(·)). A vantagem desta escolha é que a fun¸cão a(·) assim constru´ıda tem rela¸cão direta com a fun¸cão da média de excessos da fun¸cão de distribui¸cão Normal Padrão. Isto significa que

a(u) =IE

Z−uZ > u

, u <∞,

onde a variável aleatória Z tem distribui¸cão Normal Padrão Φ (127)

33Na f´ormula (126) e em todos os outros lugares do texto, ¯Φ(·) = 1−Φ(·).

(veja a demostra¸cão na página 143 de [3]). Aproveitando a fórmula da dis-tribui¸cão Normal Padrão, é poss´ıvel provar que a fun¸cãoa(·) definida em (127)

é monótona, decresce a 0 e é convexa (para u >0).

O comentário acima expôs uma propriedade não trivial de Φ(·). Desta iremos aproveitar somente aquela sua consequência que alega que a fun¸cão de média de excessos da distribui¸cão Normal Padrão é monótona, decresce a 0 e

é convexa. Isto implica que a fun¸cão da média amostral de amostra, retirada desta distribui¸cão, deve repetir este comportamento. É isso que observamos na Figura27. Assim está explicada aPrimeira dúvida: A fun¸cão da média amostral de excessos, ê(·), apresentada na Figura 27 “acompanha” o comportamento da fun¸cão da média de excessos da distribui¸cão Normal, o que é natural e leg´ıtimo, pois a amostra que determinou ê(·) veio desta distribui¸cão. Em particular ê(·)

é decrescente porque a fun¸cão da média de excessos da distribui¸cão Normal é decrescente.

A explica¸cão dada acima refor¸ca, de passagem, um fato que pode ter sido percebido por nosso leitor há muito tempo. O fato de que o método POT aproxima a cauda da distribui¸cão Normal usando a distribui¸cão exponencial, apesar da cauda da Normal ser muito, muito mais fina que a da exponencial.

O primeiro comentário a esse respeito é que o método faz isto porque ele só pode construir aproximadores de cauda usando fun¸cões GPD’s, entre as quais não se encontra a distribui¸cão Normal. Sendo assim, o método escolheu dentre todas as GPDs aquela que tem cauda infinita mas mais fina, o que é, conforme já sabemos da exposi¸cão da Se¸cão 4, a distribui¸cão exponencial. Agora, porque a partir da distribui¸cão exponencial é poss´ıvel construir um aproximador para a cauda de uma distribui¸cão muito mais fina que a exponencial? Bem, este fato não é trivial e sua demostra¸cão é uma parte da prova do Resultado de Pickands. Contudo sempre há um leitor curajoso que, apesar de não questionar a legitimidade da demostra¸cão do Resultado de Pickands, atreve-se a declarar:

– Minha intui¸cão recusa-se a entender como a cauda da distribui¸cão Normal pode ser aproximada por uma fun¸cão constru´ıda com base na distribui¸cão exponencial. A razão desta recusa é o fato das duas distribui¸cões terem caudas totalmente diferentes, no sentido de que uma é mais fina que outra, aliás, muito mais fina. Bem, como os próprios autores deste texto explicaram na Sub-se¸cões 4.3 e 4.4, dedicadas as caudas em geral e às caudas das GPDs, se há duas fun¸cões com caudas de grossuras diferentes – aqu´ı estou usando a jargão explicado e autorizado por autores –, então a partir de uma certa abcissa, uma das fun¸cões crecerá muito mais rápido que outra. Isto é, até

seria poss´ıvel fazer, via re-escala, com que as duas fossem próximas uma da outra num intervalo finito, mas cedo ou tarde a diferen¸ca da grossura entre caudas vai se manifestar e, causando aquele efeito, ou seja, vai obrigar uma das fun¸cões a crescer muito mais rápido que a outra.

Explicaremos. Os argumentos que fundamentam a desconfian¸ca do leitor estão corretos. O desentendimento veio da omissão de um fato que será apre-sentado agora. As duas fun¸cões, aquela cuja cauda está sendo aproximada, e a que aproxima a cauda, crescem monotonicamente ao n´ıvel 1 – isto por que as duas são fun¸cões de distribui¸cão. Isto implica que apesar da diferen¸ca rela-tiva entre elas crescer, a diferen¸ca absoluta fica muito pequena. Por exemplo, imagine duas fun¸cões de distribui¸cão que partem de 0, coincidem até um certo ponto, e que a partir deste ponto come¸cem a se divergir de maneira tal que a distância entre o n´ıvel 1 e primeira delas, aquela que possui a cauda mais leve, seja igual a 1 mil´ımetro (num determinado ponto), e a distância do nivel 1 até a outra, aquela cuja cauda é mais grossa, seja 2 milimetros, onde a da primeira for 0.1 mm, a da outra seja 1.5 mm, onde a da primeira for 0.01 mm, a segunda seja 1.2 mm, e assim por diante. É claro que a primeira das fun¸cões se aproxima de 1 muito mais rápido que a segunda. É n´ıtido que a diferen¸ca relativa entre elas cresce:

2−1

2 , 1.5−0.1

0.1 , 1.2−0.01 0.01 , etc.

enquanto que a distˆancia absoluta entre as duas n˜ao ultrapassaε= 2 mil´ımetros.

Queremos que o leitor entenda que o efeito explicado no parágrafo anterior está sendo usado pelo método POT para aproximar a cauda da distribui¸cão Normal Padrão. Funciona assim. Sejauum valor à direita do qual a cauda da Normal precisa ser aproximada. A cauda come¸ca do ponto (u,Φ(u)) e cresce rápido ao n´ıvel 1. Então o método toma a distribui¸cão exponencial

G_0,β,0(x) =

0, quando x <0,

1−exp{−x/β}, quandox≥0,

e escolhe o valor do parâmetroβ de modo tal que quando esta fun¸cão formar a aproxima¸cão da cauda – e se você lembra que para isto a distribui¸cão deve ser apropriadamente encolhida e sua parte à direita de 0 deve ser transportada para “come¸car” do ponto (u,Φ(u)) –, esta esteja acompanhando de perto a cauda da distribui¸cão Normal do ponto (u,Φ(u)) até o mais longe poss´ıvel.

Quando este acompanhamento não for mais fact´ıvel – o que acontecerá devido a diferen¸ca entre as grossuras da cauda e da distribui¸cão exponencial –, as duas

fun¸cões serão tão próximas do n´ıvel 1 que a distância absoluta entre elas será muito pequena. Em conseqüência, a cauda e seu aproximador serão próximos um do outro em toda a extensão à direita deu.

Você agora está convidado a observar novamente a Tabela 5 e notar como o método POT muda o valor de ˆβ de acordo com que explicamos acima.

Comentário 29. Aqui daremos uma alternativa à explica¸cão do mecanismo usado pelo método POT para aproximar, pela distribui¸cão exponencial, as caudas da distribui¸cão Normal Padrão Φ(·). Chamaremos esta explica¸cão de comentário, já que os comentários são as partes do texto que podem ser omitidas numa primeira leitura – coisa que você, talvez, gostasse de fazer depois de se cansar da nossa insistência na explica¸cão de todos os detalhes.

Come¸caremos recordando que o aproximador da cauda de uma fun¸cão de distribui¸cãoF(·) à direita de um limiarué uma fun¸cão do tipo (62), denotada porG^∗_ξ,β(u),0(·). Destacamos também que esta fun¸cão é construida a partir da GPDG_ξ,β(u),0(·), que aproxima a fun¸cãoFu(·) – que expressa a distribui¸cão dos excessos deF(·) acima deu. O motivo de tanta referência é o esclarecimento de que a acuidade da aproxima¸cão pode ser analisada em termos da proximidade de G^∗_ξ,β(u),0(·) à cauda de F(·), assim como pode ser analisada em termos da proximidade deG_ξ,β(u),0(·) aF_u(·). A primeira análise foi apresentada acima.

Agora ´e a vez da segunda, que possui suas vantagens.

Se Φ(·) é a fun¸cão de distribui¸cão Normal Padrão, e se pedimos ao método POT que aproxime Φ_u(·) para u fixo (u é positivo, claro, e grande), então o método deve construir seu aproximador usandoG_0,β(u),0(·), já que o Resultado de Pickands obriga o método a tomarξ= 0. Em outras palavras, o método só pode mudar o valor do parâmetro β para conseguir a desejada aproxima¸cão.

Que isto é poss´ıvel é o conteúdo do Resultado de Pickands. Não entraremos na sua demostra¸cão. O que queremos fazer agora é analisar a dependência do valor de β(u) em rela¸cão a u. De acordo com a Tabela 5 percebe-se que β(u) decresce com o aumento de u. Seria isto uma regra geral, ou se trata de uma caracter´ıstica da amostra? Abaixo temos a comprova¸cão da generalidade desta regra.

Vejamos a Figura 28. Os pontilhados nos quatro gráficos representam a fun¸cão da distribui¸cão amostral dos excessos da nossa amostra retirada da dis-tribui¸cão Normal Padrão. Os excessos são relativos ao limiaru, cujos valores são 0.5, 0.8, 1.1 e 1.4 nas ilustra¸cões (a), (b), (c) e (d), respectivamente. As distribui¸cões amostrais representam aproximadamente as distribui¸cões Φ0.5(·),

0 2.1 1

(a)

0 1.8

(b)

0 1.5

(c)

0 1.1

(d)

Figura 28: As figuras apresentam, por pontos, a distribui¸cão amostral dos excessos acima de limiaruda amostra retirada da distribui¸cão Normal Padrão Φ(·), e apresen-tam por linhas pontilhadas as GPD’sG0,β(u),0(·) contru´ıdas pelo método POT para aproximar Φu(·). Os valores do limiar u são 0.5 em (a), 0.8 em (b), 1.1 em (c), e 1.4 em (d), com os respectivos valores de β(u): 0.629, 0.532, 0.405 e 0.459. Note que as escalas do eixo de abcissas são diferentes e decrescem de (a) para (d). Isso implica que os gráficos em (b) são mais próximos do eixo vertical que os gráficos em (a). A mesma rela¸cão vale quando compara-se os gráficos em (b) e em (c). A mesma rela¸cão deveria valer para o par (c) e (d), mas, infelizmente, ela não se manifestou no desenho. A razão é que os gráficos em (d) foram constru´ıdos com base na amostra constitu´ıda de número muito pequeno de pontos; esta escasez ocorre porque o caso (d) corresponde ao maior valor do limiarudentre todos os quatro casos.

Φ_0.8(·), Φ_1.1(·) e Φ_1.4(·).³⁴ Infelizmente, a quantidade dos pontos excedentes da amostra diminui com o crescimento deu. Por isto a quantidade de pontos diminui de (a) para (d), e, além disso, a acuidade da aproxima¸cão de Φ_u(·) pela fun¸cão da distribui¸cão amostral também piora. Mas, apesar desta piora, os desenhos exibem a propriedade que importa para nossa presente discussão:

quanto maior u, mais próxima ao eixo vertical estará a fun¸cão Φu(·) depois de ter deixado o ponto (0,0). Portanto, caso o método POT queira fazer a fun¸cãoG_0,β(u),0(·) “acompanhar” de perto à fun¸cão Φ_u(·), conforme u cresce, então o parâmetro β(u) deve diminuir com o aumento de u. Isto por que quanto menor β mais perto do eixo vertical estará a fun¸cão G_0,β,0(·) – fato que foi explicado na Sub-se¸cão 4.4 e exibido na Figura 9(a). Pronto! Prova-mos que β(u) decresce com aumanto de u quando o método POT aproxima cauda da distribui¸cão Normal Padrão. Este foi o principal objetivo do presente comentário.

Depois de muitas explica¸cões do porque o método POT conseguiria aprox-imar cauda da distribui¸cão Normal Padrão usando a distribui¸cão exponencial,

é natural verificar se no caso da nossa amostra houve de fato a tão prometida aproxima¸cão. A resposta está na Tabela 6. No nosso ponto de vista, os valores desta tabela confirmam uma boa aproxima¸cão. Boa, apesar do procedimento de execusão da idéia do método POT ser inadequado para o presente caso.

Sobre isto versa o nosso último comentário da presente sub-se¸cão.

Comentário 30. A análise proferida na presente sub-se¸cão indica que a es-tratégia tra¸cada na Sub-se¸cão 7.1 é inadequada para executar a idéia do métod POT quando trata-se da estima¸cão da cauda de uma fun¸cão de distribui¸cão com cauda mais fina que a exponencial. Os problemas surgem já no primeiro passo da estratégia (o passo (A) definido na Sub-se¸cão 7.1 e detalhado na Sub-se¸cão 7.2). A razão é a inexistância do limiar ótimo, uôpt, definido pelos critérios explicados nas Sub-se¸cões 7.2 e 7.6. A inexistência deuôpt complica também a juistificativa do segundo passo da estratégia, já que este usa uôpt em seus procedimentos.

A inadequan¸ca acima citada ocorre porque a cauda aproximada é muito mais fina que a cauda do aproximador. Isto sugere que o estudo do tipo de cauda deve preceder à execu¸cão do métdo POT, e que o caminho da execu¸cão deve ser trilhado de acordo com as conclusões sobre o tipo de cauda. As

34Recorde que Φu(·) denota a fun¸cão da distribui¸cão dos excessos acima deude Φ(·), quer dizer, da fun¸cão da distribui¸cão Normal Padrão.

p F⁻¹(p) Fˆ_0.5⁻¹(p) Fˆ_0.55⁻¹(p) Fˆ_0.6⁻¹(p) Fˆ_0.65⁻¹ (p) Fˆ_0.7⁻¹(p) Fˆ_0.75⁻¹(p)

0.9 1.281 1.227 1.222 1.139 1.219 1.221 1.186

0.95 1.644 1.664 1.639 1.490 1.608 1.599 1.532

0.995 2.576 3.112 3.025 2.657 2.900 2.856 2.681

p Fˆ_0.8⁻¹(p) Fˆ_0.85⁻¹(p) Fˆ_0.9⁻¹(p) Fˆ_0.95⁻¹(p) Fˆ₁⁻¹(p) Fˆ_1.05⁻¹(p) Fˆ_1.1⁻¹(p)

0.9 1.224 1.231 1.317 1.241 1.222 1.310 1.212

0.95 1.593 1.579 1.741 1.592 1.580 1.770 1.494

0.995 2.819 2.734 3.149 2.758 2.768 3.298 2.428

p Fˆ_1.15⁻¹ (p) Fˆ_1.2⁻¹(p) Fˆ_1.25⁻¹(p) Fˆ_1.3⁻¹(p) Fˆ_1.35⁻¹ (p) Fˆ_1.4⁻¹(p) Fˆ_1.45⁻¹(p)

0.9 1.232 1.220 1.250 – – – –

0.95 1.576 1.576 1.576 1.544 1.600 1.592 1.615

0.995 2.721 2.760 2.729 2.500 2.622 2.650 2.585

p Fˆ_1.5⁻¹(p) Fˆ_1.55⁻¹(p) Fˆ_1.6⁻¹(p) Fˆ_1.65⁻¹(p) Fˆ_1.7⁻¹(p) Fˆ_1.75⁻¹(p) Fˆ_1.8⁻¹(p)

0.9 – – – – – – –

0.95 1.639 1.647 1.663 1.644 1.644 1.644 1.644

0.995 2.522 2.555 2.468 2.427 2.446 2.424 2.424

p Fˆ_1.85⁻¹ (p) Fˆ_1.9⁻¹(p) Fˆ_1.95⁻¹(p) Fˆ_1.95⁻¹(p)

0.9 1.281 1.281 1.281 1.281

0.95 1.644 1.644 1.644 1.644 0.995 2.382 2.398 2.430 2.411

Tabela 6: A compara¸cão entre quantis da distribui¸cão Normal Padrão e suas estima-tivas produzidas por fun¸cões -aproximadores da cauda desta produzidas pelo método POT. Analisamosp-quantis com valores 0.9,0.95,0.995 dep. Os verdadeiros valores estão na coluna “Φ⁻¹(p)”. Cada ˆFu denota o aproximador da cauda à direita de u da distribui¸cão Normal Padrão, Φ(·). Os aproximadores são produzidos por método POT com base em uma amostra de Φ(·).

ferramentas e idéias desse estudo não estão no escopo do nosso presente tra-balho, assim como os caminhos alternativos à estratégia (A)-(C) definida na Sub-se¸cão 7.1.

Apesar da inadequa¸cão comprovada da estratégia (A)-(C) para o caso em que a cauda aproximada é mais fina que a exponencial, muitas pessoas usam esta estratégia sem uma prévia ana´lise da cauda. Uma razão para isso é que tal análise é complexa e muito sens´ıvel as imperfei¸cões de amostras. A segunda razão é que a estratégia é bem capaz de dar uma boa aproxima¸cão, como, por exemplo, no caso estudado acima. De fato a Tabela 6 mostra que as estimativas dos quantis, produzidas por esta estratégia, não diferem muito dos quantis verdadeiros, e, mesmo que não soubesémos os verdadeiros valores, poder´ıamos alegar a precisão da aproxima¸cão pelo fato de que os valores não se alteram muito conforme a mudan¸ca do limiar u. A terceira razão está no emprego da fun¸cão da média amostral de excessos. A idéia do seu uso vale quando a verdadeira cauda é pesada ou é finita, mas não no caso quando a cauda é mais leve que a exponencial. Nos últimos casos esta fun¸cão será tipicamente decrescente – isto pode ser provado para a muitas distribui¸cões com cauda fina por intermédio dos argumentos exibidos no Comentário 28.

Acontece que este comportamento da fun¸cão da média amostral de excessos tem seu proveito. Se você conseguir detectar, analizando seu formato, que ela é convexa e aproxima-se a uma linha horizontal, então você terá uma forte indica¸cão de que a cauda aproximada é mais leve que a exponencial. Se você se enganar e identificar linearidade no seu gráfico, você aproximará a cauda por uma GPD de cauda finita, mas isto pode ser uma aproxima¸cão razoavelmente boa, conforme explicamos no Comentário 6.

8.3 Aplica¸c˜ao do m´etodo POT a uma amostra de dados reais

No documento “Peaks-over-Threshold” na estimac ¸ ˜ ao de risco; uma exposic ¸˜ ao abragente, (páginas 132-145)