Aplica¸c˜ao do m´etodo POT para amostras geradas das

8 Exemplos de aplica¸ c˜ ao do m´ etodo POT

Nesta se¸cão exibiremos o funcionamento do método POT para diversos con-juntos de dados. Um desses concon-juntos – aquele tratado na Sub-se¸cão 8.3 – provêm de um caso real. O tratamento deste conjunto pelo método POT fornece uma resposta não muito precisa, o que ocorre freqüentemente nos casos reias. Este fato precisa ser explicado. Para que possamos expôr e discutir suas razões, analizaremos o funcionamento do método POT em conjuntos de dados artificiais, criados a partir de fun¸cões de distribui¸cão adequadamente escolhi-das. As análises destes conjuntos formam Sub-se¸cões 8.1 e 8.2, que antecipam, por razões didáticas, a Sub-se¸cão 8.3, que trata o caso real.

8.1 Aplica¸cão do método POT para amostras geradas das fun¸cões

valores dex suficientemente grandes, sua “cara” ´e

F¯(x) (que ´e a nota¸c˜ao para 1−F(x)) =x^−αL(x), (109) para algum α >0,

ondeL(·) é alguma fun¸cão de varia¸cão lenta. O segundo grupo é chamado de dom´ınio de atra¸cão das distribui¸cões de Weibull. As fun¸cões deste grupo possuem cauda direita finita, e para os valores suficientemente próximos ao fim da cauda, x_F, a “cara” dos elementos deste grupo é

F¯(x_F −x⁻¹) =x^−αL(x), x↑ ∞, para algum α >0, (110) onde L(·) é alguma fun¸cão de varia¸cão lenta (na fórmula acima x é uma variável auxiliar: conforme esta cresce ao ∞, o argumento de ¯F aproxima-se de x_F). O terceiro e último grupo é chamado dom´ınio de atra¸cão da distribui¸cão de Gumbel. Este grupo contém tanto fun¸cões com caudas finitas quanto com caudas infinitas. As fun¸cões deste grupo são caraterizadas pelo seguinte comportamento caudal:

F¯(x) =h(x) exp

− Z x

g(t) a(t)dt

, para x∈(z, x_F), (111) onde as fun¸cões envolvidas nesta expressão devem satisfazer as condi¸cões descritas após a fórmua (42) da sub-se¸cão 5.4.

(O conteúdo do último lembrete é uma sucinta reprodu¸cão da exposi¸cão do

´ıtem (IV) da Sub-se¸c˜ao 5.4.)

Então, qual dentre as três condi¸cões , (109), (110) e (111), atenderá a fun¸cão-teste que construiremos? A condi¸cão (111) parece ser bastante com-plicada. Vamos nos deixar levar por esta impressão e descartar esta condi¸cão – mas só no âmbito da presente sub-se¸cão, pois entender o funcionamento do método POT para as fun¸cões satisfazendo esta condi¸cão é muito importante;

isto será provado na próxima sub-se¸cão. Assim, pela via errada da recusa injustificada da condi¸cão (111), nos restou escolher entre (109) e (110). Fi-caremos com a primeira delas, uma vez que esta aplica-se às fun¸cões com cauda infinita (lembre-se, na Sub-se¸cão 4.3 explicamos o motivo do nosso interesse maior pelas fun¸cões com cauda infinita).

8.1.1 Constru¸c˜ao de fun¸c˜oes-teste

Como prometido, vamos construir uma fun¸c˜ao que satisfa¸ca a condi¸c˜ao (109).

Esta será denominada porF^comp+ruido(·); um nome que pode parecer estranho, que indica que ela é composta de duas fun¸cões distintas e que há um ru´ıdo que distorce estas fun¸cões. Antes de come¸carmos com a descri¸cão da constru¸cão, vale lembrar que pretendemos “criar” F^comp+ruido(·) com o objetivo de usá-la para construir uma amostra que será fornecida ao método POT; do qual pediremos sua estimativa da cauda, que será comparada com a verdadeira cauda deF^comp+ruido(·). Agora lembre-se de que o método POT aproxima a cauda à direita de um limiar que ele próprio determina com base no seguinte critério: a distribui¸cão dos excessos dos pontos da amostra que excederam este limiar deve ser parecida com uma distribui¸cão de Pareto generalizada (GPD -foi a abrevia¸cão). Foi justamente isso que nos motivou a comporF^comp+ruido(·) de duas partes: ela é parecida com a distribui¸cão Normal Padrão até o ponto s = 1.281, e da´ı adiante é semelhante a uma GPD re-escalada e deslocada.

Note que dissemos “parecida/semelhante” e não “igual”, pois tanto a GPD quanto uma parte da distribui¸cão Normal são “distorcidas” por um ru´ıdo (este ru´ıdo corresponde à fun¸cão de varia¸cão lenta). Tudo isso garante que os excessos da amostra acima dos limiares maiores que s = 1.281 são quase que da distribui¸cão de Pareto generalizada (por causa da presen¸ca do ru´ıdo, tais excessos não são exatamente os de uma GPD). Isto nos permite testar a sensibilidade do método POT na presen¸ca de um ru´ıdo. É bom ressaltar que com a ausência do ru´ıdo, o ponto 1.281 é o melhor valor para o limiar a partir do qual o método POT aproximaria a cauda. Nosso desejo é saber se o método adivinha este valor, e se o ru´ıdo atrapalhará muito esta adivinha¸cão.

Chamamos a aten¸cão do leitor que para julgar a influência do ru´ıdo no funcionamento do método POT – a investiga¸cão que pretendemos fazer – é necessário executar os mesmos testes na fun¸cão sem ru´ıdo. É este o trajeto. A fun¸cão denotada porF^comp(·), que aparecerá abaixo, é a fun¸cãoF^comp+ruido(·) sem a presen¸ca do ru´ıdo.

Passaremos agora à descri¸cão matemática da constru¸cão das fun¸cões de distribui¸cãoF^comp+ruido(·) eF^comp(·). Os leitores que entenderam a descri¸cão informal da estrutura destas fun¸cões, dada acima, podem omitir esta parte matemática.

No primeiro passo tomamos a fun¸cão de distribui¸cão normal padrão Φ(x) = 1

√2π Z _x

−∞

e^−y

2 dy, x∈R, (112)

e eliminamos sua cauda a partir do ponto com abcissa 1.281. Recordamos que Φ(1,281)≡ √

2π−1Z 1,281

−∞

e^−y²^/2dy= 0,9. (113) Portanto, a cauda eliminda era a parte do gr´afico `a direita do ponto (1.281; 0.9).

No segundo passo usamos a parte “não chata” da fun¸cão de distribui¸cão de Pareto “pura”

F^pura(x) =







0, parax < s,

1−

1 +^ξ(x−s)_β −¹_ξ

, parax≥s, (114)

com os valores dos parâmetros ξ= 0.7, β = 1.0, s= 1.281, para repor a cauda eliminada no primeiro passo. Para isto a fun¸cãoF^pura(·) foi contra´ıda 1−0.9 = 0.1 vezes, e sua parte à direita de 1.281 levantada por 0.9. Tudo isto nos deu:

F^comp(x) =







Φ(x), parax≤s,

(1−d) 1−

1 +ξ(x−s) β

−¹_ξ!

+d, parax≥s,(115) onde aξ atribu´ımos o valor 0.7;

onde aβ atribu´ımos o valor 1.0;

onde asatribu´ımos o valor 1.281;

onde ad atribu´ımos o valor 0.9.

O terceiro passo da constru¸cão consiste em distorcer o gráfico deF^comp(·) à direita da abcissa 1.0. Notamos que o “come¸co da distor¸cão”, ou seja, o ponto 1.0, é menor ques= 1.281, o que faz com que a distor¸cão aja também no ponto (1.281,0.9), que é o ponto de solda de partes de Φ(·) e de F^pura(·). Isto deve dificultar o processo de estabelicimento do limiar ótimo pelo método POT.

A distor¸cão é dada pelo seguinte procedimento. Primeiramente, definimos a fun¸cão de sobrevivência correspondente a F^comp(·):

F¯^comp(x) := 1−F^comp(x), x∈R. (116) Depois tomamos a fun¸c˜ao

L(x) :=

1, quandox <1,

log(x+ 1.71), quandox≥1. (117)

(Note queL(1) = log(1+1.71)≈log(e) = 1, o que garante queL(·) é cont´ınua no pontox = 1. Esta continuidade é o que determina a suavidade da fun¸cão F^comp+ruido(·) no ponto x= 1. Sem esta suavidade, porém, todos os argumen-tos e procedimenargumen-tos funcionariam sem que precisassem ser alterados. ) Após isso, definimos uma nova fun¸cão de sobrevivência

F¯^comp+ruido(x) := ¯F^comp(x)×L(x), x∈R. (118) Nossa fun¸cão L(·) foi escolhida de maneira a garantir que esta fun¸cão de so-brevivência atenda as três condi¸cões seguintes:

F¯^comp+ruido(·) ´e n˜ao decrescente, lim_x→∞F¯^comp+ruido(x) = 0, lim_x→−∞F¯^comp+ruido(x) = 1.

Estas condi¸cões garantem que quando definimos a fun¸cãoF^comp+ruido(·) pela equa¸cão

F^comp+ruido(x) := 1−F¯^comp+ruido(x), x∈R, (119) ela seja uma leg´ıtima fun¸cão de distribui¸cão. Para a completude da apre-senta¸cão escreveremos sua expressão exata:

F^comp+ruido(x) =











Φ(x), x≤1,

1−log(x+ 1.71)× {1−Φ(x)}, x∈(1, s), 1−log(x+ 1.71)×

× (

1−(1−d) 1−

1 +ξ(x−s) β

−¹_ξ!

−d )

, x≥s, onde a ξ atribu´ımos o valor 0.7;

onde a β atribu´ımos o valor 1.0;

onde a satribu´ımos o valor 1.281;

onde a d atribu´ımos o valor 0.9. (120) Ufa! Terminamos a constru¸cão das tão desejadas fun¸cões de distribui¸cão F^comp+ruido(·) e F^comp(·). Agora o programa é: usar estas fun¸cões de dis-tribui¸cões para gerar amostras; aplicar às amostras o método POT com o ob-jetivo de estimar as caudas das respectivas fun¸cões de distribui¸cão e, analizar a eficiência do método, compararando os resultados do ponto de vista de suscep-tibilidade destes à presen¸ca do ru´ıdo. Mas antes de prosseguirmos na execu¸cão

deste programa é bom lembrar, com base no come¸co da presente sub-se¸cão, que queremos construir fun¸cões de distribui¸cão que satisfa¸cam a condi¸cão (109).

Como se prova queF^comp+ruido(·) e F^comp(·) de fato a satisfazem? Faremos isto paraF^comp(·) e deixamos outro caso para o leitor. Temos ent˜ao, que para xmaiores que s,

F¯^comp(x) = 1−F^comp(x)

= 1− (

(1−d) 1−

1 + ξ(x−s) β

−¹_ξ! +d

)

= (1−d) 1−

1 +ξ(x−s) β

−¹_ξ!

= x⁻¹^ξ ×

(1−d) 1−

1 +ξ(x−s) β

−¹_ξ!

x⁻¹^ξ

Portanto ¯F^comp(x) satisfaz (109) com α = 1/ξ e L(x) igual ao fator que multiplicax⁻¹^ξ na última linha da conta acima (deixamos para leitor a prova de que este fator de multiplica¸cão é uma fun¸cão de varia¸cão lenta).

8.1.2 Gera¸c˜ao de amostras

A gera¸cão de uma amostra baseia-se em um fato conhecido que diz que se F(·) é uma fun¸cão de distribui¸cão qualquer, e R é uma variável aleatória uniformamente distribu´ıda no intervalo [0,1], então F⁻¹(R) – o resultado da aplica¸cão da fun¸cão inversa aF(·) aR– é uma variável aleatória cuja fun¸cão de distribui¸cão é a própriaF(·). Portanto, para gerar uma amostra denpontos de uma dadaF(·), basta produzirnrealiza¸cõesr₁, . . . , r_nda distribui¸cão uniforme em [0,1] e então aplicar F⁻¹(·) a cada uma das realiza¸cões. Feito isso, o conjunto de valoresF⁻¹(r₁), F⁻¹(r₂), . . . , F⁻¹(r_n) corresponde a uma amostra aleatória gerada pela distribui¸cãoF(·).

No processo de gera¸cão de amostra descrito acima há um passo delicado, o de como encontrar F⁻¹(r) dados r e F(·). O empecilho é a ausência de uma expressão anal´ıtica simples para a inversa das fun¸cões F^comp+ruido(·) e F^comp(·). Este fato nos obrigou a calcularF⁻¹(r_i) como solu¸cão da equa¸cão F(x)−r_i = 0, por intermédio de um método numérico apropriado. O código

−3 1

Figura 21: Esta figura apresenta a fun¸cão de distribui¸cão amostral correspondente a amostra den= 500 pontos, gerada pela fun¸cãoF^comp+ruido(·) definida em (120). Na figura da esquerda esta fun¸cão é apresentada por sua fun¸cão de distribui¸cão amostral.

E a fun¸c˜´ ao escada que sobe um degrau de altura 1/nem cada valor da amostra. Na figura da direita as posi¸cões dos espelhos desta fun¸cão-escada estão marcadas com pontos; a proje¸cão de cada ponto no eixo das abcissas é o valor do correspondente ponto da amostra.

−3 0 1

Figura 22: Esta figura apresenta a fun¸cão de distribui¸cão amostral correspondente a amostra de tamanhon= 500, gerada da fun¸cãoF^comp(·), definida em (115). Veja a descri¸cão da Figura 21 para a explica¸cão da constru¸cão desta fun¸cão.

do programa que realiza este método é apresentado na Sub-se¸cão 11.1, que o leitor pode encontrar no Apêndice 11.

O método descrito acima foi utilizado para gerar duas amostras de cada uma das fun¸cões de distribui¸cões F^comp+ruido(·) e F^comp(·); uma amostra de n = 500 pontos e outra de n = 2000 pontos. Elas são apresentadas nas Figuras 21 e 22.

E interessante notar que a amostra da fun¸c˜ao´ F^comp+ruido(·) ´e mais esticada

à direita que a de F^comp(·), uma observa¸cão natural, que se deve à presen¸ca da fun¸cão de varia¸cão lenta, L(·), na constru¸cão de F^comp+ruido(·) e ao fato de L(·) ser crescente e maior que 1. Com a multiplica¸cão por L(·) a cauda direita de ¯F^comp+ruido(·) ficou acima da de ¯F^comp(·). Isto fez com que a cauda direita deF^comp+ruido(·) é mais grossa que a de F^comp(·), o fato evidenciado por amostras obtidas.

8.1.3 Aplica¸c˜ao do m´etodo POT

A aplica¸cão do método POT come¸ca, conforme a constru¸cão do mesmo apre-sentada na Sub-se¸cão 7.1, com o estabelecimento do limiar ótimo – a quantia denotada por uôpt. Para tal é preciso construir a fun¸cão da média amostral de excessos e analisar seu gráfico, buscando identificar a menor abcissa onde, dela adiante, o gráfico seja similar ao de uma reta com tangente não-negativa.

Na Sub-se¸cão 11.3 do Apêndice apresentamos o cógido que produz a fun¸cão da média amostral de excessos. Os gráficos desta fun¸cão, relativos às amostras de n= 500 en= 2000 pontos originados da fun¸cãoF^comp+ruido(·) de (120), estão na Figura 23. Já para as originadas da fun¸cão F^comp(·) de (115), os gráficos estão na Figura 24.

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

4 6 8 10

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

4 6 8 10

Figura 23: A fun¸cão da média amostral de excessos correspondente às amostras originadas da fun¸cãoF^comp+ruido(·) definida em (120). Esquerda: a amostra den= 500 pontos; direita: a amostra den= 2000 pontos. Certamente o dom´ınio da fun¸cão estende-se à maior obsreva¸cão da amostra, mas nós não apresentamos toda a fun¸cão pelas razões mencionadas no texto.

0.0 0.5 1.0 1.5 2.0 2.5 3.0 1

2 3 4 5 6 7

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

3 4 5 6 7

Figura 24: A fun¸cão da média amostral de excessos correspondente às amostras originadas da fun¸cão F^comp(·) definida em (115). Esquerda: a amostra de n= 500 pontos; direita: a amostra den= 2000 pontos.

A identifica¸cão da região onde a fun¸cão da média amostral de excessos

é aproximadamente linear envolve mais arte de que ciência, no sentido de que cada caso é um caso. Para cada regra genérica que definirmos sempre haverá um milhão de excessões. Uma das principais dificuldades desta tarefa reside no fato de a fun¸cão da média amostral de excessos se parecer com uma serra, cujos dentes crescem conforme o gráfico se move à direita. Para lidar adequadamente com este fenômeno é preciso lembrar que a fun¸cão da média de excessos de uma fun¸cão de distribui¸cão (e não a fun¸cão da média amostral de excessos) deve ser linear caso a cauda desta distribui¸cão seja Pareto – isto é uma fato rigorosamente provado –, ou aproximadamente linear, caso a cauda seja Pareto com um ru´ıdo fraco (que pode ser enquadrado numa fun¸cão de varia¸cão lenta) – isto é uma cren¸ca. Já a fun¸cão da média amostral de excessos é uma aproxima¸cão da fun¸cão da média de excessos, pois a fun¸cão da média amostral de excessos provêm de uma amostra. O ponto aqui é então que a linearidade, que tentamos identificar, refere-se à fun¸cão da média de excessos, que é desconhecida, e da qual só temos uma aproxima¸cão, a fun¸cão da média amostral de excessos. Este aspecto faz com que a região de “dentes grandes” seja exclu´ıda da análise da linearidade, uma vez que o tamanho de dentes corresponde ao espa¸camento dos pontos da amostra, e onde os pontos da amostra são espar¸cos, a aproxima¸cão da fun¸cão de média de excessos pela fun¸cão da média amostra de excessos é pobre. Com isto em mente na análise dos gráficos da Figura 23, decidimos num primeiro momento que no caso da

amostra de n = 500 pontos, retirada da fun¸c˜ao F^comp+ruido(·), a linearidade

“come¸ca” na abcissa 1, enquanto que no caso da amostra den= 2000 pontos, este “come¸co” se d´a em 1.3. Conseq¨uentemente, assumiremos que o limiar

ótimo, uôpt, é 1 para a amostra de n= 500 pontos e é 1.3 para a amostra de n= 2000 pontos.

A determina¸cão do limiar ótimo em todos os quatro casos foi facilitada pelo fato da fun¸cão da média amostral de excessos apresentar uma concavidade no seu come¸co. Esta concavidade é bem n´ıtida e ainda ocorre na região onde os pontos da amostra são densos. Isto permite concluir que a fun¸cão da média de excessos é côncova nesta região, e, portanto, nela não pode se encontrar o limiar ótimo.

Existem ainda diversas regras folclóricas que auxiliariam na determina¸cão do limiar ótimo em casos reais, mas que não utilizamos aqui. Uma delas é que uma fun¸cão de distribui¸cão de uma fonte real de aleatoriedade teria o come¸co da sua cauda no ponto que separa os 10%-15% maiores valores da amostra dos demais valores. Crê-se que à esquerda e à direita deste ponto a fun¸cão de distribui¸cão tenha comportamentos distintos. Aliás, para não ir contra esta cren¸ca, constru´ımos as fun¸cõesF^comp+ruido(·) eF^comp(·) no formato acordado com ela:

(i) o valor 1.281 foi escolhido para garantir que `a direita dele haja aproxi-madamente 10% do todo o volume de cada distribui¸c˜ao;

(ii) ambas as distribui¸cões foram concebidas de modo que à esquerda de 1.281 elas sejam quase normais, e à direita de 1.281 elas sejam quase Pareto.

A mesma cren¸ca acima referida faz com que em casos reais de aplica¸cão do método POT os valores muito próximos dos maiores pontos de amostra sejam descartados como candidatos a limiar ótimo. É por isto que para tais valores não é costume se analisar o comportamento da fun¸cão da média amostral de excessos. Foi por esta razão que nos quatro casos considerados aqui os gráficos desta fun¸cão foram cortados no ponto 3.0 (veja Figuras 23 e 24), apesar da fun¸cão continuar até o ponto máximo de cada amostra.

Uma outra cren¸ca diz que para que o método POT adivinhe bem a cauda de uma distribui¸cão é necessário que haja no m´ınimo 400 pontos da amostra à direita do limiar ótimo. É claro que este quesito nem sempre pode ser atendido, devido ao tamanho da amostra, mas esta cren¸ca é uma outra razão para o corte dos gráficos da fun¸cão da média amostral de excessos antes do seu fim (como explicado no fim do parágrafo anterior). Também, pagando o tributo a esta

cren¸ca, os estat´ısticos custumam reportar o número de excedentes³¹ à direita do limiar ótimo usado na execu¸cão do método POT. Também fizemos isto nas Tabelas 1-4 desta sub-se¸cão e nas tabelas semelhantes das outras sub-se¸cões.

Uma vez determindao o valor do limiar ótimo, o próximo passo do método POT é calcular estimativas dos parâmetrosξeβda GPDG_ξ,β,0(·), que melhor aproxima os excessos da amostra acima do limiar ótimo. Recordamos, para facilitar a “leitura” das fórmulas a seguir, que uôpt denota o valor do limiar

ótimo, e que ˆξ e ˆβ denotam, respectivamente, as estimativas dos parâmetrosξ eβ, sejam elas boas ou ruins. Relembramos ainda que no âmbito do presente trabalho estas estimativas são as fornecidas pelo método da máxima verossim-ilhan¸ca. Conforme explicado na Sub-se¸cão 7.3, este método atribui a ˆξ e ˆβ os valores que maximizam uma expressão constru´ıda com base na expressão da GPD. Esta constru¸cão é um ponto delicado, visto que existem três expressões para as GPDs: (10), (11) e (12). Qual delas deve ser usada? No presente caso descartamos o uso de (12), já que esta corresponde às GPDs com cauda finita.

Usar tais GPD’s para aproximar as caudas de nossas fun¸cões F^comp+ruido(·) e F^comp(·) não é adequado, conforme explicado no Comentário 19. A caudas dessas fun¸cões de distribui¸cão são infinitas por constru¸cão e, lembrando bem estes passos, suas caudas foram constru´ıdas da GPD do tipo (10) com o valor ξ = 0.7. Seguindo os argumentos apresentados no Comentário 19, a GPD que melhor aproxima os excessos da amostra retiradas destas fun¸cões deve ser do tipo (10), isto se o método POT funcionar corretamente, o que, por sua vez, depende do quão bem a amostra fornecida ao método representa a fun¸cão da distribui¸cão cuja cauda o método tenta aproximar. Então, para os casos tratados nesta sub-se¸cão, a pergunta está resolvida: usaremos as GPD’s da forma (10) na constru¸cão da expressão cujo ponto de máximo nos dará as estimativas ˆξ e ˆβ. Eis a expressão

`(ξ, β) = −N(u^opt) logβ− 1

ξ + 1

^N(uX^opt⁾

i=1

log

1 + ξ βy_i

, (121)

onde: uôpt é o valor do limiar ótimo,

N(uôpt) é o número dos pontos da amostra que excedem uôpt, β >0 devido sua interpreta¸cão,

ξ >0 pois a express˜ao foi constru´ıda da (10).

31Recorde, um valor de amostra se chama excedente acima de um valor u, caso ele ´e extritamente maior queu.

Nesse momento fica claro que, para o caso discutido na presente sub-se¸cão, a questão da constru¸cão da fun¸cão de log-verossimilhan¸ca (quer dizer, da fun¸cão `) foi resolvida gra¸cas ao conhecimento das fun¸cões de distribui¸cão, cujas caudas são aproximadas pelo método POT. E nos casos reais, em que este conhecimento prévio não existe, como agimos? Por certo, em tais casos

é necessário antecipar a constru¸cão da fun¸cão de log-verossimilhan¸ca por um teste que indique se a fun¸cão aproximador da cauda deve ter cauda finita, cauda infinita do tipo (10) (chamada também de cauda polinomial ou cauda pesada) ou ainda cauda infinita do tipo (11) (chamada também de cauda ex-ponencialou cauda leve). Estes testes não serão discutidos no nosso trabalho.

Infelizmente não há uma solu¸cão anal´ıtica para as coordenadas ( ˆξ,β), oˆ ponto onde a fun¸cão (121) assume o valor máximo. Comumente, isto leva ao cálculo aproximado de ˆξ e ˆβ via métodos de otimiza¸cão numérica. Este método de otimiza¸cão a ser utilizado na procura dos pontos de máximo da equa¸cão acima fica a critério do leitor, que pode ter preferência por algum método espec´ıfico. No presente caso empregamos um método implementado emscilab 3.0. (o código do programa está na Sub-se¸cão 11.4 apresentada no Apêndice). Este método têm melhor desempenho quando faz uso das derivadas parciais da expressão a ser maximizada. No nosso caso estas derivadas são:

∂`(ξ, β)/∂ξ = 1 ξ²

N(uX^opt)

i=1

log

1 + ξ βy_i

−

1 +1 ξ

^NX^(u^opt⁾

i=1

y_i

β+ξy_i, (122)

∂`(ξ, β)/∂β = −N(u^opt)

β −

1 +1

^N(uX^opt⁾

i=1

−βy_i

ξ(β+ξy_i). (123) Notamos que pelo comandooptim(cost,’b’,[l1;l2],[u1;u2],x0)é feita a chamada ao método; a componentecostcarrega a expressão a ser maximizada juntamente com suas derivadas parciais, a segunda componente,’b’, significa que a busca pelo ponto de máximo se dará numa caixa onde as duas variáveis são limitadas inferiormente por [l1;l2], e superiormente por [u1;u2]. Os limites inferiores “passam” ao método de otimiza¸cão a informa¸cão sobre as restri¸cões ξ > 0 e β > 0 mencionadas em (121). Devido ao redondamento da apresenta¸cão de valores no computador, estes limites são valores positivos muito pequenos, da ordem de 1E−10. Já os limites superiores foram definidos com um pouco mais de liberdade; escolhemos u1 =u2 = 10. Finalmente, x0 fornece o ponto de partida para a busca do ponto de máximo. O nosso interesse

está na variável da sa´ıda da fun¸cãooptim, que corresponde ao ponto onde a expressão assume seu valor máximo. Esta variável nos devolve os valores de ˆξ e ˆβ.

A partir de uma amostra de 500 pontos da fun¸c˜aoF^comp+ruido(·) de (120) o c´odigo acima produz ˆξ = 1.118 e ˆβ= 0.931.

Vale a pena lembrar ao leitor a que se referem as estimativas calculadas.

Estas são estimativas dos valores dos parâmetrosξ e β(uôpt) da GPD, que é apontada pelo Resultado de Pickands como a fun¸cão-aproximador da fun¸cão da distribui¸cão dos excessos deF(·) acima deuôpt; aquiF(·) denota a fun¸cão de distribui¸cão desconhecida, da qual provêm a amostra – aquela amostra que foi usada para determinar o valor deuôpt e encontrar as estimativas ˆξ e ˆβ dos verdadeirosξ eβ(uôpt). Este lembrete sugere que seria interessante comparar a fun¸cão da distribui¸cão amostral dos excessos acima de uôpt dos valores da amostras com a fun¸cão-aproximador da verdadeira fun¸cão de distribui¸cão de excessos acima deuôpt – aquela fun¸cão que seria desconhecida por nos desde que a fun¸cãoF(·) fosse desconhecida. Esta compara¸cão pode ser feita a partir da apresenta¸cão da Figura 25. A figura apresenta a aproxima¸cão acima referida para diversos valores do limiaru, um dos quais éuôpt.

A discussão do parágrafo anterior tem como um de seus objetivos despertar o leitor para que se lembre que a fun¸cão GPDG_ξ,_ˆ_β,0_ˆ (·) por si só ainda não é a aproxima¸cão da cauda produzida pelo método POT. Essa aproxima¸cão é dada porG^∗_ˆ

ξ,β,0ˆ (·), obtida da GPDG_ξ,_ˆ_β,0_ˆ (·) via o procedimento descrito no ´ıtem(C) da nossa estratégia de execu¸cão do método POT (veja a Sub-se¸cão 7.1).

8.1.4 An´alise de resultados

O que esperávamos do método POT? Em primeiro lugar esperávamos que ao receber uma amostra gerada da fun¸cão F^comp(·), definida em (115), o método calculasse o limiar ótimo como sendo 1.281. Como vimos, a parte da fun¸cão à direita de 1.281 foi feita da distribui¸cão GPD, e, portanto, os excessos da fun¸cão acima de qualquer valor maior que 1.281 têm distribui¸cão GPD. Esta propriedade deveria ser “descoberta” pelo método POT (devido sua constru¸cão), e fazer com que o método assumisse como limiar ótimo o ponto 1.281. Recordamos que o valor do limiar ótimo u foi de

0 30 1

(a)

0 60

(b)

0 30

(c)

0 60

(d)

0 30

(e)

0 60

(f)

Figura 25: Gráficos das fun¸cões de distribui¸cão amostrais correspondentes as amostras de excessos acima de limarupara diversos valores deu(0.6, 1 e 1.2 de cima para baixo na primeira coluna, e 0.8, 1.3 e 1.6 de cima para baixo na segunda col-una). Os excessos são relativos à amostra retirada da fun¸cão de distribui¸cãoF^comp(·);

e expressão desta fun¸cão está em (115). A primeira coluna corresponde a amostra de 500 pontos, e a segunda a de 2000 pontos. A primeira amostra esta apresentada na Figura 22. Junto a cada distribui¸cão de excessos está apresentada – pela linha potilhada – a GPD escolhida pelo método POT para aproximar estes excessos. Os122

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.923 0.998 1.137 1.180 1.297 1.118 1.151 1.202 βˆ 0.529 0.540 0.493 0.573 0.571 0.931 0.991 1.004

excedentes 167 144 128 107 94 77 70 65

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 1.260 1.284 1.167 0.892 0.932 0.843 0.859 0.945 βˆ 1.026 1.110 1.491 2.548 2.459 2.991 2.991 2.650

excedentes 60 55 49 42 41 38 37 37

p F⁻¹(p) Fˆ_0.5⁻¹(p) Fˆ_0.6⁻¹(p) Fˆ_0.7⁻¹(p) Fˆ_0.8⁻¹(p) Fˆ_0.9⁻¹(p) Fˆ₁⁻¹(p)

0.9 1.42 1.672 1.616 1.530 1.507 1.458 1.517

0.95 3.01 3.236 3.171 3.047 3.017 2.916 3.098

0.995 27.01 27.670 31.106 38.417 41.255 49.251 38.658 p Fˆ_1.1⁻¹(p) Fˆ_1.2⁻¹(p) Fˆ_1.3⁻¹(p) Fˆ_1.4⁻¹(p) Fˆ_1.5⁻¹(p) Fˆ_1.6⁻¹(p) Fˆ_1.7⁻¹(p)

0.9 1.507 1.509 1.510 1.399 – – –

0.95 3.058 3.000 2.940 2.915 3.025 3.281 3.246

0.995 40.239 42.409 45.162 46.400 41.418 34.149 34.901 p Fˆ_1.8⁻¹(p) Fˆ_1.9⁻¹(p)

0.9 – –

0.95 3.302 3.294 0.995 33.473 33.687

Tabela 1: A primeira tabela contém as estimativas dos parâmetros produzidos pelo método POT da amostra de 500 pontos da fun¸cãoF^comp+ruido(·) de (120). A segunda tabela apresenta os valores de quantis da fun¸cãoF^comp+ruido(·) (primeira coluna da tabela, onde F^comp+ruido−1

(p) é denotado porF⁻¹(p) para a economia de espa¸co) e as estimativas fornecidas pelas aproxima¸cões da cauda de F^comp+ruido(·), produzidas pelo método POT; ˆFusignifica a fun¸cão-aproximador constru´ıda com o valor do limiar u– na verdade ˆFu(·) é a nota¸cão alternativa paraG^∗_ˆ

ξ,β(u),0d (·), que ´e preferencial por ser muito mais curta.

As entradas tracejadas significam que a respectiva ˆF_u⁻¹(p) não faz sentido. ESpeci-ficaremos isto no exemplo de ˆF1.5(0.9). Recorde que devido nossa estratégia da ex-ecu¸cão do método POT, que a fun¸cão-aproximadorG^∗_ˆ

ξ,β(u),0d (·) vale zero até a abcissa u, e dá um salto de alturaF(u) no ponto u(isto está exibido na Figura 18). Isto significa quep-quantis compabaixo de F(u) não têm significado para esta fun¸c˜ ao-estimador (volte à Figura 18 e veja que qualquer linha horizontal na altura entre 0 e F(u) não cruza o gráfico desta fun¸cão). Então, ˆF1.5(0.9) não faz sentido, já que F(u)> pquando u= 1.5 e p= 0.9. Agora, esta última desigualdade pode ser de-duzida da fórmula da fun¸cão F(·) (que é no caso F^comp+ruido(·), de (120)). Aliás, F⁻¹(0.9) = 1.42 – a informa¸cão contida na segunda coluna da segunda tabela –

123

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.858 0.957 1.029 1.115 1.082 1.065 1.098 1.004 βˆ 0.578 0.545 0.555 0.570 0.719 0.858 0.910 1.200

excedentes 646 576 503 437 369 321 291 254

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.

ξˆ 0.914 0.918 0.934 0.990 1.012 0.958 0.985 1.029 βˆ 1.534 1.620 1.661 1.582 1.618 1.888 1.893 1.850

excedentes 226 212 201 194 184 170 163 157

p F⁻¹(p) Fˆ_0.5⁻¹(p) Fˆ_0.6⁻¹(p) Fˆ_0.7⁻¹(p) Fˆ_0.8⁻¹(p) Fˆ_0.9⁻¹(p) Fˆ₁⁻¹(p)

0.9 1.42 1.669 1.598 1.555 1.511 1.525 1.528

0.95 3.01 3.166 3.075 3.008 2.937 2.967 2.986

0.995 27.01 23.931 27.633 30.651 34.858 33.292 32.661 p Fˆ_1.1⁻¹(p) Fˆ_1.2⁻¹(p) Fˆ_1.3⁻¹(p) Fˆ_1.4⁻¹(p) Fˆ_1.5⁻¹(p) Fˆ_1.6⁻¹(p) Fˆ_1.7⁻¹(p)

0.9 1.522 1.524 1.498 1.496 – – –

0.95 2.951 3.053 3.158 3.153 3.135 3.082 3.064

0.995 33.905 30.816 28.667 28.766 29.072 30.157 30.588 p Fˆ_1.8⁻¹(p) Fˆ_1.9⁻¹(p)

0.9 – –

0.95 3.105 3.088 0.995 29.597 30.048

Tabela 2: O mesmo que da Tabela 1, agora para o caso da amostra de tamanho 2000.

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.582 0.680 0.736 0.723 0.846 0.778 0.796 0.834 βˆ 0.565 0.503 0.515 0.599 0.529 0.707 0.753 0.781

excedentes 133 120 102 85 77 62 55 49

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 0.792 0.875 0.867 1.000 1.272 1.262 0.960 1.031 βˆ 0.955 0.862 0.952 0.785 0.54 0.674 1.332 1.256

excedentes 42 40 36 35 34 29 23 22

p F⁻¹(p) Fˆ_0.5⁻¹(p) Fˆ_0.6⁻¹(p) Fˆ_0.7⁻¹(p) Fˆ_0.8⁻¹(p) Fˆ_0.9⁻¹(p) Fˆ₁⁻¹(p)

0.9 1.281 1.245 1.202 1.182 1.187 1.175 1.165

0.95 2.174 2.099 2.011 1.970 1.979 1.895 1.935

0.995 11.484 9.351 10.161 10.729 10.594 11.651 11.174 p Fˆ_1.1⁻¹(p) Fˆ_1.2⁻¹(p) Fˆ_1.3⁻¹(p) Fˆ_1.4⁻¹(p) Fˆ_1.5⁻¹(p) Fˆ_1.6⁻¹(p) Fˆ_1.7⁻¹(p)

0.9 1.174 1.200 – – – – –

0.95 1.926 1.905 1.913 1.901 1.908 1.914 1.905

0.995 11.242 11.474 11.371 11.579 11.515 11.819 13.151 p Fˆ_1.8⁻¹(p) Fˆ_1.9⁻¹(p)

0.9 – –

0.95 1.910 1.900 0.995 13.054 12.205

Tabela 3: O mesmo que da Tabela 1, para o caso da amostra de tamanho 500, gerada pela fun¸c˜ao de distribui¸c˜aoF^comp(·), definida em (115).

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.486 0.539 0.594 0.680 0.738 0.780 0.846 0.725 βˆ 0.625 0.603 0.586 0.547 0.555 0.586 0.595 0.817

excedentes 651 578 511 454 391 335 292 242

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 0.629 0.702 0.542 0.501 0.477 0.422 0.348 0.339 βˆ 1.033 0.976 1.348 1.497 1.610 1.822 2.133 2.204

excedentes 209 195 167 153 142 130 118 112

p F⁻¹(p) Fˆ_0.5⁻¹(p) Fˆ_0.6⁻¹(p) Fˆ_0.7⁻¹(p) Fˆ_0.8⁻¹(p) Fˆ_0.9⁻¹(p) Fˆ₁⁻¹(p)

0.9 1.281 1.497 1.464 1.436 1.400 1.381 1.372

0.95 2.174 2.413 2.363 2.314 2.247 2.206 2.179

0.995 11.484 9.025 9.468 9.941 10.787 11.432 11.899 p Fˆ_1.1⁻¹(p) Fˆ_1.2⁻¹(p) Fˆ_1.3⁻¹(p) Fˆ_1.4⁻¹(p) Fˆ_1.5⁻¹(p) Fˆ_1.6⁻¹(p) Fˆ_1.7⁻¹(p)

0.9 1.365 1.367 – – – – –

0.95 2.139 2.212 2.269 2.232 2.297 2.309 2.314

0.995 12.643 11.433 10.786 11.205 10.464 10.347 10.293 p Fˆ_1.8⁻¹(p) Fˆ_1.9⁻¹(p)

0.9 – –

0.95 2.305 2.263 0.995 10.235 10.246

Tabela 4: O mesmo que da Tabela 1, para o caso da amostra de tamanho 2000, gerada pela fun¸c˜ao de distribui¸c˜aoF^comp(·), definida em (115).

1.0 para a amostra den= 500 pontos da fun¸cão F^comp+ruido(·), 1.3 para amsotra de n= 2000 pontos da fun¸cão F^comp+ruido(·), 1.5 para amsotra de n= 500 pontos da fun¸cão F^comp(·), 1.3 para amsotra de n= 2000 pontos da fun¸cão F^comp(·).

A tabela acima confirma que o limiar ótimo produzido pelo método fi-cou bem próximo ao valor 1.281. Proximidade que melhora com aumento do tamanho de amostra – fato também esperado.

Já falando sobre o mesmo assunto mas para o caso da fun¸cãoF^comp+ruido(·), deve-se lembrar que esta recebeu um ru´ıdo que “passou” pelo ponto de solda 1.281. Por isto não sabemos o valor exato do limiar ótimo, que o método POT devia descobrir se tudo funcionasse perfeitamente. Só podemos alegar que este deve estar perto de 1.281, o que está de acordo com os resultados do método apresentados na tabela acima.

O que mais esperávamos do método POT? Bem, esperávamos também que ele acertasse o verdadeiro valor do parâmetroξ; que é 0.7 tanto para a fun¸cão F^comp+ruido(·) quanto paraF^comp(·). O acerto depende de muito fatores, entre os quais está a escolha correta do limiar ótimo. Conforme explicado na Se¸cão 7, os valores do limiar menores que o ótimo levam o método a utilizar pontos amostrais at´ıpicos para a cauda, enquanto que os valores maiores que o ótimo causam a diminui¸cão da quantidade dos pontos da amostra com base nos quais o método calcula suas estimativas. Esta influência da escolha do valor do limiar ótimo nos fez executar o método para diversos valores do limiar, mesmo para aqueles que não seriam identificados como ótimos pelo próprio método.

Os resultados estão apresentados nas Tabelas 1-4. As tabelas mostram uma relativa estabilidade da estimativa do parâmetro ξ. Como é de se esperar, pelas razões expostas acima, a estimativa é ruim quando o limiar fica bem abaixo do valor 1.281. Nota-se ainda que nas Tabelas 1 e 2 as estimativas ˆξ do verdadeiroξfica bem acima de 0.7 para todos os valores do limiaru. Isto é consequência da presen¸ca da fun¸cãoL(·) na defini¸cão da fun¸cãoF^comp+ruido(·).

Conforme notado no fim da Sub-se¸cão 8.1.2, a presen¸ca deL(·) fez com que a cauda direita da fun¸cãoF^comp+ruido(·) ficasse mais “pesada” que a da fun¸cão F^comp(·), o que foi captado pelo método POT, que, como se vê nas Tabelas 1-4, produziu uma estimativa para o parâmetroξmenor no caso deF^comp(·) que no caso F^comp+ruido(·). Afirmamos que o método captou a diferen¸ca de peso da cauda, pois, conforme as explica¸cões da Sub-se¸cão 4.4, é o parâmetroξ que corresponde ao peso da cauda estimada. Esta afirma¸cão, porém, contradiz a

No documento “Peaks-over-Threshold” na estimac ¸ ˜ ao de risco; uma exposic ¸˜ ao abragente, (páginas 112-132)