• Nenhum resultado encontrado

Aplica¸c˜ao do m´etodo POT para amostras geradas das

8 Exemplos de aplica¸ c˜ ao do m´ etodo POT

Nesta se¸c˜ao exibiremos o funcionamento do m´etodo POT para diversos con-juntos de dados. Um desses concon-juntos – aquele tratado na Sub-se¸c˜ao 8.3 – provˆem de um caso real. O tratamento deste conjunto pelo m´etodo POT fornece uma resposta n˜ao muito precisa, o que ocorre freq¨uentemente nos casos reias. Este fato precisa ser explicado. Para que possamos expˆor e discutir suas raz˜oes, analizaremos o funcionamento do m´etodo POT em conjuntos de dados artificiais, criados a partir de fun¸c˜oes de distribui¸c˜ao adequadamente escolhi-das. As an´alises destes conjuntos formam Sub-se¸c˜oes 8.1 e 8.2, que antecipam, por raz˜oes did´aticas, a Sub-se¸c˜ao 8.3, que trata o caso real.

8.1 Aplica¸c˜ao do m´etodo POT para amostras geradas das fun¸c˜oes

valores dex suficientemente grandes, sua “cara” ´e

F¯(x) (que ´e a nota¸c˜ao para 1−F(x)) =x−αL(x), (109) para algum α >0,

ondeL(·) ´e alguma fun¸c˜ao de varia¸c˜ao lenta. O segundo grupo ´e chamado de dom´ınio de atra¸c˜ao das distribui¸c˜oes de Weibull. As fun¸c˜oes deste grupo possuem cauda direita finita, e para os valores suficientemente pr´oximos ao fim da cauda, xF, a “cara” dos elementos deste grupo ´e

F¯(xF −x−1) =x−αL(x), x↑ ∞, para algum α >0, (110) onde L(·) ´e alguma fun¸c˜ao de varia¸c˜ao lenta (na f´ormula acima x ´e uma vari´avel auxiliar: conforme esta cresce ao ∞, o argumento de ¯F aproxima-se de xF). O terceiro e ´ultimo grupo ´e chamado dom´ınio de atra¸c˜ao da distribui¸c˜ao de Gumbel. Este grupo cont´em tanto fun¸c˜oes com caudas finitas quanto com caudas infinitas. As fun¸c˜oes deste grupo s˜ao caraterizadas pelo seguinte comportamento caudal:

F¯(x) =h(x) exp

− Z x

z

g(t) a(t)dt

, para x∈(z, xF), (111) onde as fun¸c˜oes envolvidas nesta express˜ao devem satisfazer as condi¸c˜oes descritas ap´os a f´ormua (42) da sub-se¸c˜ao 5.4.

(O conte´udo do ´ultimo lembrete ´e uma sucinta reprodu¸c˜ao da exposi¸c˜ao do

´ıtem (IV) da Sub-se¸c˜ao 5.4.)

Ent˜ao, qual dentre as trˆes condi¸c˜oes , (109), (110) e (111), atender´a a fun¸c˜ao-teste que construiremos? A condi¸c˜ao (111) parece ser bastante com-plicada. Vamos nos deixar levar por esta impress˜ao e descartar esta condi¸c˜ao – mas s´o no ˆambito da presente sub-se¸c˜ao, pois entender o funcionamento do m´etodo POT para as fun¸c˜oes satisfazendo esta condi¸c˜ao ´e muito importante;

isto ser´a provado na pr´oxima sub-se¸c˜ao. Assim, pela via errada da recusa injustificada da condi¸c˜ao (111), nos restou escolher entre (109) e (110). Fi-caremos com a primeira delas, uma vez que esta aplica-se `as fun¸c˜oes com cauda infinita (lembre-se, na Sub-se¸c˜ao 4.3 explicamos o motivo do nosso interesse maior pelas fun¸c˜oes com cauda infinita).

8.1.1 Constru¸c˜ao de fun¸c˜oes-teste

Como prometido, vamos construir uma fun¸c˜ao que satisfa¸ca a condi¸c˜ao (109).

Esta ser´a denominada porFcomp+ruido(·); um nome que pode parecer estranho, que indica que ela ´e composta de duas fun¸c˜oes distintas e que h´a um ru´ıdo que distorce estas fun¸c˜oes. Antes de come¸carmos com a descri¸c˜ao da constru¸c˜ao, vale lembrar que pretendemos “criar” Fcomp+ruido(·) com o objetivo de us´a-la para construir uma amostra que ser´a fornecida ao m´etodo POT; do qual pediremos sua estimativa da cauda, que ser´a comparada com a verdadeira cauda deFcomp+ruido(·). Agora lembre-se de que o m´etodo POT aproxima a cauda `a direita de um limiar que ele pr´oprio determina com base no seguinte crit´erio: a distribui¸c˜ao dos excessos dos pontos da amostra que excederam este limiar deve ser parecida com uma distribui¸c˜ao de Pareto generalizada (GPD -foi a abrevia¸c˜ao). Foi justamente isso que nos motivou a comporFcomp+ruido(·) de duas partes: ela ´e parecida com a distribui¸c˜ao Normal Padr˜ao at´e o ponto s = 1.281, e da´ı adiante ´e semelhante a uma GPD re-escalada e deslocada.

Note que dissemos “parecida/semelhante” e n˜ao “igual”, pois tanto a GPD quanto uma parte da distribui¸c˜ao Normal s˜ao “distorcidas” por um ru´ıdo (este ru´ıdo corresponde `a fun¸c˜ao de varia¸c˜ao lenta). Tudo isso garante que os excessos da amostra acima dos limiares maiores que s = 1.281 s˜ao quase que da distribui¸c˜ao de Pareto generalizada (por causa da presen¸ca do ru´ıdo, tais excessos n˜ao s˜ao exatamente os de uma GPD). Isto nos permite testar a sensibilidade do m´etodo POT na presen¸ca de um ru´ıdo. ´E bom ressaltar que com a ausˆencia do ru´ıdo, o ponto 1.281 ´e o melhor valor para o limiar a partir do qual o m´etodo POT aproximaria a cauda. Nosso desejo ´e saber se o m´etodo adivinha este valor, e se o ru´ıdo atrapalhar´a muito esta adivinha¸c˜ao.

Chamamos a aten¸c˜ao do leitor que para julgar a influˆencia do ru´ıdo no funcionamento do m´etodo POT – a investiga¸c˜ao que pretendemos fazer – ´e necess´ario executar os mesmos testes na fun¸c˜ao sem ru´ıdo. ´E este o trajeto. A fun¸c˜ao denotada porFcomp(·), que aparecer´a abaixo, ´e a fun¸c˜aoFcomp+ruido(·) sem a presen¸ca do ru´ıdo.

Passaremos agora `a descri¸c˜ao matem´atica da constru¸c˜ao das fun¸c˜oes de distribui¸c˜aoFcomp+ruido(·) eFcomp(·). Os leitores que entenderam a descri¸c˜ao informal da estrutura destas fun¸c˜oes, dada acima, podem omitir esta parte matem´atica.

No primeiro passo tomamos a fun¸c˜ao de distribui¸c˜ao normal padr˜ao Φ(x) = 1

√2π Z x

−∞

e−y

2

2 dy, x∈R, (112)

e eliminamos sua cauda a partir do ponto com abcissa 1.281. Recordamos que Φ(1,281)≡ √

−1Z 1,281

−∞

e−y2/2dy= 0,9. (113) Portanto, a cauda eliminda era a parte do gr´afico `a direita do ponto (1.281; 0.9).

No segundo passo usamos a parte “n˜ao chata” da fun¸c˜ao de distribui¸c˜ao de Pareto “pura”

Fpura(x) =





0, parax < s,

1−

1 +ξ(x−s)β 1ξ

, parax≥s, (114)

com os valores dos parˆametros ξ= 0.7, β = 1.0, s= 1.281, para repor a cauda eliminada no primeiro passo. Para isto a fun¸c˜aoFpura(·) foi contra´ıda 1−0.9 = 0.1 vezes, e sua parte `a direita de 1.281 levantada por 0.9. Tudo isto nos deu:

Fcomp(x) =





Φ(x), parax≤s,

(1−d) 1−

1 +ξ(x−s) β

1ξ!

+d, parax≥s,(115) onde aξ atribu´ımos o valor 0.7;

onde aβ atribu´ımos o valor 1.0;

onde asatribu´ımos o valor 1.281;

onde ad atribu´ımos o valor 0.9.

O terceiro passo da constru¸c˜ao consiste em distorcer o gr´afico deFcomp(·) `a direita da abcissa 1.0. Notamos que o “come¸co da distor¸c˜ao”, ou seja, o ponto 1.0, ´e menor ques= 1.281, o que faz com que a distor¸c˜ao aja tamb´em no ponto (1.281,0.9), que ´e o ponto de solda de partes de Φ(·) e de Fpura(·). Isto deve dificultar o processo de estabelicimento do limiar ´otimo pelo m´etodo POT.

A distor¸c˜ao ´e dada pelo seguinte procedimento. Primeiramente, definimos a fun¸c˜ao de sobrevivˆencia correspondente a Fcomp(·):

comp(x) := 1−Fcomp(x), x∈R. (116) Depois tomamos a fun¸c˜ao

L(x) :=

1, quandox <1,

log(x+ 1.71), quandox≥1. (117)

(Note queL(1) = log(1+1.71)≈log(e) = 1, o que garante queL(·) ´e cont´ınua no pontox = 1. Esta continuidade ´e o que determina a suavidade da fun¸c˜ao Fcomp+ruido(·) no ponto x= 1. Sem esta suavidade, por´em, todos os argumen-tos e procedimenargumen-tos funcionariam sem que precisassem ser alterados. ) Ap´os isso, definimos uma nova fun¸c˜ao de sobrevivˆencia

comp+ruido(x) := ¯Fcomp(x)×L(x), x∈R. (118) Nossa fun¸c˜ao L(·) foi escolhida de maneira a garantir que esta fun¸c˜ao de so-brevivˆencia atenda as trˆes condi¸c˜oes seguintes:

comp+ruido(·) ´e n˜ao decrescente, limx→∞comp+ruido(x) = 0, limx→−∞comp+ruido(x) = 1.

Estas condi¸c˜oes garantem que quando definimos a fun¸c˜aoFcomp+ruido(·) pela equa¸c˜ao

Fcomp+ruido(x) := 1−F¯comp+ruido(x), x∈R, (119) ela seja uma leg´ıtima fun¸c˜ao de distribui¸c˜ao. Para a completude da apre-senta¸c˜ao escreveremos sua express˜ao exata:

Fcomp+ruido(x) =













Φ(x), x≤1,

1−log(x+ 1.71)× {1−Φ(x)}, x∈(1, s), 1−log(x+ 1.71)×

× (

1−(1−d) 1−

1 +ξ(x−s) β

1ξ!

−d )

, x≥s, onde a ξ atribu´ımos o valor 0.7;

onde a β atribu´ımos o valor 1.0;

onde a satribu´ımos o valor 1.281;

onde a d atribu´ımos o valor 0.9. (120) Ufa! Terminamos a constru¸c˜ao das t˜ao desejadas fun¸c˜oes de distribui¸c˜ao Fcomp+ruido(·) e Fcomp(·). Agora o programa ´e: usar estas fun¸c˜oes de dis-tribui¸c˜oes para gerar amostras; aplicar `as amostras o m´etodo POT com o ob-jetivo de estimar as caudas das respectivas fun¸c˜oes de distribui¸c˜ao e, analizar a eficiˆencia do m´etodo, compararando os resultados do ponto de vista de suscep-tibilidade destes `a presen¸ca do ru´ıdo. Mas antes de prosseguirmos na execu¸c˜ao

deste programa ´e bom lembrar, com base no come¸co da presente sub-se¸c˜ao, que queremos construir fun¸c˜oes de distribui¸c˜ao que satisfa¸cam a condi¸c˜ao (109).

Como se prova queFcomp+ruido(·) e Fcomp(·) de fato a satisfazem? Faremos isto paraFcomp(·) e deixamos outro caso para o leitor. Temos ent˜ao, que para xmaiores que s,

comp(x) = 1−Fcomp(x)

= 1− (

(1−d) 1−

1 + ξ(x−s) β

1ξ! +d

)

= (1−d) 1−

1 +ξ(x−s) β

1ξ!

= x1ξ ×

(1−d) 1−

1 +ξ(x−s) β

1ξ!

x1ξ

.

Portanto ¯Fcomp(x) satisfaz (109) com α = 1/ξ e L(x) igual ao fator que multiplicax1ξ na ´ultima linha da conta acima (deixamos para leitor a prova de que este fator de multiplica¸c˜ao ´e uma fun¸c˜ao de varia¸c˜ao lenta).

8.1.2 Gera¸c˜ao de amostras

A gera¸c˜ao de uma amostra baseia-se em um fato conhecido que diz que se F(·) ´e uma fun¸c˜ao de distribui¸c˜ao qualquer, e R ´e uma vari´avel aleat´oria uniformamente distribu´ıda no intervalo [0,1], ent˜ao F−1(R) – o resultado da aplica¸c˜ao da fun¸c˜ao inversa aF(·) aR– ´e uma vari´avel aleat´oria cuja fun¸c˜ao de distribui¸c˜ao ´e a pr´opriaF(·). Portanto, para gerar uma amostra denpontos de uma dadaF(·), basta produzirnrealiza¸c˜oesr1, . . . , rnda distribui¸c˜ao uniforme em [0,1] e ent˜ao aplicar F−1(·) a cada uma das realiza¸c˜oes. Feito isso, o conjunto de valoresF−1(r1), F−1(r2), . . . , F−1(rn) corresponde a uma amostra aleat´oria gerada pela distribui¸c˜aoF(·).

No processo de gera¸c˜ao de amostra descrito acima h´a um passo delicado, o de como encontrar F−1(r) dados r e F(·). O empecilho ´e a ausˆencia de uma express˜ao anal´ıtica simples para a inversa das fun¸c˜oes Fcomp+ruido(·) e Fcomp(·). Este fato nos obrigou a calcularF−1(ri) como solu¸c˜ao da equa¸c˜ao F(x)−ri = 0, por interm´edio de um m´etodo num´erico apropriado. O c´odigo

−3 1

−3 1

−3 1

Figura 21: Esta figura apresenta a fun¸c˜ao de distribui¸c˜ao amostral correspondente a amostra den= 500 pontos, gerada pela fun¸c˜aoFcomp+ruido(·) definida em (120). Na figura da esquerda esta fun¸c˜ao ´e apresentada por sua fun¸c˜ao de distribui¸c˜ao amostral.

E a fun¸c˜´ ao escada que sobe um degrau de altura 1/nem cada valor da amostra. Na figura da direita as posi¸c˜oes dos espelhos desta fun¸c˜ao-escada est˜ao marcadas com pontos; a proje¸c˜ao de cada ponto no eixo das abcissas ´e o valor do correspondente ponto da amostra.

−3 0 1

−3 0 1

Figura 22: Esta figura apresenta a fun¸c˜ao de distribui¸c˜ao amostral correspondente a amostra de tamanhon= 500, gerada da fun¸c˜aoFcomp(·), definida em (115). Veja a descri¸c˜ao da Figura 21 para a explica¸c˜ao da constru¸c˜ao desta fun¸c˜ao.

do programa que realiza este m´etodo ´e apresentado na Sub-se¸c˜ao 11.1, que o leitor pode encontrar no Apˆendice 11.

O m´etodo descrito acima foi utilizado para gerar duas amostras de cada uma das fun¸c˜oes de distribui¸c˜oes Fcomp+ruido(·) e Fcomp(·); uma amostra de n = 500 pontos e outra de n = 2000 pontos. Elas s˜ao apresentadas nas Figuras 21 e 22.

E interessante notar que a amostra da fun¸c˜ao´ Fcomp+ruido(·) ´e mais esticada

`a direita que a de Fcomp(·), uma observa¸c˜ao natural, que se deve `a presen¸ca da fun¸c˜ao de varia¸c˜ao lenta, L(·), na constru¸c˜ao de Fcomp+ruido(·) e ao fato de L(·) ser crescente e maior que 1. Com a multiplica¸c˜ao por L(·) a cauda direita de ¯Fcomp+ruido(·) ficou acima da de ¯Fcomp(·). Isto fez com que a cauda direita deFcomp+ruido(·) ´e mais grossa que a de Fcomp(·), o fato evidenciado por amostras obtidas.

8.1.3 Aplica¸c˜ao do m´etodo POT

A aplica¸c˜ao do m´etodo POT come¸ca, conforme a constru¸c˜ao do mesmo apre-sentada na Sub-se¸c˜ao 7.1, com o estabelecimento do limiar ´otimo – a quantia denotada por uopt. Para tal ´e preciso construir a fun¸c˜ao da m´edia amostral de excessos e analisar seu gr´afico, buscando identificar a menor abcissa onde, dela adiante, o gr´afico seja similar ao de uma reta com tangente n˜ao-negativa.

Na Sub-se¸c˜ao 11.3 do Apˆendice apresentamos o c´ogido que produz a fun¸c˜ao da m´edia amostral de excessos. Os gr´aficos desta fun¸c˜ao, relativos `as amostras de n= 500 en= 2000 pontos originados da fun¸c˜aoFcomp+ruido(·) de (120), est˜ao na Figura 23. J´a para as originadas da fun¸c˜ao Fcomp(·) de (115), os gr´aficos est˜ao na Figura 24.

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

4 6 8 10

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

4 6 8 10

Figura 23: A fun¸c˜ao da m´edia amostral de excessos correspondente `as amostras originadas da fun¸c˜aoFcomp+ruido(·) definida em (120). Esquerda: a amostra den= 500 pontos; direita: a amostra den= 2000 pontos. Certamente o dom´ınio da fun¸c˜ao estende-se `a maior obsreva¸c˜ao da amostra, mas n´os n˜ao apresentamos toda a fun¸c˜ao pelas raz˜oes mencionadas no texto.

0.0 0.5 1.0 1.5 2.0 2.5 3.0 1

2 3 4 5 6 7

0.0 0.5 1.0 1.5 2.0 2.5 3.0 2

3 4 5 6 7

Figura 24: A fun¸c˜ao da m´edia amostral de excessos correspondente `as amostras originadas da fun¸c˜ao Fcomp(·) definida em (115). Esquerda: a amostra de n= 500 pontos; direita: a amostra den= 2000 pontos.

A identifica¸c˜ao da regi˜ao onde a fun¸c˜ao da m´edia amostral de excessos

´e aproximadamente linear envolve mais arte de que ciˆencia, no sentido de que cada caso ´e um caso. Para cada regra gen´erica que definirmos sempre haver´a um milh˜ao de excess˜oes. Uma das principais dificuldades desta tarefa reside no fato de a fun¸c˜ao da m´edia amostral de excessos se parecer com uma serra, cujos dentes crescem conforme o gr´afico se move `a direita. Para lidar adequadamente com este fenˆomeno ´e preciso lembrar que a fun¸c˜ao da m´edia de excessos de uma fun¸c˜ao de distribui¸c˜ao (e n˜ao a fun¸c˜ao da m´edia amostral de excessos) deve ser linear caso a cauda desta distribui¸c˜ao seja Pareto – isto ´e uma fato rigorosamente provado –, ou aproximadamente linear, caso a cauda seja Pareto com um ru´ıdo fraco (que pode ser enquadrado numa fun¸c˜ao de varia¸c˜ao lenta) – isto ´e uma cren¸ca. J´a a fun¸c˜ao da m´edia amostral de excessos ´e uma aproxima¸c˜ao da fun¸c˜ao da m´edia de excessos, pois a fun¸c˜ao da m´edia amostral de excessos provˆem de uma amostra. O ponto aqui ´e ent˜ao que a linearidade, que tentamos identificar, refere-se `a fun¸c˜ao da m´edia de excessos, que ´e desconhecida, e da qual s´o temos uma aproxima¸c˜ao, a fun¸c˜ao da m´edia amostral de excessos. Este aspecto faz com que a regi˜ao de “dentes grandes” seja exclu´ıda da an´alise da linearidade, uma vez que o tamanho de dentes corresponde ao espa¸camento dos pontos da amostra, e onde os pontos da amostra s˜ao espar¸cos, a aproxima¸c˜ao da fun¸c˜ao de m´edia de excessos pela fun¸c˜ao da m´edia amostra de excessos ´e pobre. Com isto em mente na an´alise dos gr´aficos da Figura 23, decidimos num primeiro momento que no caso da

amostra de n = 500 pontos, retirada da fun¸c˜ao Fcomp+ruido(·), a linearidade

“come¸ca” na abcissa 1, enquanto que no caso da amostra den= 2000 pontos, este “come¸co” se d´a em 1.3. Conseq¨uentemente, assumiremos que o limiar

´otimo, uopt, ´e 1 para a amostra de n= 500 pontos e ´e 1.3 para a amostra de n= 2000 pontos.

A determina¸c˜ao do limiar ´otimo em todos os quatro casos foi facilitada pelo fato da fun¸c˜ao da m´edia amostral de excessos apresentar uma concavidade no seu come¸co. Esta concavidade ´e bem n´ıtida e ainda ocorre na regi˜ao onde os pontos da amostra s˜ao densos. Isto permite concluir que a fun¸c˜ao da m´edia de excessos ´e cˆoncova nesta regi˜ao, e, portanto, nela n˜ao pode se encontrar o limiar ´otimo.

Existem ainda diversas regras folcl´oricas que auxiliariam na determina¸c˜ao do limiar ´otimo em casos reais, mas que n˜ao utilizamos aqui. Uma delas ´e que uma fun¸c˜ao de distribui¸c˜ao de uma fonte real de aleatoriedade teria o come¸co da sua cauda no ponto que separa os 10%-15% maiores valores da amostra dos demais valores. Crˆe-se que `a esquerda e `a direita deste ponto a fun¸c˜ao de distribui¸c˜ao tenha comportamentos distintos. Ali´as, para n˜ao ir contra esta cren¸ca, constru´ımos as fun¸c˜oesFcomp+ruido(·) eFcomp(·) no formato acordado com ela:

(i) o valor 1.281 foi escolhido para garantir que `a direita dele haja aproxi-madamente 10% do todo o volume de cada distribui¸c˜ao;

(ii) ambas as distribui¸c˜oes foram concebidas de modo que `a esquerda de 1.281 elas sejam quase normais, e `a direita de 1.281 elas sejam quase Pareto.

A mesma cren¸ca acima referida faz com que em casos reais de aplica¸c˜ao do m´etodo POT os valores muito pr´oximos dos maiores pontos de amostra sejam descartados como candidatos a limiar ´otimo. ´E por isto que para tais valores n˜ao ´e costume se analisar o comportamento da fun¸c˜ao da m´edia amostral de excessos. Foi por esta raz˜ao que nos quatro casos considerados aqui os gr´aficos desta fun¸c˜ao foram cortados no ponto 3.0 (veja Figuras 23 e 24), apesar da fun¸c˜ao continuar at´e o ponto m´aximo de cada amostra.

Uma outra cren¸ca diz que para que o m´etodo POT adivinhe bem a cauda de uma distribui¸c˜ao ´e necess´ario que haja no m´ınimo 400 pontos da amostra `a direita do limiar ´otimo. ´E claro que este quesito nem sempre pode ser atendido, devido ao tamanho da amostra, mas esta cren¸ca ´e uma outra raz˜ao para o corte dos gr´aficos da fun¸c˜ao da m´edia amostral de excessos antes do seu fim (como explicado no fim do par´agrafo anterior). Tamb´em, pagando o tributo a esta

cren¸ca, os estat´ısticos custumam reportar o n´umero de excedentes31 `a direita do limiar ´otimo usado na execu¸c˜ao do m´etodo POT. Tamb´em fizemos isto nas Tabelas 1-4 desta sub-se¸c˜ao e nas tabelas semelhantes das outras sub-se¸c˜oes.

Uma vez determindao o valor do limiar ´otimo, o pr´oximo passo do m´etodo POT ´e calcular estimativas dos parˆametrosξeβda GPDGξ,β,0(·), que melhor aproxima os excessos da amostra acima do limiar ´otimo. Recordamos, para facilitar a “leitura” das f´ormulas a seguir, que uopt denota o valor do limiar

´otimo, e que ˆξ e ˆβ denotam, respectivamente, as estimativas dos parˆametrosξ eβ, sejam elas boas ou ruins. Relembramos ainda que no ˆambito do presente trabalho estas estimativas s˜ao as fornecidas pelo m´etodo da m´axima verossim-ilhan¸ca. Conforme explicado na Sub-se¸c˜ao 7.3, este m´etodo atribui a ˆξ e ˆβ os valores que maximizam uma express˜ao constru´ıda com base na express˜ao da GPD. Esta constru¸c˜ao ´e um ponto delicado, visto que existem trˆes express˜oes para as GPDs: (10), (11) e (12). Qual delas deve ser usada? No presente caso descartamos o uso de (12), j´a que esta corresponde `as GPDs com cauda finita.

Usar tais GPD’s para aproximar as caudas de nossas fun¸c˜oes Fcomp+ruido(·) e Fcomp(·) n˜ao ´e adequado, conforme explicado no Coment´ario 19. A caudas dessas fun¸c˜oes de distribui¸c˜ao s˜ao infinitas por constru¸c˜ao e, lembrando bem estes passos, suas caudas foram constru´ıdas da GPD do tipo (10) com o valor ξ = 0.7. Seguindo os argumentos apresentados no Coment´ario 19, a GPD que melhor aproxima os excessos da amostra retiradas destas fun¸c˜oes deve ser do tipo (10), isto se o m´etodo POT funcionar corretamente, o que, por sua vez, depende do qu˜ao bem a amostra fornecida ao m´etodo representa a fun¸c˜ao da distribui¸c˜ao cuja cauda o m´etodo tenta aproximar. Ent˜ao, para os casos tratados nesta sub-se¸c˜ao, a pergunta est´a resolvida: usaremos as GPD’s da forma (10) na constru¸c˜ao da express˜ao cujo ponto de m´aximo nos dar´a as estimativas ˆξ e ˆβ. Eis a express˜ao

`(ξ, β) = −N(uopt) logβ− 1

ξ + 1

N(uXopt)

i=1

log

1 + ξ βyi

, (121)

onde: uopt ´e o valor do limiar ´otimo,

N(uopt) ´e o n´umero dos pontos da amostra que excedem uopt, β >0 devido sua interpreta¸c˜ao,

ξ >0 pois a express˜ao foi constru´ıda da (10).

31Recorde, um valor de amostra se chama excedente acima de um valor u, caso ele ´e extritamente maior queu.

Nesse momento fica claro que, para o caso discutido na presente sub-se¸c˜ao, a quest˜ao da constru¸c˜ao da fun¸c˜ao de log-verossimilhan¸ca (quer dizer, da fun¸c˜ao `) foi resolvida gra¸cas ao conhecimento das fun¸c˜oes de distribui¸c˜ao, cujas caudas s˜ao aproximadas pelo m´etodo POT. E nos casos reais, em que este conhecimento pr´evio n˜ao existe, como agimos? Por certo, em tais casos

´e necess´ario antecipar a constru¸c˜ao da fun¸c˜ao de log-verossimilhan¸ca por um teste que indique se a fun¸c˜ao aproximador da cauda deve ter cauda finita, cauda infinita do tipo (10) (chamada tamb´em de cauda polinomial ou cauda pesada) ou ainda cauda infinita do tipo (11) (chamada tamb´em de cauda ex-ponencialou cauda leve). Estes testes n˜ao ser˜ao discutidos no nosso trabalho.

Infelizmente n˜ao h´a uma solu¸c˜ao anal´ıtica para as coordenadas ( ˆξ,β), oˆ ponto onde a fun¸c˜ao (121) assume o valor m´aximo. Comumente, isto leva ao c´alculo aproximado de ˆξ e ˆβ via m´etodos de otimiza¸c˜ao num´erica. Este m´etodo de otimiza¸c˜ao a ser utilizado na procura dos pontos de m´aximo da equa¸c˜ao acima fica a crit´erio do leitor, que pode ter preferˆencia por algum m´etodo espec´ıfico. No presente caso empregamos um m´etodo implementado emscilab 3.0. (o c´odigo do programa est´a na Sub-se¸c˜ao 11.4 apresentada no Apˆendice). Este m´etodo tˆem melhor desempenho quando faz uso das derivadas parciais da express˜ao a ser maximizada. No nosso caso estas derivadas s˜ao:

∂`(ξ, β)/∂ξ = 1 ξ2

N(uXopt)

i=1

log

1 + ξ βyi

1 +1 ξ

NX(uopt)

i=1

yi

β+ξyi, (122)

∂`(ξ, β)/∂β = −N(uopt)

β −

1 +1

ξ

N(uXopt)

i=1

−βyi

ξ(β+ξyi). (123) Notamos que pelo comandooptim(cost,’b’,[l1;l2],[u1;u2],x0)´e feita a chamada ao m´etodo; a componentecostcarrega a express˜ao a ser maximizada juntamente com suas derivadas parciais, a segunda componente,’b’, significa que a busca pelo ponto de m´aximo se dar´a numa caixa onde as duas vari´aveis s˜ao limitadas inferiormente por [l1;l2], e superiormente por [u1;u2]. Os limites inferiores “passam” ao m´etodo de otimiza¸c˜ao a informa¸c˜ao sobre as restri¸c˜oes ξ > 0 e β > 0 mencionadas em (121). Devido ao redondamento da apresenta¸c˜ao de valores no computador, estes limites s˜ao valores positivos muito pequenos, da ordem de 1E−10. J´a os limites superiores foram definidos com um pouco mais de liberdade; escolhemos u1 =u2 = 10. Finalmente, x0 fornece o ponto de partida para a busca do ponto de m´aximo. O nosso interesse

est´a na vari´avel da sa´ıda da fun¸c˜aooptim, que corresponde ao ponto onde a express˜ao assume seu valor m´aximo. Esta vari´avel nos devolve os valores de ˆξ e ˆβ.

A partir de uma amostra de 500 pontos da fun¸c˜aoFcomp+ruido(·) de (120) o c´odigo acima produz ˆξ = 1.118 e ˆβ= 0.931.

Vale a pena lembrar ao leitor a que se referem as estimativas calculadas.

Estas s˜ao estimativas dos valores dos parˆametrosξ e β(uopt) da GPD, que ´e apontada pelo Resultado de Pickands como a fun¸c˜ao-aproximador da fun¸c˜ao da distribui¸c˜ao dos excessos deF(·) acima deuopt; aquiF(·) denota a fun¸c˜ao de distribui¸c˜ao desconhecida, da qual provˆem a amostra – aquela amostra que foi usada para determinar o valor deuopt e encontrar as estimativas ˆξ e ˆβ dos verdadeirosξ eβ(uopt). Este lembrete sugere que seria interessante comparar a fun¸c˜ao da distribui¸c˜ao amostral dos excessos acima de uopt dos valores da amostras com a fun¸c˜ao-aproximador da verdadeira fun¸c˜ao de distribui¸c˜ao de excessos acima deuopt – aquela fun¸c˜ao que seria desconhecida por nos desde que a fun¸c˜aoF(·) fosse desconhecida. Esta compara¸c˜ao pode ser feita a partir da apresenta¸c˜ao da Figura 25. A figura apresenta a aproxima¸c˜ao acima referida para diversos valores do limiaru, um dos quais ´euopt.

A discuss˜ao do par´agrafo anterior tem como um de seus objetivos despertar o leitor para que se lembre que a fun¸c˜ao GPDGξ,ˆβ,0ˆ (·) por si s´o ainda n˜ao ´e a aproxima¸c˜ao da cauda produzida pelo m´etodo POT. Essa aproxima¸c˜ao ´e dada porGˆ

ξ,β,0ˆ (·), obtida da GPDGξ,ˆβ,0ˆ (·) via o procedimento descrito no ´ıtem(C) da nossa estrat´egia de execu¸c˜ao do m´etodo POT (veja a Sub-se¸c˜ao 7.1).

8.1.4 An´alise de resultados

O que esper´avamos do m´etodo POT? Em primeiro lugar esper´avamos que ao receber uma amostra gerada da fun¸c˜ao Fcomp(·), definida em (115), o m´etodo calculasse o limiar ´otimo como sendo 1.281. Como vimos, a parte da fun¸c˜ao `a direita de 1.281 foi feita da distribui¸c˜ao GPD, e, portanto, os excessos da fun¸c˜ao acima de qualquer valor maior que 1.281 tˆem distribui¸c˜ao GPD. Esta propriedade deveria ser “descoberta” pelo m´etodo POT (devido sua constru¸c˜ao), e fazer com que o m´etodo assumisse como limiar ´otimo o ponto 1.281. Recordamos que o valor do limiar ´otimo u foi de

0 30 1

(a)

0 60

1

(b)

0 30

1

(c)

0 60

1

(d)

0 30

1

(e)

0 60

1

(f)

Figura 25: Gr´aficos das fun¸c˜oes de distribui¸c˜ao amostrais correspondentes as amostras de excessos acima de limarupara diversos valores deu(0.6, 1 e 1.2 de cima para baixo na primeira coluna, e 0.8, 1.3 e 1.6 de cima para baixo na segunda col-una). Os excessos s˜ao relativos `a amostra retirada da fun¸c˜ao de distribui¸c˜aoFcomp(·);

e express˜ao desta fun¸c˜ao est´a em (115). A primeira coluna corresponde a amostra de 500 pontos, e a segunda a de 2000 pontos. A primeira amostra esta apresentada na Figura 22. Junto a cada distribui¸c˜ao de excessos est´a apresentada – pela linha potilhada – a GPD escolhida pelo m´etodo POT para aproximar estes excessos. Os122

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.923 0.998 1.137 1.180 1.297 1.118 1.151 1.202 βˆ 0.529 0.540 0.493 0.573 0.571 0.931 0.991 1.004

excedentes 167 144 128 107 94 77 70 65

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 1.260 1.284 1.167 0.892 0.932 0.843 0.859 0.945 βˆ 1.026 1.110 1.491 2.548 2.459 2.991 2.991 2.650

excedentes 60 55 49 42 41 38 37 37

p F−1(p) Fˆ0.5−1(p) Fˆ0.6−1(p) Fˆ0.7−1(p) Fˆ0.8−1(p) Fˆ0.9−1(p) Fˆ1−1(p)

0.9 1.42 1.672 1.616 1.530 1.507 1.458 1.517

0.95 3.01 3.236 3.171 3.047 3.017 2.916 3.098

0.995 27.01 27.670 31.106 38.417 41.255 49.251 38.658 p Fˆ1.1−1(p) Fˆ1.2−1(p) Fˆ1.3−1(p) Fˆ1.4−1(p) Fˆ1.5−1(p) Fˆ1.6−1(p) Fˆ1.7−1(p)

0.9 1.507 1.509 1.510 1.399 – – –

0.95 3.058 3.000 2.940 2.915 3.025 3.281 3.246

0.995 40.239 42.409 45.162 46.400 41.418 34.149 34.901 p Fˆ1.8−1(p) Fˆ1.9−1(p)

0.9 – –

0.95 3.302 3.294 0.995 33.473 33.687

Tabela 1: A primeira tabela cont´em as estimativas dos parˆametros produzidos pelo m´etodo POT da amostra de 500 pontos da fun¸c˜aoFcomp+ruido(·) de (120). A segunda tabela apresenta os valores de quantis da fun¸c˜aoFcomp+ruido(·) (primeira coluna da tabela, onde Fcomp+ruido1

(p) ´e denotado porF1(p) para a economia de espa¸co) e as estimativas fornecidas pelas aproxima¸c˜oes da cauda de Fcomp+ruido(·), produzidas pelo m´etodo POT; ˆFusignifica a fun¸c˜ao-aproximador constru´ıda com o valor do limiar u– na verdade ˆFu(·) ´e a nota¸c˜ao alternativa paraGˆ

ξ,β(u),0d (·), que ´e preferencial por ser muito mais curta.

As entradas tracejadas significam que a respectiva ˆFu1(p) n˜ao faz sentido. ESpeci-ficaremos isto no exemplo de ˆF1.5(0.9). Recorde que devido nossa estrat´egia da ex-ecu¸c˜ao do m´etodo POT, que a fun¸c˜ao-aproximadorGˆ

ξ,β(u),0d (·) vale zero at´e a abcissa u, e d´a um salto de alturaF(u) no ponto u(isto est´a exibido na Figura 18). Isto significa quep-quantis compabaixo de F(u) n˜ao tˆem significado para esta fun¸c˜ ao-estimador (volte `a Figura 18 e veja que qualquer linha horizontal na altura entre 0 e F(u) n˜ao cruza o gr´afico desta fun¸c˜ao). Ent˜ao, ˆF1.5(0.9) n˜ao faz sentido, j´a que F(u)> pquando u= 1.5 e p= 0.9. Agora, esta ´ultima desigualdade pode ser de-duzida da f´ormula da fun¸c˜ao F(·) (que ´e no caso Fcomp+ruido(·), de (120)). Ali´as, F1(0.9) = 1.42 – a informa¸c˜ao contida na segunda coluna da segunda tabela –

123

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.858 0.957 1.029 1.115 1.082 1.065 1.098 1.004 βˆ 0.578 0.545 0.555 0.570 0.719 0.858 0.910 1.200

excedentes 646 576 503 437 369 321 291 254

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2.

ξˆ 0.914 0.918 0.934 0.990 1.012 0.958 0.985 1.029 βˆ 1.534 1.620 1.661 1.582 1.618 1.888 1.893 1.850

excedentes 226 212 201 194 184 170 163 157

p F−1(p) Fˆ0.5−1(p) Fˆ0.6−1(p) Fˆ0.7−1(p) Fˆ0.8−1(p) Fˆ0.9−1(p) Fˆ1−1(p)

0.9 1.42 1.669 1.598 1.555 1.511 1.525 1.528

0.95 3.01 3.166 3.075 3.008 2.937 2.967 2.986

0.995 27.01 23.931 27.633 30.651 34.858 33.292 32.661 p Fˆ1.1−1(p) Fˆ1.2−1(p) Fˆ1.3−1(p) Fˆ1.4−1(p) Fˆ1.5−1(p) Fˆ1.6−1(p) Fˆ1.7−1(p)

0.9 1.522 1.524 1.498 1.496 – – –

0.95 2.951 3.053 3.158 3.153 3.135 3.082 3.064

0.995 33.905 30.816 28.667 28.766 29.072 30.157 30.588 p Fˆ1.8−1(p) Fˆ1.9−1(p)

0.9 – –

0.95 3.105 3.088 0.995 29.597 30.048

Tabela 2: O mesmo que da Tabela 1, agora para o caso da amostra de tamanho 2000.

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.582 0.680 0.736 0.723 0.846 0.778 0.796 0.834 βˆ 0.565 0.503 0.515 0.599 0.529 0.707 0.753 0.781

excedentes 133 120 102 85 77 62 55 49

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 0.792 0.875 0.867 1.000 1.272 1.262 0.960 1.031 βˆ 0.955 0.862 0.952 0.785 0.54 0.674 1.332 1.256

excedentes 42 40 36 35 34 29 23 22

p F−1(p) Fˆ0.5−1(p) Fˆ0.6−1(p) Fˆ0.7−1(p) Fˆ0.8−1(p) Fˆ0.9−1(p) Fˆ1−1(p)

0.9 1.281 1.245 1.202 1.182 1.187 1.175 1.165

0.95 2.174 2.099 2.011 1.970 1.979 1.895 1.935

0.995 11.484 9.351 10.161 10.729 10.594 11.651 11.174 p Fˆ1.1−1(p) Fˆ1.2−1(p) Fˆ1.3−1(p) Fˆ1.4−1(p) Fˆ1.5−1(p) Fˆ1.6−1(p) Fˆ1.7−1(p)

0.9 1.174 1.200 – – – – –

0.95 1.926 1.905 1.913 1.901 1.908 1.914 1.905

0.995 11.242 11.474 11.371 11.579 11.515 11.819 13.151 p Fˆ1.8−1(p) Fˆ1.9−1(p)

0.9 – –

0.95 1.910 1.900 0.995 13.054 12.205

Tabela 3: O mesmo que da Tabela 1, para o caso da amostra de tamanho 500, gerada pela fun¸c˜ao de distribui¸c˜aoFcomp(·), definida em (115).

limiar 0.5 0.6 0.7 0.8 0.9 1 1.1 1.2 ξˆ 0.486 0.539 0.594 0.680 0.738 0.780 0.846 0.725 βˆ 0.625 0.603 0.586 0.547 0.555 0.586 0.595 0.817

excedentes 651 578 511 454 391 335 292 242

limiar 1.3 1.4 1.5 1.6 1.7 1.8 1.9 2

ξˆ 0.629 0.702 0.542 0.501 0.477 0.422 0.348 0.339 βˆ 1.033 0.976 1.348 1.497 1.610 1.822 2.133 2.204

excedentes 209 195 167 153 142 130 118 112

p F−1(p) Fˆ0.5−1(p) Fˆ0.6−1(p) Fˆ0.7−1(p) Fˆ0.8−1(p) Fˆ0.9−1(p) Fˆ1−1(p)

0.9 1.281 1.497 1.464 1.436 1.400 1.381 1.372

0.95 2.174 2.413 2.363 2.314 2.247 2.206 2.179

0.995 11.484 9.025 9.468 9.941 10.787 11.432 11.899 p Fˆ1.1−1(p) Fˆ1.2−1(p) Fˆ1.3−1(p) Fˆ1.4−1(p) Fˆ1.5−1(p) Fˆ1.6−1(p) Fˆ1.7−1(p)

0.9 1.365 1.367 – – – – –

0.95 2.139 2.212 2.269 2.232 2.297 2.309 2.314

0.995 12.643 11.433 10.786 11.205 10.464 10.347 10.293 p Fˆ1.8−1(p) Fˆ1.9−1(p)

0.9 – –

0.95 2.305 2.263 0.995 10.235 10.246

Tabela 4: O mesmo que da Tabela 1, para o caso da amostra de tamanho 2000, gerada pela fun¸c˜ao de distribui¸c˜aoFcomp(·), definida em (115).

1.0 para a amostra den= 500 pontos da fun¸c˜ao Fcomp+ruido(·), 1.3 para amsotra de n= 2000 pontos da fun¸c˜ao Fcomp+ruido(·), 1.5 para amsotra de n= 500 pontos da fun¸c˜ao Fcomp(·), 1.3 para amsotra de n= 2000 pontos da fun¸c˜ao Fcomp(·).

A tabela acima confirma que o limiar ´otimo produzido pelo m´etodo fi-cou bem pr´oximo ao valor 1.281. Proximidade que melhora com aumento do tamanho de amostra – fato tamb´em esperado.

J´a falando sobre o mesmo assunto mas para o caso da fun¸c˜aoFcomp+ruido(·), deve-se lembrar que esta recebeu um ru´ıdo que “passou” pelo ponto de solda 1.281. Por isto n˜ao sabemos o valor exato do limiar ´otimo, que o m´etodo POT devia descobrir se tudo funcionasse perfeitamente. S´o podemos alegar que este deve estar perto de 1.281, o que est´a de acordo com os resultados do m´etodo apresentados na tabela acima.

O que mais esper´avamos do m´etodo POT? Bem, esper´avamos tamb´em que ele acertasse o verdadeiro valor do parˆametroξ; que ´e 0.7 tanto para a fun¸c˜ao Fcomp+ruido(·) quanto paraFcomp(·). O acerto depende de muito fatores, entre os quais est´a a escolha correta do limiar ´otimo. Conforme explicado na Se¸c˜ao 7, os valores do limiar menores que o ´otimo levam o m´etodo a utilizar pontos amostrais at´ıpicos para a cauda, enquanto que os valores maiores que o ´otimo causam a diminui¸c˜ao da quantidade dos pontos da amostra com base nos quais o m´etodo calcula suas estimativas. Esta influˆencia da escolha do valor do limiar ´otimo nos fez executar o m´etodo para diversos valores do limiar, mesmo para aqueles que n˜ao seriam identificados como ´otimos pelo pr´oprio m´etodo.

Os resultados est˜ao apresentados nas Tabelas 1-4. As tabelas mostram uma relativa estabilidade da estimativa do parˆametro ξ. Como ´e de se esperar, pelas raz˜oes expostas acima, a estimativa ´e ruim quando o limiar fica bem abaixo do valor 1.281. Nota-se ainda que nas Tabelas 1 e 2 as estimativas ˆξ do verdadeiroξfica bem acima de 0.7 para todos os valores do limiaru. Isto ´e consequˆencia da presen¸ca da fun¸c˜aoL(·) na defini¸c˜ao da fun¸c˜aoFcomp+ruido(·).

Conforme notado no fim da Sub-se¸c˜ao 8.1.2, a presen¸ca deL(·) fez com que a cauda direita da fun¸c˜aoFcomp+ruido(·) ficasse mais “pesada” que a da fun¸c˜ao Fcomp(·), o que foi captado pelo m´etodo POT, que, como se vˆe nas Tabelas 1-4, produziu uma estimativa para o parˆametroξmenor no caso deFcomp(·) que no caso Fcomp+ruido(·). Afirmamos que o m´etodo captou a diferen¸ca de peso da cauda, pois, conforme as explica¸c˜oes da Sub-se¸c˜ao 4.4, ´e o parˆametroξ que corresponde ao peso da cauda estimada. Esta afirma¸c˜ao, por´em, contradiz a