A quem pedir justificativas s´olidas e rigorosas para a aceita¸c˜ao do Pressu-posto 4 a resposta ser´a honesta: n˜ao h´a. Podemos somente apresentar alguns fatores a favor desta aceita¸c˜ao.
Um fator que incentiva a aceita¸c˜ao do Pressuposto 4. A grosso modo, o Pres-suposto 4 diz que a partir de um determinado valor U a cauda de F(·) ´e praticamente uma GPD reescalada e deslocada. Recusar o pressuposto impli-caria em admitir que a cauda deF(·) ´e uma GPD destorcida por uma fun¸c˜ao Lde varia¸c˜ao lenta (supomos aqui queF(·) est´a no dom´ınio de atra¸c˜ao de uma EVD de Fr´echet e usamos o resultado (40) que afirma que a cauda de F(·) tem esta forma). No entanto vocˆe n˜ao sabe nada sobre L, pois a informa¸c˜ao de que esta possui varia¸c˜ao lenta n˜ao diz nada a respeito da sua forma exata.
Isso lhe obriga a usar m´etodos de estat´ıstica n˜ao param´etrica para adivinhar – nem que seja aproximadamente – a verdadeira forma da cauda. Acontece que a estat´ıstica n˜ao param´etrica funciona bem com amostras grandes, que n˜ao ´e o presente caso, pois, conforme j´a dissemos, a quantidade de pontos da amostra procedentes da cauda ´e pequeno. Este problema ´e eliminado pelo Pressuposto 4, pois ele leva o problema da estima¸c˜ao de cauda para o campo de estat´ıstica param´etrica: o problema da estima¸c˜ao torna-se, basicamente, o problema da estimativa dos parˆametros da fun¸c˜aoG∗ξ,β(u),0(·).
Um outro fator que incentiva a aceita¸c˜ao do Pressuposto 4. A recusa do Pres-suposto 4 leva por ´agua abaixo toda a estrat´egia (A)-(C) tra¸cada na Sub-se¸c˜ao 7.1. Tente inventar outra, no seu lugar, que produza algum estimador para a cauda. Vocˆe ver´a que para que esta funcione ´e inevit´avel assumir alguns pressupostos. Este fato as vezes leva algumas pessoas a sugerir que a melhor op¸c˜ao para executar a id´eia do m´etodo POT ´e seguir a demon-stra¸c˜ao do Resultado de Pickands – uma sugest˜ao l´ıcita decorrente do fato que este resultado ´e a base da id´eia do m´etodo, e que ele n˜ao exige pressupos-tos adicionais, uma vez que foi derivado rigorosamente. Eis ent˜ao a sugest˜ao:
“Deixemos por um instante a quest˜ao de procura dos valores deu e de F(u) e imaginemos que eles s˜ao conhecidos. Ficamos ent˜ao com o problema da estima¸c˜ao de ξ e β(u). Lembremos que estes apareceram no Resultado de Pickands, e que portanto, a demostra¸c˜ao deste deve conter a constru¸c˜ao deξ e β(u). Porque ent˜ao n˜ao usar esta constru¸c˜ao para montar uma estrat´egia de estima¸c˜ao destes parˆametros?” Eis a resposta: “Se a parte pr´atica do m´etodo resolvesse aproveitar das constru¸c˜oes da demostra¸c˜ao do Resultado de Pickands para a estimativa dos parˆametrosξ e β(u), ent˜ao seria dif´ıcil en-contrar a sa´ıda para o seguinte C´ırculo vicioso: por um lado as constru¸c˜oes
fornecem ξ e β(·) s´o depois de serem informadas sobre o comportamento da cauda30 de F(·), por outro lado o comportamento da cauda de F(·) s´o ser´a revelado por seu aproximador,G∗ξ,β(u),0(·) depois que os parˆametros ξ e β(u) forem estimados.”
Ent˜ao dada a dificuldade apresentada, assumiremos o Pressuposto 4. Isso significa (devido a interpreta¸c˜ao do pressuposto dada no par´agrafo imediata-mente depois de sua formula¸c˜ao) que podemos aproximar a cauda de F(·) `a direita de u, para qualquer u ≥U, por G∗ξ,β(u),0(·). Qual seria ent˜ao o mel-hor valor de u? O Resultado de Pickands responde esta pergunta: “Quanto maior u, melhor ´e a precis˜ao da aproxima¸c˜ao.” Isto motivaria a tendˆencia de aumentaru na constru¸c˜ao da solu¸c˜ao do problema de estima¸c˜ao de cauda.
O empec´ılio por´em, mora no fato de que este problema nos fornece apenas uma amostra de valores retiradas deF(·). Tendo em mente que os valores da amostra que excedemuser˜ao aqueles que determinam o formato deG∗ξ,β(u),0(·), chega-se `a conclus˜ao de que o aumento excessivo do limiar diminuiria a pre-cis˜ao da estimativa. De fato o aumento deuresulta na diminui¸c˜ao do n´umero de pontos da amostrax1, . . . , xn que ultrapassam u, e, conseq¨uentemente, na piora da precis˜ao das estimativas dos parˆametros da fun¸c˜aoG∗ξ,β(u),0(·) obti-das com base nestes pontos. Da´ı a necessidade de estabelecer um crit´erio para o valor ´otimo de u. Na estrat´egia (A)-(C) tal valor foi denotado de uopt e definido no ´ıtem(A). O que est´a nas entrelinhas daquela defini¸c˜ao ´e o seguinte crit´erio:
Pressuposto 5. O limiar ´otimo, uopt, isto ´e, o valor `a direita do qual a cauda de F(·) ser´a aproximada pela estrat´egia (A)-(C), ´e a estimativa de U (do Pressuposto 4), isto ´e, a estimativa do menor valor que n˜ao excede a amostra, `a direta do qual a cauda de F(·) e sua fun¸c˜ao aproximador G∗ξ,β(u),0(·) s˜ao praticamente idˆenticas.
Este crit´erio foi chamado de “pressuposto” por n˜ao haver justificativas rig-orosas para tal escolha deuopt a n˜ao ser o bom senso.
Reescreveremos agora o Pressuposto 4 da maneira mais cˆomoda para a aplica¸c˜ao do procedimento estat´ıstico que estabelecer´a o valor deuopt(observe
30Para entender porquˆe ξ depende do comportamento da cauda de F(·), recorde que ξ depende do parˆametro αvia rela¸c˜ao (56), e queαcorresponde a EVD em cujo dom´ınio de atra¸c˜ao encontra-seF(·). Relembre tamb´em que este dom´ınio ´e determinado pelo compor-tamento da cauda deF(·) – sobre isto versa o ´ıtem (IV) da Sub-se¸c˜ao 5.4. J´a para entender porquˆeβ(·) depende do comportamento da cauda deF(·) ´e s´o reler o Coment´ario 16.
que o Pressuposto 5 nos obriga a estimar U, logo a tamb´em empregar um m´etodo estat´ıstico).
Pressuposto 4 reformulado. Existe um limiarU satisfazendo min{x1, . . . , xn} ≤U <max{x1, . . . , xn},
tal que para qualqueru≥U a fun¸c˜ao de distribui¸c˜ao de excessos acima de u, Fu(·), ´e t˜ao pr´oxima de sua fun¸c˜ao-aproximador Gξ,β(u),0(·) que os excessos dos pontos da amostra x1, . . . , xn que ultrapassamupodem ser considerados como se fossem uma amostra gerada porGξ,β(u),0(·).
O problema agora se reduz em estimar o valor de U com base na amostra x1, . . . , xn retirada de F(·). Recordamos que o estimador a ser calculado ´e denotado poruopt e chama-se limiar ´otimo ouvalor ´otimo do limiar. A nossa solu¸c˜ao para este problema baseia-se no Fato apresentado na Sub-se¸c˜ao 7.2.
Combinando o Pressuposto 4-reformulado com a Propriedade decorrente deste Fato, deduzimos que a fun¸c˜ao da m´edia de excessos deFu(·) ´e linear para todo u≥U. Esta cnclus˜ao e o fato da fun¸c˜ao da m´edia amostral de excessos servir como aproxima¸c˜ao para a fun¸c˜ao de m´edia de excessos nos sugere o seguinte
Procedimento-de-trˆes-etapas para identifica¸c˜ao do limiar ´otimo uopt.
Para cadauentre min{x1, . . . , xn}e max{x1, . . . , xn}execute o seguinte procedimento (a)-(b):
(a) Extrair da amostra x1, . . . , xn os valores que s˜ao estritamente maiores que u, e formar a nova amostra de seus excessos acima de u. Para a continuidade da exposi¸c˜ao, introduzimos as nota¸c˜oes: N(u), que denota a quantidade de excedentes da amostra acima deu, e
y1(u), . . . , yN(u)(u) (104) o conjunto ordenado dos excessos. (O super-´ındice “(u)” junto a cada y ´e necess´ario para indicar que a amostra (104) muda de acordo com u.
J´a a ordena¸c˜ao da amostra (104) ´e o que facilitar´a nossa argumenta¸c˜ao abaixo.)
(b)Construir a fun¸c˜ao ˆeu(v),v≥0, seguindo a f´ormula:
ˆ eu(v) =
P
sobre todos osy(u)i ’s maiores quev
yi(u)−v
quantidade deyi(u)’s que s˜ao maiores quev , (105) para 0≤v≤max{x1, . . . , xm} −u,
e testar se esta fun¸c˜ao ´e linear em v.
(c) Definir uopt como o menor valor de u para o qual o teste do ´ıtem (b) obteve resposta positiva.
OProcedimentoacima foi chamado dede-trˆes-etapascom o objetivo de dsit-ing¨u´ı-lo doProcedimentoda Sub-se¸c˜ao 7.2. A diferen¸ca entre os nomes enfatiza a diferen¸ca essencial entre estes dois procedimentos: o que foi definido a pouco vem deuau; para cadauele constr´oi e analisa sua fun¸c˜ao da m´edia amostral de excessos, e determinauopt como o menor valor deupara o qual sua fun¸c˜ao se julga apresentar crescimento linear. J´a o Procedimento da Sub-se¸c˜ao 7.2 constr´oi uma ´unica fun¸c˜ao da m´edia amostral de excessos e determina uopt como a menor abcissa `a direita da qual esta fun¸c˜ao apresenta crescimento lin-ear. Bem, entre os dois, oProcedimento de-trˆes-etapas´e que foi embasado pelo argumento que precede sua formula¸c˜ao. Ent˜ao a nossa obriga¸c˜ao ´e mostrar que oProcedimento de-trˆes-etapase oProcedimentoda Sub-se¸c˜ao 7.2 produzem o mesmouopt. A demonstra¸c˜ao est´a contida no par´agrafo abaixo.
Para facilitar nossos argumentos, assumiremos que x1, . . . , xn designa a amostra ordenada e sem repeti¸c˜oes, ou seja, temos x1 < x2 < · · · < xn−1 <
xn. Recorde que as amostras (104) tamb´em s˜ao ordenadas por defini¸c˜ao, e que n˜ao apresentam repeti¸c˜oes, dado que elas provˆem da amostrax1, . . . , xn. Compararemos agora a fun¸c˜ao ˆe(·) e as fun¸c˜oes ˆeu(·). O que pode obscurecer um pouco a compreen¸c˜ao de nossos argumentos ´e que u designa a vari´avel livre da fun¸c˜ao ˆe(·) e designa um parˆametro com valor fixo no caso de ˆeu(·);
a vari´avel livre desta ´ultima fun¸c˜ao foi denotada por v. Com o objetivo de eliminar a confus˜ao, designaremos por t a vari´avel livre em ambos os casos.
Dessa forma a express˜ao para ˆe(·) torna -se (usamos a express˜ao (91) de ˆe(·) e substitu´ımos nelax(i) porxi, o que ´e leg´ıtimo j´a que assumimos que a amostra x1, . . . , xn´e ordenada):
ˆ e(t) =
( 1 n−k
Xn
i=k+1
xi )
−t, parat∈[xk, xk+1), ek = 1, . . . , n−1. (106) Agora tomaremos u = x1 e aplicaremos `a express˜ao (105) o argumento que t´ınhamos aplicando para derivar (91) de (86). O resultado ser´a:
ˆ ex1(t) =
( 1 n−k
Xn
i=k+1
(xi−x1) )
−t= ( 1
n−k Xn
i=k+1
xi )
−x1−t, (107) parat∈[xk−x1, xk+1−x1), e k= 2, . . . , n−1.
Comparando (106) com (107) ´e f´acil perceber que o gr´afico de ˆe(·) `a direita de x1 ´e congruente ao gr´afico de ˆex1(·) `a direita de 0. A demostra¸c˜ao desta conclus˜ao aplica-se tamb´em ao caso em que u ´e igual ao qualquer ponto da amostrax1, . . . , xn. Portanto tem-se que:
o gr´afico de ˆe(·) `a direita de qualquer pontoxi da amostra
x1, . . . , xn´e congruente ao gr´afico de ˆexi(·) `a direita de 0 (108) Isto prova queuopt determinado peloProcedimento-de-trˆes-etapascoincide com uopt determinado pelo Procedimentoapresentado na Sub-se¸c˜ao 7.2.
8 Exemplos de aplica¸ c˜ ao do m´ etodo POT
Nesta se¸c˜ao exibiremos o funcionamento do m´etodo POT para diversos con-juntos de dados. Um desses concon-juntos – aquele tratado na Sub-se¸c˜ao 8.3 – provˆem de um caso real. O tratamento deste conjunto pelo m´etodo POT fornece uma resposta n˜ao muito precisa, o que ocorre freq¨uentemente nos casos reias. Este fato precisa ser explicado. Para que possamos expˆor e discutir suas raz˜oes, analizaremos o funcionamento do m´etodo POT em conjuntos de dados artificiais, criados a partir de fun¸c˜oes de distribui¸c˜ao adequadamente escolhi-das. As an´alises destes conjuntos formam Sub-se¸c˜oes 8.1 e 8.2, que antecipam, por raz˜oes did´aticas, a Sub-se¸c˜ao 8.3, que trata o caso real.
8.1 Aplica¸c˜ao do m´etodo POT para amostras geradas das fun¸c˜oes