´
otimo do limiar
Nesta sub-se¸c˜ao apresentaremos um dos m´etodos mais utilizados para executar o ´ıtem(A)da estrat´egia tra¸cada na sub-se¸c˜ao anterior.
O m´etodo que pretendemos expor baseia-se em uma propriedade de GPD’s.
Para que possamos formul´a-la precisamos introduzir o conceito de fun¸c˜ao da m´edia de excessos, o que faremos no par´agrafo a seguir.
SejaX uma vari´avel aleat´oria qualquer. A fun¸c˜aoe(·) definida da seguinte maneira
e(u) :=IE
X −uX > u
, u <( o valor m´aximo de X), (76) chama-sefun¸c˜ao da m´edia de excessos deX, ou,27fun¸c˜ao da m´edia de excessos da fun¸c˜aoF(·), se esta ´ultima ´e a fun¸c˜ao de distribui¸c˜ao de X.
Coment´ario 22. Aqui derivaremos a express˜ao para e(·) necess´aria para a demostra¸c˜ao doFatoa seguir. Portanto este coment´ario pode ser omitido por aqueles leitores interessados somente no conte´udo do Fato.
A nota¸c˜aoIE
X−uX > u
significa, conforme a nomenclatura da Teoria de Probabilidades, a esperan¸ca matem´atica da vari´avel aleat´oria (X−u) condi-cionada `a ocorrˆencia do evento{X > u}, ou ainda, em linguagem matem´atica
IE
X−uX > u
= Z ∞
−∞
xdFu(x), (77)
27Poder´ıamos chamar IE
X−uX > u
devalor esperado dos excessos de X acima de u, dado que X ultrapassou u– nome complicado, que n˜ao usaremos adiante.
ondeFu(·) designa a fun¸c˜ao da distribui¸c˜ao condicional de (X −u) dado que ocorreu{X > u}. Vimos que esta fun¸c˜ao possui a forma: Fu(x) =IP
X−u≤ xX > u
. Onde o leitor deve exclamar: “Mas esta express˜ao j´a apareceu no texto na f´ormula (55)!” ´E isso mesmo. A fun¸c˜aoFu(·) ´e nossa velha conhecida, que foi denominada fun¸c˜ao de distribui¸c˜ao de excessos deF(·) acima deu. At´e obtivemos sua express˜ao em termos da fun¸c˜aoF(·). Isso pode ser revisto em (61), uma rela¸c˜ao que nos presenteia com o seguinte fato: se F(·) possuir fun¸c˜ao de densidade f(·), ent˜ao Fu(·) tamb´em tem sua fun¸c˜ao de densidade, que ´e dada pela seguinte f´ormula:
fu(x) =
( 0, sex <0,
f(x+u)
1−F(u), sex≥0. (78)
Juntando (77) e (79), chegamos `a f´ormula e(u) =
Z ∞
0
xf(x+u)
1−F(u) dx, (79)
o que ´e o objetivo do presente coment´ario. Fim do coment´ario.
Voltaremos agora a nossa aten¸c˜ao para o caso em queF(·) ´e uma GPD com s= 0. Neste caso a fun¸c˜ao de densidade deF(·) possui uma express˜ao anal´ıtica que pode ser facilmente calculada (via a deriva¸c˜ao da express˜ao da GPD (10), (11) ou (12)). Usando ent˜ao a f´ormula (79) derivada no Coment´ario 22, pode-mos deduzir a express˜ao para a fun¸c˜ao da m´edia de excessos de uma GPD; eis o resultado (sua demostra¸c˜ao foi “delegada” ao Exerc´ıcio 34):
Fato: Se o parˆametro de forma, ξ, de GPDGξ,β,0(·) satsifaz a condi¸c˜ao
ξ <1 (80)
ent˜ao a fun¸c˜ao da m´edia de excessos dessa GPD ´e dada por:
e(u) = β+ξu
1−ξ (81)
parau∈
(0,+∞), quando 0≤ξ,
(0,−β/ξ), quando 0> ξ, (82)
e(u) = β
1−ξ −u, (83)
parau≤0. (84)
Antes de prosseguirmos com os nossos argumentos, que se apoiam noFato acima, precisamos dar a aten¸c˜ao adequada `as suposi¸c˜oes ξ <1 e s= 0. Im-pusemoss= 0 porque apenas as GPD’s com s= 0 aparecem no Resultado de Pickands, e, conseq¨uentemente, s´o tais GPD’s nos interessar˜ao. A discuss˜ao do porquˆe da limita¸c˜aoξ <1 do pressuposto (81) e no que isto implica ´e mais extensa, e ser´a feita no Coment´ario 26. Para que n˜ao precisemos interromper nossos argumentos com a discuss˜ao da limita¸c˜ao ξ <1, vamos considerar so-mente fun¸c˜oesGξ,β,0(·) cujo parˆametroξ´e menor que 1. Mais ainda, para n˜ao repetirmos os argumentos, referentes aos casos 0≤ξe 0> ξ, vamos considerar apenas fun¸c˜oesGξ,β,0(·) cujo parˆametroξ n˜ao ´e menor que 0 (lembramos que a condi¸c˜ao ξ ≥0 ocorre se e somente se a cauda de Gξ,β,0(·) ´e infinita, e que a Sub-se¸c˜ao 4.3 explicou o motivo do nosso interesse por essas GPD’s).
Destacaremos agora como Propriedade a parte do Fato que ´e o ponto de partida para a constru¸c˜ao do procedimento que determinauopt:
Propriedade: A parte correspondente `as abcissas positivas da fun¸c˜ao da m´edia de excessos, e(u), u >0, de uma GPD Gξ,β,0(·) satisfazendo a condi¸c˜ao ξ <1, ´e uma fun¸c˜ao linear emu com tangente igual a
ξ
1−ξ. (85)
Estamos pr´oximos da constru¸c˜ao do nosso procedimento estat´ıstico. Agora
´e o momento de pensar em como poder´ıamos estimar a fun¸c˜aoe(·) se n˜ao temos em m˜aos a fun¸c˜ao de distribui¸c˜ao F(·) de uma vari´avel aleat´oria X, e se nos
´e dado somente uma amostra x1, . . . , xn de realiza¸c˜oes de X. Nossa sugest˜ao
´e que o aproximador seja a fun¸c˜ao ˆe(·) constru´ıda via a seguinte regra:
ˆ e(u) =
Psobre todos osxi’s maiores queu(xi−u)
quantidade dexi’s que s˜ao maiores queu , (86) para u satisfazendo min{x1, . . . , xn} ≤u <max{x1, . . . , xn}. (87) Esta fun¸c˜ao ser´a chamadafun¸c˜ao da m´edia amostral de excessos da amostra x1, . . . , xn. Tal nome vem do fato de ˆe(u) ser a estimativa mais tradicional para e(u) = IE[X −uX > u] dentre aquelas estimativas constru´ıdas com base em uma amostra deX. De fato, o numerador em (86), que ´e a soma de excessos da amostra acima deu, estima a soma de todos os excessos deX acima de u, enquanto que o denominador de (86) estima o peso de cada excedente
da amostra acima de u sob a condi¸c˜ao de ocrrˆencia do evento {X > u}. Maiores detalhes a respeito da justificativa do porquˆe ˆe(·) estimare(·) podem ser encontradas em qualquer bom livro de estat´ıstica.
Coment´ario 23. Aqui gostar´ıamos de comentar sobre os limites impostos por (87) aos valores deu para as quais ˆe(u) foi definida.
Os limites acima referidos surgem devido ao fato de que ˆe(u) s´o nos inter-essa parau dentro destes limites. Especificamente falando, a informa¸c˜ao que extrairemos de ˆe(·) est´a totalmente contida no intervalo entre o valor m´ınimo e o valor m´aximo da amostra.
A princ´ıpio, os valores de ˆe(·) poderiam ser definidos fora do intervalo acima referido. Estes valores devem estar de acordo com a interpreta¸c˜ao de ˆ
e(u) como a m´edia de excessos acima deu. Apresentamos estes valores abaixo, mas de pronto alertamos que eles n˜ao ser˜ao usados:
ˆ
e(u) = 1 n
Xn
i=1
(xi−u) = 1 n
Xn
i=1
xi − u, parau <min{x1, . . . , xn},(88) ˆ
e(u) = 0, para u≥max{x1, . . . , xn}. (89) Fim do coment´ario.
APropriedadeem combina¸c˜ao com o fato de que ˆe(·) aproximae(·), justifi-cam o procedimento formulado abaixo. Avisamos, por´em, que esta justifica¸c˜ao n˜ao ´e um argumento imediato e simples no caso do ´ıtem(i). A extens˜ao deste argumento nos fez adi´a-lo para a ´ultima sub-se¸c˜ao da presente se¸c˜ao. J´a no caso dos ´ıtens(ii) e (iii), eles seguem facilmente da express˜ao (85).
Procedimento para identifica¸c˜ao do limiar ´otimouopt.
(i) A partir de uma dada amostra x1, . . . , xn de uma fun¸c˜ao de dis-tribui¸c˜ao F(·), construa ˆe(·), a fun¸c˜ao da m´edia amostral de excessos da amostra, via a f´ormula (86). Indo da direita `a esquerda ao longo do gr´afico de ˆe(·), procure o primeiro trecho do gr´afico que n˜ao seja muito irregular e que apresente comportamento aproximadamente linear. De-clare uopt como sendo o valor ´otimo do limiar, a abscissa do extremo esquerdo deste trecho.
(ii)Ainda mais, o conhecimento pr´evio do verdadeiro parˆametroξobriga a procura por um trecho linear horizontal, casoξ= 0,
a procura por um trecho linear crecente, casoξ >0,
a procurar por um trecho linear decrescente, casoξ <0.
(iii)A rec´ıpoca de(ii)vale, especificamente falando, a tangente do trecho linear indica o sinal do verdadeiro ξ:
se houver confian¸ca de que o trecho linear identificado ´e horizontal, ent˜ao pode-se concluir que ξ= 0,
se houver confian¸ca de que o trecho linear identificado ´e crecente, ent˜ao pode-se concluir que ξ >0,
se houver confian¸ca de que o trecho linear identificado ´e decrescente, ent˜ao pode-se concluir que ξ <0; neste caso, por´em, ´e importante conferir se ˆe(·) indica que e(·) toca o eixo das abcissas, pois sen˜ao, a exigˆencia (82) poderia n˜ao ser satisfeita, o que implicaria na im-possibilidade de ξ ser menor que 0.
Coment´ario 24. O ´ultimo ´ıtem da parte (iii) merece uma aten¸c˜ao redobrada.
Ele insinua que a fun¸c˜ao ˆe(·) pode apresentar padr˜ao de fun¸c˜ao decrescente num caso incompat´ıvel com ξ < 0. A que valor de ξ aponta tal comporta-mento? Isso ser´a respondido na Sub-se¸c˜ao 8.2. Fim do coment´ario.
Infelizmente a execu¸c˜ao doProcedimentodescrito acima n˜ao disp˜oe de nen-hum m´etodo quantitativo. Em particular, a “lineridade” n˜ao pode ser formal-izada ou quantificada, e ´e geralmente identificada com base “no olhˆometro”, o que faz com que a eficiˆencia do procedimento dependa da experiˆencia do usu´ario. Algumas dicas ser˜ao dadas nosAspectosabaixo. Para os interessados em adquirir um pouco de experiˆencia nesse ramo, indicamos os exemplos da Se¸c˜ao 8.
Aspectos importantes da execus˜ao mais tradicional do Procedimento.
Antes de enumerarmos os aspectos vamos insistir em um aviso. Resolver o Exerc´ıcio 35 facilitar´a a compreens˜ao da exposi¸c˜ao abaixo. Aos t´opicos.
(1). Come¸car a constru¸c˜ao de ˆe(·) do pontou= 0 ou do ponto min{x1, . . . , xn}? E uma pergunta que surge naturalmente, pois a´ Propriedade considera u >0, enquanto que ˆe(·) foi constru´ıdo a partir de min{x1, . . . , xn}.
Figura 20: A fun¸c˜ao da m´edia amostral, ˆe(·), de uma amostra retirada GPD G0.7,1,0(·). Notamos que a teoria garante que e(·), a fun¸c˜ao da m´edia de excessos desta GPD, ´e uma fun¸c˜ao linear. Isto por´em n˜ao garante a linearidade da fun¸c˜ao ˆe(·), como mostra a presente figura. A raz˜ao disso ´e que ˆe(·) depende da amostra, que pode n˜ao representar perfeitamente a GPD. A figura ilustra tamb´em a irregularidade de ˆe(·) que aumenta conforme se move da esquerda `a direita. Este efeito ´e causado pelo aumento da esparsidade entre pontos da amostra da GPD. Notamos ainda que se formos executar aqu´ı oProcedimento para identifica¸c˜aouopt, concluiremos ent˜ao que uopt = 0, o que ´e coerente com a realidade, pois, conforme dito acima, a fun¸c˜aoe(·)
´e linear a partir da abcissa 0.
Esta fun¸c˜ao tem formato de “serra” explicado no item3dosAspectos de execus˜ao.
Por certo, os dentes da serra s˜ao formados por trechos verticais e trechos inclinados
−45◦. Isso n˜ao se observa na presente figura devida `a diferen¸ca das escalas nos eixos.
Respondemos: o correto ´e come¸car a partir do min{x1, . . . , xn}.
Porem, se vocˆe sabe que a cauda a ser aproximada n˜ao come¸ca antes de um valorV, ent˜ao construa ˆe(·) a partir deV. Geralmente as pessoas definem V = 0, expressando com isto que a cauda, que eles querem aproximar, fica `a direita de zero. O uso de 0 como in´ıcio de ˆe(·) contribui ainda mais para a existˆencia da pergunta acima.
H´a casos nos quais todos os valores de amostra s˜ao positivos. ´E muito comum come¸car a constru¸c˜ao de ˆe(·) a partir de 0 nestes casos. Quando isto ´e feito, a parte de ˆe(·) entre 0 e min{x1, . . . , xn} n˜ao se usa para a execu¸c˜ao do Procedimento para identifica¸c˜ao deuopt. Isto ´e coerente com o conte´udo do Co-ment´ario 23, que afirmou que os valores de ˆe(·) `a esquerda de min{x1, . . . , xn} n˜ao ajudam na capta¸c˜ao do comportamento linear da fun¸c˜aoe(·).
Por fim, devemos confessar que a pergunta acima decorre, em parte, por nossa culpa, pois n˜ao especificamos com a devida clareza como ˆe(·) se relaciona com GPD’s. De fato, se ˆe(·) fosse uma GPD, ent˜ao aPropriedadese aplicaria a ela, e, conseq¨uentemente, seu dom´ınio de defini¸c˜ao seriau >0. Caso contr´ario, n˜ao haveria empec´ılios em considerar ˆe(·) no dom´ınio entre o m´ınimo e o m´aximo da amostra. O que vale ´e o segundo caso; o dom´ınio correto ´e o intervalo definido pelo valor m´ınimo e valor m´aximo da amostra. Mas existe uma rela¸c˜ao entre ˆe(·), constru´ıda dessa forma, e as GPD’s. Esta rela¸c˜ao esta nas entrelinhas do Procedimento. Por´em, para uma explica¸c˜ao detalhada, o leitor ter´a de esperar at´e a ´ultima sub-se¸c˜ao.
(2)Sobre o c´alculo de ˆe(u) quandoucoincide com um dos pontos de amostra.
Aqui enfatizamos um dos aspectos embutidos na f´ormula (86). Se u coin-cidir com um dos pontos de amostra, este ponto n˜ao ´e contabilizado nem no numerador nem no denominador da f´ormula (86) que calcula ˆe(u). A exclus˜ao deste ponto ´e conseq¨uˆencia do condicionamento{X > u}na defini¸c˜ao de e(·).
Se fosse {X ≥ u}, ent˜ao o ponto da amostra na posi¸c˜ao u estaria incluso.
E poss´ıvel argumentar que a substitui¸c˜ao de´ {X > u} por {X ≥ u} altera detalhes de todo o procedimento, mas n˜ao pode alterar as conclus˜oes que ele produz. Esta argumenta¸c˜ao n˜ao ´e ser´a abordada.
(3)Sobre as maneiras de se expressar visualmente ˆe(·).
Para evitar poss´ıveis desentendimentos e cofuss˜oes, usaremos a nota¸c˜ao x(1) - o menor valor da amostrax1, . . . , xn;
x(2) - o segundo menor valor,· · · , x(n) - o maior valor da amostra. (90) Veja agora a f´ormula (86) e observe que o n´umero de vezes que “u” aparece
no numerador ´e igual ao valor do denominador. Isto nos ajuda a derivar a seguinte express˜ao alternativa para a fun¸c˜ao da m´edia amostral de excessos:
ˆ
e(u) = 1 n−k
Xn
i=k+1
x(i)
!
−u, para u∈[x(k), x(k+1)), (91) para qualquerk de 1 a n−1. Esta express˜ao prova a seguinte
propriedade-(a): entre quaisquer dois pontos consecutivos da amostra, a fun¸c˜ao ˆ
e(·) ´e linear com tangente igual a−1.
Agora, se vocˆe prorrogar esta fun¸c˜ao linear at´e a abcissax(k+1), vocˆe ver´a que seu valor emx(k+1) ´e menor que ˆe(x(k+1)) (o Exerc´ıcio 37 lhe ajudar´a provar este fato). Isto implica a
propriedade-(b): a fun¸c˜ao ˆe(·) ´e descont´ınua em cada ponto da amostra, ap-resentando um pulo para cima nestes pontos.
Ao desenhar o gr´afico de ˆe(·) ´e custume preencher os pulos por intervalos verticais. Esta barbaridade e aspropriedades-(a,b) fazem com que o gr´afico de ˆ
e(·) apare¸ca freq¨uentemente no formato de “dentes de serra”.
Segue-se do nosso argumento do par´agrafo anterior que os dentes da “serra”
de uma fun¸c˜ao ˆe(·) s˜ao feitos de segmentos verticais e de segmentos de in-clina¸c˜ao −45◦. Nem sempre vocˆe encontrar´a na literatura gr´aficos com seg-mentos de inclina¸c˜ao −45◦. Isto ocorre quando a escala vertical e a escala horizontal s˜ao diferentes.
Existem ainda pessoas que alegam – e concordamos com esta alega¸c˜ao – que os segmentos inclinados dos dentes da “serra” de uma fun¸c˜ao ˆe(·) s˜ao pouco representativos. Vejamos o argumento. Cada segmento de ˆe(·) entre cada para de observa¸c˜oes x(k) e x(k+1) surge devido a ausˆencia de outras observa¸c˜oes entre estas duas. Mas isto n˜ao significa que a vari´avel aleat´oria X - aquela cujas realiza¸c˜oes comp˜oem a amostra – n˜ao possa assumir valores entre x(k) e x(k+1). Logo, nada obriga que e(·), a fun¸c˜ao de m´edia de excessos de X, seja uma fun¸c˜ao linear entre x(k) e x(k+1). O argumento agora apresentado n˜ao s´o desqualifica a capacidade de informa¸c˜ao dos trechos lineares de ˆe(·) em indicar o comportamento dee(·), como tamb´em indica que a informa¸c˜ao confi´avel sobre e(·) est´a contida somente nos valores de ˆe(·) avaliados nos pontos da amostra. Dessa forma os seguidores deste argumento apresentam a fun¸c˜ao ˆe(·) somente pelos pontos
x(1),e(xˆ (1)
,· · ·, x(n),e(xˆ (n)
, (92)
e, as vezes, ligam os pontos consecutivos desta apresenta¸c˜ao por intervalos.
Nesta ´ultima forma de apresenta¸c˜ao o gr´afico de ˆe(·) n˜ao possui trechos ver-ticais, o que o faz se apresentar fora do padr˜ao dos “dentes-de-serra”, como discutido acima.
(4)Sobre a coincidˆencia deuopt com um dos pontos de amostra.
Se os argumentos do ´ıtem (3) acima convenceram vocˆe de que os trechos da fun¸c˜ao ˆe(·) entre pontos da amostra n˜ao s˜ao representativos, no sentido de n˜ao conseguirem revelar o verdadeiro comportamento da fun¸c˜aoe(·) entre tais pontos, ent˜ao vocˆe vai executar o Procedimento para a identifica¸c˜ao do limiar ´otimoda seguinte maneira: analise a linearidade de ˆe(·) n˜ao por todos os trechos, mas apenas por aqueles que come¸cam (e terminam) em um dos pontos da amostra. Vocˆe n˜ao ´e o ´unico, todo mundo faz isso. Em conseq¨uˆencia, uopt sempre coincide com um dos pontos de amostra.
(5) sobre a inclus˜ao do uopt no conjunto de excessos usados para construir aproximadorGξ,β(uopt),0(·).
O ´ıtem acima explicou porquˆeuopt sempre coincide com um dos pontos da amostra x1, . . . , xn, o que freq¨uentemente induz `a seguinte d´uvida: o ponto que coincide comuopt deve ou n˜ao deve ser usado na constru¸c˜ao do conjunto de excessos (74)? Gostar´ıamos de explicitar que a resposta ´e “n˜ao” devido ao formalismo: “para que um valor x seja excedente acima de um valor u ´e necess´ario que x seja estritamente maior que u”. Assim o ponto de amostra que coincidiu com uopt n˜ao ´e um excedente acima de uopt, e, logo, n˜ao gera excesso. Por´em, todo formalismo tem por tr´as de si uma raz˜ao pr´atica. O Exerc´ıcio 40 convida o leitor a descobrir esta raz˜ao.
(6)sobre aspectos pr´aticos da identifica¸c˜ao da linearidade da fun¸c˜ao ˆe(·).
A an´alise da linearidade da fun¸c˜ao ˆe(·) ´e uma tarefa complexa devido `a intr´ınseca irregularidade do gr´afico desta fun¸c˜ao. Esta irregularidade ´e cau-sada – claro – pelo fato da fun¸c˜ao ser constru´ıda com base numa amostra. O que n˜ao pode ser esquecido ´e que o objetivo da an´alise ´e identificar a regi˜ao da linearidade de fun¸c˜aoe(·), para a qual a fun¸c˜ao ˆe(·) serve como uma aprox-ima¸c˜ao. Isto nos permite excluir da an´alise as regi˜oes onde ˆe(·) seja muito irregular e a amostra muito esparsa. Uma tal regi˜ao ´e, tipicamente, a cauda da fun¸c˜ao ˆe(·). Foi precisamente a incapacidade da cauda de ˆe(·) ser um bom aproximador para cauda dee(·) que fez com que o Procedimento fosse procu-rar pela linearidade de ˆe(·) num s´o trecho, que geralmente ´e um intervalo que
“acaba” antes do come¸co da irregular e indesej´avel cauda de ˆe(·).
(7). N˜ao foi justificado, nem sequer no n´ıvel heur´ıstico, a instru¸c˜ao do Pro-cedimentoque nos “manda” procurar pelo trecho “mais `a esquerda” do gr´afico de ˆe(·) e atribuir a uopt o extremo esquerdo deste trecho. Tudo isso ser´a justificado na Sub-se¸c˜ao 7.6.
7.3 A segunda parte da estrat´egia: como construir a GPD a