O primeiro passo da estrat´egia: como encontrar o valor

otimo do limiar

Nesta sub-se¸cão apresentaremos um dos métodos mais utilizados para executar o ´ıtem(A)da estratégia tra¸cada na sub-se¸cão anterior.

O m´etodo que pretendemos expor baseia-se em uma propriedade de GPD’s.

Para que possamos formulá-la precisamos introduzir o conceito de fun¸cão da média de excessos, o que faremos no parágrafo a seguir.

SejaX uma variável aleatória qualquer. A fun¸cãoe(·) definida da seguinte maneira

e(u) :=IE

X −uX > u

, u <( o valor máximo de X), (76) chama-sefun¸cão da média de excessos deX, ou,²⁷fun¸cão da média de excessos da fun¸cãoF(·), se esta última é a fun¸cão de distribui¸cão de X.

Comentário 22. Aqui derivaremos a expressão para e(·) necessária para a demostra¸cão doFatoa seguir. Portanto este comentário pode ser omitido por aqueles leitores interessados somente no conteúdo do Fato.

A nota¸c˜aoIE

X−uX > u

significa, conforme a nomenclatura da Teoria de Probabilidades, a esperan¸ca matemática da variável aleatória (X−u) condi-cionada à ocorrência do evento{X > u}, ou ainda, em linguagem matemática

X−uX > u

= Z _∞

−∞

xdF_u(x), (77)

27Poder´ıamos chamar IE

X−uX > u

devalor esperado dos excessos de X acima de u, dado que X ultrapassou u– nome complicado, que n˜ao usaremos adiante.

ondeF_u(·) designa a fun¸cão da distribui¸cão condicional de (X −u) dado que ocorreu{X > u}. Vimos que esta fun¸cão possui a forma: F_u(x) =IP

X−u≤ xX > u

. Onde o leitor deve exclamar: “Mas esta expressão já apareceu no texto na fórmula (55)!” É isso mesmo. A fun¸cãoF_u(·) é nossa velha conhecida, que foi denominada fun¸cão de distribui¸cão de excessos deF(·) acima deu. Até obtivemos sua expressão em termos da fun¸cãoF(·). Isso pode ser revisto em (61), uma rela¸cão que nos presenteia com o seguinte fato: se F(·) possuir fun¸cão de densidade f(·), então F_u(·) também tem sua fun¸cão de densidade, que é dada pela seguinte fórmula:

f_u(x) =

( 0, sex <0,

f(x+u)

1−F(u), sex≥0. (78)

Juntando (77) e (79), chegamos `a f´ormula e(u) =

Z ∞

xf(x+u)

1−F(u) dx, (79)

o que é o objetivo do presente comentário. Fim do comentário.

Voltaremos agora a nossa aten¸cão para o caso em queF(·) é uma GPD com s= 0. Neste caso a fun¸cão de densidade deF(·) possui uma expressão anal´ıtica que pode ser facilmente calculada (via a deriva¸cão da expressão da GPD (10), (11) ou (12)). Usando então a fórmula (79) derivada no Comentário 22, pode-mos deduzir a expressão para a fun¸cão da média de excessos de uma GPD; eis o resultado (sua demostra¸cão foi “delegada” ao Exerc´ıcio 34):

Fato: Se o parˆametro de forma, ξ, de GPDG_ξ,β,0(·) satsifaz a condi¸c˜ao

ξ <1 (80)

então a fun¸cão da média de excessos dessa GPD é dada por:

e(u) = β+ξu

1−ξ (81)

parau∈

(0,+∞), quando 0≤ξ,

(0,−β/ξ), quando 0> ξ, (82)

e(u) = β

1−ξ −u, (83)

parau≤0. (84)

Antes de prosseguirmos com os nossos argumentos, que se apoiam noFato acima, precisamos dar a aten¸cão adequada às suposi¸cões ξ <1 e s= 0. Im-pusemoss= 0 porque apenas as GPD’s com s= 0 aparecem no Resultado de Pickands, e, conseqüentemente, só tais GPD’s nos interessarão. A discussão do porquê da limita¸cãoξ <1 do pressuposto (81) e no que isto implica é mais extensa, e será feita no Comentário 26. Para que não precisemos interromper nossos argumentos com a discussão da limita¸cão ξ <1, vamos considerar so-mente fun¸cõesG_ξ,β,0(·) cujo parâmetroξé menor que 1. Mais ainda, para não repetirmos os argumentos, referentes aos casos 0≤ξe 0> ξ, vamos considerar apenas fun¸cõesG_ξ,β,0(·) cujo parâmetroξ não é menor que 0 (lembramos que a condi¸cão ξ ≥0 ocorre se e somente se a cauda de G_ξ,β,0(·) é infinita, e que a Sub-se¸cão 4.3 explicou o motivo do nosso interesse por essas GPD’s).

Destacaremos agora como Propriedade a parte do Fato que é o ponto de partida para a constru¸cão do procedimento que determinauôpt:

Propriedade: A parte correspondente às abcissas positivas da fun¸cão da média de excessos, e(u), u >0, de uma GPD G_ξ,β,0(·) satisfazendo a condi¸cão ξ <1, é uma fun¸cão linear emu com tangente igual a

1−ξ. (85)

Estamos pr´oximos da constru¸c˜ao do nosso procedimento estat´ıstico. Agora

é o momento de pensar em como poder´ıamos estimar a fun¸cãoe(·) se não temos em mãos a fun¸cão de distribui¸cão F(·) de uma variável aleatória X, e se nos

é dado somente uma amostra x1, . . . , xn de realiza¸cões de X. Nossa sugestão

é que o aproximador seja a fun¸cão ê(·) constru´ıda via a seguinte regra:

ˆ e(u) =

Psobre todos osx_i’s maiores queu(x_i−u)

quantidade dex_i’s que são maiores queu , (86) para u satisfazendo min{x₁, . . . , x_n} ≤u <max{x₁, . . . , x_n}. (87) Esta fun¸cão será chamadafun¸cão da média amostral de excessos da amostra x₁, . . . , x_n. Tal nome vem do fato de ê(u) ser a estimativa mais tradicional para e(u) = IE[X −uX > u] dentre aquelas estimativas constru´ıdas com base em uma amostra deX. De fato, o numerador em (86), que é a soma de excessos da amostra acima deu, estima a soma de todos os excessos deX acima de u, enquanto que o denominador de (86) estima o peso de cada excedente

da amostra acima de u sob a condi¸cão de ocrrência do evento {X > u}. Maiores detalhes a respeito da justificativa do porquê ê(·) estimare(·) podem ser encontradas em qualquer bom livro de estat´ıstica.

Coment´ario 23. Aqui gostar´ıamos de comentar sobre os limites impostos por (87) aos valores deu para as quais ˆe(u) foi definida.

Os limites acima referidos surgem devido ao fato de que ê(u) só nos inter-essa parau dentro destes limites. Especificamente falando, a informa¸cão que extrairemos de ê(·) está totalmente contida no intervalo entre o valor m´ınimo e o valor máximo da amostra.

A princ´ıpio, os valores de ˆe(·) poderiam ser definidos fora do intervalo acima referido. Estes valores devem estar de acordo com a interpreta¸c˜ao de ˆ

e(u) como a média de excessos acima deu. Apresentamos estes valores abaixo, mas de pronto alertamos que eles não serão usados:

e(u) = 1 n

i=1

(x_i−u) = 1 n

i=1

x_i − u, parau <min{x₁, . . . , x_n},(88) ˆ

e(u) = 0, para u≥max{x₁, . . . , x_n}. (89) Fim do coment´ario.

APropriedadeem combina¸cão com o fato de que ê(·) aproximae(·), justifi-cam o procedimento formulado abaixo. Avisamos, porém, que esta justifica¸cão não é um argumento imediato e simples no caso do ´ıtem(i). A extensão deste argumento nos fez adiá-lo para a última sub-se¸cão da presente se¸cão. Já no caso dos ´ıtens(ii) e (iii), eles seguem facilmente da expressão (85).

Procedimento para identifica¸cão do limiar ótimouôpt.

(i) A partir de uma dada amostra x₁, . . . , x_n de uma fun¸cão de dis-tribui¸cão F(·), construa ê(·), a fun¸cão da média amostral de excessos da amostra, via a fórmula (86). Indo da direita à esquerda ao longo do gráfico de ê(·), procure o primeiro trecho do gráfico que não seja muito irregular e que apresente comportamento aproximadamente linear. De-clare uôpt como sendo o valor ótimo do limiar, a abscissa do extremo esquerdo deste trecho.

(ii)Ainda mais, o conhecimento pr´evio do verdadeiro parˆametroξobriga a procura por um trecho linear horizontal, casoξ= 0,

a procura por um trecho linear crecente, casoξ >0,

a procurar por um trecho linear decrescente, casoξ <0.

(iii)A rec´ıpoca de(ii)vale, especificamente falando, a tangente do trecho linear indica o sinal do verdadeiro ξ:

se houver confian¸ca de que o trecho linear identificado ´e horizontal, ent˜ao pode-se concluir que ξ= 0,

se houver confian¸ca de que o trecho linear identificado ´e crecente, ent˜ao pode-se concluir que ξ >0,

se houver confian¸ca de que o trecho linear identificado é decrescente, então pode-se concluir que ξ <0; neste caso, porém, é importante conferir se ê(·) indica que e(·) toca o eixo das abcissas, pois senão, a exigência (82) poderia não ser satisfeita, o que implicaria na im-possibilidade de ξ ser menor que 0.

Comentário 24. O último ´ıtem da parte (iii) merece uma aten¸cão redobrada.

Ele insinua que a fun¸cão ê(·) pode apresentar padrão de fun¸cão decrescente num caso incompat´ıvel com ξ < 0. A que valor de ξ aponta tal comporta-mento? Isso será respondido na Sub-se¸cão 8.2. Fim do comentário.

Infelizmente a execu¸cão doProcedimentodescrito acima não dispõe de nen-hum método quantitativo. Em particular, a “lineridade” não pode ser formal-izada ou quantificada, e é geralmente identificada com base “no olhômetro”, o que faz com que a eficiência do procedimento dependa da experiência do usuário. Algumas dicas serão dadas nosAspectosabaixo. Para os interessados em adquirir um pouco de experiência nesse ramo, indicamos os exemplos da Se¸cão 8.

Aspectos importantes da execus˜ao mais tradicional do Procedimento.

Antes de enumerarmos os aspectos vamos insistir em um aviso. Resolver o Exerc´ıcio 35 facilitará a compreensão da exposi¸cão abaixo. Aos tópicos.

(1). Come¸car a constru¸cão de ê(·) do pontou= 0 ou do ponto min{x₁, . . . , x_n}? E uma pergunta que surge naturalmente, pois a´ Propriedade considera u >0, enquanto que ê(·) foi constru´ıdo a partir de min{x₁, . . . , x_n}.

Figura 20: A fun¸cão da média amostral, ê(·), de uma amostra retirada GPD G0.7,1,0(·). Notamos que a teoria garante que e(·), a fun¸cão da média de excessos desta GPD, é uma fun¸cão linear. Isto porém não garante a linearidade da fun¸cão ê(·), como mostra a presente figura. A razão disso é que ê(·) depende da amostra, que pode não representar perfeitamente a GPD. A figura ilustra também a irregularidade de ê(·) que aumenta conforme se move da esquerda à direita. Este efeito é causado pelo aumento da esparsidade entre pontos da amostra da GPD. Notamos ainda que se formos executar aqu´ı oProcedimento para identifica¸cãouôpt, concluiremos então que uôpt = 0, o que é coerente com a realidade, pois, conforme dito acima, a fun¸cãoe(·)

´e linear a partir da abcissa 0.

Esta fun¸c˜ao tem formato de “serra” explicado no item3dosAspectos de execus˜ao.

Por certo, os dentes da serra s˜ao formados por trechos verticais e trechos inclinados

−45^◦. Isso n˜ao se observa na presente figura devida `a diferen¸ca das escalas nos eixos.

Respondemos: o correto ´e come¸car a partir do min{x₁, . . . , x_n}.

Porem, se você sabe que a cauda a ser aproximada não come¸ca antes de um valorV, então construa ê(·) a partir deV. Geralmente as pessoas definem V = 0, expressando com isto que a cauda, que eles querem aproximar, fica à direita de zero. O uso de 0 como in´ıcio de ê(·) contribui ainda mais para a existência da pergunta acima.

Há casos nos quais todos os valores de amostra são positivos. É muito comum come¸car a constru¸cão de ê(·) a partir de 0 nestes casos. Quando isto é feito, a parte de ê(·) entre 0 e min{x1, . . . , xn} não se usa para a execu¸cão do Procedimento para identifica¸cão deuôpt. Isto é coerente com o conteúdo do Co-mentário 23, que afirmou que os valores de ê(·) à esquerda de min{x₁, . . . , x_n} não ajudam na capta¸cão do comportamento linear da fun¸cãoe(·).

Por fim, devemos confessar que a pergunta acima decorre, em parte, por nossa culpa, pois não especificamos com a devida clareza como ê(·) se relaciona com GPD’s. De fato, se ê(·) fosse uma GPD, então aPropriedadese aplicaria a ela, e, conseqüentemente, seu dom´ınio de defini¸cão seriau >0. Caso contrário, não haveria empec´ılios em considerar ê(·) no dom´ınio entre o m´ınimo e o máximo da amostra. O que vale é o segundo caso; o dom´ınio correto é o intervalo definido pelo valor m´ınimo e valor máximo da amostra. Mas existe uma rela¸cão entre ê(·), constru´ıda dessa forma, e as GPD’s. Esta rela¸cão esta nas entrelinhas do Procedimento. Porém, para uma explica¸cão detalhada, o leitor terá de esperar até a última sub-se¸cão.

(2)Sobre o c´alculo de ˆe(u) quandoucoincide com um dos pontos de amostra.

Aqui enfatizamos um dos aspectos embutidos na fórmula (86). Se u coin-cidir com um dos pontos de amostra, este ponto não é contabilizado nem no numerador nem no denominador da fórmula (86) que calcula ê(u). A exclusão deste ponto é conseqüência do condicionamento{X > u}na defini¸cão de e(·).

Se fosse {X ≥ u}, ent˜ao o ponto da amostra na posi¸c˜ao u estaria incluso.

E poss´ıvel argumentar que a substitui¸cão de´ {X > u} por {X ≥ u} altera detalhes de todo o procedimento, mas não pode alterar as conclusões que ele produz. Esta argumenta¸cão não é será abordada.

(3)Sobre as maneiras de se expressar visualmente ˆe(·).

Para evitar poss´ıveis desentendimentos e cofuss˜oes, usaremos a nota¸c˜ao x₍₁₎ - o menor valor da amostrax₁, . . . , x_n;

x₍₂₎ - o segundo menor valor,· · · , x_(n) - o maior valor da amostra. (90) Veja agora a f´ormula (86) e observe que o n´umero de vezes que “u” aparece

no numerador é igual ao valor do denominador. Isto nos ajuda a derivar a seguinte expressão alternativa para a fun¸cão da média amostral de excessos:

e(u) = 1 n−k

i=k+1

x_(i)

−u, para u∈[x_(k), x_(k+1)), (91) para qualquerk de 1 a n−1. Esta express˜ao prova a seguinte

propriedade-(a): entre quaisquer dois pontos consecutivos da amostra, a fun¸c˜ao ˆ

e(·) ´e linear com tangente igual a−1.

Agora, se você prorrogar esta fun¸cão linear até a abcissax_(k+1), você verá que seu valor emx_(k+1) é menor que ê(x_(k+1)) (o Exerc´ıcio 37 lhe ajudará provar este fato). Isto implica a

propriedade-(b): a fun¸cão ê(·) é descont´ınua em cada ponto da amostra, ap-resentando um pulo para cima nestes pontos.

Ao desenhar o gráfico de ê(·) é custume preencher os pulos por intervalos verticais. Esta barbaridade e aspropriedades-(a,b) fazem com que o gráfico de ˆ

e(·) apare¸ca freq¨uentemente no formato de “dentes de serra”.

Segue-se do nosso argumento do par´agrafo anterior que os dentes da “serra”

de uma fun¸cão ê(·) são feitos de segmentos verticais e de segmentos de in-clina¸cão −45^◦. Nem sempre você encontrará na literatura gráficos com seg-mentos de inclina¸cão −45^◦. Isto ocorre quando a escala vertical e a escala horizontal são diferentes.

Existem ainda pessoas que alegam – e concordamos com esta alega¸cão – que os segmentos inclinados dos dentes da “serra” de uma fun¸cão ê(·) são pouco representativos. Vejamos o argumento. Cada segmento de ê(·) entre cada para de observa¸cões x_(k) e x_(k+1) surge devido a ausência de outras observa¸cões entre estas duas. Mas isto não significa que a variável aleatória X - aquela cujas realiza¸cões compõem a amostra – não possa assumir valores entre x_(k) e x_(k+1). Logo, nada obriga que e(·), a fun¸cão de média de excessos de X, seja uma fun¸cão linear entre x_(k) e x_(k+1). O argumento agora apresentado não só desqualifica a capacidade de informa¸cão dos trechos lineares de ê(·) em indicar o comportamento dee(·), como também indica que a informa¸cão confiável sobre e(·) está contida somente nos valores de ê(·) avaliados nos pontos da amostra. Dessa forma os seguidores deste argumento apresentam a fun¸cão ê(·) somente pelos pontos

x₍₁₎,e(xˆ ₍₁₎

,· · ·, x_(n),e(xˆ _(n)

, (92)

e, as vezes, ligam os pontos consecutivos desta apresenta¸c˜ao por intervalos.

Nesta última forma de apresenta¸cão o gráfico de ê(·) não possui trechos ver-ticais, o que o faz se apresentar fora do padrão dos “dentes-de-serra”, como discutido acima.

(4)Sobre a coincidˆencia deu^opt com um dos pontos de amostra.

Se os argumentos do ´ıtem (3) acima convenceram você de que os trechos da fun¸cão ê(·) entre pontos da amostra não são representativos, no sentido de não conseguirem revelar o verdadeiro comportamento da fun¸cãoe(·) entre tais pontos, então você vai executar o Procedimento para a identifica¸cão do limiar ótimoda seguinte maneira: analise a linearidade de ê(·) não por todos os trechos, mas apenas por aqueles que come¸cam (e terminam) em um dos pontos da amostra. Você não é o único, todo mundo faz isso. Em conseqüência, uôpt sempre coincide com um dos pontos de amostra.

(5) sobre a inclus˜ao do u^opt no conjunto de excessos usados para construir aproximadorG_ξ,β(uopt),0(·).

O ´ıtem acima explicou porquêuôpt sempre coincide com um dos pontos da amostra x₁, . . . , x_n, o que freqüentemente induz à seguinte dúvida: o ponto que coincide comuôpt deve ou não deve ser usado na constru¸cão do conjunto de excessos (74)? Gostar´ıamos de explicitar que a resposta é “não” devido ao formalismo: “para que um valor x seja excedente acima de um valor u é necessário que x seja estritamente maior que u”. Assim o ponto de amostra que coincidiu com uôpt não é um excedente acima de uôpt, e, logo, não gera excesso. Porém, todo formalismo tem por trás de si uma razão prática. O Exerc´ıcio 40 convida o leitor a descobrir esta razão.

(6)sobre aspectos práticos da identifica¸cão da linearidade da fun¸cão ê(·).

A análise da linearidade da fun¸cão ê(·) é uma tarefa complexa devido à intr´ınseca irregularidade do gráfico desta fun¸cão. Esta irregularidade é cau-sada – claro – pelo fato da fun¸cão ser constru´ıda com base numa amostra. O que não pode ser esquecido é que o objetivo da análise é identificar a região da linearidade de fun¸cãoe(·), para a qual a fun¸cão ê(·) serve como uma aprox-ima¸cão. Isto nos permite excluir da análise as regiões onde ê(·) seja muito irregular e a amostra muito esparsa. Uma tal região é, tipicamente, a cauda da fun¸cão ê(·). Foi precisamente a incapacidade da cauda de ê(·) ser um bom aproximador para cauda dee(·) que fez com que o Procedimento fosse procu-rar pela linearidade de ê(·) num só trecho, que geralmente é um intervalo que

“acaba” antes do come¸co da irregular e indesej´avel cauda de ˆe(·).

(7). Não foi justificado, nem sequer no n´ıvel heur´ıstico, a instru¸cão do Pro-cedimentoque nos “manda” procurar pelo trecho “mais à esquerda” do gráfico de ê(·) e atribuir a uôpt o extremo esquerdo deste trecho. Tudo isso será justificado na Sub-se¸cão 7.6.

7.3 A segunda parte da estrat´egia: como construir a GPD a

No documento “Peaks-over-Threshold” na estimac ¸ ˜ ao de risco; uma exposic ¸˜ ao abragente, (páginas 90-99)