Ao meu marido Jorge Miguel e à minha filha Isabel Eduarda.

(1)

(2)

(3)

Agradecimentos

Quero come¸car por manifestar os meus sinceros agradecimentos à Professora Doutora Margarida Brito, pelo apoio e aten¸cão dedicados durante a orienta¸cão da tese.

Desejo tamb´em agradecer ao meu marido por toda a sua ajuda e ˆanimo.

Agrade¸co ao Centro de Matemática e à Faculdade de Ciências da Universidade do Porto o facto de me terem apoiado durante este trabalho, bem como à Faculdade de Economia, pelo mesmo motivo e pelo facto de me ter dado equipara¸cão a bolseiro para a realiza¸cão da presente tese.

Estou ainda grata `a minha fam´ılia pelo incentivo transmitido.

(4)

Resumo

Neste trabalho estudamos o problema da estima¸cão do coeficiente de cauda exponencial R da fam´ılia de fun¸cões de distribui¸cão F que verificam

1 − F (z) = r(z)e−Rz_, _{z > 0,}

em que r é uma fun¸cão de varia¸cão regular em ∞ e R > 0.

A estima¸cão de R é um problema muito importante, com aplica¸cões em diversos dom´ınios como, por exemplo, em teoria do risco. Em particular, sob certas condi¸cões, a estima¸cão de R corresponde à estima¸cão do coeficiente de ajustamento, conforme provado por Csörg˝o e Steinebach (1991).

Motivados por considera¸cões de tipo geométrico, introduzimos, a partir de uma amostra de variáveis aleatórias independentes e identicamente distribu´ıdas, um estimador consis-tente para R, bR, relacionado com os estimadores de m´ınimos quadrados propostos por

Schultze e Steinebach (1996). Mostramos que este estimador é universalmente assimptot-icamente normal sobre toda a fam´ılia considerada, quando centrado numa certa sucessão determin´ıstica que converge para R, e estabelecemos um resultado acerca da sua normali-dade assimptótica, quando centrado em R.

Investigamos ainda a possibilidade de aplica¸cão de técnicas de reamostragem na uti-liza¸cão do estimador proposto. Conclu´ımos que, usando o método bootstrap de cauda, introduzido por Bacro e Brito (1998), é poss´ıvel construir intervalos de confian¸ca para R. Estudamos também o problema da estima¸cão do coeficiente de ajustamento no modelo de Sparre Andersen para uma companhia de seguros, sob condi¸cões gerais assegurando a validade da aproxima¸cão de Lundberg. O coeficiente de ajustamento corresponde ao coeficiente de cauda exponencial da distribui¸cão subjacente a uma sucessão auxiliar con-siderada por Csörg˝o e Steinebach (1991). Os resultados obtidos sobre a estima¸cão de R são assim aplicáveis neste contexto. De forma a obter uma melhor descri¸cão da realidade têm sido propostas na literatura generaliza¸cões do modelo de risco clássico. Consideramos um desses modelos de risco generalizado, e estudamos, também neste caso, o problema da estima¸cão de um majorante para a probabilidade de ru´ına.

Alguns resultados são ilustrados através de estudos de simula¸cão, adaptando-se um procedimento emp´ırico proposto por Schultze e Steinebach (1996) ao estimador bR, para a

escolha do número de observa¸cões de cauda a incluir na estima¸cão.

Investigamos também a consistência do estimador bR no caso de variáveis dependentes,

e mostramos que bR é consistente para sucessões estacionárias, com uma estrutura de

(5)

Abstract

In this work, we study the problem of estimating the exponential tail coefficient R of the family of distribution functions F satisfying

1 − F (z) = r(z)e−Rz_, _{z > 0,}

where r is a regularly varying function at ∞ and R > 0.

The problem of estimating the tail coefficient R has received considerable attention and common applications may be found in a big variety of domains, in particular in risk theory. Under certain conditions, the problem of estimating R corresponds to the estimation of the adjustment coefficient as shown by Cs¨org˝o and Steinebach (1991).

Motivated by geometric-type considerations, we propose a consistent estimator for R, b

R, that is directly related to the least squares estimators of Schultze and Steinebach (1996).

We show that this estimator is universally asymptotically normal over the whole family above, when centered at a deterministic sequence converging to R, and prove that bR is

asymptotically normal, when centered at R.

We also investigate the possibility of application of resampling technics to the proposed estimator. We concluded that, using the tail bootstrap method introduced by Bacro and Brito (1998), it is possible to construct confidence intervals for R.

We also study the problem of estimating the adjustment coefficient in the Sparre Ander-sen model for an insurance company, under general conditions that guarantee the validity of the Lundberg approximation. The adjustment coefficient corresponds to the tail exponen-tial coefficient of the distribution underlying an auxiliary sequence considered by Cs¨org˝o e Steinebach (1991). Thus, the results obtained for the estimation of R are applicable on this context. In order to achieve a better description of reality, generalizations of the classical risk model have been proposed in the literature. Here we consider one of these generalized models, and study, in that case, the problem of estimating the upper bound for the ruin probability.

Some results are illustrated by means of simulation studies, adapting here a procedure proposed by Schultze and Steinebach (1996) to the estimator bR, for the choice of the

number of tail observations to include on the estimation.

We also investigate the consistency of the estimator bR, when the variables are

depen-dent, and show that bR is a consistent estimator of R for stationary sequences, with an

(6)

R´

esum´

e

Dans ce travaille nous étudions le problème de l’estimation du coefficient de queue expo-nentiel R de la famille de f.d. F vérifiant

1 − F (z) = r(z)e−Rz_{, z > 0}

où r est une fonction à variation réguliere et R > 0.

Nous proposons ici un estimateur de nature géométrique, bR, rélationé avec les

estima-teurs des moindres carr´e introduits par Schultze et Steinebach (1996).

Nous montrons que, sous des conditions g´en´erales, bR est asymptotiquement normal.

Nous démontrons aussi que par l’intermédiaire du méthode bootstrap de queue, intro-duit par Bacro et Brito (1998), il est possible construire des intervalles de confiance pour

R.

Nous étudions aussi le probléme de l’estimation d’un majorant pour la probabilité de ruine dans le modèle de Sparre Andersen, sous des conditions génèrales assurant le validité de l’approximation de Lundberg. L’estimateur proposé est basé en l’estimateur géometrique du coefficient de queue exponentiel de la distribution d’une suite auxiliaire considerée par Csörg˝o et Steinebach (1991).

Les résultats obtenus sont illustrés dans études de simulation.

Nous etudións aussi la consistance de bR dans le cas où les v.a. sont dépendantes et

mon-trons que bR est consistent pour des s´eries stationnaires avec une structure de d´ependance

(7)

Conte´

udo

Agradecimentos iii Resumo iv Abstract v Resum´e vi Introdu¸c˜ao 1

Algumas defini¸c˜oes e nota¸c˜oes 3

1 Estima¸c˜ao do coeficiente de cauda exponencial R 5

1.1 Introdu¸c˜ao e resultados preliminares . . . 5

1.2 Um estimador geom´etrico para coeficiente de cauda exponencial, bR . . . . 15

1.3 Comportamento limite fraco de bR . . . . 17

1.4 Normalidade assimpt´otica de bR . . . . 21

1.4.1 Estudo de simula¸c˜ao . . . 28

1.5 Bootstrap de cauda para a estima¸c˜ao de R . . . . 31

1.5.1 M´etodo bootstrap . . . 31

1.5.2 Procedimento bootstrap de cauda . . . 32

1.5.3 Normalidade assimpt´otica da vers˜ao bootstrap de cauda de bR . . . 33

1.5.4 Intervalo de confian¸ca bootstrap de cauda . . . 40

1.5.5 Estudo de simula¸c˜ao . . . 42

1.6 Consistˆencia de bR para vari´aveis dependentes . . . . 45

1.6.1 Introdu¸c˜ao . . . 45

1.6.2 Resultados gerais . . . 46

1.6.3 Consistência de bR para sucessões estacionárias . . . . 52

2 Estima¸c˜ao do coeficiente de ajustamento na teoria do risco 57 2.1 Introdu¸c˜ao . . . 57

2.2 Algumas propriedades dos passeios aleat´orios . . . 60

(8)

2.4.1 Um exemplo t´ıpico . . . 67

2.4.2 Um exemplo de seguro de vida . . . 68

2.5 Estima¸cão de um majorante para a probabilidade de ru´ına para general-iza¸cões do modelo de risco clássico . . . 68

2.5.1 Exemplo simulado . . . 72

3 Ilustra¸c˜ao dos resultados 75 3.1 Introdu¸c˜ao . . . 75

3.2 Estudo de simula¸c˜ao relativo ao comportamento amostral de bR, bR1, bR3 e bH−1 ₇₆ 3.2.1 Um m´etodo emp´ırico para a escolha de kn . . . 78

3.3 Estudo de simula¸c˜ao relativo aos intervalos de confian¸ca para R . . . . 79

3.4 Estudo de simula¸c˜ao relativo aos intervalos de confian¸ca bootstrap de cauda para R . . . . 80

3.5 Estima¸c˜ao de quantis de ordem elevada . . . 80

3.6 Resultados das simula¸c˜oes . . . 83

3.6.1 Comportamento amostral de bR, bR1, bR3 e bH−1 . . . 83

3.6.2 Intervalos de confian¸ca para R . . . . 90

3.6.3 Intervalos de confian¸ca bootstrap de cauda para R . . . . 94

3.6.4 Quantis de ordem elevada . . . 98

(9)

Introdu¸c˜

ao

Em termos gerais, a Teoria de Valores Extremos prende-se com o estudo de acontecimentos raros ou extremos, e o consequente interesse na cauda da distribui¸cão que governa o sistema em causa. Por ter aplica¸cões numa grande variedade de dom´ınios, este tema tem sido motivo de forte aten¸cão. Entre os vários problemas estudados em Teoria de Extremos destacamos o caso particular da estima¸cão de parâmetros relacionados com a cauda de distribui¸cões.

Neste trabalho estudaremos o problema da estima¸cão do coeficiente de cauda exponen-cial R da fam´ılia de fun¸cões de distribui¸cão F que verificam

1 − F (z) = r(z)e−Rz, z > 0, (1)

em que r é uma fun¸cão de varia¸cão regular em ∞ e R > 0. Este problema tem aplica¸cões em diversos dom´ınios como, por exemplo, em hidrologia, finan¸cas, seguros, telecomunica¸cões, geologia e climatologia. Aqui consideraremos uma importante aplica¸cão à teoria do risco, que é a estima¸cão do coeficiente de ajustamento.

No Cap´ıtulo 1 come¸camos por apresentar alguns estimadores de R, bem como alguns dos resultados acerca das suas propriedades assimptóticas, quer neste contexto, quer no contexto equivalente da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto. Com base no estudo de dois estimadores “baseados” no método dos m´ınimos quadrados, intro-duzidos por Schultze e Steinebach (1996), iremos propor um estimador de tipo geométrico,

b

R, e provar a sua consistência. O estimador é naturalmente fun¸cão dos maiores valores

da amostra. Mostraremos que bR ´e universalmente assimptoticamente normal sobre toda

a fam´ılia (1), quando centrado numa certa sucessão determin´ıstica que converge para R, e estabeleceremos um resultado acerca da sua normalidade assimptótica, quando centrado em R. De seguida, com base no procedimento bootstrap de cauda introduzido por Bacro e Brito (1998), mostraremos que é poss´ıvel construir intervalos de confian¸ca para R a partir do estimador bR. Na última seçcão deste cap´ıtulo, consideraremos o caso de v.a.

depen-dentes e mostraremos a consistência de bR para sucessões estacionárias, com uma estrutura

de dependˆencia usual.

(10)

e−Rx_{, em que R ´e o chamado coeficiente de ajustamento. Neste trabalho, dedicaremos}

particular aten¸cão ao problema da estima¸cão desse coeficiente. Com o mesmo objec-tivo, Csörg˝o e Steinebach (1991) sugeriram estimar R, no modelo de Sparre Andersen, com base numa sucessão auxiliar (Zk) de variáveis aleatórias independentes e

identica-mente distribu´ıdas, bastante estudada no contexto das filas de espera (veja-se seçcão 2.3). O desenvolvimento deste trabalho tem como motiva¸cão principal resultados de Csörg˝o e Steinebach (1991) no caso das indemniza¸cões ou dos tempos interchegadas das mesmas serem variáveis aleatórias exponencialmente distribu´ıdas. Mostraremos aqui, usando algu-mas propriedades gerais dos passeios aleatórios (considerados na seçcão 2.2), que para o modelo de Sparre Andersen e sob condi¸cões gerais assegurando a validade da aproxima¸cão de Lundberg, a fun¸cão de distribui¸cão de Zk pertence à fam´ılia (1), em que o coeficiente

de cauda exponencial corresponde ao coeficiente de ajustamento. Este último pode, desta forma, ser estimado por qualquer dos estimadores apresentados no Cap´ıtulo 1. No Cap´ıtulo 2 faremos também a aplica¸cão dos corolários obtidos no Cap´ıtulo 1 para o estimador bR,

ao caso das indemniza¸cões ou dos tempos interchegadas serem variáveis aleatórias expo-nencialmente distribu´ıdas. Quando no modelo de Sparre Andersen se supõe que os tempos interchegadas são variáveis aleatórias exponencialmente distribu´ıdas, diz-se que estamos perante um processo de risco clássico. Na última seçcão do Cap´ıtulo 2 iremos considerar uma generaliza¸cão deste processo (veja-se, por exemplo Grandell (1991) e Bening e Korolev (2003)) e estudar também nesse caso a estima¸cão de um majorante para a probabilidade de ru´ına.

No Cap´ıtulo 3 analisaremos o comportamento em amostras finitas do estimador bR,

(11)

Algumas defini¸c˜

oes e nota¸c˜

oes gerais

Nesta seçcão iremos apresentar algumas defini¸cões e estabelecer nota¸cões de forma a poderem ser usadas nos cap´ıtulos que se seguem.

Dado x ∈ R+_{, denotamos por [x] o maior n´umero inteiro n˜ao superior a x.}

Dado x0 ∈ R, considerem-se fun¸c˜oes gen´ericas u e v definidas numa vizinhan¸ca de x0 e

suponha-se que v n˜ao se anula nessa vizinhan¸ca. Escrevemos: 1. u(x) = O(v(x)) quando x → x0 se

¯ ¯ ¯u(x)_v(x)

¯ ¯

¯ ≤ c quando x → x0, para algum c ∈ R+.

No caso em que ¯ ¯ ¯u(x)_v(x) ¯ ¯

¯ → 1 quando x → x0, escrevemos u(x) ∼ v(x) quando x → x0.

2. u(x) = o(v(x)) quando x → x0 se u(x)_v(x) → 0 quando x → x0.

Dada uma fun¸c˜ao f : R → R, consideramos

kf k∞ = sup

x∈R|f (x)|.

Seja agora H a fun¸cão de distribui¸cão (f.d.) de uma variável aleatória (v.a.) Y ,

H(y) = P [Y ≤ y]. Denotamos por H−1 _{a inversa cont´ınua `a esquerda de H:}

H−1(s) := inf{x : H(x) ≥ s}.

E(Y ) e V (Y ) denotam, respectivamente, o valor esperado e a variˆancia de Y , e MY a sua

fun¸c˜ao geradora de momentos (f.g.m.) definida por MY(r) = E(erY).

Dada uma amostra (Y1, . . . , Yn) de v.a. independentes e identicamente distribu´ıdas

(i.i.d.) com f.d. comum H, denotamos por Hn a f.d. emp´ırica (f.d.e.) associada a essa

amostra aleat´oria (a.a.):

Hn(y) = 1 n n X i=1 I{Yi≤y},

em que I ´e a fun¸c˜ao indicatriz:

I{x∈A}=

½

(12)

Considerando ainda a a.a. (Y1, . . . , Yn), denotamos por Y1,n≤ . . . ≤ Yn,n as estat´ısticas de

ordem (e.o.) dessa amostra.

Ao longo deste trabalho, → eD = denotam, respectivamente, convergência e igualdadeD em distribui¸cão, e→ convergência em probabilidade.P

Dadas uma sucessão (Yn) de v.a. i.i.d. e uma sucessão (an) de números reais, escrevemos

1. Vn= OP(an) se ∀δ > 0 ∃Mδ > 0 : P · |Vn| an ≤ Mδ ¸ ≥ 1 − δ ∀n ∈ N. 2. Vn= oP(1) se Vn→ 0.P

Neste trabalho iremos considerar o comportamento da cauda de certas fam´ılias de fun¸cões de distribui¸cão. Para isso necessitamos das três defini¸cões que se seguem.

Uma fun¸cão r : R+_{→ R}+ _{diz-se uma fun¸cão de varia¸cão regular em ∞ se} ∀z > 0, lim

t→∞

r(tz) r(t) = z

ρ_{, para algum ρ ∈ R.}

Uma fun¸cão L : R+ _{→ R}+ _{diz-se uma fun¸cão de varia¸cão lenta em ∞ se} ∀y > 0, lim

t→∞

L(ty) L(t) = 1.

L é, em particular, de varia¸cão regular em ∞ (basta tomar na defini¸cão anterior ρ = 0).

Uma fun¸cão eL : R+ _{→ R}+ _{diz-se uma fun¸cão de varia¸cão lenta em 0 se e}_L(x−1_{) for de}

(13)

Cap´ıtulo 1

Estima¸c˜

ao do coeficiente de cauda

exponencial R

1.1 Introdu¸c˜

ao e resultados preliminares

Comecemos por considerar uma amostra (Z1, . . . , Zn) de v.a. i.i.d. (vari´aveis aleat´orias

independentes e identicamente distribu´ıdas), com f.d. F que satisfaz:

1 − F (z) = P [Z1 > z] = r(z)e−Rz, z > 0, (1.1.1)

onde r é uma fun¸cão de varia¸cão regular em ∞ e R é uma constante positiva, a que se dá o nome de coeficiente de cauda exponencial.

No seguimento do trabalho iremos tamb´em considerar a seguinte forma equivalente a (1.1.1):

F−1(1 − s) = −1

Rlog s + log eL(s), 0 < s < 1, (1.1.2)

onde eL é uma fun¸cão de varia¸cão lenta em zero (veja-se, por exemplo, Schultze e Steinebach

(1996), Lema 2.2.a) e referˆencias citadas).

O problema que vamos estudar neste cap´ıtulo ´e o da estima¸c˜ao do coeficiente de cauda

R. Este problema tem recebido particular aten¸c˜ao, uma vez que tem aplica¸c˜oes numa

grande variedade de dom´ınios, como, por exemplo, em hidrologia, finan¸cas, seguros, tele-comunica¸cões, geologia e climatologia. Uma visão geral da literatura existente é dada em Csörg˝o e Viharos (1998). Seguindo Csörg˝o e Steinebach (1991), consideramos, no próximo cap´ıtulo, uma importante aplica¸cão à teoria do risco, nomeadamente a estima¸cão do coe-ficiente de ajustamento R.

Comecemos por apresentar trˆes estimadores para o coeficiente de cauda exponencial, introduzidos por Schultze e Steinebach (1996).

Tais estimadores foram motivados pelo facto de que, sendo F uma fun¸cão de distribui¸cão que verifica (1.1.1), − log(1 − F (z)), para z grande, é aproximadamente linear com declive

R, uma vez que z−1_{log r(z) → 0 quando z → ∞. Espera-se assim que − log(1− F} n(z))

tamb´em seja aproximadamente linear para valores elevados de n e de z, em que Fn denota

(14)

Para simplificar o estudo, Schultze e Steinebach supuseram inicialmente r(z) ≡ c, ∀z > 0. Assim sendo, y := − log(1 − F (z)) = Rz − log c = Rz − d, ou equivalentemente, z = R−1_{(y + d) = ay + b,} onde a = R−1_{, b = R}−1_{d e d = log c.}

Espera-se assim que estas rela¸c˜oes lineares se verifiquem, aproximadamente, para as kn

maiores observa¸c˜oes da realiza¸c˜ao da amostra (Z1, . . . , Zn), que se denotam por

zi := zn−i+1,n, i = 1, . . . , kn ≤ n. Schultze e Steinebach aproximaram − log(1 − F (zi))

por yi := − log(1 − Fn(zi−)) = − log(1 − (n − i)/n) = log(n/i). Deste modo tem-se que yi

está “próximo” de Rzi− d, ou equivalentemente, zi está “próximo” de ayi+ b.

Um estimador de a foi obtido minimizando a fun¸c˜ao f1(a, b) =

P_k_n

i=1(zi − ayi − b)2.

Fixado o sistema de eixos da Figura 1, o problema da estima¸c˜ao de a corresponde a deter-minar o inverso do declive da recta que minimiza a soma dos quadrados das distˆancias entre os pontos (zi, yi) e os pontos de uma recta com ordenada yi, respectivamente,

i = 1, ..., kn (isto ´e, corresponde a determinar o inverso do declive da recta que minimiza

a soma dos quadrados das distˆancias, medidas na horizontal, entre os pontos {(zi, yi), i =

1, . . . , kn} e uma recta). z y i i ay + b i z y Figura 1.

O estimador de R assim obtido foi bR1(kn) := ˆa−11 (kn), isto ´e,

b

R1(kn) =

P_k_n

i=1log2(n/i) − k1n

³P_k_n

i=1log (n/i)

´₂ P_k_n

i=1log (n/i) Zn−i+1,n− k1n

³P_k_n

i=1Zn−i+1,n

´ ³P_k_n

i=1log(n/i)

(15)

No caso particular em que r(z) ≡ 1, z > 0 (F (z) = 1 − e−Rz_{, z > 0), o problema anterior}

corresponde a minimizar a fun¸c˜ao f2(a) = f1(a, 0) =

P_k_n

i=1(zi−ayi)2. Schultze e Steinebach

propuseram ent˜ao o seguinte estimador de R, no sentido do m´etodo dos m´ınimos quadrados: b

R2(kn) := ˆa−12 (kn) =

P_k_n

i=1log2(n/i)

P_k_n

i=1log (n/i) Zn−i+1,n

.

Um outro estimador de R foi deduzido directamente da equa¸cão y = Rz − d, por minimiza¸cão da fun¸cão f3(R, d) =

P_k_n

i=1(yi − Rzi + d)2. Fixado o sistema de eixos da

Figura 2 (o mesmo da Figura 1), este problema corresponde a determinar o declive da recta que minimiza a soma dos quadrados das distˆancias entre os pontos (zi, yi) e os pontos

de uma recta com abcissa zi, respectivamente, i = 1, ..., kn (isto ´e, determinar o declive

da recta que minimiza a soma dos quadrados das distˆancias, medidas na vertical, entre os pontos {(zi, yi), i = 1, . . . , kn} e uma recta).

z y i i Rz - d i z y Figura 2.

Schultze e Steinebach introduziram assim um outro estimador de R: b

R3(kn) =

P_k_n

i=1log (n/i) Zn−i+1,n− _k1_n

³P_k_n

i=1Zn−i+1,n

´ ³P_k_n

i=1log (n/i)

´ P_k_n i=1Zn−i+1,n2 −k1n ³P_k_n i=1Zn−i+1,n ´₂ . (1.1.4)

Para estabelecer a consistência dos estimadores é necessário impor algumas condi¸cões de regularidade sobre a sucessão kn ≡ (kn). A condi¸cão básica assumida por Schultze e

Steinebach é que kné uma sucessão de inteiros positivos satisfazendo:

1 ≤ kn < n, kn→ ∞ e kn/n → 0 quando n → ∞. (1.1.5)

Esta ´e uma condi¸c˜ao usual que assumimos ao longo do trabalho.

O resultado que se segue estabelece a consistˆencia dos estimadores bR1(kn), bR2(kn) e

b

(16)

Teorema 1.1.1 (Schultze e Steinebach (1996), Teorema 1.1)

Seja F uma f.d. que verifica (1.1.1), e kn uma sucess˜ao de inteiros satisfazendo (1.1.5) e

tal que log2n/kn → 0 quando n → ∞. Tem-se ent˜ao que:

a) bR1(kn)→ R.P

b) se F−1 _{´e cont´ınua em (s}

0, 1) para algum s0 ∈ (0, 1), ent˜ao bR3(kn)→ R.P

Neste trabalho iremos introduzir um estimador de tipo geom´etrico, bR(kn), relacionado

com os estimadores bR1(kn) e bR3(kn), e mostraremos que, sob as condi¸c˜oes do Teorema

1.1.1, bR(kn) ´e tamb´em um estimador consistente de R.

Independentemente de Schultze e Steinebach (1996), Kratz e Resnick (1996) introduzi-ram uma forma equivalente do estimador 1/ bR1(kn) de 1/R, designando-o por estimador-qq,

relativo aos “qq-plots”. Apresentamos de seguida, de forma resumida, uma motiva¸cão de carácter heur´ıstico deste método. Para uma justifica¸cão mais detalhada da aplica¸cão dos “qq-plots” à estima¸cão de ´ındices de cauda pode consultar-se Beirlant et al. (1996).

Se U1,n ≤ . . . ≤ Un,n s˜ao as e.o. (estat´ısticas de ordem) de uma amostra (U1, . . . , Un)

de v.a. i.i.d. uniformemente distribu´ıdas em [0, 1], ent˜ao

E(Ui,n) =

i n + 1.

Assim, espera-se que Ui,nesteja “próximo” da sua média _n+1i , e por consequência, o gráfico

de ½µ i n + 1, Ui,n ¶ , 1 ≤ i ≤ n ¾

deva ser aproximadamente linear com declive 1, o mesmo acontecendo com o gr´afico de ½µ H−1 µ i n + 1 ¶ , Zi,n ¶ , 1 ≤ i ≤ n ¾ ,

em que Z1,n ≤ . . . ≤ Zn,n s˜ao as e.o. de uma amostra (Z1, . . . , Zn) de v.a. i.i.d. com

f.d. H. Notemos que H−1₍ i

n+1) é o quantil da distribui¸cão da popula¸cão e Zi,n o quantil

emp´ırico correspondente, e por isso o nome de “qq-plot”.

O estimador-qq foi introduzido por Kratz e Resnick (1996) usando este método, não no contexto da estima¸cão do coeficiente de cauda exponencial, mas no contexto equivalente da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto, que passamos a apresentar.

Fazendo a mudan¸ca de vari´avel

Xi = eZi,

em que Zi, i = 1, 2, . . . s˜ao v.a. i.i.d. cuja f.d. verifica (1.1.1), tem-se que

1 − G(x) = P [X1 > x] = x−1/αL(x), x > 1, (1.1.6)

onde α = 1/R e

(17)

em que r é a fun¸cão de varia¸cão regular em ∞ que surge em (1.1.1), sendo portanto L de varia¸cão lenta em ∞. Assim 1 − G é uma fun¸cão de varia¸cão regular em ∞ com ´ındice

−1/α. Notemos que (1.1.6) tamb´em se pode escrever na forma equivalente

G−1_{(1 − s) = s}−α_L(s)e _{0 < s < 1,} _(1.1.8)

para a fun¸c˜ao de varia¸c˜ao lenta em zero, eL, que surge em (1.1.2).

Para introduzirmos o estimador-qq comecemos por considerar o caso particular em que

L(x) ≡ 1 em (1.1.7). Neste caso, X1,n ≤ . . . ≤ Xn,n representam as e.o. de uma a.a.

(X1, . . . , Xn) de v.a. i.i.d. com f.d. G que verifica:

1 − G(x) = P [X1 > x] = x−1/α, x > 1, (α > 0).

Para z > 0, seja

H(z) := 1 − P [log X1 > z] = 1 − e−z/α.

Pelo m´etodo-qq, o gr´afico de ½µ α−1_H−1 µ i n + 1 ¶ , log Xi,n ¶ , 1 ≤ i ≤ n ¾ = ½µ − log µ 1 − i n + 1 ¶ , log Xi,n ¶ , 1 ≤ i ≤ n ¾

dever´a ser aproximadamente linear com declive α.

Consideremos agora o caso em que X1,n ≤ . . . ≤ Xn,n designam as e.o. de uma a.a.

(X1, . . . , Xn) de v.a. i.i.d. com f.d. G pertencente `a fam´ılia de Pareto, isto ´e, tal que

1 − G(x) = P [X1 > x] = x−1/αL(x), x > 1, (α > 0),

em que L é uma fun¸cão de varia¸cão lenta em ∞.

Atendendo `a forma da cauda de G, Kratz e Resnick definiram naturalmente o estimador-qq, com base apenas nas kn maiores e.o. da amostra, isto ´e, consideraram

apenas o gr´afico de ½µ − log µ 1 − i kn+ 1 ¶ , log Xn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ .

O estimador-qq, deduzido por Kratz e Resnick no sentido do m´etodo dos m´ınimos quadrados, ´e dado por

b

αqq(kn) =

P_kn

i=1(− log(1−kn+1i )log Xn−kn+i,n)−kn1 (

P_kn

i=1log Xn−kn+i,n)(

(18)

Reparemos agora que, para a determina¸c˜ao deste estimador, foi considerado o gr´afico de ½µ − log µ 1 − i kn+ 1 ¶ , log Xn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ = ½µ log µ kn+ 1 kn− i + 1 ¶ , Zn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ = ½µ log µ kn+ 1 j ¶ , Zn−j+1,n ¶ , 1 ≤ j ≤ kn ¾ ,

em que Zi = log Xi, i = 1, . . . , n, enquanto que para o estimador 1/ bR1(kn) foi considerado

o gr´afico de n³ log³n i ´ , Zn−i+1,n ´ , 1 ≤ i ≤ kn o .

Notemos que a nuvem de pontos considerada para o estimador bαqq(kn) ´e apenas uma

transla¸c˜ao da nuvem de pontos considerada para 1/ bR1(kn). Portanto, as rectas obtidas no

sentido do m´etodo dos m´ınimos quadrados, tˆem em ambos os casos o mesmo declive, pelo que bαqq(kn) = 1/ bR1(kn) (veja-se Brito e Moreira (2001)).

Kratz e Resnick (1996) provaram a consistˆencia do estimador bαqq(kn) de α para qualquer

sucess˜ao kn de inteiros que verifica (1.1.5). Para al´em disso, investigaram a normalidade

assimpt´otica de bαqq(kn), quando centrado em α. Para esse estudo, supuseram que se

verificava uma condi¸cão de varia¸cão regular de segunda ordem para a fun¸cão b dada por

b(t) := µ 1 1 − G ¶₋₁ (t) = G−1 µ 1 − 1 t ¶ . (1.1.10)

Notemos que b(t) = tα_{L(1/t), em que e}e _{L é a fun¸cão de varia¸cão lenta em 0 da expressão}

(1.1.8). Portanto, b ´e de varia¸c˜ao regular em ∞, com ´ındice α.

Kratz e Resnick assumiram que ∃ρ ≤ 0 e uma fun¸cão 0 < A(t) → 0 quando t → ∞, verificando ∀x > 1 b(tx) b(t) − xα A(t) → x α µ xρ_{− 1} ρ ¶ quando t → ∞. (1.1.11) O resultado acerca da normalidade assimptótica de bαqq(kn) é o seguinte:

Teorema 1.1.2 (Kratz e Resnick (1996), Teorema 3.1)

Assumamos que G ´e uma f.d. que satisfaz (1.1.6). Se (1.1.11) se verificar e kn for uma

sucess˜ao de inteiros positivos satisfazendo (1.1.5) e tal que k1/2_n A(n/kn) → 0 quando n → ∞,

ent˜ao,

k_n1/2{bαqq(kn) − α}→ ND

¡

(19)

Neste trabalho estabeleceremos também a normalidade assimptótica do estimador de tipo geométrico bR(kn), quando centrado em R.

No contexto da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto, têm sido propostos muitos estimadores para α, de entre os quais se destaca o clássico estimador de Hill, introduzido por Hill (1975):

b H(kn) = 1 kn kn X i=1

log Xn−i+1,n− log Xn−kn,n. (1.1.12)

As propriedades assimptóticas do estimador de Hill têm sido muito estudadas. A con-sistência fraca foi provada por Mason (1982), para qualquer sucessão kn de inteiros que

verifica (1.1.5). A consistˆencia forte foi provada por Deheuvels et al. (1988), para sucess˜oes

kn de inteiros satisfazendo (1.1.5) e tal que kn/(log(log n)) → ∞ quando n → ∞. A

nor-malidade assimptótica foi investigada por vários autores, dos quais referimos Haeusler e Teugels (1985), Csörg˝o e Mason (1985) e Csörg˝o e Viharos (1995). Os primeiros dois au-tores apresentam resultados para a normalidade assimptótica de bH(kn) centrado em α,

mostrando que sob certas condi¸c˜oes de segunda ordem sobre a cauda de G e para sucess˜oes

kn adequadas, k1/2n n b H(kn) − α o D

→ N (0, α2_{), enquanto que os ´ultimos quatro}

estabele-cem resultados acerca da normalidade assimpt´otica de bH(kn) centrado em sucess˜oes que

convergem para α. Alguns destes resultados ser˜ao apresentados em seguida.

Para isso, consideremos a representa¸cão de Karamata da fun¸cão de varia¸cão lenta em zero eL, que surge em (1.1.8):

e L(s) = a_Le(s) exp ½Z ₁ s b_Le(u) u du ¾ , 0 < s < 1, (1.1.13) onde a_Le(s) → a0 quando s → 0, para algum a0 ∈ (0, ∞), e be_L(s) → 0 quando s → 0.

Definamos a sucess˜ao cn(kn) := n kn Z ₁ 1−kn/n (1 − s)d log G−1_(s). _(1.1.14)

Cs¨org˝o e Mason (1985) come¸cam por provar que:

se G satisfaz (1.1.6) ent˜ao cn(kn) → α quando n → ∞.

Depois estabelecem o resultado que se segue.

Teorema 1.1.3 (Cs¨org˝o e Mason (1985), Teorema 2.3)

Se G satisfizer (1.1.6) e kn verificar (1.1.5), ent˜ao

(20)

onde An:= k1/2n log

©

a_Le(kn/n)/ae_L(1 − Un−kn,n)

ª

, a_Le é a fun¸cão da representa¸cão de Kara-mata de (1.1.13), {Bn(t) : 0 ≤ t ≤ 1}_n≥1 é uma sucessão de pontes Brownianas 1 e U1,n≤ . . . ≤ Un,n denotam as e.o. de uma certa amostra (U1, . . . , Un) de v.a. uniformemente

distribu´ıdas em [0, 1].

Para provarem a normalidade assimpt´otica de kn1/2

n b

H(kn) − cn(kn)

o

, Csörg˝o e Mason assumem que a_Le é constante numa vizinhan¸ca à direita de zero, não degenerada, condi¸cão

equivalente a log G−1_{(1 − s) ser absolutamente cont´ınua, para s numa vizinhan¸ca `a direita}

de zero. Assim sendo, An = 0 quase certamente para n suficientemente grande, provando

da´ı que k1/2_n n b H(kn) − cn(kn) o D → N¡0, α2¢. (1.1.15)

Csörg˝o e Viharos (1995) obtiveram uma generaliza¸cão deste resultado, como corolário do teorema que será apresentado de seguida.

Seja ent˜ao d(·) := a_Le(·) − a0.

Assumamos, para os dois resultados seguintes, que G satisfaz (1.1.6) e que a sucess˜ao

kn verifica (1.1.5).

Teorema 1.1.4 (Cs¨org˝o e Viharos (1995), Teorema 2)

Se, para uma sucess˜ao limitada de n´umeros reais, dn, tivermos

kn n d(1 − Un−kn,n) − d(kn/n) 1 − Un−kn,n− kn/n − dn → 0,P ent˜ao _µ kn α2_{+ (d}_n_/a0₎2 ¶_1/2_n b H(kn) − cn(kn) o D → N (0, 1) .

O resultado que se segue, corolário do Teorema 1.1.4, é válido apenas para fun¸cões d diferenciáveis, e corresponde a uma generaliza¸cão do resultado (1.1.15) de Csörg˝o e Mason (1985).

Corol´ario 1.1.1 (Cs¨org˝o e Viharos (1995), Corol´ario 2)

Se a derivada d0 _{de d existir numa vizinhan¸ca `a direita de zero, n˜ao degenerada, e se}

sd0_{(s) → d}

0 quando s → 0, ent˜ao tem-se necessariamente que d0 = 0, e k1/2 n n b H(kn) − cn(kn) o D → N¡0, α2¢_.

1_{Um processo estoc´astico {B(t); 0 ≤ t ≤ 1} designa-se por ponte Browniana se:}

i) a distribui¸cão conjunta de B(t1), B(t2), ..., B(tn), com 0 ≤ t1≤ ... ≤ tn≤ 1, n = 1, 2, ..., é normal; ii) a fun¸cão de covariância de B(t) é dada por R(s, t) = E(B(s)B(t)) = min(s, t) − st;

(21)

´

E de salientar que todos os resultados acerca da normalidade assimptótica do estimador de Hill, centrado em sucessões determin´ısticas que convergem para α, requerem condi¸cões restritivas sobre a fam´ılia (1.1.6).

A distribui¸c˜ao assimpt´otica dos estimadores 1/ bRi(kn), i = 1, 2, 3, de 1/R, foi estudada

por Csörg˝o e Viharos (1997), neste mesmo contexto da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto. Estes autores mostraram que, para sucessões kn adequadas,

1/ bRi(kn), i = 1, 2, 3, s˜ao universalmente assimptoticamente normais sobre toda a fam´ılia

(1.1.6), quando centrados em sucessões determin´ısticas que convergem para α = 1/R. Para além disso, o factor de normaliza¸cão obtido para 1/ bRi(kn), i = 1, 3, é kn1/2, e, como Csörg˝o e

Viharos salientam, estes foram os primeiros estimadores assimptoticamente normais sobre toda a fam´ılia (1.1.6), com o factor ideal kn1/2. Enunciamos de seguida alguns dos resultados

estabelecidos, importantes para o seguimento do trabalho, escrevendo-os assim no contexto da estima¸c˜ao do coeficiente de cauda exponencial.

Teorema 1.1.5 (Cs¨org˝o e Viharos (1997), Teorema 1.1)

Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros positivos que

verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,

k_n1/2 n 1/ bR1(kn) − µ(1)n (kn) o D → N¡0, 2/R2¢, onde µ(1) n (kn) := − n kn Z _k_n_/n 0 F−1_{(1 − t}−₎ ½ 1 + log µ nt kn ¶¾ dt → 1/R quando n → ∞.

Teorema 1.1.6 (Cs¨org˝o e Viharos (1997), Teorema 1.3)

Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros positivos que

verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,

k_n1/2 n 1/ bR3(kn) − µ(3)n (kn) o D → N¡0, 2/R2¢, onde µ(3)_n (kn) := n kn R_k_n_/n 0 (F−1)2(1 − t−)dt − ³ n kn R_k_n_/n 0 F−1(1 − t−)dt ´₂ −n kn R_k_n_/n 0 F−1(1 − t−) n 1 + log ³ nt kn ´o dt → 1/R quando n → ∞.

Ainda no contexto da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto, Viharos (1999) propôs uma classe de estimadores de m´ınimos quadrados “pesados” que contém o estimador 1/ bR1(kn). Para uma dada classe de fun¸cões peso, o mesmo autor

provou que estes estimadores s˜ao, tal como 1/ bR1(kn), universalmente assimptoticamente

normais sobre toda a fam´ılia (1.1.6).

Neste trabalho, mostraremos que o estimador de tipo geométrico, bR(kn), é também

(22)

sucessão determin´ıstica que converge para R. Para além disso, o factor de normaliza¸cão obtido é também kn1/2.

Notemos que esta propriedade não é partilhada pelo estimador de Hill. Csörg˝o e Vi-haros (1995) constru´ıram, para cada α > 0, uma fun¸cão quantil G−1 _{que satisfaz (1.1.8)}

e tal que bH([n2/3_{]) não tem distribui¸cão assimptótica não degenerada para quaisquer}

sucess˜oes de normaliza¸c˜ao. O exemplo apresentado corresponde a tomar, em (1.1.8), e

L(s) = 1 + s sin(1/s). Assim, o estimador de Hill bH(kn) n˜ao ´e universalmente

assimp-toticamente normal sobre toda a fam´ılia (1.1.6).

Para outros estimadores de α, veja-se, por exemplo, Csörg˝o et al. (1985), Dekkers et al. (1989), Bacro e Brito (1993), Caeiro e Gomes (2002), Csörg˝o e Viharos (1998) e referências citadas.

Tendo em vista a constru¸cão de intervalos de confian¸ca para α, um problema bastante estudado é o da possibilidade de aplica¸cão de técnicas de reamostragem na utiliza¸cão dos estimadores propostos. Nos últimos tempos tem havido, em geral, um interesse acrescido em usar os métodos bootstrap na inferência estat´ıstica (veja-se, por exemplo, Gomes (1994), Caers et al. (1998), Brito (2001) e referências citadas). Bacro e Brito (1998) introduziram um procedimento bootstrap, designado por bootstrap de cauda, adequado ao problema particular da estima¸cão do ´ındice de cauda superior da fam´ılia de Pareto (que será descrito na seçcão 1.5), e mostraram que usando esse método é poss´ıvel construir intervalos de confian¸ca para α (ou, equivalentemente para R), com base no estimador de Hill. Denotando por Φ a f.d. N(0, 1), o resultado correspondente é o seguinte:

Teorema 1.1.7 (Bacro e Brito (1998), Teorema 1)

Assumamos que G satisfaz (1.1.6), que eL é a fun¸cão de varia¸cão lenta em zero que surge em (1.1.8) e que kn é uma sucessão de inteiros positivos que satisfaz (1.1.5). Se, quando

n → ∞, k_n1/2 sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log Ã e L¡ytkn n ¢ e L¡kn n ¢ !¯_¯ ¯ ¯ ¯→0

uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao, em probabilidade, para todo o x, P h b H(kn)−1kn1/2 ³ b H∗(kn) − bH(kn) ´ ≤ x | (Xn−kn,n, . . . , Xn,n) i →Φ (x) quando n → ∞, em que bH∗_(k

n) ´e a vers˜ao bootstrap de cauda do estimador bH(kn).

Neste trabalho mostraremos que, usando o procedimento bootstrap de cauda ´e poss´ıvel construir intervalos de confian¸ca para R, com base no estimador de tipo geom´etrico bR(kn).

(23)

estacionárias, com uma estrutura de dependência semelhante à considerada por Hsing, e faremos uma aplica¸cão ao caso de sucessões estacionárias m-dependentes.

Na seçcão 1.2, introduziremos o já referido estimador de tipo geométrico, bR(kn), para

o coeficiente de cauda exponencial, relacionado com os estimadores bR1(kn) e bR3(kn) de

Schultze e Steinebach, e provaremos um resultado acerca da sua consistência. Na seçcão 1.3 mostraremos que, para sucessões kn que verifiquem (1.1.5) e tais que kn/ log4n → ∞

quando n → ∞, bR(kn) ´e assimptoticamente normal sobre toda a classe de fun¸c˜oes de

distribui¸cão que satisfazem (1.1.1), quando centrado numa certa sucessão determin´ıstica que converge para R. Na seçcão 1.4 estabeleceremos um resultado acerca da normalidade assimptótica de bR(kn), quando centrado em R. Na seçcão 1.5 iremos considerar o

proced-imento bootstrap de cauda introduzido por Bacro e Brito (1998) e mostrar que ´e poss´ıvel, usando esse m´etodo, construir intervalos de confian¸ca para R, com base no estimador

b

R(kn). Por fim, na seçcão 1.6 estudaremos a consistência do novo estimador no caso de

v.a. dependentes, seguindo o estudo de Hsing (1991) para o estimador de Hill.

1.2 Um estimador geom´

etrico para coeficiente de cauda

exponencial, b

R

No seguimento do estudo dos estimadores bR1(kn) e bR3(kn) correspondentes `as Figuras 1 e

2, consideramos os dois pontos de vista simultaneamente, minimizando a soma das ´areas dos rectˆangulos indicados na figura seguinte.

z (z , y ) (ay + b , Rz - d) y i i i i i i y z Figura 3.

Assim, um novo estimador para R de tipo geom´etrico, bR(kn), resulta da minimiza¸c˜ao

da fun¸c˜ao f (R, d) = kn X i=1 (yi− Rzi+ d)(R−1yi+ R−1d − zi).

(24)

b R(kn) = v u u u u t P_k_n

i=1log2(n/i) − k1n

³P_k_n i=1log(n/i) ´₂ P_k_n i=1Zn−i+1,n2 − k1n ³P_k_n i=1Zn−i+1,n) ´₂. (1.2.1)

Notemos que bR(kn) é a média geométrica dos estimadores bR1(kn) e bR3(kn), isto é,

b

R(kn) =

q b

R1(kn) bR3(kn).

Tendo em conta esta propriedade, estabelecemos facilmente a consistˆencia de bR(kn).

Teorema 1.2.1 Seja F uma f.d. que verifica (1.1.1) e kn uma sucess˜ao de inteiros que

satisfaz (1.1.5) e tal que log2n/kn → 0 quando n → ∞. Suponhamos ainda que F−1 ´e

cont´ınua em (s0, 1) para algum s0 ∈ (0, 1). Temos ent˜ao que:

b

R(kn)→ R.P

Prova do Teorema 1.2.1. Pelo Teorema 1.1.1, b

R1(kn)→ RP e Rb3(kn)→ R,P

o que implica, pelo Teorema de Slutsky, que b R(kn) = q b R1(kn) bR3(kn)→P √ R2 _{= R,}

como pretend´ıamos mostrar. ¥

O lema que se segue descreve a rela¸c˜ao de ordem entre os trˆes estimadores.

Lema 1.2.1 Sejam bR1(kn), bR3(kn) e bR(kn) os estimadores definidos em (1.1.3), (1.1.4)

e (1.2.1), respectivamente. Temos ent˜ao que

b

R3(kn) ≤ bR(kn) ≤ bR1(kn).

Prova do Lema 1.2.1. Para provarmos o pretendido, ´e suficiente mostrarmos que b

R3(kn) ≤ bR1(kn),

pois, sendo bR(kn) a m´edia geom´etrica dos estimadores bR1(kn) e bR3(kn), bR(kn) encontra-se

necessariamente enquadrado entre os dois.

(25)

≤  Xkn i=1 log2_{(n/i) −} 1 kn Ã kn X i=1 log (n/i) !2   Xkn i=1 Z2 n−i+1,n− 1 kn Ã kn X i=1 Zn−i+1,n !2  . (1.2.2) Mas, kn X i=1

log (n/i) Zn−i+1,n−

1 kn kn X i=1 Zn−i+1,n kn X i=1 log (n/i) = = kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) ! Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n ! , kn X i=1 log2(n/i) − 1 kn Ã _k n X i=1 log (n/i) !2 = kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) !2 e, analogamente, kn X i=1 Z2 n−i+1,n− 1 kn Ã _k n X i=1 Zn−i+1,n !2 = kn X i=1 Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !2 .

A desigualdade (1.2.2) ´e assim equivalente `a seguinte: Ã _k n X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) ! Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !!2 ≤ ≤ kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) !_{2 k} n X i=1 Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !2 ,

decorrendo, esta ´ultima, directamente da desigualdade de Cauchy-Schwarz. ¥

De modo a ilustrarmos o comportamento amostral finito do novo estimador, na seçcão 3.2 extendemos o estudo de simula¸cão de Schultze e Steinebach (1996) a bR(kn). Nesse

estudo inclu´ımos um procedimento emp´ırico para a escolha de kn no caso do estimador

b

R(kn), por adapta¸c˜ao da t´ecnica usada por Schultze e Steinebach (1996) para os

esti-madores bR1(kn) e bR3(kn).

1.3 Comportamento limite fraco de b

R

Como já referimos na seçcão 1.1, Csörg˝o e Viharos (1997) estudaram a distribui¸cão as-simptótica dos estimadores 1/ bR1(kn) e 1/ bR3(kn) de 1/R, quando centrados em certas

sucess˜oes determin´ısticas que convergem para 1/R.

Considerando agora o estimador 1/ bR(kn) de 1/R, estabelecemos o seguinte resultado

(26)

Proposi¸c˜ao 1.3.1 Seja F uma f.d. que verifica (1.1.1). Se knfor uma sucess˜ao de inteiros

positivos que verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,

k1/2_n n 1/ bR(kn) − µn(kn) o D → N¡0, 2/R2¢,

onde µn(kn) := (µ(1)n (kn)µ(3)n (kn))1/2 → 1/R quando n → ∞, e µ(1)n (kn) e µ(3)n (kn) s˜ao as

sucess˜oes definidas nos Teoremas 1.1.5 e 1.1.6.

Para provarmos o teorema, iremos usar os dois lemas que se seguem.

No primeiro lema estuda-se a ordem de grandeza da sucess˜ao in(kn) definida por

in(kn) := 1 kn kn X i=1 log2(n/i) − Ã 1 kn kn X i=1 log(n/i) !2 . (1.3.1)

Lema 1.3.1 Seja kn uma sucess˜ao de inteiros positivos tal que 1 ≤ kn ≤ n. Para a

sucess˜ao in(kn) definida em (1.3.1) temos que

in(kn) = 1 + O µ log2kn kn ¶ .

Prova. Comecemos por notar que

in(kn) = 1 kn kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) !2 = 1 kn kn X i=1 Ã log i − 1 kn kn X i=1 log i !2 = 1 kn kn X i=1 log2i − Ã 1 kn kn X i=1 log i !2 .

Escrevamos ent˜ao i(kn) ≡ in(kn) = _k1_n

P_k_n i=1log2i − ³ 1 kn P_k_n i=1log i ´₂ .

Observemos agora que

(27)

Portanto, i(kn) ≤ kn+ 1 kn £ log2(kn+ 1) − 2 log(kn+ 1) ¤ + 2 − 1 k2 n [knlog kn− (kn− 1)]2 = ¡log2_(k n+ 1) − log2kn ¢ + 2 (log kn− log(kn+ 1)) − 2 kn (log (kn+ 1) + log kn) + 1 kn log2(kn+ 1) + 2 kn − 1 k2 n + 1 = O µ log kn kn ¶ + O µ 1 kn ¶ + O µ log kn kn ¶ + O µ log2kn kn ¶ + O µ 1 kn ¶ + O µ 1 k2 n ¶ + 1 = 1 + O µ log2kn kn ¶ ,

como pretend´ıamos mostrar. ¥

Lema 1.3.2 (Cs¨org˝o e Viharos (1997), Lema 5.6)

Suponhamos que (1.1.1) se verifica e seja kn uma sucess˜ao de inteiros positivos verificando

(1.1.5), tal que kn/ log4n → ∞ quando n → ∞,

Wn(kn) := 1 kn kn X i=1 Z_n−i+1,n2 − Ã 1 kn kn X i=1 Zn−i+1,n !2

e µn(kn) = (µ(1)n (kn)µ(3)n (kn))1/2. Ent˜ao, kn1/2{Wn(kn) − µ2n(kn)} = Nn∗ + oP(1), para uma

dada sucess˜ao N∗

n = Nn∗(ln, kn) (onde ln ´e uma sucess˜ao convenientemente escolhida) que

´e tal que

N_n∗ → ND Ã 0, 8 µ 1 R ¶₄! .

Prova da Proposi¸cão 1.3.1. Atendendo à expressão de bR(kn) podemos escrever:

k1/2 n n 1/ bR(kn) − µn(kn) o = k1/2 n (µ Wn(kn) in(kn) ¶_1/2 − µn(kn) ) = µ kn in(kn) ¶_1/2_© W1/2 n (kn) − µn(kn) ª − µn(kn) µ kn in(kn) ¶_1/2_¡ i1/2 n (kn) − 1 ¢ ,(1.3.2)

em que in(kn) é a sucessão definida em (1.3.1) e (Wn(kn)) é a sucessão do Lema 1.3.2.

(28)

com min(µ2 n(kn), Wn(kn)) < ξn < max(µ2n(kn), Wn(kn)). Pelo Lema 1.3.2, k1/2 n © Wn(kn) − µ2n(kn) ª _D → N¡0, 8/R4¢_,

e por consequˆencia Wn(kn) − µ2n(kn) → 0. Os Teoremas 1.1.5 e 1.1.6 asseguram queP

µ2

n(kn) → 1/R2 quando n → ∞. Portanto temos que Wn(kn)→ 1/RP 2, e consequentemente

ξn(kn)→ 1/RP 2. Assim,

ª _D

→ N¡0, 2/R2¢.

Agora, pelo Lema 1.3.1, in(kn) → 1 quando n → ∞, e portanto, para provarmos o

pretendido, basta, atendendo `a express˜ao (1.3.2), mostrar que

k1/2

n (i1/2n (kn) − 1) → 0 quando n → ∞.

Mas, novamente pelo Lema 1.3.1, temos que

in(kn) − 1 = O µ log2kn kn ¶ , e, consequentemente, k_n1/2¡i1/2_n (kn) − 1 ¢ = O µ log2kn k1/2n ¶ . ¥

Conclu´ımos, ent˜ao, que o estimador 1/ bR(kn) ´e, tal como os estimadores 1/ bR1(kn)

e 1/ bR3(kn), universalmente assimptoticamente normal sobre toda a classe de fun¸c˜oes

de distribui¸c˜ao que satisfazem (1.1.1), desde que a sucess˜ao kn verifique (1.1.5) e que

kn/ log4n → ∞ quando n → ∞. Para além disso, o factor de normaliza¸cão obtido é

tamb´em o factor ideal k1/2n .

Considerando agora a transforma¸cão h(x) = 1/x, o teorema que se segue é consequência imediata da Proposi¸cão 1.3.1.

Teorema 1.3.1 Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros

positivos que verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,

k1/2_n n b R(kn) − µ−1n (kn) o D → N¡0, 2R2¢, onde µn(kn) é a sucessão definida na Proposi¸cão 1.3.1.

Temos assim que o estimador bR(kn) de R ´e tamb´em universalmente assimptoticamente

normal sobre toda a classe de fun¸cões de distribui¸cão que satisfazem (1.1.1), desde que a sucessão kn verifique (1.1.5) e que kn/ log4n → ∞ quando n → ∞. O factor de

(29)

1.4 Normalidade assimpt´

otica de b

R

Nesta seçcão iremos estudar a distribui¸cão assimptótica de bR(kn) centrado em R, de modo

a que seja poss´ıvel a constru¸c˜ao de intervalos de confian¸ca assimpt´oticos para R.

Consideremos uma amostra gen´erica, Vn = (V1, . . . , Vn), de v.a. i.i.d. com f.d. comum

J. Uma v.a. que dependa da amostra Vn e de uma caracter´ıstica da popula¸c˜ao, R, ser´a

designada por ra´ız e denotada por Rn(Vn, R). Habitualmente, uma ra´ız ´e constru´ıda de

forma a que informa¸cões acerca da estima¸cão de R possam ser extra´ıdas da sua f.d., que denotamos por Hn(·, J). A t´ıtulo de exemplo destacamos o caso da constru¸cão de intervalos

de confian¸ca a partir dos quantis da f.d. O limite fraco n˜ao degenerado de Hn(·, J), caso

exista, ser´a denotado por HA(·, J).

Ao longo desta seçcão e também da seçcão 1.5 usaremos ainda as seguintes nota¸cões. Sendo T1, T2, . . . e T10, T20, . . . duas sucessões de v.a., denotamos por Sn2(T) a variância

emp´ırica de T = (T1, . . . , Tn) e por Sn(T, T0) a covariˆancia emp´ırica entre T e

T0 _{= (T}0 1, . . . , Tn0), ou seja, S2 n(T) = 1 n n X i=1 (Ti− 1 n n X i=1 Ti)2 e Sn(T, T0) = 1 n n X i=1 Ã (Ti− 1 n n X i=1 Ti)(Ti0 − 1 n n X i=1 T0 i) ! .

Consideremos agora a amostra Wkn = (W1, . . . , Wkn) definida em Bacro e Brito (1998),

em que:

Wi := Zn−kn+i,n− Zn−kn,n, 1 ≤ i ≤ kn. (1.4.1)

Observemos que W1 ≤ W2 ≤ . . . ≤ Wkn.

Com esta nota¸c˜ao,

1 b R2_(k n) = 1 kn P_k_n i=1Zn−i+1,n2 − ³ 1 kn P_k_n i=1Zn−i+1,n ´₂ 1 kn P_k_n i=1log2(ni) − ³ 1 kn P_k_n i=1log(n/i) ´₂ = 1 kn P_k_n i=1(Zn−i+1,n− Zn−kn,n) 2₋³ 1 kn P_k_n i=1(Zn−i+1,n− Zn−kn,n) ´₂ 1 kn P_k_n

i=1log2(n/i) −

³ 1 kn P_k_n i=1log(n/i) ´₂ = 1 in(kn)   1 kn kn X i=1 W2 i − Ã 1 kn kn X i=1 Wi !2  , (1.4.2)

(30)

Consideremos agora a ra´ız R0_n= R_n0 ((Zn−kn,n, Wkn) , R) = R2 √ 8k 1/2 n Ã 1 b R2_(k n) − 1 R2 ! . (1.4.3) Denotemos por H0 n(·, F ) a f.d. de R0n: H0 n(x, F ) = P [R0n((Zn−kn,n, Wkn) , R) ≤ x] , (1.4.4) e por H0

A(·, F ) o limite fraco n˜ao degenerado dessa f.d..

No resultado que se segue estabelecemos a normalidade assimpt´otica da ra´ız R0 n, isto

´e, mostramos que sob certas condi¸c˜oes, H0

A(·, F ) = Φ(·) (veja-se Brito e Moreira Freitas

(2003b)).

Proposi¸c˜ao 1.4.1 Assumamos que F satisfaz a condi¸cão (1.1.1), que eL é a fun¸cão de varia¸cão lenta em zero que surge em (1.1.2) e que kn é uma sucessão de inteiros positivos

que satisfaz (1.1.5). Se, quando n → ∞, k1/2 n sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log Ã e L¡ytkn n ¢ e L¡kn n ¢ !¯_¯ ¯ ¯ ¯→ 0 (1.4.5)

uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao, R2 √ 8k 1/2 n Ã 1 b R2_(k n) − 1 R2 ! D → N(0, 1).

Prova. Comecemos por considerar a ra´ız

R00 n= Rn00((Zn−kn,n, Wkn) , R) = R2 √ 8k 1/2 n Ã in(kn) b R2_(k_n₎− 1 R2 ! . (1.4.6)

Como (Zi) = (FD −1(Ui)), onde (Ui) é uma sucessão de v.a. com distribui¸cão uniforme

em [0, 1], Ui ∼ U[0,1], ent˜ao podemos escrever, sem perda de generalidade, Wi = F−1(Un−kn+i,n) − F

−1_(U

n−kn,n) .

(31)

Notemos que (Ykn, . . . , Y1) tem distribui¸c˜ao igual `a do vector de e.o. de uma amostra de

v.a. i.i.d., de dimens˜ao kn, de uma distribui¸c˜ao U[0,1] (veja-se, por exemplo, Reiss (1989)).

Usando as express˜oes (1.4.2) e (1.4.7), podemos escrever:

in(kn) b R2_(k n) − 1 R2 = 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !₂ − Ã 1 kn kn X i=1 Ã −1 R log Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !!2 − 1 R2 = 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) − 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !!2 − 1 R2 = S2 kn(E) + S 2 kn(F) + 2Skn(E, F) − 1 R2, onde E = (E1, . . . , Ekn), F = (F1, . . . , Fkn), Ei := − 1 Rlog Yi, i = 1, . . . , kn e Fi := log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) , i = 1, . . . , kn. Temos, portanto, R_n00 = R 2 √ 8k 1/2 n µ S_k2_n(E) − 1 R2 ¶ + R 2 √ 8k 1/2 n ¡ S_k2_n(F) + 2Skn(E, F) ¢ . (1.4.8)

Notemos agora que

(− log Yi, 1 ≤ i ≤ kn)= (TD i,kn, 1 ≤ i ≤ kn), (1.4.9)

onde (T1,n, T2,n, ..., Tn,n) é o vector das e.o. de uma a.a., de dimensão n, de uma distribui¸cão

exponencial de m´edia 1, Exp (1) . Desta forma, temos que S2

kn(E) é a variância amostral de uma amostra de dimensão

kn de v.a. i.i.d. com distribui¸c˜ao exponencial de m´edia 1/R. Assim sendo, fazendo alguns

c´alculos simples, usando o Teorema do Limite Central e o Teorema de Slutsky, conclu´ımos que R2 √ 8k 1/2 n µ S_k2_n(E) − 1 R2 ¶ D → N(0, 1)

(32)

Mostraremos em seguida que k1/2 n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0,

de forma a concluirmos que R00 n D → N(0, 1). Observemos que (Skn(E, F)) 2 _{≤ S}2 kn(E)S 2 kn(F). Assim, k1/2 n |Skn(E, F)| = OP(1)(knS 2 kn(F)) 1/2_. _(1.4.10)

Considerando agora o termo S2

kn(F), podemos observar que

S2 kn(F) = 1 kn kn X i=1 Ã log eL (Yi(1 − Un−kn,n)) − 1 kn kn X i=1 log eL (Yi(1 − Un−kn,n)) !2 = 1 kn kn X i=1 Ã logL (Ye i(1 − Un−kn,n)) e L (kn/n) − 1 kn kn X i=1 logL (Ye i(1 − Un−kn,n)) e L (kn/n) !2 ≤ 1 kn kn X i=1 Ã logL (Ye i(1 − Un−kn,n)) e L (kn/n) !₂ ≤ sup Y_kn≤y≤1 Ã log L (y (1 − Ue n−kn,n)) e L (kn/n) !₂ ,

o que implica que

k1/2 n Sk2n(F) ≤ k 1/2 n Ã sup Y_kn≤y≤1 ¯ ¯ ¯ ¯ ¯log e L (y (1 − Un−kn,n)) e L (kn/n) ¯ ¯ ¯ ¯ ¯ !₂ . (1.4.11)

Provemos agora, com base em (1.4.10) e (1.4.11), o lema que se segue. Lema 1.4.1 Sob (1.4.5), k1/2 n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0.

(33)

que converge para zero quando n → ∞, pela condi¸c˜ao (1.4.5).

Como P [An(λ1, λ2)] → 1 quando n → ∞, ent˜ao segue de (1.4.11) e de (1.4.10) que k1/2n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0. ¥

Fica assim mostrado, como j´a referimos, que R00 n

D

→ N(0, 1).

Consideremos finalmente a ra´ız R0

n definida em (1.4.3), e provemos, como ´e pretendido,

que R0 n D → N(0, 1). Podemos escrever R0 n = R2 √ 8k 1/2 n Ã 1 b R2_(k n) − 1 R2 ! = 1 in(kn) R00_n+ k 1/2 n √ 8 µ 1 in(kn) − 1 ¶ .

Relembremos agora que, pelo Lema 1.3.1,

in(kn) = 1 + O µ log2_k n kn ¶ . Assim, 1

in(kn) → 1 quando n → ∞. Logo, pelo Teorema de Slutsky,

1 in(kn) R00 n D → N(0, 1).

Para al´em disso,

k_√n1/2 8 µ 1 in(kn) − 1 ¶ = O µ log2kn kn1/2 ¶ ,

que converge para 0 quando n → ∞. Novamente, pelo Teorema de Slutsky, conclu´ımos que R0

n D

→ N(0, 1), como pretend´ıamos demonstrar. ¥

Consideremos agora a ra´ız

Rn = Rn((Zn−kn,n, Wkn) , R) = 1 √ 2Rk 1/2 n ³ b R(kn) − R ´ (1.4.13) e denotemos por Hn(·, F ) a f.d. da mesma:

Hn(x, F ) = P [Rn((Zn−kn,n, Wkn) , R) ≤ x] , (1.4.14)

e por HA(·, F ) o limite fraco n˜ao degenerado de Hn(·, F ).

Considerando a transforma¸cão h(x) = 1/√x, obtém-se como consequência imediata da

(34)

Teorema 1.4.1 Assumamos que F satisfaz a condi¸cão (1.1.1), que eL é a fun¸cão de varia¸cão lenta em zero que surge em (1.1.2) e que kn é uma sucessão de inteiros

posi-tivos que satisfaz (1.1.5). Se, quando n → ∞, k1/2 n sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log Ã e L¡ytkn n ¢ e L¡kn n ¢ !¯_¯ ¯ ¯ ¯→ 0

uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao,

1 √ 2Rk 1/2 n ³ b R(kn) − R ´ D → N(0, 1).

De forma a obtermos condi¸cões mais expl´ıcitas, é necessário especificar o comporta-mento da fun¸cão de varia¸cão lenta definida em (1.1.7):

L(x) = r(log x),

onde r é a fun¸cão de varia¸cão regular da fam´ılia (1.1.1).

Para isso usamos a no¸cão de varia¸cão lenta com resto (veja-se Bingham et al. (1987), Cap´ıtulo 3), e, em particular, consideramos a seguinte rela¸cão assimptótica:

(SR1) L(tx)/L(x) − 1 = O(g(x)) quando x → ∞, para cada t > 0,

onde g é uma fun¸cão positiva tal que g(x) → 0 quando x → ∞. Para simplificar, assumimos que g é de varia¸cão regular com ´ındice γ < 0. Como foi mostrado em Bacro e Brito (1998), sob a suposi¸cão anterior, a condi¸cão (1.4.5) pode ser muito simplificada. Apresentamos aqui o seguinte resultado:

Corol´ario 1.4.1 Assumamos que a fun¸c˜ao de varia¸c˜ao lenta L em (1.1.7) satisfaz (SR1),

com g de varia¸c˜ao regular em ∞ com ´ındice γ < 0. Ent˜ao, se k1/2 n g ¡ exp(F−1_{(1 − k} n/n)) ¢ → 0 quando n → ∞, temos 1 √ 2Rk 1/2 n ³ b R(kn) − R ´ D → N(0, 1).

A prova deste corolário é igual à demonstra¸cão do Corolário 1 de Bacro e Brito (1998), que passamos a apresentar.

Prova do Corol´ario 1.4.1. Para esta prova usaremos os seguintes factos: Facto 1 (Bingham, Goldie e Teugels (1987))

(35)

Facto 2 (Bacro e Brito (1995))

1 − F (F−1_{(1 − u)) = u{1 + O(g(exp F}−1_{(1 − u)))} quando u → 0.}

Facto 3 (Bingham, Goldie e Teugels (1987)) Se f ´e de varia¸c˜ao regular com ´ındice ρ < 0,

f localmente limitada em [a, ∞), a ≥ 0, ent˜ao

sup{f (t) : t ≥ x} ∼ f (x) quando x → ∞.

Sejam agora 1/kn ≤ y ≤ 1 e a ≤ t ≤ b, com 0 < a < 1 < b < ∞. Combinando a

equa¸c˜ao (1.1.1) com a equa¸c˜ao (1.1.2) podemos escrever Ã e L(ytkn/n) e L(kn/n) !_R = ytL(exp F−1(1 − ytkn/n)) L(exp F−1_{(1 − k} n/n)) 1 − F (F−1_{(1 − k} n/n)) 1 − F (F−1_{(1 − ytk} n/n)) . Usando os Factos 1 e 2, sup 1 kn≤y≤1 sup a≤t≤b R ¯ ¯ ¯ ¯ ¯log e L(ytkn/n) e L(kn/n) ¯ ¯ ¯ ¯ ¯= sup1 kn≤y≤1 sup a≤t≤b O(g(exp F−1(1 − ytkn/n))).

Consequentemente, se kn1/2g (exp F−1(1 − kn/n)) → 0 quando n → ∞, o resultado segue

pelo Facto 3 e pelo Teorema 1.4.1. ¥

Uma subfam´ılia da fam´ılia de Pareto, escrita na forma (1.1.8), bastante usada no con-texto da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto, ´e a designada fam´ılia de Hall, dada por:

G−1_{(1 − s) = s}−α_D 1 ¡ 1 + D2sβ{1 + o (1)} ¢ quando s → 0, (1.4.15) onde D1 > 0, D2 6= 0 e β > 0 s˜ao constantes.

No contexto da estima¸cão do coeficiente de cauda exponencial, esta fam´ılia corresponde à seguinte: F−1_{(1 − s) = log}¡_s−1/R_D 1 ¡ 1 + D2sβ{1 + o (1)} ¢¢ quando s → 0, (1.4.16) onde D1 > 0, D2 6= 0 e β > 0 são constantes.

Agora, determinemos condi¸cões sob as quais a condi¸cão do corolário anterior é válida para esta fam´ılia (1.4.16).

Fazendo alguns c´alculos vemos facilmente que para esta fam´ılia

L(x) = DR