Agradecimentos
Quero come¸car por manifestar os meus sinceros agradecimentos `a Professora Doutora Margarida Brito, pelo apoio e aten¸c˜ao dedicados durante a orienta¸c˜ao da tese.
Desejo tamb´em agradecer ao meu marido por toda a sua ajuda e ˆanimo.
Agrade¸co ao Centro de Matem´atica e `a Faculdade de Ciˆencias da Universidade do Porto o facto de me terem apoiado durante este trabalho, bem como `a Faculdade de Economia, pelo mesmo motivo e pelo facto de me ter dado equipara¸c˜ao a bolseiro para a realiza¸c˜ao da presente tese.
Estou ainda grata `a minha fam´ılia pelo incentivo transmitido.
Resumo
Neste trabalho estudamos o problema da estima¸c˜ao do coeficiente de cauda exponencial R da fam´ılia de fun¸c˜oes de distribui¸c˜ao F que verificam
1 − F (z) = r(z)e−Rz, z > 0,
em que r ´e uma fun¸c˜ao de varia¸c˜ao regular em ∞ e R > 0.
A estima¸c˜ao de R ´e um problema muito importante, com aplica¸c˜oes em diversos dom´ınios como, por exemplo, em teoria do risco. Em particular, sob certas condi¸c˜oes, a estima¸c˜ao de R corresponde `a estima¸c˜ao do coeficiente de ajustamento, conforme provado por Cs¨org˝o e Steinebach (1991).
Motivados por considera¸c˜oes de tipo geom´etrico, introduzimos, a partir de uma amostra de vari´aveis aleat´orias independentes e identicamente distribu´ıdas, um estimador consis-tente para R, bR, relacionado com os estimadores de m´ınimos quadrados propostos por
Schultze e Steinebach (1996). Mostramos que este estimador ´e universalmente assimptot-icamente normal sobre toda a fam´ılia considerada, quando centrado numa certa sucess˜ao determin´ıstica que converge para R, e estabelecemos um resultado acerca da sua normali-dade assimpt´otica, quando centrado em R.
Investigamos ainda a possibilidade de aplica¸c˜ao de t´ecnicas de reamostragem na uti-liza¸c˜ao do estimador proposto. Conclu´ımos que, usando o m´etodo bootstrap de cauda, introduzido por Bacro e Brito (1998), ´e poss´ıvel construir intervalos de confian¸ca para R. Estudamos tamb´em o problema da estima¸c˜ao do coeficiente de ajustamento no modelo de Sparre Andersen para uma companhia de seguros, sob condi¸c˜oes gerais assegurando a validade da aproxima¸c˜ao de Lundberg. O coeficiente de ajustamento corresponde ao coeficiente de cauda exponencial da distribui¸c˜ao subjacente a uma sucess˜ao auxiliar con-siderada por Cs¨org˝o e Steinebach (1991). Os resultados obtidos sobre a estima¸c˜ao de R s˜ao assim aplic´aveis neste contexto. De forma a obter uma melhor descri¸c˜ao da realidade tˆem sido propostas na literatura generaliza¸c˜oes do modelo de risco cl´assico. Consideramos um desses modelos de risco generalizado, e estudamos, tamb´em neste caso, o problema da estima¸c˜ao de um majorante para a probabilidade de ru´ına.
Alguns resultados s˜ao ilustrados atrav´es de estudos de simula¸c˜ao, adaptando-se um procedimento emp´ırico proposto por Schultze e Steinebach (1996) ao estimador bR, para a
escolha do n´umero de observa¸c˜oes de cauda a incluir na estima¸c˜ao.
Investigamos tamb´em a consistˆencia do estimador bR no caso de vari´aveis dependentes,
e mostramos que bR ´e consistente para sucess˜oes estacion´arias, com uma estrutura de
Abstract
In this work, we study the problem of estimating the exponential tail coefficient R of the family of distribution functions F satisfying
1 − F (z) = r(z)e−Rz, z > 0,
where r is a regularly varying function at ∞ and R > 0.
The problem of estimating the tail coefficient R has received considerable attention and common applications may be found in a big variety of domains, in particular in risk theory. Under certain conditions, the problem of estimating R corresponds to the estimation of the adjustment coefficient as shown by Cs¨org˝o and Steinebach (1991).
Motivated by geometric-type considerations, we propose a consistent estimator for R, b
R, that is directly related to the least squares estimators of Schultze and Steinebach (1996).
We show that this estimator is universally asymptotically normal over the whole family above, when centered at a deterministic sequence converging to R, and prove that bR is
asymptotically normal, when centered at R.
We also investigate the possibility of application of resampling technics to the proposed estimator. We concluded that, using the tail bootstrap method introduced by Bacro and Brito (1998), it is possible to construct confidence intervals for R.
We also study the problem of estimating the adjustment coefficient in the Sparre Ander-sen model for an insurance company, under general conditions that guarantee the validity of the Lundberg approximation. The adjustment coefficient corresponds to the tail exponen-tial coefficient of the distribution underlying an auxiliary sequence considered by Cs¨org˝o e Steinebach (1991). Thus, the results obtained for the estimation of R are applicable on this context. In order to achieve a better description of reality, generalizations of the classical risk model have been proposed in the literature. Here we consider one of these generalized models, and study, in that case, the problem of estimating the upper bound for the ruin probability.
Some results are illustrated by means of simulation studies, adapting here a procedure proposed by Schultze and Steinebach (1996) to the estimator bR, for the choice of the
number of tail observations to include on the estimation.
We also investigate the consistency of the estimator bR, when the variables are
depen-dent, and show that bR is a consistent estimator of R for stationary sequences, with an
R´
esum´
e
Dans ce travaille nous ´etudions le probl`eme de l’estimation du coefficient de queue expo-nentiel R de la famille de f.d. F v´erifiant
1 − F (z) = r(z)e−Rz, z > 0
o`u r est une fonction `a variation r´eguliere et R > 0.
Nous proposons ici un estimateur de nature g´eom´etrique, bR, r´elation´e avec les
estima-teurs des moindres carr´e introduits par Schultze et Steinebach (1996).
Nous montrons que, sous des conditions g´en´erales, bR est asymptotiquement normal.
Nous d´emontrons aussi que par l’interm´ediaire du m´ethode bootstrap de queue, intro-duit par Bacro et Brito (1998), il est possible construire des intervalles de confiance pour
R.
Nous ´etudions aussi le probl´eme de l’estimation d’un majorant pour la probabilit´e de ruine dans le mod`ele de Sparre Andersen, sous des conditions g´en`erales assurant le validit´e de l’approximation de Lundberg. L’estimateur propos´e est bas´e en l’estimateur g´eometrique du coefficient de queue exponentiel de la distribution d’une suite auxiliaire consider´ee par Cs¨org˝o et Steinebach (1991).
Les r´esultats obtenus sont illustr´es dans ´etudes de simulation.
Nous etudi´ons aussi la consistance de bR dans le cas o`u les v.a. sont d´ependantes et
mon-trons que bR est consistent pour des s´eries stationnaires avec une structure de d´ependance
Conte´
udo
Agradecimentos iii Resumo iv Abstract v Resum´e vi Introdu¸c˜ao 1Algumas defini¸c˜oes e nota¸c˜oes 3
1 Estima¸c˜ao do coeficiente de cauda exponencial R 5
1.1 Introdu¸c˜ao e resultados preliminares . . . 5
1.2 Um estimador geom´etrico para coeficiente de cauda exponencial, bR . . . . 15
1.3 Comportamento limite fraco de bR . . . . 17
1.4 Normalidade assimpt´otica de bR . . . . 21
1.4.1 Estudo de simula¸c˜ao . . . 28
1.5 Bootstrap de cauda para a estima¸c˜ao de R . . . . 31
1.5.1 M´etodo bootstrap . . . 31
1.5.2 Procedimento bootstrap de cauda . . . 32
1.5.3 Normalidade assimpt´otica da vers˜ao bootstrap de cauda de bR . . . 33
1.5.4 Intervalo de confian¸ca bootstrap de cauda . . . 40
1.5.5 Estudo de simula¸c˜ao . . . 42
1.6 Consistˆencia de bR para vari´aveis dependentes . . . . 45
1.6.1 Introdu¸c˜ao . . . 45
1.6.2 Resultados gerais . . . 46
1.6.3 Consistˆencia de bR para sucess˜oes estacion´arias . . . . 52
2 Estima¸c˜ao do coeficiente de ajustamento na teoria do risco 57 2.1 Introdu¸c˜ao . . . 57
2.2 Algumas propriedades dos passeios aleat´orios . . . 60
2.4.1 Um exemplo t´ıpico . . . 67
2.4.2 Um exemplo de seguro de vida . . . 68
2.5 Estima¸c˜ao de um majorante para a probabilidade de ru´ına para general-iza¸c˜oes do modelo de risco cl´assico . . . 68
2.5.1 Exemplo simulado . . . 72
3 Ilustra¸c˜ao dos resultados 75 3.1 Introdu¸c˜ao . . . 75
3.2 Estudo de simula¸c˜ao relativo ao comportamento amostral de bR, bR1, bR3 e bH−1 76 3.2.1 Um m´etodo emp´ırico para a escolha de kn . . . 78
3.3 Estudo de simula¸c˜ao relativo aos intervalos de confian¸ca para R . . . . 79
3.4 Estudo de simula¸c˜ao relativo aos intervalos de confian¸ca bootstrap de cauda para R . . . . 80
3.5 Estima¸c˜ao de quantis de ordem elevada . . . 80
3.6 Resultados das simula¸c˜oes . . . 83
3.6.1 Comportamento amostral de bR, bR1, bR3 e bH−1 . . . 83
3.6.2 Intervalos de confian¸ca para R . . . . 90
3.6.3 Intervalos de confian¸ca bootstrap de cauda para R . . . . 94
3.6.4 Quantis de ordem elevada . . . 98
Introdu¸c˜
ao
Em termos gerais, a Teoria de Valores Extremos prende-se com o estudo de acontecimentos raros ou extremos, e o consequente interesse na cauda da distribui¸c˜ao que governa o sistema em causa. Por ter aplica¸c˜oes numa grande variedade de dom´ınios, este tema tem sido motivo de forte aten¸c˜ao. Entre os v´arios problemas estudados em Teoria de Extremos destacamos o caso particular da estima¸c˜ao de parˆametros relacionados com a cauda de distribui¸c˜oes.
Neste trabalho estudaremos o problema da estima¸c˜ao do coeficiente de cauda exponen-cial R da fam´ılia de fun¸c˜oes de distribui¸c˜ao F que verificam
1 − F (z) = r(z)e−Rz, z > 0, (1)
em que r ´e uma fun¸c˜ao de varia¸c˜ao regular em ∞ e R > 0. Este problema tem aplica¸c˜oes em diversos dom´ınios como, por exemplo, em hidrologia, finan¸cas, seguros, telecomunica¸c˜oes, geologia e climatologia. Aqui consideraremos uma importante aplica¸c˜ao `a teoria do risco, que ´e a estima¸c˜ao do coeficiente de ajustamento.
No Cap´ıtulo 1 come¸camos por apresentar alguns estimadores de R, bem como alguns dos resultados acerca das suas propriedades assimpt´oticas, quer neste contexto, quer no contexto equivalente da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto. Com base no estudo de dois estimadores “baseados” no m´etodo dos m´ınimos quadrados, intro-duzidos por Schultze e Steinebach (1996), iremos propor um estimador de tipo geom´etrico,
b
R, e provar a sua consistˆencia. O estimador ´e naturalmente fun¸c˜ao dos maiores valores
da amostra. Mostraremos que bR ´e universalmente assimptoticamente normal sobre toda
a fam´ılia (1), quando centrado numa certa sucess˜ao determin´ıstica que converge para R, e estabeleceremos um resultado acerca da sua normalidade assimpt´otica, quando centrado em R. De seguida, com base no procedimento bootstrap de cauda introduzido por Bacro e Brito (1998), mostraremos que ´e poss´ıvel construir intervalos de confian¸ca para R a partir do estimador bR. Na ´ultima sec¸c˜ao deste cap´ıtulo, consideraremos o caso de v.a.
depen-dentes e mostraremos a consistˆencia de bR para sucess˜oes estacion´arias, com uma estrutura
de dependˆencia usual.
e−Rx, em que R ´e o chamado coeficiente de ajustamento. Neste trabalho, dedicaremos
particular aten¸c˜ao ao problema da estima¸c˜ao desse coeficiente. Com o mesmo objec-tivo, Cs¨org˝o e Steinebach (1991) sugeriram estimar R, no modelo de Sparre Andersen, com base numa sucess˜ao auxiliar (Zk) de vari´aveis aleat´orias independentes e
identica-mente distribu´ıdas, bastante estudada no contexto das filas de espera (veja-se sec¸c˜ao 2.3). O desenvolvimento deste trabalho tem como motiva¸c˜ao principal resultados de Cs¨org˝o e Steinebach (1991) no caso das indemniza¸c˜oes ou dos tempos interchegadas das mesmas serem vari´aveis aleat´orias exponencialmente distribu´ıdas. Mostraremos aqui, usando algu-mas propriedades gerais dos passeios aleat´orios (considerados na sec¸c˜ao 2.2), que para o modelo de Sparre Andersen e sob condi¸c˜oes gerais assegurando a validade da aproxima¸c˜ao de Lundberg, a fun¸c˜ao de distribui¸c˜ao de Zk pertence `a fam´ılia (1), em que o coeficiente
de cauda exponencial corresponde ao coeficiente de ajustamento. Este ´ultimo pode, desta forma, ser estimado por qualquer dos estimadores apresentados no Cap´ıtulo 1. No Cap´ıtulo 2 faremos tamb´em a aplica¸c˜ao dos corol´arios obtidos no Cap´ıtulo 1 para o estimador bR,
ao caso das indemniza¸c˜oes ou dos tempos interchegadas serem vari´aveis aleat´orias expo-nencialmente distribu´ıdas. Quando no modelo de Sparre Andersen se sup˜oe que os tempos interchegadas s˜ao vari´aveis aleat´orias exponencialmente distribu´ıdas, diz-se que estamos perante um processo de risco cl´assico. Na ´ultima sec¸c˜ao do Cap´ıtulo 2 iremos considerar uma generaliza¸c˜ao deste processo (veja-se, por exemplo Grandell (1991) e Bening e Korolev (2003)) e estudar tamb´em nesse caso a estima¸c˜ao de um majorante para a probabilidade de ru´ına.
No Cap´ıtulo 3 analisaremos o comportamento em amostras finitas do estimador bR,
Algumas defini¸c˜
oes e nota¸c˜
oes gerais
Nesta sec¸c˜ao iremos apresentar algumas defini¸c˜oes e estabelecer nota¸c˜oes de forma a poderem ser usadas nos cap´ıtulos que se seguem.
Dado x ∈ R+, denotamos por [x] o maior n´umero inteiro n˜ao superior a x.
Dado x0 ∈ R, considerem-se fun¸c˜oes gen´ericas u e v definidas numa vizinhan¸ca de x0 e
suponha-se que v n˜ao se anula nessa vizinhan¸ca. Escrevemos: 1. u(x) = O(v(x)) quando x → x0 se
¯ ¯ ¯u(x)v(x)
¯ ¯
¯ ≤ c quando x → x0, para algum c ∈ R+.
No caso em que ¯ ¯ ¯u(x)v(x) ¯ ¯
¯ → 1 quando x → x0, escrevemos u(x) ∼ v(x) quando x → x0.
2. u(x) = o(v(x)) quando x → x0 se u(x)v(x) → 0 quando x → x0.
Dada uma fun¸c˜ao f : R → R, consideramos
kf k∞ = sup
x∈R|f (x)|.
Seja agora H a fun¸c˜ao de distribui¸c˜ao (f.d.) de uma vari´avel aleat´oria (v.a.) Y ,
H(y) = P [Y ≤ y]. Denotamos por H−1 a inversa cont´ınua `a esquerda de H:
H−1(s) := inf{x : H(x) ≥ s}.
E(Y ) e V (Y ) denotam, respectivamente, o valor esperado e a variˆancia de Y , e MY a sua
fun¸c˜ao geradora de momentos (f.g.m.) definida por MY(r) = E(erY).
Dada uma amostra (Y1, . . . , Yn) de v.a. independentes e identicamente distribu´ıdas
(i.i.d.) com f.d. comum H, denotamos por Hn a f.d. emp´ırica (f.d.e.) associada a essa
amostra aleat´oria (a.a.):
Hn(y) = 1 n n X i=1 I{Yi≤y},
em que I ´e a fun¸c˜ao indicatriz:
I{x∈A}=
½
Considerando ainda a a.a. (Y1, . . . , Yn), denotamos por Y1,n≤ . . . ≤ Yn,n as estat´ısticas de
ordem (e.o.) dessa amostra.
Ao longo deste trabalho, → eD = denotam, respectivamente, convergˆencia e igualdadeD em distribui¸c˜ao, e→ convergˆencia em probabilidade.P
Dadas uma sucess˜ao (Yn) de v.a. i.i.d. e uma sucess˜ao (an) de n´umeros reais, escrevemos
1. Vn= OP(an) se ∀δ > 0 ∃Mδ > 0 : P · |Vn| an ≤ Mδ ¸ ≥ 1 − δ ∀n ∈ N. 2. Vn= oP(1) se Vn→ 0.P
Neste trabalho iremos considerar o comportamento da cauda de certas fam´ılias de fun¸c˜oes de distribui¸c˜ao. Para isso necessitamos das trˆes defini¸c˜oes que se seguem.
Uma fun¸c˜ao r : R+→ R+ diz-se uma fun¸c˜ao de varia¸c˜ao regular em ∞ se ∀z > 0, lim
t→∞
r(tz) r(t) = z
ρ, para algum ρ ∈ R.
Uma fun¸c˜ao L : R+ → R+ diz-se uma fun¸c˜ao de varia¸c˜ao lenta em ∞ se ∀y > 0, lim
t→∞
L(ty) L(t) = 1.
L ´e, em particular, de varia¸c˜ao regular em ∞ (basta tomar na defini¸c˜ao anterior ρ = 0).
Uma fun¸c˜ao eL : R+ → R+ diz-se uma fun¸c˜ao de varia¸c˜ao lenta em 0 se eL(x−1) for de
Cap´ıtulo 1
Estima¸c˜
ao do coeficiente de cauda
exponencial R
1.1
Introdu¸c˜
ao e resultados preliminares
Comecemos por considerar uma amostra (Z1, . . . , Zn) de v.a. i.i.d. (vari´aveis aleat´orias
independentes e identicamente distribu´ıdas), com f.d. F que satisfaz:
1 − F (z) = P [Z1 > z] = r(z)e−Rz, z > 0, (1.1.1)
onde r ´e uma fun¸c˜ao de varia¸c˜ao regular em ∞ e R ´e uma constante positiva, a que se d´a o nome de coeficiente de cauda exponencial.
No seguimento do trabalho iremos tamb´em considerar a seguinte forma equivalente a (1.1.1):
F−1(1 − s) = −1
Rlog s + log eL(s), 0 < s < 1, (1.1.2)
onde eL ´e uma fun¸c˜ao de varia¸c˜ao lenta em zero (veja-se, por exemplo, Schultze e Steinebach
(1996), Lema 2.2.a) e referˆencias citadas).
O problema que vamos estudar neste cap´ıtulo ´e o da estima¸c˜ao do coeficiente de cauda
R. Este problema tem recebido particular aten¸c˜ao, uma vez que tem aplica¸c˜oes numa
grande variedade de dom´ınios, como, por exemplo, em hidrologia, finan¸cas, seguros, tele-comunica¸c˜oes, geologia e climatologia. Uma vis˜ao geral da literatura existente ´e dada em Cs¨org˝o e Viharos (1998). Seguindo Cs¨org˝o e Steinebach (1991), consideramos, no pr´oximo cap´ıtulo, uma importante aplica¸c˜ao `a teoria do risco, nomeadamente a estima¸c˜ao do coe-ficiente de ajustamento R.
Comecemos por apresentar trˆes estimadores para o coeficiente de cauda exponencial, introduzidos por Schultze e Steinebach (1996).
Tais estimadores foram motivados pelo facto de que, sendo F uma fun¸c˜ao de distribui¸c˜ao que verifica (1.1.1), − log(1 − F (z)), para z grande, ´e aproximadamente linear com declive
R, uma vez que z−1log r(z) → 0 quando z → ∞. Espera-se assim que − log(1− F n(z))
tamb´em seja aproximadamente linear para valores elevados de n e de z, em que Fn denota
Para simplificar o estudo, Schultze e Steinebach supuseram inicialmente r(z) ≡ c, ∀z > 0. Assim sendo, y := − log(1 − F (z)) = Rz − log c = Rz − d, ou equivalentemente, z = R−1(y + d) = ay + b, onde a = R−1, b = R−1d e d = log c.
Espera-se assim que estas rela¸c˜oes lineares se verifiquem, aproximadamente, para as kn
maiores observa¸c˜oes da realiza¸c˜ao da amostra (Z1, . . . , Zn), que se denotam por
zi := zn−i+1,n, i = 1, . . . , kn ≤ n. Schultze e Steinebach aproximaram − log(1 − F (zi))
por yi := − log(1 − Fn(zi−)) = − log(1 − (n − i)/n) = log(n/i). Deste modo tem-se que yi
est´a “pr´oximo” de Rzi− d, ou equivalentemente, zi est´a “pr´oximo” de ayi+ b.
Um estimador de a foi obtido minimizando a fun¸c˜ao f1(a, b) =
Pkn
i=1(zi − ayi − b)2.
Fixado o sistema de eixos da Figura 1, o problema da estima¸c˜ao de a corresponde a deter-minar o inverso do declive da recta que minimiza a soma dos quadrados das distˆancias entre os pontos (zi, yi) e os pontos de uma recta com ordenada yi, respectivamente,
i = 1, ..., kn (isto ´e, corresponde a determinar o inverso do declive da recta que minimiza
a soma dos quadrados das distˆancias, medidas na horizontal, entre os pontos {(zi, yi), i =
1, . . . , kn} e uma recta). z y i i ay + b i z y Figura 1.
O estimador de R assim obtido foi bR1(kn) := ˆa−11 (kn), isto ´e,
b
R1(kn) =
Pkn
i=1log2(n/i) − k1n
³Pkn
i=1log (n/i)
´2 Pkn
i=1log (n/i) Zn−i+1,n− k1n
³Pkn
i=1Zn−i+1,n
´ ³Pkn
i=1log(n/i)
No caso particular em que r(z) ≡ 1, z > 0 (F (z) = 1 − e−Rz, z > 0), o problema anterior
corresponde a minimizar a fun¸c˜ao f2(a) = f1(a, 0) =
Pkn
i=1(zi−ayi)2. Schultze e Steinebach
propuseram ent˜ao o seguinte estimador de R, no sentido do m´etodo dos m´ınimos quadrados: b
R2(kn) := ˆa−12 (kn) =
Pkn
i=1log2(n/i)
Pkn
i=1log (n/i) Zn−i+1,n
.
Um outro estimador de R foi deduzido directamente da equa¸c˜ao y = Rz − d, por minimiza¸c˜ao da fun¸c˜ao f3(R, d) =
Pkn
i=1(yi − Rzi + d)2. Fixado o sistema de eixos da
Figura 2 (o mesmo da Figura 1), este problema corresponde a determinar o declive da recta que minimiza a soma dos quadrados das distˆancias entre os pontos (zi, yi) e os pontos
de uma recta com abcissa zi, respectivamente, i = 1, ..., kn (isto ´e, determinar o declive
da recta que minimiza a soma dos quadrados das distˆancias, medidas na vertical, entre os pontos {(zi, yi), i = 1, . . . , kn} e uma recta).
z y i i Rz - d i z y Figura 2.
Schultze e Steinebach introduziram assim um outro estimador de R: b
R3(kn) =
Pkn
i=1log (n/i) Zn−i+1,n− k1n
³Pkn
i=1Zn−i+1,n
´ ³Pkn
i=1log (n/i)
´ Pkn i=1Zn−i+1,n2 −k1n ³Pkn i=1Zn−i+1,n ´2 . (1.1.4)
Para estabelecer a consistˆencia dos estimadores ´e necess´ario impor algumas condi¸c˜oes de regularidade sobre a sucess˜ao kn ≡ (kn). A condi¸c˜ao b´asica assumida por Schultze e
Steinebach ´e que kn´e uma sucess˜ao de inteiros positivos satisfazendo:
1 ≤ kn < n, kn→ ∞ e kn/n → 0 quando n → ∞. (1.1.5)
Esta ´e uma condi¸c˜ao usual que assumimos ao longo do trabalho.
O resultado que se segue estabelece a consistˆencia dos estimadores bR1(kn), bR2(kn) e
b
Teorema 1.1.1 (Schultze e Steinebach (1996), Teorema 1.1)
Seja F uma f.d. que verifica (1.1.1), e kn uma sucess˜ao de inteiros satisfazendo (1.1.5) e
tal que log2n/kn → 0 quando n → ∞. Tem-se ent˜ao que:
a) bR1(kn)→ R.P
b) se F−1 ´e cont´ınua em (s
0, 1) para algum s0 ∈ (0, 1), ent˜ao bR3(kn)→ R.P
Neste trabalho iremos introduzir um estimador de tipo geom´etrico, bR(kn), relacionado
com os estimadores bR1(kn) e bR3(kn), e mostraremos que, sob as condi¸c˜oes do Teorema
1.1.1, bR(kn) ´e tamb´em um estimador consistente de R.
Independentemente de Schultze e Steinebach (1996), Kratz e Resnick (1996) introduzi-ram uma forma equivalente do estimador 1/ bR1(kn) de 1/R, designando-o por estimador-qq,
relativo aos “qq-plots”. Apresentamos de seguida, de forma resumida, uma motiva¸c˜ao de car´acter heur´ıstico deste m´etodo. Para uma justifica¸c˜ao mais detalhada da aplica¸c˜ao dos “qq-plots” `a estima¸c˜ao de ´ındices de cauda pode consultar-se Beirlant et al. (1996).
Se U1,n ≤ . . . ≤ Un,n s˜ao as e.o. (estat´ısticas de ordem) de uma amostra (U1, . . . , Un)
de v.a. i.i.d. uniformemente distribu´ıdas em [0, 1], ent˜ao
E(Ui,n) =
i n + 1.
Assim, espera-se que Ui,nesteja “pr´oximo” da sua m´edia n+1i , e por consequˆencia, o gr´afico
de ½µ i n + 1, Ui,n ¶ , 1 ≤ i ≤ n ¾
deva ser aproximadamente linear com declive 1, o mesmo acontecendo com o gr´afico de ½µ H−1 µ i n + 1 ¶ , Zi,n ¶ , 1 ≤ i ≤ n ¾ ,
em que Z1,n ≤ . . . ≤ Zn,n s˜ao as e.o. de uma amostra (Z1, . . . , Zn) de v.a. i.i.d. com
f.d. H. Notemos que H−1( i
n+1) ´e o quantil da distribui¸c˜ao da popula¸c˜ao e Zi,n o quantil
emp´ırico correspondente, e por isso o nome de “qq-plot”.
O estimador-qq foi introduzido por Kratz e Resnick (1996) usando este m´etodo, n˜ao no contexto da estima¸c˜ao do coeficiente de cauda exponencial, mas no contexto equivalente da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto, que passamos a apresentar.
Fazendo a mudan¸ca de vari´avel
Xi = eZi,
em que Zi, i = 1, 2, . . . s˜ao v.a. i.i.d. cuja f.d. verifica (1.1.1), tem-se que
1 − G(x) = P [X1 > x] = x−1/αL(x), x > 1, (1.1.6)
onde α = 1/R e
em que r ´e a fun¸c˜ao de varia¸c˜ao regular em ∞ que surge em (1.1.1), sendo portanto L de varia¸c˜ao lenta em ∞. Assim 1 − G ´e uma fun¸c˜ao de varia¸c˜ao regular em ∞ com ´ındice
−1/α. Notemos que (1.1.6) tamb´em se pode escrever na forma equivalente
G−1(1 − s) = s−αL(s)e 0 < s < 1, (1.1.8)
para a fun¸c˜ao de varia¸c˜ao lenta em zero, eL, que surge em (1.1.2).
Para introduzirmos o estimador-qq comecemos por considerar o caso particular em que
L(x) ≡ 1 em (1.1.7). Neste caso, X1,n ≤ . . . ≤ Xn,n representam as e.o. de uma a.a.
(X1, . . . , Xn) de v.a. i.i.d. com f.d. G que verifica:
1 − G(x) = P [X1 > x] = x−1/α, x > 1, (α > 0).
Para z > 0, seja
H(z) := 1 − P [log X1 > z] = 1 − e−z/α.
Pelo m´etodo-qq, o gr´afico de ½µ α−1H−1 µ i n + 1 ¶ , log Xi,n ¶ , 1 ≤ i ≤ n ¾ = ½µ − log µ 1 − i n + 1 ¶ , log Xi,n ¶ , 1 ≤ i ≤ n ¾
dever´a ser aproximadamente linear com declive α.
Consideremos agora o caso em que X1,n ≤ . . . ≤ Xn,n designam as e.o. de uma a.a.
(X1, . . . , Xn) de v.a. i.i.d. com f.d. G pertencente `a fam´ılia de Pareto, isto ´e, tal que
1 − G(x) = P [X1 > x] = x−1/αL(x), x > 1, (α > 0),
em que L ´e uma fun¸c˜ao de varia¸c˜ao lenta em ∞.
Atendendo `a forma da cauda de G, Kratz e Resnick definiram naturalmente o estimador-qq, com base apenas nas kn maiores e.o. da amostra, isto ´e, consideraram
apenas o gr´afico de ½µ − log µ 1 − i kn+ 1 ¶ , log Xn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ .
O estimador-qq, deduzido por Kratz e Resnick no sentido do m´etodo dos m´ınimos quadrados, ´e dado por
b
αqq(kn) =
Pkn
i=1(− log(1−kn+1i )log Xn−kn+i,n)−kn1 (
Pkn
i=1log Xn−kn+i,n)(
Reparemos agora que, para a determina¸c˜ao deste estimador, foi considerado o gr´afico de ½µ − log µ 1 − i kn+ 1 ¶ , log Xn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ = ½µ log µ kn+ 1 kn− i + 1 ¶ , Zn−kn+i,n ¶ , 1 ≤ i ≤ kn ¾ = ½µ log µ kn+ 1 j ¶ , Zn−j+1,n ¶ , 1 ≤ j ≤ kn ¾ ,
em que Zi = log Xi, i = 1, . . . , n, enquanto que para o estimador 1/ bR1(kn) foi considerado
o gr´afico de n³ log³n i ´ , Zn−i+1,n ´ , 1 ≤ i ≤ kn o .
Notemos que a nuvem de pontos considerada para o estimador bαqq(kn) ´e apenas uma
transla¸c˜ao da nuvem de pontos considerada para 1/ bR1(kn). Portanto, as rectas obtidas no
sentido do m´etodo dos m´ınimos quadrados, tˆem em ambos os casos o mesmo declive, pelo que bαqq(kn) = 1/ bR1(kn) (veja-se Brito e Moreira (2001)).
Kratz e Resnick (1996) provaram a consistˆencia do estimador bαqq(kn) de α para qualquer
sucess˜ao kn de inteiros que verifica (1.1.5). Para al´em disso, investigaram a normalidade
assimpt´otica de bαqq(kn), quando centrado em α. Para esse estudo, supuseram que se
verificava uma condi¸c˜ao de varia¸c˜ao regular de segunda ordem para a fun¸c˜ao b dada por
b(t) := µ 1 1 − G ¶−1 (t) = G−1 µ 1 − 1 t ¶ . (1.1.10)
Notemos que b(t) = tαL(1/t), em que ee L ´e a fun¸c˜ao de varia¸c˜ao lenta em 0 da express˜ao
(1.1.8). Portanto, b ´e de varia¸c˜ao regular em ∞, com ´ındice α.
Kratz e Resnick assumiram que ∃ρ ≤ 0 e uma fun¸c˜ao 0 < A(t) → 0 quando t → ∞, verificando ∀x > 1 b(tx) b(t) − xα A(t) → x α µ xρ− 1 ρ ¶ quando t → ∞. (1.1.11) O resultado acerca da normalidade assimpt´otica de bαqq(kn) ´e o seguinte:
Teorema 1.1.2 (Kratz e Resnick (1996), Teorema 3.1)
Assumamos que G ´e uma f.d. que satisfaz (1.1.6). Se (1.1.11) se verificar e kn for uma
sucess˜ao de inteiros positivos satisfazendo (1.1.5) e tal que k1/2n A(n/kn) → 0 quando n → ∞,
ent˜ao,
kn1/2{bαqq(kn) − α}→ ND
¡
Neste trabalho estabeleceremos tamb´em a normalidade assimpt´otica do estimador de tipo geom´etrico bR(kn), quando centrado em R.
No contexto da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto, tˆem sido propostos muitos estimadores para α, de entre os quais se destaca o cl´assico estimador de Hill, introduzido por Hill (1975):
b H(kn) = 1 kn kn X i=1
log Xn−i+1,n− log Xn−kn,n. (1.1.12)
As propriedades assimpt´oticas do estimador de Hill tˆem sido muito estudadas. A con-sistˆencia fraca foi provada por Mason (1982), para qualquer sucess˜ao kn de inteiros que
verifica (1.1.5). A consistˆencia forte foi provada por Deheuvels et al. (1988), para sucess˜oes
kn de inteiros satisfazendo (1.1.5) e tal que kn/(log(log n)) → ∞ quando n → ∞. A
nor-malidade assimpt´otica foi investigada por v´arios autores, dos quais referimos Haeusler e Teugels (1985), Cs¨org˝o e Mason (1985) e Cs¨org˝o e Viharos (1995). Os primeiros dois au-tores apresentam resultados para a normalidade assimpt´otica de bH(kn) centrado em α,
mostrando que sob certas condi¸c˜oes de segunda ordem sobre a cauda de G e para sucess˜oes
kn adequadas, k1/2n n b H(kn) − α o D
→ N (0, α2), enquanto que os ´ultimos quatro
estabele-cem resultados acerca da normalidade assimpt´otica de bH(kn) centrado em sucess˜oes que
convergem para α. Alguns destes resultados ser˜ao apresentados em seguida.
Para isso, consideremos a representa¸c˜ao de Karamata da fun¸c˜ao de varia¸c˜ao lenta em zero eL, que surge em (1.1.8):
e L(s) = aLe(s) exp ½Z 1 s bLe(u) u du ¾ , 0 < s < 1, (1.1.13) onde aLe(s) → a0 quando s → 0, para algum a0 ∈ (0, ∞), e beL(s) → 0 quando s → 0.
Definamos a sucess˜ao cn(kn) := n kn Z 1 1−kn/n (1 − s)d log G−1(s). (1.1.14)
Cs¨org˝o e Mason (1985) come¸cam por provar que:
se G satisfaz (1.1.6) ent˜ao cn(kn) → α quando n → ∞.
Depois estabelecem o resultado que se segue.
Teorema 1.1.3 (Cs¨org˝o e Mason (1985), Teorema 2.3)
Se G satisfizer (1.1.6) e kn verificar (1.1.5), ent˜ao
onde An:= k1/2n log
©
aLe(kn/n)/aeL(1 − Un−kn,n)
ª
, aLe ´e a fun¸c˜ao da representa¸c˜ao de Kara-mata de (1.1.13), {Bn(t) : 0 ≤ t ≤ 1}n≥1 ´e uma sucess˜ao de pontes Brownianas 1 e U1,n≤ . . . ≤ Un,n denotam as e.o. de uma certa amostra (U1, . . . , Un) de v.a. uniformemente
distribu´ıdas em [0, 1].
Para provarem a normalidade assimpt´otica de kn1/2
n b
H(kn) − cn(kn)
o
, Cs¨org˝o e Mason assumem que aLe ´e constante numa vizinhan¸ca `a direita de zero, n˜ao degenerada, condi¸c˜ao
equivalente a log G−1(1 − s) ser absolutamente cont´ınua, para s numa vizinhan¸ca `a direita
de zero. Assim sendo, An = 0 quase certamente para n suficientemente grande, provando
da´ı que k1/2n n b H(kn) − cn(kn) o D → N¡0, α2¢. (1.1.15)
Cs¨org˝o e Viharos (1995) obtiveram uma generaliza¸c˜ao deste resultado, como corol´ario do teorema que ser´a apresentado de seguida.
Seja ent˜ao d(·) := aLe(·) − a0.
Assumamos, para os dois resultados seguintes, que G satisfaz (1.1.6) e que a sucess˜ao
kn verifica (1.1.5).
Teorema 1.1.4 (Cs¨org˝o e Viharos (1995), Teorema 2)
Se, para uma sucess˜ao limitada de n´umeros reais, dn, tivermos
kn n d(1 − Un−kn,n) − d(kn/n) 1 − Un−kn,n− kn/n − dn → 0,P ent˜ao µ kn α2+ (dn/a0)2 ¶1/2n b H(kn) − cn(kn) o D → N (0, 1) .
O resultado que se segue, corol´ario do Teorema 1.1.4, ´e v´alido apenas para fun¸c˜oes d diferenci´aveis, e corresponde a uma generaliza¸c˜ao do resultado (1.1.15) de Cs¨org˝o e Mason (1985).
Corol´ario 1.1.1 (Cs¨org˝o e Viharos (1995), Corol´ario 2)
Se a derivada d0 de d existir numa vizinhan¸ca `a direita de zero, n˜ao degenerada, e se
sd0(s) → d
0 quando s → 0, ent˜ao tem-se necessariamente que d0 = 0, e k1/2 n n b H(kn) − cn(kn) o D → N¡0, α2¢.
1Um processo estoc´astico {B(t); 0 ≤ t ≤ 1} designa-se por ponte Browniana se:
i) a distribui¸c˜ao conjunta de B(t1), B(t2), ..., B(tn), com 0 ≤ t1≤ ... ≤ tn≤ 1, n = 1, 2, ..., ´e normal; ii) a fun¸c˜ao de covariˆancia de B(t) ´e dada por R(s, t) = E(B(s)B(t)) = min(s, t) − st;
´
E de salientar que todos os resultados acerca da normalidade assimpt´otica do estimador de Hill, centrado em sucess˜oes determin´ısticas que convergem para α, requerem condi¸c˜oes restritivas sobre a fam´ılia (1.1.6).
A distribui¸c˜ao assimpt´otica dos estimadores 1/ bRi(kn), i = 1, 2, 3, de 1/R, foi estudada
por Cs¨org˝o e Viharos (1997), neste mesmo contexto da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto. Estes autores mostraram que, para sucess˜oes kn adequadas,
1/ bRi(kn), i = 1, 2, 3, s˜ao universalmente assimptoticamente normais sobre toda a fam´ılia
(1.1.6), quando centrados em sucess˜oes determin´ısticas que convergem para α = 1/R. Para al´em disso, o factor de normaliza¸c˜ao obtido para 1/ bRi(kn), i = 1, 3, ´e kn1/2, e, como Cs¨org˝o e
Viharos salientam, estes foram os primeiros estimadores assimptoticamente normais sobre toda a fam´ılia (1.1.6), com o factor ideal kn1/2. Enunciamos de seguida alguns dos resultados
estabelecidos, importantes para o seguimento do trabalho, escrevendo-os assim no contexto da estima¸c˜ao do coeficiente de cauda exponencial.
Teorema 1.1.5 (Cs¨org˝o e Viharos (1997), Teorema 1.1)
Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros positivos que
verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,
kn1/2 n 1/ bR1(kn) − µ(1)n (kn) o D → N¡0, 2/R2¢, onde µ(1) n (kn) := − n kn Z kn/n 0 F−1(1 − t−) ½ 1 + log µ nt kn ¶¾ dt → 1/R quando n → ∞.
Teorema 1.1.6 (Cs¨org˝o e Viharos (1997), Teorema 1.3)
Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros positivos que
verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,
kn1/2 n 1/ bR3(kn) − µ(3)n (kn) o D → N¡0, 2/R2¢, onde µ(3)n (kn) := n kn Rkn/n 0 (F−1)2(1 − t−)dt − ³ n kn Rkn/n 0 F−1(1 − t−)dt ´2 −n kn Rkn/n 0 F−1(1 − t−) n 1 + log ³ nt kn ´o dt → 1/R quando n → ∞.
Ainda no contexto da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto, Viharos (1999) propˆos uma classe de estimadores de m´ınimos quadrados “pesados” que cont´em o estimador 1/ bR1(kn). Para uma dada classe de fun¸c˜oes peso, o mesmo autor
provou que estes estimadores s˜ao, tal como 1/ bR1(kn), universalmente assimptoticamente
normais sobre toda a fam´ılia (1.1.6).
Neste trabalho, mostraremos que o estimador de tipo geom´etrico, bR(kn), ´e tamb´em
sucess˜ao determin´ıstica que converge para R. Para al´em disso, o factor de normaliza¸c˜ao obtido ´e tamb´em kn1/2.
Notemos que esta propriedade n˜ao ´e partilhada pelo estimador de Hill. Cs¨org˝o e Vi-haros (1995) constru´ıram, para cada α > 0, uma fun¸c˜ao quantil G−1 que satisfaz (1.1.8)
e tal que bH([n2/3]) n˜ao tem distribui¸c˜ao assimpt´otica n˜ao degenerada para quaisquer
sucess˜oes de normaliza¸c˜ao. O exemplo apresentado corresponde a tomar, em (1.1.8), e
L(s) = 1 + s sin(1/s). Assim, o estimador de Hill bH(kn) n˜ao ´e universalmente
assimp-toticamente normal sobre toda a fam´ılia (1.1.6).
Para outros estimadores de α, veja-se, por exemplo, Cs¨org˝o et al. (1985), Dekkers et al. (1989), Bacro e Brito (1993), Caeiro e Gomes (2002), Cs¨org˝o e Viharos (1998) e referˆencias citadas.
Tendo em vista a constru¸c˜ao de intervalos de confian¸ca para α, um problema bastante estudado ´e o da possibilidade de aplica¸c˜ao de t´ecnicas de reamostragem na utiliza¸c˜ao dos estimadores propostos. Nos ´ultimos tempos tem havido, em geral, um interesse acrescido em usar os m´etodos bootstrap na inferˆencia estat´ıstica (veja-se, por exemplo, Gomes (1994), Caers et al. (1998), Brito (2001) e referˆencias citadas). Bacro e Brito (1998) introduziram um procedimento bootstrap, designado por bootstrap de cauda, adequado ao problema particular da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto (que ser´a descrito na sec¸c˜ao 1.5), e mostraram que usando esse m´etodo ´e poss´ıvel construir intervalos de confian¸ca para α (ou, equivalentemente para R), com base no estimador de Hill. Denotando por Φ a f.d. N(0, 1), o resultado correspondente ´e o seguinte:
Teorema 1.1.7 (Bacro e Brito (1998), Teorema 1)
Assumamos que G satisfaz (1.1.6), que eL ´e a fun¸c˜ao de varia¸c˜ao lenta em zero que surge em (1.1.8) e que kn ´e uma sucess˜ao de inteiros positivos que satisfaz (1.1.5). Se, quando
n → ∞, kn1/2 sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log à e L¡ytkn n ¢ e L¡kn n ¢ !¯¯ ¯ ¯ ¯→0
uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao, em probabilidade, para todo o x, P h b H(kn)−1kn1/2 ³ b H∗(kn) − bH(kn) ´ ≤ x | (Xn−kn,n, . . . , Xn,n) i →Φ (x) quando n → ∞, em que bH∗(k
n) ´e a vers˜ao bootstrap de cauda do estimador bH(kn).
Neste trabalho mostraremos que, usando o procedimento bootstrap de cauda ´e poss´ıvel construir intervalos de confian¸ca para R, com base no estimador de tipo geom´etrico bR(kn).
estacion´arias, com uma estrutura de dependˆencia semelhante `a considerada por Hsing, e faremos uma aplica¸c˜ao ao caso de sucess˜oes estacion´arias m-dependentes.
Na sec¸c˜ao 1.2, introduziremos o j´a referido estimador de tipo geom´etrico, bR(kn), para
o coeficiente de cauda exponencial, relacionado com os estimadores bR1(kn) e bR3(kn) de
Schultze e Steinebach, e provaremos um resultado acerca da sua consistˆencia. Na sec¸c˜ao 1.3 mostraremos que, para sucess˜oes kn que verifiquem (1.1.5) e tais que kn/ log4n → ∞
quando n → ∞, bR(kn) ´e assimptoticamente normal sobre toda a classe de fun¸c˜oes de
distribui¸c˜ao que satisfazem (1.1.1), quando centrado numa certa sucess˜ao determin´ıstica que converge para R. Na sec¸c˜ao 1.4 estabeleceremos um resultado acerca da normalidade assimpt´otica de bR(kn), quando centrado em R. Na sec¸c˜ao 1.5 iremos considerar o
proced-imento bootstrap de cauda introduzido por Bacro e Brito (1998) e mostrar que ´e poss´ıvel, usando esse m´etodo, construir intervalos de confian¸ca para R, com base no estimador
b
R(kn). Por fim, na sec¸c˜ao 1.6 estudaremos a consistˆencia do novo estimador no caso de
v.a. dependentes, seguindo o estudo de Hsing (1991) para o estimador de Hill.
1.2
Um estimador geom´
etrico para coeficiente de cauda
exponencial, b
R
No seguimento do estudo dos estimadores bR1(kn) e bR3(kn) correspondentes `as Figuras 1 e
2, consideramos os dois pontos de vista simultaneamente, minimizando a soma das ´areas dos rectˆangulos indicados na figura seguinte.
z (z , y ) (ay + b , Rz - d) y i i i i i i y z Figura 3.
Assim, um novo estimador para R de tipo geom´etrico, bR(kn), resulta da minimiza¸c˜ao
da fun¸c˜ao f (R, d) = kn X i=1 (yi− Rzi+ d)(R−1yi+ R−1d − zi).
b R(kn) = v u u u u t Pkn
i=1log2(n/i) − k1n
³Pkn i=1log(n/i) ´2 Pkn i=1Zn−i+1,n2 − k1n ³Pkn i=1Zn−i+1,n) ´2. (1.2.1)
Notemos que bR(kn) ´e a m´edia geom´etrica dos estimadores bR1(kn) e bR3(kn), isto ´e,
b
R(kn) =
q b
R1(kn) bR3(kn).
Tendo em conta esta propriedade, estabelecemos facilmente a consistˆencia de bR(kn).
Teorema 1.2.1 Seja F uma f.d. que verifica (1.1.1) e kn uma sucess˜ao de inteiros que
satisfaz (1.1.5) e tal que log2n/kn → 0 quando n → ∞. Suponhamos ainda que F−1 ´e
cont´ınua em (s0, 1) para algum s0 ∈ (0, 1). Temos ent˜ao que:
b
R(kn)→ R.P
Prova do Teorema 1.2.1. Pelo Teorema 1.1.1, b
R1(kn)→ RP e Rb3(kn)→ R,P
o que implica, pelo Teorema de Slutsky, que b R(kn) = q b R1(kn) bR3(kn)→P √ R2 = R,
como pretend´ıamos mostrar. ¥
O lema que se segue descreve a rela¸c˜ao de ordem entre os trˆes estimadores.
Lema 1.2.1 Sejam bR1(kn), bR3(kn) e bR(kn) os estimadores definidos em (1.1.3), (1.1.4)
e (1.2.1), respectivamente. Temos ent˜ao que
b
R3(kn) ≤ bR(kn) ≤ bR1(kn).
Prova do Lema 1.2.1. Para provarmos o pretendido, ´e suficiente mostrarmos que b
R3(kn) ≤ bR1(kn),
pois, sendo bR(kn) a m´edia geom´etrica dos estimadores bR1(kn) e bR3(kn), bR(kn) encontra-se
necessariamente enquadrado entre os dois.
≤ Xkn i=1 log2(n/i) − 1 kn à kn X i=1 log (n/i) !2 Xkn i=1 Z2 n−i+1,n− 1 kn à kn X i=1 Zn−i+1,n !2 . (1.2.2) Mas, kn X i=1
log (n/i) Zn−i+1,n−
1 kn kn X i=1 Zn−i+1,n kn X i=1 log (n/i) = = kn X i=1 à log (n/i) − 1 kn kn X i=1 log (n/i) ! à Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n ! , kn X i=1 log2(n/i) − 1 kn à k n X i=1 log (n/i) !2 = kn X i=1 à log (n/i) − 1 kn kn X i=1 log (n/i) !2 e, analogamente, kn X i=1 Z2 n−i+1,n− 1 kn à k n X i=1 Zn−i+1,n !2 = kn X i=1 à Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !2 .
A desigualdade (1.2.2) ´e assim equivalente `a seguinte: Ã k n X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) ! Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !!2 ≤ ≤ kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) !2 k n X i=1 Ã Zn−i+1,n− 1 kn kn X i=1 Zn−i+1,n !2 ,
decorrendo, esta ´ultima, directamente da desigualdade de Cauchy-Schwarz. ¥
De modo a ilustrarmos o comportamento amostral finito do novo estimador, na sec¸c˜ao 3.2 extendemos o estudo de simula¸c˜ao de Schultze e Steinebach (1996) a bR(kn). Nesse
estudo inclu´ımos um procedimento emp´ırico para a escolha de kn no caso do estimador
b
R(kn), por adapta¸c˜ao da t´ecnica usada por Schultze e Steinebach (1996) para os
esti-madores bR1(kn) e bR3(kn).
1.3
Comportamento limite fraco de b
R
Como j´a referimos na sec¸c˜ao 1.1, Cs¨org˝o e Viharos (1997) estudaram a distribui¸c˜ao as-simpt´otica dos estimadores 1/ bR1(kn) e 1/ bR3(kn) de 1/R, quando centrados em certas
sucess˜oes determin´ısticas que convergem para 1/R.
Considerando agora o estimador 1/ bR(kn) de 1/R, estabelecemos o seguinte resultado
Proposi¸c˜ao 1.3.1 Seja F uma f.d. que verifica (1.1.1). Se knfor uma sucess˜ao de inteiros
positivos que verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,
k1/2n n 1/ bR(kn) − µn(kn) o D → N¡0, 2/R2¢,
onde µn(kn) := (µ(1)n (kn)µ(3)n (kn))1/2 → 1/R quando n → ∞, e µ(1)n (kn) e µ(3)n (kn) s˜ao as
sucess˜oes definidas nos Teoremas 1.1.5 e 1.1.6.
Para provarmos o teorema, iremos usar os dois lemas que se seguem.
No primeiro lema estuda-se a ordem de grandeza da sucess˜ao in(kn) definida por
in(kn) := 1 kn kn X i=1 log2(n/i) − Ã 1 kn kn X i=1 log(n/i) !2 . (1.3.1)
Lema 1.3.1 Seja kn uma sucess˜ao de inteiros positivos tal que 1 ≤ kn ≤ n. Para a
sucess˜ao in(kn) definida em (1.3.1) temos que
in(kn) = 1 + O µ log2kn kn ¶ .
Prova. Comecemos por notar que
in(kn) = 1 kn kn X i=1 Ã log (n/i) − 1 kn kn X i=1 log (n/i) !2 = 1 kn kn X i=1 Ã log i − 1 kn kn X i=1 log i !2 = 1 kn kn X i=1 log2i − Ã 1 kn kn X i=1 log i !2 .
Escrevamos ent˜ao i(kn) ≡ in(kn) = k1n
Pkn i=1log2i − ³ 1 kn Pkn i=1log i ´2 .
Observemos agora que
Portanto, i(kn) ≤ kn+ 1 kn £ log2(kn+ 1) − 2 log(kn+ 1) ¤ + 2 − 1 k2 n [knlog kn− (kn− 1)]2 = ¡log2(k n+ 1) − log2kn ¢ + 2 (log kn− log(kn+ 1)) − 2 kn (log (kn+ 1) + log kn) + 1 kn log2(kn+ 1) + 2 kn − 1 k2 n + 1 = O µ log kn kn ¶ + O µ 1 kn ¶ + O µ log kn kn ¶ + O µ log2kn kn ¶ + O µ 1 kn ¶ + O µ 1 k2 n ¶ + 1 = 1 + O µ log2kn kn ¶ ,
como pretend´ıamos mostrar. ¥
Lema 1.3.2 (Cs¨org˝o e Viharos (1997), Lema 5.6)
Suponhamos que (1.1.1) se verifica e seja kn uma sucess˜ao de inteiros positivos verificando
(1.1.5), tal que kn/ log4n → ∞ quando n → ∞,
Wn(kn) := 1 kn kn X i=1 Zn−i+1,n2 − Ã 1 kn kn X i=1 Zn−i+1,n !2
e µn(kn) = (µ(1)n (kn)µ(3)n (kn))1/2. Ent˜ao, kn1/2{Wn(kn) − µ2n(kn)} = Nn∗ + oP(1), para uma
dada sucess˜ao N∗
n = Nn∗(ln, kn) (onde ln ´e uma sucess˜ao convenientemente escolhida) que
´e tal que
Nn∗ → ND Ã 0, 8 µ 1 R ¶4! .
Prova da Proposi¸c˜ao 1.3.1. Atendendo `a express˜ao de bR(kn) podemos escrever:
k1/2 n n 1/ bR(kn) − µn(kn) o = k1/2 n (µ Wn(kn) in(kn) ¶1/2 − µn(kn) ) = µ kn in(kn) ¶1/2© W1/2 n (kn) − µn(kn) ª − µn(kn) µ kn in(kn) ¶1/2¡ i1/2 n (kn) − 1 ¢ ,(1.3.2)
em que in(kn) ´e a sucess˜ao definida em (1.3.1) e (Wn(kn)) ´e a sucess˜ao do Lema 1.3.2.
com min(µ2 n(kn), Wn(kn)) < ξn < max(µ2n(kn), Wn(kn)). Pelo Lema 1.3.2, k1/2 n © Wn(kn) − µ2n(kn) ª D → N¡0, 8/R4¢,
e por consequˆencia Wn(kn) − µ2n(kn) → 0. Os Teoremas 1.1.5 e 1.1.6 asseguram queP
µ2
n(kn) → 1/R2 quando n → ∞. Portanto temos que Wn(kn)→ 1/RP 2, e consequentemente
ξn(kn)→ 1/RP 2. Assim,
kn1/2©Wn1/2(kn) − µn(kn)
ª D
→ N¡0, 2/R2¢.
Agora, pelo Lema 1.3.1, in(kn) → 1 quando n → ∞, e portanto, para provarmos o
pretendido, basta, atendendo `a express˜ao (1.3.2), mostrar que
k1/2
n (i1/2n (kn) − 1) → 0 quando n → ∞.
Mas, novamente pelo Lema 1.3.1, temos que
in(kn) − 1 = O µ log2kn kn ¶ , e, consequentemente, kn1/2¡i1/2n (kn) − 1 ¢ = O µ log2kn k1/2n ¶ . ¥
Conclu´ımos, ent˜ao, que o estimador 1/ bR(kn) ´e, tal como os estimadores 1/ bR1(kn)
e 1/ bR3(kn), universalmente assimptoticamente normal sobre toda a classe de fun¸c˜oes
de distribui¸c˜ao que satisfazem (1.1.1), desde que a sucess˜ao kn verifique (1.1.5) e que
kn/ log4n → ∞ quando n → ∞. Para al´em disso, o factor de normaliza¸c˜ao obtido ´e
tamb´em o factor ideal k1/2n .
Considerando agora a transforma¸c˜ao h(x) = 1/x, o teorema que se segue ´e consequˆencia imediata da Proposi¸c˜ao 1.3.1.
Teorema 1.3.1 Seja F uma f.d. que verifica (1.1.1). Se kn for uma sucess˜ao de inteiros
positivos que verifica (1.1.5) e tal que kn/ log4n → ∞ quando n → ∞, ent˜ao,
k1/2n n b R(kn) − µ−1n (kn) o D → N¡0, 2R2¢, onde µn(kn) ´e a sucess˜ao definida na Proposi¸c˜ao 1.3.1.
Temos assim que o estimador bR(kn) de R ´e tamb´em universalmente assimptoticamente
normal sobre toda a classe de fun¸c˜oes de distribui¸c˜ao que satisfazem (1.1.1), desde que a sucess˜ao kn verifique (1.1.5) e que kn/ log4n → ∞ quando n → ∞. O factor de
1.4
Normalidade assimpt´
otica de b
R
Nesta sec¸c˜ao iremos estudar a distribui¸c˜ao assimpt´otica de bR(kn) centrado em R, de modo
a que seja poss´ıvel a constru¸c˜ao de intervalos de confian¸ca assimpt´oticos para R.
Consideremos uma amostra gen´erica, Vn = (V1, . . . , Vn), de v.a. i.i.d. com f.d. comum
J. Uma v.a. que dependa da amostra Vn e de uma caracter´ıstica da popula¸c˜ao, R, ser´a
designada por ra´ız e denotada por Rn(Vn, R). Habitualmente, uma ra´ız ´e constru´ıda de
forma a que informa¸c˜oes acerca da estima¸c˜ao de R possam ser extra´ıdas da sua f.d., que denotamos por Hn(·, J). A t´ıtulo de exemplo destacamos o caso da constru¸c˜ao de intervalos
de confian¸ca a partir dos quantis da f.d. O limite fraco n˜ao degenerado de Hn(·, J), caso
exista, ser´a denotado por HA(·, J).
Ao longo desta sec¸c˜ao e tamb´em da sec¸c˜ao 1.5 usaremos ainda as seguintes nota¸c˜oes. Sendo T1, T2, . . . e T10, T20, . . . duas sucess˜oes de v.a., denotamos por Sn2(T) a variˆancia
emp´ırica de T = (T1, . . . , Tn) e por Sn(T, T0) a covariˆancia emp´ırica entre T e
T0 = (T0 1, . . . , Tn0), ou seja, S2 n(T) = 1 n n X i=1 (Ti− 1 n n X i=1 Ti)2 e Sn(T, T0) = 1 n n X i=1 Ã (Ti− 1 n n X i=1 Ti)(Ti0 − 1 n n X i=1 T0 i) ! .
Consideremos agora a amostra Wkn = (W1, . . . , Wkn) definida em Bacro e Brito (1998),
em que:
Wi := Zn−kn+i,n− Zn−kn,n, 1 ≤ i ≤ kn. (1.4.1)
Observemos que W1 ≤ W2 ≤ . . . ≤ Wkn.
Com esta nota¸c˜ao,
1 b R2(k n) = 1 kn Pkn i=1Zn−i+1,n2 − ³ 1 kn Pkn i=1Zn−i+1,n ´2 1 kn Pkn i=1log2(ni) − ³ 1 kn Pkn i=1log(n/i) ´2 = 1 kn Pkn i=1(Zn−i+1,n− Zn−kn,n) 2−³ 1 kn Pkn i=1(Zn−i+1,n− Zn−kn,n) ´2 1 kn Pkn
i=1log2(n/i) −
³ 1 kn Pkn i=1log(n/i) ´2 = 1 in(kn) 1 kn kn X i=1 W2 i − Ã 1 kn kn X i=1 Wi !2 , (1.4.2)
Consideremos agora a ra´ız R0n= Rn0 ((Zn−kn,n, Wkn) , R) = R2 √ 8k 1/2 n à 1 b R2(k n) − 1 R2 ! . (1.4.3) Denotemos por H0 n(·, F ) a f.d. de R0n: H0 n(x, F ) = P [R0n((Zn−kn,n, Wkn) , R) ≤ x] , (1.4.4) e por H0
A(·, F ) o limite fraco n˜ao degenerado dessa f.d..
No resultado que se segue estabelecemos a normalidade assimpt´otica da ra´ız R0 n, isto
´e, mostramos que sob certas condi¸c˜oes, H0
A(·, F ) = Φ(·) (veja-se Brito e Moreira Freitas
(2003b)).
Proposi¸c˜ao 1.4.1 Assumamos que F satisfaz a condi¸c˜ao (1.1.1), que eL ´e a fun¸c˜ao de varia¸c˜ao lenta em zero que surge em (1.1.2) e que kn ´e uma sucess˜ao de inteiros positivos
que satisfaz (1.1.5). Se, quando n → ∞, k1/2 n sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log à e L¡ytkn n ¢ e L¡kn n ¢ !¯¯ ¯ ¯ ¯→ 0 (1.4.5)
uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao, R2 √ 8k 1/2 n à 1 b R2(k n) − 1 R2 ! D → N(0, 1).
Prova. Comecemos por considerar a ra´ız
R00 n= Rn00((Zn−kn,n, Wkn) , R) = R2 √ 8k 1/2 n à in(kn) b R2(kn)− 1 R2 ! . (1.4.6)
Como (Zi) = (FD −1(Ui)), onde (Ui) ´e uma sucess˜ao de v.a. com distribui¸c˜ao uniforme
em [0, 1], Ui ∼ U[0,1], ent˜ao podemos escrever, sem perda de generalidade, Wi = F−1(Un−kn+i,n) − F
−1(U
n−kn,n) .
Notemos que (Ykn, . . . , Y1) tem distribui¸c˜ao igual `a do vector de e.o. de uma amostra de
v.a. i.i.d., de dimens˜ao kn, de uma distribui¸c˜ao U[0,1] (veja-se, por exemplo, Reiss (1989)).
Usando as express˜oes (1.4.2) e (1.4.7), podemos escrever:
in(kn) b R2(k n) − 1 R2 = 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !2 − Ã 1 kn kn X i=1 Ã −1 R log Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !!2 − 1 R2 = 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) − 1 kn kn X i=1 Ã −1 Rlog Yi+ log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) !!2 − 1 R2 = S2 kn(E) + S 2 kn(F) + 2Skn(E, F) − 1 R2, onde E = (E1, . . . , Ekn), F = (F1, . . . , Fkn), Ei := − 1 Rlog Yi, i = 1, . . . , kn e Fi := log e L (Yi(1 − Un−kn,n)) e L (1 − Un−kn,n) , i = 1, . . . , kn. Temos, portanto, Rn00 = R 2 √ 8k 1/2 n µ Sk2n(E) − 1 R2 ¶ + R 2 √ 8k 1/2 n ¡ Sk2n(F) + 2Skn(E, F) ¢ . (1.4.8)
Notemos agora que
(− log Yi, 1 ≤ i ≤ kn)= (TD i,kn, 1 ≤ i ≤ kn), (1.4.9)
onde (T1,n, T2,n, ..., Tn,n) ´e o vector das e.o. de uma a.a., de dimens˜ao n, de uma distribui¸c˜ao
exponencial de m´edia 1, Exp (1) . Desta forma, temos que S2
kn(E) ´e a variˆancia amostral de uma amostra de dimens˜ao
kn de v.a. i.i.d. com distribui¸c˜ao exponencial de m´edia 1/R. Assim sendo, fazendo alguns
c´alculos simples, usando o Teorema do Limite Central e o Teorema de Slutsky, conclu´ımos que R2 √ 8k 1/2 n µ Sk2n(E) − 1 R2 ¶ D → N(0, 1)
Mostraremos em seguida que k1/2 n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0,
de forma a concluirmos que R00 n D → N(0, 1). Observemos que (Skn(E, F)) 2 ≤ S2 kn(E)S 2 kn(F). Assim, k1/2 n |Skn(E, F)| = OP(1)(knS 2 kn(F)) 1/2. (1.4.10)
Considerando agora o termo S2
kn(F), podemos observar que
S2 kn(F) = 1 kn kn X i=1 Ã log eL (Yi(1 − Un−kn,n)) − 1 kn kn X i=1 log eL (Yi(1 − Un−kn,n)) !2 = 1 kn kn X i=1 Ã logL (Ye i(1 − Un−kn,n)) e L (kn/n) − 1 kn kn X i=1 logL (Ye i(1 − Un−kn,n)) e L (kn/n) !2 ≤ 1 kn kn X i=1 Ã logL (Ye i(1 − Un−kn,n)) e L (kn/n) !2 ≤ sup Ykn≤y≤1 Ã log L (y (1 − Ue n−kn,n)) e L (kn/n) !2 ,
o que implica que
k1/2 n Sk2n(F) ≤ k 1/2 n à sup Ykn≤y≤1 ¯ ¯ ¯ ¯ ¯log e L (y (1 − Un−kn,n)) e L (kn/n) ¯ ¯ ¯ ¯ ¯ !2 . (1.4.11)
Provemos agora, com base em (1.4.10) e (1.4.11), o lema que se segue. Lema 1.4.1 Sob (1.4.5), k1/2 n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0.
que converge para zero quando n → ∞, pela condi¸c˜ao (1.4.5).
Como P [An(λ1, λ2)] → 1 quando n → ∞, ent˜ao segue de (1.4.11) e de (1.4.10) que k1/2n ¯ ¯S2 kn(F) + 2Skn(E, F) ¯ ¯ P → 0. ¥
Fica assim mostrado, como j´a referimos, que R00 n
D
→ N(0, 1).
Consideremos finalmente a ra´ız R0
n definida em (1.4.3), e provemos, como ´e pretendido,
que R0 n D → N(0, 1). Podemos escrever R0 n = R2 √ 8k 1/2 n à 1 b R2(k n) − 1 R2 ! = 1 in(kn) R00n+ k 1/2 n √ 8 µ 1 in(kn) − 1 ¶ .
Relembremos agora que, pelo Lema 1.3.1,
in(kn) = 1 + O µ log2k n kn ¶ . Assim, 1
in(kn) → 1 quando n → ∞. Logo, pelo Teorema de Slutsky,
1 in(kn) R00 n D → N(0, 1).
Para al´em disso,
k√n1/2 8 µ 1 in(kn) − 1 ¶ = O µ log2kn kn1/2 ¶ ,
que converge para 0 quando n → ∞. Novamente, pelo Teorema de Slutsky, conclu´ımos que R0
n D
→ N(0, 1), como pretend´ıamos demonstrar. ¥
Consideremos agora a ra´ız
Rn = Rn((Zn−kn,n, Wkn) , R) = 1 √ 2Rk 1/2 n ³ b R(kn) − R ´ (1.4.13) e denotemos por Hn(·, F ) a f.d. da mesma:
Hn(x, F ) = P [Rn((Zn−kn,n, Wkn) , R) ≤ x] , (1.4.14)
e por HA(·, F ) o limite fraco n˜ao degenerado de Hn(·, F ).
Considerando a transforma¸c˜ao h(x) = 1/√x, obt´em-se como consequˆencia imediata da
Teorema 1.4.1 Assumamos que F satisfaz a condi¸c˜ao (1.1.1), que eL ´e a fun¸c˜ao de varia¸c˜ao lenta em zero que surge em (1.1.2) e que kn ´e uma sucess˜ao de inteiros
posi-tivos que satisfaz (1.1.5). Se, quando n → ∞, k1/2 n sup 1 kn≤y≤1 ¯ ¯ ¯ ¯ ¯log à e L¡ytkn n ¢ e L¡kn n ¢ !¯¯ ¯ ¯ ¯→ 0
uniformemente em t em conjuntos compactos de (0, ∞), ent˜ao,
1 √ 2Rk 1/2 n ³ b R(kn) − R ´ D → N(0, 1).
De forma a obtermos condi¸c˜oes mais expl´ıcitas, ´e necess´ario especificar o comporta-mento da fun¸c˜ao de varia¸c˜ao lenta definida em (1.1.7):
L(x) = r(log x),
onde r ´e a fun¸c˜ao de varia¸c˜ao regular da fam´ılia (1.1.1).
Para isso usamos a no¸c˜ao de varia¸c˜ao lenta com resto (veja-se Bingham et al. (1987), Cap´ıtulo 3), e, em particular, consideramos a seguinte rela¸c˜ao assimpt´otica:
(SR1) L(tx)/L(x) − 1 = O(g(x)) quando x → ∞, para cada t > 0,
onde g ´e uma fun¸c˜ao positiva tal que g(x) → 0 quando x → ∞. Para simplificar, assumimos que g ´e de varia¸c˜ao regular com ´ındice γ < 0. Como foi mostrado em Bacro e Brito (1998), sob a suposi¸c˜ao anterior, a condi¸c˜ao (1.4.5) pode ser muito simplificada. Apresentamos aqui o seguinte resultado:
Corol´ario 1.4.1 Assumamos que a fun¸c˜ao de varia¸c˜ao lenta L em (1.1.7) satisfaz (SR1),
com g de varia¸c˜ao regular em ∞ com ´ındice γ < 0. Ent˜ao, se k1/2 n g ¡ exp(F−1(1 − k n/n)) ¢ → 0 quando n → ∞, temos 1 √ 2Rk 1/2 n ³ b R(kn) − R ´ D → N(0, 1).
A prova deste corol´ario ´e igual `a demonstra¸c˜ao do Corol´ario 1 de Bacro e Brito (1998), que passamos a apresentar.
Prova do Corol´ario 1.4.1. Para esta prova usaremos os seguintes factos: Facto 1 (Bingham, Goldie e Teugels (1987))
Facto 2 (Bacro e Brito (1995))
1 − F (F−1(1 − u)) = u{1 + O(g(exp F−1(1 − u)))} quando u → 0.
Facto 3 (Bingham, Goldie e Teugels (1987)) Se f ´e de varia¸c˜ao regular com ´ındice ρ < 0,
f localmente limitada em [a, ∞), a ≥ 0, ent˜ao
sup{f (t) : t ≥ x} ∼ f (x) quando x → ∞.
Sejam agora 1/kn ≤ y ≤ 1 e a ≤ t ≤ b, com 0 < a < 1 < b < ∞. Combinando a
equa¸c˜ao (1.1.1) com a equa¸c˜ao (1.1.2) podemos escrever à e L(ytkn/n) e L(kn/n) !R = ytL(exp F−1(1 − ytkn/n)) L(exp F−1(1 − k n/n)) 1 − F (F−1(1 − k n/n)) 1 − F (F−1(1 − ytk n/n)) . Usando os Factos 1 e 2, sup 1 kn≤y≤1 sup a≤t≤b R ¯ ¯ ¯ ¯ ¯log e L(ytkn/n) e L(kn/n) ¯ ¯ ¯ ¯ ¯= sup1 kn≤y≤1 sup a≤t≤b O(g(exp F−1(1 − ytkn/n))).
Consequentemente, se kn1/2g (exp F−1(1 − kn/n)) → 0 quando n → ∞, o resultado segue
pelo Facto 3 e pelo Teorema 1.4.1. ¥
Uma subfam´ılia da fam´ılia de Pareto, escrita na forma (1.1.8), bastante usada no con-texto da estima¸c˜ao do ´ındice de cauda superior da fam´ılia de Pareto, ´e a designada fam´ılia de Hall, dada por:
G−1(1 − s) = s−αD 1 ¡ 1 + D2sβ{1 + o (1)} ¢ quando s → 0, (1.4.15) onde D1 > 0, D2 6= 0 e β > 0 s˜ao constantes.
No contexto da estima¸c˜ao do coeficiente de cauda exponencial, esta fam´ılia corresponde `a seguinte: F−1(1 − s) = log¡s−1/RD 1 ¡ 1 + D2sβ{1 + o (1)} ¢¢ quando s → 0, (1.4.16) onde D1 > 0, D2 6= 0 e β > 0 s˜ao constantes.
Agora, determinemos condi¸c˜oes sob as quais a condi¸c˜ao do corol´ario anterior ´e v´alida para esta fam´ılia (1.4.16).
Fazendo alguns c´alculos vemos facilmente que para esta fam´ılia
L(x) = DR