Resumo
O trabalho para esta tese de doutoramento come¸ca com o interesse em continuar o es-tudo acerca da dura¸c˜ao de n´ıveis elevados por um per´ıodo de tempo fixo, introduzido em Draisma [20]. De uma an´alise sob o pressuposto de que esses n´ıveis elevados cons-tituem uma s´erie de observa¸c˜oes i.i.d., rapidamente se passa `a hip´otese mais realista de considerar dependˆencia entre as observa¸c˜oes, embora mantendo a estacionaridade. Uma vez que ´e sempre uma modela¸c˜ao dos valores extremos que est´a em mente, muito natu-ralmente se pensa nos modelos autorregressivos de m´aximos, como os MARMA em Davis e Resnick [15], em particular, os MARMA(1, 0), tamb´em designados ARMAX (Alpuim [1], [2] e Canto e Castro [11]). Na sequˆencia do interesse em contemplar situa¸c˜oes de dependˆencia, surge a quest˜ao de avaliar se existe uma dependˆencia ou independˆencia exactas entre observa¸c˜oes consecutivas consideradas nas caudas, ou se ´e uma dependˆencia que vai desaparecendo gradualmente. Ledford e Tawn [57] introduzem um modelo, no qual surge um novo parˆametro (η), que permite “medir o grau” de dependˆencia na cauda, designado, coeficiente de dependˆencia assint´otica na cauda. ´E no decurso do c´alculo do valor deste parˆametro para os usuais max-autorregressivos, que surge a constru¸c˜ao do processo pARMAX, o qual inclui um parˆametro potˆencia (c), que faz com que o valor de η se relacione directamente com esse mesmo parˆametro. De modo a atenuar o car´acter um tanto determin´ıstico dos processos pARMAX e, assim, torn´a-los mais aplic´aveis na modela¸c˜ao de dados reais, considera-se uma generaliza¸c˜ao dos mesmos, com a introdu¸c˜ao de um factor aleat´orio. Surge assim um novo processo max-autorregressivo potˆencia, que designamos pRARMAX, e que, `a semelhan¸ca do processo pARMAX, mant´em a particu-laridade de possuir um parˆametro potˆencia (c) que se relaciona do mesmo modo com η, calculado em pares de vari´aveis consecutivas. Aproveitando a maleabilidade permitida nos processos pRARMAX, desenvolve-se uma metodologia de an´alise do seu ajustamento a uma s´erie de dados.
Palavras-Chave: Teoria de Valores Extremos, processos max-autorregressivos, ´ındice de cauda, ´ındice extremal, coeficiente de dependˆencia assint´otica na cauda.
Abstract
This work begins with the interest in pursuit the study of the duration of high le-vels that persist for a fixed period of time, introduced in Draisma [20]. From the as-sumption of i.i.d. levels, we move to more realistic forms of temporal dependence. Max-autoregressive processes like MARMA, (Davis and Resnick [15]), and also the particular case, MARMA(1, 0) or ARMAX (Alpuim [1], [2] and Canto e Castro [11]) are very in-teresting examples of stationary sequences, in what concerns an extreme value analysis. The issue of assessing the extremal dependence structure, that is, distinguishing between exact independence or a dependence that gradually disappears at more and more extreme levels, is very important, in order to select an adequate approach. Ledford and Tawn [57] introduced a model that includes the so-called coefficient of asymptotic tail dependence, denoted by η, whose value gives the strength of dependence in the tail. The pARMAX process arises from the computation of η for the above mentioned max-autoregressive models, as it includes a power parameter (c) that is related with η. In order to make the pARMAX process less deterministic and hence, more applicable to real data, it is considered a somewhat generalized version, by including a random factor. These new processes, denoted pRARMAX, are very similar to pARMAX and the same connexion between the power parameter (c) and η holds. Making use of pRARMAX flexibility, a methodology for assessing the adjustment of this model to real data is developed.
Keywords: Extreme Value Theory, max-autoregressive processes, tail index, ex-tremal index, coefficient of tail dependence.
Agradecimentos
O primeiro agradecimento e o mais especial de todos, ´e `a Professora Doutora Lu´ısa Canto e Castro, pelo apoio cient´ıfico, pela dedica¸c˜ao, motiva¸c˜ao, amizade, carinho, disponi-bilidade, sem os quais, este trabalho n˜ao seria poss´ıvel. Devo-lhe todo o meu percurso cient´ıfico, desde os primeiros passos, quando me orientou na disserta¸c˜ao de mestrado, at´e ao dia de hoje, e esta cumplicidade ´e para mim inestim´avel.
O segundo agradecimento ´e `a Sandra Dias (UTAD), pela preciosa ajuda com a pro-grama¸c˜ao em MATLAB, que permitiu levar a cabo toda a simula¸c˜ao envolvida na ´ultima sec¸c˜ao deste trabalho.
Agrade¸co ao DMAT, ao CMAT, ao projecto ERAS e `a FCT, todo o apoio financeiro.
Estou, e estarei, sempre grata `a minha fam´ılia, por ser aquele suporte, sempre pre-sente, t˜ao importante.
Conte´
udo
1 Introdu¸c˜ao 7
1.1 Condi¸c˜oes de Dependˆencia relevantes em Teoria de Extremos . . . 14
1.1.1 Caso Particular das Cadeias de Markov . . . 19
1.2 Extremos Bivariados e Dependˆencia assint´otica na cauda . . . 21
1.2.1 Dependˆencia assint´otica na cauda em Cadeias de Markov . . . 26
1.3 O ´ındice de cauda e a classe de estimadores de Drees . . . 27
2 Modelos Max-Autorregressivos 31 2.1 Modelos MARMA revisitados . . . 32
2.1.1 O coeficiente de dependˆencia assint´otica na cauda de um processo ARMAX . . . 35
2.1.2 Aproxima¸c˜ao da fun¸c˜ao quantil emp´ırica de cauda de um processo ARMAX . . . 37
2.2 O modelo pARMAX . . . 39
2.2.1 Estrutura de dependˆencia . . . 47
2.2.2 Dependˆencia assint´otica na cauda . . . 52
2.2.3 O ´ındice extremal pr´e-assint´otico . . . 55
2.2.4 Aproxima¸c˜ao da fun¸c˜ao quantil emp´ırica de cauda . . . 59
3 N´ıveis elevados que persistem no tempo 61 3.1 Quando a sucess˜ao dos n´ıveis iniciais {Xi}i≥1 ´e i.i.d. . . 62
3.1.1 Estrutura de Dependˆencia . . . 62
3.2 Quando a sucess˜ao dos n´ıveis iniciais {Xi}i≥1 ´e estacion´aria . . . 69
3.2.1 Estrutura de Dependˆencia . . . 69
3.2.2 Comportamento Extremal quando {Xi}i∈Z ´e um processo ARMAX . 71 3.2.3 Comportamento Extremal quando {Xi}i∈Z ´e um processo pARMAX 79 4 Estima¸c˜ao do parˆametro potˆencia em modelos pARMAX 89 4.1 Propriedades de alguns estimadores . . . 91
4.2 Um exemplo ilustrativo . . . 97
5 Modelos max-autorregressivos potˆencia com coeficiente aleat´orio 99 5.1 O modelo pRARMAX . . . 100
5.1.1 Estrutura de dependˆencia . . . 104
5.1.2 Coeficiente de dependˆencia assint´otica na cauda . . . 106
5.2 An´alise do ajustamento do modelo . . . 108
5.2.1 Um estudo de simula¸c˜ao . . . 116
5.2.2 Um exemplo ilustrativo . . . 119
5.2.3 Uma aplica¸c˜ao a dados financeiros . . . 123
A Tabelas do estudo de simula¸c˜ao 143
Cap´ıtulo 1
Introdu¸c˜
ao
1O principal objectivo de uma an´alise de valores extremos ´e estimar a probabilidade de
ocorrˆencia de acontecimentos mais extremos do que quaisquer que tenham sido observados. A t´ıtulo de exemplo, suponhamos que a projec¸c˜ao de um dique requer uma defesa costeira para todos os n´ıveis do mar, durante os pr´oximos 100 anos. Os modelos extremais s˜ao uma preciosa ferramenta que permite extrapola¸c˜oes deste tipo.
A Teoria de Valores Extremos (TVE) cl´assica assenta na teoria distribucional assint´otica do m´aximo de vari´aveis aleat´orias (v.a.’s) independentes e identicamente distribu´ıdas (i.i.d.). Podemos dizer que a sua idade ronda os 60 anos, embora seja poss´ıvel encontrar ra´ızes que remontam `a antiguidade matem´atica. Ao longo de todos estes anos, a Teoria de Valores Extremos tem conhecido uma grande aplica¸c˜ao, sendo o trabalho de Gumbel, E.J. [38], o maior expoente na literatura desta ´area.
O resultado central na TVE, conhecido por, Teorema dos Tipos Extremais, estabelece os trˆes dom´ınios de atrac¸c˜ao poss´ıveis para o m´aximo de sequˆencias i.i.d.. Aparecendo inicialmente com Fisher e Tippet [34], e demonstrado de uma forma generalizada, mais tarde, por Gnedenko [36], estabelece o seguinte:
1Este trabalho ´e parcialmente suportado pela bolsa de doutoramento SFRH/BD/38867/2007 da
Dada uma sequˆencia de v.a.’s, { ˆXi}i≥1, independentes e identicamente distribu´ıdas
(i.i.d.) com a v.a. bX, possuindo fun¸c˜ao distribui¸c˜ao (f.d.) marginal F e considerando c
Mn= max( bX1, ..., bXn), se existirem constantes reais, an> 0 e bn, tais que,
P ( cMn ≤ anx + bn) = Fn(anx + bn) d
−→ G(x) , (1.1)
(“→” denota convergˆencia em distribui¸c˜ao), onde G ´e uma f.d. n˜ao degenerada, ent˜aod esta ser´a de um dos trˆes tipos:
Tipo I (Fr´echet) G(x)≡ Φα(x) = exp − x−α
, x > 0, γ > 0
Tipo II (Weibull) G(x)≡ Ψα(x) = exp − (−x)α
, x < 0, γ < 0
Tipo III (Gumbel) G(x)≡ Λ(x) = exp − e−x, x∈ R,
e diz-se que F pertence ao dom´ınio de atrac¸c˜ao para m´aximos de G, com a nota¸c˜ao, F ∈ D(G) ou X ∈ D(G). A fun¸c˜ao G pode ser representada na forma param´etrica geral de Jenkinson-von Mises, dada por,
Gγ(x) = exp(−(1 + γx)−1/γ), 1 + γx > 0, γ ∈ R, (1.2)
com G0(x) = exp(−e−x), usualmente designada por fun¸c˜ao Generalizada de Valor
Ex-tremo (GEV). Tem-se, obviamente,
Gγ(x) = Φ1/γ(1 + γx), se γ > 0 Ψ−1/γ(−1 − γx), se γ < 0 Λ(x),se γ = 0.
A necessidade de uma normaliza¸c˜ao, atrav´es das constantes, an > 0 e bn, adv´em do
facto da distribui¸c˜ao do m´aximo, por si s´o, convergir para uma f.d. degenerada no limite superior do suporte de F , aqui denotado por xF, em que, xF = sup{x : F (x) < 1}.
A classe de fun¸c˜oes limite, G, em (1.1), corresponde `a classe das fun¸c˜oes max-est´aveis (est´aveis para m´aximos), significando isto que, se uma sequˆencia de v.a.’s, {ζi}i≥1,
inde-pendentes e identicamente distribu´ıdas com ζ, tiverem como f.d. marginal alguma G, em (1.1), ent˜ao existem constantes reais cn > 0 e dn, tais que,
c−1n max(ζ1, ..., ζn)− dn
d
= ζ, (1.3)
onde “=” denota, igual em distribui¸c˜ao. Claramente, uma f.d. max-est´avel est´a no seud pr´oprio dom´ınio de atrac¸c˜ao.
O parˆametro γ, conhecido como ´ındice de cauda, ´e um parˆametro de forma, na medida em que, determina o tipo de cauda de F , nomeadamente, uma cauda curta se γ < 0 (dom´ınio Weibull), uma cauda exponencial se γ = 0 (dom´ınio Gumbel) e uma cauda longa (do tipo polinomial negativo) se γ > 0 (dom´ınio Fr´echet).
Com a introdu¸c˜ao de parˆametros de localiza¸c˜ao, µ∈ R e escala, σ > 0, tem-se ainda, Gγ,µ,σ(x) = exp −1 + γx− µ σ −1/γ , 1 + γx− µ σ > 0, γ ∈ R.
Dentro da Teoria de Valores Extremos, o facto de ser v´alida a seguinte equivalˆencia: F ∈ D(Gγ) se e s´o se lim u↑xF P X− u a(u) X > u = (1 + γx)−1/γ , γ 6= 0 e−x , γ = 0, (1.4)
para alguma fun¸c˜ao mensur´avel positiva, a(·) e 1 + γx > 0, permite uma abordagem alternativa, baseada numa an´alise dos excessos acima de patamares elevados. O lado direito do limite em (1.4) motivou, `a semelhan¸ca da GEV, a defini¸c˜ao da GP (Distribui¸c˜ao Pareto Generalizada), dada por,
Pγ(x) = 1− (1 + γx)−1/γ , γ 6= 0(x≥ 0 se γ > 0; 0 ≤ x ≤ −1/γ se γ < 0) 1− e−x , γ = 0(x≥ 0).
A introdu¸c˜ao dos parˆametros, escala (σ > 0) e localiza¸c˜ao (µ∈ R), conduz a,
Pγ,µ,σ(x) = 1− 1 + γx−µσ −1/γ , γ 6= 0(x−µσ ≥ 0 se γ > 0; 0 ≤ x−µσ ≤ −1/γ se γ < 0) 1− e−x−µσ , γ = 0 (x−µ ≥ 0).
Apesar de se considerar sempre o m´aximo, n˜ao se est´a a excluir o caso do m´ınimo, uma vez que, min(X1, ..., Xn) = − max(−X1, ...,−Xn), donde os resultados podem ser
reformulados para o m´ınimo.
A convergˆencia de P ( cMn ≤ un) pode verificar-se para outras sucess˜oes reais (un)n, e
n˜ao apenas para un= anx + bn. Mais precisamente, dado τ ∈ [0, ∞],
P ( cMn ≤ un)−→ n→∞e −τ, (1.5) se e s´o se, n(1− F (un))−→ n→∞τ. (1.6)
Trabalhos de relevo na caracteriza¸c˜ao de cada um dos dom´ınios de atrac¸c˜ao, fre-quentemente referenciados na literatura, encontram-se em, von Mises [60], Gnedenko [36], de Haan [39], Balkema e de Haan [5], Goldie e Resnick [37], entre outros. Neste ˆambito, apontamos o seguinte conjunto de condi¸c˜oes necess´arias e suficientes, que se resumem ao estudo da cauda da f.d. em causa e ao conhecimento do limite superior do suporte, xF. Indicam-se, tamb´em, poss´ıveis escolhas para as constantes de atrac¸c˜ao, an > 0 e bn,
decorrentes da demonstra¸c˜ao dessas mesmas condi¸c˜oes. Proposi¸c˜ao 1.0.1. Seja bX uma v.a. com f.d. F . Ent˜ao:
i) F ∈ D(Gγ)≡ D(Φγ), γ > 0, se e s´o se, xF =∞ e lim w→∞ 1− F (wx) 1− F (w) = x −1/γ, x > 0. (1.7)
As constantes de atrac¸c˜ao, an > 0 e bn, podem ser escolhidas do seguinte modo:
an= F−1(1− 1/n) e bn = 0.
ii) F ∈ D(Gγ)≡ D(Ψγ), γ < 0, se e s´o se, xF <∞ e
lim
w↓0
1− F (xF − wx)
1− F (xF − w)
= x−1/γ, x > 0. (1.8) Uma escolha poss´ıvel para as constantes de atrac¸c˜ao, ser´a, an = xF − F−1(1− 1/n)
iii) F ∈ D(Gγ)≡ D(Λ), γ = 0, se e s´o se, xF ≤ ∞ e
lim
w↑xF
1− F (w + xf(w))
1− F (w) = e−x, x∈ R, (1.9)
para alguma fun¸c˜ao positiva adequada, f . Se (1.9) ´e v´alida para certa fun¸c˜ao f , ent˜ao RxF
w (1− F (s))ds < ∞, com w < xF, e, assim, tem-se (1.9) para
f (w) := RxF
w (1− F (s))ds
1− F (w) . Pode considerar-se an = f (bn) e bn= F−1(1− 1/n).
A fun¸c˜ao F−1 designa a inversa generalizada de F ou fun¸c˜ao quantil (f.q.) de F , i.e.,
F−1(y) = inf{x : F (x) ≥ y}.
A condi¸c˜ao relativa ao dom´ınio de atrac¸c˜ao Fr´echet (1.7), significa que a fun¸c˜ao, 1− F (x) ´e de varia¸c˜ao regular de ´ındice −1/γ em ∞. Do mesmo modo, a condi¸c˜ao (1.8), no dom´ınio de atrac¸c˜ao Weibull, ´e equivalente a afirmar que, 1− F (xF − x) ´e de
varia¸c˜ao regular de ´ındice −1/γ em 0. O conceito de fun¸c˜ao de varia¸c˜ao regular e toda a teoria desenvolvida em seu redor, ´e uma ferramenta de grande importˆancia na Teoria de Valores Extremos, univariada e multivariada, intrinsecamente associado `a caracteriza¸c˜ao dos dom´ınios de atrac¸c˜ao.
Concretamente, uma fun¸c˜ao mensur´avel f : R+ → R+, diz-se de varia¸c˜ao regular em
infinito, com ´ındice ρ, se, para x > 0, lim
w→∞
f (wx) f (w) = x
ρ. (1.10)
A fun¸c˜ao f (x) ´e de varia¸c˜ao regular em∞ se e s´o se f(1/x) ´e de varia¸c˜ao regular em 0.
Quando ρ = 0, a fun¸c˜ao diz-se de varia¸c˜ao lenta e ´e denotada, usualmente, por L(x). Uma vez que, f (x)/xρ ´e de varia¸c˜ao lenta, ent˜ao, L(x) = f (x)/xρ. Logo,
esta representa¸c˜ao, a caracteriza¸c˜ao das fun¸c˜oes de varia¸c˜ao regular pode ser feita com base no estudo das fun¸c˜oes de varia¸c˜ao lenta, L. Exemplos t´ıpicos destas fun¸c˜oes s˜ao: L(x) = (log x)α ou quaisquer itera¸c˜oes de log, com α arbitr´ario e x > 1; L(x) positiva e
mensur´avel possuindo limite constante positivo quando x → ∞ e L(x) = exp{(log x)β}
com β < 1. A classe de fun¸c˜oes de varia¸c˜ao lenta ´e fechada para a adi¸c˜ao, multiplica¸c˜ao e potencia¸c˜ao em R.
Se uma fun¸c˜ao for de varia¸c˜ao regular de ´ındice ρ (ρ ∈ R) ent˜ao a sua inversa ´e de varia¸c˜ao regular de ´ındice −ρ, e vice-versa.
Na verdade, a varia¸c˜ao regular pode ser ligeiramente enfraquecida.
Proposi¸c˜ao 1.0.2 (de Haan, 1970; Feller, 1971). Uma fun¸c˜ao mensur´avel, f : R+→ R+,
´e de varia¸c˜ao regular, se existe uma fun¸c˜ao g, tal que, para todo x > 0, lim
w→∞f (wx)/f (w) = g(x).
Neste caso, g(x) = xρ, para algum ρ∈ R.
Extendendo agora o conceito ao caso multidimensional, seja C ⊂ Rd um cone, i.e.,
x = (x1, ..., xd)∈ C se e s´o se wx ∈ C, ∀w > 0. Uma fun¸c˜ao mensur´avel, h : C → (0, ∞)
diz-se de varia¸c˜ao regular com fun¸c˜ao limite, λ, se λ(x) > 0, com x∈ C, e, se para todo x∈ C,
lim
w→∞h(wx)/h(w1) = λ(x), (1.11)
tal que, λ(1) = 1.
Decorre desta defini¸c˜ao e da Proposi¸c˜ao anterior que, existe ρ ∈ R (independente de x), tal que, λ ´e homog´enea de ´ındice ρ, i.e.,
λ(sx) = sρλ(x), s > 0 (1.12)
(Bingham et al. [8]; Resnick [66]). Assim, alternativamente a (1.11), dir-se-´a que, h : C → (0, ∞) ´e de varia¸c˜ao regular com fun¸c˜ao limite, λ, se e s´o se, existe V : R+ → R+,
onde V ´e uma fun¸c˜ao de varia¸c˜ao regular com ´ındice ρ, e, para todo x∈ C, lim
w→∞h(wx)/V (w) = λ(x), (1.13)
(Resnick [66]).
Dom´ınio de atrac¸c˜ao Fr´echet
O dom´ınio de atrac¸c˜ao Fr´echet, pelo facto de corresponder a um dom´ınio de f.d.’s com caudas pesadas, assume um interesse especial na TVE e, neste trabalho em particular, encontra-se envolvido em quase todos os resultados.
Como foi visto, as f.d.’s neste dom´ınio, apresentam-se com cauda direita de varia¸c˜ao regular de ´ındice−1/γ em ∞, donde,
1− F (x) = x−1/γLF(x),
onde LF ´e uma fun¸c˜ao de varia¸c˜ao lenta em ∞.
A caracteriza¸c˜ao dos dom´ınios de atrac¸c˜ao de m´aximos tamb´em pode ser feita atrav´es da f.q., F−1. No caso do dom´ınio de atrac¸c˜ao Fr´echet, o limite, lim
t↓0F−1(1−tx)/F−1(1−
t) = x−γ, ´e uma condi¸c˜ao necess´aria e suficiente para que F ∈ D(G
γ), onde γ > 0 e x > 0.
Assim sendo, tem-se a seguinte aproxima¸c˜ao, quando t↓ 0:
F−1(1− tx) ∼ x−γF−1(1− t), (1.14) ou seja, F−1 ´e uma fun¸c˜ao de varia¸c˜ao regular de ´ındice −γ em 0 e, portanto,
F−1(1− t) = t−γLF −1(t), (1.15)
onde LF −1 ´e uma fun¸c˜ao de varia¸c˜ao lenta em zero.
Se F ´e cont´ınua, ent˜ao F (F−1(1− t)) = 1 − t. Mas, por outro lado,
F (F−1(1− t)) ∼ F t−γL F −1(t) = 1− tLF −1(t) −1/γ LF t−γLF −1(t) , (1.16)
e, portanto, considerando 1/t≡ x, podemos relacionar as fun¸c˜oes de varia¸c˜ao lenta asso-ciadas `a f.d. e `a f.q., respectivamente, LF e LF −1, do seguinte modo:
LF −1(t) −1/γ LF t−γLF −1(t) ∼ 1, t ↓ 0. (1.17)
1.1
Condi¸c˜
oes de Dependˆ
encia relevantes em Teoria
de Extremos
A evidˆencia de uma dependˆencia temporal inerente a muitos fen´omenos f´ısicos, fez com que a teoria de extremos cl´assica progredisse para um pressuposto mais realista, no sentido de, passar a contemplar sequˆencias dependentes. Os primeiros passos conhecidos deste novo desafio, s˜ao atribu´ıdos a G. S. Watson, R. M. Loynes e S. M. Berman. Os tra-balhos de Watson e Loynes assentam, essencialmente, numa extens˜ao dos resultados da teoria cl´assica a sequˆencias com estrutura de dependˆencia, enquanto que Berman inicia uma teoria detalhada para sequˆencias estacion´arias.
As condi¸c˜oes de dependˆencia que aqui vamos considerar assentam numa dependˆencia fraca, i.e., que vai esmorecendo `a medida que as v.a.’s se v˜ao afastando no tempo, que, na pr´atica, resulta na restri¸c˜ao de uma dependˆencia de longo alcance.
O conceito mais simples ´e o da m-dependˆencia (Watson, [80]) em que as vari´aveis aleat´orias Xi e Xj s˜ao independentes, sempre que |i − j| > m.
Segue-se a defini¸c˜ao de algumas condi¸c˜oes “mixing” ou de mistura, bastante conhecidas na literatura.
Defini¸c˜ao 1.1.1. Sejam A e B σ-´algebras contidas na σ-´algebra, F, do espa¸co de proba-bilidades, (Ω,F, P ). Considerem-se as medidas de dependˆencia:
φ A, B = sup|P (B|A) − P (B)|, A ∈ A, B ∈ B, P (A) > 0 β A, B= sup1 2 I X i=1 J X j=1 |P (Ai∩ Bj)− P (Ai)P (Bj)|,
onde o supremo ´e tomado sobre todos os pares de parti¸c˜oes (finitas) {A1, ..., AI} e {B1, ..., BJ} de Ω, tais que, Ai ∈ A para cada i
e Bj ∈ B para cada j.
Seja {Xi}i∈Z uma sequˆencia de v.a.’s (n˜ao necessariamente estacion´arias) e, para
−∞ ≤ J ≤ L ≤ ∞, defina-se a σ-´algebra, FL
J = σ(XJ, ...XL).
• {Xi}i∈Z diz-se α-mixing (ou strong-mixing) (Rosenblatt, M. [73]) se
α(n) := sup
j∈Z
α F−∞j ,Fj+n∞
→ 0. (1.18)
• {Xi}i∈Z diz-se β-mixing (ou absolutamente regular) se
β(n) := sup
j∈Z
β F−∞j ,Fj+n∞ → 0. (1.19)
• {Xi}i∈Z diz-se φ-mixing (de Ibragimov) (Ibragimov [49], [50]) se
φ(n) := sup
j∈Z
φ F−∞j ,Fj+n∞
→ 0 (1.20)
De notar que, a condi¸c˜ao φ-mixing de Ibragimov implica a condi¸c˜ao β-mixing que, por sua vez, implica a strong-mixing.
Em Leadbetter [52], apresenta-se a condi¸c˜ao distributional-mixing, conhecida por, condi¸c˜ao D≡D(u) (∀u ∈ R) ou ainda D(un), para uma sucess˜ao real (un)n. Trata-se
de uma condi¸c˜ao mais fraca que as anteriores, pois reporta-se apenas a acontecimentos do tipo {Xi ≤ u} ou suas intersec¸c˜oes.
Defini¸c˜ao 1.1.2. A sequˆencia estacion´aria {Xi}i∈Z, com f.d. marginal F , verifica D(un)
para uma sucess˜ao de n´umeros reais (un)n, se, para quaisquer conjuntos de inteiros I =
i1, ..., ip e J =j1, ..., jp0 , tais que, 1≤ i1 < ... < ip < j1 < ... < jp0 ≤ n e j1− ip ≥ ` , se tem, |FI,J(un)− FI(un)FJ(un)| ≤ αn,`, com αn,`n → n→∞0, (1.21)
para alguma sucess˜ao `n= o(n), onde se considera,
FI,J(un) = P (Xi1 ≤ un, ..., Xip ≤ un, Xj1 ≤ un, ..., Xjp0 ≤ un).
A importˆancia desta condi¸c˜ao reside no facto de permitir uma extens˜ao do Teorema dos Tipos Extremais, a um contexto D-dependente, como se estabelece no resultado seguinte. Teorema 1.1.1. Seja {Xi}i∈Z uma sucess˜ao estacion´aria e Mn= max(X1, ..., Xn).
Supo-nhamos que existem sucess˜oes de constantes {an > 0} e {bn ∈ R}, tais que, P Mn ≤
anx + bn
converge para uma f.d. G(x) n˜ao degenerada. Se a condi¸c˜ao D(anx + bn) for
v´alida para todo x∈ R, ent˜ao G(x) ´e uma fun¸c˜ao GEV.
Na extens˜ao de um resultado de Loynes [56], Chernick [12] mostra que, se para cada τ > 0, existe uma sucess˜ao (u(τ )
n )n verificando (1.6) e {Xi}i∈Z verifica D(un(τ )) , ent˜ao,
qualquer (fun¸c˜ao) limite para P Mn ≤ u(τ )n
ser´a da forma, P Mn ≤ u(τ )n −→ n→∞e −θτ, (1.22)
com θ∈ [0, 1] constante, independente de τ.
O novo parˆametro, θ, denomina-se ´ındice extremal da sequˆencia{Xi}i∈Z.
Conclui-se de imediato que, as sequˆencias i.i.d. cujo m´aximo devidamente normalizado convirja, tˆem ´ındice extremal unit´ario. O rec´ıproco, contudo, n˜ao ´e verdadeiro. Este fen´omeno pode ser constatado nos processos Gaussianos autorregressivos (Leadbetter et al. [53], Cap. 4).
O ´ındice extremal desempenha um papel importante na deriva¸c˜ao de propriedades ex-tremais de uma sequˆencia estacion´aria, {Xi}i∈Z, verificando a condi¸c˜ao de mistura fraca
D(un), com margens no dom´ınio de atrac¸c˜ao para m´aximos de alguma GEV. Mais
pre-cisamente, se {Xi}i∈Z verifica a condi¸c˜ao D(un) para sucess˜oes (un)n satisfazendo (1.6),
atendendo a (1.5) e (1.22), tem-se, lim
n→∞P (max(X1, ... , Xn)≤ un) = limn→∞ P (X1 ≤ un)
nθ
. (1.23)
Ainda no contexto de sequˆencias estacion´arias, sob a validade da condi¸c˜ao D(un),
Leadbetter et al. [53] estabelecem a equivalˆencia entre (1.5) e (1.6), introduzindo uma nova condi¸c˜ao de dependˆencia local, D0(un), definida em baixo:
Defini¸c˜ao 1.1.3. A sucess˜ao estacion´aria {Xi}i∈Z verifica a condi¸c˜ao D0(un) se, quando
k→ ∞ e rn= [n/k], lim sup n→∞ n rn X j=2 P X1 > un, Xj > un → 0.
Considerando {Xi}i∈Z uma sequˆencia estacion´aria e { ˆXi}i≥1 a respectiva sequˆencia
i.i.d. associada, i.e., ambas tˆem a mesma distribui¸c˜ao marginal, ent˜ao, sob a validade das condi¸c˜oes D(un) e D0(un) para {Xi}i∈Z, a lei limite do m´aximo linearmente normalizado
de{Xi}i∈Z e de { ˆXi}i≥1 coincidem. Decorre ainda da equivalˆencia entre (1.5) e (1.6) que
{Xi}i∈Z tem ´ındice extremal unit´ario.
Considere-se uma subdivis˜ao das v.a.’s X1, X2, ... em blocos de tamanho rn, (X1, ..., Xrn),
(Xrn+1, ..., X2rn), ..., onde rn= o(n). Um cluster de excedˆencias ´e definido como um
con-junto de observa¸c˜oes que excedem um limiar un, dentro de cada bloco, dado que ocorre,
pelo menos, uma excedˆencia (i.e., ocorre um acontecimento do tipo {Xi > un}) dentro
desse bloco.
A condi¸c˜ao de dependˆencia local, D0(un), restringe a possibilidade de ocorrerem duas
ou mais excedˆencias em cada bloco. Assim, numa sequˆencia que verifique D0(un), as
excedˆencias de limiares elevados tendem a aparecer isoladas, assemelhando-se a uma situa¸c˜ao i.i.d..
Uma condi¸c˜ao mais fraca do que D0(un), designada D00(un), foi introduzida em
Lead-better e Nandagopalan [54]. Essencialmente, esta condi¸c˜ao inibe a ocorrˆencia de oscila¸c˜oes r´apidas junto de limiares elevados un, ou seja, restringe a probabilidade de ocorrerem dois
ou mais acontecimentos do tipo {Xj ≤ un< Xj+1} (designados cruzamentos ascendentes
de un no instante j) em cada bloco de dimens˜ao rn. Em termos formais, define-se do
seguinte modo:
Defini¸c˜ao 1.1.4. Seja {Xi}i∈Z uma sucess˜ao estacion´aria verificando a condi¸c˜ao D(un).
A condi¸c˜ao D00(un) ´e v´alida se existe uma sucess˜ao de inteiros {kn}, tal que,
kn−→ n→∞∞ , knαn,lnn→∞−→0 , knln/nn→∞−→0 , kn(1− F (un))n→∞−→0 (1.24) e lim n→∞n rXn−1 j=2 P X1 > un, Xj ≤ un< Xj+1 = 0, onde rn= [n/kn].
A validade das condi¸c˜oes D e D00 pode facilitar bastante o c´alculo do ´ındice extremal, sobretudo em processos onde se conhe¸ca a fun¸c˜ao de probabilidade de transi¸c˜ao, como ´e o caso dos processos markovianos, conforme ´e not´orio no resultado que se segue (Leadbetter e Nandagopalan [54], Corol´ario 4.2.4):
Teorema 1.1.2. Seja (u(τ )
n )n uma sucess˜ao real, tal que, nP (X1 > u(τ )n )→ τ. Se {Xi}i∈Z
verifica D(u(τ )
n ) e D00(u(τ )n ), para todo τ > 0, e se para algum deles,
lim n→∞P X2 ≤ u (τ ) n |X1 > u(τ )n ) = θ, (1.25)
ent˜ao a convergˆencia d´a-se para todo o τ > 0 e o processo tem ´ındice extremal igual a θ.
Uma outra condi¸c˜ao de dependˆencia local, tamb´em relacionada com o ´ındice extremal, foi introduzida por Hsing et al. [46], a que chamaram ∆(un). Esta condi¸c˜ao ´e mais forte
que a condi¸c˜ao D(un), mas n˜ao tanto quanto a strong-mixing. De facto, ela deriva de um
enfraquecimento da condi¸c˜ao strong-mixing, pois confina-se `as σ-´algebras, FL
J(un), que
un}. Concretamente, a condi¸c˜ao ∆(un) ´e v´alida se, para uma dada sucess˜ao real (un)n e
para alguma sucess˜ao (ln)n, tal que, ln= o(n), se tem,
α(ln, un) = sup 1≤k≤n−1
α(Fk
1(un),Fk+l∞ n(un))→ 0, n → ∞ (1.26)
Se {Xi}i∈Z ´e uma sequˆencia estacion´aria sob a condi¸c˜ao ∆(un), satisfazendo (1.6)
para uma constante positiva τ e possui ´ındice extremal positivo, ent˜ao, o valor do ´ındice extremal aproxima-se do inverso aritm´etico do tamanho m´edio dos clusters de excedˆencias. Nestas condi¸c˜oes, podemos dizer que θ “mede a tendˆencia” dos extremos para ocorrer em clusters.
Neste ponto, conv´em fazer a ressalva de que, um ´ındice extremal nulo est´a associado a casos considerados “patol´ogicos”, que n˜ao ser˜ao aqui abordados.
Se relaxarmos agora um pouco a dependˆencia na condi¸c˜ao D(un), encontramos ainda
uma outra caracteriza¸c˜ao do ´ındice extremal, desta feita, estabelecida em O’Brien [62]: θ = lim
n→∞P (Xi ≤ un, 2≤ i ≤ rn|X1 > un) , (1.27)
onde (un)n ´e uma sucess˜ao real, tal que, (1.6) ´e v´alido novamente para uma constante
τ > 0.
1.1.1
Caso Particular das Cadeias de Markov
Muitas das vezes, as s´eries temporais em estudo apresentam uma dependˆencia a curto termo, o que faz com com que os processos markovianos sejam frequentemente utilizados na modela¸c˜ao deste tipo de dados.
No que se segue, considera-se que a sequˆencia {Xi}i∈Z ´e uma cadeia de Markov
estacion´aria de primeira ordem com espa¸co de estados cont´ınuo. Neste caso, os coefi-cientes de mistura, na Defini¸c˜ao 1.1.1, simplificam-se bastante, para a sequˆencia {Xi}i∈Z,
pois reduzem-se a, respectivamente, α(n) = α(σ(X0), σ(Xn)), β(n) = β(σ(X0), σ(Xn)),
Certas caracter´ısticas das cadeias de Markov, permitem conhecer alguma da sua estrutura de dependˆencia. Em O’Brien [62], por exemplo, constata-se que, as cadeias de Markov com espa¸cos de estados cont´ınuo e transi¸c˜oes n˜ao degeneradas, verificam a condi¸c˜ao distribucional-mixing, D, de Leadbetter et al. [53].
O resultado que se segue, ´e mais um exemplo dessa liga¸c˜ao.
Proposi¸c˜ao 1.1.3 (Bradley, [10]). Seja{Xi}i∈Z uma cadeia de Markov estritamente
esta-cion´aria.
1. {Xi}i∈Z ´e Harris recorrente e a aperi´odica, se e s´o se, tem uma estrutura de
de-pendˆencia β-mixing;
2. Se {Xi}i∈Z ´e erg´odica e aperi´odica, e φ(n) < 1 para algum n ≥ 1 em (1.20), ent˜ao
´e v´alida a condi¸c˜ao φ-mixing.
3. Se {Xi}i∈Z ´e Harris recorrente, ent˜ao ´e erg´odica.
Vejamos o que significa cada um destes conceitos, que se encontram bastante explanados, por exemplo, em Asmussen [4] e em Meyn e Tweedie [59].
Defini¸c˜ao 1.1.5. Um conjunto R diz-se recorrente num processo estoc´astico {Xi}i∈Z, se
volta a ser visitado pelo processo em tempo finito, i.e., P (inf{n : Xn ∈ R} < ∞) = 1.
Proposi¸c˜ao 1.1.4. Seja {Xi}i∈Z uma cadeia de Markov estritamente estacion´aria com
f.d. marginal F . Um conjunto R ´e recorrente, se F (R) =RRF (dx) > 0.
Daqui em diante, denotar-se-´a por Qm(x, B), a fun¸c˜ao probabilidade de transi¸c˜ao a
m-passos de x para o conjunto B, i.e., Qm(x, B) = P (X
m+1 ∈ B|X1 = x), onde m ´e um
inteiro positivo.
Proposi¸c˜ao 1.1.5. Seja {Xi}i∈Z uma cadeia de Markov estritamente estacion´aria e R
um conjunto recorrente. Se, para algum m > 0, ∈ (0, 1) e uma distribui¸c˜ao λ, se tiver,
para todo B ∈ B(R) (B(R) ´e uma σ-´algebra de Borel), ent˜ao R diz-se um conjunto de regenera¸c˜ao.
Defini¸c˜ao 1.1.6. Uma cadeia de Markov estritamente estacion´aria diz-se regenerativa ou Harris recorrente se possui um conjunto de regenera¸c˜ao.
Segue-se uma condi¸c˜ao suficiente para a aperiodicidade (Asmussen, [4]).
Proposi¸c˜ao 1.1.6. Uma cadeia de Markov estritamente estacion´aria, {Xi}i∈Z, diz-se
aperi´odica se, para qualquer conjunto de regenera¸c˜ao R, e para qualquer acontecimento B, se tem,
Qm+1(x, B)≥
1λ(B) e Qm(x, B)≥ 2λ(B) , ∀x ∈ R, (1.29)
para algum m∈ N e 1, 2 ∈ (0, 1).
Defini¸c˜ao 1.1.7. Seja {Xi}i∈Z uma cadeia de Markov, estritamente estacion´aria, e seja
µ, a distribui¸c˜ao de X0 (em (R,B(R))). Diz-se que {Xi}i∈Z ´e irredut´ıvel, se o que se segue
´e v´alido, µ-q.c. (“q.c.”, significa, “quase certamente”) x∈ R:
∀B ∈ B(R) : µ(B) > 0, ∃n ≥ 1 : P (Xn∈ B|X0 = x) > 0.
Teorema 1.1.7. Uma cadeia de Markov, estritamente estacion´aria, diz-se erg´odica, se for irredut´ıvel.
1.2
Extremos Bivariados e Dependˆ
encia assint´
otica
na cauda
Muitos problemas, envolvendo valores extremos, s˜ao de natureza multivariada. Por exemplo, de Haan e de Ronde [41] e de Haan e Sinha [42] estimaram a probabilidade de uma tempestade causar o colapso de um dique, perto da cidade de Petten, nos Pa´ıses Baixos, considerando uma combina¸c˜ao de alto risco, entre o n´ıvel do mar e a altura da ondula¸c˜ao. No campo das finan¸cas, por exemplo, Longin e Solnik [55] investigaram a
dependˆencia entre a equidade internacional dos mercados em per´ıodos de elevada volati-lidade.
A extens˜ao da Teoria de Valores Extremos univariada ao caso multivariado n˜ao ´e assim t˜ao imediata, pois apresenta logo dois problemas: decidir o que ´e uma observa¸c˜ao extrema multivariada e, como lidar com a eventual dependˆencia entre as v.a.’s de um vector. No que respeita `a primeira quest˜ao, o mais usual ´e considerar o m´aximo componente a componente, i.e., dada uma sequˆencia i.i.d. de vectores d-variados, Xi = (Xi,1, ..., Xi,d),
i = 1, ..., n, as componentes do m´aximo, Mn = max(X1, ..., Xn), s˜ao dadas por, Mn,j =
max(X1,j, ..., Xn,j), j = 1, ..., d. Note-se que, este m´aximo n˜ao ´e, necessariamente, um
vector observado.
Ressalva-se, desde j´a que, tal como no caso unidimensional, pelo facto de, min(X1, ..., Xn) = − max(−X1, ...,−Xn)
apenas nos preocupamos com o estudo do m´aximo, pois os resultados para o m´ınimo componente a componente, decorrem de imediato, mediante esta transforma¸c˜ao.
Analogamente `a situa¸c˜ao univariada, procuram-se vectores de constantes reais, an >
0 = (0, ..., 0) e bn, tais que, existe uma f.d. d-variada, G, com margens n˜ao degeneradas,
de tal modo que,
P (Mn≤ anx + bn) = Fn(anx + bn) d
−→ G(x) , (1.30)
Novamente, diz-se que F pertence ao dom´ınio de atrac¸c˜ao (para m´aximos) de G, denotando-se, F ∈ D(G). Se Fj e Gj forem as f.d.’s marginais de F e G, respectivamente, para
j = 1, ..., d, tem-se que,
Fjn(an,jxj + bn,j) d
→ Gj(xj),
onde, para cada j, Gj ´e uma fun¸c˜ao de valor extremo univariada e Fj ∈ D(Gj). A classe
de fun¸c˜oes limite, G, em (1.30), coincide com a classe de fun¸c˜oes max-est´aveis, onde max-estabilidade tem o mesmo sentido do caso univariado em (1.3).
Desta vez, n˜ao ´e poss´ıvel uma representa¸c˜ao param´etrica geral, para as fun¸c˜oes mul-tivariadas de valor extremo, dada a vasta classe de estruturas de dependˆencia que podem ocorrer entre as v.a’s do vector em causa. Este impedimento vem dificultar sobremaneira a inferˆencia estat´ıstica, que, deste modo, se viu for¸cada a diligenciar outras estrat´egias, nomeadamente, a constru¸c˜ao de sub-fam´ılias param´etricas, suficientemente flex´ıveis para aproximarem, satisfatoriamente, qualquer fun¸c˜ao da classe limite max-est´avel, mas, si-multaneamente, anal´ıtica e computacionalmente trat´aveis.
Um dos problemas que adv´em dos m´etodos baseados directamente da caracteriza¸c˜ao (1.30), reside no facto de que, apenas permitem modelos, nos quais, as componentes para valores extremos s˜ao, ou exactamente independentes, ou assintoticamente dependentes (no sentido de que, a probabilidade de extremos conjuntos, d´a-se com a mesma ordem de magnitude de um s´o extremo). A modela¸c˜ao da cauda de uma distribui¸c˜ao multi-variada, com base numa distribui¸c˜ao de valor extremo, torna-se, ent˜ao, inadequada para dados exibindo uma associa¸c˜ao entre as observa¸c˜oes, que gradualmente vai desaparecendo para valores cada vez mais extremos, aproximando-se, progressivamente, de uma situa¸c˜ao i.i.d. (independˆencia assint´otica). Este fen´omeno tem sido notado em s´eries de dados e aplica¸c˜oes te´oricas (Tawn em [16], Smith e Weissman [77] e Hsing et al. [48]). As distribui¸c˜oes normais bivariadas, com correla¸c˜ao |ρ| < 1, por exemplo, comungam desta caracter´ıstica.
Num contexto bivariado, surgiram alguns m´etodos para “quantificar” a dependˆencia existente num par aleat´orio, (X1, X2), para valores de cauda (entenda-se cauda direita
pois reportamo-nos sempre ao m´aximo). Admitindo que (X1, X2) tem f.d.’s marginais,
respectivamente, F1 e F2 cont´ınuas e, admitindo, primeiramente, que estas s˜ao idˆenticas,
Coles et al. [13] apresentam um coeficiente de dependˆencia extremal, entre X1 e X2, ao
n´ıvel dos valores m´aximos, dado por, lim
x→xF
P (X2 > x|X1 > x) = χ , (1.31)
modo mais geral, se F1 e F2 n˜ao s˜ao idˆenticas, considerando a transforma¸c˜ao Uj = Fj(Xj)
(j = 1, 2), tem-se,
lim
u↑1P (U2 > u|U1 > u) = χ. (1.32)
Grosso modo, χ ´e a probabilidade de uma vari´avel ser extrema, dado que, a outra tamb´em o ´e. Quando 0 < χ ≤ 1, X1 e X2 dizem-se assintoticamente dependentes na cauda,
enquanto que, χ = 0 indica que s˜ao assintoticamente independentes na cauda. Veja-se agora o seguinte desenvolvimento:
P (U2 > u|U1 > u) = 2− 1− P (U2 < u, U1 < u) 1− P (U1 < u) ∼ u↑12− log P (U2 < u, U1 < u) log P (U1 < u) , (1.33) Designando por χ(u) a aproxima¸c˜ao que se obteve, i.e.,
χ(u) = 2−log P (U2 < u, U1 < u)
log P (U1 < u)
, para 0 ≤ u ≤ 1, (1.34)
esta fun¸c˜ao ´e uma medida de dependˆencia u-dependente, pois o seu sinal determina se as vari´aveis s˜ao positiva ou negativamente associadas ao n´ıvel do limiar u. Na verdade, χ(u) ´e limitada por: 2− log(2u − 1)/ log(u) ≤ χ(u) ≤ 1, sendo o limite inferior interpretado como −∞ se u ≤ 1/2 e 0 se u = 1. Veja-se que, atendendo a (1.32), (1.33) e (1.34), tem-se,
lim
u↑1 χ(u) = χ.
O aumento do valor da medida χ, significa um aumento do grau de dependˆencia entre as v.a.’s, mas n˜ao permite diferenciar graus de dependˆencia no caso assintoticamente in-dependente (i.e., χ = 0). De modo a contornar este problema, Coles et al. [13] apresentam um coeficiente alternativo, χ, an´alogo a χ, mas baseado numa compara¸c˜ao entre as fun¸c˜oes de sobrevivˆencia, conjunta e marginal, de U1 e U2, respectivamente, P (U1 > u1, U2 > u2)
e P (U1 > u1), com u1, u2 ∈ (0, 1). Mais precisamente, considerando agora,
χ(u) = 2 log(1− u) log P (U2 > u, U1 > u) − 1. (1.35) define-se assim, lim u↑1 χ(u) = χ. (1.36)
Tem-se que −1 ≤ χ ≤ 1, onde χ = 1 corresponde a v.a.’s assintoticamente depen-dentes na cauda e, para −1 ≤ χ < 1, as v.a.’s dizem-se assintoticamente independentes na cauda. Este coeficiente permite, agora, discriminar diferentes graus de dependˆencia no caso assintoticamente independente.
O modelo de Ledford e Tawn [57], [58], para a fun¸c˜ao de sobrevivˆencia conjunta de uma distribui¸c˜ao bivariada, compreende, tamb´em, ambas as situa¸c˜oes, de dependˆencia e de independˆencia assint´otica, e dentro desta ´ultima, permite distinguir entre: associa¸c˜ao positiva, quase/exacta independˆencia e associa¸c˜ao negativa, entre as v.a.´s, ao n´ıvel da cauda. Neste modelo surge um outro coeficiente de dependˆencia extremal, conhecido por coeficiente de dependˆencia assint´otica na cauda, usualmente denotado por η. Pelas raz˜oes acima descritas, ´e considerado um coeficiente mais ´util e ´e aquele que mais se referencia e trabalha na literatura. Sendo assim, ´e sobre este que nos vamos debru¸car, passando `a sua defini¸c˜ao formal.
Atendendo `a formula¸c˜ao em Draisma et al. [21], o modelo de Ledford e Tawn assume que a fun¸c˜ao, (x, y) 7→ P (X1 > F1−1(1− x), X2 > F2−1(1− y)), ´e de varia¸c˜ao regular de
´ındice 1/η (η∈ (0, 1]) em 0, ou seja, quando t ↓ 0,
ht(x, y) :=
P (X1 > F1−1(1− tx), X2 > F2−1(1− ty))
P (X1 > F1−1(1− t), X2 > F2−1(1− t))
→ h(x, y), (1.37) onde h ´e uma fun¸c˜ao n˜ao degenerada, homog´enea de ordem 1/η (ver 1.12). Admite-se que a convergˆencia ocorre uniformemente em{(x, y)| max(x, y) = 1}.
Assim sendo, quando t↓ 0, podemos considerar, P (X1 > F1−1(1− t), X2 > F2−1(1− t)) ∼
t1/ηL(t), onde L ´e uma fun¸c˜ao de varia¸c˜ao lenta em 0 (ver 1.13), ou equivalentemente,
que
P (X2 > F2−1(1− t)|X1 > F1−1(1− t)) ∼ t1/η−1L(t). (1.38)
Notando que, esta ´ultima aproxima¸c˜ao, mediante a mudan¸ca de vari´avel, u = 1 − t, permite estabelecer que, η ∼ log P (U1 > u)/ log P (U1 > u, U2 > u), quando u → 1,
considerando (1.35) e (1.36), ent˜ao,
χ = 2η− 1. (1.39)
Veja-se que, se η = 1 e L(t) → a, para algum 0 < a ≤ 1, tem-se χ = 1 e o limite em (1.38) vem positivo, pelo que as v.a.’s s˜ao assintoticamente dependentes de grau χ = a. No caso de η = 1 e L(t) → 0 ou 0 < η < 1, o limite em (1.38) ´e nulo, correspondendo a χ = 0 em (1.31) e ent˜ao, X1 e X2 dizem-se assintoticamente independentes com um
grau dado por χ. Dentro desta ´ultima classe, ´e poss´ıvel distinguir trˆes tipos distintos de independˆencia, de acordo com o sinal de χ. Assim, se η = 1/2, o que corresponde a χ = 0, tem-se uma (quase) independˆencia (ser´a uma independˆencia exacta se L(t) = 1). Quando, η ∈ (1/2, 1), tem-se χ positivo, verificando-se uma associa¸c˜ao positiva entre X1
e X2, i.e., entre U1 e U2, pois as observa¸c˜oes em que ambas excedem um valor elevado,
u, ocorrem mais frequentemente do que sob independˆencia exacta. No caso, η∈ (0, 1/2), i.e., χ < 0, manifesta-se uma associa¸c˜ao negativa, pois agora as observa¸c˜oes em que U1
e U2 excedem ambas um valor elevado, u, ocorrem menos frequentemente do que sob
independˆencia exacta.
1.2.1
Dependˆ
encia assint´
otica na cauda em Cadeias de Markov
Com a introdu¸c˜ao da hip´otese mais realista de dependˆencia entre as observa¸c˜oes de uma s´erie temporal, o horizonte da teoria de valores extremos alargou-se a modelos com estrutura markoviana, como por exemplo, os autorregressivos. A caracteriza¸c˜ao proba-bil´ıstica das propriedades extremais das cadeias de Markov encontra-se j´a bastante desen-volvida na literatura (veja-se, por exemplo, Rootz´en [69], Smith [76], Perfekt [64] e Yun [81]). Contudo, ´e necess´ario encontrar a melhor forma de transformar esta compreens˜ao, num processo vi´avel para a modela¸c˜ao de extremos em s´eries temporalmente dependentes. O primeiro trabalho de relevo, neste t´opico, encontra-se em Smith et al. [78]. Nesta abordagem, considera-se que, acima de um limiar elevado fixo, o comportamento limite de uma cadeia de Markov,{Xi}i, ´e exacto e a estrutura de dependˆencia entre v.a.’s
a aplica¸c˜ao deste procedimento a processos cuja tendˆencia de “clustering” diminui em limiares elevados, como ´e o caso de cadeias de Markov Gaussianas, com |ρ| < 1, pode conduzir a uma representa¸c˜ao enganosa dos eventos na cauda.
Esta situa¸c˜ao motivou o trabalho de Bortot e Tawn [9], com a proposta de um pro-cedimento alternativo: substituir o modelo bivariado de valor extremo, pelo modelo mais geral, proposto por Ledford e Tawn ([57], [58]), acima apresentado. A vantagem reside no facto deste novo modelo incluir um parˆametro, η, cujo valor indica o grau de inde-pendˆencia assint´otica na cauda, fazendo a liga¸c˜ao entre os casos limite de deinde-pendˆencia perfeita e de exacta independˆencia.
Adoptando a classifica¸c˜ao de Bortot e Tawn [9], diremos que {Xi}i ´e uma cadeia de
Markov assintoticamente independente, se χ = 0 em (1.31), e que{Xi}i ´e uma cadeia de
Markov assintoticamente dependente, caso χ > 0.
1.3
O ´ındice de cauda e a classe de estimadores de
Drees
A estima¸c˜ao do ´ındice de cauda recebe a aten¸c˜ao de muitos investigadores, dada a grande importˆancia deste parˆametro na Teoria de Valores Extremos, uma vez que, indica o tipo de cauda de uma distribui¸c˜ao. Existem j´a v´arios estimadores para este parˆametro, como os populares estimador de Hill [44], de Pickands’ [65], de m´axima verosimilhan¸ca (Smith [75]), de momentos (Dekkers et al. [17]), de momentos ponderados generalizado (Hosking e Wallis [45]), entre outros, com propriedades e desempenhos amplamente estu-dados, em contexto i.i.d..
No ˆambito de um alargamento a um contexto estacion´ario, come¸cam a surgir os primeiros estudos, por volta de 1990, quase sempre direccionados para o comportamento assint´otico do estimador de Hill, v´alido no dom´ınio das caudas pesadas (i.e. γ > 0). Uma das primeiras referˆencias, se bem que n˜ao publicada, ´e um manuscrito de Rootz´en et
al. [71], no qual se estabelece a normalidade assint´otica do estimador de Hill, sob certas condi¸c˜oes fracas, incluindo s´eries temporais strong-mixing. Quase em simultˆaneo, aparece um trabalho de Hsing [47], onde as condi¸c˜oes de dependˆencia impostas, embora difer-entes, s˜ao compar´aveis. Nesta linha de investiga¸c˜ao, foram surgindo outras publica¸c˜oes, com especial relevo para os trabalhos de Resnick e St˘aric˘a [67] e Novak [61].
Al´em do ´ındice de cauda, outras caracter´ısticas extremais est˜ao sob o alvo dos in-vestigadores, nomeadamente, probabilidades de excedˆencia e quantis elevados, cuja im-portˆancia est´a patente na sua designa¸c˜ao. Refere-se, neste ˆambito, o j´a citado artigo de Rootz´en et al. [71].
Tendo como ferramenta os processos emp´ıricos, Drees desenvolve tamb´em o seu tra-balho nesta ´area, apresentando uma nova classe de estimadores, que abrange os acima mencionados. Todos estes estimadores, baseiam-se nas kn+ 1 maiores estat´ısticas ordinais
(e.o.’s), Xn:n ≥ Xn−1:n ≥ ... ≥ Xn−kn:n, onde{kn} ´e uma sucess˜ao interm´edia, i.e., ´e uma
sucess˜ao de inteiros positivos, tal que, kn→ ∞ e kn = o(n), quando n→ ∞.
A sua estrat´egia consiste em estabelecer uma aproxima¸c˜ao ponderada da fun¸c˜ao quan-til (f.q.) emp´ırica de cauda,
Qn(t) := Fn−1 1− kn n t = Xn−[knt]:n, t∈ [0, 1], (1.40)
onde Fn ´e a f.d. emp´ırica e [x] denota o maior inteiro n˜ao superior a x, a um processo
Gaussiano. A partir deste resultado, estabelece a consistˆencia e a normalidade assint´otica para bγn = T (Qn), mediante certas condi¸c˜oes de regularidade para o funcional T . Pelo
facto de se definirem `a custa de um funcional, aplicado `a cauda de uma distribui¸c˜ao, designou estes estimadores por “classe dos funcionais estat´ısticos de cauda”.
Orientando-se, inicialmente, num contexto i.i.d., no qual se destacam os trabalhos, [22] e [23], Drees passa para as sequˆencias estacion´arias com estrutura de dependˆencia β-mixing. ´E com base num resultado de Rootz´en [70], no qual, se mostra a convergˆencia do processo emp´ırico de cauda uniforme, de uma sequˆencia estacion´aria β-mixing, para um processo Gaussiano, que Drees [24] estabelece uma aproxima¸c˜ao ponderada para o
processo em (1.40).
Um refinamento destes resultados, para o caso γ > 0, encontra-se em Drees [25], que, por ser o caso que nos interessa particularmente, ´e nele que nos vamos concentrar. Assim sendo, al´em de considerar uma sequˆencia estacion´aria β-mixing, {Xi}i∈Z, com f.d.
marginal F ∈ D(Gγ), para algum γ > 0, Drees [25] estabelece as seguintes condi¸c˜oes:
• existe uma sucess˜ao (ln)n, tal que,
lim
n→∞
β(ln)
ln
n + lnk−1/2n log2(kn) = 0, (1.41)
onde ln → ∞, kn → ∞ e kn/n → 0, quando n → ∞. Exemplos t´ıpicos s˜ao as
cadeias de Markov Harris recorrentes, para as quais, os coeficientes β decrescem geometricamente (Doukhan [19]), e que, satisfazem (1.41), com ln = [C log n], para
C > 0 suficientemente grande e kn, tal que, log2n log4(log n) = o(kn).
• uma condi¸c˜ao de regularidade para a cauda conjunta de (X1, X1+m):
lim n→∞ n kn PX1 > F−1 1− kn n x , X1+m > F−1 1− kn ny → cm(x, y), (1.42) ∀m ∈ N e 0 < x, y ≤ 1 + .
• uma majora¸c˜ao uniforme sobre a probabilidade de X1 e X1+m pertencerem
conjun-tamente a um intervalo extremo, In(x, y) =
F−1(1− yk n/n , F−1(1− xk n/n) : n kn P X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ (y − x)ρ(m) + D˜ 1 kn n , (1.43) ∀m ∈ N, 0 < x, y ≤ 1 + , onde D1 ≥ 0 ´e uma constante e ˜ρ(m), m ∈ N, ´e uma
sucess˜ao, satisfazendo,P∞m=1ρ(m) <˜ ∞.
• uma condi¸c˜ao sobre a velocidade de convergˆencia de kn → ∞, quando n → ∞, onde
{kn} ´e uma sucess˜ao interm´edia e
lim
n→∞k
1/2
n Φ(kn/n) = 0 , (1.44)
sendo Φ uma fun¸c˜ao de varia¸c˜ao regular de ´ındice τ em 0, para algum τ > 0, ou τ = 0 e Φ n˜ao-decrescente com lim Φ(t) = 0.
• e, por uma quest˜ao de simplicidade, quantis sob a forma,
F−1(1− t) = dt−γ(1 + r(t)) , com |r(t)| ≤ Φ(t) . (1.45)
Assim sendo, est˜ao reunidas as condi¸c˜oes para o referido resultado de Drees [25], que se passa a enunciar:
Teorema 1.3.1 (Drees [25], Teorema 2.1). Sob as condi¸c˜oes (1.41)-(1.45) e para uma sucess˜ao, (ln)n, tal que, ln = o(n/kn), existem vers˜oes da f.q. emp´ırica de cauda, Qn(t),
definida em (1.40), e um processo gaussiano centrado, g(t), com fun¸c˜ao de covariˆancia dada por, ˜ c(x, y) := x∧ y + ∞ X m=1 (cm(x, y) + cm(y, x)) ∈ R , (1.46)
de tal modo que, a seguinte convergˆencia se verifica: sup t∈(0,1] tγ+1/2(1 +| log t|)−1/2 kn1/2 Qn(t) F−1(1− kn/n) − t −γ− γt−(γ+1)g(t) −→ 0. (1.47)P
onde “→” denota convergˆencia em probabilidade.P
Daqui, decorre que, kn1/2(bγn− γ) converge fracamente para uma v.a. com lei N (0, σT,γ2 )
(bγn= T (Qn)), onde, σ2T,γ = γ2 Z (0,1] Z (0,1] (st)−(γ+1)c(s, t)ν˜ T,γ(ds)νT,γ(dt) , (1.48)
com ˜c dada em (1.46) e onde νT,γ ´e uma medida sinal em (0, 1] (Drees [25], Teorema 2.2).
Por exemplo (conforme Drees [22], [23]), a medida sinal do estimador de Hill, num modelo generalizado Pareto, ´e dada por:
νH,γ(dt) = tγdt− δ1(dt), (1.49)
Cap´ıtulo 2
Modelos Max-Autorregressivos
S´eries temporais, aparentemente estacion´arias, mas exibindo s´ubitas grandes observa-¸c˜oes, s˜ao potenciais candidatas a uma modela¸c˜ao com base num processo ARMA de ru´ıdos de caudas pesadas. Este tipo de dados encontra-se, por exemplo, em sinais telef´onicos ou em pre¸cos do mercado bolsista. No contexto de uma an´alise de valores extremos, os processos max-autorregressivos, como os modelos MARMA, introduzidos em Davis e Resnick [15], podem ser boas alternativas, por apresentarem uma estrutura mais simples, conforme argumentado pelos referidos autores. Neste cap´ıtulo, al´em de se rever estes mod-elos, introduz-se um novo, pARMAX, que tem a particularidade de incluir uma potˆencia c∈ (0, 1), `a qual nos referiremos como, parˆametro potˆencia, que se relaciona com o valor do coeficiente de dependˆencia assint´otica na cauda (η), de Ledford e Tawn. Este tamb´em poder´a ser um modelo a considerar, no que a uma modela¸c˜ao de valores extremos diz respeito.
Neste cap´ıtulo, come¸camos, ent˜ao, com uma revis˜ao dos modelos MARMA, com par-ticular relevo para o modelo ARMAX ou MARMA(1, 0) (Alpuim [1], [2] e Canto e Cas-tro [11]). Calcular-se-´a o valor do coeficiente de dependˆencia assint´otica na cauda de Ledford e Tawn (η), para pares aleat´orios ARMAX desfasados m unidades, (Xi, Xi+m),
concluindo-se acerca do tipo de dependˆencia assint´otica na cauda. Por fim, obter-se-´a uma aproxima¸c˜ao para a fun¸c˜ao quantil emp´ırica de cauda de um processo ARMAX, de acordo com o Teorema 1.3.1, a partir do qual, se deduz, a consistˆencia e normalidade assint´otica
dos estimadores do ´ındice de cauda da classe de Drees. Na Sec¸c˜ao 2.2, introduz-se o modelo max-autorregressivo, pARMAX. Come¸ca-se por provar a existˆencia e unicidade de distribui¸c˜ao estacion´aria para este novo processo, seguindo-se o estudo do dom´ınio de atrac¸c˜ao para m´aximos e da estrutura de dependˆencia, o c´alculo do ´ındice extremal e do coeficiente de dependˆencia assint´otica na cauda de Ledford e Tawn, este ´ultimo, tamb´em para pares da forma, (Xi, Xi+m). Ver-se-´a como este coeficiente (η) se relaciona com o
valor do parˆametro potˆencia (c) do processo pARMAX, ao mesmo tempo que se conclui que se trata de um processo markoviano assintoticamente independente. Assim sendo, e pelo facto do ´ındice extremal ser unit´ario, estabelece-se uma express˜ao pr´e-assint´otica para este ´ultimo, de acordo com Bortot e Tawn [9], que tamb´em se relaciona com η, e que permitir´a melhorar toda a inferˆencia baseada em (1.23) (Sec¸c˜ao 2.2.3). Como η tamb´em depende do desfasamento m considerado, na verdade tem-se uma express˜ao para ηm, a
partir da qual, se constr´oi a fun¸c˜ao de auto-dependˆencia assint´otica na cauda (FADAC). Trata-se de uma medida de dependˆencia, an´aloga `a fun¸c˜ao de autocorrela¸c˜ao (FAC), mas que quantifica a dependˆencia serial nos valores extremos de uma s´erie temporal (Sec¸c˜ao 2.2.2). Finaliza-se com a verifica¸c˜ao das condi¸c˜oes do Teorema 1.3.1 para o processo pARMAX, o que permite concluir, `a semelhan¸ca do modelo ARMAX, a consistˆencia e normalidade assint´otica dos estimadores do ´ındice de cauda da classe de Drees.
2.1
Modelos MARMA revisitados
Em Davis e Resnick [15], introduzem-se os processos max-autorregressivos de m´edias m´oveis ou MARMA(p,q) (max-autoregressive moving average), que se definem como proces-sos que satisfazem a seguinte recurs˜ao:
Xn = ϕ1Xn−1∨ ... ∨ ϕpXn−p∨ Zn∨ ϑ1Zn−1∨ ... ∨ ϑqZn−q, n = 0,±1, ±2, ..., (2.1)
onde ϕi, ϑj ≥ 0, 1 ≤ i ≤ p, 1 ≤ j ≤ q, e {Zi}i∈Z ´e uma sequˆencia i.i.d.. A sequˆencia
{Zi}i∈Z ´e tamb´em conhecida como sequˆencia das inova¸c˜oes ou ru´ıdos.
Os referidos autores estabelecem condi¸c˜oes necess´arias e suficientes, quer para a exis-tˆencia de solu¸c˜ao estacion´aria ´unica, quer para a sua redutibilidade, i.e., reduzir a um
MARMA(p0, q0), com p0 < p e q0 < q, considerando os ru´ıdos com f.d. marginal no
dom´ınio de atrac¸c˜ao Fr´echet(γ), para algum γ > 0.
Na Figura 2.1, encontram-se duas traject´orias simuladas, de um modelo ARMA(1,0) e de um modelo MARMA(1,0), respectivamente. Veja-se como a semelhan¸ca entre elas reitera a ideia de usar um modelo max-autorregressivo, satisfazendo a recurs˜ao (2.1), como modelo alternativo aos ARMA de caudas pesadas. Embora seja inteiramente poss´ıvel que os modelos MARMA n˜ao se ajustem bem aos valores pequenos, isto n˜ao constitui problema, uma vez que estamos interessados na modela¸c˜ao das maiores observa¸c˜oes.
0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 AR(1) 0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 ARMAX
Figura 2.1: 500 realiza¸c˜oes dos processos: Xi = 0.7 Xi−1+ Zi, `a esquerda; Xi = max(0.7Xi−1, Zi), `a
direita, com ru´ıdos Zi_Pareto(0.8).
Os modelos MARMA(1,0) ou ARMAX que s˜ao um caso particular simples dos MARMA, encontram-se amplamente estudados em Alpuim [1], [2] e Canto e Castro [11]. Mais pre-cisamente, satisfazem a recurs˜ao,
Xi = cXi−1∨ Zi, i = 0,±1, ±2, ..., 0 < c < 1 (2.2)
onde {Zi}i∈Z ´e uma sequˆencia de v.a.’s independentes e identicamente distribu´ıdas com
a v.a. Z, com suporte R+0 e com f.d. marginal FZ. Considera-se Zi independente de Xj,
para j < i. A existˆencia de distribui¸c˜ao estacion´aria, K, ´e garantida pela condi¸c˜ao sobre o parˆametro do modelo, 0 < c < 1, e pela hip´otese acrescida de FZ estar, ou no dom´ınio
de atrac¸c˜ao de uma Fr´echet(γ) para algum γ > 0, ou no de Gumbel (Canto e Castro [11], Sec¸c˜ao 5.5). (Note-se que, o dom´ınio de atrac¸c˜ao Weibull est´a exclu´ıdo `a partida, pelo facto de se considerar um limite superior do suporte infinito.) Mediante estas condi¸c˜oes,
a f.d., K, vem dada por, K(x) = ∞ Y j=0 FZ(x/cj). (2.3)
Em particular, K satisfaz a equa¸c˜ao
K(x) = FZ(x)K(x/c). (2.4)
O modelo ARMAX ´e um processo markoviano com fun¸c˜ao probabilidade de transi¸c˜ao (f.t.p.), de x para ]− ∞, y], dada por,
Qm(x, ]− ∞, y]) := P X n+m ≤ y|Xn = x = m−1Y j=0 FZ y/c j , se x ≤ y/cm 0 , se x > y/cm (2.5)
Ainda em Canto e Castro [11] (Cap´ıtulo 5), mostra-se que se trata de um processo re-generativo e aperi´odico. Assim sendo, pela Proposi¸c˜ao 1.1.3, apresenta uma estrutura de dependˆencia β-mixing. Tamb´em verifica a condi¸c˜ao D00(un), para sucess˜oes (un)n, tais
que, n(1−K(un)) = O(1) e possui ´ındice extremal unit´ario sempre que K est´a no dom´ınio
de atrac¸c˜ao Gumbel, enquanto que, se K pertencer ao dom´ınio de atrac¸c˜ao Fr´echet(γ), ent˜ao θ = 1− c1/γ.
No resultado que se segue, veja-se como o dom´ınio de atrac¸c˜ao de K se reduz ao dom´ınio de atrac¸c˜ao de FZ.
Proposi¸c˜ao 2.1.1. O dom´ınio de atrac¸c˜ao das margens do processo ARMAX ´e o mesmo do das suas inova¸c˜oes, Z, tendo tamb´em o mesmo ´ındice de cauda.
Dem. Atendendo `a recurs˜ao (2.2) e, aplicando depois as hip´oteses de independˆencia a´ı assumidas, tem-se que,
P (Mn≤ x) = P max X1, ..., Xn ≤ x = P maxX1, cX1, Z2, c2X1, cZ2, Z3, ... , cn−1X1, ... , cZn−1, Zn ≤ x = P maxX1, Z2, ... , Zn ≤ x = K(x)Fn−1 Z (x) . (2.6)
Logo, se FZ ∈ D Gγ , ent˜ao, lim n→∞P Mn≤ anx + bn = lim n→∞K(anx + bn)F n−1 Z (anx + bn) = Gγ(x),
para constantes normalizadoras, an > 0 e bn, convenientemente escolhidas.
No que se segue, considerar-se-´a que os ru´ıdos do processo ARMAX est˜ao no dom´ınio de atrac¸c˜ao Fr´echet(γ), para algum γ > 0, pelo que, existe uma fun¸c˜ao de varia¸c˜ao lenta em infinito, LZ, tal que,
1− FZ(x) = x−1/γLZ(x). (2.7)
Assim, pela Proposi¸c˜ao 2.1.1, tem-se tamb´em, 1− K(x) = x−1/γL
K(x) , (2.8)
para alguma fun¸c˜ao de varia¸c˜ao lenta em infinito, LK(x).
2.1.1
O coeficiente de dependˆ
encia assint´
otica na cauda de um
processo ARMAX
Nesta sec¸c˜ao, calcula-se o coeficiente de dependˆencia assint´otica na cauda, de Ledford e Tawn, denotado η, para um par aleat´orio, (X1, X1+m), proveniente de um processo
ARMAX, sendo m um qualquer inteiro positivo.
Proposi¸c˜ao 2.1.2. Seja{Xi}i∈Z um processo ARMAX, tal que, (2.7) e (2.8) se verificam.
O par aleat´orio, (X1, X1+m), (m∈ N), tem coeficiente de dependˆencia assint´otica na cauda
unit´ario.
Dem. Assumindo U = 1− K(X1) e V = 1− K(X1+m) em (1.37), tem-se que, P U < tx, V < ty P U < t, V < t = P X1 > K−1(1− tx), X1+m > K−1(1− ty) P X1 > K−1(1− t), X1+m > K−1(1− t) . (2.9)
Desenvolvendo a express˜ao em numerador, considerando a fun¸c˜ao probabilidade de transi¸c˜ao em (2.5), ent˜ao, P X1 > K−1(1− tx), X1+m > K−1(1− ty) = Z ∞ K−1(1−tx)
1− Qm(u, ]− ∞, K−1(1− ty)])K(du)
= tx− Z K−1(1−ty) cm K−1(1−tx) m−1Y j=0 FZ K−1(1− ty)/c jK(du).
O ´ultimo integral ser´a n˜ao nulo se x > ycm/γ, pelo que, aplicando (2.4) e (2.8),
obt´em-se, P X1 > K−1(1− tx), X1+m > K−1(1− ty) = tx− K(K−1(1− ty)) − K(K−1(1−tx))K(K−1(1−ty)) K K−1(1−ty)cm . (2.10)
Observe-se que, aplicando (1.14) e (1.15), ent˜ao, K K−1c(1−ty)m ∼ 1 − yt LK−1(t) −1/γ cm/γL K t−γLK−1(t)c−my−γ (2.11)
Porque LK ´e uma fun¸c˜ao de varia¸c˜ao lenta e a aproxima¸c˜ao em (1.17) ´e v´alida, deduz-se
ent˜ao que, quando t↓ 0,
K K−1c(1−ty)m
∼ 1 − ytcm/γ (2.12)
pelo que, a probabilidade em (2.10), vem, aproximadamente, tx− (1 − ty) −(1−tx)(1−ty)1−tycm/γ = tyc
m/γ1− tx − ty
1− tycm/γ +
t2xy
1− tycm/γ ∼ tyc m/γ.
Assim sendo, conclui-se que,
P X1 > K−1(1− tx), X1+m > K−1(1− ty) ∼ tx , se 0 < x≤ ycm/γ tycm/γ , se ycm/γ < x≤ 1 + . (2.13)
Note-se que, tomando x = y = 1, obt´em-se imediatamente a seguinte aproxima¸c˜ao para o denominador em (2.9):
P X1 > K−1(1− t), X1+m > K−1(1− t)
quando t ↓ 0. Substituindo (2.13) e (2.14) em (2.9), a fun¸c˜ao, h(x, y), dada em (1.37), vem dada por,
h(x, y) = lim t↓0 P U < tx, V < ty P U < t, V < t ∼ xc−m/γ , se 0 < x≤ ycm/γ y , se ycm/γ < x≤ 1 + ,
sendo, portanto, uma fun¸c˜ao homog´enea de ordem 1. Logo η = 1, donde se conclui que duas observa¸c˜oes de cauda de um processo ARMAX, que distam no tempo, uma da outra, m + 1 instantes, s˜ao assintoticamente dependentes, para qualquer valor do parˆametro c (0 < c < 1)).
Com este resultado, e atendendo `a classifica¸c˜ao de Bortot e Tawn [9] (Sec¸c˜ao 1.2.1), constatamos que o processo ARMAX ´e uma cadeia de Markov assintoticamente depen-dente.
2.1.2
Aproxima¸c˜
ao da fun¸c˜
ao quantil emp´ırica de cauda de um
processo ARMAX
Vejamos como ´e poss´ıvel aplicar ao modelo ARMAX, os resultados de Drees, apresen-tados na Sec¸c˜ao 1.3.
Proposi¸c˜ao 2.1.3. Seja {Xi}i∈Zum processo ARMAX sob as assun¸c˜oes da Proposi¸c˜ao
2.1.2. Ent˜ao, as condi¸c˜oes, (1.42) e (1.43), s˜ao ambas v´alidas.
Dem. O limite em (1.42) ´e imediato, substituindo t por kn/n em (2.13), com n→ ∞. Logo, tem-se que,
cm(x, y) = x , 0 < x≤ ycm/γ ycm/γ , ycm/γ < x≤ 1 + . (2.15)
Passando `a condi¸c˜ao (1.43), considere-se, In(x, y) =
K−1(1−yk
n/n), K−1(1−xkn/n)
.
Tem-se que, n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ n knP X1 ∈ In(x, y), X1+m > K−1(1− ykn/n) ≤ n knP X1 ∈ In(x, y), X1 > c−mK−1(1− ykn/n) +n knP X1 ∈ In(x, y), max k=2,...,1+m c m−k+1Z k > K−1(1− ykn/n)
Atendendo `a independˆencia entre as v.a.’s de {Zi}i∈Z, e `a independˆencia entre X1 e Zk
∀k ≥ 2, ambas postuladas na defini¸c˜ao do processo ARMAX, ent˜ao,
n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) = n kn 1−kn nx− K K−1(1−kn ny) cm +kn n(y− x) 1− m+1Y k=2 FZ K−1(1−kn ny) cm−k+1 ≤ n kn kn nycm/γ − kn nx + kn n(y− x) 1− ∞ Y j=0 FZ K−1(1−kn ny) cj
onde, a ´ultima passagem se deve a (2.12) e ao facto de, 1− m+1Y k=2 FZ K−1(1−kn ny) cm−k+1 ≤ 1 − ∞ Y k=0 FZ K−1(1−kn ny) cm−k+1 = 1− K K−1 1− kn ny
Considerando agora (2.3) e observando que, −kn nx <−
kn nxc
m/γ, conclui-se, ent˜ao, que, n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ (y − x)cm/γ +kn ny .
Como y∈ (0, 1 + ], tomando D1 = 1 + e ˜ρ(m) = cm/γ, ent˜ao a condi¸c˜ao (1.43) ´e v´alida,
pois,P∞m=1cm/γ <∞.
Corol´ario 2.1.4. Seja{Xi}i∈Zum processo ARMAX sob as condi¸c˜oes da Proposi¸c˜ao 2.1.2
e seja{kn} uma sucess˜ao, tal que, kn → ∞ e kn= o(n), quando n→ ∞. Ent˜ao, o limite
em (1.47) ´e v´alido para a fun¸c˜ao quantil emp´ırica de cauda, Qn(t), definida em (1.40),
com fun¸c˜ao ˜c dada por, ˜ c(x, y) = min(x, y) + p−1 X m=1 (cm(x, y) + cm(y, x)) + (x + y) cp/γ (1− c1/γ) , (2.16)
onde p≡ px,y = [max{γ ln(x/y)/ ln c, γ ln(y/x)/ ln c}] + 1.
Neste processo, para qualquer estimador da classe de Drees, ˆγn = T (Qn), tem-se que,
kn1/2(bγn−γ), converge fracamente para uma v.a. com lei N (0, σT,γ2 ), cuja variˆancia, ´e dada
por (1.48).
Dem. O resultado em (1.47) e a normalidade assint´otica, decorrem, de imediato, da Proposi¸c˜ao 2.1.3, juntamente com o facto do processo ARMAX ser β-mixing.
Resta calcular a fun¸c˜ao de covariˆancia em (1.46). Observe-se que,
cm(x, y) + cm(y, x) = x(1 + cm/γ) , 0 < x≤ ycm/γ (y + x)cm/γ , ycm/γ < x≤ yc−m/γ y(1 + cm/γ) , yc−m/γ < x≤ 1 + .
Uma vez que, cm/γ → 0 e c−m/γ → ∞, quando m → ∞, fixando x e y, existe uma ordem
p∈ N, tal que, para todo m ≥ p, se tem sempre, ycm/γ < x≤ yc−m/γ. Logo, ∞ X m=1 (cm(x, y) + cm(y, x)) = p−1 X m=1 (cm(x, y) + cm(y, x)) + ∞ X m=p (x + y)cm/γ. (2.17)
Como a s´erie do 2o membro ´e geom´etrica de raz˜ao, c < 1, seque-se a validade de (2.16),
para p acima enunciado.
2.2
O modelo pARMAX
´
E na sequˆencia do estudo dos processos ARMAX, mais precisamente, no c´alculo do valor do coeficiente de dependˆencia assint´otica na cauda de Ledford e Tawn (η), que surge a ideia de um novo processo max-autorregressivo, o qual designamos pARMAX. Trata-se de um processo que envolve uma fun¸c˜ao potˆencia (da´ı o acr´escimo do “p” na sua desi-gna¸c˜ao), cujo expoente c (c ∈ (0, 1)) influencia, directamente, o parˆametro η, calculado em pares de vari´aveis afastadas no tempo m unidades. Esta rela¸c˜ao revela-se importante, se pensarmos que existem j´a, na literatura, alguns estimadores para η (veja-se Ledford e Tawn [57], Peng [63], Beirlant e Vandewalle [7], Draisma et al. [21]) e, portanto, temos
uma forma para estimar o parˆametro c do modelo pARMAX. A este parˆametro, chamare-mos, por vezes, parˆametro potˆencia.
Seja {Zi}i∈Z uma sequˆencia de c´opias i.i.d. da v.a. Z com suporte n˜ao negativo e f.d.
FZ. Uma sequˆencia {Xi}i∈Z diz-se pARMAX se,
Xi = Xi−1c ∨ Zi , 0 < c < 1, i = 0,±1, ±2, ... (2.18)
com Xi independente de Zj, para j > i.
Tal como acontece com os j´a referidos MARMA, o processo max-autorregressivo potˆencia, pARMAX, n˜ao ´e de dif´ıcil manejo, no que diz respeito ao estudo de carac-ter´ısticas extremais, como veremos. Apresenta tamb´em traject´orias semelhantes aos ARMA com caudas pesadas, sobretudo ao n´ıvel dos maiores valores (ver Figura 2.2).
0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 AR(1) 0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 pARMAX
Figura 2.2: 500 realiza¸c˜oes dos processos: autorregressivo, Xi= 0.7 Xi−1+ Zi, `a esquerda; pARMAX,
Xi= max(X 0.7
i−1, Zi), `a direita, com ru´ıdos Zi_Pareto(0.8).
Iterando sucessivamente, tem-se, Xn = Xn−1c ∨ Zn= Xc 2 n−2∨ Zn−1c ∨ Zn= ... = Xc k n−k ∨ k−1_ j=0 Zn−jcj = ... . Observe-se que, Xn= ∞ _ j=0 Zn−jcj (2.19)
´e uma solu¸c˜ao da recurs˜ao max-autorregressiva potˆencia em (2.18), pois Xn = Xn−1c ∨ Zn= _∞ j=0 Zcj n−1−j c ∨ Zn= ∞ _ j=0 Zcj n−j.
Vejamos condi¸c˜oes, sob as quais, a solu¸c˜ao dada por (2.19) est´a bem definida, ´e esta-cion´aria e ´e ´unica.
Proposi¸c˜ao 2.2.1. As equa¸c˜oes em (2.18) tˆem solu¸c˜ao estacion´aria dada por (2.19), se e s´o se, ∞ X j=0 − log FZ(x1/c j ) < ∞ , para algum x ≥ 0. (2.20)
Dem. Mostra-se que, W∞
j=0Zc j
j , ´e quase certamente (q.c.) finito, se e s´o se, (2.20) ´e
v´alido. Pela Lei 0-1 de Kolmogorov, P (W∞j=0Zcj
j <∞) = 0 ou 1, sendo 1 se P (
W∞ j=0Zc
j
j ≤
x) > 0 para algum x n˜ao negativo. Usando a hip´otese de independˆencia,
P _∞ j=0 Zjcj ≤ x = ∞ Y j=0 FZ(x1/c j ) , (2.21)
e portanto, tem-se que, P _∞ j=0 Zjcj ≤ x = expn−− log ∞ Y j=0 FZ(x1/c j )o = expn− ∞ X j=0 − log FZ(x 1/cj )o,
o qual ´e positivo, se e s´o se, (2.20) se verifica.
Proposi¸c˜ao 2.2.2. Se FZ ∈ D(Gγ) para algum γ > 0, ent˜ao (2.20) ´e v´alida.
Dem. A hip´otese ´e equivalente a considerar que 1− FZ ´e de varia¸c˜ao regular em infinito, com ´ındice −1/γ, pelo que, podemos escrever 1 − FZ da forma (2.7). Basta ter
em conta que, 1−FZ xcj+11 1−FZ xcj1 =x − 1 γcj+1 LZ xcj+11 x− 1γcj L xcj1 = x−γcj1 1 c−1 L∗Z(x)∼ 0 , j → ∞