Extremos em séries temporais max-autorregressivas

(1)

(2)

Resumo

O trabalho para esta tese de doutoramento come¸ca com o interesse em continuar o es-tudo acerca da dura¸cão de n´ıveis elevados por um per´ıodo de tempo fixo, introduzido em Draisma [20]. De uma análise sob o pressuposto de que esses n´ıveis elevados cons-tituem uma série de observa¸cões i.i.d., rapidamente se passa à hipótese mais realista de considerar dependência entre as observa¸cões, embora mantendo a estacionaridade. Uma vez que é sempre uma modela¸cão dos valores extremos que está em mente, muito natu-ralmente se pensa nos modelos autorregressivos de máximos, como os MARMA em Davis e Resnick [15], em particular, os MARMA(1, 0), também designados ARMAX (Alpuim [1], [2] e Canto e Castro [11]). Na sequência do interesse em contemplar situa¸cões de dependência, surge a questão de avaliar se existe uma dependência ou independência exactas entre observa¸cões consecutivas consideradas nas caudas, ou se é uma dependência que vai desaparecendo gradualmente. Ledford e Tawn [57] introduzem um modelo, no qual surge um novo parâmetro (η), que permite “medir o grau” de dependência na cauda, designado, coeficiente de dependência assintótica na cauda. É no decurso do cálculo do valor deste parâmetro para os usuais max-autorregressivos, que surge a constru¸cão do processo pARMAX, o qual inclui um parâmetro potência (c), que faz com que o valor de η se relacione directamente com esse mesmo parâmetro. De modo a atenuar o carácter um tanto determin´ıstico dos processos pARMAX e, assim, torná-los mais aplicáveis na modela¸cão de dados reais, considera-se uma generaliza¸cão dos mesmos, com a introdu¸cão de um factor aleatório. Surge assim um novo processo max-autorregressivo potência, que designamos pRARMAX, e que, à semelhan¸ca do processo pARMAX, mantém a particu-laridade de possuir um parâmetro potência (c) que se relaciona do mesmo modo com η, calculado em pares de variáveis consecutivas. Aproveitando a maleabilidade permitida nos processos pRARMAX, desenvolve-se uma metodologia de análise do seu ajustamento a uma série de dados.

Palavras-Chave: Teoria de Valores Extremos, processos max-autorregressivos, ´ındice de cauda, ´ındice extremal, coeficiente de dependˆencia assint´otica na cauda.

(3)

Abstract

This work begins with the interest in pursuit the study of the duration of high le-vels that persist for a fixed period of time, introduced in Draisma [20]. From the as-sumption of i.i.d. levels, we move to more realistic forms of temporal dependence. Max-autoregressive processes like MARMA, (Davis and Resnick [15]), and also the particular case, MARMA(1, 0) or ARMAX (Alpuim [1], [2] and Canto e Castro [11]) are very in-teresting examples of stationary sequences, in what concerns an extreme value analysis. The issue of assessing the extremal dependence structure, that is, distinguishing between exact independence or a dependence that gradually disappears at more and more extreme levels, is very important, in order to select an adequate approach. Ledford and Tawn [57] introduced a model that includes the so-called coefficient of asymptotic tail dependence, denoted by η, whose value gives the strength of dependence in the tail. The pARMAX process arises from the computation of η for the above mentioned max-autoregressive models, as it includes a power parameter (c) that is related with η. In order to make the pARMAX process less deterministic and hence, more applicable to real data, it is considered a somewhat generalized version, by including a random factor. These new processes, denoted pRARMAX, are very similar to pARMAX and the same connexion between the power parameter (c) and η holds. Making use of pRARMAX flexibility, a methodology for assessing the adjustment of this model to real data is developed.

Keywords: Extreme Value Theory, max-autoregressive processes, tail index, ex-tremal index, coefficient of tail dependence.

(4)

Agradecimentos

O primeiro agradecimento e o mais especial de todos, é à Professora Doutora Lu´ısa Canto e Castro, pelo apoio cient´ıfico, pela dedica¸cão, motiva¸cão, amizade, carinho, disponi-bilidade, sem os quais, este trabalho não seria poss´ıvel. Devo-lhe todo o meu percurso cient´ıfico, desde os primeiros passos, quando me orientou na disserta¸cão de mestrado, até ao dia de hoje, e esta cumplicidade é para mim inestimável.

O segundo agradecimento é à Sandra Dias (UTAD), pela preciosa ajuda com a pro-grama¸cão em MATLAB, que permitiu levar a cabo toda a simula¸cão envolvida na última seçcão deste trabalho.

Agrade¸co ao DMAT, ao CMAT, ao projecto ERAS e `a FCT, todo o apoio financeiro.

Estou, e estarei, sempre grata `a minha fam´ılia, por ser aquele suporte, sempre pre-sente, t˜ao importante.

(5)

(6)

Conte´

udo

1 Introdu¸c˜ao 7

1.1 Condi¸c˜oes de Dependˆencia relevantes em Teoria de Extremos . . . 14

1.1.1 Caso Particular das Cadeias de Markov . . . 19

1.2 Extremos Bivariados e Dependˆencia assint´otica na cauda . . . 21

1.2.1 Dependˆencia assint´otica na cauda em Cadeias de Markov . . . 26

1.3 O ´ındice de cauda e a classe de estimadores de Drees . . . 27

2 Modelos Max-Autorregressivos 31 2.1 Modelos MARMA revisitados . . . 32

2.1.1 O coeficiente de dependˆencia assint´otica na cauda de um processo ARMAX . . . 35

2.1.2 Aproxima¸c˜ao da fun¸c˜ao quantil emp´ırica de cauda de um processo ARMAX . . . 37

2.2 O modelo pARMAX . . . 39

2.2.1 Estrutura de dependˆencia . . . 47

2.2.2 Dependˆencia assint´otica na cauda . . . 52

2.2.3 O ´ındice extremal pr´e-assint´otico . . . 55

2.2.4 Aproxima¸c˜ao da fun¸c˜ao quantil emp´ırica de cauda . . . 59

3 N´ıveis elevados que persistem no tempo 61 3.1 Quando a sucess˜ao dos n´ıveis iniciais {Xi}i≥1 ´e i.i.d. . . 62

3.1.1 Estrutura de Dependˆencia . . . 62

(7)

3.2 Quando a sucessão dos n´ıveis iniciais {Xi}i≥1 é estacionária . . . 69

3.2.1 Estrutura de Dependˆencia . . . 69

3.2.2 Comportamento Extremal quando {Xi}i∈Z é um processo ARMAX . 71 3.2.3 Comportamento Extremal quando _{Xi}i∈Z é um processo pARMAX 79 4 Estima¸cão do parâmetro potência em modelos pARMAX 89 4.1 Propriedades de alguns estimadores . . . 91

4.2 Um exemplo ilustrativo . . . 97

5 Modelos max-autorregressivos potˆencia com coeficiente aleat´orio 99 5.1 O modelo pRARMAX . . . 100

5.1.1 Estrutura de dependˆencia . . . 104

5.1.2 Coeficiente de dependˆencia assint´otica na cauda . . . 106

5.2 An´alise do ajustamento do modelo . . . 108

5.2.1 Um estudo de simula¸c˜ao . . . 116

5.2.2 Um exemplo ilustrativo . . . 119

5.2.3 Uma aplica¸c˜ao a dados financeiros . . . 123

A Tabelas do estudo de simula¸c˜ao 143

(8)

Cap´ıtulo 1

Introdu¸c˜

ao

1_{O principal objectivo de uma an´alise de valores extremos ´e estimar a probabilidade de}

ocorrência de acontecimentos mais extremos do que quaisquer que tenham sido observados. A t´ıtulo de exemplo, suponhamos que a projeçcão de um dique requer uma defesa costeira para todos os n´ıveis do mar, durante os próximos 100 anos. Os modelos extremais são uma preciosa ferramenta que permite extrapola¸cões deste tipo.

A Teoria de Valores Extremos (TVE) clássica assenta na teoria distribucional assintótica do máximo de variáveis aleatórias (v.a.’s) independentes e identicamente distribu´ıdas (i.i.d.). Podemos dizer que a sua idade ronda os 60 anos, embora seja poss´ıvel encontrar ra´ızes que remontam à antiguidade matemática. Ao longo de todos estes anos, a Teoria de Valores Extremos tem conhecido uma grande aplica¸cão, sendo o trabalho de Gumbel, E.J. [38], o maior expoente na literatura desta área.

O resultado central na TVE, conhecido por, Teorema dos Tipos Extremais, estabelece os três dom´ınios de atraçcão poss´ıveis para o máximo de sequências i.i.d.. Aparecendo inicialmente com Fisher e Tippet [34], e demonstrado de uma forma generalizada, mais tarde, por Gnedenko [36], estabelece o seguinte:

1_{Este trabalho ´e parcialmente suportado pela bolsa de doutoramento SFRH/BD/38867/2007 da}

(9)

Dada uma sequˆencia de v.a.’s, { ˆXi}i≥1, independentes e identicamente distribu´ıdas

(i.i.d.) com a v.a. bX, possuindo fun¸c˜ao distribui¸c˜ao (f.d.) marginal F e considerando c

Mn= max( bX1, ..., bXn), se existirem constantes reais, an> 0 e bn, tais que,

P ( cMn ≤ anx + bn) = Fn(anx + bn) d

−→ G(x) , (1.1)

(“→” denota convergência em distribui¸cão), onde G é uma f.d. não degenerada, entãod esta será de um dos três tipos:

Tipo I (Fr´echet) G(x)≡ Φα(x) = exp − x−α

, x > 0, γ > 0

Tipo II (Weibull) G(x)≡ Ψα(x) = exp − (−x)α

, x < 0, γ < 0

Tipo III (Gumbel) G(x)≡ Λ(x) = exp − e−x_{, x}_{∈ R,}

e diz-se que F pertence ao dom´ınio de atraçcão para máximos de G, com a nota¸cão, F ∈ D(G) ou X ∈ D(G). A fun¸cão G pode ser representada na forma paramétrica geral de Jenkinson-von Mises, dada por,

Gγ(x) = exp(−(1 + γx)−1/γ), 1 + γx > 0, γ ∈ R, (1.2)

com G0(x) = exp(−e−x), usualmente designada por fun¸c˜ao Generalizada de Valor

Ex-tremo (GEV). Tem-se, obviamente,

Gγ(x) =              Φ1/γ(1 + γx), se γ > 0 Ψ_−1/γ(−1 − γx), se γ < 0 Λ(x),se γ = 0.

A necessidade de uma normaliza¸cão, através das constantes, an > 0 e bn, advém do

facto da distribui¸cão do máximo, por si só, convergir para uma f.d. degenerada no limite superior do suporte de F , aqui denotado por xF, em que, xF = sup{x : F (x) < 1}.

(10)

A classe de fun¸cões limite, G, em (1.1), corresponde à classe das fun¸cões max-estáveis (estáveis para máximos), significando isto que, se uma sequência de v.a.’s, _{ζi}i≥1,

inde-pendentes e identicamente distribu´ıdas com ζ, tiverem como f.d. marginal alguma G, em (1.1), ent˜ao existem constantes reais cn > 0 e dn, tais que,

c−1_n max(ζ1, ..., ζn)− dn

d

= ζ, (1.3)

onde “=” denota, igual em distribui¸cão. Claramente, uma f.d. max-estável está no seud próprio dom´ınio de atraçcão.

O parâmetro γ, conhecido como ´ındice de cauda, é um parâmetro de forma, na medida em que, determina o tipo de cauda de F , nomeadamente, uma cauda curta se γ < 0 (dom´ınio Weibull), uma cauda exponencial se γ = 0 (dom´ınio Gumbel) e uma cauda longa (do tipo polinomial negativo) se γ > 0 (dom´ınio Fréchet).

Com a introdu¸cão de parâmetros de localiza¸cão, µ_{∈ R e escala, σ > 0, tem-se ainda,} Gγ,µ,σ(x) = exp −1 + γx− µ σ −1/γ , 1 + γx− µ σ > 0, γ ∈ R.

Dentro da Teoria de Valores Extremos, o facto de ser válida a seguinte equivalência: F ∈ D(Gγ) se e só se lim u↑xF P X− u a(u) X > u =    (1 + γx)−1/γ _{, γ} _{6= 0} e−x _{, γ = 0,} (1.4)

para alguma fun¸cão mensurável positiva, a(_{·) e 1 + γx > 0, permite uma abordagem} alternativa, baseada numa análise dos excessos acima de patamares elevados. O lado direito do limite em (1.4) motivou, à semelhan¸ca da GEV, a defini¸cão da GP (Distribui¸cão Pareto Generalizada), dada por,

Pγ(x) =    1_{− (1 + γx)}−1/γ _{, γ} _{6= 0}_(x_{≥ 0 se γ > 0; 0 ≤ x ≤ −1/γ se γ < 0)} 1− e−x _{, γ = 0}_(x_{≥ 0)}_.

A introdu¸cão dos parâmetros, escala (σ > 0) e localiza¸cão (µ_{∈ R), conduz a,}

Pγ,µ,σ(x) =      1− 1 + γx−µσ −1/γ , γ 6= 0(x−µ_σ ≥ 0 se γ > 0; 0 ≤ x−µσ ≤ −1/γ se γ < 0) 1− e−x−µσ , γ = 0 (x−µ ≥ 0).

(11)

Apesar de se considerar sempre o máximo, não se está a excluir o caso do m´ınimo, uma vez que, min(X1, ..., Xn) = − max(−X1, ...,−Xn), donde os resultados podem ser

reformulados para o m´ınimo.

A convergˆencia de P ( cMn ≤ un) pode verificar-se para outras sucess˜oes reais (un)n, e

n˜ao apenas para un= anx + bn. Mais precisamente, dado τ ∈ [0, ∞],

P ( cMn ≤ un)−→ n→∞e −τ_, _(1.5) se e s´o se, n(1− F (un))−→ n→∞τ. (1.6)

Trabalhos de relevo na caracteriza¸cão de cada um dos dom´ınios de atraçcão, fre-quentemente referenciados na literatura, encontram-se em, von Mises [60], Gnedenko [36], de Haan [39], Balkema e de Haan [5], Goldie e Resnick [37], entre outros. Neste âmbito, apontamos o seguinte conjunto de condi¸cões necessárias e suficientes, que se resumem ao estudo da cauda da f.d. em causa e ao conhecimento do limite superior do suporte, xF. Indicam-se, também, poss´ıveis escolhas para as constantes de atraçcão, an > 0 e bn,

decorrentes da demonstra¸cão dessas mesmas condi¸cões. Proposi¸cão 1.0.1. Seja bX uma v.a. com f.d. F . Então:

i) F ∈ D(Gγ)≡ D(Φγ), γ > 0, se e s´o se, xF =∞ e lim w→∞ 1_{− F (wx)} 1− F (w) = x −1/γ_{, x > 0.} _(1.7)

As constantes de atrac¸c˜ao, an > 0 e bn, podem ser escolhidas do seguinte modo:

an= F−1(1− 1/n) e bn = 0.

ii) F ∈ D(Gγ)≡ D(Ψγ), γ < 0, se e s´o se, xF <∞ e

lim

w↓0

1_{− F (x}F − wx)

1− F (xF − w)

= x−1/γ, x > 0. (1.8) Uma escolha poss´ıvel para as constantes de atraçcão, será, an = xF − F−1(1− 1/n)

(12)

iii) F ∈ D(Gγ)≡ D(Λ), γ = 0, se e s´o se, xF ≤ ∞ e

lim

w↑xF

1_{− F (w + xf(w))}

1− F (w) = e−x, x∈ R, (1.9)

para alguma fun¸cão positiva adequada, f . Se (1.9) é válida para certa fun¸cão f , então RxF

w (1− F (s))ds < ∞, com w < xF, e, assim, tem-se (1.9) para

f (w) := RxF

w (1− F (s))ds

1− F (w) . Pode considerar-se an = f (bn) e bn= F−1(1− 1/n).

A fun¸c˜ao F−1 _{designa a inversa generalizada de F ou fun¸c˜ao quantil (f.q.) de F , i.e.,}

F−1(y) = inf{x : F (x) ≥ y}.

A condi¸cão relativa ao dom´ınio de atraçcão Fréchet (1.7), significa que a fun¸cão, 1_{− F (x) é de varia¸cão regular de ´ındice −1/γ em ∞. Do mesmo modo, a condi¸cão} (1.8), no dom´ınio de atraçcão Weibull, é equivalente a afirmar que, 1_{− F (x}F − x) é de

varia¸cão regular de ´ındice _{−1/γ em 0. O conceito de fun¸cão de varia¸cão regular e toda a} teoria desenvolvida em seu redor, é uma ferramenta de grande importância na Teoria de Valores Extremos, univariada e multivariada, intrinsecamente associado à caracteriza¸cão dos dom´ınios de atraçcão.

Concretamente, uma fun¸cão mensurável f : R+ _{→ R}+_{, diz-se de varia¸cão regular em}

infinito, com ´ındice ρ, se, para x > 0, lim

w→∞

f (wx) f (w) = x

ρ_. _(1.10)

A fun¸cão f (x) é de varia¸cão regular em_{∞ se e só se f(1/x) é de varia¸cão regular em} 0.

Quando ρ = 0, a fun¸cão diz-se de varia¸cão lenta e é denotada, usualmente, por L(x). Uma vez que, f (x)/xρ _{é de varia¸cão lenta, então, L(x) = f (x)/x}ρ_{. Logo,}

(13)

esta representa¸cão, a caracteriza¸cão das fun¸cões de varia¸cão regular pode ser feita com base no estudo das fun¸cões de varia¸cão lenta, L. Exemplos t´ıpicos destas fun¸cões são: L(x) = (log x)α _{ou quaisquer itera¸cões de log, com α arbitrário e x > 1; L(x) positiva e}

mensur´avel possuindo limite constante positivo quando x _{→ ∞ e L(x) = exp{(log x)}β_}

com β < 1. A classe de fun¸cões de varia¸cão lenta é fechada para a adi¸cão, multiplica¸cão e potencia¸cão em R.

Se uma fun¸cão for de varia¸cão regular de ´ındice ρ (ρ _{∈ R) então a sua inversa é de} varia¸cão regular de ´ındice −ρ, e vice-versa.

Na verdade, a varia¸c˜ao regular pode ser ligeiramente enfraquecida.

Proposi¸cão 1.0.2 (de Haan, 1970; Feller, 1971). Uma fun¸cão mensurável, f : R+_{→ R}+_,

é de varia¸cão regular, se existe uma fun¸cão g, tal que, para todo x > 0, lim

w→∞f (wx)/f (w) = g(x).

Neste caso, g(x) = xρ_{, para algum ρ}_{∈ R.}

Extendendo agora o conceito ao caso multidimensional, seja C _{⊂ R}d _{um cone, i.e.,}

x = (x1, ..., xd)∈ C se e só se wx ∈ C, ∀w > 0. Uma fun¸cão mensurável, h : C → (0, ∞)

diz-se de varia¸c˜ao regular com fun¸c˜ao limite, λ, se λ(x) > 0, com x_{∈ C, e, se para todo} x∈ C,

lim

w→∞h(wx)/h(w1) = λ(x), (1.11)

tal que, λ(1) = 1.

Decorre desta defini¸cão e da Proposi¸cão anterior que, existe ρ ∈ R (independente de x), tal que, λ é homogénea de ´ındice ρ, i.e.,

λ(sx) = sρλ(x), s > 0 (1.12)

(Bingham et al. [8]; Resnick [66]). Assim, alternativamente a (1.11), dir-se-á que, h : C _{→ (0, ∞) é de varia¸cão regular com fun¸cão limite, λ, se e só se, existe V : R}+ _{→ R}+_,

(14)

onde V é uma fun¸cão de varia¸cão regular com ´ındice ρ, e, para todo x∈ C, lim

w→∞h(wx)/V (w) = λ(x), (1.13)

(Resnick [66]).

Dom´ınio de atraçcão Fréchet

O dom´ınio de atraçcão Fréchet, pelo facto de corresponder a um dom´ınio de f.d.’s com caudas pesadas, assume um interesse especial na TVE e, neste trabalho em particular, encontra-se envolvido em quase todos os resultados.

Como foi visto, as f.d.’s neste dom´ınio, apresentam-se com cauda direita de varia¸c˜ao regular de ´ındice−1/γ em ∞, donde,

1_{− F (x) = x}−1/γLF(x),

onde LF é uma fun¸cão de varia¸cão lenta em ∞.

A caracteriza¸cão dos dom´ınios de atraçcão de máximos também pode ser feita através da f.q., F−1_{. No caso do dom´ınio de atraçcão Fréchet, o limite, lim}

t↓0F−1(1−tx)/F−1(1−

t) = x−γ_{, é uma condi¸cão necessária e suficiente para que F} _{∈ D(G}

γ), onde γ > 0 e x > 0.

Assim sendo, tem-se a seguinte aproxima¸c˜ao, quando t↓ 0:

F−1(1_{− tx) ∼ x}−γF−1(1_{− t),} (1.14) ou seja, F−1 _{é uma fun¸cão de varia¸cão regular de ´ındice} _{−γ em 0 e, portanto,}

F−1(1_{− t) = t}−γLF −1(t), (1.15)

onde LF −1 é uma fun¸cão de varia¸cão lenta em zero.

Se F ´e cont´ınua, ent˜ao F (F−1₍₁_{− t)) = 1 − t. Mas, por outro lado,}

F (F−1(1− t)) ∼ F t−γ_L F −1(t) = 1− tLF −1(t) −1/γ LF t−γLF −1(t) , (1.16)

(15)

e, portanto, considerando 1/t≡ x, podemos relacionar as fun¸cões de varia¸cão lenta asso-ciadas à f.d. e à f.q., respectivamente, LF e LF −1, do seguinte modo:

LF −1(t) −1/γ LF t−γLF −1(t) ∼ 1, t ↓ 0. (1.17)

1.1 Condi¸c˜

oes de Dependˆ

encia relevantes em Teoria

de Extremos

A evidência de uma dependência temporal inerente a muitos fenómenos f´ısicos, fez com que a teoria de extremos clássica progredisse para um pressuposto mais realista, no sentido de, passar a contemplar sequências dependentes. Os primeiros passos conhecidos deste novo desafio, são atribu´ıdos a G. S. Watson, R. M. Loynes e S. M. Berman. Os tra-balhos de Watson e Loynes assentam, essencialmente, numa extensão dos resultados da teoria clássica a sequências com estrutura de dependência, enquanto que Berman inicia uma teoria detalhada para sequências estacionárias.

As condi¸cões de dependência que aqui vamos considerar assentam numa dependência fraca, i.e., que vai esmorecendo à medida que as v.a.’s se vão afastando no tempo, que, na prática, resulta na restri¸cão de uma dependência de longo alcance.

O conceito mais simples é o da m-dependência (Watson, [80]) em que as variáveis aleatórias Xi e Xj são independentes, sempre que |i − j| > m.

Segue-se a defini¸c˜ao de algumas condi¸c˜oes “mixing” ou de mistura, bastante conhecidas na literatura.

Defini¸cão 1.1.1. Sejam _{A e B σ-álgebras contidas na σ-álgebra, F, do espa¸co de} proba-bilidades, (Ω,F, P ). Considerem-se as medidas de dependência:

(16)

φ _{A, B} = sup_{|P (B|A) − P (B)|, A ∈ A, B ∈ B, P (A) > 0} β A, B= sup1 2 I X i=1 J X j=1 |P (Ai∩ Bj)− P (Ai)P (Bj)|,

onde o supremo ´e tomado sobre todos os pares de parti¸c˜oes (finitas) {A1, ..., AI} e {B1, ..., BJ} de Ω, tais que, Ai ∈ A para cada i

e Bj ∈ B para cada j.

Seja _{Xi}i∈Z uma sequência de v.a.’s (não necessariamente estacionárias) e, para

−∞ ≤ J ≤ L ≤ ∞, defina-se a σ-´algebra, FL

J = σ(XJ, ...XL).

• {Xi}i∈Z diz-se α-mixing (ou strong-mixing) (Rosenblatt, M. [73]) se

α(n) := sup

j∈Z

α F−∞j ,Fj+n∞

→ 0. (1.18)

• {Xi}i∈Z diz-se β-mixing (ou absolutamente regular) se

β(n) := sup

j∈Z

β _F_−∞j ,_F_j+n∞ _{→ 0.} (1.19)

• {Xi}i∈Z diz-se φ-mixing (de Ibragimov) (Ibragimov [49], [50]) se

φ(n) := sup

j∈Z

φ F−∞j ,Fj+n∞

→ 0 (1.20)

De notar que, a condi¸c˜ao φ-mixing de Ibragimov implica a condi¸c˜ao β-mixing que, por sua vez, implica a strong-mixing.

Em Leadbetter [52], apresenta-se a condi¸cão distributional-mixing, conhecida por, condi¸cão D≡D(u) (∀u ∈ R) ou ainda D(un), para uma sucessão real (un)n. Trata-se

de uma condi¸cão mais fraca que as anteriores, pois reporta-se apenas a acontecimentos do tipo {Xi ≤ u} ou suas interseçcões.

(17)

Defini¸cão 1.1.2. A sequência estacionária {Xi}i∈Z, com f.d. marginal F , verifica D(un)

para uma sucess˜ao de n´umeros reais (un)n, se, para quaisquer conjuntos de inteiros I =

i1, ..., ip e J =j1, ..., jp0 , tais que, 1≤ i1 < ... < ip < j1 < ... < jp0 ≤ n e j₁− i_p ≥ ` , se tem, |FI,J(un)− FI(un)FJ(un)| ≤ αn,`, com αn,`n → n→∞0, (1.21)

para alguma sucess˜ao `n= o(n), onde se considera,

FI,J(un) = P (Xi1 ≤ un, ..., Xip ≤ un, Xj1 ≤ un, ..., Xjp0 ≤ un).

A importância desta condi¸cão reside no facto de permitir uma extensão do Teorema dos Tipos Extremais, a um contexto D-dependente, como se estabelece no resultado seguinte. Teorema 1.1.1. Seja _{Xi}i∈Z uma sucessão estacionária e Mn= max(X1, ..., Xn).

Supo-nhamos que existem sucess˜oes de constantes {an > 0} e {bn ∈ R}, tais que, P Mn ≤

anx + bn

converge para uma f.d. G(x) n˜ao degenerada. Se a condi¸c˜ao D(anx + bn) for

válida para todo x∈ R, então G(x) é uma fun¸cão GEV.

Na extens˜ao de um resultado de Loynes [56], Chernick [12] mostra que, se para cada τ > 0, existe uma sucess˜ao (u(τ )

n )n verificando (1.6) e {Xi}i∈Z verifica D(un(τ )) , ent˜ao,

qualquer (fun¸c˜ao) limite para P Mn ≤ u(τ )n

ser´a da forma, P Mn ≤ u(τ )n −→ n→∞e −θτ_, _(1.22)

com θ∈ [0, 1] constante, independente de τ.

O novo parˆametro, θ, denomina-se ´ındice extremal da sequˆencia{Xi}i∈Z.

Conclui-se de imediato que, as sequências i.i.d. cujo máximo devidamente normalizado convirja, têm ´ındice extremal unitário. O rec´ıproco, contudo, não é verdadeiro. Este fenómeno pode ser constatado nos processos Gaussianos autorregressivos (Leadbetter et al. [53], Cap. 4).

(18)

O ´ındice extremal desempenha um papel importante na deriva¸cão de propriedades ex-tremais de uma sequência estacionária, _{Xi}i∈Z, verificando a condi¸cão de mistura fraca

D(un), com margens no dom´ınio de atraçcão para máximos de alguma GEV. Mais

pre-cisamente, se _{Xi}i∈Z verifica a condi¸c˜ao D(un) para sucess˜oes (un)n satisfazendo (1.6),

atendendo a (1.5) e (1.22), tem-se, lim

n→∞P (max(X1, ... , Xn)≤ un) = limn→∞ P (X1 ≤ un)

nθ

. (1.23)

Ainda no contexto de sequências estacionárias, sob a validade da condi¸cão D(un),

Leadbetter et al. [53] estabelecem a equivalência entre (1.5) e (1.6), introduzindo uma nova condi¸cão de dependência local, D0(un), definida em baixo:

Defini¸cão 1.1.3. A sucessão estacionária {Xi}i∈Z verifica a condi¸cão D0(un) se, quando

k_{→ ∞ e r}n= [n/k], lim sup n→∞ n rn X j=2 P X1 > un, Xj > un → 0.

Considerando {Xi}i∈Z uma sequência estacionária e { ˆXi}i≥1 a respectiva sequência

i.i.d. associada, i.e., ambas têm a mesma distribui¸cão marginal, então, sob a validade das condi¸cões D(un) e D0(un) para {Xi}i∈Z, a lei limite do máximo linearmente normalizado

de_{Xi}i∈Z e de { ˆXi}i≥1 coincidem. Decorre ainda da equivalˆencia entre (1.5) e (1.6) que

{Xi}i∈Z tem ´ındice extremal unit´ario.

Considere-se uma subdivis˜ao das v.a.’s X1, X2, ... em blocos de tamanho rn, (X1, ..., Xrn),

(Xrn+1, ..., X2rn), ..., onde rn= o(n). Um cluster de excedˆencias ´e definido como um

con-junto de observa¸c˜oes que excedem um limiar un, dentro de cada bloco, dado que ocorre,

pelo menos, uma excedˆencia (i.e., ocorre um acontecimento do tipo _{Xi > un}) dentro

desse bloco.

A condi¸c˜ao de dependˆencia local, D0(un), restringe a possibilidade de ocorrerem duas

ou mais excedˆencias em cada bloco. Assim, numa sequˆencia que verifique D0(un), as

excedˆencias de limiares elevados tendem a aparecer isoladas, assemelhando-se a uma situa¸c˜ao i.i.d..

(19)

Uma condi¸c˜ao mais fraca do que D0(un), designada D00(un), foi introduzida em

Lead-better e Nandagopalan [54]. Essencialmente, esta condi¸cão inibe a ocorrência de oscila¸cões rápidas junto de limiares elevados un, ou seja, restringe a probabilidade de ocorrerem dois

ou mais acontecimentos do tipo _{Xj ≤ un< Xj+1} (designados cruzamentos ascendentes

de un no instante j) em cada bloco de dimens˜ao rn. Em termos formais, define-se do

seguinte modo:

Defini¸cão 1.1.4. Seja _{Xi}i∈Z uma sucessão estacionária verificando a condi¸cão D(un).

A condi¸cão D00(un) é válida se existe uma sucessão de inteiros {kn}, tal que,

kn−→ n→∞∞ , knαn,lnn→∞−→0 , knln/nn→∞−→0 , kn(1− F (un))n→∞−→0 (1.24) e lim n→∞n rXn−1 j=2 P X1 > un, Xj ≤ un< Xj+1 = 0, onde rn= [n/kn].

A validade das condi¸cões D e D00 pode facilitar bastante o cálculo do ´ındice extremal, sobretudo em processos onde se conhe¸ca a fun¸cão de probabilidade de transi¸cão, como é o caso dos processos markovianos, conforme é notório no resultado que se segue (Leadbetter e Nandagopalan [54], Corolário 4.2.4):

Teorema 1.1.2. Seja (u(τ )

n )n uma sucess˜ao real, tal que, nP (X1 > u(τ )n )→ τ. Se {Xi}i∈Z

verifica D(u(τ )

n ) e D00(u(τ )n ), para todo τ > 0, e se para algum deles,

lim n→∞P X2 ≤ u (τ ) n |X1 > u(τ )n ) = θ, (1.25)

então a convergência dá-se para todo o τ > 0 e o processo tem ´ındice extremal igual a θ.

Uma outra condi¸cão de dependência local, também relacionada com o ´ındice extremal, foi introduzida por Hsing et al. [46], a que chamaram ∆(un). Esta condi¸cão é mais forte

que a condi¸c˜ao D(un), mas n˜ao tanto quanto a strong-mixing. De facto, ela deriva de um

enfraquecimento da condi¸cão strong-mixing, pois confina-se às σ-álgebras, FL

J(un), que

(20)

un}. Concretamente, a condi¸cão ∆(un) é válida se, para uma dada sucessão real (un)n e

para alguma sucess˜ao (ln)n, tal que, ln= o(n), se tem,

α(ln, un) = sup 1≤k≤n−1

α(Fk

1(un),Fk+l∞ n(un))→ 0, n → ∞ (1.26)

Se _{Xi}i∈Z é uma sequência estacionária sob a condi¸cão ∆(un), satisfazendo (1.6)

para uma constante positiva τ e possui ´ındice extremal positivo, então, o valor do ´ındice extremal aproxima-se do inverso aritmético do tamanho médio dos clusters de excedências. Nestas condi¸cões, podemos dizer que θ “mede a tendência” dos extremos para ocorrer em clusters.

Neste ponto, convém fazer a ressalva de que, um ´ındice extremal nulo está associado a casos considerados “patológicos”, que não serão aqui abordados.

Se relaxarmos agora um pouco a dependˆencia na condi¸c˜ao D(un), encontramos ainda

uma outra caracteriza¸c˜ao do ´ındice extremal, desta feita, estabelecida em O’Brien [62]: θ = lim

n→∞P (Xi ≤ un, 2≤ i ≤ rn|X1 > un) , (1.27)

onde (un)n é uma sucessão real, tal que, (1.6) é válido novamente para uma constante

τ > 0.

1.1.1 Caso Particular das Cadeias de Markov

Muitas das vezes, as séries temporais em estudo apresentam uma dependência a curto termo, o que faz com com que os processos markovianos sejam frequentemente utilizados na modela¸cão deste tipo de dados.

No que se segue, considera-se que a sequˆencia _{Xi}i∈Z ´e uma cadeia de Markov

estacionária de primeira ordem com espa¸co de estados cont´ınuo. Neste caso, os coefi-cientes de mistura, na Defini¸cão 1.1.1, simplificam-se bastante, para a sequência _{Xi}i∈Z,

pois reduzem-se a, respectivamente, α(n) = α(σ(X0), σ(Xn)), β(n) = β(σ(X0), σ(Xn)),

(21)

Certas caracter´ısticas das cadeias de Markov, permitem conhecer alguma da sua estrutura de dependência. Em O’Brien [62], por exemplo, constata-se que, as cadeias de Markov com espa¸cos de estados cont´ınuo e transi¸cões não degeneradas, verificam a condi¸cão distribucional-mixing, D, de Leadbetter et al. [53].

O resultado que se segue, ´e mais um exemplo dessa liga¸c˜ao.

Proposi¸c˜ao 1.1.3 (Bradley, [10]). Seja_{Xi}i∈Z uma cadeia de Markov estritamente

esta-cion´aria.

1. _{Xi}i∈Z é Harris recorrente e a aperiódica, se e só se, tem uma estrutura de

de-pendˆencia β-mixing;

2. Se _{Xi}i∈Z é ergódica e aperiódica, e φ(n) < 1 para algum n ≥ 1 em (1.20), então

é válida a condi¸cão φ-mixing.

3. Se _{Xi}i∈Z é Harris recorrente, então é ergódica.

Vejamos o que significa cada um destes conceitos, que se encontram bastante explanados, por exemplo, em Asmussen [4] e em Meyn e Tweedie [59].

Defini¸c˜ao 1.1.5. Um conjunto R diz-se recorrente num processo estoc´astico {Xi}i∈Z, se

volta a ser visitado pelo processo em tempo finito, i.e., P (inf_{{n : X}n ∈ R} < ∞) = 1.

Proposi¸c˜ao 1.1.4. Seja {Xi}i∈Z uma cadeia de Markov estritamente estacion´aria com

f.d. marginal F . Um conjunto R ´e recorrente, se F (R) =R_RF (dx) > 0.

Daqui em diante, denotar-se-á por Qm_{(x, B), a fun¸cão probabilidade de transi¸cão a}

m-passos de x para o conjunto B, i.e., Qm_{(x, B) = P (X}

m+1 ∈ B|X1 = x), onde m ´e um

inteiro positivo.

Proposi¸c˜ao 1.1.5. Seja _{Xi}i∈Z uma cadeia de Markov estritamente estacion´aria e R

um conjunto recorrente. Se, para algum m > 0, ∈ (0, 1) e uma distribui¸c˜ao λ, se tiver,

(22)

para todo B ∈ B(R) (B(R) é uma σ-álgebra de Borel), então R diz-se um conjunto de regenera¸cão.

Defini¸cão 1.1.6. Uma cadeia de Markov estritamente estacionária diz-se regenerativa ou Harris recorrente se possui um conjunto de regenera¸cão.

Segue-se uma condi¸c˜ao suficiente para a aperiodicidade (Asmussen, [4]).

Proposi¸c˜ao 1.1.6. Uma cadeia de Markov estritamente estacion´aria, _{Xi}i∈Z, diz-se

aperi´odica se, para qualquer conjunto de regenera¸c˜ao R, e para qualquer acontecimento B, se tem,

Qm+1_{(x, B)}_≥

1λ(B) e Qm(x, B)≥ 2λ(B) , ∀x ∈ R, (1.29)

para algum m_{∈ N e}1, 2 ∈ (0, 1).

Defini¸c˜ao 1.1.7. Seja {Xi}i∈Z uma cadeia de Markov, estritamente estacion´aria, e seja

µ, a distribui¸c˜ao de X0 (em (R,B(R))). Diz-se que {Xi}i∈Z ´e irredut´ıvel, se o que se segue

´e v´alido, µ-q.c. (“q.c.”, significa, “quase certamente”) x∈ R:

∀B ∈ B(R) : µ(B) > 0, ∃n ≥ 1 : P (Xn∈ B|X0 = x) > 0.

Teorema 1.1.7. Uma cadeia de Markov, estritamente estacion´aria, diz-se erg´odica, se for irredut´ıvel.

1.2 Extremos Bivariados e Dependˆ

encia assint´

otica

na cauda

Muitos problemas, envolvendo valores extremos, são de natureza multivariada. Por exemplo, de Haan e de Ronde [41] e de Haan e Sinha [42] estimaram a probabilidade de uma tempestade causar o colapso de um dique, perto da cidade de Petten, nos Pa´ıses Baixos, considerando uma combina¸cão de alto risco, entre o n´ıvel do mar e a altura da ondula¸cão. No campo das finan¸cas, por exemplo, Longin e Solnik [55] investigaram a

(23)

dependˆencia entre a equidade internacional dos mercados em per´ıodos de elevada volati-lidade.

A extensão da Teoria de Valores Extremos univariada ao caso multivariado não é assim tão imediata, pois apresenta logo dois problemas: decidir o que é uma observa¸cão extrema multivariada e, como lidar com a eventual dependência entre as v.a.’s de um vector. No que respeita à primeira questão, o mais usual é considerar o máximo componente a componente, i.e., dada uma sequência i.i.d. de vectores d-variados, Xi = (Xi,1, ..., Xi,d),

i = 1, ..., n, as componentes do m´aximo, Mn = max(X1, ..., Xn), s˜ao dadas por, Mn,j =

max(X1,j, ..., Xn,j), j = 1, ..., d. Note-se que, este máximo não é, necessariamente, um

vector observado.

Ressalva-se, desde j´a que, tal como no caso unidimensional, pelo facto de, min(X1, ..., Xn) = − max(−X1, ...,−Xn)

apenas nos preocupamos com o estudo do m´aximo, pois os resultados para o m´ınimo componente a componente, decorrem de imediato, mediante esta transforma¸c˜ao.

Analogamente `a situa¸c˜ao univariada, procuram-se vectores de constantes reais, an >

0 = (0, ..., 0) e bn, tais que, existe uma f.d. d-variada, G, com margens n˜ao degeneradas,

de tal modo que,

P (Mn≤ anx + bn) = Fn(anx + bn) d

−→ G(x) , (1.30)

Novamente, diz-se que F pertence ao dom´ınio de atraçcão (para máximos) de G, denotando-se, F _{∈ D(G). Se F}j e Gj forem as f.d.’s marginais de F e G, respectivamente, para

j = 1, ..., d, tem-se que,

F_jn(an,jxj + bn,j) d

→ Gj(xj),

onde, para cada j, Gj ´e uma fun¸c˜ao de valor extremo univariada e Fj ∈ D(Gj). A classe

de fun¸cões limite, G, em (1.30), coincide com a classe de fun¸cões max-estáveis, onde max-estabilidade tem o mesmo sentido do caso univariado em (1.3).

(24)

Desta vez, não é poss´ıvel uma representa¸cão paramétrica geral, para as fun¸cões mul-tivariadas de valor extremo, dada a vasta classe de estruturas de dependência que podem ocorrer entre as v.a’s do vector em causa. Este impedimento vem dificultar sobremaneira a inferência estat´ıstica, que, deste modo, se viu for¸cada a diligenciar outras estratégias, nomeadamente, a constru¸cão de sub-fam´ılias paramétricas, suficientemente flex´ıveis para aproximarem, satisfatoriamente, qualquer fun¸cão da classe limite max-estável, mas, si-multaneamente, anal´ıtica e computacionalmente tratáveis.

Um dos problemas que advém dos métodos baseados directamente da caracteriza¸cão (1.30), reside no facto de que, apenas permitem modelos, nos quais, as componentes para valores extremos são, ou exactamente independentes, ou assintoticamente dependentes (no sentido de que, a probabilidade de extremos conjuntos, dá-se com a mesma ordem de magnitude de um só extremo). A modela¸cão da cauda de uma distribui¸cão multi-variada, com base numa distribui¸cão de valor extremo, torna-se, então, inadequada para dados exibindo uma associa¸cão entre as observa¸cões, que gradualmente vai desaparecendo para valores cada vez mais extremos, aproximando-se, progressivamente, de uma situa¸cão i.i.d. (independência assintótica). Este fenómeno tem sido notado em séries de dados e aplica¸cões teóricas (Tawn em [16], Smith e Weissman [77] e Hsing et al. [48]). As distribui¸cões normais bivariadas, com correla¸cão |ρ| < 1, por exemplo, comungam desta caracter´ıstica.

Num contexto bivariado, surgiram alguns métodos para “quantificar” a dependência existente num par aleatório, (X1, X2), para valores de cauda (entenda-se cauda direita

pois reportamo-nos sempre ao m´aximo). Admitindo que (X1, X2) tem f.d.’s marginais,

respectivamente, F1 e F2 cont´ınuas e, admitindo, primeiramente, que estas s˜ao idˆenticas,

Coles et al. [13] apresentam um coeficiente de dependˆencia extremal, entre X1 e X2, ao

n´ıvel dos valores m´aximos, dado por, lim

x→xF

P (X2 > x|X1 > x) = χ , (1.31)

(25)

modo mais geral, se F1 e F2 não são idênticas, considerando a transforma¸cão Uj = Fj(Xj)

(j = 1, 2), tem-se,

lim

u↑1P (U2 > u|U1 > u) = χ. (1.32)

Grosso modo, χ é a probabilidade de uma variável ser extrema, dado que, a outra também o é. Quando 0 < χ ≤ 1, X1 e X2 dizem-se assintoticamente dependentes na cauda,

enquanto que, χ = 0 indica que s˜ao assintoticamente independentes na cauda. Veja-se agora o seguinte desenvolvimento:

P (U2 > u|U1 > u) = 2− 1− P (U2 < u, U1 < u) 1_{− P (U}1 < u) ∼ u↑12− log P (U2 < u, U1 < u) log P (U1 < u) , (1.33) Designando por χ(u) a aproxima¸c˜ao que se obteve, i.e.,

χ(u) = 2−log P (U2 < u, U1 < u)

log P (U1 < u)

, para 0 ≤ u ≤ 1, (1.34)

esta fun¸cão é uma medida de dependência u-dependente, pois o seu sinal determina se as variáveis são positiva ou negativamente associadas ao n´ıvel do limiar u. Na verdade, χ(u) é limitada por: 2_{− log(2u − 1)/ log(u) ≤ χ(u) ≤ 1, sendo o limite inferior interpretado} como −∞ se u ≤ 1/2 e 0 se u = 1. Veja-se que, atendendo a (1.32), (1.33) e (1.34), tem-se,

lim

u↑1 χ(u) = χ.

O aumento do valor da medida χ, significa um aumento do grau de dependência entre as v.a.’s, mas não permite diferenciar graus de dependência no caso assintoticamente in-dependente (i.e., χ = 0). De modo a contornar este problema, Coles et al. [13] apresentam um coeficiente alternativo, χ, análogo a χ, mas baseado numa compara¸cão entre as fun¸cões de sobrevivência, conjunta e marginal, de U1 e U2, respectivamente, P (U1 > u1, U2 > u2)

e P (U1 > u1), com u1, u2 ∈ (0, 1). Mais precisamente, considerando agora,

χ(u) = 2 log(1− u) log P (U2 > u, U1 > u) − 1. (1.35) define-se assim, lim u↑1 χ(u) = χ. (1.36)

(26)

Tem-se que −1 ≤ χ ≤ 1, onde χ = 1 corresponde a v.a.’s assintoticamente depen-dentes na cauda e, para _{−1 ≤ χ < 1, as v.a.’s dizem-se assintoticamente independentes} na cauda. Este coeficiente permite, agora, discriminar diferentes graus de dependˆencia no caso assintoticamente independente.

O modelo de Ledford e Tawn [57], [58], para a fun¸cão de sobrevivência conjunta de uma distribui¸cão bivariada, compreende, também, ambas as situa¸cões, de dependência e de independência assintótica, e dentro desta última, permite distinguir entre: associa¸cão positiva, quase/exacta independência e associa¸cão negativa, entre as v.a.´s, ao n´ıvel da cauda. Neste modelo surge um outro coeficiente de dependência extremal, conhecido por coeficiente de dependência assintótica na cauda, usualmente denotado por η. Pelas razões acima descritas, é considerado um coeficiente mais útil e é aquele que mais se referencia e trabalha na literatura. Sendo assim, é sobre este que nos vamos debru¸car, passando à sua defini¸cão formal.

Atendendo à formula¸cão em Draisma et al. [21], o modelo de Ledford e Tawn assume que a fun¸cão, (x, y) _{7→ P (X}1 > F1−1(1− x), X2 > F2−1(1− y)), é de varia¸cão regular de

´ındice 1/η (η∈ (0, 1]) em 0, ou seja, quando t ↓ 0,

ht(x, y) :=

P (X1 > F1−1(1− tx), X2 > F2−1(1− ty))

P (X1 > F1−1(1− t), X2 > F2−1(1− t))

→ h(x, y), (1.37) onde h é uma fun¸cão não degenerada, homogénea de ordem 1/η (ver 1.12). Admite-se que a convergência ocorre uniformemente em_{{(x, y)| max(x, y) = 1}.}

Assim sendo, quando t_{↓ 0, podemos considerar, P (X}1 > F1−1(1− t), X2 > F2−1(1− t)) ∼

t1/η_{L(t), onde L é uma fun¸cão de varia¸cão lenta em 0 (ver 1.13), ou equivalentemente,}

que

P (X2 > F2−1(1− t)|X1 > F1−1(1− t)) ∼ t1/η−1L(t). (1.38)

Notando que, esta última aproxima¸cão, mediante a mudan¸ca de variável, u = 1 _{− t,} permite estabelecer que, η ∼ log P (U1 > u)/ log P (U1 > u, U2 > u), quando u → 1,

(27)

considerando (1.35) e (1.36), ent˜ao,

χ = 2η_{− 1.} (1.39)

Veja-se que, se η = 1 e L(t) → a, para algum 0 < a ≤ 1, tem-se χ = 1 e o limite em (1.38) vem positivo, pelo que as v.a.’s são assintoticamente dependentes de grau χ = a. No caso de η = 1 e L(t) → 0 ou 0 < η < 1, o limite em (1.38) é nulo, correspondendo a χ = 0 em (1.31) e então, X1 e X2 dizem-se assintoticamente independentes com um

grau dado por χ. Dentro desta última classe, é poss´ıvel distinguir três tipos distintos de independência, de acordo com o sinal de χ. Assim, se η = 1/2, o que corresponde a χ = 0, tem-se uma (quase) independência (será uma independência exacta se L(t) = 1). Quando, η _{∈ (1/2, 1), tem-se χ positivo, verificando-se uma associa¸cão positiva entre X}1

e X2, i.e., entre U1 e U2, pois as observa¸c˜oes em que ambas excedem um valor elevado,

u, ocorrem mais frequentemente do que sob independência exacta. No caso, η_{∈ (0, 1/2),} i.e., χ < 0, manifesta-se uma associa¸cão negativa, pois agora as observa¸cões em que U1

e U2 excedem ambas um valor elevado, u, ocorrem menos frequentemente do que sob

independˆencia exacta.

1.2.1 Dependˆ

encia assint´

otica na cauda em Cadeias de Markov

Com a introdu¸cão da hipótese mais realista de dependência entre as observa¸cões de uma série temporal, o horizonte da teoria de valores extremos alargou-se a modelos com estrutura markoviana, como por exemplo, os autorregressivos. A caracteriza¸cão proba-bil´ıstica das propriedades extremais das cadeias de Markov encontra-se já bastante desen-volvida na literatura (veja-se, por exemplo, Rootzén [69], Smith [76], Perfekt [64] e Yun [81]). Contudo, é necessário encontrar a melhor forma de transformar esta compreensão, num processo viável para a modela¸cão de extremos em séries temporalmente dependentes. O primeiro trabalho de relevo, neste tópico, encontra-se em Smith et al. [78]. Nesta abordagem, considera-se que, acima de um limiar elevado fixo, o comportamento limite de uma cadeia de Markov,{Xi}i, é exacto e a estrutura de dependência entre v.a.’s

(28)

a aplica¸cão deste procedimento a processos cuja tendência de “clustering” diminui em limiares elevados, como é o caso de cadeias de Markov Gaussianas, com _{|ρ| < 1, pode} conduzir a uma representa¸cão enganosa dos eventos na cauda.

Esta situa¸cão motivou o trabalho de Bortot e Tawn [9], com a proposta de um pro-cedimento alternativo: substituir o modelo bivariado de valor extremo, pelo modelo mais geral, proposto por Ledford e Tawn ([57], [58]), acima apresentado. A vantagem reside no facto deste novo modelo incluir um parâmetro, η, cujo valor indica o grau de inde-pendência assintótica na cauda, fazendo a liga¸cão entre os casos limite de deinde-pendência perfeita e de exacta independência.

Adoptando a classifica¸c˜ao de Bortot e Tawn [9], diremos que {Xi}i ´e uma cadeia de

Markov assintoticamente independente, se χ = 0 em (1.31), e que_{Xi}i ´e uma cadeia de

Markov assintoticamente dependente, caso χ > 0.

1.3 O ´ındice de cauda e a classe de estimadores de

Drees

A estima¸cão do ´ındice de cauda recebe a aten¸cão de muitos investigadores, dada a grande importância deste parâmetro na Teoria de Valores Extremos, uma vez que, indica o tipo de cauda de uma distribui¸cão. Existem já vários estimadores para este parâmetro, como os populares estimador de Hill [44], de Pickands’ [65], de máxima verosimilhan¸ca (Smith [75]), de momentos (Dekkers et al. [17]), de momentos ponderados generalizado (Hosking e Wallis [45]), entre outros, com propriedades e desempenhos amplamente estu-dados, em contexto i.i.d..

No âmbito de um alargamento a um contexto estacionário, come¸cam a surgir os primeiros estudos, por volta de 1990, quase sempre direccionados para o comportamento assintótico do estimador de Hill, válido no dom´ınio das caudas pesadas (i.e. γ > 0). Uma das primeiras referências, se bem que não publicada, é um manuscrito de Rootzén et

(29)

al. [71], no qual se estabelece a normalidade assintótica do estimador de Hill, sob certas condi¸cões fracas, incluindo séries temporais strong-mixing. Quase em simultâneo, aparece um trabalho de Hsing [47], onde as condi¸cões de dependência impostas, embora difer-entes, são comparáveis. Nesta linha de investiga¸cão, foram surgindo outras publica¸cões, com especial relevo para os trabalhos de Resnick e St˘aric˘a [67] e Novak [61].

Além do ´ındice de cauda, outras caracter´ısticas extremais estão sob o alvo dos in-vestigadores, nomeadamente, probabilidades de excedência e quantis elevados, cuja im-portância está patente na sua designa¸cão. Refere-se, neste âmbito, o já citado artigo de Rootzén et al. [71].

Tendo como ferramenta os processos emp´ıricos, Drees desenvolve tamb´em o seu tra-balho nesta ´area, apresentando uma nova classe de estimadores, que abrange os acima mencionados. Todos estes estimadores, baseiam-se nas kn+ 1 maiores estat´ısticas ordinais

(e.o.’s), Xn:n ≥ Xn−1:n ≥ ... ≥ Xn−kn:n, onde{kn} é uma sucessão intermédia, i.e., é uma

sucess˜ao de inteiros positivos, tal que, kn→ ∞ e kn = o(n), quando n→ ∞.

A sua estratégia consiste em estabelecer uma aproxima¸cão ponderada da fun¸cão quan-til (f.q.) emp´ırica de cauda,

Qn(t) := Fn−1 1− kn n t = X_n−[knt]:n, t∈ [0, 1], (1.40)

onde Fn ´e a f.d. emp´ırica e [x] denota o maior inteiro n˜ao superior a x, a um processo

Gaussiano. A partir deste resultado, estabelece a consistência e a normalidade assintótica para _bγn = T (Qn), mediante certas condi¸cões de regularidade para o funcional T . Pelo

facto de se definirem à custa de um funcional, aplicado à cauda de uma distribui¸cão, designou estes estimadores por “classe dos funcionais estat´ısticos de cauda”.

Orientando-se, inicialmente, num contexto i.i.d., no qual se destacam os trabalhos, [22] e [23], Drees passa para as sequências estacionárias com estrutura de dependência β-mixing. É com base num resultado de Rootzén [70], no qual, se mostra a convergência do processo emp´ırico de cauda uniforme, de uma sequência estacionária β-mixing, para um processo Gaussiano, que Drees [24] estabelece uma aproxima¸cão ponderada para o

(30)

processo em (1.40).

Um refinamento destes resultados, para o caso γ > 0, encontra-se em Drees [25], que, por ser o caso que nos interessa particularmente, é nele que nos vamos concentrar. Assim sendo, além de considerar uma sequência estacionária β-mixing, _{Xi}i∈Z, com f.d.

marginal F ∈ D(Gγ), para algum γ > 0, Drees [25] estabelece as seguintes condi¸c˜oes:

• existe uma sucess˜ao (ln)n, tal que,

lim

n→∞

β(ln)

ln

n + lnk−1/2n log2(kn) = 0, (1.41)

onde ln → ∞, kn → ∞ e kn/n → 0, quando n → ∞. Exemplos t´ıpicos s˜ao as

cadeias de Markov Harris recorrentes, para as quais, os coeficientes β decrescem geometricamente (Doukhan [19]), e que, satisfazem (1.41), com ln = [C log n], para

C > 0 suficientemente grande e kn, tal que, log2n log4(log n) = o(kn).

• uma condi¸c˜ao de regularidade para a cauda conjunta de (X1, X1+m):

lim n→∞ n kn PX1 > F−1 1− kn n x , X1+m > F−1 1− kn ny → cm(x, y), (1.42) ∀m ∈ N e 0 < x, y ≤ 1 + .

• uma majora¸c˜ao uniforme sobre a probabilidade de X1 e X1+m pertencerem

conjun-tamente a um intervalo extremo, In(x, y) =

F−1₍₁_{− yk} n/n , F−1₍₁_{− xk} n/n) : n kn P X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ (y − x)ρ(m) + D˜ 1 kn n , (1.43) ∀m ∈ N, 0 < x, y ≤ 1 + , onde D1 ≥ 0 ´e uma constante e ˜ρ(m), m ∈ N, ´e uma

sucess˜ao, satisfazendo,P∞_m=1ρ(m) <˜ ∞.

• uma condi¸c˜ao sobre a velocidade de convergˆencia de kn → ∞, quando n → ∞, onde

{kn} é uma sucessão intermédia e

lim

n→∞k

1/2

n Φ(kn/n) = 0 , (1.44)

sendo Φ uma fun¸cão de varia¸cão regular de ´ındice τ em 0, para algum τ > 0, ou τ = 0 e Φ não-decrescente com lim Φ(t) = 0.

(31)

• e, por uma quest˜ao de simplicidade, quantis sob a forma,

F−1₍₁_{− t) = dt}−γ_{(1 + r(t)) , com} _{|r(t)| ≤ Φ(t) .} _(1.45)

Assim sendo, est˜ao reunidas as condi¸c˜oes para o referido resultado de Drees [25], que se passa a enunciar:

Teorema 1.3.1 (Drees [25], Teorema 2.1). Sob as condi¸cões (1.41)-(1.45) e para uma sucessão, (ln)n, tal que, ln = o(n/kn), existem versões da f.q. emp´ırica de cauda, Qn(t),

definida em (1.40), e um processo gaussiano centrado, g(t), com fun¸c˜ao de covariˆancia dada por, ˜ c(x, y) := x_{∧ y +} ∞ X m=1 (cm(x, y) + cm(y, x)) ∈ R , (1.46)

de tal modo que, a seguinte convergˆencia se verifica: sup t∈(0,1] tγ+1/2(1 +_{| log t|)}−1/2 kn1/2 _Q_n_(t) F−1₍₁_{− k}_n_/n) − t −γ_{− γt}−(γ+1)_g(t) −→ 0. (1.47)P

onde “_{→” denota convergˆencia em probabilidade.}P

Daqui, decorre que, kn1/2(bγn− γ) converge fracamente para uma v.a. com lei N (0, σT,γ2 )

(_bγn= T (Qn)), onde, σ2_T,γ = γ2 Z (0,1] Z (0,1] (st)−(γ+1)c(s, t)ν˜ T,γ(ds)νT,γ(dt) , (1.48)

com ˜c dada em (1.46) e onde νT,γ ´e uma medida sinal em (0, 1] (Drees [25], Teorema 2.2).

Por exemplo (conforme Drees [22], [23]), a medida sinal do estimador de Hill, num modelo generalizado Pareto, ´e dada por:

νH,γ(dt) = tγdt− δ1(dt), (1.49)

(32)

Cap´ıtulo 2

Modelos Max-Autorregressivos

Séries temporais, aparentemente estacionárias, mas exibindo súbitas grandes observa-¸cões, são potenciais candidatas a uma modela¸cão com base num processo ARMA de ru´ıdos de caudas pesadas. Este tipo de dados encontra-se, por exemplo, em sinais telefónicos ou em pre¸cos do mercado bolsista. No contexto de uma análise de valores extremos, os processos max-autorregressivos, como os modelos MARMA, introduzidos em Davis e Resnick [15], podem ser boas alternativas, por apresentarem uma estrutura mais simples, conforme argumentado pelos referidos autores. Neste cap´ıtulo, além de se rever estes mod-elos, introduz-se um novo, pARMAX, que tem a particularidade de incluir uma potência c_{∈ (0, 1), à qual nos referiremos como, parâmetro potência, que se relaciona com o valor} do coeficiente de dependência assintótica na cauda (η), de Ledford e Tawn. Este também poderá ser um modelo a considerar, no que a uma modela¸cão de valores extremos diz respeito.

Neste cap´ıtulo, come¸camos, então, com uma revisão dos modelos MARMA, com par-ticular relevo para o modelo ARMAX ou MARMA(1, 0) (Alpuim [1], [2] e Canto e Cas-tro [11]). Calcular-se-á o valor do coeficiente de dependência assintótica na cauda de Ledford e Tawn (η), para pares aleatórios ARMAX desfasados m unidades, (Xi, Xi+m),

concluindo-se acerca do tipo de dependência assintótica na cauda. Por fim, obter-se-á uma aproxima¸cão para a fun¸cão quantil emp´ırica de cauda de um processo ARMAX, de acordo com o Teorema 1.3.1, a partir do qual, se deduz, a consistência e normalidade assintótica

(33)

dos estimadores do ´ındice de cauda da classe de Drees. Na Seçcão 2.2, introduz-se o modelo max-autorregressivo, pARMAX. Come¸ca-se por provar a existência e unicidade de distribui¸cão estacionária para este novo processo, seguindo-se o estudo do dom´ınio de atraçcão para máximos e da estrutura de dependência, o cálculo do ´ındice extremal e do coeficiente de dependência assintótica na cauda de Ledford e Tawn, este último, também para pares da forma, (Xi, Xi+m). Ver-se-á como este coeficiente (η) se relaciona com o

valor do parâmetro potência (c) do processo pARMAX, ao mesmo tempo que se conclui que se trata de um processo markoviano assintoticamente independente. Assim sendo, e pelo facto do ´ındice extremal ser unitário, estabelece-se uma expressão pré-assintótica para este último, de acordo com Bortot e Tawn [9], que também se relaciona com η, e que permitirá melhorar toda a inferência baseada em (1.23) (Seçcão 2.2.3). Como η também depende do desfasamento m considerado, na verdade tem-se uma expressão para ηm, a

partir da qual, se constrói a fun¸cão de auto-dependência assintótica na cauda (FADAC). Trata-se de uma medida de dependência, análoga à fun¸cão de autocorrela¸cão (FAC), mas que quantifica a dependência serial nos valores extremos de uma série temporal (Seçcão 2.2.2). Finaliza-se com a verifica¸cão das condi¸cões do Teorema 1.3.1 para o processo pARMAX, o que permite concluir, à semelhan¸ca do modelo ARMAX, a consistência e normalidade assintótica dos estimadores do ´ındice de cauda da classe de Drees.

2.1 Modelos MARMA revisitados

Em Davis e Resnick [15], introduzem-se os processos max-autorregressivos de médias móveis ou MARMA(p,q) (max-autoregressive moving average), que se definem como proces-sos que satisfazem a seguinte recursão:

Xn = ϕ1Xn−1∨ ... ∨ ϕpXn−p∨ Zn∨ ϑ1Zn−1∨ ... ∨ ϑqZn−q, n = 0,±1, ±2, ..., (2.1)

onde ϕi, ϑj ≥ 0, 1 ≤ i ≤ p, 1 ≤ j ≤ q, e {Zi}i∈Z é uma sequência i.i.d.. A sequência

{Zi}i∈Z é também conhecida como sequência das inova¸cões ou ru´ıdos.

Os referidos autores estabelecem condi¸cões necessárias e suficientes, quer para a exis-tência de solu¸cão estacionária única, quer para a sua redutibilidade, i.e., reduzir a um

(34)

MARMA(p0_{, q}0_{), com p}0 _{< p e q}0 _{< q, considerando os ru´ıdos com f.d. marginal no}

dom´ınio de atraçcão Fréchet(γ), para algum γ > 0.

Na Figura 2.1, encontram-se duas trajectórias simuladas, de um modelo ARMA(1,0) e de um modelo MARMA(1,0), respectivamente. Veja-se como a semelhan¸ca entre elas reitera a ideia de usar um modelo max-autorregressivo, satisfazendo a recursão (2.1), como modelo alternativo aos ARMA de caudas pesadas. Embora seja inteiramente poss´ıvel que os modelos MARMA não se ajustem bem aos valores pequenos, isto não constitui problema, uma vez que estamos interessados na modela¸cão das maiores observa¸cões.

0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 AR(1) 0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 ARMAX

Figura 2.1: 500 realiza¸cões dos processos: Xi = 0.7 Xi−1+ Zi, à esquerda; Xi = max(0.7Xi−1, Zi), à

direita, com ru´ıdos Zi_Pareto(0.8).

Os modelos MARMA(1,0) ou ARMAX que s˜ao um caso particular simples dos MARMA, encontram-se amplamente estudados em Alpuim [1], [2] e Canto e Castro [11]. Mais pre-cisamente, satisfazem a recurs˜ao,

Xi = cXi−1∨ Zi, i = 0,±1, ±2, ..., 0 < c < 1 (2.2)

onde _{Zi}i∈Z ´e uma sequˆencia de v.a.’s independentes e identicamente distribu´ıdas com

a v.a. Z, com suporte R+₀ e com f.d. marginal FZ. Considera-se Zi independente de Xj,

para j < i. A existência de distribui¸cão estacionária, K, é garantida pela condi¸cão sobre o parâmetro do modelo, 0 < c < 1, e pela hipótese acrescida de FZ estar, ou no dom´ınio

de atraçcão de uma Fréchet(γ) para algum γ > 0, ou no de Gumbel (Canto e Castro [11], Seçcão 5.5). (Note-se que, o dom´ınio de atraçcão Weibull está exclu´ıdo à partida, pelo facto de se considerar um limite superior do suporte infinito.) Mediante estas condi¸cões,

(35)

a f.d., K, vem dada por, K(x) = ∞ Y j=0 FZ(x/cj). (2.3)

Em particular, K satisfaz a equa¸c˜ao

K(x) = FZ(x)K(x/c). (2.4)

O modelo ARMAX é um processo markoviano com fun¸cão probabilidade de transi¸cão (f.t.p.), de x para ]_{− ∞, y], dada por,}

Qm_{(x, ]}_{− ∞, y]) := P X} n+m ≤ y|Xn = x =          m−1_Y j=0 FZ y/c j _{, se x} ≤ y/cm 0 , se x > y/cm (2.5)

Ainda em Canto e Castro [11] (Cap´ıtulo 5), mostra-se que se trata de um processo re-generativo e aperiódico. Assim sendo, pela Proposi¸cão 1.1.3, apresenta uma estrutura de dependência β-mixing. Também verifica a condi¸cão D00(un), para sucessões (un)n, tais

que, n(1−K(un)) = O(1) e possui ´ındice extremal unit´ario sempre que K est´a no dom´ınio

de atraçcão Gumbel, enquanto que, se K pertencer ao dom´ınio de atraçcão Fréchet(γ), então θ = 1− c1/γ_.

No resultado que se segue, veja-se como o dom´ınio de atraçcão de K se reduz ao dom´ınio de atraçcão de FZ.

Proposi¸cão 2.1.1. O dom´ınio de atraçcão das margens do processo ARMAX é o mesmo do das suas inova¸cões, Z, tendo também o mesmo ´ındice de cauda.

Dem. _{Atendendo à recursão (2.2) e, aplicando depois as hipóteses de independência} a´ı assumidas, tem-se que,

P (Mn≤ x) = P max X1, ..., Xn ≤ x = P maxX1, cX1, Z2, c2X1, cZ2, Z3, ... , cn−1X1, ... , cZn−1, Zn ≤ x = P maxX1, Z2, ... , Zn ≤ x = K(x)Fn−1 Z (x) . (2.6)

(36)

Logo, se FZ ∈ D Gγ , ent˜ao, lim n→∞P Mn≤ anx + bn = lim n→∞K(anx + bn)F n−1 Z (anx + bn) = Gγ(x),

para constantes normalizadoras, an > 0 e bn, convenientemente escolhidas.

No que se segue, considerar-se-á que os ru´ıdos do processo ARMAX estão no dom´ınio de atraçcão Fréchet(γ), para algum γ > 0, pelo que, existe uma fun¸cão de varia¸cão lenta em infinito, LZ, tal que,

1− FZ(x) = x−1/γLZ(x). (2.7)

Assim, pela Proposi¸c˜ao 2.1.1, tem-se tamb´em, 1− K(x) = x−1/γ_L

K(x) , (2.8)

para alguma fun¸c˜ao de varia¸c˜ao lenta em infinito, LK(x).

2.1.1 O coeficiente de dependˆ

encia assint´

otica na cauda de um

processo ARMAX

Nesta seçcão, calcula-se o coeficiente de dependência assintótica na cauda, de Ledford e Tawn, denotado η, para um par aleatório, (X1, X1+m), proveniente de um processo

ARMAX, sendo m um qualquer inteiro positivo.

Proposi¸c˜ao 2.1.2. Seja{Xi}i∈Z um processo ARMAX, tal que, (2.7) e (2.8) se verificam.

O par aleatório, (X1, X1+m), (m∈ N), tem coeficiente de dependência assintótica na cauda

unit´ario.

Dem. _{Assumindo U = 1}_{− K(X}₁_{) e V = 1}_{− K(X}_1+m_{) em (1.37), tem-se que,} P U < tx, V < ty P U < t, V < t = P X1 > K−1(1− tx), X1+m > K−1(1− ty) P X1 > K−1(1− t), X1+m > K−1(1− t) . (2.9)

(37)

Desenvolvendo a expressão em numerador, considerando a fun¸cão probabilidade de transi¸cão em (2.5), então, P X1 > K−1(1− tx), X1+m > K−1(1− ty) = Z _∞ K−1_(1−tx)

1− Qm_{(u, ]}_{− ∞, K}−1₍₁_{− ty)])}_K(du)

= tx₋ Z K−1(1−ty) cm K−1_(1−tx) m−1_Y j=0 FZ K−1(1− ty)/c j_K(du).

O último integral será não nulo se x > ycm/γ_{, pelo que, aplicando (2.4) e (2.8),}

obt´em-se, P X1 > K−1(1− tx), X1+m > K−1(1− ty) = tx− K(K−1₍₁_{− ty)) −} K(K−1_(1−tx))K(K−1_(1−ty)) K K−1(1−ty)_cm . (2.10)

Observe-se que, aplicando (1.14) e (1.15), ent˜ao, K K−1_c(1−ty)m ∼ 1 − yt LK−1(t) −1/γ cm/γ_L K t−γLK−1(t)c−my−γ _(2.11)

Porque LK é uma fun¸cão de varia¸cão lenta e a aproxima¸cão em (1.17) é válida, deduz-se

ent˜ao que, quando t_{↓ 0,}

K K−1_c(1−ty)m

∼ 1 − ytcm/γ _(2.12)

pelo que, a probabilidade em (2.10), vem, aproximadamente, tx− (1 − ty) −(1−tx)(1−ty)_1−tycm/γ = tyc

m/γ1− tx − ty

1_{− tyc}m/γ +

t2_xy

1_{− tyc}m/γ ∼ tyc m/γ_.

Assim sendo, conclui-se que,

P X1 > K−1(1− tx), X1+m > K−1(1− ty) ∼      tx , se 0 < x_{≤ yc}m/γ tycm/γ _{, se yc}m/γ _{< x}_{≤ 1 + .} (2.13)

Note-se que, tomando x = y = 1, obt´em-se imediatamente a seguinte aproxima¸c˜ao para o denominador em (2.9):

P X1 > K−1(1− t), X1+m > K−1(1− t)

(38)

quando t ↓ 0. Substituindo (2.13) e (2.14) em (2.9), a fun¸c˜ao, h(x, y), dada em (1.37), vem dada por,

h(x, y) = lim t↓0 P U < tx, V < ty P U < t, V < t ∼      xc−m/γ _{, se 0 < x}_{≤ yc}m/γ y , se ycm/γ _{< x}_{≤ 1 + ,}

sendo, portanto, uma fun¸cão homogénea de ordem 1. Logo η = 1, donde se conclui que duas observa¸cões de cauda de um processo ARMAX, que distam no tempo, uma da outra, m + 1 instantes, são assintoticamente dependentes, para qualquer valor do parâmetro c (0 < c < 1)).

Com este resultado, e atendendo à classifica¸cão de Bortot e Tawn [9] (Seçcão 1.2.1), constatamos que o processo ARMAX é uma cadeia de Markov assintoticamente depen-dente.

2.1.2 Aproxima¸c˜

ao da fun¸c˜

ao quantil emp´ırica de cauda de um

processo ARMAX

Vejamos como é poss´ıvel aplicar ao modelo ARMAX, os resultados de Drees, apresen-tados na Seçcão 1.3.

Proposi¸cão 2.1.3. Seja {Xi}i∈Zum processo ARMAX sob as assun¸cões da Proposi¸cão

2.1.2. Então, as condi¸cões, (1.42) e (1.43), são ambas válidas.

Dem. _{O limite em (1.42) ´e imediato, substituindo t por k}_n_{/n em (2.13), com n}_{→ ∞.} Logo, tem-se que,

cm(x, y) =    x , 0 < x_{≤ yc}m/γ ycm/γ _{, yc}m/γ _{< x}_{≤ 1 + .} (2.15)

Passando `a condi¸c˜ao (1.43), considere-se, In(x, y) =

K−1₍₁_−yk

n/n), K−1(1−xkn/n)

.

(39)

Tem-se que, n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ n knP X1 ∈ In(x, y), X1+m > K−1(1− ykn/n) ≤ n knP X1 ∈ In(x, y), X1 > c−mK−1(1− ykn/n) +n knP X1 ∈ In(x, y), max k=2,...,1+m c m−k+1_Z k > K−1(1_{− yk}n/n)

Atendendo à independência entre as v.a.’s de _{Zi}i∈Z, e à independência entre X1 e Zk

∀k ≥ 2, ambas postuladas na defini¸c˜ao do processo ARMAX, ent˜ao,

n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) = n kn 1₋kn nx− K _K−1₍₁₋kn ny) cm +kn n(y− x) 1₋ m+1_Y k=2 FZ _K−1₍₁₋kn ny) cm−k+1 ≤ n kn kn nycm/γ − kn nx + kn n(y− x) 1− ∞ Y j=0 FZ K−1₍₁₋kn ny) cj

onde, a ´ultima passagem se deve a (2.12) e ao facto de, 1₋ m+1_Y k=2 FZ _K−1₍₁₋kn ny) cm−k+1 ≤ 1 − ∞ Y k=0 FZ _K−1₍₁₋kn ny) cm−k+1 = 1_{− K K}−1 ₁₋ kn ny

Considerando agora (2.3) e observando que, ₋kn nx <−

kn nxc

m/γ_{, conclui-se, ent˜ao, que,} n knP X1 ∈ In(x, y), X1+m ∈ In(x, y) ≤ (y − x)cm/γ ₊kn ny .

Como y_{∈ (0, 1 + ], tomando D}1 = 1 + e ˜ρ(m) = cm/γ, então a condi¸cão (1.43) é válida,

pois,P∞_m=1cm/γ _<_∞.

Corolário 2.1.4. Seja_{Xi}i∈Zum processo ARMAX sob as condi¸cões da Proposi¸cão 2.1.2

e seja{kn} uma sucess˜ao, tal que, kn → ∞ e kn= o(n), quando n→ ∞. Ent˜ao, o limite

em (1.47) é válido para a fun¸cão quantil emp´ırica de cauda, Qn(t), definida em (1.40),

com fun¸c˜ao ˜c dada por, ˜ c(x, y) = min(x, y) + p−1 X m=1 (cm(x, y) + cm(y, x)) + (x + y) cp/γ (1_{− c}1/γ₎ , (2.16)

(40)

onde p≡ px,y = [max{γ ln(x/y)/ ln c, γ ln(y/x)/ ln c}] + 1.

Neste processo, para qualquer estimador da classe de Drees, ˆγn = T (Qn), tem-se que,

kn1/2(bγn−γ), converge fracamente para uma v.a. com lei N (0, σT,γ2 ), cuja variˆancia, ´e dada

por (1.48).

Dem. _{O resultado em (1.47) e a normalidade assint´otica, decorrem, de imediato, da} Proposi¸c˜ao 2.1.3, juntamente com o facto do processo ARMAX ser β-mixing.

Resta calcular a fun¸c˜ao de covariˆancia em (1.46). Observe-se que,

cm(x, y) + cm(y, x) =          x(1 + cm/γ_{) , 0 < x}_{≤ yc}m/γ (y + x)cm/γ _{, yc}m/γ _{< x}_{≤ yc}−m/γ y(1 + cm/γ_{) , yc}−m/γ _{< x}_{≤ 1 +} .

Uma vez que, cm/γ _{→ 0 e c}−m/γ _{→ ∞, quando m → ∞, fixando x e y, existe uma ordem}

p_{∈ N, tal que, para todo m ≥ p, se tem sempre, yc}m/γ _{< x}_{≤ yc}−m/γ_{. Logo,} ∞ X m=1 (cm(x, y) + cm(y, x)) = p−1 X m=1 (cm(x, y) + cm(y, x)) + ∞ X m=p (x + y)cm/γ. (2.17)

Como a série do 2o _{membro é geométrica de razão, c < 1, seque-se a validade de (2.16),}

para p acima enunciado.

2.2 O modelo pARMAX

´

E na sequência do estudo dos processos ARMAX, mais precisamente, no cálculo do valor do coeficiente de dependência assintótica na cauda de Ledford e Tawn (η), que surge a ideia de um novo processo max-autorregressivo, o qual designamos pARMAX. Trata-se de um processo que envolve uma fun¸cão potência (da´ı o acréscimo do “p” na sua desi-gna¸cão), cujo expoente c (c _{∈ (0, 1)) influencia, directamente, o parâmetro η, calculado} em pares de variáveis afastadas no tempo m unidades. Esta rela¸cão revela-se importante, se pensarmos que existem já, na literatura, alguns estimadores para η (veja-se Ledford e Tawn [57], Peng [63], Beirlant e Vandewalle [7], Draisma et al. [21]) e, portanto, temos

(41)

uma forma para estimar o parâmetro c do modelo pARMAX. A este parâmetro, chamare-mos, por vezes, parâmetro potência.

Seja _{Zi}i∈Z uma sequência de cópias i.i.d. da v.a. Z com suporte não negativo e f.d.

FZ. Uma sequˆencia {Xi}i∈Z diz-se pARMAX se,

Xi = X_i−1c ∨ Zi , 0 < c < 1, i = 0,±1, ±2, ... (2.18)

com Xi independente de Zj, para j > i.

Tal como acontece com os já referidos MARMA, o processo max-autorregressivo potência, pARMAX, não é de dif´ıcil manejo, no que diz respeito ao estudo de carac-ter´ısticas extremais, como veremos. Apresenta também trajectórias semelhantes aos ARMA com caudas pesadas, sobretudo ao n´ıvel dos maiores valores (ver Figura 2.2).

0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 AR(1) 0 100 200 300 400 500 0 20 40 60 80 100 120 140 160 pARMAX

Figura 2.2: 500 realiza¸c˜oes dos processos: autorregressivo, Xi= 0.7 Xi−1+ Zi, `a esquerda; pARMAX,

Xi= max(X 0.7

i−1, Zi), `a direita, com ru´ıdos Zi_Pareto(0.8).

Iterando sucessivamente, tem-se, Xn = X_n−1c ∨ Zn= Xc 2 n−2∨ Zn−1c ∨ Zn= ... = Xc k n−k ∨ k−1_{_} j=0 Z_n−jcj = ... . Observe-se que, Xn= ∞ _ j=0 Z_n−jcj (2.19)

(42)

é uma solu¸cão da recursão max-autorregressiva potência em (2.18), pois Xn = X_n−1c ∨ Zn= _{_}∞ j=0 Zcj n−1−j c ∨ Zn= ∞ _ j=0 Zcj n−j.

Vejamos condi¸cões, sob as quais, a solu¸cão dada por (2.19) está bem definida, é esta-cionária e é única.

Proposi¸cão 2.2.1. As equa¸cões em (2.18) têm solu¸cão estacionária dada por (2.19), se e só se, ∞ X j=0 − log FZ(x1/c j ) < ∞ , para algum x ≥ 0. (2.20)

Dem. _{Mostra-se que,} W∞

j=0Zc j

j , é quase certamente (q.c.) finito, se e só se, (2.20) é

v´alido. Pela Lei 0-1 de Kolmogorov, P (W∞_j=0Zcj

j <∞) = 0 ou 1, sendo 1 se P (

W∞ j=0Zc

j

j ≤

x) > 0 para algum x não negativo. Usando a hipótese de independência,

P _{_}∞ j=0 Z_jcj ≤ x = ∞ Y j=0 FZ(x1/c j ) , (2.21)

e portanto, tem-se que, P _{_}∞ j=0 Z_jcj ≤ x = expn−− log ∞ Y j=0 FZ(x1/c j )o = expn₋ ∞ X j=0 − log FZ(x 1/cj )o,

o qual ´e positivo, se e s´o se, (2.20) se verifica.

Proposi¸cão 2.2.2. Se FZ ∈ D(Gγ) para algum γ > 0, então (2.20) é válida.

Dem. _{A hipótese é equivalente a considerar que 1}_{− F}_Z _{é de varia¸cão regular em} infinito, com ´ındice _{−1/γ, pelo que, podemos escrever 1 − F}Z da forma (2.7). Basta ter

em conta que, 1_−FZ xcj+11 1−FZ xcj1 =x − 1 γcj+1 LZ xcj+11 x− 1γcj L xcj1 = x−γcj1 1 c−1 L∗Z(x)∼ 0 , j → ∞