An´
alise de Valores Extremos: Uma Introdu¸c˜
ao
M. Ivette Gomes
C.E.A.U.L. e D.E.I.O., F.C.U.L., Universidade de Lisboa,
Instituto de Investiga¸c˜
ao Cient´ıfica Bento da Rocha Cabral
M. Isabel Fraga Alves
D.E.I.O., F.C.U.L. e C.E.A.U.L., Universidade de Lisboa
Cl´
audia Neves
C.E.A.U.L., Universidade de Lisboa,
DMat, Universidade de Aveiro
Ficha T´
ecnica:
An´
alise de Valores Extremos: Uma Introdu¸
c˜
ao
1M. Ivette Gomes
C.E.A.U.L. e D.E.I.O., F.C.U.L., Universidade de Lisboa, Instituto de Investiga¸c˜ao Cient´ıfica Bento da Rocha Cabral
M. Isabel Fraga Alves
D.E.I.O., F.C.U.L. e C.E.A.U.L., Universidade de Lisboa
Cl´audia Neves
C.E.A.U.L., Universidade de Lisboa, DMat, Universidade de Aveiro
Editora: Sociedade Portuguesa de Estat´ıstica Capa: Carina Sousa
Impress˜ao: Instituto Nacional de Estat´ıstica Tiragem: 200 exemplares
ISBN: 978-972-8890-30-8 Dep´osito Legal: 366446/13
1Investiga¸c˜ao parcialmente financiada pelos fundos nacionais da FCT—Funda¸c˜ao
para a Ciˆencia e a Tecnologia, projecto PEst-OE/MAT/UI0006/2011, EXTREMA, PTDC/MAT/101736/2008 e PTDC/MAT/112770/2009: EXTREMES IN SPACE.
Conte´
udo
1 Coment´arios Bibliogr´aficos 1
1.1 T´opicos a abordar . . . 4
2 Motiva¸c˜ao 7 2.1 Katrina: Um desastre (n˜ao) natural? . . . 7
2.2 Extremos no mercado financeiro . . . 9
2.3 EVT: porque nem tudo ´e normal! . . . 11
2.4 Estat´ısticos hist´oricos na ´area de extremos . . . 14
3 Metodologias Gr´aficas em APVE 17 3.1 Papel de probabilidade . . . 18
3.1.1 Referˆencia hist´orica aos pap´eis de probabilidade . . . . 20
3.2 QQ-plots: outra perspectiva equivalente . . . 26
3.2.1 QQ–plot: modelo Exponencial . . . 26
3.2.2 QQ–plot: caso geral . . . 29
3.2.3 QQ–plots para modelos Normal e Log-Normal . . . 30
3.2.4 QQ–plot: Tabela de distribui¸c˜oes . . . 31
3.3 QQ-plots e PP-plots: caso geral F (·|θ) . . . 31 i
ii CONTE ´UDO
3.4 W-plots: caso geral F (·|θ) . . . 33
3.5 Fun¸c˜ao de excesso m´edio e ME-plot . . . 34
3.5.1 ME-plots — mean excess plots . . . 34
3.5.2 Padr˜oes das fun¸c˜oes de excesso m´edio . . . 35
3.5.3 Fun¸c˜oes de excesso m´edio — modelo Weibull . . . 36
3.6 Caudas HTE/LTE . . . 36
3.7 Dados hidrol´ogicos — parˆametros de interesse . . . 36
3.7.1 Dados de m´aximos anuais . . . 37
3.8 Dados financeiros . . . 38
4 APVE — O Porquˆe da EVT 41 4.1 Problemas simples em valores extremos . . . 41
4.1.1 Escassez de dados nas caudas . . . 42
4.1.2 Metodologias tradicionais inadequadas . . . 42
4.2 Velocidade m´axima de vento em Albuquerque . . . 43
4.3 Velocidade m´axima de vento em Zaventem . . . 45
4.4 Seguros de incˆendios . . . 49
4.5 Descargas anuais m´aximas do rio Meuse . . . 51
5 Teoria Distribucional Exacta 55 5.1 Comportamento de uma estat´ıstica ordinal . . . 55
5.1.1 Rela¸c˜ao com os modelos Binomial e Beta . . . 56
5.2 Distribui¸c˜ao conjunta de estat´ısticas ordinais . . . 60
5.2.1 Estat´ısticas ordinais em modelo Uniforme . . . 61
5.2.2 Estat´ısticas ordinais em modelo Exponencial . . . 65
5.2.3 Estat´ısticas ordinais em modelo Pareto . . . 68
5.3 Momentos de estat´ısticas ordinais . . . 71
5.3.1 Rela¸c˜oes de controlo . . . 72
CONTE ´UDO iii
5.3.3 Rela¸c˜oes de c´alculo efectivo . . . 74
5.3.4 Momentos em modelo Uniforme . . . 78
5.3.5 Momentos em modelo Exponencial . . . 80
5.3.6 Momentos em modelo Pareto . . . 84
5.4 Estrutura markoviana das estat´ısticas ordinais . . . 84
5.4.1 Estat´ısticas ordinais e processo de Poisson . . . 84
5.4.2 Estat´ısticas ordinais como processo de Markov . . . 86
5.4.3 Uma cadeia de Markov aditiva . . . 89
5.5 Estat´ısticas sistem´aticas . . . 90
5.5.1 Distribui¸c˜ao de amostragem da amplitude e estat´ısticas similares . . . 91
5.5.2 Amplitude e escala . . . 92
5.5.3 Espa¸camentos de estat´ısticas ordinais . . . 94
5.5.4 O m´etodo de Steutel . . . 97
5.6 Enquadramentos e aproxima¸c˜oes . . . 99
5.6.1 Enquadramentos ‘distribution-free’ . . . 99
5.6.2 Aproxima¸c˜oes para os momentos . . . 102
5.7 O Teorema de Malmquist e simula¸c˜ao . . . 104
6 Teoria Distribucional Assint´otica 107 6.1 Introdu¸c˜ao . . . 107
6.2 Modelos particulares e m´etodo de R´enyi . . . 109
6.2.1 O modelo Exponencial, E (1) . . . 109
6.2.2 O modelo Uniforme, U (0, 1) . . . 111
6.3 Estat´ısticas ordinais centrais (quantis) . . . 114
6.4 Teoria assint´otica de valores extremos . . . 117
6.4.1 O teorema de Gnedenko . . . 118
6.4.2 Modelo de valores extremos e ´ındice de valores ex-tremos . . . 124
iv CONTE ´UDO
6.4.3 Teorema unificado dos tipos extremais para m´ınimos . . 125
6.4.4 Caracteriza¸c˜ao de max-dom´ınios de atrac¸c˜ao e coefici-entes de atrac¸c˜ao . . . 126
6.4.5 Condi¸c˜oes suficientes de von Mises para F ∈ DM(Gγ) . 132 6.4.6 N´ıveis normalizados e a distribui¸c˜ao limite no modelo Normal . . . 135
6.4.7 Car´acter poissoniano de excedˆencias de n´ıveis elevados . 138 6.4.8 Distribui¸c˜ao assint´otica de Xk:n e Xn−k+1:n, k fixo . . . 139
6.4.9 Distribui¸c˜ao assint´otica conjunta de estat´ısticas ordi-nais superiores e inferiores . . . 142
6.4.10 Teorema Pickands-Balkema-de Haan . . . 144
6.5 Estat´ısticas ordinais interm´edias . . . 145
6.6 Esquemas originais n˜ao i.i.d. . . 145
6.7 Estat´ısticas sistem´aticas . . . 152
7 Abordagens Param´etricas 155 7.1 Parˆametros de acontecimentos extremos . . . 155
7.2 M´etodo dos m´aximos anuais . . . 157
7.2.1 Modelos Gumbel, Fr´echet, Max-Weibull e GEV: princi-pais caracter´ısticas . . . 161
7.2.2 Estima¸c˜ao dos parˆametros em modelos extremais cl´assicos . . . 163
7.2.3 Modelo GEV: M´etodo ML . . . 165
7.2.4 Modelo GEV: M´etodo PWM . . . 166
7.2.5 Intervalos de confian¸ca para os parˆametros da GEV . . 167
7.3 Abordagens n˜ao cl´assicas . . . 170
7.3.1 Modelo GEV multivariado e multidimensional . . . 172
7.3.2 A metodologia POT e o modelo GP . . . 174
CONTE ´UDO v
7.5 Estima¸c˜ao do CTE . . . 182
7.6 Breve referˆencia a extremos bivariados . . . 183
7.7 Resumo . . . 184
8 Abordagem Semi-Param´etrica 187 8.1 Condi¸c˜oes de segunda ordem e de ordem superior . . . 188
8.2 Estima¸c˜ao semi-param´etrica do EVI . . . 189
8.2.1 O estimador de Hill (H) . . . 189
8.2.2 O estimador de Pickands (P ) . . . 189
8.2.3 O estimador dos Momentos (M ) . . . 190
8.2.4 O estimador POT-ML (M L) . . . 191
8.2.5 Normalidade assint´otica dos estimadores . . . 192
8.2.6 ICs semi-param´etricos e assint´oticos para o EVI . . . . 192
8.2.7 Observa¸c˜oes adicionais . . . 193
8.3 Estima¸c˜ao de outros parˆametros . . . 194
8.3.1 Estima¸c˜ao de quantis extremais . . . 195
8.3.2 Estima¸c˜ao semi-param´etrica do limite superior do su-porte . . . 196
8.3.3 Estima¸c˜ao semi-param´etrica da probabilidade de exce-dˆencia . . . 197
8.4 Invariˆancia versus n˜ao-invariˆancia . . . 199
9 Casos de Estudo 201 9.1 Dados ‘maasmax.txt’ . . . 201
9.2 Caso de Estudo: ‘venice, library(ismev)’ . . . 221
9.3 Um novo caso de estudo: ‘soa.txt’ . . . 233
Bibliografia 255
Pref´
acio
Neste texto procedemos em grande parte a uma compila¸c˜ao do material lec-cionado em cadeiras das ´areas de Estat´ısticas Ordinais, de Teoria de Valores Extremos, de Estat´ıstica de Extremos e de Modela¸c˜ao de Acontecimentos Ra-ros, ampliado com alguns desenvolvimentos recentes.
Trata-se de um manual de trabalho, ainda em fase embrion´aria, em que se procurou encontrar um compromisso entre o rigor te´orico e uma abordagem intuitiva `as ´areas em estudo, disseminando t´ecnicas simples, mas poderosas da ´
area de Estat´ıstica de Extremos, que tˆem sido largamente utilizadas nos mais variados campos, entre os quais destacamos Ciˆencias Ambientais, Finan¸cas e Seguros.
Come¸camos por apresentar no Cap´ıtulo 2 alguma Motiva¸c˜ao para a necessi-dade da Teoria de Valores Extremos (TVE), muito frequentemente denotada EVT, do ingˆes ‘Extreme Value Theory’. No Cap´ıtulo 3 avan¸camos com al-gumas T´ecnicas Gr´aficas usadas na an´alise preliminar de qualquer tipo de dados, tais como os QQ-plots e os PP-plots, e T´ecnicas Gr´aficas espec´ıficas da ´area de valores extremos, como os ME-plots e os W-plots. No Cap´ıtulo 4, atrav´es de alguns exemplos de aplica¸c˜ao a dados univariados, tentamos responder `a pergunta Porquˆe a Teoria de Valores Extremos? Mas em EVT, e mais geralmente, em quase todos as ´areas da Estat´ıstica, a ordena¸c˜ao de uma amostra aleat´oria univariada, como base para uma representa¸c˜ao clara do conte´udo dessa amostra, ´e crucial. Tal justifica a considera¸c˜ao dos Cap´ı-tulos 5 e 6, respectivamente sobre o Comportamento Distribucional Exacto e o Comportamento Distribucional Assint´otico das estat´ısticas ordinais. Final-mente, nos Cap´ıtulo 7, 8 e 9, debru¸camo-nos sobre Estat´ıstica de Extremos, ´
area de grande utilidade em aplica¸c˜oes quando se pretende inferir na cauda de um modelo, estimando parˆametros de acontecimentos raros, como por exem-plo quantis elevados ou per´ıodos de retorno de n´ıveis elevados. No Cap´ıtulo 7, abordamos as perspectivas param´etricas de inferˆencia estat´ıstica em acon-tecimentos raros. O Cap´ıtulo 8 ´e dedicado a alguns m´etodos de inferˆencia semi-param´etrica. Finalmente, no Cap´ıtulo 9, procedemos `a an´alise de trˆes casos de estudo.
O texto ´e, como conv´em, consideravelmente mais ambicioso do que ser´a o vii
curso breve no XXI Congresso Anual da Sociedade Portuguesa de Estat´ıstica. Fica no entanto como elemento de referˆencia para os interessados, enquanto num curso de algumas horas, mesmo intensivas e com a celeridade que uma audiˆencia conhecedora imp˜oe, apenas os t´opicos mais relevantes podem ser abordados. Qualquer curso ´e um compromisso, procurando um equil´ıbrio pes-soal (neste caso de uma trindade geracional) entre o que ´e reconhecidamente fundamental e imprescind´ıvel, e os gostos e interesses de quem o escreve. As-sim, ficaram naturalmente de fora quest˜oes muito importantes mas que n˜ao serviam o nosso puzzle, tal como ficaram de fora quest˜oes que est˜ao entre os nossos interesses directos de investiga¸c˜ao, tais como como estima¸c˜ao de vi´es reduzido, utiliza¸c˜ao de metodologias de re-amostragem, como o bootstrap e o jackknife em Estat´ıstica de Extremos, entre outros, mas que certamente iriam desequilibrar a dinˆamica do texto.
N˜ao ´e decerto por ingratid˜ao, mas em todo o rol de agradecimentos h´a es-quecimentos. Por isso preferimos os clich´es: `as nossas fam´ılias e aos nossos amigos, aos nossos mestres, aos nossos colegas, aos nossos alunos.
Agradecemos por outro lado `a Sociedade Portuguesa de Estat´ıstica (SPE) e aos organizadores do XXI Congresso Anual da SPE esta honra que nos conferiram. Agradecemos tamb´em o apoio institucional do CEAUL — Centro de Estat´ıs-tica e Aplica¸c˜oes da Universidade de Lisboa. E, claro, as palavras m´agicas e o logotipo: Esta investiga¸c˜ao foi parcialmente subsidiada por FCT — Fun-da¸c˜ao para a Ciˆencia e a Tecnologia, projectos PEst-OE/MAT/UI0006/2011, EXTREMA, PTDC/MAT/101736/2008 e PTDC/MAT/112770/2009: EX-TREMES IN SPACE.
M. Ivette Gomes M. Isabel Fraga Alves Cl´audia Neves