• Nenhum resultado encontrado

Modelos ARMA espaço-temporais e a sua aplicação na modelação da radioatividade no ambiente em Portugal

N/A
N/A
Protected

Academic year: 2021

Share "Modelos ARMA espaço-temporais e a sua aplicação na modelação da radioatividade no ambiente em Portugal"

Copied!
92
0
0

Texto

(1)

Modelos ARMA espaço-temporais e a sua aplicação na

modelação da radioatividade no ambiente em Portugal

Salvador Menano de Figueiredo Malfeito Freire

Dissertac¸ ˜ao para obtenc¸ ˜ao do Grau de Mestre em

Matemática e Aplicações

Orientador:

Prof. Dr. Manuel González Scotto

Prof.

a

Dra. Susana Barbosa

Júri

Presidente: Prof. Dr. António Manuel Pacheco Pires

Orientador: Prof. Dr. Manuel González Scotto

Vogal: Prof.

a

Dra. Sónia Cristina Alexandre Gouveia

(2)
(3)
(4)
(5)

Agradecimentos

Agradec¸o ao Professor Manuel Scotto em primeiro lugar, pela orientac¸ ˜ao, disponibilidade e incentivo, pelos conselhos e cr´ıticas. Sem ele a realizac¸ ˜ao da dissertac¸ ˜ao seria imposs´ıvel. N ˜ao s ´o pelo seus enormes conhecimentos na ´area mas tamb ´em pelo seu lado humano e motivacional.

Agradec¸o tamb ´em `a minha fam´ılia e amigos pelo constante apoio que me deram, e que de algum modo contribu´ıram para a realizac¸ ˜ao da dissertac¸ ˜ao.

Por fim agradec¸o aos meus colegas, que conheci durante o meu percurso acad ´emico e que ajuda-ram a crescer do ponto de vista pessoal e profissional.

(6)
(7)

Resumo

As s ´eries temporais est ˜ao constantemente presentes no nosso dia-a-dia: em economia, ambiente, meteorologia, sa ´ude entre outras ´areas. Assim, tornou-se imprescind´ıvel desenvolver metodologias, de modo a compreender o comportamento de qualquer vari ´avel ao longo do tempo.

As metodologias para estudar s ´eries temporais n ˜ao s ˜ao propriamente recentes. Entre elas, destacam-se as metodologias propostas com Box-Jenckins, e a sua extens ˜ao por parte de Pfeifer e Deutsch (1980) para modelar v ´arias s ´eries temporais em simult ˆaneo. Os modelos espac¸o-temporais, STARMA, descrevem simultaneamente v ´arias s ´eries temporais tendo em conta uma componente espacial entre elas. Assim, cada valor observado no local i e no instante t ´e expressa como uma combinac¸ ˜ao linear ponderada de observac¸ ˜oes desfasadas no tempo e no espac¸o.

Nesta dissertac¸ ˜ao procurou-se assim detalhar toda a literatura dos modelos SARIMA e STARMA: a sua caracterizac¸ ˜ao, m ´etodos de identificac¸ ˜ao para selecionar um bom modelo, estimac¸ ˜ao de par ˆametros e diagn ´ostico de modelos. Posteriormente, aplicou-se os conceitos a uma aplicac¸ ˜ao real: a medidas de radioatividade em 8 cidades portuguesas.

Ao longo do trabalho, descreveu-se oito s ´eries temporais individualmente, cada uma com um mo-delo SARIMA, e todas em simult ˆaneo com um momo-delo STARMA. Testaram-se v ´arios momo-delos e, quer na modelac¸ ˜ao univariada, quer na modelac¸ ˜ao espac¸o-temporal, foram alcanc¸ados resultados satisfat ´orios. Depois de encontrados os ”melhores” modelos (que descrevessem adequadamente as s ´eries tempo-rais), seguiram-se as provis ˜oes. Em ambos os casos foram obtidos resultados satisfat ´orios, e seme-lhantes entre os modelos SARIMA e STARMA. Apesar de n ˜ao ser clara a escolha entre a modelac¸ ˜ao univariada e multivariada, destaca-se o modelo STARMA, que descreve todas as s ´eries com um s ´o modelo e inclui ainda uma componente espacial.

Palavras-chave:

S ´eries temporais, SARIMA, Modelac¸ ˜ao espac¸o-temporal, STARMA, Radi-oatividade.

(8)
(9)

Abstract

There are many fields, which time series theory could be applied: economy, environment, healthcare and many others. Hence, it is crucial to study further these concepts to describe data points in time order.

Since the beginning of the last century, many studies have been developed to model time series correctly. In a widely range of different approaches, the most famous one is the methodology introduced by Box-Jenkins to study univariate time series. Many years later, in 1980, Pfeifer and Deutsch extended that methodology and proposed an approach to model many time series at the same time. This ex-tension is called Spatial and Temporal Modelling, STARMA, and it is able to describe many time series simultaneous including a spatial component. Furthermore, each observation in each site i and at time t is a weighted linear combinations of the lagged observations in space and time.

In this thesis, the main goal is to describe an univariate and spatial and temporal time series mo-delling (SARIMA and STARMA): a characterization of each model, how to identify the best model to describe some data set, the parameters estimation and a diagnosis analysis of a certain model. After describing time series theory, these concepts were applied to radioactivity measures collected in eight portuguese cities.

Over this dissertation, eight time series were modelled independently by SARIMA models, and also all together by a STARMA model. Many models were tested, and the best models had been chosen for forecasting. The results were good in both univariate and multivariate cases, and the predictions were accurate too. Although it is almost impossible to choose between univariate and space time mo-delling, the STARMA model is able to fit many time series at the same time, and also includes a spatial component.

(10)
(11)

Conte ´

udo

Agradecimentos . . . v

Resumo . . . vii

Abstract . . . ix

Lista de Tabelas . . . xiii

Lista de Figuras . . . xv

Gloss ´ario . . . xix

1 Introduc¸ ˜ao 1 1.1 Motivac¸ ˜ao e contextualizac¸ ˜ao . . . 1

1.2 Radioatividade em Portugal . . . 2

1.3 Objetivos e Estrutura da Dissertac¸ ˜ao . . . 3

2 Revis ˜ao Bibliogr ´afica 5 2.1 Aplicac¸ ˜oes dos modelos SARIMA e espac¸o-temporais STARMA . . . 5

3 Modelos e M ´etodos 11 3.1 Modelos SARIMA . . . 12

3.1.1 Modelo Autorregressivo de ordem p . . . 12

3.1.2 Modelo de M ´edias M ´oveis de ordem q . . . 12

3.1.3 Modelo Autorregressivo e de M ´edia M ´oveis (p,q) . . . 13

3.1.4 Modelo Autorregressivo e de M ´edias M ´oveis integrado (p,d,q) . . . 13

3.1.5 Modelo Autorregressivo e de M ´edias M ´oveis Integrado Sazonal . . . 14

3.2 Metodologia de Box-Jenkins para modelos SARIMA . . . 16

3.2.1 Identificac¸ ˜ao . . . 16 3.2.2 Estimac¸ ˜ao . . . 16 3.2.3 Diagn ´ostico . . . 17 3.2.4 Previs ˜ao . . . 19 3.3 Modelo STARMA . . . 20 3.3.1 Desfasagem espacial . . . 20 3.3.2 Caracterizac¸ ˜ao . . . 22

(12)

3.4 Extens ˜ao da Metodologia de Box-Jenkins para modelos STARMA . . . 26 3.4.1 Identificac¸ ˜ao . . . 26 3.4.2 Estimac¸ ˜ao . . . 28 3.4.3 Diagn ´ostico . . . 31 3.4.4 Previs ˜ao . . . 32

4 Aplicac¸ ˜ao das metodologias propostas a um caso pr ´atico - Radioatividade em Portugal 33 4.1 Descric¸ ˜ao do Problema/Dados . . . 33

4.2 Aplicac¸ ˜ao da metodologia SARIMA . . . 36

4.3 Aplicac¸ ˜ao da metodologia STARMA . . . 49

5 Considerac¸ ˜oes finais 67 5.1 Conclus ˜oes . . . 67

5.2 Dificuldades . . . 67

5.3 Trabalhos futuros . . . 68

(13)

Lista de Tabelas

3.1 Caracter´ısticas te ´oricas das func¸ ˜oes de autocorrelac¸ ˜ao e parcial para modelos AR, MA e

ARMA. . . 16

3.2 Caracter´ısticas te ´oricas das func¸ ˜oes de autocorrelac¸ ˜ao espac¸o-temporal e parcial para modelos STAR, STMA e STARMA. Adaptado de Rao e Antunes (2003) . . . 28

4.1 N ´umero de observac¸ ˜oes e respetiva percentagem . . . 34

4.2 Medidas descritivas dos dados . . . 36

4.3 Modelos identificados para modelar as 8 cidades . . . 44

4.4 Sum ´ario do modelo ARIMA (1,0,1) para Braganc¸a . . . 44

4.5 Sum ´ario do modelo ARIMA (2,0,1) para Castelo Branco . . . 44

4.6 Sum ´ario do modelo ARIMA (3,0,1) para Coimbra . . . 44

4.7 Sum ´ario do modelo ARIMA (3,0,0) para Elvas . . . 45

4.8 Sum ´ario do modelo ARIMA (1,0,0) para Faro . . . 45

4.9 Sum ´ario do modelo ARIMA (2,0,1) para Ponta Delgada . . . 45

4.10 Sum ´ario do modelo ARIMA (2,0,1) para Portalegre . . . 45

4.11 Sum ´ario do modelo ARIMA (3,0,1) para Porto . . . 45

4.12 Previs ˜oes segundo os modelos SARIMA para as cidades Braganc¸a, Castelo Branco, Coimbra e Elvas . . . 49

4.13 Previs ˜oes segundo os modelos SARIMA para as cidades Faro, Ponta Delgada, Portalegre e Porto . . . 49

4.14 Erro Quadr ´atico M ´edio e σ das previs ˜oes para as 8 cidades utilizando o modelo SARIMA 49 4.15 Dist ˆancias, em km, das cidades em an ´alise . . . 50

4.16 BIC e vari ˆancia dos modelos 1 a 6 . . . 52

4.17 Sum ´ario do Modelo 1: STARMA (2, 0, 0) × (0, 1, 11) . . . 52

4.18 Sum ´ario do Modelo 2: STARMA (3, 0, 0) × (0, 1, 11) . . . 53

4.19 Sum ´ario do Modelo 3: STARMA (31, 0, 1) × (0, 1, 11) . . . 53

4.20 Sum ´ario do Modelo 4: STARMA (31, 0, 1) × (1, 1, 11) . . . 53

4.21 Sum ´ario do Modelo 5: STARMA (31, 0, 2) × (0, 1, 11) . . . 53

4.22 Sum ´ario do Modelo 6: STARMA (31, 0, 2) × (0, 1, 11) . . . 54

4.23 Resultados dos testes de Box Pierce dos modelos 1 a 6 . . . 58

(14)

4.25 Sum ´ario do Modelo 7: STARMA (41, 0, 2) × (0, 1, 11) . . . 59

4.26 Sum ´ario do Modelo 8: STARMA (31, 0, 3) × (0, 1, 11) . . . 59

4.27 Sum ´ario do Modelo 9: STARMA (41, 0, 3) × (0, 1, 11) . . . 59

4.28 Sum ´ario do Modelo 10: STARMA (31, 0, 4) × (0, 1, 11) . . . 60

4.29 Sum ´ario do Modelo 11: STARMA (31, 0, 41) × (0, 1, 11) . . . 60

4.30 Resultados dos testes de Box Pierce dos modelos 7 a 11 . . . 60

4.31 Previs ˜oes do Modelo 9 para as cidades de Braganc¸a, Castelo Branco, Coimbra e Elvas . 64 4.32 Previs ˜oes do Modelo 9 para as cidades de Faro, Ponta Delgada, Portalegre e Porto . . . 64

4.33 Erro Quadr ´atico M ´edio e desvio padr ˜ao das previs ˜oes para as 8 cidades utilizando o modelo STARMA . . . 64

4.34 Desvios padr ˜ao das previs ˜oes para as 8 cidades dos modelos SARIMA e do modelo STARMA . . . 65

(15)

Lista de Figuras

3.1 Ordens espaciais de Pfeifer e Deustch, em duas e uma dimens ˜oes . . . 21

3.2 As equac¸ ˜oes Yule-Walker para modelo espac¸o-temporal . . . 27

4.1 Mapa Portugal com as cidade em estudo: 1) Braganc¸a, 2) Castelo Branco, 3) Coimbra, 4) Elvas, 5) Faro, 6) Ponta Delgada (n ˜ao est ´a representada no mapa), 7) Portalegre, 8) Porto . . . 34

4.2 S ´erie observada em Braganc¸a . . . 35

4.3 S ´erie observada em Castelo Branco . . . 35

4.4 S ´erie observada em Coimbra . . . 35

4.5 S ´erie observada em Elvas . . . 35

4.6 S ´erie observada em Faro . . . 35

4.7 S ´erie observada em Ponta Delgada . . . 35

4.8 S ´erie observada em Portalegre . . . 36

4.9 S ´erie observada no Porto . . . 36

4.10 Decomposic¸ ˜ao STL da s ´erie de Braganc¸a . . . 37

4.11 Decomposic¸ ˜ao STL da s ´erie de Castelo Branco . . . 38

4.12 Decomposic¸ ˜ao STL da s ´erie de Coimbra . . . 38

4.13 Decomposic¸ ˜ao STL da s ´erie de Elvas . . . 39

4.14 Decomposic¸ ˜ao STL da s ´erie de Faro . . . 39

4.15 Decomposic¸ ˜ao STL da s ´erie de Ponta Delgada . . . 40

4.16 Decomposic¸ ˜ao STL da s ´erie de Portalegre . . . 40

4.17 Decomposic¸ ˜ao STL da s ´erie de Porto . . . 41

4.18 ACF amostral da s ´erie de Braganc¸a . . . 41

4.19 PACF amostral da s ´erie de CIDADE Braganc¸a . . . 41

4.20 ACF amostral da s ´erie de Castelo Branco . . . 41

4.21 PACF amostral da s ´erie de Castelo Branco . . . 41

4.22 ACF amostral da s ´erie de Coimbra . . . 42

4.23 PACF amostral da s ´erie de Coimbra . . . 42

4.24 ACF amostral da s ´erie de Elvas . . . 42

4.25 PACF amostral da s ´erie de Elvas . . . 42

(16)

4.27 PACF amostral da s ´erie de Faro . . . 42

4.28 ACF amostral da s ´erie de Ponta Delgada . . . 43

4.29 PACF amostral da s ´erie de Ponta Delgada . . . 43

4.30 ACF amostral da s ´erie de Portalegre . . . 43

4.31 PACF amostral da s ´erie de Portalegre . . . 43

4.32 ACF amostral da s ´erie de Porto . . . 43

4.33 PACF amostral da s ´erie de Porto . . . 43

4.34 Diagn ´ostico para o modelo de Braganc¸a . . . 46

4.35 Diagn ´ostico para o modelo de Castelo Branco . . . 46

4.36 Diagn ´ostico para o modelo de Coimbra . . . 46

4.37 Diagn ´ostico para o modelo de Elvas . . . 46

4.38 Diagn ´ostico para o modelo de Faro . . . 47

4.39 Diagn ´ostico para o modelo de Ponta Delgada . . . 47

4.40 Diagn ´ostico para o modelo de Portalegre . . . 47

4.41 Diagn ´ostico para o modelo de Porto . . . 47

4.42 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos dados orginais: ordem 0 e ordem 1 . . 51

4.43 Func¸ ˜ao de Autocorrelac¸ ˜ao espac¸o-temporais dos dados diferenciados: ordem 0 e ordem 1 51 4.44 Func¸ ˜ao de Autocorrelac¸ ˜ao parcial espac¸o-temporais dos dados diferenciados: ordem 0 e ordem 1 . . . 52

4.45 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 1: STARMA (2, 0, 0)× (0, 1, 11) . . . 55

4.46 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 2: STARMA (3, 0, 0)× (0, 1, 11) . . . 55

4.47 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 3: STARMA (31, 0, 1)× (0, 1, 11) . . . 56

4.48 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 4: STARMA (31, 0, 1)× (1, 1, 11) . . . 56

4.49 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 5: STARMA (31, 0, 2)× (0, 1, 11) . . . 57

4.50 Func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporais dos res´ıduos do Modelo 6: STARMA (31, 0, 2)× (0, 1, 11) . . . 57

4.51 Func¸ ˜ao de Autocorrelac¸ ˜ao Espac¸o-temporais dos res´ıduos do Modelo 7: STARMA (41, 0, 2)× (0, 1, 11) . . . 61

4.52 Func¸ ˜ao de Autocorrelac¸ ˜ao Espac¸o-temporais dos res´ıduos do Modelo 8: STARMA (31, 0, 3)× (0, 1, 11) . . . 61

4.53 Func¸ ˜ao de Autocorrelac¸ ˜ao Espac¸o-temporais dos res´ıduos do Modelo 9: STARMA (41, 0, 3)× (0, 1, 11) . . . 62

4.54 Func¸ ˜ao de Autocorrelac¸ ˜ao Espac¸o-temporais dos res´ıduos do Modelo 10: STARMA (31, 0, 4)× (0, 1, 11) . . . 62

(17)

4.55 Func¸ ˜ao de Autocorrelac¸ ˜ao Espac¸o-temporais dos res´ıduos do Modelo 11: STARMA (31, 0, 41)×

(18)
(19)

Gloss ´ario

AR

Modelo Autoregressivo

MA

Modelo de M ´edias M ´oveis

ARMA

Modelo Autoregressivo e de M ´edias M ´oveis

ACF

Func¸ ˜ao de Autocorrelac¸ ˜ao

PACF

Func¸ ˜ao de Autocorrelac¸ ˜ao Parcial

SARIMA

Modelo Autoregressivo e de M ´edias M ´oveis integrado Sazonal

STMA

Modelo M ´edias M ´oveis espac¸o-temporal

STAR

Modelo Autoregressivo espac¸o-temporal

STARMA

Modelo Autoregressivo e de M ´edias M ´oveis espac¸o-temporal

(20)
(21)

Cap´ıtulo 1

Introduc¸ ˜ao

1.1

Motivac¸ ˜ao e contextualizac¸ ˜ao

Define-se s ´erie temporal, como um conjunto de observac¸ ˜oes ordenadas no tempo, em que se verifica depend ˆencia temporal entre as observac¸ ˜oes.

Sequ ˆencias de dados hist ´oricos surgem em diferentes contextos, como em economia, marketing, financ¸as, ambiente etc... pelo que se tornou indispens ´avel desenvolver m ´etodos matem ´aticos e es-tat´ısticos para os estudar. Os m ´etodos eses-tat´ısticos permitem n ˜ao s ´o analisar a estrutura de depend ˆencia das s ´eries hist ´oricas, como tamb ´em fazer previs ˜oes baseadas nos valores observados.

Nesta dissertac¸ ˜ao, ser ˜ao usados apenas modelos autorregressivos m ´edias m ´oveis (ARMA) univa-riados, e os modelos ARMA espac¸o-temporais (STARMA). Os modelos ARMA s ˜ao os mais utilizados, e na maioria dos casos s ˜ao muito eficazes para representar dados temporais. Contudo, aplicam-se apenas ao estudo de apenas uma s ´erie. Para contornar este problema, surgiram os modelos ARMA multivariados. No entanto, os modelos ARMA multivariados n ˜ao permitem caracterizar depend ˆencias espaciais, muitas vezes observadas no estudo de v ´arias s ´eries temporais. Com esse prop ´osito, foram introduzidos os modelos STARMA.

Os modelos STARMA foram propostos por Pfeifer e Deutsch (1980). Estes autores estenderam a classe de modelos ARMA univariados de Box-Jenkins e consideraram as correlac¸ ˜oes espac¸o-temporais, originando assim os modelos STARMA. Diz-se que um STARMA expressa cada observac¸ ˜ao no instante t e na localizac¸ ˜ao i, como uma combinac¸ ˜ao linear das observac¸ ˜oes passadas, desfasadas quer no tempo, quer no espac¸o.

Embora os modelos STARMA tenham sido aplicados em v ´arias ´areas cient´ıficas, por exemplo: em processos meio ambientais, no campo magn ´etico criados pelo c ´erebro, no tr ´afego autom ´ovel etc... n ˜ao t ˆem sido utilizados para caracterizar a depend ˆencia espac¸o-temporal de s ´eries de radioatividade em Portugal. Esta dissertac¸ ˜ao vem assim testar os modelos STARMA pela primeira vez nesta tem ´atica, esperando assim que sirva de motivac¸ ˜ao e inspirac¸ ˜ao para outros autores proporem novos trabalhos neste campo.

(22)

torna-se ineg ´avel que cada cidad ˜ao deve torna-ser alertado para inverter esta situac¸ ˜ao. O excesso de radioativi-dade na atmosfera tem consequ ˆencias graves quer para a vida humana quer para o ambiente. Estas preocupac¸ ˜oes serviram tamb ´em de motivac¸ ˜ao extra para realizar esta dissertac¸ ˜ao.

1.2

Radioatividade em Portugal

A radioatividade ´e definida como ”0 fen ´omeno pelo qual um n ´ucleo inst ´avel emite part´ıculas e ondas para atingir a estabilidade. Nem todos os ´atomos s ˜ao radioativos, mas os que recebem essa definic¸ ˜ao se caracterizam por emitir part´ıculas radioativas (radiac¸ ˜ao), numa busca constante para se tornarem mais est ´aveis (https://www.apambiente.pt/index.php?ref=17subref=305, 2019-01-07).”

A utilizac¸ ˜ao de energia radioativa tem-se mostrado fundamental ao longo do tempo. A sua aplicac¸ ˜ao tem sido muito variada, como por exemplo, na produc¸ ˜ao de energia nuclear, em exames m ´edicos etc.. No entanto, este tipo de energia, quando libertado em excesso para a atmosfera, pode originar s ´erias consequ ˆencias para o ambiente, n ˜ao s ´o para o local do acidente mas podendo afetar ´areas a centenas de quil ´ometros de dist ˆancia.

Visto que n ˜ao h ´a centrais nucleares em Portugal, a probabilidade de ocorr ˆencia de um acidente nuclear com graves consequ ˆencias para Portugal ´e bastante remota. Em territ ´orio nacional h ´a apenas o Reator Portugu ˆes de Investigac¸ ˜ao (RPI), mas a proximidade `as sete centrais espanholas leva a algu-mas precauc¸ ˜oes e a criar procedimentos que permitam respostas r ´apidas e eficazes para minimizar ao m ´aximo as consequ ˆencias de um poss´ıvel acidente. Por outro lado, poder ´a haver alertas de outra natu-reza onde tamb ´em se utiliza fontes radioativas, como a medicina, ind ´ustria ou at ´e mesmo no transporte de subst ˆancias radioativas.

Conforme adotado pela Ag ˆencia Internacional de Energia At ´omica, os tipos de emerg ˆencias ra-diol ´ogicas podem ser divididos em cinco categorias:

• ”emerg ˆencias exclusivamente relacionadas com instalac¸ ˜oes nucleares;

• queda de sat ´elite ou outro objeto espacial com uma fonte propulsora nuclear ou fontes radioativas perigosas;

• desaparecimento de uma ”fonte radioativa perigosa”;

• detec¸ ˜ao de elevados n´ıveis de radioatividade de origem desconhecida;

• outras emerg ˆencias radiol ´ogicas ou ameac¸as, tais como acidente no transporte de subst ˆancias radioativas, descoberta de uma ”fonte radioativa perigosa”, sobre-exposic¸ ˜ao s ´eria de pacientes, e at ´e atos de terrorismo de ataque a instalac¸ ˜oes nucleares com bombas sujas.”

Face a todos os tipos de emerg ˆencias apresentados, torna-se priorit ´ario ter uma gest ˜ao apropri-ada para eventuais emerg ˆencias. Nesse sentido, esta dissertac¸ ˜ao apresenta modelos temporais para descrever n´ıveis de radioatividade em oito cidades em Portugal.

(23)

1.3

Objetivos e Estrutura da Dissertac¸ ˜ao

O objetivo principal da dissertac¸ ˜ao foi testar modelos STARMA a um conjunto de medidas de radioati-vidade recolhidas em diferentes cidades em Portugal, e compar ´a-los `a modelac¸ ˜ao SARIMA univariada. A expectativa na an ´alise ´e que a componente espacial melhore os resultados em comparac¸ ˜ao com a an ´alise individual de cada s ´erie temporal.

Tendo em conta outros objetivos, esta dissertac¸ ˜ao foi estruturada da seguinte forma: • Revis ˜ao Bibliogr ´afica - revis ˜ao da literatura sobre modelos STARMA;

• Conceitos te ´oricos - caracterizac¸ ˜ao dos modelos do tipo autoregressivo e de m ´edias m ´oveis univariados sazonal (SARIMA) e STARMA: analisar algumas propriedades, nomeadamente (a) condic¸ ˜oes para a exist ˆencia de uma soluc¸ ˜ao estacion ´aria, (b) caracterizac¸ ˜ao da estrutura de mentos (estrutura de segunda ordem), (c) m ´etodos de identificac¸ ˜ao para a selec¸ ˜ao de um mo-delo SARIMA / STARMA, (d) estimac¸ ˜ao, e finalmente, (e) avaliac¸ ˜ao do diagn ´ostico (qualidade estat´ıstica do modelo e qualidade do ajustamento);

• Aplicac¸ ˜ao a um caso de estudo - caracterizac¸ ˜ao da estrutura de depend ˆencia espac¸o-temporal das s ´eries temporais de radioatividade no ambiente em oito cidades portuguesas, atrav ´es de modelos STARMA;

• Resultados - discuss ˜ao os resultados obtidos;

• Considerac¸ ˜oes finais - considerac¸ ˜oes finais e sugest ˜ao de trabalhos futuros. Esta dissertac¸ ˜ao foi organizada e dividida nos seguintes cap´ıtulos:

• Introduc¸ ˜ao - apresenta-se a dissertac¸ ˜ao, o contexto em que se insere o caso de estudo, a meto-dologia e a estrutura do trabalho;

• Revis ˜ao Bibliogr ´afica - realc¸a-se toda a literatura relevante a realizac¸ ˜ao da dissertac¸ ˜ao, particu-larmente para sobre modelos espac¸o temporais;

• Modelos e M ´etodos - aborda-se os conceitos te ´oricos que servem de suporte para entender a estrutura de s ´eries temporais univaridas e s ´eries espac¸o-temporais, bem como as metodologias e t ´ecnicas que ser ˜ao aplicadas para modelar os dados no caso de estudo;

• Aplicac¸ ˜oes das metodologias propostas a um caso pr ´atico - aplica-se as metodologias do cap´ıtulo anterior `as s ´eries temporais da radioatividade;

• Conclus ˜ao - Retira-se as conclus ˜oes e limitac¸ ˜oes do estudo realizado e deixa-se sugest ˜oes para trabalhos futuros.

(24)
(25)

Cap´ıtulo 2

Revis ˜ao Bibliogr ´afica

A necessidade de estudar fen ´omenos com depend ˆencia temporal impulsionou o desenvolvimento de modelos temporais. Esta preocupac¸ ˜ao surgiu h ´a muitos anos atr ´as, sendo preciso recuar sensivelmente at ´e 1920 para encontrar os primeiros estudos sobre modelos temporais. Primeiro surgiram os modelos AR, MA e ARIMA. As aplicac¸ ˜oes destes modelos a casos pr ´aticos t ˆem surgido nas mais diversas ´areas, apresentando resultados muito satisfat ´orios na maioria dos casos.

Cerca de 60 anos mais tarde, surgiram os primeiro modelos espac¸o-temporais: modelos que estu-dam v ´arias s ´eries de dados hist ´oricos em simult ˆaneo e que apresentam depend ˆencia espacial. Desde ent ˜ao, os modelos da fam´ılia STARMA, comec¸aram a ser aplicados em ´areas como Biologia, Econo-mia, Telecomunicac¸ ˜oes etc. O n ´umero de aplicac¸ ˜oes tem sido significativo, apesar de que durante os anos 90, houve uma escassez no que toca a literatura publicada, possivelmente devido ao grande peso computacional destes modelos. Por volta de 2004, surgiram rotinas computacionais que incenti-varam os autores a publicar trabalhos nesta ´area. Desde ent ˜ao, o n ´umero de aplicac¸ ˜ao t ˆem aumentado significativamente, n ˜ao s ´o pelas rotinas computacionais criadas mas principalmente pela utilidade e caracter´ısticas dos modelos STARMA.

O presenta cap´ıtulo est ´a organizado da seguinte forma:

• Aplicac¸ ˜oes dos modelos temporais SARIMA - ´e apresentada alguma literatura de aplicac¸ ˜oes a medidas radioativas, usando os m ´etodos SARIMA;

• Aplicac¸ ˜oes dos modelos STARMA - ´E apresentada toda a literatura encontrada, dos conceitos te ´oricos dos modelos STARMA, bem como a sua aplicac¸ ˜ao a casos pr ´aticos.

2.1

Aplicac¸ ˜

oes dos modelos SARIMA e espac¸o-temporais STARMA

Os modelos da fam´ılia SARIMA s ˜ao os mais populares para modelar s ´eries espac¸o-temporais. Costumam ser muito eficazes em quase todas as ´areas, visto que conseguem estudar variabilidades temporais e fazer previs ˜oes relativamente precisas.

Os modelo SARIMA s ˜ao usadas frequentemente em muitos contextos distintos, pelo que seria de-masiado exaustivo apresentar todos esses trabalhos nesta dissertac¸ ˜ao. Contudo, apresenta-se alguns

(26)

trabalhos realizados no ˆambito da radioatividade em 2018:

• Barbosa et al. (2018) estudaram a exist ˆencia de poss´ıveis sinais que poder ˜ao antever terramo-tos. Para tentar explicar este fen ´omeno utilizaram tr ˆes s ´eries temporais: uma de radiac¸ ˜ao gama, intensidade da precipitac¸ ˜ao e de humidade nos solos. O estudo concluiu que tanto as grandes variac¸ ˜oes na emiss ˜ao de radiac¸ ˜ao gama como os percursores de terramotos, s ˜ao explicadas por uma grande variac¸ ˜ao na humidade dos solos;

• Kalo et al. (2018) usaram a t ´ecnica Radioactive Particle Tracking (RPT), para estudar o compor-tamento de um flu´ıdo quando escoado atrav ´es de dois tipos de cam ˆaras: uma cil´ındrica e outra c ´onica. Neste estudo o RPT foi feito pela an ´alise de s ´eries temporais e ajudaram no c ´alculo do expoente de Hurst e de coeficiente de correlac¸ ˜ao;

• Bianchi et al. (2018) estudaram as evoluc¸ ˜oes dos n ´ucleos de Ber´ılio e X ´enon na atmosfera sob diferentes caracter´ısticas f´ısicas e qu´ımicas. O estudo foi feito atrav ´es da modelac¸ ˜ao temporal das concentrac¸ ˜oes dos dois elementos qu´ımicos, e identificaram-se com sucessos alguns par ˆametros meteorol ´ogicos significativos nas s ´eries temporais obtidas.

Apesar de modelos temporais terem demostrado ao longo do tempo a sua utilidade em an ´alise es-tat´ıstica, os modelos espac¸o-temporais tem vindo a ganhar algum protagonismo. Para al ´em de estuda-rem depend ˆencias temporais, conseguem modelar v ´arias s ´eries temporais espacialmente localizadas. As aplicac¸ ˜oes t ˆem sido nas mais diversas ´areas, como por exemplo, economia, ambiente, planeamento de distribuic¸ ˜ao de eletricidade, previs ˜ao de n ´umeros de assaltos etc. Apesar de haverem aplicac¸ ˜oes em ´areas muito diferentes, os resultados costumam ser bastante aceit ´aveis.

Martin and Oeppen (1975), foram os primeiros a abordar modelos espac¸o-temporais. Criaram roti-nas para a construc¸ ˜ao de um modelo atrav ´es das correlac¸ ˜oes espac¸o-temporais e verificaram que um modelo poderia ser bem constru´ıdo pela observac¸ ˜ao dessas mesmas correlac¸ ˜oes. Nesta fase ainda n ˜ao havia estudos sobre a modelac¸ ˜ao STARMA, pelo que foi um grande avanc¸o na altura, visto que anos mais tarde Pfeifer e Deutsch desenvolveram metodologias muito concretas e mais f ´aceis de utilizar.

Na d ´ecada de 80, Pfeifer and Deutsch foram provavelmente os ´unicos a fazer investigac¸ ˜ao sobre a teoria dos modelos STARMA, e deram avanc¸os significativos neste ˆambito com pr ´aticas ainda usadas nos dias de hoje, dos quais se destacam:

• Pfeifer and Deutsch (1980a) descreveram detalhadamente um processo iterativo de etapas a se-guir para a modelac¸ ˜ao espac¸o-temporal. A descric¸ ˜ao consistia em tr ˆes etapas: identificac¸ ˜ao de modelos candidatos, estimac¸ ˜ao dos seus par ˆametros e diagn ´ostico. Os autores aplicaram a me-todologia a v ´arias s ´eries de n ´umero de condenados por assalto em alguns distritos a nordeste de Boston, EUA;

• Tamb ´em Pfeifer and Deutsch (1980b) propuseram uma metodologia alternativa para se cons-truirem as matrizes de vizinhanc¸a, e interpretaram um modelo espac¸o-temporal de primeira or-dem. Estudaram em detalhe as caracter´ısticas te ´oricas das func¸ ˜oes de autocorrelac¸ ˜ao e de

(27)

autocorrelac¸ ˜ao parcial para identificar poss´ıveis candidatos a modelar uma sequ ˆencia de dados hist ´oricos. Simularam tamb ´em dois casos particulares: um STAR(1) e um STMA(1);

• Pfeifer and Deutsch (1981a) estudaram a independ ˆencia temporal dos res´ıduos no modelos STARMA. Este estudo ´e fundamental no diagn ´ostico de um modelo e faz-se atrav ´es do c ´alculo das auto-correlac¸ ˜oes amostrais espac¸o-temporais. Ao longo de texto, a metodologia ´e explicada sob a condic¸ ˜ao de que os res´ıduos s ˜ao independentes e identicamente distribu´ıdos, com m ´edia zero e com matriz de covari ˆancia igual a INNo artigo n ˜ao h ´a nenhuma aplicac¸ ˜ao a nenhum caso

pr ´atico;

• Pfeifer and Deutsch (1981b) apresentaram modelos STARMA com matrizes de covari ˆancias dife-rentes do habitual. Os autores propuseram que a matriz de covari ˆancias fosse 6= σ2I

N (onde σ2

´e o desvio padr ˜ao e IN ´e matriz identidade de dimens ˜ao N × N ) e desenvolveram uma novo

pro-cesso de identificac¸ ˜ao, estimac¸ ˜ao e diagn ´ostico, aplicando os novos conceitos a dois exemplos: no controlo do n´ıvel da ´agua do rio Mohawk em v ´arias localizac¸ ˜oes e no n ´umero de detidos por assaltos em v ´arias regi ˜oes a nordeste de Boston;

• Para dados que apresentam padr ˜oes sazonais, Pfeifer and Deutsch (1981c) propuseram adicio-nar uma componente sazonal `a metodologia STARMA j ´a conhecida. O processo ´e quase id ˆentico ao descrito por Pfeifer and Deutsch (1980), mas aqui tenta-se modelar a parte sazonal separada-mente, chegando at ´e a fazer-se diferenciac¸ ˜oes sazonais. Neste artigo a metodologia foi aplicada ao estudo de descargas de ´agua em v ´arios locais ao longo do rio Mississipi.

Depois de Pfeifer e Deutsch terem proposto uma metodologia adequada para modelar s ´eries espac¸o-temporais, v ´arios foram os autores que a usaram em aplicac¸ ˜oes muito diversificadas:

• Pace et al. (2000), por exemplo, estudaram prec¸os de im ´oveis comparando diferentes mode-los: modelo autoregressivo espac¸o-temporal, v ´arios modelos autoregressivos univariados e a re-gress ˜ao linear tradicional. Os resultados foram substancialmente melhores com o modelo STAR tendo em conta a soma dos quadrados dos erros. Nas previs ˜oes os resultados tamb ´em foram melhores com o STAR;

• Giacomini and Granger (2004) usaram modelos espac¸o-temporais para prever dados econ ´omicos. Compararam v ´arios m ´etodos de previs ˜ao, e verificaram a relev ˆancia da componente espac¸o-temporal. Mais uma vez esta componente mostrou-se importante: mesmo quando a compo-nente espacial parecia pouco significativa, quando removida do modelos, os resultados n ˜ao foram aceit ´aveis;

• Rao and Antunes (2004) fizeram uma aplicac¸ ˜ao a dados de temperaturas em nove locais no Reino Unido. Reviram alguns conceitos e aplicaram uma modelac¸ ˜ao STARMA. Os autores fizeram tamb ´em previs ˜oes e comparam-nas com previs ˜oes obtidas a partir de modelos ARMA univariados. Os resultados foram de certa forma similares nos dois casos, apesar de se com o STARMA se utilizar apenas um modelo;

(28)

• Tamb ´em em 2004, as correlac¸ ˜oes espac¸o-temporais dos modelos STARMA, foram muito ´uteis em Medicina. Soni et al (2004) estudaram a atividade cerebral pelo campo magn ´etico criado pelo pr ´oprio c ´erebro. Foi criado um modelo STARMA para os sinais da corrente el ´etrica consoante a zona do c ´erebro, e verificou-se alguns padr ˜oes inesperados nas diferentes zonas cerebrais. Os m ´etodos STARMA permitiram controlar e explicar as diferenc¸as dos sinais emitidas pelo c ´erebro, associando-as `as diferentes zonas do c ´erebro;

• Numa tentativa de evitar tr ´afego excessivo e de baixa qualidade em redes sem fios (wireless), Zhour and Mitchell (2005) utilizaram um modelo STARMA para modelar redes wireless. Modelou-se v ´arios tipos de rede, e os modelos STARMA foram ´uteis para controlar o tr ´afego dos dados e para prever a procura. Este estudo de 2005 mostrou mais uma aplicac¸ ˜ao da modelac¸ ˜ao espac¸o-temporal, onde se provou uma vez mais a relev ˆancia das correlac¸ ˜oes espac¸o-temporais;

• Kamarianakis and Prastacos (2016) estudaram o fluxo de tr ˆansito em algumas estradas nos ar-redores de Atenas. Aplicaram modelos STARMA e os resultados obtidos foram os desejados. A componente espacial foi determinante, confirmando a intuic¸ ˜ao de que o tr ˆansito numa determi-nada estrada depende do tr ˆansito circundante;

• Sartoris (2007) descreveu um modelo espac¸o-temporal em que descreveu o n ´umero de crimes em S ˜ao Paulo nos diferentes bairro da cidade com o intuito de verificar algumas correlac¸ ˜oes no n ´umero de assaltos entre os bairros em quest ˜ao;

• Cheng et al. (2008) estudaram temperaturas na China recolhidas em 137 estac¸ ˜oes meteo-rol ´ogicas entre 1951 e 2002. Visto que os dados n ˜ao apresentam tend ˆencias estacion ´arias, os autores optarem por uma estrat ´egia diferente do habitual. Primeiro utilizaram o artificial neural network (ANN) para desenvolver um modelo n ˜ao param ´etrico para retirar estruturas n ˜ao lineares, e depois usaram os m ´etodos STARMA. Este m ´etodo combinado mostrou melhores resultados nas previs ˜oes do que os STARMA convencionais e deixou em abertos para outros autores testarem este ”novo” m ´etodo;

• Glasbey and Allcroft (2008) descreveram uma aplicac¸ ˜ao dos modelos STARMA na ´area energ ´etica, mais concretamente, no estudo do potencial de energia solar numa regi ˜ao a sul de Edimburgo. Foi constru´ıdo um modelo espac¸o-temporal para estudar a variabilidade da energia solar retirada dos pain ´eis fotovoltaicos. Apesar de as localizac¸ ˜oes serem relativamente pr ´oximas umas das outras, o modelo adequou-se bem aos dados;

• Epperson (2010) modelou dados gen ´eticos de uma populac¸ ˜ao atrav ´es de um modelo STARMA. Atrav ´es dos exemplos estudados verificou-se que os modelos espac¸o-temporais conseguiram ca-racterizar de forma adequada os processos gen ´eticos. As correlac¸ ˜oes espac¸o-temporais mostram-se importantes visto que permitiram calcular taxas d migrac¸ ˜ao, ajustar modelos e fazer previs ˜oes para a gen ´etica de futuras populac¸ ˜oes;

• Lee et al. (2010) descreveram um modelo STARMA para o n ´umero de corvos mortos devido a uma epidemia no Nilo Ocidental. O modelo foi muito ´util pois conseguiu estimar a taxa de propagac¸ ˜ao

(29)

do v´ırus em quest ˜ao. Mais uma vez um modelo STARMA foi eficaz, neste caso na medicina. Serviu para ajudar a caracterizar uma doenc¸a infecciosa;

• Huang et al. (2010), usaram uma t ´ecnica RBF (A Radial Basis Function (RDF) ´e uma t ´ecnica usada para remover tend ˆencias espac¸o-temporais n ˜ao sazonais), para depois utilizarem um mo-delo STARMA para descrever as variac¸ ˜oes espac¸o-temporais. Neste artigo estudou-se o fluxo di ´ario de embarcac¸ ˜oes em 23 locais diferentes. Estes modelos foram comparados aos modelos STARMA tradicionais e foi obtida uma melhor performance;

• Hu et al. (2011) estudaram a detec¸ ˜ao de fissuras em estruturas de placas recorrendo aos modelos STARMA. O modelo usado foi criado atrav ´es das vibrac¸ ˜oes em diferentes zonas da placa. Atrav ´es das vibrac¸ ˜oes numa determinada zona, o modelo foi capaz de prever fissuras noutros locais, o que ´e particularmente ´util para localizar poss´ıveis danos. neste estudo os erros das previs ˜oes foram usados para avaliar a qualidade do modelo, comparando os erros reais com os esperados; • Mercieca and Kadirkamanathan (2016) enfatizaram a vasta aplicabilidade dos modelos espac¸o-temporais entre os quais os modelos autoregressivos e de m ´edias m ´oveis. Aplicaram-nos em tr ˆes ´areas diferentes: engenharia, sa ´ude e em ci ˆencias sociais;

• Andre et al. (2016) utilizaram um STAR para descrever a radiac¸ ˜ao solar recebida em tr ˆes locais distintos na ilha de Guadalupe no Mar das Cara´ıbas. Este modelo originou melhores previs ˜oes no curto prazo quando comparado com outros modelos.

No caso particular desta dissertac¸ ˜ao, verificou-se que nunca foram utilizados modelos da fam´ılia STARMA para modelar medidas de radioatividade, pelo que se ir ´a verificar se os modelos se adequam a este tipo de dados.

(30)
(31)

Cap´ıtulo 3

Modelos e M ´etodos

Neste cap´ıtulo s ˜ao introduzidos os conceitos b ´asicos de s ´eries temporais a utilizar posteriormente na aplicac¸ ˜ao ao caso pr ´atico em estudo. As s ´eries temporais s ˜ao colec¸ ˜oes de dados ordenados no tempo, e o seu ponto de interesse ´e analisar e modelar as depend ˆencias temporais entre essas observac¸ ˜oes.

Para se ajustar um modelo a uma s ´erie temporal, torna-se necess ´ario proceder-se primeiro `a estacionarizac¸ ˜ao da mesma atrav ´es de transformac¸ ˜oes de modo a estabilizar a vari ˆancia , a neutra-lizar a tend ˆencia e a eliminar movimentos sazonais.

Os conceitos explicados anteriormente v ˜ao ser abordados ao longo deste cap´ıtulo, estando este dividido em duas partes: a primeira onde se explicar ´a a estrutura e os v ´arios tipos de modelos SARIMA bem como a sua extens ˜ao para a modelac¸ ˜ao espac¸o-temporal STARMA. E a segunda parte, em que ser ˜ao descritos os m ´etodos necess ´arios para ajustar um modelo temporal a um conjunto de dados. Esta metodologia foi proposta por Box-Jenkins e consiste nas seguintes etapas:

• Identificac¸ ˜ao dos modelos candidatos atrav ´es das func¸ ˜oes de autocorrelac¸ ˜ao e autocorrelac¸ ˜ao parcial;

• Estimac¸ ˜ao dos par ˆametros atrav ´es de m ´etodos de estimac¸ ˜ao adequados;

• Diagn ´ostico e validac¸ ˜ao do modelo atrav ´es da an ´alise dos res´ıduos;

• Previs ˜ao (se o modelo selecionado for adequado).

Na modelac¸ ˜ao espacial usou-se uma extens ˜ao da metodologia de Box-Jenkins proposta por Pfeifer e Deutsch (1980) que engloba uma componente espac¸o-temporal. Esta componente incorpora n ˜ao s ´o depend ˆencias temporais entre as observac¸ ˜oes, como tamb ´em depend ˆencias espaciais entre elas em cada instante. O ciclo iterativo de Box-Jenkins tamb ´em se aplica nesse caso, mas com algumas variac¸ ˜oes.

(32)

3.1

Modelos SARIMA

3.1.1

Modelo Autorregressivo de ordem p

Os modelos autorregressivos de ordem p (AR(p)) s ˜ao um dos modelos da fam´ılia SARIMA. Nes-tes modelos, Xt ´e obtido como func¸ ˜ao de Xt−1, Xt−2, ..., Xt−p, onde p ´e o n ´umero de desfasamento

necess ´arios para descrever o Xt. Assim, um modelo Autorregressivo de ordem p define-se como

Xt= α1Xt−1+ α2Xt−2+ ... + αpXt−p+ t,

onde t´e um processo aleat ´orio, com m ´edia zero e vari ˆancia σ2, e α1, α2, ..., αps ˜ao constantes (αp6= 0).

Um modelo AR(p) tamb ´em pode ser representado a partir do operador atraso B como:

(1 − α1B − α2B2− ... − αpBp)Xt= t,

ou ent ˜ao

φ(B)Xt= t,

Para garantir que os valores atuais n ˜ao dependem de valores futuros, ´e necess ´ario verificar a causali-dade do modelo. Um modelo AR(p) diz-se causal se

• φ(B) 6= 0 para | B | ≤ 1.

3.1.2

Modelo de M ´edias M ´

oveis de ordem q

Como os AR(p), tamb ´em os modelos de M ´edias M ´oveis de ordem q (MA(q)) s ˜ao modelos com depend ˆencias temporais. Neste caso, o valor atual depende dos q valores passados t−1, t−2, ..., t−q.

Assim, um modelo de M ´edias M ´oveis de ordem q define-se como

Xt= β1t−1+ β2t−2+ ... + βqt−q+ t,

onde t ´e um processo aleat ´orio, com m ´edia zero e vari ˆancia σ2. β1, β2, ..., βps ˜ao constantes (βp 6= 0).

Um modelo MA(q) tamb ´em pode ser representado com um operador retardado B como:

Xt= (1 + β1B + β2B2+ ... + βqBq)t,

ou ent ˜ao

Xt= θ(B)t.

Para garantir que os valores atuais n ˜ao dependem de valores futuros, ´e necess ´ario verificar a invertibi-lidade do modelo. Torna-se assim intuitivo que esta propriedade ´e indispens ´avel para fazer previs ˜oes. Um modelo MA(q) diz-se causal se

(33)

3.1.3

Modelo Autorregressivo e de M ´edia M ´

oveis (p,q)

Depois de apresentados os modelos Autorregressivos e de M ´edias M ´oveis, surge um modelo que combina os dois anteriores: ARMA (p,q). Este modelo tem o nome de Autorregressivo e de M ´edias M ´oveis e incorpora todas as caracter´ısticas dos modelos AR e MA. Assim um modelo ARMA(p,q) define-se como:

Xt= α1Xt−1+ α2Xt−2+ ... + αpXt−p+ β1t−1+ β2t−2+ ... + βqt−q+ t,

em que t segue distribuic¸ ˜ao normal com m ´edia zero e vari ˆancia constante igual a σ2. Usando o

operador retardado B, (3.1.3) escreve-se como

(1 − α1B − α2B2− ... − αpBp)Xt= (1 + β1B + β2B2+ ... + βqBq)t,

ou ent ˜ao

φ(B)Xt= θ(B)t.

Um modelo ARMA (p,q) tem de obrigatoriamente verificar a causalidade da componente autorregressiva e a a invertiblidade da componente de m ´edias m ´oveis, ou seja:

• φ(B) 6= 0 para | B | ≤ 1,

• θ(B) 6= 0 para | B | ≤ 1.

3.1.4

Modelo Autorregressivo e de M ´edias M ´

oveis integrado (p,d,q)

At ´e agora s ´o foram apresentados processos capazes de modelar s ´eries temporais em redor de uma m ´edia constante. No entanto, na maioria das aplicac¸ ˜oes pr ´aticas destes modelos, esta condic¸ ˜ao n ˜ao se verifica. A n ˜ao estacionariedade dos modelos justifica assim um ajuste, por exemplo, a remoc¸ ˜ao de poss´ıveis tend ˆencias. Uma pr ´atica comum, ´e diferenciar a s ´erie pela d- ´esima diferenc¸a, para que a sejam removidas todas as componentes n ˜ao estacion ´arias. Assim o modelo autorregressivo integrado e de m ´edias m ´oveis integrado (ARIMA) escreve-se como:

∇dX

t= (1 − B)dXt,

com d = [0, s] em que s ´e a sazonalidade s ´erie ou,

∇dX

t= α1∇dXt−1+ α2∇dXt−2+ ... + αp∇dXt−p+ β1t−1+ β2t−2+ ... + βqt−q+ t.

Utilizando o operador retardo B, o modelo ARIMA tamb ´em pode ser representado como:

(34)

3.1.5

Modelo Autorregressivo e de M ´edias M ´

oveis Integrado Sazonal

Por fim, combinando todas as subclasses apresentadas anteriormente, com uma componente de sazonalidade associada, obt ˆem-se o modelo autorregresivo e de m ´edia m ´oveis integrado sazonal. Para o melhor explicar comece-se por recordar o modelo autorregresivo e m ´edias m ´oveis (ARMA) de ordem pe q respetivamente

Xt= α1Xt−1+ α2Xt−2+ ... + αpXt−p+ β1t−1+ β2t−2+ ... + βqt−q+ t,

em que tsegue uma distribuic¸ ˜ao normal com m ´edia zero e vari ˆancia constante igual a σ2. Usando

o operador retardado B, (3.1.3) escreve-se como

(1 − α1B − α2B2− ... − αpBp)Xt= (1 + β1B − β2B2− ... − βqBq)t,

ou ent ˜ao

φ(B)Xt= θ(B)t.

Para o modelo ser estacion ´ario as condic¸ ˜oes de causalidade e invertibilidade t ˆem de ser cumpridas, ou seja:

• causalidade verifica-se se e s ´o se φ(B) 6= 0 para | B | ≤ 1, • invertibilidade verifica-se se e s ´o se θ(B) 6= 0 para | B | ≤ 1.

Normalmente, uma s ´erie temporal n ˜ao ´e estacion ´aria e apresenta uma tend ˆencia. Assim para a modelar ´e preciso remover essa tend ˆencia para tornar a s ´erie estacion ´aria. Para tal recorre-se a uma diferenciac¸ ˜ao da s ´erie na forma

∇dX

t= (1 − B)dXt,

onde ∇d ´e a d- ´esima diferenc¸a. Fica-se ent ˜ao com um modelo ARIMA (p,d,q) na forma

φ(B)(1 − B)dXt= θ(B)t.

Para al ´em de tend ˆencias, muitas s ´erias apresentam tamb ´em componentes sazonais. Nestes casos, a primeira diferenc¸a (∇1= X

t− Xt−1) n ˜ao chega para tornar a s ´erie estacion ´aria. Ent ˜ao define-se um

per´ıodo sazonal s, no nosso particular da dissertac¸ ˜ao recolheram-se medidas di ´arias de radioatividade ao longo de 10 anos, ent ˜ao a D diferenc¸a para o per´ıodos sazonal S ´e:

∇D

SXt= Xt− Xt−S.

Com esta diferenciac¸ ˜ao sazonal, obtem-se um modelo sazonal ARIMA, vulgarmente chamado SARIMA. Os modelos SARIMA modelam assim a parte sazonal de uma s ´erie e a parte n ˜ao sazonal, tendo coeficientes pr ´oprios associados a cada uma das partes. Representam-se como

φ(B)Φ(Bs)∇d∇D

(35)

onde • φ(B) = 1 − α1B − · · · − αpBp, • Φ(BS) = 1 − Φ 1BS− · · · − ΦpBpS, • θ(B) = 1 + β1B + · · · + βpBp, • Θ(BS) = 1 + θ 1BS+ · · · + θpBpS.

Nos cap´ıtulos seguintes, ser ´a adotada a seguintes notac¸ ˜ao para um modelo SARIMA:

SARIM A (p,d,q) × (P,D,Q)S,

onde

• p ´e a ordem autorregressiva da parte n ˜ao sazonal; • d ´e o n ´umero de diferenc¸as n ˜ao sazonais;

• q ´e a ordem de m ´edias m ´oveis da parte n ˜ao sazonal; • P ´e a ordem autorregressiva da parte sazonal; • D ´e o n ´umero de diferenc¸as sazonais;

• Q ´e a ordem de m ´edias m ´oveis da parte sazonal; • S ´e a sazonalidade da s ´erie.

(36)

3.2

Metodologia de Box-Jenkins para modelos SARIMA

3.2.1

Identificac¸ ˜ao

Na maioria das aplicac¸ ˜oes, as s ´eries temporais apresentam tend ˆencia e/ou sazonalidade. Assim para a estabilizac¸ ˜ao da s ´erie, pode ser necess ´ario diferenciar a parte sazonal e a n ˜ao sazonal. A decis ˜ao de se diferenciar a s ´erie deve ser feita atrav ´es da observac¸ ˜ao de um plot dos dados originais. Um caminho alternativo ´e estudar os res´ıduos da s ´erie original (Xt), fazendo uma decomposic¸ ˜ao da

s ´erie na forma aditiva:

Xt= Tt+ St+ Zt,

onde

• Xts ˜ao os dados originais;

• Tt ´e a componente tend ˆencia;

• St ´e a componente sazonal;

• Zt ´e a componente aleat ´oria.

Depois de ultrapassada a etapa anterior, passa-se a identificac¸ ˜ao das ordem autorregressivas e de m ´edias m ´oveis. Teoricamente estas ordens s ˜ao identificas pela func¸ ˜ao de autocorrelac¸ ˜ao parcial (PACF) e pela func¸ ˜ao de autocorrelac¸ ˜ao (ACF).

Na tabela 3.1 est ˜ao sumarizadas as caracter´ısticas te ´oricas de alguns modelos. De notar que muitas vezes as caracter´ısticas te ´oricas de ACF e PACF n ˜ao condizem com o ”melhor” modelo para os dados.

Processo Func¸ ˜ao de autocorrelac¸ ˜ao Func¸ ˜ao de autocorrelac¸ ˜ao parcial

AR(p) cai exponencialmente cai exponencialmente a partir do desfasamento p

MA(q) cai exponencialmente a partir do desfasamento q cai exponencialmente

ARMA(p,q) cai exponencialmente a partir do desfasamento q cai exponencialmente a partir do desfasamento p

Tabela 3.1: Caracter´ısticas te ´oricas das func¸ ˜oes de autocorrelac¸ ˜ao e parcial para modelos AR, MA e ARMA.

3.2.2

Estimac¸ ˜ao

Depois da identificar um candidato ao modelo final, o passo seguinte ´e estimar os seus par ˆametros. Existem tr ˆes m ´etodos para a estimac¸ ˜ao: o m ´etodo dos momentos, m´ınimos quadrados e m ´axima verosimilhanc¸a. O m ´etodo que origina melhores estimativas ´e o m ´etodo da m ´axima verosimilhanc¸a, assim sendo ser ´a o m ´etodo abordado neste secc¸ ˜ao.

Considere-se um modelo ARMA (p, d, q), com p + q + 1 par ˆametros a estimar, onde ξ := (φ, θ, σ2 )

(37)

Como ´e habitual, nos estimadores de m ´axima verosimilhanc¸a (EMV), ´e preciso assumir que as inovac¸ ˜oes t ˆem distribuic¸ ˜ao normal com m ´edia igual a zero e desvio padr ˜ao constante (σ2) em que as

inovac¸ ˜oes s ˜ao dadas pela express ˜ao

t= Xt− φ1Xt−1− φpXt−p+ θ1Xt−1+ θqXt−q,

sendo a func¸ ˜ao densidade conjunta das inovac¸ ˜oes ´e

f (1, ..., n) = (2π)−n/2(σ2) exp ( − 1 2σ2  n X t=1 2t ) .

Para calcular a express ˜ao anterior, ´e preciso encontrar estimativas iniciais para os X0s e 0s.

Es-tes valores s ˜ao desconhecidos, mas poder ˜ao ser calculados para cada conjunto de dados dado os par ˆametros ((φ, θ)). Desta feita a func¸ ˜ao de M ´axima Verosimilhanc¸a Condicional ´e dada por

L(ξ | X∗, ∗) = (2π)−n/2(σ2) exp ( − 1 2σ2  n X t=1 2t ) .

para uma determinada escolha de (X∗, ∗). Se for aplicada a transformac¸ ˜ao logar´ıtmica obt ˆem-se

log  L(ξ | X∗, ∗)  ∝ −nlog(σ) − S∗(η | X, ) 2σ2  , onde S∗(η | Z, ) := n X t=1 2t, (3.1)

´e a soma condicional dos quadrados dos erros. Assim, o EMV Condicional dos par ˆametros ser ´a encon-trado pela minimizac¸ ˜ao da equac¸ ˜ao 3.1.

3.2.3

Diagn ´

ostico

Depois de estimar os par ˆametro do modelo, ´e preciso verificar se o modelo descreve e se ajusta corretamente aos dados em estudo.

A maneira mais eficaz de fazer um diagn ´ostico ao modelo ´e avaliar os res´ıduos. ´E importante que os erros se distribuam com m ´edia igual a zero, vari ˆancia constante e que n ˜ao sejam correlacionados entre si. Uma an ´alise completa aos res´ıduos pode ser dividida em tr ˆes partes:

• observac¸ ˜ao do plot dos res´ıduos - verifica-se se os res´ıduos est ˜ao distribu´ıdos em torno do valor zero;

• observac¸ ˜ao da ACF dos res´ıduos - verificar se a ACF n ˜ao tem um correlac¸ ˜oes maiores que os valores refer ˆencia para uma desfasagem relativamente pr ´oxima;

(38)

• Teste de Ljung-Box para testar as autocorrelac¸ ˜oes dos res´ıduos atrav ´es da estat´ıstica de teste: Q = T (T + 2) K X j=1 r2j T − j,

em que K ´e o n ´umero de desfasamentos a serem testados, rk ´e a autocorrelac¸ ˜ao do res´ıduo k,

sob a hip ´otese nula de os dados distribu´ıdos de forma independente. A estat´ıstica tem aproxima-damente uma distribuic¸ ˜ao chi-quadrado com K − p − q graus de liberdade.

Na eventualidade de termos v ´arios modelos candidatos que verifiquem as suposic¸ ˜oes acima menci-onadas, podemos classificar os modelos tendo em conta a qualidade dos ajustamentos e a inclus ˜ao de par ˆametros. Os crit ´erios escolhidos para escolher o ”melhor” modelo ser ˜ao o BIC, AIC e AICc. o BIC ´e calculado atrav ´es da formula:

BIC = −2ln(σb2) + b Tln(T ), onde

bσ2 ´e a vari ˆancia dos res´ıduos;

• b ´e o n ´umero de par ˆametros do modelo; • T ´e o n ´umero de observac¸ ˜oes da s ´erie. O AIC ´e calculado atrav ´es da formula:

AIC = −2ln(bσ2) +T + 2b T , onde

bσ2 ´e a vari ˆancia dos res´ıduos;

• b ´e o n ´umero de par ˆametros do modelo; • T ´e o n ´umero de observac¸ ˜oes da s ´erie. O AICc ´e calculado atrav ´es da formula:

AIC = −2ln(bσ2) + T + b T − b + 2, onde

bσ2 ´e a vari ˆancia dos res´ıduos;

• b ´e o n ´umero de par ˆametros do modelo; • T ´e o n ´umero de observac¸ ˜oes da s ´erie.

(39)

3.2.4

Previs ˜ao

Uma das finalidade em se ajustar um modelo a uma s ´erie temporal, ´e a previs ˜ao de observac¸ ˜oes fu-turas com base nas observac¸ ˜oes recolhidas at ´e ao presente. Para prever o comportamento da s ´erie no futuro, assume-se que Xt´e estacion ´ario e que os par ˆametros do modelo s ˜ao iguais `as suas estimativas.

Assim, a previs ˜ao para m passos `a frente ser ´a dada por:

Xt+m= φ1Xt+m−1+ φ2Xt+m−2+ · · · + φp+mXt+h−p− θ1t+m−1− θ2t+m−2− · · · − φt+mt+m−q+ t+m,

A previs ˜ao ´e feita com base nas estimativas dos par ˆametros e nos valores observados em instantes < t e pressup ˆoe que os termos t+m= 0para m > 0. Ent ˜ao, a previs ˜ao pode ser reescrita da forma:

Xt+m= E(Xt+m|Xt).

De modo a avaliar um determinado modelo de previs ˜ao, ´e necess ´ario encontrar um indicador que mec¸a se a qualidade da predic¸ ˜ao. O Erro Quadr ´atico M ´edio (MSE – Mean Squared Error) ´e uma das medidas mais comuns e ser ´a a que se usar ´a nesta dissertac¸ ˜ao.

M SE = Pm t=1 2 t m onde m ´e o n ´umero de previs ˜oes.

(40)

3.3

Modelo STARMA

Os modelos STARMA s ˜ao utilizados para modelar dados de s ´eries temporais espacialmente locali-zados. As observac¸ ˜oes nos N locais s ˜ao s ´eries temporais com uma depend ˆencia espacial entre elas. Estes N locais podem ser cidades, pa´ıses etc...a ´unica restric¸ ˜ao ´e que estas localizac¸ ˜oes t ˆem de ser fixas.

Os modelos STARMA consistem na combinac¸ ˜ao de tr ˆes componentes: autorregressiva, m ´edias m ´oveis e espacial em N locais fixos. A depend ˆencia espacial entre os N locais est ´a incorporada no modelo atrav ´es das matrizes de ponderac¸ ˜ao baseadas nas ordens de vizinhanc¸a entre os locais. Estas matrizes s ˜ao determinadas a priori pelo construtor do modelo e devem refletir caracter´ısticas f´ısicas do modelo.

Assim, cada observac¸ ˜ao de uma das N s ´eries ´e uma combinac¸ ˜ao linear das suas observac¸ ˜oes passadas e das observac¸ ˜oes dos seus vizinhos.

A forma autorregressiva nos modelos espac¸o-temporais deve definir Xi

t (observac¸ ˜ao no instante t,

no local i), como uma combinac¸ ˜ao linear das observac¸ ˜oes passados no local i e dos seus vizinhos. Se isso se verificar para todos os N locais, diz-se que a s ´erie ´e estacion ´aria espacial.

3.3.1

Desfasagem espacial

Como em [21], antes de definir os modelos STARMA, defini-se primeiro o operador de desfasagem espacial: L(l). Seja L(l)o operador de desfasagem espacial de l- ´esima ordem tal que:

L(0)Xit= Xit, L(l)Xit= N X j=1 wij(l)Xjt,

onde os pesos w(l)ij satisfazem-se a equac¸ ˜ao:

N

X

j=1

w(l)ij = 1.

Para todos os valores de i e w(l)ij diferentes de zero, se os locais i e j s ˜ao vizinhos da l- ´esima ordem.

Na forma matricial, os pesos w(l)ij, podem ler-se na matrizW (l)

matriz quadrada N x N, onde a soma de todos os elementos por linha tem de ser um.

L(0)Xt=W(0)Xt=INXt,

e

L(l)Xt=W(l)Xt∀ l > 0,

(41)

modelo.

Em muitos casos, ´e assumido que a distribuic¸ ˜ao do espac¸o ´e uma malha regular. Na maioria das aplicac¸ ˜oes, esta ´e uma simplificac¸ ˜ao comum, visto que tipicamente os locais s ˜ao espac¸ados entre si de forma irregular.

Os pesos t ˆem de refletir uma hierarquia de ordem espacial dos vizinhos. A primeira ordem s ˜ao os locais mais pr ´oximos. A segunda ordem s ˜ao os locais mais longe que os de primeira ordem, mas mais pr ´oximos que os de terceira ordem, e assim sucessivamente. Neste caso, os elementos das matrizes dos pesos seriam:

w(l)i,j=      1 n(l)i i 6= j 0 i = j ,

onde n(l)i ´e o n ´umero de vizinhos da l- ´esima ordem de vizinhanc¸a.

No caso proposto por Pfeifer e Deutsch (1980a), na figura 3.1 conseguimos visualizar as quatro primeiras ordem de vizinha (W(1),W(2),W(3),W(4)) de um determinado local numa malha em duas di-mens ˜oes. Esta ordem espacial foi definida em termos da dist ˆancia euclidiana entre os locais de inte-resse.

Figura 3.1: Ordens espaciais de Pfeifer e Deustch, em duas e uma dimens ˜oes

Uma alternativa a criar uma hierarquia de vizinhanc¸a, ´e usar as dist ˆancias entre os locais, e con-siderar todos os vizinhos de primeira ordem. W(0) seria a matriz identidade, eW(1) a matriz como o inverso da dist ˆancia euclidiana entre os locais:

(42)

wij=      1 dij i 6= j 0 i = j ,

onde dij ´e a dist ˆancia euclidiana entre os locais i e j. Esta abordagem ´e particularmente ´util, porque

acredita-se a priori que se consegue incorporar todo o efeito espacial numa s ´o matriz.

Ainda h ´a uma terceira forma para definir a matriz de pesos atrav ´es da correlac¸ ˜ao entre os valores observados e a dist ˆancia entre os v ´arios locais em estudo. No caso de Haslett and Raftery (1989), os autores verificaram uma forte relac¸ ˜ao entre a velocidade do vento nos diferente locais e as dist ˆancia entre eles. Conclu´ıram assim que a covari ˆancia seria aproximada por:

cov(Xit, Xjt) = σ2rij, onde rij =      1 i = j α exp(−βdij) i 6= j ,

com 0 < α ≤ 1, 0 < β ≤ 1 e dij ´e a dist ˆancia entre i e j. Depois de estimar os par ˆametros α e β, j ´a

se pode utilizar esta estrutura para definir as mas matrizes de pesos dos modelos STARMA.

Esta abordagem tem uma vantagem em relac¸ ˜ao `as demais: consegue-se definir as matrizes de pesos atrav ´es dos dados, em vez de as definir a priori, com nos dois m ´etodos apresentados.

3.3.2

Caracterizac¸ ˜ao

Estamos agora em condic¸ ˜oes de definir o modelo. Seja Xi

tuma observac¸ ˜ao no local i (i=1,2,3....,N)

e no instante t (t ∈Z). Um modelo STARMA ´e dado pela seguinte equac¸ ˜ao:

Xt= − p X k=1 λk X l=0 φklW(l)Xt−k+ q X k=1 mk X l=0 θklW(l)t−k+ t, onde:

• Xt ´e a matriz com todas as observac¸ ˜oes, em que cada coluna i corresponde `a s ´erie do local i;

• p ´e a ordem autorregressiva; • q ´e a ordem de m ´edias m ´oveis;

• λk ´e a ordem espacial do k- ´esimo termo autorregresivo;

• mk ´e a ordem espacial do k- ´esimo termo das m ´edias m ´oveis;

• φkl ´e o par ˆametro autorregresivo do desfasamento temporal k e do desfasamento espacial l;

(43)

• W(l) ´e a matriz de pesos da ordem espacial l;

• ts ˜ao os erros aleat ´orios onde:

E[t] = 0, e E[t 0 t+s] =      σ2IN, s = 0 0, s 6= 0 .

Podemos verificar dois casos especiais da fam´ılia STARMA: • STAR - modelo apenas com a parte autorregressiva (q = 0).

Xt= − p X k=1 λk X l=0 φklW(l)Xt−k+ t,

• STMA - modelo apenas com a parte de m ´edias m ´oveis (p = 0).

Xt= q X k=1 mk X l=0 θklW(l)t−k+ t.

3.3.3

Condic¸ ˜

oes de estacionariedade

Para que um modelo STARMA possa representar processos estacion ´arios, ´e necess ´ario verificar algumas condic¸ ˜oes: o comportamento da func¸ ˜ao de autocorrelac¸ ˜ao de Xtao longo do tempo, e se o

modelo em quest ˜ao ´e causal e invert´ıvel. Assim para todo o y que resolva a

det ypIN + p X k=1 λk X l=0 φklW(l)yp−k ! = 0, (3.2)

equac¸ ˜ao (3.2), e se todas as soluc¸ ˜oes pertencerem ao c´ırculo unit ´ario (|y| < 1), diz-se que o pro-cesso ´e causal. Na pr ´atica, testa-se se um modelo ´e estacion ´ario para poss´ıveis valores de φkl.

Analogamente, se as soluc¸ ˜oes de (3.3) pertencerem tamb ´em ao c´ırculo unit ´ario, o processo diz-se invert´ıvel. det yqIN + q X k=1 mk X l=0 θklW(l)yq−k ! = 0. (3.3)

Esta propriedade implica que Xt possa ser uma combinac¸ ˜ao linear ponderada das observac¸ ˜oes

passadas, onde os pesos convergem para zero. N ˜ao fica dif´ıcil concluir que todos os modelos STAR s ˜ao invert´ıveis.

A definic¸ ˜ao dos modelos STARMA, implica tamb ´em que o processo seja estacion ´ario de segunda ordem quer no tempo, quer no espac¸o. Assim o valor esperado do processo tem de ser constante ao longo do tempo e a autocovari ˆancia ´e

(44)

covXit, Xjt+s= γ(h, s),

onde γ ´e a func¸ ˜ao de covari ˆancia espac¸o-temporal, em que h ´e a dist ˆancia entre duas localizac¸ ˜oes quaisquer, e s ´e o desfasamento temporal. Isto significa o processo s ´o ´e estacion ´ario de segunda ordem se a covari ˆancia n ˜ao depender das localizac¸ ˜oes espec´ıficas, mas apenas das dist ˆancias entre elas e do desfasamento temporal s.

A fam´ılia STARMA n ˜ao se restringe a modelar processos estacion ´arios. Se `a partida, a estacionari-edade n ˜ao se verificar, torna-se necess ´ario diferenciar a s ´erie, obtendo

∇dX t= p X k=1 λk X l=0 ∇dφ klWlXt−k− q X k=1 mk X l=0 θklWlt−k+ t,

Uma vez incorporada a parte sazonal (S = 365 no caso de observac¸ ˜oes mensais, S = 365 no caso de observac¸ ˜oes di ´arias, etc) obtemos um modelo STARMA sazonal

ΦP,Λ(BS)φP,Λ(B)∇DS∇ dX t= Θq,m(Bs)θq,m(B) + t, em que ΦP,Λ(BS) = IN − p X k=1 Λk X l=0 φlkWlBkS, ∇D S = (IN− BS)D, ΘQ,M= IN − Q X k=1 Mk X l=0 ΘkLWlBkS,

Ao longo da dissertac¸ ˜ao, e apresentando uma notac¸ ˜ao mais simples, o modelo STARMA sazonal, ser ´a representado na seguinte forma

ST ARM A(pλ, d , qm) × (PΛ, D , QM)S,

onde

• pΛ ´e a ordem autorregressiva da parte n ˜ao sazonal de ordem espacial Λ;

• d ´e o n ´umero de diferenc¸as n ˜ao sazonais;

• qM ´e a ordem de m ´edias m ´oveis da parte n ˜ao sazonal de ordem espacial M ;

• PΛ ´e a ordem autorregressiva da parte sazonal de ordem espacial Λ;

• D ´e o n ´umero de diferenc¸as sazonais;

(45)
(46)

3.4

Extens ˜ao da Metodologia de Box-Jenkins para modelos

STARMA

3.4.1

Identificac¸ ˜ao

Nesta fase, o objetivo ´e escolher um modelo apropriado para descrever os dados com base em algumas propriedades te ´oricas. Nesta fase, torna-se essencial usar ferramentas como a func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal, e a func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal parcial para identificar os modelos.

Antes de apresentar a func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal, ´e necess ´ario calcular a func¸ ˜ao de autocovari ˆancia entre todos as localizac¸ ˜oes em estudo, ou seja, N2covari ˆancias. Utilizando tamb ´em

o operador de desfasagem espacial introduzido anteriormente, consegue-se obter todas as covari ˆancias entre todos os pontos desfasados no tempo (desfasamento s) e no espac¸o (entre as ordem de vizinhanc¸a le k). Na forma matricial ´e dado por:

γlk(s) = E ( [W(l)X t] 0 [W(k)X t+s] N ) , ⇔ γlk(s) = tr ( W(k)0W(l)γlk(s) N ) ,

pela propriedade E[y0Ay] = tr[AE(yy0)]e γ

lk(s) = E[XtX

0

t+s].

A estimativa de γlk(s),bγlk(s) ´e obtida substituindo Γ(s) pela sua estimativa na equac¸ ˜ao (3.4.1)

b Γ(s) = T −s X t=1 (Xt− X)(Xt+s− X)0 T − s .

Uma importante propriedade da func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal ´e que γlk(s) = γkl(−s).

A func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal entre os vizinhos de l- ´esima ordem e de k- ´esima ordem com um desafasamento temporal s ´e

ρlk=

γlk(s) [γll(0)γkk(0)]12

,

e a sua estimativa ´e dada por:

b

ρlk= bγlk(s) [bγll(0)γbkk(0)]12

.

Neste caso em particular, s ´o ´e relevante para a identificac¸ ˜ao do modelo, saber a func¸ ˜ao autocorrelac¸ ˜ao espac¸o-temporal entre a l- ´esima ordem e a ordem zero de vizinhanc¸a para um determinado desfasa-mento espacial. Assim a func¸ ˜ao de interesse ´e dada por:

b

ρl0= bγl0(s)

bl0(0)γb00(0)]12

.

Uma vez encontrada a func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal, n ˜ao ´e trivial encontrar o modelo mais apropriado. Consegue-se desvendar se o modelo tem car ´ater autorregresivo ou n ˜ao, mas a sua

(47)

ordem ´e dif´ıcil de identificar atrav ´es dabγl0(s). Este problema pode ser solucionado atrav ´es da func¸ ˜ao

de autocorrelac¸ ˜ao espac¸o-temporal parcial (proposto por Martinn e Oeppen (1975)). A sua definic¸ ˜ao pode ser deduzida de forma trivial atrav ´es da definic¸ ˜ao de um modelo STAR:

Xt= − p X k=1 λk X l=0 φklW(l)Xt−k+ t,

multiplicando ambos os lados por [W(H)X0

t−s]com s > 0, e tirando o valor esperado dividindo por N

temos γh0(s) = − k X j=1 λ X l=0 φjlγhl(s − j),

desde que E[X0t−st] = 0, com s = 1, 2...k e h = 0, 1, ...λ. Estas equac¸ ˜oes s ˜ao an ´alogas `as equac¸ ˜oes

de Yule-Walker para o caso univariado. O ´ultimo coeficiente φkλ obtido atrav ´es de o sistema de

equac¸ ˜oes para λ = 0, 1, ... e k = 1, 2... ´e a func¸ ˜ao de autocorrelac¸ ˜ao espac¸o-temporal de ordem espacial λpara um processo STAR.

Figura 3.2: As equac¸ ˜oes Yule-Walker para modelo espac¸o-temporal

Como no caso univariado, cada STARMA ´e definido por ter func¸ ˜oes de autocorrelac¸ ˜ao espac¸o-temporal e parcial diferentes dos outros STARMA. Se num modelo AR (MA) a func¸ ˜ao de autocorrelac¸ ˜ao (parcial) cai a partir do desfasamento temporal p (q), num modelo STAR (STMA) podemos fazer um racioc´ınio an ´alogo: neste processo, a func¸ ˜ao de autocorrelac¸ ˜ao (parcial) espac¸o-temporal cai a partir do desfasamento temporal p (q) e do desfasamento espacial λp(qm).

Na tabela 3.2 apresenta-se um quadro resumo para identificar teoricamente as ordens de um modelo STARMA.

(48)

Processo Func¸ ˜ao de autocorrelac¸ ˜ao Func¸ ˜ao de autocorrelac¸ ˜ao parcial

STAR(p) cai exponencialmente cai exponencialmente a partir do desfasamento p STMA(q) cai exponencialmente a partir do desfasamento q cai exponencialmente

STARMA(p,q) cai exponencialmente a partir do desfasamento q cai exponencialmente a partir do desfasamento p

Tabela 3.2: Caracter´ısticas te ´oricas das func¸ ˜oes de autocorrelac¸ ˜ao espac¸o-temporal e parcial para modelos STAR, STMA e STARMA. Adaptado de Rao e Antunes (2003)

3.4.2

Estimac¸ ˜ao

Depois de se encontrar um modelo STARMA candidato, segue-se a estimac¸ ˜ao dos par ˆametros.

Φ = [φ10, φ11, ...φ1λ1, ...φp0, φp1,...φpλp]

0,

θ = [θ10, θ11, ...θ1λ1, ...θq0, θq1,...θqλq]

0,

Como na caso univariado, o melhor para se estimar Φ e Θ ´e utilizar o m ´etodo da m ´axima verosimilhanc¸a. Se os erros forem normalmente distribu´ıdos, com E[t] = 0e var(t) = σ2IN, a func¸ ˜ao de verosimilhanc¸a

´e L( | Φ, Θ, σ2) = (2π)−T N2 | σ2IN |−12 exp  − 1 2σ2 0I N  = (2πσ2)−T N2 exp  −S(Φ, Θ) 2σ2  , onde S(Φ, Θ) = 0 = N X i=1 T X t=1 (it)2,

Como os erros s ˜ao aleat ´orios e n ˜ao observ ´aveis, ´e necess ´ario estim ´a-los. Para os estimar, basta utilizar a express ˜ao geral dos modelos STARMA, mas reescreve-la em ordem a t:

t= + p X k=1 λk X l=0 φklW(l)Xt−k− q X k=1 mk X l=0 θklW(l)t−k+ Xt,

para t = 1, 2...T e para os valores de [Φ, Θ]. De notar que os valores de Xt, e consequentemente

t, s ˜ao desconhecidos antes de o instante inicial, o que torna necess ´ario estimar estes valores. Este

c ´alculo n ˜ao ´e trivial, e sem ele n ˜ao se consegue encontrar as estimativas exatas para os par ˆametros Φ e Θ. Uma maneira de contornar este problema ´e assumir que Xte ts ˜ao zero quando t < 1. Com esta

simplificac¸ ˜ao perde-se um pouco de informac¸ ˜ao, mas quando se est ´a a analisar um s ´erie temporal longa esta ”perda” torna-se irrelevante. Desta forma, a func¸ ˜ao em estudo passa a ser a func¸ ˜ao condicional de verosimilhanc¸a de Φ, Θ e σ2, L(Φ, Θ, σ2) = (2πσ2)−T N2 exp  −S∗(Φ, Θ) 2σ2  ,

onde S∗(Φ, Θ) ´e a soma de quadrados condicional

S∗(Φ, Θ) =b

0

b ,

(49)

eb ´e obtido atrav ´es de 3.4.2. O estimador de σ

2 ´e dado por

c

σ2=S∗( bΦ, bΘ)

T N , e bΦ, bΘs ˜ao os valores que minimizam S∗( bΦ, bΘ).

Este procedimento de trabalhar a func¸ ˜ao de m ´axima verosimilhanc¸a condicional leva a uma soluc¸ ˜ao exata para s ´eries longas. Quando as s ´eries n ˜ao s ˜ao muito extensas a soluc¸ ˜ao afasta-se da func¸ ˜ao.

Como as estimativas de m ´axima verosimilhanc¸a condicional s ˜ao tamb ´em estimativas de m´ınimos quadrados, nos modelos STAR as estimativas s ˜ao baseadas na teoria de regress ˜ao linear. Relem-brando um modelo STAR

Xt= q X k=1 mk X l=0 θklW(l)t−k+ t, (3.4)

conseguimos facilmente encontrar na equac¸ ˜ao 3.4 a estrutura Y = Xβ + . Assim a estimativa de Φ seria

Φ = (X0X)−1X0Z,

assumindo que X0X ´e uma matriz n ˜ao singular. Ainda pela teoria de regress ˜ao linear define-se um intervalo de confianc¸a para os par ˆametros

(Φ − bΦ)0X0X(Φ − bΦ)

KS∗( bΦ)

T N −A

∼ FA,T N −A,

em que F ´e distribuic¸ ˜ao F de Fisher-Snedecor, T ´e o tamanho da s ´erie, A o tamanho do vetor Φ e N o n ´umero de localizac¸ ˜oes. Tamb ´em se conclui que

σ2= S∗(Φ) T N − A, e (T N − A)bσ2 σ2 ∼ χ 2 T N −A.

Como proposto por Mann e Wald (1943), estas propriedades da regress ˜ao linear podem ser utili-zadas para os modelos STAR, uma vez que as suposic¸ ˜oes da regress ˜ao n ˜ao s ˜ao verificadas. Mais precisamente, as vari ´aveis da regress ˜ao n ˜ao s ˜ao independentes dos erros.

Como os modelos STMA e STARMA apresentam estruturas de natureza n ˜ao linear, optou-se por utilizar outros m ´etodos para estimar intervalos de confianc¸a para os par ˆametros. Para estimar os seus par ˆametros ´e preciso aplicar t ´ecnicas n ˜ao lineares, como por exemplo o m ´etodo do gradiente (onde o gradiente ´e aproximado) ou a linearizac¸ ˜ao num m ´etodo iterativo, em que em cada iterac¸ ˜ao ”lineariza-se” o modelo n ˜ao linear atrav ´es de expans ˜oes de Taylor para estimar os valores dos par ˆametros da iterac¸ ˜ao seguinte. Estes m ´etodos n ˜ao ser ˜ao abordados nesta dissertac¸ ˜ao. Para mais informac¸ ˜oes consultar Marquardt (1963).

Referências

Documentos relacionados

a) Termo de Colaboração: instrumento pelo qual são formalizadas as parcerias estabelecidas pela administração pública com organizações da sociedade civil,

Para isso, você deverá buscar bibliografia em revistas indexadas que aponte os principais problemas enfrentados por professores para o ensino de seu tema e como eles

Marcos Antonio Molina dos Santos – Chairman of the Board, Alain Emilie Henry Martinet, Antonio dos Santos Maciel Neto, Herculano Aníbal Alves, Marcia Aparecida Pascoal Marçal

As variáveis ES, ENV, ATC e DPA são muito importantes para um maior rendimento dos atletas, haja visto que as equipes melhores colocadas obtiveram um desempenho superior na

A psicanálise foi acusada de normatizadora (FOUCAULT, 1996) por haver mantido o modelo familiar burguês nuclear como o centro de sua teoria como é manifestado

As espécies predominantes (mais freqüentes, constantes e dominantes) foram Anastrepha obliqua (Macquart) em Campos dos Goytacazes e São Francisco do Itabapoana, Anastrepha fraterculus

Elaboração de um problema – deve ser contextualizado, introduzindo os alunos no assunto que se quer trabalhar e ofereça condições para que eles possam pensar nas

Esse formato de peça não deve ser confundido com o jingle, que utiliza principalmente a música como recurso para a fácil memorização da mensagem pelo público alvo