Análise de múltiplos pontos de mudança em modelos normal multivariados

(1)

NORMAL MULTIVARIADOS

Leonardo Brandão Freitas doNas imento

Dissertação de Mestrado apresentada ao

Programade PósGraduação emEstatísti ada

Universidade Federal de Minas Gerais, omo

parte dos requisitos ne essários à obtenção do

título de Mestre em Estatísti a.

Orientadora:Prof a

RosangelaHelena Los hi,

D.S .

BeloHorizonte

(2)

DISSERTAÇO SUBMETIDA AO CORPO DOCENTE DO PROGRAMA DE

PÓS GRADUAÇO EM ESTATÍSTICA DA UNIVERSIDADE FEDERAL DE

MINAS GERAIS, COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A

OBTENÇO DO GRAU DE MESTRE EM ESTATÍSTICA.

Examinadapor:

Prof a

.Rosangela Helena Los hi,D.S .

Prof.Clé io daSilva Ferreira,D.S .

Cristianode Carvalho Santos, D.S .

Prof.Flávio Bambirra Gonçalves, D.S .

BELOHORIZONTE, MG BRASIL

(3)

Análise de Múltiplos Pontos de Mudança em Modelos

Normal Multivariados/Leonardo Brandão Freitas do

Nas imento. Belo Horizonte: UFMG/ICEx, 2017.

VIII, 105 p.: il.;

29, 7

m.

Orientadora:Prof a

RosangelaHelena Los hi,D.S .

Dissertação (mestrado) UFMG/ICEx, Área de

Con entração: Estatísti a, 2017.

Referên ias Bibliográ as: p. 102 105.

1. Modelo Partção Produto. 2. Múltiplas Mudanças.

3. Normal Multivariada. 4. Dados E onmi os. I.

D.S ., Prof a

Rosangela Helena Los hi,. II. Universidade

Federal de Minas Gerais, UFMG, Área de Con entração:

(4)

A Deusque através dos meus estudos me permite auxiliá-lo na riação.

Aos membros da ban a, professores Clé io da Silva Ferreira, Flávio Bambirra

Gonçalves e Rosangela Helena Los hi e ao pesquisador Cristiano de Carvalho

San-tosquesedisponibilizaramdefazerpartedaban aepelassugestõesparaamelhoria

dotrabalho. Emespe ial,agradeço aoCristianode CarvalhoSantospelaamizadee

pelos onselhos antes mesmo dadefesa. Tambémagradeço de formaespe ial a

pro-fessora RosangelaHelena Los hique meorientou pa ientemente esempre dedi ada

a resolver os problemas oriundos do trabalho, além da amizade e ompreensão do

fatode eu ter que defender antes doperíodoesperado.

Aosmeusfamiliares,amigoseamigasqueduranteessetempodemestrado

ontri-buíramparaodesenvolvimentodotrabalhoousimplesmentepelofatoda ompanhia

de ada um.

Agradeço à Fundação de Amparo à Pesquisa do Estado de Minas Gerais (F

A-PEMIG)pelonan iamento desta pequisa através do Programade Pós-Graduação

(5)

daUniverisdadeFederaldeMinasGerais, omopartedosrequisitosne essáriospara

aobtenção do grau de Mestre emEstatísti a. (M.S .)

ANÁLISE DE MÚLTIPLOS PONTOSDE MUDANÇA EMMODELOS

Janeiro/2017

Orientadora:Prof a

RosangelaHelena Los hi, D.S .

Nessetrabalho,propõe-seumaextensãodoModeloPartiçãoProdutoparaa

iden-ti açãode múltiplos pontos de mudança, ao longo do tempo, no vetor de médias

ena matrizde variân ia e ovariân ia de uma sequên ia de dados om distribuição

normal multivariada. Para isso, distribuições a priori onjugadas foram utilizadas

para estimar o vetor de médias e a matriz de variân ia e ovariân ia ao longo do

tempo. Tambémpropõe-se realizaruma omparaçãode ada parâmetro

sequen ial-mente. Para estem, onstrói-seintervalosdemaisaltadensidade(intervalosHPD)

aposteriori para adiferençade parâmetrosemsu essivos instantes de tempo. Para

avaliaromodeloproposto,foram onsideradosalguns enáriossimuladoserealizada

uma apli ação em dados nan eiros, mais espe i amente uma análise do impa to

(6)

Lista de Figuras vii

Lista de Tabelas viii

Introdução 1

1 Modelo Partição Produto para dados sequen ialmente observados:

uma revisão 4

1.1 Modelo Partição Produto. . . 5

1.2 Construção doModelo Partição Produto . . . 5

1.3 Métodos omputa ionais . . . 13

2 Identi ando múltiplasmudanças na médiae na ovariân ia de

da-dos Normal Multivariados 16

2.1 Inferên ia Bayesianano modelo normalmultivariado . . . 17

2.2 Construção doMPP . . . 19

2.3 Faltade identi abilidade naidenti açãodamudança . . . 21

3 Análise de sensibilidade do Modelo Partição Produto para Normal

Multivariada 23

3.1 Cenário 1: mudança namédia . . . 24

3.2 Cenário 2: mudança navariân ia . . . 39

3.3 Cenário 3: mudanças emtodos os parâmetros . . . 52

4 Avaliando o efeito do Brexit na e onomia 59

4.1 Ban o de dados . . . 60

4.2 Espe i ações a priori . . . 62

4.3 Análise . . . 63

5 Con lusão 76

(7)

C Algumas propriedades matri iais 89

D Grá os 90

(8)

3.1 Valores das séries para o enário1. . . 25

3.2 Probabilidade a posteriori do númerode blo os, enário1 . . . 28

3.3 Probabilidadeaposterioride adainstanteserumpontodemudança, enário 2 . . . 30

3.4 Estimativasdoparâmetro

µ

k

dasérie 1, enário 1 . . . 32

µ

k

3.6 Intervalo HPD de

95%

para

µ

k

− µ

k−1

, série 2 e enário 1 . . . 35

σ

2 k

dasérie 1, enário1 . . . 36 3.8 Estimativasdoparâmetro

σ

2 k

σ

2 (12)k

, enário1 . . . 38

3.11 Probabilidade a posteriori para número de blo os, enário2 . . . 42

µ

k

µ

k

σ

2 k

σ

2 k

dasérie 2, enário2 . . . 49

95%

para

σ

2 k

− σ

k−1

2

, séries 2 e enário 2 . . . 50

σ

2 (12)

, enário2 . . . 51

3.20 Probabilidade a posteriori do númerode blo os, enário3 . . . 53

3.21 Distribuição a posteriori daprobabilidade de mudança, enário3 . . 54

µ

k

dasérie 1e 2, enário 3 . . . 56

95%

para

µ

k

− µ

k−1

, séries 1 e2, enário3 . . . 57

3.25 Estimativasdos parâmetros

σ

2 k

e

σ

k

(12)

2

, enário3 . . . 58

4.1 Retornos dos índi es nan eiros da Alemanha, EUA, França, Reino Unido e Suíça. . . 61

(9)

4.3 Probabilidade a posteriori dos blo os, apli ação . . . 64

4.4 Distribuição a posteriori daprobabilidade de mudança, apli ação . . 65

4.5 Probabilidade a posteriori de ada instante ser ponto de mudança, apli ação . . . 65

4.6 Estimação para

µ

k

,estudo de aso . . . 67

µ

k

µ

k

σ

2 k

, estudo de aso. . . 70 4.10 Estimação para

σ

2 k

, estudo de aso. . . 71 4.11 Estimação para

σ

2 k

, estudo de aso. . . 72

4.12 Estimação para ovariân ia,estudo de aso . . . 73

D.1 Cadeia de

µ

50

e

µ

51

, enário 1e série 2 . . . 90

D.2 Distribuição de

µ

51 − µ

50

, enário1 esérie 2 . . . 91

D.3 Cadeias daprobabilidadede mudança, enário 1 . . . 91

D.4 Cadeia de

σ

2

51

e

σ

2

51 − σ

50

2

, enário1 esérie 2 . . . 91

D.5 Distribuição a posteriori daprobabilidade de mudança, enário1 . . 92

D.6 Cadeia de

µ

51

e

µ

51

D.7 Cadeia de

σ

2

52

e

σ

2

52

, enário 2e série 2 . . . 93 D.8 Distribuição

σ

2

53 − σ

52

2

D.9 Distribuição a posteriori daprobabilidade de mudança, enário2 . . 95

D.10Cadeias damédia, variân iae ovariân ia, estudode aso . . . 96

D.11Cadeias daprobabilidadede mudança, estudo de aso . . . 97

D.12Estimativaspara ovariân ia,estudo de aso . . . 97

(10)

1.1 Relação entre a partição

ρ

e onúmerode blo os

B

. . . 5

1.2 Relação entre

ρ

e

U

. . . 13

3.1 Estatísti as a priori, enário1 . . . 26

3.2 Probabilidade a posteriori das partições, enário1 . . . 27

3.3 Estimativasa posteriori para a probabilidadede ponto de mudança, enário 1 . . . 28

3.4 Estimativasa priori, enário 2 . . . 40

3.5 Probabilidade aposterioridas partições, enário2 . . . 41

3.6 Estimativaspara aprobabilidade de ponto de mudança, enário2 . . 42

3.7 Média evariân ia a priori para

l = 1, 2

. . . 52

3.8 Probabilidade aposterioridas partições, enário3 . . . 53

4.1 Média evariân ia dos parâmetros, para

l, t = 1, ..., 9

. . . 62

4.2 Probabilidade a posteriori das partições, apli ação. . . 63

(11)

A identi ação de pontos de mudança é um problema estatísti o relevante, pois

possibilita onje turar sobre os fenmenos que os ausaram e auxilia na avaliação

de açõesaserem tomada. Nesse sentido, um pontode mudançapode ser entendido

omo uma quebra estrutural em uma série temporal ou, simplesmente, um valor

atípi oque o orre emum ban o de dados.

Oproblemadeidenti açãodepontosdemudança,emdadosobservados

sequen- ialmente, esta presenteemdiversas áreas omo,porexemplo, emestudo

hidrológi- os(Perreaultetal.[36℄), limatológi os(Ruggieri[40℄),e onmi os(Arellano-Valle

et al. [2℄) e so ais (Los hi et al. [27℄). Problemas de pontos de mudança também

o orremem segmentação de textos omo pode ser visto emKehagias et al.[17℄.

Nesse sentido, sefaz ne essária autilizaçãode modelos estatísti os em onjunto

om ferramentas omputa ionais apazes de re onhe e -los adequadamente e,

on-sequentemente, ajudar nas tomadas de de isões. Assim, diversas abordagens e

me-todologiasforamdesenvolvidasparaa aptaçãodospontosdemudançaem onjunto

de dados observados sequen ialmente, entre as quaisdesta am-se a metodologia de

máximaverossimilhança (Hinkley[13℄, Bhatta harya [5℄, Liu[21℄)e pro edimentos

Bayesianos baseados emmétodos paramétri osenão paramétri os(Martínez etal.

[31℄, Allenet al. [1℄ e Hartigan[12℄).

Do ponto de vista Bayesiano paramétri o e onsiderando apenas um ponto de

mudança, desta a-se o trabalho de Smith [42℄ que onsiderou o problema de

mu-dança namédia de uma sequên ia de variáveisaleatórias om distribuições normal

e binomial. Lee & Heghinian [20℄ também estudaram uma mudança na média em

uma sequên ia de variáveis aleatórias independentes om distribuição normal,

va-riân ia des onhe ida e omum. Trabalhos apli ados na área e onmi a podem ser

vistos em Booth & Smith [6℄, Diaz [9℄, Holbert [14℄ e Salazar [41℄. Ainda sobre

a perspe tiva Bayesiana paramétri a, ita-se os trabalhos de Perreault et al. [37℄,

que onsiderou um ponto de mudança no vetor de médias e Son & Kim [43℄, que

onsiderouumpontode mudançatantonovetor de médiasquanto namatrizde

o-variân ia,emuma sequên iade variáveisaleatóriasindependentes om distribuição

normalmultivariada.

(12)

props o Modelo Partição Produto (MPP) em que onsidera a suposição da

exis-tên ia de múltiplos pontos de mudança. No MPP tanto o número de pontos de

mudança quanto os instantes em que o orreram são quantidades des onhe idas as

quaisdevemser estimadas,logo,tornandoomodelomaisexível. Barry&Hartigan

[3℄ desenvolveram uma versão do MPP para a identi ação de pontos de mudança

em dados observados sequen ialmente, no qual apenas blo os ontíguos são

on-siderados. Posteriormente, Barry & Hartigan [4℄ apli aram o MPP para inferir

sobremúltiplospontos de mudançana médiada distribuiçãonormal om variân ia

onstante e des onhe ida. Uma grande ontribuição de Barry & Hartigan [4℄ foi o

desenvolvimento de um algoritmo para gerar da distribuição a posteriori de uma

partição om blo os ontíguos, emque usam o amostrador de Gibbs. Apli ações e

extensõesdoMPPpodemservistosemLos hietal.[28℄,Monteiroetal.[32℄,Los hi

et al.[24℄,Quintana &Iglesias [38℄, Müller et al. [34℄ eentre muitos outros

Adete çãodemúltiplasmudançasemsériestemporaismultivariadasédegrande

interesseeumproblemaaindapou oexplorado. Seestassériessão orrela ionadas,a

o orrên iadealgumamudançano omportamentodeumadelaspodegerarmudança

em alguma outra. Nesse enário, o presente trabalho onsidera que uma sequên ia

de vetores aleatórios,

Y

1 , ..., Y

n

,de dimensão

p × 1

são independentes edistribuídos segundo uma distribuição normal multivariada om vetores de médias

µ

k

,

p × 1

, e matriz de ovariân ia

Σ

k

,

p × p

, para

k = 1, ..., n

. Assim sendo, temos omo objetivosutilizaroMPPpara identi armúltiplospontosde mudançasnovetor de

médiasenamatrizde variân ia- ovariân ia. Alémde estimar

µ

k

e

Σ

k

para todo

k

, tambémestima-seonúmerode pontosde mudançaeasposiçõesonde asmudanças

o orreram. Distribuiçõesa priori onjugadas são utilizadas para

µ

k

e

Σ

.

O modelo apresentado nesse trabalho é uma extensão ao propostos em Cheon

& Kim [8℄ e em Moura [33℄. Moura [33℄, por exemplo, utilizou o modelo partição

produtoparaaidenti açãode mudanças namatrizde variân iae ovariân iapara

uma sequên ia de dados om distribuição normal multivariada entrado no vetor

nulo. Cheon & Kim [8℄ apli aramo algoritmoMonteCarlo om aproximação

esto- ásti a para a dete ção de múltiplos pontos de mudanças no vetor de médias e na

matriz de variân ia e ovariân ia de dados om distribuição normal multivariada.

No entanto, Cheon & Kim [8℄ onsideraram uma distribuição a priori vaga para

o vetor de médias, ou seja,

π(µ

k

) = 1

e estimam apenas a partição dos dados, o número de blo os e a probabilidade de ada instante ser um ponto de mudança,

não forne endo estimativaspara os parâmetros noinstante

k

e, onsequentemente, não havendo a identi ação em qual parâmetro e em qual variável houve a

mu-dança. Além desses trabalhos, desta am-se tambémo de Lavielle & Teyssiere [19℄,

(13)

máximaverossimilhançaparaadete ção de múltiplospontosde mudançaemséries

multivariadas. Re entemente, James &Matteson[15℄disponibilizaramopa otee p

nosoftware R Core Team [39℄, noqual utiliza daabordagemnão paramétri apara

aanálise de múltiplos pontos de mudançaem dados multivariados.

Em estudos de pontos de mudança usando o MPP, omumente o orrem

pro-blemas de falta de identi abilidade. Por exemplo, no problema de identi ação

de múltiplas mudanças na média e variân ia de uma sequên ia de variáveis

nor-malmente distribuídas (Los hi & Cruz [22℄), a mudança real pode o orrer apenas

no média e não na variân ia. No entanto, estudos simulados mostram que as

es-timativas forne idas pelo modelo indi arão também uma mudança na variân ia e

eminstantes próximos a mudançadete tada na média. Problemas similares a este

também o orrerão no ontexto multivariado. Neste aso, podemos, por exemplo,

inferirque hámudança emtodas assérie quando apenas uma destas experimentou

amudança. Para analisar osresultados e minimizareste tipo de problema da falta

de identi ação,propõe-se realizaruma omparaçãode ada parâmetro

sequen ial-mente. Para estem, onstrói-seintervalosdemaisaltadensidade(intervalosHPD)

a posteriori para a diferença de parâmetros em su essivos instantes de tempo. O

intervaloHPD serela iona omaevidên iaaposteriori forne idapelotestede

signi- ân iabayesiano ompleto (FBST) introduzidoporBragança Pereira &Stern [7℄.

Assim,pode-se onsidera-loparatestarseadiferençade adaparâmetroem

instan-tes su essivos de tempo é signi amente diferente de zero, on luindo-se diferença

signi ativaquando ovalorzero não perten e aointervalo.

Para avaliarodesempenho do modelo, onsiderou-se algunsban os de dados

si-mulados. Alémdisso,tambémrealizou-seumaapli açãoemque onsisteemavaliar

oefeitodoBrexit nae onomiadeoitopaíses. Essetermoéaabreviaçãodaspalavras

em inglês Britain (Grã-Bretanha) e exit (saída) e designa a saída do Reino Unido

daUnião Europeia. Para esse estudos foram onsiderados nove índi esnan eiros:

DAX (Deuts her Aktienindex) da Alemanha, IBEX 35 (Iberia Index) da Espanha,

CAC 40 ( Cotation Assistée en Continu) da França, ATG (Athens General) da

Gré ia, FTSE MIB (Finan ial Times Sto k Ex hange Milano Indi e di Borsa) da

Itália, PSI-20 (Portuguese Sto k Index) de Portugal, FTSE 100 Reino Unido

(Fi-nan ial Times Sto k Ex hange), SMI (Swiss Market Index) da Suíça e S&P 500

(Standard & Poor's 500) dos Estados Unidos. Tais índi es são responsáveis por

mediro desempenho e onmi o dos países emestudo

Este trabalho está organizado omo segue. No Capítulo 1, é apresentado uma revisão do MPP desenvolvido em Barry & Hartigan [3℄ e Barry & Hartigan [4℄, as

extensõespropostaemLos hi&Cruz[25℄eométodo omputa ionalparaobter-seas

(14)

realizarostestessequen iais. NoCapítulo3,érealizadoumaanálisedesensibilidade domodelo proposto através de três enáriossob diferentes óti as. No Capítulo4, é analisadooefeito doBrexit nae onomia de oitopaíses.

(15)

Modelo Partição Produto para dados

sequen ialmente observados: uma

revisão

OModelo Partição Produtofoi denido, nasua formamais geral, emHartigan[12℄

e onsidera a suposição da existên ia de múltiplos pontos de mudança em um

de-terminadoban o de dados. Dessaforma,o MPPé mais exível quando omparado

aosmodelosque onsideram apresença de apenasum pontode mudança. NoMPP

tanto onúmerode pontosde mudanças quanto osinstantes emqueestes o orreram

são quantidades a serem estimadas. Barry &Hartigan [3℄ parti ularizaramo MPP

para a identi ação de pontos de mudança em dados observados sequen ialmente

porassumirem queapenas blo os ontíguos são onsiderados. Barry& Hartigan[3℄

forne eram expressões analíti as para as distribuições a posteriori dos parâmetros

queindexam a função de distribuição dos dados e para suas esperanças.

Posterior-mente, Barry & Hartigan [4℄ apli aramo MPP para inferir sobre múltiplos pontos

de mudança na média de uma sequên ia de dados normalmente distribuídos e

as-sumindovariân ia omum e des onhe ida em ada instantedo tempo. Alémdisso,

propuseramum algoritmobaseado noamostrador de Gibbspara gerarda

distribui-çãoa posteriori dapartiçãoaleatóriaquandoapenas blo os ontíguos sãopossíveis.

Maistarde,Los hi etal. [23℄implementou oamostradorde Gibbs para gerarda

dis-tribuição a posteriori do número de pontos de mudanças e para os instantes nos

quais estes o orreram. Los hi et al. [23℄ também onsiderou a oesão denida em

Yao [44℄, no qual depende de uma probabilidade

p

de haver mudança em algum instante, assumindo uma distribuição a priori degenerada para a

p

. Los hi et al. [26℄ fez uma extensãode Los hiet al. [23℄assumindo distribuiçõesa priori não

de-generadas para a

p

. Posteriormente, Ferreira et al. [10℄ apresenta uma versão do MPPno qual onsidera os blo os orrela ionados.

(16)

deniçõese on eitos bási os inerentes ao MPP. Na Seção1.2 édenido oMPP no aso paramétri oe são apresentadas as distribuições a priori ea posteriori da

par-tiçãoaleatória,donúmerode blo os eaprobabilidadea posteriori de adainstante

serumpontodemudança. Porm,naSeção1.3,édes ritoométodo omputa ional queé utilizadopara a obtenção das estimativas de interesse doMPP.

1.1 Modelo Partição Produto

Sejam

y

1 , ...y

n

uma série temporal observada e

I

o onjunto formado pelos índi es

{1, ..., n}

que indexam tais observações. Denote por

ρ

a partição aleatóriado

on-junto

I

S{0}

e B o númerode blo os dapartição

ρ

. Denote por

[ij]

osub onjunto de

I

formado pelos indi ies

{i + 1, ..., j}

, para

i < j

e

i, j ∈ I

S{0}

, e por

y

[ij]

o blo oformado pelas observações

y

i+1

, ..., y

j

.

Assumindoquesomenteblo os ontíguosdeobservaçõessãopossíveis, adavalor

dapartiçãoaleatória

ρ

édaforma

ρ = {i

0 , i

1 , ..., i

b

}

,emque

0 = i

0 < i

1 < ... < i

b

=

n

, para

b ∈ I

, a qual divide onjunto de obervações em

B = b

blo os vizinhos da

seguinteforma:

[y

1 , ..., y

i

1 ] [y

i

1 +1

, ..., y

i

2 ] ...

y

i

b−1

+1

, ..., y

i

b

.

A o orrên ia da partição

ρ = {i

0 , i

1 , ..., i

b

}

impli a na o orrên ia de

b − 1

mu-dançasno omportamentodasérie observada nos instantes

i

1 + 1, ..., i

b−1

+ 1

. Para melhor ompreensão, ver Tabela(1.1).

Exemplo 1.1.1 Seja

y

1 , y

2 , y

3

uma série temporal observada. Então, tem-se que

I

S 0 = {0, 1, 2, 3}

e os dados podem ser divididos de

2 n−1

formas diferentes omo

mostra a Tabela 1.1.

Tabela1.1: Relação entre a partição

ρ

e o númerode blo os

B

. Blo ode observações Valores de

ρ

Valores de

B

[y

1 , y

2 , y

3 ]

{i

0 = 0, i

1 = 3}

1

[y

1 ] , [y

2 , y

3 ]

{i

0 = 0, i

1 = 1, i

2 = 3}

2

[y

1 , y

2 ] , [y

3 ]

{i

0 = 0, i

1 = 2, i

2 = 3}

2

[y

1 ] , [y

2 ] , [y

3 ]

{i

0 = 0, i

1 = 1, i

2 = 2, i

3 = 3}

3

Denidosesses elementos bási os,napróximaseçãoserá apresentado oMPPem

(17)

Seja

θ

1 , ..., θ

n

umasequên iadeparâmetros sobreoespaçoparamétri o

Θ

e

Y

1 , .., Y

n

uma sequên ia de variáveis aleatórias. Considere que, dados

θ

1 , ..., θ

n

, as variáveis

Y

1 , .., Y

n

são independentes e om omportamentodado por

f

1 (y

1 |θ

1 ), ..., f

n

(y

n

|θ

n

)

,

respe tivamente. No MPPassume-se que:

1 Dado

ρ = {i

0 , i

1 , ..., i

b

}

, a sequên ia de parâmetros

θ

1 , ..., θ

n

é parti ionada

em b blo os ontíguos, no qual

θ

[ij]

denota o parâmetro omum que indexa a distribuiçãodas variáveis aleatóriasdoblo o

Y

[ij]

,ou seja

θ

k

= θ

[i

r−1

i

r

]

∀ i

r−1

< k ≤ i

r

,

k = 1, ..., n e r = 1, ..., b.

Destaforma,ovetordeparâmetros

θ

= (θ

1 , ...θ

1 )

podeserrees ritodaseguinte forma:

θ

=

b

X

r=1

θ

[i

r−1

i

r

]

1{i

r−1

< 1 ≤ i

r

}, ..., θ

[i

r−1

i

r

]

1{i

r−1

< n ≤ i

r

} ,

onde

1{A}

denota afunção indi adora do evento

A

2 Dado

ρ = {i

0 , i

1 , ..., i

b

}

,tem-se queosparâmetros omuns

θ

[i

0 i

1 ]

, ..., θ

[i

b−1

i

b

]

são

independentes e

θ

[ij]

possui distribuição a priori

π

[ij]

(θ)

om

θ ∈ Θ

[ij]

, onde

Θ

[ij]

é oespaço paramétri ode

θ

[ij]

.

O MPP estabele e a distribuição onjunta de

ρ

, das observações e dos parâmetros omomostra a denição abaixo.

Denição 1.2.1 A quantidade aleatória

((Y

1 , θ

1 ), ..., (Y

n

, θ

n

); ρ)

possui o seu om-portamento des rito pelo MPP paramétri o, denotado por

((Y

1 , θ

1 ), ..., (Y

n

, θ

n

); ρ) ∼

MP P

, se:

(1) A distribuição a priori para

ρ

é uma distribuição produto, ou seja:

P (ρ = {i

0 , i

1 , ..., i

b

}) =

Q

b

r=1

c

[i

r−1

i

r

]

P

C

Q

b

r=1

c

[i

r−1

i

r

]

,

onde

c

[ij]

é a oesão do blo o

[ij]

(ver detalhes a seguir) e

C

é o onjunto de todas as possíveis partições de

I

em

b

blo os ontíguos

∀b ∈ I

.

(2) Condi ionalem

ρ = {i

0 , i

1 , ..., i

b

}

, tem-sequeasobservaçõesemdiferentes blo- ossãoindependenteseasobservaçõesem adablo o

y

[ij]

possuemdistribuição

(18)

indexadapelo parâmetro

θ

[ij]

, ou seja:

f (y

1 , ..., y

n

; θ

1 , ..., θ

n

|ρ = {i

0 , i

1 , ..., i

b

}) =

b

Y

r=1

i

r

Y

k=i

r−1

+1

f (y

k

|θ

[ij]

)π

[i

r−1

i

r

]

(θ

[ij]

).

(3) Condi ionalem

ρ

, a distribuição a priori para

θ

= (θ

1 , ..., θ

n

)

é

π(θ) = π(θ

[i

0 i

1 ]

) · · · π(θ

[i

b−1

i

b

]

)

=

b

Y

r=1

π(θ

[i

r−1

i

r

]

).

Uma partiçãotende a agregarem um mesmo blo o observações om

omporta-mentos semelhantes. Diante disso, para des rever ain erteza ini ialsobre

ρ

, Harti-gan[12℄dene

c

[ij]

a oesãoasso iadaaoblo odeobservações

[ij]

. SegundoHartigan [12℄,

c

[ij]

é um valornuméri oe não negativoque representa ograu de similaridade existenteentreobservaçõesdoblo o

[ij]

,podendoserinterpretada,quandoosdados sãosequen ialmenteobservados, omoumaprobabilidadede transição da adeiade

Markov

Z

a

, a ∈ {0, ..., n}

, onde

Z

a

assume valores em

{i

0 , i

1 , ..., i

b

}

, isto é, orres-pondeao instanteemque o orre a

a

-ésima mudançana estrutura dadistribuição. Desse modo, tem-se que a oesão do blo o

c

[ij]

é a probabilidade do instante da

a

-ésima mudança ser o

j

dado que a

(a − 1)

-ésima mudança o orreu no instante

i

([3℄).

Como onsequên ia da Denição 1.2.1, tem-se que a distribuição onjunta de

y

1 , ..., y

n

dado

ρ

, é dada por

f (y

1 , ..., y

n

|ρ = {i

0 , i

1 , ..., i

b

}) =

b

Y

r=1

f

[i

r−1

i

r

]

(y

[i

r−1

i

r

]

),

onde

f

[i

r−1

i

r

]

(y

[i

r−1

i

r

]

) =

Z

i

r

Y

k=i

r−1

+1

f (y

k

|θ)π

[i

r−1

i

r

]

(θ)dθ

édenominadafatordedadose orrespondeadistribuiçãopreditivaapriori asso iada

aoblo o

[ij]

.

A partir da Denição 1.2.1, pode ser mostrado que a distribuição a priori do númerode blo os napartição

ρ

édado por:

P (B = b) =

X

C

′

Q

b

r=1

c

i

r−1

i

r

P

C

Q

b

r=1

c

i

r−1

i

r

,

(19)

onde

C

′

é um sub onjunto de todas aspartiçõesem

I

om exatamente

b

blo os. Barry & Hartigan[3℄ também mostraram que asdistribuições a posteriori para

ρ

e B são dadas,respe tivamente, por:

P (ρ|y

1 , ...., y

n

) ∝

b

Y

r=1

c

∗

_i

_r−1

_i

_r

P (B = b|y

1 , ...., y

n

) ∝

X

C

′

b

Y

r=1

c

∗

_i

_r−1

_i

_r

∀b ∈

I

,

onde

c

∗

[ij]

= c

[ij]

f

[ij]

(y

[ij]

)

,

∀i, j ∈{0, ..., n}

e

i < j

, denota a oesão a posteriori do

blo o

[ij]

.

Em geral, a distribuição a posteriori de

ρ

forne e uma boa informação sobre a probabilidade de ada instante ser um ponto de mudança. Los hi & Cruz [25℄

props ummétodopara al ularaprobabilidade a posteriori de ada instanteser

um ponto de mudança.

Seja

C

k

umsubgrupode

C

que ontém todasaspartiçõesquein luemoinstante

k

omopontode mudança, ouseja, ada partiçãoem

C

k

édaforma

{i

0 , ..., i

l−1

, i

l

=

k − 1, i

l+1

, ..., i

b

}

paraalgum

l ∈ I

. Sejaoevento

A

k

quedenotao

k

-ésimoinstanteé

um ponto de mudança, para

k = 2, ..., n

. Portanto,a probabilidade de um instante

k

ser um ponto de mudançaé

P (A

k

|y

1 , ..., y

n

) =

X

C

k

P ({i

0 , ..., i

l−1

, i

l

= k − 1, i

l+1

, ..., i

b

}|y

1 , ..., y

n

)

∝

X

C

k

l−1

Y

r=1

c

∗

[i

r−1

i

r

]

!

c

∗

[i

l−1

(k−1)]

c

∗

[(k−1)i

l+1

]

b

Y

r=l+1

c

∗

[i

r−1

i

r

]

!

.

Similarmente, a probabilidade a posteriori para dois instantes espe í os,

k

′

e

k

∗

,

serempontosde mudanças pode ser obtida apartir da probabilidadede

A

k

′

∩ A

_k

∗

,

eassim por diante.

Considerando o item

(2)

da Denição 1.2.1, observa-se que o omportamentoa posteriori do parâmetro

θ

[ij]

depende do blo o

y

[ij]

a que está asso iado. Portanto, omo mostrado em Barry & Hartigan [3℄, a distribuição a posteriori para ada

θ

k

,

k = 1, ..., n

,é dada por

f (θ

k

|y

1 , ..., y

n

) =

k−1

X

i=0

n

X

j=k

r

∗

_[ij]

f (θ

k

|y

[ij]

),

(1.1) onde

r

∗

[ij]

denota a relevân ia a posteriori do blo o

[ij]

, a qual é denida omo sendo,

r

∗

[ij]

= P ([ij] ∈ ρ|Y

1 , ..., Y

n

)

. Barry & Hartigan [3℄ também mostraram que

(20)

a posteriori de ada

θ

k

, ouseja,

ˆ

θ

k

= E(θ

k

|y

1 , ..., y

n

) =

k−1

X

i=0

n

X

j=k

r

∗

_[ij]

E(θ

k

|y

[ij]

).

A es olha da oesão

c

[ij]

expressa aper epção ini ial do pesquisadorem relação ao grau de similaridade entre as observações perten entes ao blo o

[ij]

ou sobre o quãoprovável taisobservações perten erem ao mesmo luster. Portanto, a es olha

da oesão é fundamental no pro esso de inferên ia. Algumas oesões utilizadas

frequentementesão:

• c

[ij]

= 1

: assumindoesta oesão paratodosos lusters, tem-se quea distribui-ção a priori para

ρ

será uma uniforme no onjunto de todas as partições em blo os ontíguos de

I

, ouseja,

P (ρ = {i

0 , ..., i

b

}) = 2

−(n−1)

;

• c

[ij]

=

1 j − i

: assumindoesta oesão, tem-sequea on epçãoini ialdo

pesqui-sadorrevelaque asobservaçõessão pou os similares,pois este tipo de oesão

atribuialta probabilidade a blo os om pou as observações, induzindo

parti-ções om muitos blo os.

• c

[ij]

= j − i

: assumindo esta oesão, tem-seque a on epção ini ial do

pesqui-sador revelaque as observações são similares,pois este tipo de oesão atribui

pesos maioresa blo os om muita observações, formando, om grande

proba-bilidade,partições om pou os blo os.

No presente trabalho, será adotada a oesão proposta por Yao [44℄. Seja

p

a probabilidadede que umanova mudançao orraemalguminstantedasequên iade

observações. Então, a oesão a priori para oblo o

[ij]

é dada por:

c

[ij]

=

(

p(1 − p)

j−i−1

_,

se

j < n,

(1 − p)

i−j−1

_,

se

j = n,

(1.2)

onde

i, j ∈ I ∪ 0

e

i < j

. Tal oesão orresponde à probabilidade que uma nova

mudança o orra após

j − i

instantes, dado que o orreu uma mudança no instante

i

. Condi ional em

p

, asdistribuiçõesa priori de

ρ

e

B

são, respe tivamente, dadas por:

(21)

P (B = b|p) =

n − 1

b − 1

p

b−1

(1 − p)

n−b

,

b ∈

I

.

Atribuindouma distribuiçãoa priori

π(p)

,obtem-se asdistribuiçõesa priori de

ρ

e

B

omo segue. A distribuiçãoa priori de

ρ

é dada por

P (ρ = {i

0 , ..., i

b

}) =

Z

1

0 (ρ = {i

0 , ..., i

b

} | p) π(p)dp

=

Z

1

0 p

b−1

(1 − p)

n−b

π(p)dp,

P (B = b) =

Z

1

0 P (B = b | p) π(p)dp

=

n − 1

b − 1

Z

1

0 p

b−1

(1 − p)

n−b

π(p)dp.

Como onsequên ia,tem-seque asdistribuiçõesaposteriori de

ρ

e

B

são dadas, respe tivamente, por:

P (ρ = {i

0 , ..., i

b

} | y

1 , ..., y

n

) =

P (ρ; y

1 , ..., y

n

)

P (y

1 , ..., y

n

)

∝

Z

1

0 P (y

1 , ..., y

n

; ρ, p) dp

∝

Z

1

0 P (y

1 , ..., y

n

| ρ, p) P (ρ | p) π(p)dp

∝

Z

1

0 b

Y

r=1

f

i

r−1

i

r

y

i

r−1

i

r

p

b−1

_{(1 − p)}

n−b

π(p)dp

∝

b

Y

r=1

f

i

r−1

i

r

y

i

r−1

i

r

Z

1

0 p

b−1

(1 − p)

n−b

π(p)dp

(1.3) e

(22)

P (B = b | y

1 , ..., y

n

) =

X

C

′

P (ρ = {i

0 , ..., i

b

} | y

1 , ..., y

n

)

=

X

C

′

P (ρ = {i

0 , ..., i

b

} , y

1 , ..., y

n

)

P (y

1 , ..., y

n

)

∝

X

C

′

Z

1

0 P (y

1 , ..., y

n

| ρ, p) P (ρ | p) π(p)dp

∝

n − 1

b − 1

b

Y

r=1

f

i

r−1

i

r

y

i

r−1

i

r

Z

1

0 p

b−1

(1 − p)

n−b

π(p)dp.

Alémdisso, tem-seque aprobabilidadea posteriori de um parti ular instante

k

ser um ponto de mudança e a distribuição a posteriori de

p

são dadas, respe tiva-mente, dada por:

P (A

k

| y

1 , ..., y

n

) =

X

C

k

P (ρ = {i

0 , ..., i

l−1

, i

l

= k − 1, i

l+1

, ..., i

b

} | y

1 , ..., y

n

)

=

X

C

k

P (ρ = {i

0 , ..., i

l−1

, i

l

= k − 1, i

l+1

, ..., i

b

} ; y

1 , ..., y

n

)

P (y

1 , ..., y

n

)

∝

X

C

k

Z

1

0 P (y

1 , ..., y

n

| ρ, p) P (ρ | p) π(p)dp

∝

X

C

k

b

Y

r=1

f y

i

r−1

i

r

Z

1

0 p

b−1

(1 − p)

n−b

π(p)dp,

(1.4) e

P (p | y

1 , ..., y

n

) =

P (y

1 , ..., y

n

; p)

P (y

1 , ..., y

n

)

∝

X

C

P (y

1 , ..., y

n

; ρ, p)

∝

X

C

P (y

1 , ..., y

n

| ρ, p) P (ρ | p) π(p)

∝

X

C

b

Y

r=1

f y

i

r−1

i

r

p

b−1

_{(1 − p)}

n−b

π(p),

(1.5)

onde

C

k

éosub onjuntode

C

que ontém todasaspartiçõesquein luemoinstante

k

omo ponto de mudança.

Para ompletar as espe i ações do modelo pode-se utilizar uma distribuição a

priori para

p

. Neste trabalho,

p ∼ Beta(α, β)

, om

α > 0

e

β > 0

. Consequente-mente as,distribuiçõesa priori de

ρ

e

B

serão, respe tivamente:

(23)

P (ρ = {i

0 , ..., i

b

}) =

Z

1

0 P (ρ = {i

0 , ..., i

b

} | p) π(p)dp

=

Γ (α + β) Γ (α + b − 1) Γ (n + β − b)

Γ (α) Γ (β) Γ (n + α + β − 1)

P (B = b) =

Z

1

0 P (B = b | p) π(p)dp

=

n − 1

b − 1

Γ (α + β) Γ (α + b − 1) Γ (n + β − b)

Γ (α) Γ (β) Γ (n + α + β − 1)

.

Note que

B = W + 1

, onde

W

é uma variável aleatória om distribuição

Beta-Binomial de parâmetros

n − 1

,

α

e

β

, para

α > 0

e

β > 0

, denotada por

W ∼

Bb(n − 1, α, β)

. A função de probabilidadede

W

édada por:

f (W | n−1, α, β) =

n − 1

w

Γ (α + β) Γ (α + w) Γ (n + β − w − 1)

Γ (α) Γ (β) Γ (n + α + β − 1)

,

w = 0, 1, ..., n−1.

A esperança e avariân iade

W

é dada, respe tivamente, por

E(W ) = (n − 1)

α

α + β

e

V ar(W ) = (n − 1)

αβ(α + β + n − 1)

(α + β)

2 _{(α + β + 1)}

.

Consequentemente, tem-se queaesperançae avariân iadavariávelaleatória

B

são dadas, respe tivamente, por

E(B) = (n − 1)

α

α + β

+ 1

e

V ar(B) = (n − 1)

αβ(α + β + n − 1)

(α + β)

2 _{(α + β + 1)}

.

A partir daEquação (1.3), tem-seque a distribuiçãoa posteriori de

ρ

é:

P (ρ = {i

0 , ..., i

b

} | y

1 , ..., y

n

) ∝

b

Y

r=1

f

i

r−1

i

r

y

i

r−1

i

r

Γ (α + β ) Γ (α + b − 1) Γ (n + β − b)

Γ (α) Γ (β) Γ (n + α + β − 1)

.

(1.6)

(24)

P (B = b | y

1 , ..., y

n

) ∝

n − 1

b − 1

b

Y

r=1

f

i

r−1

i

r

y

i

r−1

i

r

Γ (α + β ) Γ (α + b − 1) Γ (n + β − b)

Γ (α) Γ (β) Γ (n + α + β − 1)

Alémdisso, dasequações(1.4)e(1.5)tem-sequeasdistribuiçõesaposteriori de

A

k

e

p

são dadas, respe tivamente, por:

P (A

k

| y

1 , ..., y

n

) ∝

X

C

k

b

Y

r=1

f y

i

r−1

i

r

Γ (α + β ) Γ (α + β − 1) Γ (n + β − b)

Γ (α) Γ (β) Γ (n + α + β − 1)

P (p | y

1 , ..., y

n

) ∝

X

C

b

Y

r=1

f y

i

r−1

i

r

p

α+b−2

_{(1 − p)}

n+β−b−1

_.

(1.7) 1.3 Métodos omputa ionais

Observe que não é trivial gerar amostras de

ρ

a partir da distribuição ondi ional ompleta,poisadimensão de

ρ

não éxaeonúmerode partiçõespossíveis res e a medidaque

n

aumenta. Para ontornarestadi uldadeBarry&Hartigan[4℄props uma transformação de variáveis em que

ρ

é representada omo um vetor ujas as omponentes são variáveis binárias. Ao fazer isto, pode-se gerar da distribuição a

posteriori de

ρ

via amostrador de Gibbs. Tal pro edimento émostrado aseguir. Considere umaquantidade aleatória

U

r

quereete sehouve ounãomudançano instante

r + 1

, ouseja,

U

r

=

(

1,

se

θ

r

= θ

r+1

,

0,

se

θ

r

6= θ

r+1

,

para

r = 1, ..., n − 1

. Assumindo esta transformação, ada valor de

ρ

pode ser

identi ado porum valordovetor

U

= (U

1 , ..., U

n−1

)

, istoé,

ρ = {i

0 , ..., i

b

} ⇔ (U

1 = 1, ..., U

i

1 −1

= 1, U

i

1 = 0, U

i

1 +1

= 1, U

i

2 −1

= 0, U

i

2 = 0, ...,

U

i

b−1

−1

= 1, U

i

b−1

= 0, U

i

b−1

+1

= 1, ..., U

i

b

= 1).

Para melhor ompreensão, verTabela1.2.

Umadas vantagensde se onsideraratransformação

U

équeesteterádimensão xa em ada parte do algoritmo. Então, ada partição

(U

s

1 , ..., U

n−1

s

)

,

s ≥ 1

, é

(25)

-Tabela 1.2: Relaçãoentre

ρ

e

U

Blo ode observações Valores de

ρ

Valores de

U

[y

1 , y

2 , y

3 ]

{i

0 = 0, i

1 = 3}

{U

1 = 1, U

2 = 1}

[y

1 ] , [y

2 , y

3 ]

{i

0 = 0, i

1 = 1, i

2 = 3}

{U

1 = 0, U

2 = 1}

[y

1 , y

2 ] , [y

3 ]

{i

0 = 0, i

1 = 2, i

2 = 3}

{U

1 = 1, U

2 = 0}

[y

1 ] , [y

2 ] , [y

3 ]

{i

0 = 0, i

1 = 1, i

2 = 2, i

3 = 3}

{U

1 = 0, U

2 = 0}

ésimoelementono passo

s

doalgoritmo,

U

s

r

de

U

, égerada apartirda distribuição ondi ional

U

r

|U

1 s

, ..., U

r−1

s

, U

r+1

s−1

, ..., U

n−1

s−1

, p, y

1 , ..., y

n

,

para

r = 1, ..., n − 1

. Como

U

r

é uma variável binária, para gerar amostras de

U

,

sugere-se onsiderar aseguinterazão:

R

r

=

P (U

r

= 1|V

r

s

, p, y

1 , ..., y

n

)

P (U

r

= 0|V

r

s

, p, y

1 , ..., y

n

)

,

para

r = 1, ..., n−1

e

V

s

r

= {U

1 s

= u

1 , ..., U

r−1

s

= u

r−1

, U

r+1

s−1

= u

r+1

, ..., U

n−1

s−1

= u

n−1

}

.

Assumindo a oesão apresentada na Equação (1.2) e fazendo

p ∼ Beta(α, β)

, om

α > 0

e

β > 0

, então o valorde

R

r

édado por:

R

r

=

f

[xl]

(y

[xl]

)Γ(n + β − b + 1)Γ(b + α − 2)

f

[xr]

(y

[xr]

)f

[rl]

(y

[rl]

)Γ(b + α − 1)Γ(n + β − b)

,

para

b = 1, ..., n

,

x =

(

max{r

∗

_{; 0 < r}

∗

_{< r, U}

s

r

∗

= 0},

se

U

r

∗

= 0, r

∗

_{∈ {1, ..., r − 1},}

0,

aso ontrário

,

e

l =

(

min{r

∗

_{; r < r}

∗

_{< n, U}

s−1

r

∗

= 0},

se

U

s−1

r

∗

= 0, r

∗

∈ {r + 1, ..., n − 1},

n,

aso ontrário

.

para mais detalhes, verLos hi &Cruz [22℄.

Usando o amostrador de Gibbs, gera-se amostra de

U

onsiderando o seguinte ritériopara a simulaçãoda variável aleatória

U

s

r

:

U

_r

s

=







1,

se

R

r

≥

1 − z

z

,

0,

aso ontrário

,

onde

r = 1, ..., n − 1

e

z ∼ U(0, 1)

.

(26)

ρ = {i

0 , ..., i

b

}

é dada pela proporção de vetores

(U

1 = 1, ..., U

i

1 −1

= 1, U

i

1 =

0, U

i

1 +1

= 1, U

i

2 −1

= 0, U

i

2 = 0, ..., U

i

b−1

−1

= 1, U

i

b−1

= 0, U

i

b−1

+1

= 1, ..., U

i

b

= 1)

queapare eramnototalde amostrasúteis. Alémdisso, aamostradadistribuiçãoa

posteriori para número de blo os em

ρ

pode ser obtida onsiderando-se a seguinte relação

B = 1 +

n−1

X

r=1

(1 − U

r

).

Consequentemente, para ada vetor gerado

(U

s

1 , ..., U

n−1

s

)

obtém-se um valor

B

s

₌

1 +

P

n−1

r

(1 − U

r

s

)

e a estimativa Monte Carlo para probabilidade a posteriori do

númerode blo os é dada por

P (B = b|y

1 , ...y

n

) =

P

T

s=1

1 {B

s

= b}

T

, ∀b ∈ I,

onde

T

éonúmerototaldeamostrasa posteriori e

1 {B

s

_{= b}}

éafunçãoindi adora.

Além disso, Los hi & Cruz [25℄ mostra que a estimativa Monte Carlo para a

probabilidadea posteriori do instante

k

ser um ponto de mudançaé dada por

P (A

k

|y

1 , ..., y

n

) =

N

T

,

onde

k = 2, ..., n

,

N

éonúmerodevetoresobservados om

U

k−1

= 0

e

T

éotamanho

daamostrada distribuiçãoa posteriori.

Assumindo que

p ∼ Beta(α, β)

, om

α > 0

e

β > 0

, omo mostrado em Los hi &Cruz[25℄,tem-seque adaamostradadistribuiçãoaposteriori de

p

édaseguinte distribuição ondi ional ompleta a posteriori:

p

s

| θ, ρ, y

1 , ..., y

n

∼ beta(b

s

+ α − 1; n + β − b

s

),

onde

b

s

é o número de blo os observados novetor

(U

s

1 , ..., U

n−1

s

)

.

Nopróximo apítulo,apli a-seoMPPparaaidenti açãodepontosdemudança

novetor de médias ena matriz de variân ia e ovariân ia de dados multivariados e

normalmente distribuídos. Os resultados estendem o trabalho de Moura [33℄, pois

(27)

Identi ando múltiplas mudanças na

média e na ovariân ia de dados

Normal Multivariados

Oestudo de séries temporais multivariadas permiteavaliarainuên ia do

ompor-tamento que uma determinada série exer e sobre as demais. No estudo de dados

nan eiros, por exemplo, tal inuên ia é denominada ontágio e pode ser

mensu-radaatravésda orrelaçãoentre asséries. Nesse sentido,aidenti açãode múltiplos

pontode mudanças no ontexto multivariadoé mais uma formade estudar as

rela-çõesexistente entre asséries.

Diante disso, alguns métodos foram utilizadospara a identi ação de múltiplos

pontos de mudanças, no qual desta am-se o de Moura [33℄ e Cheon & Kim [8℄.

Moura[33℄,porexemplo,utilizouomodelopartiçãoproduto paraaidenti açãode

mudanças na matriz de variân ia e ovariân ia para uma sequên ia de dados om

distribuiçãonormal

p

-variada. Cheon&Kim[8℄apli aramoalgoritmoMonteCarlo om aproximação esto ásti a para a dete ção de múltiplos pontos de mudanças no

vetor de médias e na matriz de variân ia e ovariân ia de dados om distribuição

normal

p

-variada. No entanto, Cheon & Kim [8℄ onsideraram uma distribuição a priori vaga para o vetor de médias, ou seja,

π(µ

k

) = 1

e estimam apenas a partiçãodos dados, o número de blo os e a probabilidade de ada instante ser um

ponto de mudança, não forne endo estimativas para os parâmetros no instante

k

e, onsequentemente, não havendo a identi ação em qual parâmetro e em qual

variávelhouve amudança.

Neste apítulo,tem-se omo metaestudaro omportamentode séries temporais

multivariadaseavaliarsehámudanças aolongodotempotantonovetor de médias

quanto namatriz de variân ia- ovariân ia. Assim, tem-se omo avaliar, por

(28)

de mudanças no vetor de médias e na matriz de variân ia e ovariân ia de uma

sequên ia de vetores aleatórios om distribuição normal multivariada, no qual,

di-ferentede Cheon& Kim [8℄, distribuições a priori onjugadas serãoutilizadaspara

o vetor de médias e para matriz de variân ia ovariân ia. Estimativasdo vetor de

médiasedamatrizde variân iae ovariân iapara ada instantedotempotambém

serão forne idas. Além disso, será apresentado um pro edimento para

ompara-ções sequen ias dos parâmetros de forma a auxiliar na identi ação de mudanças

signi ativas nos parâmetros de diferentes séries. Na Seção 2.1 são apresentadas alguns resultados úteis para a onstrução do modelo partição produto para dados

multivariados normalmente distribuídos (MPPNM). Na Seção 2.2 é apresentada a onstrução doMPPNM. Na Seção 2.3 é forne ido oalgoritmopara gerar da distri-buiçãoa posteriori onjuntade

(µ

k

, Σ

k

)

epara realizaras omparaçõessequen iais dos parâmetros.

2.1 Inferên ia Bayesiana no modelo normal

multi-variado

Nesteprimeiromomento,serãoapresentadosalgunsresultados úteisparaa

onstru-ção do MPPNM apresentado naSeção 2.2. As funções densidade de probabilidade das distribuições onsideradas neste trabalho, normal

p

-variada,

t

-matriz variada e Wishart-inversa,são apresentadas no Apêndi eA.As propriedadesmatri iais utili-zadas notrabalhoestão noApêndi eC.

Considere umaamostraaleatória

y

1 , ..., y

n

de vetores

p × 1

provenientes de uma distribuição normal

p

-variada om vetor de médias

µ

de dimensão

p × 1

e matriz de variân ia- ovariân ia

Σ

de dimensão

p × p

, a qual é denotada por

y

1 , ..., y

n

|

µ, Σ ∼ N

p

(µ, Σ)

. Considerando Equação (A.1) do Apêndi e A, obtém-se que a

verossimilhança,asso iada a este experimento, é dadapor:

L(µ, Σ|y

1 , ..., y

n

) = (2π)

(−np/2)

|Σ|

−n/2

× exp

−

1

2 (n − 1)tr Σ

−1

_S

_{+ n( ¯}

_y

_{− µ)}

t

_Σ

−1

_{( ¯}

_y

_{− µ)}

,

onde

¯

y

=

n

X

k=1

1 n

y

k

(29)

éo vetor de médias amostraisde dimensão

p × 1

e

S

₌

1 n − 1

n

X

k=1

(y

k

− ¯

y

)(y

k

− ¯

y

)

t

éamatrizde variân ia ovariân iaamostralde dimensão

p × p

. Odesenvolvimento função de verossimilhançaé apresentado no Apêndi e B e, para mais detalhes, ver Johnsonet al. [16℄.

Uma formaalternativa de es rever, emtermos matri iais,a funçã de

verossimi-lhançaé:

L(µ, Σ|Y) = (2π)

(−np/2)

|Σ|

−n/2

exp

−

1

2 tr

Σ

−1

(Y − 1

n

µ

t

)

t

I

n

(Y − 1

n

µ

t

)

,

(2.1) onde

Y

= (y

1 , ..., y

n

)

t

_{, I}

n

éamatrizidentidadedeordem

n×n

e

1 n

denotaumvetor deunsdeordem

n×1

. AverossimilhançaapresentadanaEquação(2.1)foiutilizada para no ál ulo da distribuição preditiva a priori. A Proposição 2.1.1 apresenta alguns resultados úteis quando distribuições priori onjugadas são utilizadas para

des rever a in erteza sobre (

µ

,

Σ

). A demonstração dessa proposição pode ser en ontrada noApêndi eB.

Denote por

W I(D, d)

a distribuição Wishart-inversa om parâmetros

d ∈ ℜ

+

,

tal que

d ≥ p

e

D

é uma matriz positiva denida de dimensão

p × p

. Denote

por

t

ν

(µ, Σ)

a distribuição t-Student multivariada om lo ação

µ

∈ ℜ

p

, matriz

de dispersão

Σ

∈ ℜ

p×p

e graus de liberdade

ν

. Denote por

T

n×p

(ν, M, Ω, Σ)

a distribuição t-Student matriz variada, onde

Ω

é uma matriz positiva denida de dimensão

n × n

,

Σ

éumamatrizpositivadenida dedimensão

p × p

,

M

umamatriz de lo ação de dimensão

n × p

e

ν

é o grau de liberdade. As respe tivas funções densidadesde probabilidadee algumaspropriedades en ontram-se noApêndi e A. Proposição 2.1.1 Seja

y

1 , ..., y

n

uma amostra aleatória de vetores,

p × 1

, de uma distribuição normal

p

-variada,ou seja,

y

k

|µ, Σ

iid

∼ N

p

(µ, Σ)

, onde

µ

é um vetor de

médiasde dimensão

p × 1

,

Σ

é amatriz de variân ia- ovariân ia dedimensão

p × p

e

k = 1, ..., n

. Se, a priori,

µ

|Σ ∼ N

p

(m

,

1 v

Σ

e

Σ

∼ W I(D, d)

, em que

m

é um

vetor demédiasdedimensão

p × 1

e

v

e

d

sãonúmerosreaispositivos, então tem-se que:

a) A distribuição a posteriori onjunta de

(µ, Σ)

é tal que

µ|Σ, y

1 , ..., y

n

∼ N

p

(M, (v + n)

−1

D

∗

);

(30)

b) a distribuição a posteriori de

µ

é

µ|y

1 , ..., y

n

∼ t

d+n+1−p

(M, (d + n + 1 − p)

−1

(v + n)

−1

D

∗

);

) a distribuição preditivaa priori de

Y

é

Y

_{∼ T}

_n×p

d + 1 − p, 1

n

m

t

, I

n

+

1 n

1 t

n

v

, D

,

onde

M

= (n + v)

−1

_{(n ¯}

_y

_{+ vm)}

e

D

∗

_{= D + (n − 1)S +}

nv

n + v

[( ¯

y

− m)( ¯

y

− m)

t

_]

.

Os resultados apresentados naProposição 2.1.1 são onhe idos e serão úteis na obtençãodasdistribuiçõesaposteriori envolvidas noMPPdesenvolvidonapróxima

seção.

2.2 Construção do MPP

O objetivo nesta seção é onstruir um modelo que permita identi ar múltiplas

mudanças,aolongodotempo,novetorde médiasenamatrizde ovariân iaquando

osdados são normalmentedistribuídos. Para isso, será utilizadoo modelo des rito

noCapítulo1.

Seja

Y

1 , ..., Y

n

uma sequên ia de vetores aleatórios de dimensão

p × 1

, onde

Y

k

= (Y

1k

, ..., Y

pk

)

t

,

µ

1 , ..., µ

n

é uma sequên ia de vetores das médias de dimensão

p × 1

e

Σ

1 , ..., Σ

n

é uma sequên ia de matrizes de variân ia ovariân ia, de ordem

p × p

, simétri ae positivadenida. O modelo será onstruído assumindo que,para

k = 1, ..., n

,

Y

_k

|µ

k

, Σ

k

ind

∼ N

p

(µ

k

, Σ

k

)

µ

k

|Σ

k

ind

∼ N

p

(m,

1 v

Σ

k

)

Σ

_k

iid

_{∼ W I(D, d),}

onde

m

é um vetor de médias,

p × 1

,

D

éuma matriz positivade dimensão

p × p

e

v

e

d

são reais positivos.

Considerando a notaçãosimilar a apresentada noCapítulo1, denotepor

Y

_[ij]

_{= (y}

_i+1

_{, y}

_i+2

_{, ..., y}

_j

₎

t

₌







y

(i+1)1

. . . y

(i+1)p

y

(i+2)1

. . . y

(i+2)p

. . . . . . . . .

y

j1

. . .

y

jp







(31)

amatrizblo o de observaçõesde dimensão

(j − i) × p

. Alémdisso, denotepor

µ

[ij]

e

Σ

[ij]

o vetor de médias e a matriz de ovariân ia que indexam a distribuição das observaçõesno blo o

Y

[ij]

. Adi ionalmente, assuma que

(i) As observações

y

i+1

, y

i+2

, ..., y

j

são independentes e identi amente distribuí-das, ondi ionalmenteem

µ

[ij]

e

Σ

[ij]

, omumadistribuiçãonormal

p

-variada, istoé:

Y

_k

|µ

[ij]

, Σ

[ij]

iid

∼ N

p

(µ

[ij]

, Σ

[ij]

)

para

k = i + 1, ..., j;

(ii) Dada uma partição

ρ

=

{i

0 , ..., i

n

}

, existem os parâmetros omuns

(µ

[i

0 i

1 ]

, Σ

[i

0 i

1 ]

), ..., (µ

[i

b−1

i

b

]

, Σ

[i

b−1

i

b

]

)

que são independentes e identi amente

distribuídostaisque

µ

[ij]

|Σ

[ij]

∼N

p

m

_,

1 v

Σ

[ij]

Σ

_[ij]

_{∼W I(D, d).}

(iii) Dada uma partição

ρ

=

{i

0 , ..., i

n

}

e os parâmetros omuns

(µ

[i

0 i

1 ]

, Σ

[i

0 i

1 ]

), ..., (µ

[i

b−1

i

b

]

, Σ

[i

b−1

i

b

]

)

, as observações em diferentes blo os

Y

_i

0 ,i

1

,...,

Y

i

b−1

,i

b

são independentes.

Denotepor

n

r

= i

r

− i

r−1

e

θ

= (θ

1 , ..., θ

n

)

,onde

θ

k

= (µ

k

, Σ

k

)

para

k = 1, ..., n

. Considerando assuposições

(i)

e

(iii)

, obtém-se a verossimilhança omo

L(θ, ρ | y

1 , ..., y

n

) =

b

Y

r=1

f y

[i

r−1

i

r

]

| µ

[i

r−1

i

r

]

, Σ

[i

r−1

i

r

]

=

b

Y

r=1

i

r

Y

k=i

r−1

+1

f y

k

| µ

[i

r−1

i

r

]

, Σ

[i

r−1

i

r

]

=

b

Y

r=1

(2π)

−

nr p

2 |Σ

_[i

r−1

i

r

]

|

−

nr

2 exp

−

1

2 n

(n

r

− 1)tr

h

Σ

−1

[i

r−1

i

r

]

S

[i

r−1

i

r

]

io

× exp

n

r

( ¯

y

[i

r−1

i

r

]

− µ

[i

r−1

i

r

]

)

t

_Σ

−1

[i

r−1

i

r

]

( ¯

y

[i

r−1

i

r

]

− µ

[i

r−1

i

r

]

)

o

(2.2)

Como onsequên ia das suposições anteriores,segue quea distribuição a posteriori

de

θ

k

= (µ

k

, Σ

k

)

é dada pelaexpressão em 1.1, emque

(32)

µ

k

| Σ

k

, ρ, y

i+1

, ..., y

j

∼ N

p

(M

[ij]

, (j − i + v)

−1

Σ

[ij]

),

Σ

_k

_{| ρ, y}

_i+1

_{, ..., y}

_j

_{∼ W I(D}

∗

[ij]

, d + j − i),

onde

M

[ij]

= (j − i + v)

−1

_{((j − i) ¯}

_y

[ij]

+ vm)

,

D

∗

[ij]

= D + (j − i − 1)S

[ij]

+

(j − i)v

j − i + v

( ¯

y

[ij]

− m)( ¯

y

[ij]

− m)

t

,

S

[ij]

=

1 j − i − 1

P

j

k=i+1

(y

k

− ¯

y

[ij]

)(y

k

− ¯

y

[ij]

)

t

e

y

¯

[ij]

=

P

j

k=i+1

1 j − i

y

k

.

As distribuiçõesa posteriori para

ρ

e

p

são obtidas, respe tivamente, das Equa-ções (1.6) e (1.7), onde o fator dados é dado pela seguinte distribuição preditiva a priori porblo os

Y

_[ij]

_{∼ T}

_(j−i)×p

_{d + 1 − p, 1}

_(j−i)

m

t

_{, I}

_(j−i)

₊

1 (j−i)

1 t

(j−i)

v

, D

!

,

obtidano item ( ) daProposição 2.1.1.

2.3 Falta de identi abilidade na identi ação da

mudança

NautilizaçãodoMPPnadete ção depontosde mudançapodemo orrerproblemas

de falta de identi abilidade, ou seja, a mudança pode o orre apenas no vetor de

médiase,noentanto,omodeloidenti a mudanças tambémnamatriz de variân ia

e ovariân ia,por exemplo.

Para auxiliarnaidenti açãodos parâmetrosque, de fato,experimentaram

mu-dança,minimizandooproblema de faltade identi abilidade,aqui propõe-se

onsi-derar oestudo do omportamentoda distribuiçãoa posteriori de

θ

k

− θ

k−1

e para

todo

k = 2, ..., n

testar ashipóteses

H

0 : θ

k

− θ

k−1

= 0

H

a

: θ

k

− θ

k−1

6= 0.

Caso

H

0

sejaa eita,tem-seevidên iasde queoparâmetrossu essivosnotemponão são substan ialmentediferentes. A evidên ia a favor de

H

0

pode ser obtida usando o teste de signi ân ia Bayesiano Completo (Bragança Pereira & Stern [7℄). No

entanto,de isõesbaseada emtaltesteé equivalenteade idir por

H

0

seovalorzero perten eraregiãode maisaltadensidadea posteriori (regiõesHPD).Considerando