NORMAL MULTIVARIADOS
Leonardo Brandão Freitas doNas imento
Dissertação de Mestrado apresentada ao
Programade PósGraduação emEstatísti ada
Universidade Federal de Minas Gerais, omo
parte dos requisitos ne essários à obtenção do
título de Mestre em Estatísti a.
Orientadora:Prof a
RosangelaHelena Los hi,
D.S .
BeloHorizonte
NORMAL MULTIVARIADOS
Leonardo Brandão Freitas doNas imento
DISSERTAÇO SUBMETIDA AO CORPO DOCENTE DO PROGRAMA DE
PÓS GRADUAÇO EM ESTATÍSTICA DA UNIVERSIDADE FEDERAL DE
MINAS GERAIS, COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A
OBTENÇO DO GRAU DE MESTRE EM ESTATÍSTICA.
Examinadapor:
Prof a
.Rosangela Helena Los hi,D.S .
Prof.Clé io daSilva Ferreira,D.S .
Cristianode Carvalho Santos, D.S .
Prof.Flávio Bambirra Gonçalves, D.S .
BELOHORIZONTE, MG BRASIL
Análise de Múltiplos Pontos de Mudança em Modelos
Normal Multivariados/Leonardo Brandão Freitas do
Nas imento. Belo Horizonte: UFMG/ICEx, 2017.
VIII, 105 p.: il.;
29, 7
m.Orientadora:Prof a
RosangelaHelena Los hi,D.S .
Dissertação (mestrado) UFMG/ICEx, Área de
Con entração: Estatísti a, 2017.
Referên ias Bibliográ as: p. 102 105.
1. Modelo Partção Produto. 2. Múltiplas Mudanças.
3. Normal Multivariada. 4. Dados E onmi os. I.
D.S ., Prof a
Rosangela Helena Los hi,. II. Universidade
Federal de Minas Gerais, UFMG, Área de Con entração:
A Deusque através dos meus estudos me permite auxiliá-lo na riação.
Aos membros da ban a, professores Clé io da Silva Ferreira, Flávio Bambirra
Gonçalves e Rosangela Helena Los hi e ao pesquisador Cristiano de Carvalho
San-tosquesedisponibilizaramdefazerpartedaban aepelassugestõesparaamelhoria
dotrabalho. Emespe ial,agradeço aoCristianode CarvalhoSantospelaamizadee
pelos onselhos antes mesmo dadefesa. Tambémagradeço de formaespe ial a
pro-fessora RosangelaHelena Los hique meorientou pa ientemente esempre dedi ada
a resolver os problemas oriundos do trabalho, além da amizade e ompreensão do
fatode eu ter que defender antes doperíodoesperado.
Aosmeusfamiliares,amigoseamigasqueduranteessetempodemestrado
ontri-buíramparaodesenvolvimentodotrabalhoousimplesmentepelofatoda ompanhia
de ada um.
Agradeço à Fundação de Amparo à Pesquisa do Estado de Minas Gerais (F
A-PEMIG)pelonan iamento desta pequisa através do Programade Pós-Graduação
daUniverisdadeFederaldeMinasGerais, omopartedosrequisitosne essáriospara
aobtenção do grau de Mestre emEstatísti a. (M.S .)
ANÁLISE DE MÚLTIPLOS PONTOSDE MUDANÇA EMMODELOS
NORMAL MULTIVARIADOS
Leonardo Brandão Freitas doNas imento
Janeiro/2017
Orientadora:Prof a
RosangelaHelena Los hi, D.S .
Nessetrabalho,propõe-seumaextensãodoModeloPartiçãoProdutoparaa
iden-ti açãode múltiplos pontos de mudança, ao longo do tempo, no vetor de médias
ena matrizde variân ia e ovariân ia de uma sequên ia de dados om distribuição
normal multivariada. Para isso, distribuições a priori onjugadas foram utilizadas
para estimar o vetor de médias e a matriz de variân ia e ovariân ia ao longo do
tempo. Tambémpropõe-se realizaruma omparaçãode ada parâmetro
sequen ial-mente. Para estem, onstrói-seintervalosdemaisaltadensidade(intervalosHPD)
aposteriori para adiferençade parâmetrosemsu essivos instantes de tempo. Para
avaliaromodeloproposto,foram onsideradosalguns enáriossimuladoserealizada
uma apli ação em dados nan eiros, mais espe i amente uma análise do impa to
Lista de Figuras vii
Lista de Tabelas viii
Introdução 1
1 Modelo Partição Produto para dados sequen ialmente observados:
uma revisão 4
1.1 Modelo Partição Produto. . . 5
1.2 Construção doModelo Partição Produto . . . 5
1.3 Métodos omputa ionais . . . 13
2 Identi ando múltiplasmudanças na médiae na ovariân ia de
da-dos Normal Multivariados 16
2.1 Inferên ia Bayesianano modelo normalmultivariado . . . 17
2.2 Construção doMPP . . . 19
2.3 Faltade identi abilidade naidenti açãodamudança . . . 21
3 Análise de sensibilidade do Modelo Partição Produto para Normal
Multivariada 23
3.1 Cenário 1: mudança namédia . . . 24
3.2 Cenário 2: mudança navariân ia . . . 39
3.3 Cenário 3: mudanças emtodos os parâmetros . . . 52
4 Avaliando o efeito do Brexit na e onomia 59
4.1 Ban o de dados . . . 60
4.2 Espe i ações a priori . . . 62
4.3 Análise . . . 63
5 Con lusão 76
C Algumas propriedades matri iais 89
D Grá os 90
3.1 Valores das séries para o enário1. . . 25
3.2 Probabilidade a posteriori do númerode blo os, enário1 . . . 28
3.3 Probabilidadeaposterioride adainstanteserumpontodemudança, enário 2 . . . 30
3.4 Estimativasdoparâmetro
µ
k
dasérie 1, enário 1 . . . 323.5 Estimativasdoparâmetro
µ
k
dasérie 2, enário 1 . . . 343.6 Intervalo HPD de
95%
paraµ
k
− µ
k−1
, série 2 e enário 1 . . . 353.7 Estimativasdoparâmetro
σ
2
k
dasérie 1, enário1 . . . 36 3.8 Estimativasdoparâmetroσ
2
k
dasérie 2, enário1 . . . 37 3.9 Estimativasdoparâmetroσ
2
(12)k
, enário1 . . . 383.10 Valores das séries para o enário1. . . 39
3.11 Probabilidade a posteriori para número de blo os, enário2 . . . 42
3.12 Probabilidadeaposterioride adainstanteserumpontodemudança, enário 2 . . . 43
3.13 Estimativasdoparâmetro
µ
k
dasérie 1, enário 2 . . . 453.14 Estimativasdoparâmetro
µ
k
dasérie 2, enário 2 . . . 473.15 Estimativasdoparâmetro
σ
2
k
dasérie 1, enário2 . . . 48 3.16 Estimativasdoparâmetroσ
2
k
dasérie 2, enário2 . . . 493.17 Intervalo HPD de
95%
paraσ
2
k
− σ
k−1
2
, séries 2 e enário 2 . . . 503.18 Estimativasdoparâmetro
σ
2
(12)
, enário2 . . . 513.19 Valores das séries para o enário3. . . 52
3.20 Probabilidade a posteriori do númerode blo os, enário3 . . . 53
3.21 Distribuição a posteriori daprobabilidade de mudança, enário3 . . 54
3.22 Probabilidadeaposterioride adainstanteserumpontodemudança, enário 3 . . . 55
3.23 Estimativasdoparâmetro
µ
k
dasérie 1e 2, enário 3 . . . 563.24 Intervalo HPD de
95%
paraµ
k
− µ
k−1
, séries 1 e2, enário3 . . . 573.25 Estimativasdos parâmetros
σ
2
k
eσ
k
(12)
2
, enário3 . . . 584.1 Retornos dos índi es nan eiros da Alemanha, EUA, França, Reino Unido e Suíça. . . 61
4.3 Probabilidade a posteriori dos blo os, apli ação . . . 64
4.4 Distribuição a posteriori daprobabilidade de mudança, apli ação . . 65
4.5 Probabilidade a posteriori de ada instante ser ponto de mudança, apli ação . . . 65
4.6 Estimação para
µ
k
,estudo de aso . . . 674.7 Estimação para
µ
k
,estudo de aso . . . 684.8 Estimação para
µ
k
,estudo de aso . . . 694.9 Estimação para
σ
2
k
, estudo de aso. . . 70 4.10 Estimação paraσ
2
k
, estudo de aso. . . 71 4.11 Estimação paraσ
2
k
, estudo de aso. . . 724.12 Estimação para ovariân ia,estudo de aso . . . 73
4.13 Estimação para ovariân ia,estudo de aso . . . 74
4.14 Estimação para ovariân ia,estudo de aso . . . 75
D.1 Cadeia de
µ
50
eµ
51
, enário 1e série 2 . . . 90D.2 Distribuição de
µ
51
− µ
50
, enário1 esérie 2 . . . 91D.3 Cadeias daprobabilidadede mudança, enário 1 . . . 91
D.4 Cadeia de
σ
2
51
eσ
2
51
− σ
50
2
, enário1 esérie 2 . . . 91D.5 Distribuição a posteriori daprobabilidade de mudança, enário1 . . 92
D.6 Cadeia de
µ
51
eµ
51
, enário 2e série 1 . . . 93D.7 Cadeia de
σ
2
52
eσ
2
52
, enário 2e série 2 . . . 93 D.8 Distribuiçãoσ
2
53
− σ
52
2
, enário 2e série 2 . . . 94D.9 Distribuição a posteriori daprobabilidade de mudança, enário2 . . 95
D.10Cadeias damédia, variân iae ovariân ia, estudode aso . . . 96
D.11Cadeias daprobabilidadede mudança, estudo de aso . . . 97
D.12Estimativaspara ovariân ia,estudo de aso . . . 97
D.13Estimativaspara ovariân ia,estudo de aso . . . 98
D.14Estimativaspara ovariân ia,estudo de aso . . . 99
D.15Estimativaspara ovariân ia,estudo de aso . . . 100
D.16Estimativaspara ovariân ia,estudo de aso . . . 101
1.1 Relação entre a partição
ρ
e onúmerode blo osB
. . . 51.2 Relação entre
ρ
eU
. . . 133.1 Estatísti as a priori, enário1 . . . 26
3.2 Probabilidade a posteriori das partições, enário1 . . . 27
3.3 Estimativasa posteriori para a probabilidadede ponto de mudança, enário 1 . . . 28
3.4 Estimativasa priori, enário 2 . . . 40
3.5 Probabilidade aposterioridas partições, enário2 . . . 41
3.6 Estimativaspara aprobabilidade de ponto de mudança, enário2 . . 42
3.7 Média evariân ia a priori para
l = 1, 2
. . . 523.8 Probabilidade aposterioridas partições, enário3 . . . 53
4.1 Média evariân ia dos parâmetros, para
l, t = 1, ..., 9
. . . 624.2 Probabilidade a posteriori das partições, apli ação. . . 63
A identi ação de pontos de mudança é um problema estatísti o relevante, pois
possibilita onje turar sobre os fenmenos que os ausaram e auxilia na avaliação
de açõesaserem tomada. Nesse sentido, um pontode mudançapode ser entendido
omo uma quebra estrutural em uma série temporal ou, simplesmente, um valor
atípi oque o orre emum ban o de dados.
Oproblemadeidenti açãodepontosdemudança,emdadosobservados
sequen- ialmente, esta presenteemdiversas áreas omo,porexemplo, emestudo
hidrológi- os(Perreaultetal.[36℄), limatológi os(Ruggieri[40℄),e onmi os(Arellano-Valle
et al. [2℄) e so ais (Los hi et al. [27℄). Problemas de pontos de mudança também
o orremem segmentação de textos omo pode ser visto emKehagias et al.[17℄.
Nesse sentido, sefaz ne essária autilizaçãode modelos estatísti os em onjunto
om ferramentas omputa ionais apazes de re onhe e -los adequadamente e,
on-sequentemente, ajudar nas tomadas de de isões. Assim, diversas abordagens e
me-todologiasforamdesenvolvidasparaa aptaçãodospontosdemudançaem onjunto
de dados observados sequen ialmente, entre as quaisdesta am-se a metodologia de
máximaverossimilhança (Hinkley[13℄, Bhatta harya [5℄, Liu[21℄)e pro edimentos
Bayesianos baseados emmétodos paramétri osenão paramétri os(Martínez etal.
[31℄, Allenet al. [1℄ e Hartigan[12℄).
Do ponto de vista Bayesiano paramétri o e onsiderando apenas um ponto de
mudança, desta a-se o trabalho de Smith [42℄ que onsiderou o problema de
mu-dança namédia de uma sequên ia de variáveisaleatórias om distribuições normal
e binomial. Lee & Heghinian [20℄ também estudaram uma mudança na média em
uma sequên ia de variáveis aleatórias independentes om distribuição normal,
va-riân ia des onhe ida e omum. Trabalhos apli ados na área e onmi a podem ser
vistos em Booth & Smith [6℄, Diaz [9℄, Holbert [14℄ e Salazar [41℄. Ainda sobre
a perspe tiva Bayesiana paramétri a, ita-se os trabalhos de Perreault et al. [37℄,
que onsiderou um ponto de mudança no vetor de médias e Son & Kim [43℄, que
onsiderouumpontode mudançatantonovetor de médiasquanto namatrizde
o-variân ia,emuma sequên iade variáveisaleatóriasindependentes om distribuição
normalmultivariada.
props o Modelo Partição Produto (MPP) em que onsidera a suposição da
exis-tên ia de múltiplos pontos de mudança. No MPP tanto o número de pontos de
mudança quanto os instantes em que o orreram são quantidades des onhe idas as
quaisdevemser estimadas,logo,tornandoomodelomaisexível. Barry&Hartigan
[3℄ desenvolveram uma versão do MPP para a identi ação de pontos de mudança
em dados observados sequen ialmente, no qual apenas blo os ontíguos são
on-siderados. Posteriormente, Barry & Hartigan [4℄ apli aram o MPP para inferir
sobremúltiplospontos de mudançana médiada distribuiçãonormal om variân ia
onstante e des onhe ida. Uma grande ontribuição de Barry & Hartigan [4℄ foi o
desenvolvimento de um algoritmo para gerar da distribuição a posteriori de uma
partição om blo os ontíguos, emque usam o amostrador de Gibbs. Apli ações e
extensõesdoMPPpodemservistosemLos hietal.[28℄,Monteiroetal.[32℄,Los hi
et al.[24℄,Quintana &Iglesias [38℄, Müller et al. [34℄ eentre muitos outros
Adete çãodemúltiplasmudançasemsériestemporaismultivariadasédegrande
interesseeumproblemaaindapou oexplorado. Seestassériessão orrela ionadas,a
o orrên iadealgumamudançano omportamentodeumadelaspodegerarmudança
em alguma outra. Nesse enário, o presente trabalho onsidera que uma sequên ia
de vetores aleatórios,
Y
1
, ..., Y
n
,de dimensãop × 1
são independentes edistribuídos segundo uma distribuição normal multivariada om vetores de médiasµ
k
,p × 1
, e matriz de ovariân iaΣ
k
,p × p
, parak = 1, ..., n
. Assim sendo, temos omo objetivosutilizaroMPPpara identi armúltiplospontosde mudançasnovetor demédiasenamatrizde variân ia- ovariân ia. Alémde estimar
µ
k
eΣ
k
para todok
, tambémestima-seonúmerode pontosde mudançaeasposiçõesonde asmudançaso orreram. Distribuiçõesa priori onjugadas são utilizadas para
µ
k
eΣ
.O modelo apresentado nesse trabalho é uma extensão ao propostos em Cheon
& Kim [8℄ e em Moura [33℄. Moura [33℄, por exemplo, utilizou o modelo partição
produtoparaaidenti açãode mudanças namatrizde variân iae ovariân iapara
uma sequên ia de dados om distribuição normal multivariada entrado no vetor
nulo. Cheon & Kim [8℄ apli aramo algoritmoMonteCarlo om aproximação
esto- ásti a para a dete ção de múltiplos pontos de mudanças no vetor de médias e na
matriz de variân ia e ovariân ia de dados om distribuição normal multivariada.
No entanto, Cheon & Kim [8℄ onsideraram uma distribuição a priori vaga para
o vetor de médias, ou seja,
π(µ
k
) = 1
e estimam apenas a partição dos dados, o número de blo os e a probabilidade de ada instante ser um ponto de mudança,não forne endo estimativaspara os parâmetros noinstante
k
e, onsequentemente, não havendo a identi ação em qual parâmetro e em qual variável houve amu-dança. Além desses trabalhos, desta am-se tambémo de Lavielle & Teyssiere [19℄,
máximaverossimilhançaparaadete ção de múltiplospontosde mudançaemséries
multivariadas. Re entemente, James &Matteson[15℄disponibilizaramopa otee p
nosoftware R Core Team [39℄, noqual utiliza daabordagemnão paramétri apara
aanálise de múltiplos pontos de mudançaem dados multivariados.
Em estudos de pontos de mudança usando o MPP, omumente o orrem
pro-blemas de falta de identi abilidade. Por exemplo, no problema de identi ação
de múltiplas mudanças na média e variân ia de uma sequên ia de variáveis
nor-malmente distribuídas (Los hi & Cruz [22℄), a mudança real pode o orrer apenas
no média e não na variân ia. No entanto, estudos simulados mostram que as
es-timativas forne idas pelo modelo indi arão também uma mudança na variân ia e
eminstantes próximos a mudançadete tada na média. Problemas similares a este
também o orrerão no ontexto multivariado. Neste aso, podemos, por exemplo,
inferirque hámudança emtodas assérie quando apenas uma destas experimentou
amudança. Para analisar osresultados e minimizareste tipo de problema da falta
de identi ação,propõe-se realizaruma omparaçãode ada parâmetro
sequen ial-mente. Para estem, onstrói-seintervalosdemaisaltadensidade(intervalosHPD)
a posteriori para a diferença de parâmetros em su essivos instantes de tempo. O
intervaloHPD serela iona omaevidên iaaposteriori forne idapelotestede
signi- ân iabayesiano ompleto (FBST) introduzidoporBragança Pereira &Stern [7℄.
Assim,pode-se onsidera-loparatestarseadiferençade adaparâmetroem
instan-tes su essivos de tempo é signi amente diferente de zero, on luindo-se diferença
signi ativaquando ovalorzero não perten e aointervalo.
Para avaliarodesempenho do modelo, onsiderou-se algunsban os de dados
si-mulados. Alémdisso,tambémrealizou-seumaapli açãoemque onsisteemavaliar
oefeitodoBrexit nae onomiadeoitopaíses. Essetermoéaabreviaçãodaspalavras
em inglês Britain (Grã-Bretanha) e exit (saída) e designa a saída do Reino Unido
daUnião Europeia. Para esse estudos foram onsiderados nove índi esnan eiros:
DAX (Deuts her Aktienindex) da Alemanha, IBEX 35 (Iberia Index) da Espanha,
CAC 40 ( Cotation Assistée en Continu) da França, ATG (Athens General) da
Gré ia, FTSE MIB (Finan ial Times Sto k Ex hange Milano Indi e di Borsa) da
Itália, PSI-20 (Portuguese Sto k Index) de Portugal, FTSE 100 Reino Unido
(Fi-nan ial Times Sto k Ex hange), SMI (Swiss Market Index) da Suíça e S&P 500
(Standard & Poor's 500) dos Estados Unidos. Tais índi es são responsáveis por
mediro desempenho e onmi o dos países emestudo
Este trabalho está organizado omo segue. No Capítulo 1, é apresentado uma revisão do MPP desenvolvido em Barry & Hartigan [3℄ e Barry & Hartigan [4℄, as
extensõespropostaemLos hi&Cruz[25℄eométodo omputa ionalparaobter-seas
realizarostestessequen iais. NoCapítulo3,érealizadoumaanálisedesensibilidade domodelo proposto através de três enáriossob diferentes óti as. No Capítulo4, é analisadooefeito doBrexit nae onomia de oitopaíses.
Modelo Partição Produto para dados
sequen ialmente observados: uma
revisão
OModelo Partição Produtofoi denido, nasua formamais geral, emHartigan[12℄
e onsidera a suposição da existên ia de múltiplos pontos de mudança em um
de-terminadoban o de dados. Dessaforma,o MPPé mais exível quando omparado
aosmodelosque onsideram apresença de apenasum pontode mudança. NoMPP
tanto onúmerode pontosde mudanças quanto osinstantes emqueestes o orreram
são quantidades a serem estimadas. Barry &Hartigan [3℄ parti ularizaramo MPP
para a identi ação de pontos de mudança em dados observados sequen ialmente
porassumirem queapenas blo os ontíguos são onsiderados. Barry& Hartigan[3℄
forne eram expressões analíti as para as distribuições a posteriori dos parâmetros
queindexam a função de distribuição dos dados e para suas esperanças.
Posterior-mente, Barry & Hartigan [4℄ apli aramo MPP para inferir sobre múltiplos pontos
de mudança na média de uma sequên ia de dados normalmente distribuídos e
as-sumindovariân ia omum e des onhe ida em ada instantedo tempo. Alémdisso,
propuseramum algoritmobaseado noamostrador de Gibbspara gerarda
distribui-çãoa posteriori dapartiçãoaleatóriaquandoapenas blo os ontíguos sãopossíveis.
Maistarde,Los hi etal. [23℄implementou oamostradorde Gibbs para gerarda
dis-tribuição a posteriori do número de pontos de mudanças e para os instantes nos
quais estes o orreram. Los hi et al. [23℄ também onsiderou a oesão denida em
Yao [44℄, no qual depende de uma probabilidade
p
de haver mudança em algum instante, assumindo uma distribuição a priori degenerada para ap
. Los hi et al. [26℄ fez uma extensãode Los hiet al. [23℄assumindo distribuiçõesa priori nãode-generadas para a
p
. Posteriormente, Ferreira et al. [10℄ apresenta uma versão do MPPno qual onsidera os blo os orrela ionados.deniçõese on eitos bási os inerentes ao MPP. Na Seção1.2 édenido oMPP no aso paramétri oe são apresentadas as distribuições a priori ea posteriori da
par-tiçãoaleatória,donúmerode blo os eaprobabilidadea posteriori de adainstante
serumpontodemudança. Porm,naSeção1.3,édes ritoométodo omputa ional queé utilizadopara a obtenção das estimativas de interesse doMPP.
1.1 Modelo Partição Produto
Sejam
y
1
, ...y
n
uma série temporal observada eI
o onjunto formado pelos índi es{1, ..., n}
que indexam tais observações. Denote porρ
a partição aleatóriadoon-junto
I
S{0}
e B o númerode blo os dapartiçãoρ
. Denote por[ij]
osub onjunto deI
formado pelos indi ies{i + 1, ..., j}
, parai < j
ei, j ∈ I
S{0}
, e pory
[ij]
o blo oformado pelas observaçõesy
i+1
, ..., y
j
.Assumindoquesomenteblo os ontíguosdeobservaçõessãopossíveis, adavalor
dapartiçãoaleatória
ρ
édaformaρ = {i
0
, i
1
, ..., i
b
}
,emque0 = i
0
< i
1
< ... < i
b
=
n
, parab ∈ I
, a qual divide onjunto de obervações emB = b
blo os vizinhos daseguinteforma:
[y
1
, ..., y
i
1
] [y
i
1
+1
, ..., y
i
2
] ...
y
i
b−1
+1
, ..., y
i
b
.
A o orrên ia da partição
ρ = {i
0
, i
1
, ..., i
b
}
impli a na o orrên ia deb − 1
mu-dançasno omportamentodasérie observada nos instantesi
1
+ 1, ..., i
b−1
+ 1
. Para melhor ompreensão, ver Tabela(1.1).Exemplo 1.1.1 Seja
y
1
, y
2
, y
3
uma série temporal observada. Então, tem-se queI
S 0 = {0, 1, 2, 3}
e os dados podem ser divididos de2
n−1
formas diferentes omo
mostra a Tabela 1.1.
Tabela1.1: Relação entre a partição
ρ
e o númerode blo osB
. Blo ode observações Valores deρ
Valores deB
[y
1
, y
2
, y
3
]
{i
0
= 0, i
1
= 3}
1[y
1
] , [y
2
, y
3
]
{i
0
= 0, i
1
= 1, i
2
= 3}
2[y
1
, y
2
] , [y
3
]
{i
0
= 0, i
1
= 2, i
2
= 3}
2[y
1
] , [y
2
] , [y
3
]
{i
0
= 0, i
1
= 1, i
2
= 2, i
3
= 3}
3Denidosesses elementos bási os,napróximaseçãoserá apresentado oMPPem
Seja
θ
1
, ..., θ
n
umasequên iadeparâmetros sobreoespaçoparamétri oΘ
eY
1
, .., Y
n
uma sequên ia de variáveis aleatórias. Considere que, dadosθ
1
, ..., θ
n
, as variáveisY
1
, .., Y
n
são independentes e om omportamentodado porf
1
(y
1
|θ
1
), ..., f
n
(y
n
|θ
n
)
,respe tivamente. No MPPassume-se que:
1 Dado
ρ = {i
0
, i
1
, ..., i
b
}
, a sequên ia de parâmetrosθ
1
, ..., θ
n
é parti ionadaem b blo os ontíguos, no qual
θ
[ij]
denota o parâmetro omum que indexa a distribuiçãodas variáveis aleatóriasdoblo oY
[ij]
,ou sejaθ
k
= θ
[i
r−1
i
r
]
∀ i
r−1
< k ≤ i
r
,
k = 1, ..., n e r = 1, ..., b.
Destaforma,ovetordeparâmetros
θ
= (θ
1
, ...θ
1
)
podeserrees ritodaseguinte forma:θ
=
b
X
r=1
θ
[i
r−1
i
r
]
1{i
r−1
< 1 ≤ i
r
}, ..., θ
[i
r−1
i
r
]
1{i
r−1
< n ≤ i
r
} ,
onde
1{A}
denota afunção indi adora do eventoA
2 Dado
ρ = {i
0
, i
1
, ..., i
b
}
,tem-se queosparâmetros omunsθ
[i
0
i
1
]
, ..., θ
[i
b−1
i
b
]
sãoindependentes e
θ
[ij]
possui distribuição a prioriπ
[ij]
(θ)
omθ ∈ Θ
[ij]
, ondeΘ
[ij]
é oespaço paramétri odeθ
[ij]
.O MPP estabele e a distribuição onjunta de
ρ
, das observações e dos parâmetros omomostra a denição abaixo.Denição 1.2.1 A quantidade aleatória
((Y
1
, θ
1
), ..., (Y
n
, θ
n
); ρ)
possui o seu om-portamento des rito pelo MPP paramétri o, denotado por((Y
1
, θ
1
), ..., (Y
n
, θ
n
); ρ) ∼
MP P
, se:(1) A distribuição a priori para
ρ
é uma distribuição produto, ou seja:P (ρ = {i
0
, i
1
, ..., i
b
}) =
Q
b
r=1
c
[i
r−1
i
r
]
P
C
Q
b
r=1
c
[i
r−1
i
r
]
,
onde
c
[ij]
é a oesão do blo o[ij]
(ver detalhes a seguir) eC
é o onjunto de todas as possíveis partições deI
emb
blo os ontíguos∀b ∈ I
.(2) Condi ionalem
ρ = {i
0
, i
1
, ..., i
b
}
, tem-sequeasobservaçõesemdiferentes blo- ossãoindependenteseasobservaçõesem adablo oy
[ij]
possuemdistribuiçãoindexadapelo parâmetro
θ
[ij]
, ou seja:f (y
1
, ..., y
n
; θ
1
, ..., θ
n
|ρ = {i
0
, i
1
, ..., i
b
}) =
b
Y
r=1
i
r
Y
k=i
r−1
+1
f (y
k
|θ
[ij]
)π
[i
r−1
i
r
]
(θ
[ij]
).
(3) Condi ionalem
ρ
, a distribuição a priori paraθ
= (θ
1
, ..., θ
n
)
éπ(θ) = π(θ
[i
0
i
1
]
) · · · π(θ
[i
b−1
i
b
]
)
=
b
Y
r=1
π(θ
[i
r−1
i
r
]
).
Uma partiçãotende a agregarem um mesmo blo o observações om
omporta-mentos semelhantes. Diante disso, para des rever ain erteza ini ialsobre
ρ
, Harti-gan[12℄denec
[ij]
a oesãoasso iadaaoblo odeobservações[ij]
. SegundoHartigan [12℄,c
[ij]
é um valornuméri oe não negativoque representa ograu de similaridade existenteentreobservaçõesdoblo o[ij]
,podendoserinterpretada,quandoosdados sãosequen ialmenteobservados, omoumaprobabilidadede transição da adeiadeMarkov
Z
a
, a ∈ {0, ..., n}
, ondeZ
a
assume valores em{i
0
, i
1
, ..., i
b
}
, isto é, orres-pondeao instanteemque o orre aa
-ésima mudançana estrutura dadistribuição. Desse modo, tem-se que a oesão do blo oc
[ij]
é a probabilidade do instante daa
-ésima mudança ser oj
dado que a(a − 1)
-ésima mudança o orreu no instantei
([3℄).Como onsequên ia da Denição 1.2.1, tem-se que a distribuição onjunta de
y
1
, ..., y
n
dadoρ
, é dada porf (y
1
, ..., y
n
|ρ = {i
0
, i
1
, ..., i
b
}) =
b
Y
r=1
f
[i
r−1
i
r
]
(y
[i
r−1
i
r
]
),
ondef
[i
r−1
i
r
]
(y
[i
r−1
i
r
]
) =
Z
i
r
Y
k=i
r−1
+1
f (y
k
|θ)π
[i
r−1
i
r
]
(θ)dθ
édenominadafatordedadose orrespondeadistribuiçãopreditivaapriori asso iada
aoblo o
[ij]
.A partir da Denição 1.2.1, pode ser mostrado que a distribuição a priori do númerode blo os napartição
ρ
édado por:P (B = b) =
X
C
′
Q
b
r=1
c
i
r−1
i
r
P
C
Q
b
r=1
c
i
r−1
i
r
,
onde
C
′
é um sub onjunto de todas aspartiçõesem
I
om exatamenteb
blo os. Barry & Hartigan[3℄ também mostraram que asdistribuições a posteriori paraρ
e B são dadas,respe tivamente, por:P (ρ|y
1
, ...., y
n
) ∝
b
Y
r=1
c
∗
i
r−1
i
r
P (B = b|y
1
, ...., y
n
) ∝
X
C
′
b
Y
r=1
c
∗
i
r−1
i
r
∀b ∈
I,
ondec
∗
[ij]
= c
[ij]
f
[ij]
(y
[ij]
)
,∀i, j ∈{0, ..., n}
ei < j
, denota a oesão a posteriori doblo o
[ij]
.Em geral, a distribuição a posteriori de
ρ
forne e uma boa informação sobre a probabilidade de ada instante ser um ponto de mudança. Los hi & Cruz [25℄props ummétodopara al ularaprobabilidade a posteriori de ada instanteser
um ponto de mudança.
Seja
C
k
umsubgrupodeC
que ontém todasaspartiçõesquein luemoinstantek
omopontode mudança, ouseja, ada partiçãoemC
k
édaforma{i
0
, ..., i
l−1
, i
l
=
k − 1, i
l+1
, ..., i
b
}
paraalguml ∈ I
. SejaoeventoA
k
quedenotaok
-ésimoinstanteéum ponto de mudança, para
k = 2, ..., n
. Portanto,a probabilidade de um instantek
ser um ponto de mudançaéP (A
k
|y
1
, ..., y
n
) =
X
C
k
P ({i
0
, ..., i
l−1
, i
l
= k − 1, i
l+1
, ..., i
b
}|y
1
, ..., y
n
)
∝
X
C
k
l−1
Y
r=1
c
∗
[i
r−1
i
r
]
!
c
∗
[i
l−1
(k−1)]
c
∗
[(k−1)i
l+1
]
b
Y
r=l+1
c
∗
[i
r−1
i
r
]
!
.
Similarmente, a probabilidade a posteriori para dois instantes espe í os,
k
′
e
k
∗
,
serempontosde mudanças pode ser obtida apartir da probabilidadede
A
k
′
∩ A
k
∗
,eassim por diante.
Considerando o item
(2)
da Denição 1.2.1, observa-se que o omportamentoa posteriori do parâmetroθ
[ij]
depende do blo oy
[ij]
a que está asso iado. Portanto, omo mostrado em Barry & Hartigan [3℄, a distribuição a posteriori para adaθ
k
,k = 1, ..., n
,é dada porf (θ
k
|y
1
, ..., y
n
) =
k−1
X
i=0
n
X
j=k
r
∗
[ij]
f (θ
k
|y
[ij]
),
(1.1) onder
∗
[ij]
denota a relevân ia a posteriori do blo o[ij]
, a qual é denida omo sendo,r
∗
[ij]
= P ([ij] ∈ ρ|Y
1
, ..., Y
n
)
. Barry & Hartigan [3℄ também mostraram quea posteriori de ada
θ
k
, ouseja,ˆ
θ
k
= E(θ
k
|y
1
, ..., y
n
) =
k−1
X
i=0
n
X
j=k
r
∗
[ij]
E(θ
k
|y
[ij]
).
A es olha da oesão
c
[ij]
expressa aper epção ini ial do pesquisadorem relação ao grau de similaridade entre as observações perten entes ao blo o[ij]
ou sobre o quãoprovável taisobservações perten erem ao mesmo luster. Portanto, a es olhada oesão é fundamental no pro esso de inferên ia. Algumas oesões utilizadas
frequentementesão:
• c
[ij]
= 1
: assumindoesta oesão paratodosos lusters, tem-se quea distribui-ção a priori paraρ
será uma uniforme no onjunto de todas as partições em blo os ontíguos deI
, ouseja,P (ρ = {i
0
, ..., i
b
}) = 2
−(n−1)
;
• c
[ij]
=
1
j − i
: assumindoesta oesão, tem-sequea on epçãoini ialdopesqui-sadorrevelaque asobservaçõessão pou os similares,pois este tipo de oesão
atribuialta probabilidade a blo os om pou as observações, induzindo
parti-ções om muitos blo os.
• c
[ij]
= j − i
: assumindo esta oesão, tem-seque a on epção ini ial dopesqui-sador revelaque as observações são similares,pois este tipo de oesão atribui
pesos maioresa blo os om muita observações, formando, om grande
proba-bilidade,partições om pou os blo os.
No presente trabalho, será adotada a oesão proposta por Yao [44℄. Seja
p
a probabilidadede que umanova mudançao orraemalguminstantedasequên iadeobservações. Então, a oesão a priori para oblo o
[ij]
é dada por:c
[ij]
=
(
p(1 − p)
j−i−1
,
sej < n,
(1 − p)
i−j−1
,
sej = n,
(1.2)onde
i, j ∈ I ∪ 0
ei < j
. Tal oesão orresponde à probabilidade que uma novamudança o orra após
j − i
instantes, dado que o orreu uma mudança no instantei
. Condi ional emp
, asdistribuiçõesa priori deρ
eB
são, respe tivamente, dadas por:P (B = b|p) =
n − 1
b − 1
p
b−1
(1 − p)
n−b
,
b ∈
I.
Atribuindouma distribuiçãoa priori
π(p)
,obtem-se asdistribuiçõesa priori deρ
eB
omo segue. A distribuiçãoa priori deρ
é dada porP (ρ = {i
0
, ..., i
b
}) =
Z
1
0
(ρ = {i
0
, ..., i
b
} | p) π(p)dp
=
Z
1
0
p
b−1
(1 − p)
n−b
π(p)dp,
P (B = b) =
Z
1
0
P (B = b | p) π(p)dp
=
n − 1
b − 1
Z
1
0
p
b−1
(1 − p)
n−b
π(p)dp.
Como onsequên ia,tem-seque asdistribuiçõesaposteriori de
ρ
eB
são dadas, respe tivamente, por:P (ρ = {i
0
, ..., i
b
} | y
1
, ..., y
n
) =
P (ρ; y
1
, ..., y
n
)
P (y
1
, ..., y
n
)
∝
Z
1
0
P (y
1
, ..., y
n
; ρ, p) dp
∝
Z
1
0
P (y
1
, ..., y
n
| ρ, p) P (ρ | p) π(p)dp
∝
Z
1
0
b
Y
r=1
f
i
r−1
i
r
y
i
r−1
i
r
p
b−1
(1 − p)
n−b
π(p)dp
∝
b
Y
r=1
f
i
r−1
i
r
y
i
r−1
i
r
Z
1
0
p
b−1
(1 − p)
n−b
π(p)dp
(1.3) eP (B = b | y
1
, ..., y
n
) =
X
C
′
P (ρ = {i
0
, ..., i
b
} | y
1
, ..., y
n
)
=
X
C
′
P (ρ = {i
0
, ..., i
b
} , y
1
, ..., y
n
)
P (y
1
, ..., y
n
)
∝
X
C
′
Z
1
0
P (y
1
, ..., y
n
| ρ, p) P (ρ | p) π(p)dp
∝
n − 1
b − 1
b
Y
r=1
f
i
r−1
i
r
y
i
r−1
i
r
Z
1
0
p
b−1
(1 − p)
n−b
π(p)dp.
Alémdisso, tem-seque aprobabilidadea posteriori de um parti ular instante
k
ser um ponto de mudança e a distribuição a posteriori dep
são dadas, respe tiva-mente, dada por:P (A
k
| y
1
, ..., y
n
) =
X
C
k
P (ρ = {i
0
, ..., i
l−1
, i
l
= k − 1, i
l+1
, ..., i
b
} | y
1
, ..., y
n
)
=
X
C
k
P (ρ = {i
0
, ..., i
l−1
, i
l
= k − 1, i
l+1
, ..., i
b
} ; y
1
, ..., y
n
)
P (y
1
, ..., y
n
)
∝
X
C
k
Z
1
0
P (y
1
, ..., y
n
| ρ, p) P (ρ | p) π(p)dp
∝
X
C
k
b
Y
r=1
f y
i
r−1
i
r
Z
1
0
p
b−1
(1 − p)
n−b
π(p)dp,
(1.4) eP (p | y
1
, ..., y
n
) =
P (y
1
, ..., y
n
; p)
P (y
1
, ..., y
n
)
∝
X
C
P (y
1
, ..., y
n
; ρ, p)
∝
X
C
P (y
1
, ..., y
n
| ρ, p) P (ρ | p) π(p)
∝
X
C
b
Y
r=1
f y
i
r−1
i
r
p
b−1
(1 − p)
n−b
π(p),
(1.5)onde
C
k
éosub onjuntodeC
que ontém todasaspartiçõesquein luemoinstantek
omo ponto de mudança.Para ompletar as espe i ações do modelo pode-se utilizar uma distribuição a
priori para
p
. Neste trabalho,p ∼ Beta(α, β)
, omα > 0
eβ > 0
. Consequente-mente as,distribuiçõesa priori deρ
eB
serão, respe tivamente:P (ρ = {i
0
, ..., i
b
}) =
Z
1
0
P (ρ = {i
0
, ..., i
b
} | p) π(p)dp
=
Γ (α + β) Γ (α + b − 1) Γ (n + β − b)
Γ (α) Γ (β) Γ (n + α + β − 1)
P (B = b) =
Z
1
0
P (B = b | p) π(p)dp
=
n − 1
b − 1
Γ (α + β) Γ (α + b − 1) Γ (n + β − b)
Γ (α) Γ (β) Γ (n + α + β − 1)
.
Note que
B = W + 1
, ondeW
é uma variável aleatória om distribuiçãoBeta-Binomial de parâmetros
n − 1
,α
eβ
, paraα > 0
eβ > 0
, denotada porW ∼
Bb(n − 1, α, β)
. A função de probabilidadedeW
édada por:f (W | n−1, α, β) =
n − 1
w
Γ (α + β) Γ (α + w) Γ (n + β − w − 1)
Γ (α) Γ (β) Γ (n + α + β − 1)
,
w = 0, 1, ..., n−1.
A esperança e avariân iade
W
é dada, respe tivamente, porE(W ) = (n − 1)
α
α + β
e
V ar(W ) = (n − 1)
αβ(α + β + n − 1)
(α + β)
2
(α + β + 1)
.
Consequentemente, tem-se queaesperançae avariân iadavariávelaleatória
B
são dadas, respe tivamente, porE(B) = (n − 1)
α
α + β
+ 1
e
V ar(B) = (n − 1)
αβ(α + β + n − 1)
(α + β)
2
(α + β + 1)
.
A partir daEquação (1.3), tem-seque a distribuiçãoa posteriori de
ρ
é:P (ρ = {i
0
, ..., i
b
} | y
1
, ..., y
n
) ∝
b
Y
r=1
f
i
r−1
i
r
y
i
r−1
i
r
Γ (α + β ) Γ (α + b − 1) Γ (n + β − b)
Γ (α) Γ (β) Γ (n + α + β − 1)
.
(1.6)P (B = b | y
1
, ..., y
n
) ∝
n − 1
b − 1
b
Y
r=1
f
i
r−1
i
r
y
i
r−1
i
r
Γ (α + β ) Γ (α + b − 1) Γ (n + β − b)
Γ (α) Γ (β) Γ (n + α + β − 1)
Alémdisso, dasequações(1.4)e(1.5)tem-sequeasdistribuiçõesaposteriori de
A
k
ep
são dadas, respe tivamente, por:P (A
k
| y
1
, ..., y
n
) ∝
X
C
k
b
Y
r=1
f y
i
r−1
i
r
Γ (α + β ) Γ (α + β − 1) Γ (n + β − b)
Γ (α) Γ (β) Γ (n + α + β − 1)
P (p | y
1
, ..., y
n
) ∝
X
C
b
Y
r=1
f y
i
r−1
i
r
p
α+b−2
(1 − p)
n+β−b−1
.
(1.7) 1.3 Métodos omputa ionaisObserve que não é trivial gerar amostras de
ρ
a partir da distribuição ondi ional ompleta,poisadimensão deρ
não éxaeonúmerode partiçõespossíveis res e a medidaquen
aumenta. Para ontornarestadi uldadeBarry&Hartigan[4℄props uma transformação de variáveis em queρ
é representada omo um vetor ujas as omponentes são variáveis binárias. Ao fazer isto, pode-se gerar da distribuição aposteriori de
ρ
via amostrador de Gibbs. Tal pro edimento émostrado aseguir. Considere umaquantidade aleatóriaU
r
quereete sehouve ounãomudançano instanter + 1
, ouseja,U
r
=
(
1,
seθ
r
= θ
r+1
,
0,
seθ
r
6= θ
r+1
,
para
r = 1, ..., n − 1
. Assumindo esta transformação, ada valor deρ
pode seridenti ado porum valordovetor
U
= (U
1
, ..., U
n−1
)
, istoé,ρ = {i
0
, ..., i
b
} ⇔ (U
1
= 1, ..., U
i
1
−1
= 1, U
i
1
= 0, U
i
1
+1
= 1, U
i
2
−1
= 0, U
i
2
= 0, ...,
U
i
b−1
−1
= 1, U
i
b−1
= 0, U
i
b−1
+1
= 1, ..., U
i
b
= 1).
Para melhor ompreensão, verTabela1.2.
Umadas vantagensde se onsideraratransformação
U
équeesteterádimensão xa em ada parte do algoritmo. Então, ada partição(U
s
1
, ..., U
n−1
s
)
,s ≥ 1
, é-Tabela 1.2: Relaçãoentre
ρ
eU
Blo ode observações Valores de
ρ
Valores deU
[y
1
, y
2
, y
3
]
{i
0
= 0, i
1
= 3}
{U
1
= 1, U
2
= 1}
[y
1
] , [y
2
, y
3
]
{i
0
= 0, i
1
= 1, i
2
= 3}
{U
1
= 0, U
2
= 1}
[y
1
, y
2
] , [y
3
]
{i
0
= 0, i
1
= 2, i
2
= 3}
{U
1
= 1, U
2
= 0}
[y
1
] , [y
2
] , [y
3
]
{i
0
= 0, i
1
= 1, i
2
= 2, i
3
= 3}
{U
1
= 0, U
2
= 0}
ésimoelementono passo
s
doalgoritmo,U
s
r
deU
, égerada apartirda distribuição ondi ionalU
r
|U
1
s
, ..., U
r−1
s
, U
r+1
s−1
, ..., U
n−1
s−1
, p, y
1
, ..., y
n
,
para
r = 1, ..., n − 1
. ComoU
r
é uma variável binária, para gerar amostras deU
,sugere-se onsiderar aseguinterazão:
R
r
=
P (U
r
= 1|V
r
s
, p, y
1
, ..., y
n
)
P (U
r
= 0|V
r
s
, p, y
1
, ..., y
n
)
,
parar = 1, ..., n−1
eV
s
r
= {U
1
s
= u
1
, ..., U
r−1
s
= u
r−1
, U
r+1
s−1
= u
r+1
, ..., U
n−1
s−1
= u
n−1
}
.Assumindo a oesão apresentada na Equação (1.2) e fazendo
p ∼ Beta(α, β)
, omα > 0
eβ > 0
, então o valordeR
r
édado por:R
r
=
f
[xl]
(y
[xl]
)Γ(n + β − b + 1)Γ(b + α − 2)
f
[xr]
(y
[xr]
)f
[rl]
(y
[rl]
)Γ(b + α − 1)Γ(n + β − b)
,
parab = 1, ..., n
,x =
(
max{r
∗
; 0 < r
∗
< r, U
s
r
∗
= 0},
seU
r
∗
= 0, r
∗
∈ {1, ..., r − 1},
0,
aso ontrário,
el =
(
min{r
∗
; r < r
∗
< n, U
s−1
r
∗
= 0},
seU
s−1
r
∗
= 0, r
∗
∈ {r + 1, ..., n − 1},
n,
aso ontrário.
para mais detalhes, verLos hi &Cruz [22℄.Usando o amostrador de Gibbs, gera-se amostra de
U
onsiderando o seguinte ritériopara a simulaçãoda variável aleatóriaU
s
r
:U
r
s
=
1,
seR
r
≥
1 − z
z
,
0,
aso ontrário,
onder = 1, ..., n − 1
ez ∼ U(0, 1)
.ρ = {i
0
, ..., i
b
}
é dada pela proporção de vetores(U
1
= 1, ..., U
i
1
−1
= 1, U
i
1
=
0, U
i
1
+1
= 1, U
i
2
−1
= 0, U
i
2
= 0, ..., U
i
b−1
−1
= 1, U
i
b−1
= 0, U
i
b−1
+1
= 1, ..., U
i
b
= 1)
queapare eramnototalde amostrasúteis. Alémdisso, aamostradadistribuiçãoa
posteriori para número de blo os em
ρ
pode ser obtida onsiderando-se a seguinte relaçãoB = 1 +
n−1
X
r=1
(1 − U
r
).
Consequentemente, para ada vetor gerado
(U
s
1
, ..., U
n−1
s
)
obtém-se um valorB
s
=
1 +
P
n−1
r
(1 − U
r
s
)
e a estimativa Monte Carlo para probabilidade a posteriori donúmerode blo os é dada por
P (B = b|y
1
, ...y
n
) =
P
T
s=1
1
{B
s
= b}
T
, ∀b ∈ I,
onde
T
éonúmerototaldeamostrasa posteriori e1
{B
s
= b}
éafunçãoindi adora.
Além disso, Los hi & Cruz [25℄ mostra que a estimativa Monte Carlo para a
probabilidadea posteriori do instante
k
ser um ponto de mudançaé dada porP (A
k
|y
1
, ..., y
n
) =
N
T
,
onde
k = 2, ..., n
,N
éonúmerodevetoresobservados omU
k−1
= 0
eT
éotamanhodaamostrada distribuiçãoa posteriori.
Assumindo que
p ∼ Beta(α, β)
, omα > 0
eβ > 0
, omo mostrado em Los hi &Cruz[25℄,tem-seque adaamostradadistribuiçãoaposteriori dep
édaseguinte distribuição ondi ional ompleta a posteriori:p
s
| θ, ρ, y
1
, ..., y
n
∼ beta(b
s
+ α − 1; n + β − b
s
),
onde
b
s
é o número de blo os observados novetor
(U
s
1
, ..., U
n−1
s
)
.Nopróximo apítulo,apli a-seoMPPparaaidenti açãodepontosdemudança
novetor de médias ena matriz de variân ia e ovariân ia de dados multivariados e
normalmente distribuídos. Os resultados estendem o trabalho de Moura [33℄, pois
Identi ando múltiplas mudanças na
média e na ovariân ia de dados
Normal Multivariados
Oestudo de séries temporais multivariadas permiteavaliarainuên ia do
ompor-tamento que uma determinada série exer e sobre as demais. No estudo de dados
nan eiros, por exemplo, tal inuên ia é denominada ontágio e pode ser
mensu-radaatravésda orrelaçãoentre asséries. Nesse sentido,aidenti açãode múltiplos
pontode mudanças no ontexto multivariadoé mais uma formade estudar as
rela-çõesexistente entre asséries.
Diante disso, alguns métodos foram utilizadospara a identi ação de múltiplos
pontos de mudanças, no qual desta am-se o de Moura [33℄ e Cheon & Kim [8℄.
Moura[33℄,porexemplo,utilizouomodelopartiçãoproduto paraaidenti açãode
mudanças na matriz de variân ia e ovariân ia para uma sequên ia de dados om
distribuiçãonormal
p
-variada. Cheon&Kim[8℄apli aramoalgoritmoMonteCarlo om aproximação esto ásti a para a dete ção de múltiplos pontos de mudanças novetor de médias e na matriz de variân ia e ovariân ia de dados om distribuição
normal
p
-variada. No entanto, Cheon & Kim [8℄ onsideraram uma distribuição a priori vaga para o vetor de médias, ou seja,π(µ
k
) = 1
e estimam apenas a partiçãodos dados, o número de blo os e a probabilidade de ada instante ser umponto de mudança, não forne endo estimativas para os parâmetros no instante
k
e, onsequentemente, não havendo a identi ação em qual parâmetro e em qualvariávelhouve amudança.
Neste apítulo,tem-se omo metaestudaro omportamentode séries temporais
multivariadaseavaliarsehámudanças aolongodotempotantonovetor de médias
quanto namatriz de variân ia- ovariân ia. Assim, tem-se omo avaliar, por
de mudanças no vetor de médias e na matriz de variân ia e ovariân ia de uma
sequên ia de vetores aleatórios om distribuição normal multivariada, no qual,
di-ferentede Cheon& Kim [8℄, distribuições a priori onjugadas serãoutilizadaspara
o vetor de médias e para matriz de variân ia ovariân ia. Estimativasdo vetor de
médiasedamatrizde variân iae ovariân iapara ada instantedotempotambém
serão forne idas. Além disso, será apresentado um pro edimento para
ompara-ções sequen ias dos parâmetros de forma a auxiliar na identi ação de mudanças
signi ativas nos parâmetros de diferentes séries. Na Seção 2.1 são apresentadas alguns resultados úteis para a onstrução do modelo partição produto para dados
multivariados normalmente distribuídos (MPPNM). Na Seção 2.2 é apresentada a onstrução doMPPNM. Na Seção 2.3 é forne ido oalgoritmopara gerar da distri-buiçãoa posteriori onjuntade
(µ
k
, Σ
k
)
epara realizaras omparaçõessequen iais dos parâmetros.2.1 Inferên ia Bayesiana no modelo normal
multi-variado
Nesteprimeiromomento,serãoapresentadosalgunsresultados úteisparaa
onstru-ção do MPPNM apresentado naSeção 2.2. As funções densidade de probabilidade das distribuições onsideradas neste trabalho, normal
p
-variada,t
-matriz variada e Wishart-inversa,são apresentadas no Apêndi eA.As propriedadesmatri iais utili-zadas notrabalhoestão noApêndi eC.Considere umaamostraaleatória
y
1
, ..., y
n
de vetoresp × 1
provenientes de uma distribuição normalp
-variada om vetor de médiasµ
de dimensãop × 1
e matriz de variân ia- ovariân iaΣ
de dimensãop × p
, a qual é denotada pory
1
, ..., y
n
|
µ, Σ ∼ N
p
(µ, Σ)
. Considerando Equação (A.1) do Apêndi e A, obtém-se que averossimilhança,asso iada a este experimento, é dadapor:
L(µ, Σ|y
1
, ..., y
n
) = (2π)
(−np/2)
|Σ|
−n/2
× exp
−
1
2
(n − 1)tr Σ
−1
S
+ n( ¯
y
− µ)
t
Σ
−1
( ¯
y
− µ)
,
onde¯
y
=
n
X
k=1
1
n
y
k
éo vetor de médias amostraisde dimensão
p × 1
eS
=
1
n − 1
n
X
k=1
(y
k
− ¯
y
)(y
k
− ¯
y
)
t
éamatrizde variân ia ovariân iaamostralde dimensão
p × p
. Odesenvolvimento função de verossimilhançaé apresentado no Apêndi e B e, para mais detalhes, ver Johnsonet al. [16℄.Uma formaalternativa de es rever, emtermos matri iais,a funçã de
verossimi-lhançaé:
L(µ, Σ|Y) = (2π)
(−np/2)
|Σ|
−n/2
exp
−
1
2
tr
Σ
−1
(Y − 1
n
µ
t
)
t
I
n
(Y − 1
n
µ
t
)
,
(2.1) ondeY
= (y
1
, ..., y
n
)
t
, I
n
éamatrizidentidadedeordemn×n
e1
n
denotaumvetor deunsdeordemn×1
. AverossimilhançaapresentadanaEquação(2.1)foiutilizada para no ál ulo da distribuição preditiva a priori. A Proposição 2.1.1 apresenta alguns resultados úteis quando distribuições priori onjugadas são utilizadas parades rever a in erteza sobre (
µ
,Σ
). A demonstração dessa proposição pode ser en ontrada noApêndi eB.Denote por
W I(D, d)
a distribuição Wishart-inversa om parâmetrosd ∈ ℜ
+
,
tal que
d ≥ p
eD
é uma matriz positiva denida de dimensãop × p
. Denotepor
t
ν
(µ, Σ)
a distribuição t-Student multivariada om lo açãoµ
∈ ℜ
p
, matriz
de dispersão
Σ
∈ ℜ
p×p
e graus de liberdade
ν
. Denote porT
n×p
(ν, M, Ω, Σ)
a distribuição t-Student matriz variada, ondeΩ
é uma matriz positiva denida de dimensãon × n
,Σ
éumamatrizpositivadenida dedimensãop × p
,M
umamatriz de lo ação de dimensãon × p
eν
é o grau de liberdade. As respe tivas funções densidadesde probabilidadee algumaspropriedades en ontram-se noApêndi e A. Proposição 2.1.1 Sejay
1
, ..., y
n
uma amostra aleatória de vetores,p × 1
, de uma distribuição normalp
-variada,ou seja,y
k
|µ, Σ
iid
∼ N
p
(µ, Σ)
, ondeµ
é um vetor demédiasde dimensão
p × 1
,Σ
é amatriz de variân ia- ovariân ia dedimensãop × p
e
k = 1, ..., n
. Se, a priori,µ
|Σ ∼ N
p
(m
,
1
v
Σ
eΣ
∼ W I(D, d)
, em quem
é umvetor demédiasdedimensão
p × 1
ev
ed
sãonúmerosreaispositivos, então tem-se que:a) A distribuição a posteriori onjunta de
(µ, Σ)
é tal queµ|Σ, y
1
, ..., y
n
∼ N
p
(M, (v + n)
−1
D
∗
);
b) a distribuição a posteriori de
µ
éµ|y
1
, ..., y
n
∼ t
d+n+1−p
(M, (d + n + 1 − p)
−1
(v + n)
−1
D
∗
);
) a distribuição preditivaa priori de
Y
éY
∼ T
n×p
d + 1 − p, 1
n
m
t
, I
n
+
1
n
1
t
n
v
, D
,
ondeM
= (n + v)
−1
(n ¯
y
+ vm)
eD
∗
= D + (n − 1)S +
nv
n + v
[( ¯
y
− m)( ¯
y
− m)
t
]
.Os resultados apresentados naProposição 2.1.1 são onhe idos e serão úteis na obtençãodasdistribuiçõesaposteriori envolvidas noMPPdesenvolvidonapróxima
seção.
2.2 Construção do MPP
O objetivo nesta seção é onstruir um modelo que permita identi ar múltiplas
mudanças,aolongodotempo,novetorde médiasenamatrizde ovariân iaquando
osdados são normalmentedistribuídos. Para isso, será utilizadoo modelo des rito
noCapítulo1.
Seja
Y
1
, ..., Y
n
uma sequên ia de vetores aleatórios de dimensãop × 1
, ondeY
k
= (Y
1k
, ..., Y
pk
)
t
,µ
1
, ..., µ
n
é uma sequên ia de vetores das médias de dimensãop × 1
eΣ
1
, ..., Σ
n
é uma sequên ia de matrizes de variân ia ovariân ia, de ordemp × p
, simétri ae positivadenida. O modelo será onstruído assumindo que,parak = 1, ..., n
,Y
k
|µ
k
, Σ
k
ind
∼ N
p
(µ
k
, Σ
k
)
µ
k
|Σ
k
ind
∼ N
p
(m,
1
v
Σ
k
)
Σ
k
iid
∼ W I(D, d),
onde
m
é um vetor de médias,p × 1
,D
éuma matriz positivade dimensãop × p
ev
ed
são reais positivos.Considerando a notaçãosimilar a apresentada noCapítulo1, denotepor
Y
[ij]
= (y
i+1
, y
i+2
, ..., y
j
)
t
=
y
(i+1)1
. . . y
(i+1)p
y
(i+2)1
. . . y
(i+2)p
. . . . . . . . .y
j1
. . .
y
jp
amatrizblo o de observaçõesde dimensão
(j − i) × p
. Alémdisso, denoteporµ
[ij]
eΣ
[ij]
o vetor de médias e a matriz de ovariân ia que indexam a distribuição das observaçõesno blo oY
[ij]
. Adi ionalmente, assuma que(i) As observações
y
i+1
, y
i+2
, ..., y
j
são independentes e identi amente distribuí-das, ondi ionalmenteemµ
[ij]
eΣ
[ij]
, omumadistribuiçãonormalp
-variada, istoé:Y
k
|µ
[ij]
, Σ
[ij]
iid
∼ N
p
(µ
[ij]
, Σ
[ij]
)
parak = i + 1, ..., j;
(ii) Dada uma partição
ρ
=
{i
0
, ..., i
n
}
, existem os parâmetros omuns(µ
[i
0
i
1
]
, Σ
[i
0
i
1
]
), ..., (µ
[i
b−1
i
b
]
, Σ
[i
b−1
i
b
]
)
que são independentes e identi amentedistribuídostaisque
µ
[ij]
|Σ
[ij]
∼N
p
m
,
1
v
Σ
[ij]
Σ
[ij]
∼W I(D, d).
(iii) Dada uma partição
ρ
=
{i
0
, ..., i
n
}
e os parâmetros omuns(µ
[i
0
i
1
]
, Σ
[i
0
i
1
]
), ..., (µ
[i
b−1
i
b
]
, Σ
[i
b−1
i
b
]
)
, as observações em diferentes blo osY
i
0
,i
1
,...,Y
i
b−1
,i
b
são independentes.Denotepor
n
r
= i
r
− i
r−1
eθ
= (θ
1
, ..., θ
n
)
,ondeθ
k
= (µ
k
, Σ
k
)
parak = 1, ..., n
. Considerando assuposições(i)
e(iii)
, obtém-se a verossimilhança omoL(θ, ρ | y
1
, ..., y
n
) =
b
Y
r=1
f y
[i
r−1
i
r
]
| µ
[i
r−1
i
r
]
, Σ
[i
r−1
i
r
]
=
b
Y
r=1
i
r
Y
k=i
r−1
+1
f y
k
| µ
[i
r−1
i
r
]
, Σ
[i
r−1
i
r
]
=
b
Y
r=1
(2π)
−
nr p
2
|Σ
[i
r−1
i
r
]
|
−
nr
2
exp
−
1
2
n
(n
r
− 1)tr
h
Σ
−1
[i
r−1
i
r
]
S
[i
r−1
i
r
]
io
× exp
n
n
r
( ¯
y
[i
r−1
i
r
]
− µ
[i
r−1
i
r
]
)
t
Σ
−1
[i
r−1
i
r
]
( ¯
y
[i
r−1
i
r
]
− µ
[i
r−1
i
r
]
)
o
(2.2)Como onsequên ia das suposições anteriores,segue quea distribuição a posteriori
de
θ
k
= (µ
k
, Σ
k
)
é dada pelaexpressão em 1.1, emqueµ
k
| Σ
k
, ρ, y
i+1
, ..., y
j
∼ N
p
(M
[ij]
, (j − i + v)
−1
Σ
[ij]
),
Σ
k
| ρ, y
i+1
, ..., y
j
∼ W I(D
∗
[ij]
, d + j − i),
ondeM
[ij]
= (j − i + v)
−1
((j − i) ¯
y
[ij]
+ vm)
,D
∗
[ij]
= D + (j − i − 1)S
[ij]
+
(j − i)v
j − i + v
( ¯
y
[ij]
− m)( ¯
y
[ij]
− m)
t
,S
[ij]
=
1
j − i − 1
P
j
k=i+1
(y
k
− ¯
y
[ij]
)(y
k
− ¯
y
[ij]
)
t
e
y
¯
[ij]
=
P
j
k=i+1
1
j − i
y
k
.
As distribuiçõesa posteriori para
ρ
ep
são obtidas, respe tivamente, das Equa-ções (1.6) e (1.7), onde o fator dados é dado pela seguinte distribuição preditiva a priori porblo osY
[ij]
∼ T
(j−i)×p
d + 1 − p, 1
(j−i)
m
t
, I
(j−i)
+
1
(j−i)
1
t
(j−i)
v
, D
!
,
obtidano item ( ) daProposição 2.1.1.
2.3 Falta de identi abilidade na identi ação da
mudança
NautilizaçãodoMPPnadete ção depontosde mudançapodemo orrerproblemas
de falta de identi abilidade, ou seja, a mudança pode o orre apenas no vetor de
médiase,noentanto,omodeloidenti a mudanças tambémnamatriz de variân ia
e ovariân ia,por exemplo.
Para auxiliarnaidenti açãodos parâmetrosque, de fato,experimentaram
mu-dança,minimizandooproblema de faltade identi abilidade,aqui propõe-se
onsi-derar oestudo do omportamentoda distribuiçãoa posteriori de
θ
k
− θ
k−1
e paratodo
k = 2, ..., n
testar ashipótesesH
0
: θ
k
− θ
k−1
= 0
H
a
: θ
k
− θ
k−1
6= 0.
Caso
H
0
sejaa eita,tem-seevidên iasde queoparâmetrossu essivosnotemponão são substan ialmentediferentes. A evidên ia a favor deH
0
pode ser obtida usando o teste de signi ân ia Bayesiano Completo (Bragança Pereira & Stern [7℄). Noentanto,de isõesbaseada emtaltesteé equivalenteade idir por