Modelagem de volatilidade via modelos GARCH com erros assimétricos: abordagem Ba...

(1)

Modelagem de volatilidade via modelos GARCH

com erros assimétricos: abordagem Bayesiana

(2)

Modelagem de volatilidade via modelos GARCH com

erros assimétricos: abordagem Bayesiana

José Augusto Fioruci

Orientador: Prof. Dr. Ricardo Sandes Ehlers

Dissertação apresentada ao Instituto de Ciências Matemáticas e de Computação - ICMC-USP, como parte dos requisitos para obtenção do título de Mestre em Ciências - Ciências de Computação e Matemática Computacional. VERSÃO REVISADA

USP – São Carlos

Agosto de 2012

SERVIÇO DE PÓS-GRADUAÇÃO DO ICMC-USP

Data de Depósito:

(3)

(4)

A minha família, em especial aos meus pais,

José Airton Fioruci e Luzia Neuza Dalaqua, pelo

incentivo e o esforço pela minha formação.

Aos meus amigos do laboratório da

(5)

Agradecimentos

Agradeço primeiramente a Deus por me permitir estudar os mistérios da sua criação

e por ter me concedido saúde e sabedoria para realizar este trabalho.

A minha família, em especial aos meus pais que sempre me ajudam, apoiam e me

incentivam e a quem sempre estarei em dívida.

Ao meu orientador, Ricardo Sandes Ehlers, pela orientação, sugestões e amizade

que contribuíram no meu crescimento e na minha formação acadêmica.

Aos professores Francisco Louzada Neto e Mauricio Enrique Zevallos Herencia,

membros da banca de defesa, pelas valiosas sugestões feitas.

Aos professores Francisco Antonio Rojas Rojas e Marinho Gomes de Andrade Filho,

membros da banda de qualiﬁcação, pelas valiosas sugestões feitas.

Aos diversos amigos e colegas do ICMC, em especial aos amigos do laboratório da

estatística.

Aos professores e aos demais funcionários do ICMC pelo excelente convívio.

Por ﬁm, agradeço ao Conselho Nacional de Desenvolvimento Cientíﬁco e

(6)

Resumo

A modelagem da volatilidade desempenha um papel fundamental em Econometria.

Nesta dissertação são estudados a generalização dos modelos autorregressivos

condi-cionalmente heterocedásticos conhecidos como GARCH e sua principal generalização

multivariada, os modelos DCC-GARCH (Dynamic Condicional Correlation GARCH).

Para os erros desses modelos são consideradas distribuições de probabilidade

possivel-mente assimétricas e leptocúrticas, sendo essas parametrizadas em função da assimetria

e do peso nas caudas, necessitando assim de estimar esses parâmetros adicionais aos

modelos. A estimação dos parâmetros dos modelos é feita sob a abordagem Bayesiana

e devido às complexidades destes modelos, métodos computacionais baseados em

si-mulações de Monte Carlo via Cadeias de Markov (MCMC) são utilizados. Para obter

maior eﬁciência computacional os algoritmos de simulação da distribuição a posteriori

dos parâmetros são implementados em linguagem de baixo nível. Por ﬁm, a proposta

de modelagem e estimação é exempliﬁcada com dois conjuntos de dados reais.

Palavras-chave: series temporais, modelagem de volatilidade, modelos GARCH,

(7)

Abstract

The modeling of volatility plays a fundamental role in Econometrics. In this

disser-tation are studied the generalization of known autoregressive conditionally

heterosce-dastic (GARCH) models and its main principal multivariate generalization, the

DCC-GARCH (Dynamic Conditional Correlation GARCH) models. For the errors of these

models are considered distribution of probability possibility asymmetric and

leptokur-tic, these being parameterized as a function of asymmetry and the weight on the tails,

thus requiring estimate the models additional parameters. The estimation of

parame-ters is made under the Bayesian approach and due to the complexities of these models,

methods computer-based simulations Monte Carlo Markov Chain (MCMC) are used.

For more computational eﬃciency of simulation algorithms of posterior distribution of

the parameters are implemented in low-level language. Finally, the proposed modeling

and estimation is illustrated with two real data sets.

Keywords: time series, volatility modeling, GARCH models, asymmetric

(8)

Sumário

1 Introdução 1

1.1 Motivação . . . 1

1.2 Conceitos Básicos . . . 3

1.2.1 Retornos e Volatilidade . . . 3

1.2.2 Métodos de Monte Carlo via Cadeias de Markov . . . 6

1.3 Revisão Bibliográﬁca . . . 10

1.4 Apresentação de Capítulos . . . 14

2 Distribuições Assimétricas 16 2.1 Método Univariado . . . 16

2.2 Método Multivariado . . . 20

2.2.1 Normal . . . 22

2.2.2 t-Student . . . 23

2.2.3 GED . . . 24

3 Modelos GARCH 27

(9)

SUMÁRIO vi

3.1 Modelos Univariados . . . 28

3.2 Modelos Multivariados . . . 32

3.3 Estimação dos Parâmetros . . . 36

4 Estudo de Simulação 40

5 Aplicação 47

5.1 Modelo Univariado . . . 49

5.2 Modelo Multivariado . . . 53

6 Considerações Finais e Conclusão 59

Bibliograﬁa 61

A Estimativa Bayesiana dos parâmetros dos modelos 66

B Gráﬁcos da simulação a posteriori dos parâmetros do modelo

(10)

Lista de Figuras

1.1 Petrobrás PN: (a) Gráﬁco da série, (b) Gráﬁco dos retornos. . . 4

1.2 Petrobrás PN: (a) Autocorrelação nos retornos, (b) Autocorrelação nos

quadrados dos retornos. . . 5

2.1 Versão padronizada da distribuição Normal Assimétrica . . . 19

4.1 Gráﬁcos das densidades utilizadas para os erros do modelo GARCH(1,1)

para gerar os dados artiﬁciais: (a) SSN, (b) SST e (c) SSGED . . . 41

5.1 Série do IBOVESPA de 02/01/2001 até 28/12/2007. (a) Gráﬁco da série;

(b) Gráﬁco dos retornos; (c) Gráﬁcos das autocorrelações dos retornos

e (d) Gráﬁco das autocorrelações do quadrado dos retornos. . . 50

5.2 A esquerda o histograma dos resíduos com a distribuição de

probabili-dade dos erros sobreposta e a direita o gráﬁco qqplot dos resíduos do

modelo com erros SST. . . 51

5.3 (a) Densidade a posteriori do parâmetro de assimetria (γ) e (b)

den-sidade a posteriori da persistência (α1 +β1), para o modelo com erros

SST. . . 52

(11)

LISTA DE FIGURAS viii

5.4 Gráﬁco das volatilidades estimadas pelo modelo GARCH(1,1) com erros

SST e intervalo com 95% de credibilidade. . . 52

5.5 Gráﬁcos da série e dos retornos dos índices DAX, CAC40 e NIKKEI. . 53

5.6 Autocorrelações dos retornos (primeira coluna) e dos retornos ao

qua-drado (segunda coluna) dos índices DAX, CAC40 e NIKKEI. . . 54

5.7 Histogramas dos resíduos com as respectivas distribuições marginais

so-brepostas na coluna esquerda e gráﬁcos qqplots dos resíduos na coluna

da direita: modelo com erros SST. . . 56

5.8 Densidade a posteriori dos parâmetros de assimetrias (γ) e das

persis-tências (α1+β1) do modelo com erros SST. . . 57

5.9 Gráﬁco das volatilidades estimadas pelo modelo DCC-GARCH(1,1) com

erros SST e intervalo com 95% de credibilidade. . . 58

B.1 Na coluna da esquerda os traços, na centro os gráﬁcos das densidades

aproximadas e na direita o gráﬁco das autocorrelações da simulação da

distribuição a posteriori dos parâmetros do modelo GARCH(1,1) com

erros SST aplicado ao conjunto de dados univariado do Capítulo 5. . . 72

B.2 Traços da simulação a posteriori, densidades aproximadas e

autocorrela-ções do parâmetro de assimetria e dos parâmetro da volatilidade para a

série DAX. Modelo ajustado: GARCH(1,1) com errosSST ao conjunto

da dados multivariados do Capítulo 5. . . 73

autocorre-lações do parâmetro de assimetria e dos parâmetro da volatilidade para

a série CAC40. Modelo ajustado: GARCH(1,1) com erros SST ao

(12)

LISTA DE FIGURAS ix

autocorre-lações do parâmetro de assimetria e dos parâmetro da volatilidade para

a série NIKKEI. Modelo ajustado: GARCH(1,1) com errosSST ao

con-junto da dados multivariados do Capítulo 5. . . 75

autocorre-lações dos parâmetros de correlação e do parâmetro de peso nas caudas.

Modelo ajustado: GARCH(1,1) com erros SST ao conjunto da dados

(13)

Lista de Tabelas

2.1 Razões entre a massa de probabilidade presente a esquerda de ₋q com

a massa de probabilidade presente a direita de q P(X<−_q₎ P(X>q)

. . . 20

4.1 Porcentagem de vezes que cada modelo foi selecionado pelo critério EAIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . 44

4.2 Porcentagem de vezes que cada modelo foi selecionado pelo critério EBIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . 45

4.3 Porcentagem de vezes que cada modelo foi selecionado pelo critério DIC no estudo de simulação. Em destaque a porcentagem de vezes que o modelo selecionado foi o mesmo utilizado na geração dos dados. . . 46

5.1 Critérios para seleção dos modelos univariados. . . 49

5.2 Critérios para seleção dos modelos multivariados. . . 55

A.1 Estimativas do GARCH univariado com erros N. . . 66

A.2 Estimativas do GARCH univariado com erros SSN. . . 66

A.3 Estimativas do GARCH univariado com erros ST. . . 67

(14)

LISTA DE TABELAS xi

A.4 Estimativas do GARCH univariado com erros SST. . . 67

A.5 Estimativas do GARCH univariado com erros GED. . . 67

A.6 Estimativas do GARCH univariado com erros SSGED. . . 67

A.7 Estimativas do GARCH multivariado com erros N. . . 68

A.8 Estimativas do GARCH multivariado com erros SSN. . . 68

A.9 Estimativas do GARCH multivariado com erros ST. . . 69

A.10 Estimativas do GARCH multivariado com erros SST. . . 69

A.11 Estimativas do GARCH multivariado com erros GED. . . 70

(15)

Capítulo 1

Introdução

1.1 Motivação

Modelagem de volatilidade (variância condicional) é de grande interesse em Economia.

Gráﬁcos de dados ﬁnanceiros mostram que existem períodos mais voláteis do que

ou-tros, sendo que esses períodos geralmente estão distribuídos em grupos, sugerindo assim

um grau de dependência no tempo. Outra característica que geralmente esta presente

em séries ﬁnanceiras, é que, em geral choques negativos tem mais inﬂuencia na

volati-lidade do que choques positivos, caracterizando assim, um certo grau de assimetria na

volatilidade.

Para levar em conta a presença de grupos de volatilidade é necessário a utilização de

modelos heterocedásticos condicionais, ou seja, modelos que consideram que a variância

condicional de uma série temporal não é constante. Diversos modelos para volatilidade

foram propostos na literatura, sendo que os modelos autorregressivos condicionalmente

heterocedásticos (ARCH) propostos por Engle (1982), e sua generalização os modelos

GARCH (Bollerslev 1986), bem como os modelos de volatilidade estocástica (Taylor

(16)

1.1 Motivação 2

Variações em diversas séries ﬁnanceiras podem ser correlacionadas, de forma que a

volatilidade de uma série pode sofrer inﬂuencia das volatilidades de outras séries. Com

o intuito de considerar essas correlações na estimação dos modelos GARCH, diversas

extensões multivariadas surgiram na literatura, sendo que os modelos CCC-GARCH

(Constant Conditional Correlation GARCH) proposto em Bollerslev (1990) e

DCC-GARCH (Dynamic Conditional Correlation-GARCH) propostos simultaneamente em

Engle (2002) e Tse & Tsui (2002) estão entre os mais conhecidos.

Muitas vezes a utilização da distribuição de probabilidade Normal Padrão para os

erros dos modelos GARCH não é suﬁciente para adequar as características de caudas

pesadas e assimetria dos retornos ﬁnanceiros. Assim, tanto para os erros dos modelos

GARCH como para os erros dos modelos DCC-GARCH, nesta dissertação é estudado

a utilização de distribuições de probabilidade com caudas mais pesadas do que a

dis-tribuição Normal Padrão e também consideramos uma forma de tornar possivelmente

assimétrica (skew) essas distribuições. A estimação é feita sob o enfoque Bayesiano o

que possibilita analisar essas características através da distribuição a posteriori dos

pa-râmetros, uma vez que as distribuições de probabilidade utilizadas são parametrizadas

em função de parâmetros de peso nas caudas e de assimetria.

Na literatura poucos trabalhos surgiram utilizando o enfoque Bayesiano, mesmo

para os modelos univariados. Isto ocorre devido a complexidade desses modelos e ao

custo computacional da utilização de métodos computacionais baseados em

simula-ção de Monte Carlos via Cadeias de Markov (MCMC). Nesta dissertasimula-ção, os métodos

MCMC são utilizados, mas para obter maior eﬁciência computacional os algoritmos de

simulação da distribuição a posteriori são implementados em linguagem de baixo nível.

As principais contribuições metodológicas deste trabalho são: o estudo de

distribui-ções possivelmente leptocúrticas e assimétricas para o termo do erro, tanto em modelos

(17)

Baye-1.2 Conceitos Básicos 3

siana para estimação desses modelos; avaliação da adequação de alguns critérios para

seleção entre os modelos aqui estudados através de um estudo de simulação.

1.2 Conceitos Básicos

Nesta seção apresentamos alguns conceitos que serão utilizados nesta dissertação. Os

conceitos relacionados a séries temporais podem ser vistos detalhadamente em

Moret-tin (2008). Um excelente texto introdutório sobre os conceitos relacionados a inferência

Bayesiana e métodos computacionais pode ser encontrado em Lynch (2007). Estudos

mais avançados sobre os algoritmos Amostrador de Gibbs e Metropolis-Hastings podem

ser encontrados em Casella & George (1992) e Chib & Greenberg (1995),

respectiva-mente.

1.2.1 Retornos e Volatilidade

ConsiderePtcomo sendo o preço de um ativo no instanteteptcomo sendo o logaritmo

na base e do preço deste ativo (pt = log(Pt)). Assim o log-retorno ou simplesmente,

retorno no instantet, é deﬁnido como sendo:

yt= log

Pt

Pt−₁

!

=pt−pt−₁.

Como exemplo, a Figura 1.1 (a) apresenta o gráﬁco da série diária dos fechamentos

da ação da Petrobrás PN, no período de 2 de janeiro de 1995 à 27 de dezembro de

2000, e a Figura 1.1 (b) apresenta o gráﬁco dos retornos da mesma série.

Pela Figura 1.1 podemos notar algumas das principais propriedades dos retornos,

como por exemplo estacionaridade. Isto faz com que em geral, seja preferível trabalhar

(18)

1.2 Conceitos Básicos 4

(a)

Tempo

Obser

vações

0 500 1000 1500

10000

50000

(b)

Tempo

Retor

nos

0 500 1000 1500

−0.2

0.1

Figura 1.1: Petrobrás PN: (a) Gráﬁco da série, (b) Gráﬁco dos retornos.

Outra características comum em séries de retornos ﬁnanceiros consiste na existência

de autocorrelação nos quadrados dos retornos, enquanto que os retornos não possuem

autocorrelação ou em alguns casos possuem autocorrelação apenas nos primeiros lags.

Essa característica é exempliﬁcada na Figura 1.2, onde para a mesma série da Petrobrás,

temos no gráﬁco (a) as autocorrelações dos retornos e no gráﬁco (b) as autocorrelações

dos quadrado dos retornos. Observe que no gráﬁco (a) existe autocorrelação apenas

para o lag 1, enquanto que no gráﬁco (b) existe autocorrelação para diversos lags.

Considerando uma série de retornos _{yt, t = 1, . . . , T}, podemos escrever a

dis-tribuição conjunta dos retornos como o produto das distribuições de cada retorno,

condicionado os retornos anteriores:

(19)

0 5 10 15 20 25 30

0.0

0.6

Lag

A

CF

(a)

0 5 10 15 20 25 30

0.0

0.6

Lag

A

CF

(b)

Figura 1.2: Petrobrás PN: (a) Autocorrelação nos retornos, (b) Autocorrelação nos quadrados dos retornos.

sendoIt={yt−₁, y_t−₂, . . .} a informação prévia até o instantet.

A variância das distribuições condicionais da equação (1.1) convencionou-se chamar

de Volatilidade e será o objetivo da modelagem. O formato de escrever distribuição

conjunta dos retornos apresentado em (1.1) é muito utilizada nos modelos para

volati-lidade, pois nessa modelagem sempre estaremos interessados na informação disponível

no instante t com relação ao que ocorreu nos instantes anteriores.

Algumas das características que geralmente são encontradas em séries de retornos

ﬁnanceiros são:

• Retornos são em geral não autocorrelacionados;

• A distribuição incondicional dos retornos apresenta caudas mais pesadas do que

(20)

• Os quadrados dos retornos são em geral autocorrelacionados;

• A volatilidade aparece em grupos de maior, ou menor, volatilidade;

• A volatilidade reage de modo diferente a valores positivos e negativos da série;

Os modelos que serão vistos no Capítulo 3 assumirão que a esperança de cada

distribuição condicional da equação (1.1) é zero, enquanto que a variância

(vola-tilidade) é uma função da informação passada. Ou seja, estes modelos

assumi-rão heterocedasticidade. Para ﬁxar a notação, considere a volatilidade como ht =

V ar(yt|It) = E(y2t|It), sendo It a informação prévia até o momento t, ou seja,

It = (yt−₁, y_t−₂, . . . , h_t−₁, h_t−₂, . . .).

A seguir apresentaremos uma breve descrição de alguns dos principais métodos de

simulação computacional baseados em Monte Carlo via Cadeias de Markov.

1.2.2 Métodos de Monte Carlo via Cadeias de Markov

Suponha que temos interesse em obter características (por exemplo: média e a

variân-cia) de uma distribuição a posteriori π(θ_|y), mas não podemos obter essa informação

diretamente. Entretanto, suponha que podemos construir uma Cadeia de Markov,

com espaço de estados no espaço paramétrico Θ (conjunto de todos valores possíveis

deθ), que é simples para simular e cuja distribuição de equilíbrio seja dada porπ(θ_|y).

Por ﬁm, sob algumas condições de regularidade, o Teorema 1.1 garante que podemos

utilizar os valores simulados da cadeia como base para sumarizar características da

posteriori π(θ_|y). A demonstração do Teorema 1.1 pode ser encontrada em Tierney

(1994).

Teorema 1.1. Suponha que _{Y(t)_}M

t=1 é uma Cadeia de Markov irredutível, aperiódica

(21)

continua com respeito a π para todo y, então π é a única distribuição invariante de

P(.,.) e para toda função h que toma valores nos reais e integrável em relação a π,

temos

1

M

X

t=1

h(Y(t))−→

Z

h(y)π(y)dy,

quando M _{→ ∞}, q.c.

Recentemente, com a evolução computacional, os métodos de Monte Carlo via

Ca-deias de Markov (MCMC) vem sendo cada vez mais utilizados, por conta da facilidade

na utilização e pela possibilidade de trabalhar com modelos complexos.

A seguir serão apresentados os dois métodos MCMC mais empregados, o

Amostra-dor de Gibbs e o Metropolis-Hastings.

Amostrador de Gibbs

Considere θ = (θ1, . . . , θk) um vetor de variáveis aleatórias. O Amostrador de Gibbs

consiste em um algoritmo para gerar uma Cadeia de Markov da distribuição

con-junta π(θ) a partir das distribuições condicionais de θi|θ−i, i = 1, . . . , k, sendo

θ₋i = (θ1, . . . , θi−₁, θ_i₊₁, . . . , θ_k).

As distribuições condicionais são obtidas a partir de:

π(θi|θ−i) =

π(θ)

R

π(θ) dθi ∝

π(θ).

Assim, a menos de uma constante, para obter a distribuição condicionais de θi|θ(i),

basta considerar apenas os termos da distribuição conjuntaπ(θ) que dependem de θi.

A seguir é apresentado o esquema do algoritmo Amostrador de Gibbs:

(22)

2. Obtenha um novo valor de θ(j+1) a partir de θ(j), através da geração sucessiva

dos valores:

θ₁(j+1) _∼ π(θ1|θ2(j), θ (j) 3 , . . . , θ

(j) k )

θ₂(j+1) _∼ π(θ2|θ1(j+1), θ (j) 3 , . . . , θ

(j) k )

...

θ_k(j+1) _∼ π(θk|θ(1j+1), θ (j+1) 2 , . . . , θ

(j+1) k−₁ )

3. Faça j =j+ 1 e volte ao Passo 2.

Os passo 2 e 3 devem ser repetidos até que a distribuição estacionária seja alcançada.

Em geral, as primeiras simulações são descartadas como uma amostra de aquecimento.

Pode-se considerar apenas os últimos valores gerados a cada bloco de k-simulações,

com k >1.

Observe que não é necessário conhecer a distribuição conjunta, mas é necessário

conhecer as distribuições condicionais completas. Se as distribuições condicionais

com-pletas coincidirem com alguma distribuição de probabilidade conhecida na literatura,

então deve-se gerar valores diretamente dessa distribuição. No caso, de uma ou mais

distribuições condicionais completas não coincidirem com alguma distribuição de

pro-babilidade conhecida, pode-se utilizar o algoritmo Metropolis-Hastings para simular da

distribuição conjunta. O algoritmo Metropolis-Hastings é apresentado a seguir.

Metropolis-Hastings

No algoritmo Metropolis-Hastings um valor é gerado de uma distribuição auxiliar (ou

distribuição proposta) e aceito com uma dada probabilidade. Este mecanismo de

(23)

Considerando θ = (θ1, . . . , θk), suponha que deseja-se gerar valores da distribuição

conjunta π(θ) e a cadeia esteja no estado θ, um valor θ′ é gerado de uma distribuição

proposta q(·|θ). Note que a distribuição proposta pode depender do estado atual da

cadeia, por exemplo q(·|θ) poderia ser uma distribuição multivariada centrada em θ.

O esquema geral do algoritmo Metropolis-Hastings é apresentado a seguir:

1. Inicialize o contadorj = 0 e determine um valor inicial θ(0).

2. Gere θ′ da distribuição proposta

q(_·|θ(j)).

3. Gere u_∼U(0,1).

4. Se u < p(θ′

,θ(j)) então faça θ(j+1) =θ′. Caso contrário, faça

θ(j+1) =θ(j).

5. Faça j =j+ 1 e volte para o Passo 2.

No passo 4 a probabilidade de aceitaçãop(θ′

,θ(j)_{) é dada por:}

p(θ′

,θ(j)) = min

(

1, π(θ

′)

q(θ(j)_|θ′)

π(θ(j)₎ _q₍_θ′ |θ(j)₎

)

. (1.2)

Observe, que a probabilidade de aceitação não depende de constantes normalizadoras,

ou seja, π(θ) pode ser conhecido a menos de uma constante. Os passo 2₋5 devem ser

repetidos até que seja obtida a distribuição estacionária π(θ).

Na inferência Bayesiana o algoritmo Metropolis-Hastings é bastante utilizado para

gerar amostras da distribuição a posteriori, neste caso, a distribuição pretendida é

a posteriori π(θ_|y) _∝ L(θ)π(θ), sendo L(θ) e π(θ) a função de verossimilhança e a

distribuição a priori deθ, respectivamente. Assim, se considerarmos como distribuição

(24)

1.3 Revisão Bibliográﬁca 10

apresentada em (1.2) ﬁca resumida na razão de verossimilhanças:

p(θ(j),θ′) = min

(

1, L(θ

′)

L(θ(j)₎

)

.

Um caso mais geral do Metropolis-Hastings e que em alguns casos pode ser mais

eﬁciente computacionalmente, consiste em dividir θ = (θ1, . . . , θk) em p blocos

{θ1, . . . ,θp}, sendo que cada bloco contém um ou mais elementos, assim dentro de

cada iteração teremos o algoritmo aplicado p vezes. Por exemplo, deﬁnindo o

ve-tor θ−i = (θ1, . . . ,θi−1,θi+1, . . . ,θp) que contém todos os elementos de θ exceto θi,

suponha que na iteração j + 1 os blocos 1,2, . . . , i ₋1 já foram atualizados, isto é

θ(−ji) = (θ (j+1) 1 , . . . ,θ

(j+1) i−1 ,θ

(j)

i+1, . . . ,θp(j)). Assim, para atualizar a i-ésima componente,

um valor θ′

i é gerado da distribuição proposta q(·|θ (j) i ,θ

(j)

−i) e este valor candidato é

aceito com probabilidade:

p(θ′ i,θ

(j)

i ) = min

 



1, π(θ

′ i|θ

(j)

−_i)q(θ

(j) i |θ

′ i,θ

(j)

−_i)

π(θ_i(j)_|θ−(ji))q(θ ′ i|θ

(j) i ,θ

(j)

−i)

 



. (1.3)

Aqui, π(θi|θ−i) é a distribuição condicional completa do bloco θi.

Note que o Amostrador de Gibbs é um caso especial do algoritmo

Metropolis-Hastings, no qual os elementos de θ são atualizados um de cada vez (ou em blocos),

tomando a distribuição condicional completa como proposta e neste caso, a

probabili-dade de aceitação é igual a 1.

1.3 Revisão Bibliográﬁca

Os modelos ARCH (Autoregressive Conditional Heteroskedasticity) foram introduzidos

por Engle (1982) e têm como ideia básica que a volatilidade (variância condicional) em

(25)

uma classe de modelos que considera que a volatilidade depende, além dos valores

passados dos retornos, também dos valores passados da volatilidade, estes modelos são

os considerados GARCH (Generalized ARCH). Os modelos GARCH são considerados

mais parcimoniosos do que os ARCH, no sentido que, em geral descrevem a volatilidade

com menos parâmetros.

Desde a criação dos modelos GARCH diversas extensões multivariadas foram

pro-postas na literatura, uma revisão sobre vários desses modelos pode ser encontrada em

Bauwens et al. (2006). Os modelos multivariados mais utilizados foram propostos pelos

mesmos criadores dos modelos ARCH e GARCH, primeiramente foi proposto o modelo

CCC-GARCH (Constant Conditional Correlation GARCH) em Bollerslev (1990), esse

modelo considera correlação constante ao longo do tempo entre as séries de retornos.

Uma extensão do CCC-GARCH que hoje é mais utilizada é o modelo DCC-GARCH

(Dynamic Conditional Correlation GARCH) o qual foi proposto simultaneamente em

Engle (2002) e Tse & Tsui (2002), este modelo considera que a correlação entre as

volatilidades varia com o tempo através de um processo GARCH. Os modelos

CCC-GARCH e DCC-CCC-GARCH serão apresentados em detalhes na Seção 3.2.

Atualmente vem surgindo algumas abordagens Bayesianas para estimação dos

mo-delos GARCH. Ardia (2006) propõe um algoritmo para estimação Bayesiana do modelo

GARCH(1,1) com erros normais. O algoritmo consiste em amostrar valores da

distri-buição posteriori conjunta dos parâmetros, construindo assim, uma Cadeia de Markov

para ser utilizada na estimação dos parâmetros. Nos modelos GARCH as condicionais

completas da posteriori, em geral, não coincidem com funções de densidades de

proba-bilidade conhecidas na literatura, e assim, o algoritmo Metropolis-Hastings é utilizado.

Ainda no mesmo artigo, para melhorar o desempenho do algoritmo a amostragem é

feita por uma abordagem sugerida por Nakatsuma (1998), a qual utiliza uma

(26)

Devido a evidências na literatura de que muitas séries temporais ﬁnanceiras tendem

a ter a curtose observada maior do que aquela considerada por um modelo GARCH

com erros normais, Ardia (2008) propõe a estimação Bayesiana do modelo GARCH(1,1)

com erros t-Student através de um algoritmo MCMC. A implementação em R de

am-bos algoritmos, pode ser encontrada no pacote bayesGARCH (Ardia 2011). Além da

distribuição t-Student, outra distribuição de probabilidade possivelmente leptocúrtica

que vem sendo usada para os erros do modelo GARCH é a GED (Generalized Error

Distribution), que pode ser encontrada na forma univariada e com uma das extensões

multivariada em Gómez et al. (1998).

Uma das preocupações atuais, tem sido com a evidência empírica de assimetria

nos retornos ﬁnanceiros, não tratada pelos modelos GARCH, isto levou alguns

pes-quisadores a proporem extensões para o modelo. Nelson (1991) introduziu os modelos

EGARCH (Exponential GARCH), Glosten et al. (1993) introduziram os modelos GJR,

mas uma das extensões que mostrou-se mais promissora foi a APARCH (Asymmetric

Power ARCH) introduzidas por Ding et al. (1993). Os modelos APARCH generalizam

vários modelos GARCH assimétricos, entre eles, os EGARCH e os GJR (veja, Laurent

(2004)).

Outra forma de tratar a assimetria nos retornos através dos modelos GARCH

con-siste em assumir algum grau de assimetria na distribuição dos erros. Em Pipien (2006)

são revisados diversos métodos para inserir assimetria em qualquer distribuição de

pro-babilidade univariada, continua, unimodal e simétrica. Na literatura o método para

inserir assimetria que vem sendo mais explorado é o proposto em Fernandez & Steel

(1998) para distribuições de probabilidade univariadas e generalizado para as

distri-buições multivariadas em Bauwens & Laurent (2005). O método de Fernandez e Steel

transforma a distribuição de probabilidade simétrica em uma distribuição

possivel-mente assimétrica acrescentado apenas um parâmetro, o qual pode ser interpretado

(27)

se menor que 1, então a distribuição terá maior massa a esquerda da moda e se maior

que 1 terá maior massa a direita da moda. O método de Fernandez & Steel (1998) e

sua generalização multivarida de Bauwens & Laurent (2005) será explicada em detalhes

no Capítulo 2.

Outras propostas recentes para modelar características não captadas pelos modelos

GARCH usuais são: modelos com mudança de regime estocástica (Markov switching,

Bauwens et al. (2008), Ardia (2009)), e misturas de distribuições para os erros (ver

por exemplo Ausin & Galeano (2007)).

Outra classe de modelos para volatilidade são os modelos de Volatilidade Estocástica

(VE), propostos por Taylor (1982), os quais tem sido uma alternativa aos modelos da

família GARCH. Em alguns casos, estes modelos são conhecidos por modelarem melhor

a volatilidade do que os modelos GARCH (veja, Kim et al. (1998), Barossi-Filho

et al. (2010)), mas são considerados de difícil estimação, isso porque nesses modelos

não é possível obter a função verossimilhança de forma analítica, pois as volatilidades

aparecem como variáveis latentes. Iniciado, por Jacquier et al. (1994) os métodos

MCMC tem sido usados para estimar os parâmetros e as log-volatilidades do modelo

de VE do ponto de vista Bayesiano. Na classe de modelos VE também tem surgido

propostas na literatura para relaxar a hipótese de normalidade dos erros

introduzindo-se distribuições com caudas mais pesadas bem como distribuições assimétricas (ver

por exemplo, Liesenfeld & Jung (2000) e Cappuccio et al. (2004)). A utilização das

distribuições de probabilidade que serão obtidas no Capítulo 2 para os erros dos modelos

VE nos casos univariados e multivariados ﬁcará como proposta futura de pesquisa nesta

(28)

1.4 Apresentação de Capítulos 14

1.4 Apresentação de Capítulos

No Capítulo 1 foi apresentada a motivação para o projeto e alguns conceitos básicos,

incluindo uma introdução aos conceitos de retornos e volatilidade em séries

tempo-rais e aos principais métodos computacionais baseados em Monte Carlo via Cadeias

de Markov (Amostrador de Gibbs e Metropolis-Hastings). Ainda neste capítulo,

tam-bém é feita uma revisão bibliográﬁca de alguns trabalhos referentes a distribuições

assimétricas e modelos GARCH.

O Capítulo 2 deﬁne o conceito de simetria em distribuições de probabilidade

uni-variadas e multiuni-variadas e apresenta um método para obter uma generalização

pos-sivelmente assimétrica (dependendo do valor do parâmetro de assimetria) dessas

dis-tribuições, desde que estas sejam, contínuas e unimodais. O método é então aplicado

a três distribuições de probabilidade comumente utilizadas para os erros dos modelos

GARCH.

Os modelos GARCH, foco do estudo dessa dissertação, são apresentados no

Ca-pítulo 3. Inicialmente, são introduzidos os modelos univariados conhecidos como

GARCH(p,q), em seguida são apresentadas duas de suas generalizações

multivaria-das, os modelos CCC-GARCH e DCC-GARCH. Ainda, neste capítulo, é apresentado

dois algoritmos para simulação da distribuição a posteriori dos parâmetros do modelo

DCC-GARCH. Lembrando que o modelo DCC-GARCH generaliza o modelo GARCH

univariado e portanto o mesmo algoritmo pode ser utilizado para o GARCH univariado.

No Capítulo 4 é apresentado um estudo de simulação para avaliar se alguns

crité-rios para seleção de modelos conhecidos na literatura são adequados para distinguir

entre os modelos aqui estudados. No Capítulo 5 os modelos estudados são aplicados a

dois conjuntos de dados reais, uma para os modelos univariados e outro para os

(29)

1.4 Apresentação de Capítulos 15

apresentados no Capítulo 3. Estes, então são comparados via critérios de seleção de

modelos e é feita a análise de resíduo para o modelo selecionado.

Por ﬁm, no Capítulo 6 temos as considerações ﬁnais e a conclusão da dissertação.

Em seguida, são apresentadas as referências bibliográﬁcas e o Apêndice A com as

(30)

Capítulo 2

Distribuições Assimétricas

Neste capítulo apresentaremos o método de Fernandez & Steel (1998) para inserir

assimetria em qualquer função de distribuição de probabilidade contínua, simétrica,

unimodal e deﬁnida nos reais. Em seguida apresentaremos o método de Bauwens

& Laurent (2005), o qual generaliza o método de Fernandez & Steel (1998) para as

distribuições multivariadas.

2.1 Método Univariado

Diversas propostas para introduzir assimetria em distribuições simétricas surgiram na

literatura, dentre elas podemos citar, Azzalini (1985), Fernandez & Steel (1998), Branco

& Dey (2001), Azzaline & Capitanio (2003), Jones & Faddy (2003). Mas devido a

sim-plicidade e generalidade neste capítulo nos concentraremos na proposta de Fernandez

& Steel (1998). Neste método os momentos são mais fáceis de serem calculados e não

é necessário obter a função de distribuição acumulada. Ainda, no contexto Bayesiano,

o método facilita a especiﬁcação das distribuições a priori separando os efeitos dos

parâmetros de assimetria e de cauda.

(31)

2.1 Método Univariado 17

Considerep(x) uma função de densidade unimodal, deﬁnida na reta e simétrica em

torno do zero. Neste caso, consideramos p(x) simétrica se p(x) = p(₋x), para todo

x_∈R_{. O método proposto em Fernandez & Steel (1998) é conhecido como método de}

escala inversa de fatores. Este obtêm uma função de densidades(x_|γ) a partir dep(x)

a qual é assimétrica e possui o grau de assimetria indexado pelo parâmetro adicional

γ >0. Quando o valor da variável aleatória é menor que zero entãos(x_|γ)_∝p(xγ), caso

contrário,s(x_|γ)_∝p(x_γ). A função de densidade de probabilidades(x_|γ) é apresentada

a seguir:

s(x_|γ) = 2

γ+γ−₁

n

p(xγ)I(−∞_,₀₎(x) +p(x/γ)I_[0_,∞₎(x)

o

= 2

γ+γ−₁p(xγ

−_sign₍_x₎

),

sendoIA(x) a função indicadora no conjuntoAesign(x) é igual a−1, sex <0 e igual

a +1 , se x_≥0.

Algumas das principais características de s(x_|γ) são apresentadas a seguir:

1. Se γ = 1 então obtemos o caso simétrico, isto é, s(x_|γ = 1) =p(x).

2. s(x_|γ) mantém a mesma moda da p(x). Como p(x) é unimodal e simétrica em

torno do zero, a moda sempre é no zero.

3. A massa de probabilidade a esquerda e a direita de zero é independente dep(x):

P(X _≥0) = 2γ

1 +γ2

Z ∞

0 p(x/γ)dx=

γ2

1 +γ2,

P(X _≤0) = 1−P(X _≥0) = 1 1 +γ2,

P(X _≥0)

P(X _≤0) = γ

2_.

(32)

5. A existência dos momentos des(x_|γ) depende unicamente dos momento absolutos

de p(x). O r-ésimo momento é dado por:

E(Xr_|γi) =

γr+1_{+ (}₋₁₎r_/γr+1

γ+ 1/γ Mr,

sendo

Mr = 2

Z ∞

0 x

r _p₍_x₎_dx _(2.1)

o r-ésimo momento absoluto de p(x).

6. A média e a variância são dados por:

µ = M1(γ−1/γ) (2.2)

σ2 = (M2−M12)(γ2+ 1/γ2) + 2M12−M2 (2.3)

7. A versão padronizada da função de densidade s(x_|γ) é a distribuição de

proba-bilidade da variável aleatória Z = (X₋µ)/σ, a qual é dada por:

p(z_|γ) = s(zσ+µ_|γ)dx

dz =s(zσ+µ|γ)σ

= 2σ

γ+γ−₁p(z ∗

), (2.4)

sendo, z∗ =       

(zσ+µ)γ, se z <₋µ/σ

(zσ+µ)/γ, se z_{≥ −}µ/σ

(2.5)

e p(z∗) a função de densidade simétrica calculada em

z∗.

Como exemplo, se aplicarmos o método apresentado em (2.4) na distribuição de

probabilidade Normal Padrão, obtemos:

p(x_|γ) = (2/π)

1/2

γ+γ−1 exp

(

(x∗)₂

2

)

(33)

sendo, x∗ dado como em (2.5). No caso da função de distribuição simétrica

p(x) ser

padronizada temos o segundo momento absoluto será dado porM2 = 1. Neste exemplo

então, temos M2 = 1 e aplicando (2.1) obtemos M1 = (2/π)1/2. Desta forma, das

expressões (2.2) e (2.3) obtemos a média a variância da versão assimétrica da Normal

Padrão:

µ = (2/π)1/2(γ₋1/γ)

σ2 = (γ2+γ−₁

−1)−µ2.

A função de densidade (2.6) será referenciada no texto como SSN(0,1, γ) (Standard

Skew Normal). A Figura 2.1 apresenta o gráﬁco dessa distribuição nas versões com

parâmetro de assimetria igual a 1,0, 0,7 e 1,3, sendo respectivamente a versão

simé-trica, uma versão assimétrica a esquerda e uma versão assimétrica a direita. Observe

que no caso padronizado a função de densidade não possui moda igual a zero.

−4 −2 0 2 4

0.0

0.1

0.2

0.3

0.4

x

p(x|

γ

)

γ = 1.0

γ = 0.7

γ = 1.3

Figura 2.1: Versão padronizada da distribuição Normal Assimétrica.

(34)

pro-2.2 Método Multivariado 20

babilidade presente nas caudas da distribuição. Como exemplo, para a função de

densidade (2.6), a Tabela 2.1 apresenta os valores de P(X < ₋q)/P(X > q), isto é,

a razão entre a massa de probabilidade presente a esquerda de −q com a massa de

probabilidade presente a direita deq, sendo q _≥0. Observe que mesmo com γ = 0,9,

o que graﬁcamente seria próximo de simetria, a massa de probabilidade presente na

cauda esquerda não é próxima da massa de probabilidade presente na cauda direita.

Note que o valor desta razão aumenta quando aumentamos o valor de q.

Tabela 2.1: Razões entre a massa de probabilidade presente a esquerda de ₋q com a

massa de probabilidade presente a direita de q P(X<−_q₎ P(X>q)

.

q= 1 q= 2 q = 3

γ = 0,9 1,0192 1,5183 3,3238 γ = 0,7 1,0584 4,9009 119,7992

2.2 Método Multivariado

O conceito de distribuições simétricas em torno do zero apresentado na Seção 2.1 é

generalizado para distribuições multivariadas na deﬁnição a seguir (Bauwens & Laurent

(2005)):

Deﬁnição 2.1. Uma distribuição de probabilidade unimodal p(x) definida em Rm_,

com E(X) = 0 _e _{V ar}(_X) = _I_m _{é simétrica se, e somente se, para qualquer} _x_,

p(x) =p(Qx)para qualquer matriz diagonalQ cujos elementos da diagonal são iguais

a 1 ou ₋1.

Considerando p(x) como na Deﬁnição 2.1 o método para inserir assimetria de

(35)

2.2 Método Multivariado 21

& Steel (1998) apresentado na Seção 2.1. Este método é dado por:

s(x|γ) = 2m

m

Y

i=1

γi

1 +γ2 i

!

p(x∗)_, (2.7)

sendo, x∗ = (_x∗ 1, . . . , x

∗ m)

′,

x∗

i = xi/γi se xi ≥ 0 e x∗i =xiγi se xi <0. Os parâmetros

de assimetria são dados porγ = (γ1, . . . , γm)′, com γi >0. Seγi = 1 então a marginal

correspondente é simétrica.

Os momentos de p(x|γ) podem ser obtidos em função dos momentos absolutos das

distribuições marginais dep(x) como em Fernandez & Steel (1998). Isto é,

E(X_ir_|γi) =

γr+1

i + (−1)r/γr+1

γi+ 1/γi

Mr, (2.8)

sendo

Mr = 2

Z ∞

0 x r

i p(xi)dxi,

para qualquer r_∈N_.

Em geral, mesmop(x) sendo padronizada a distribuição resultantes(x_|γ) não será

padronizada. Mas desde que o primeiro momento absoluto da distribuição marginal

p(xi) seja conhecido podemos utilizar a expressão (2.8) para obtermos o vetor de médias

µ = (µ1, . . . , µm)′ e o vetor de variâncias σ2 = (σ12, . . . , σm2)

′ de

s(x_|γ). Como p(x)

é padronizada, é fácil ver que M2 = 1, logo da expressão (2.8) temos as médias e as

variâncias de p(x_|γ):

µi = E(Xi|γi) = (γi−γ

−₁

i )M1, (2.9)

σ2_i = γ

3 i +γ

−₃

i

γi+γ

−₁

i

M2 −µ2i = (γi2+γ

−₂

i −1)−µ2i, (2.10)

para i= 1, . . . , m.

(36)

pro-2.2 Método Multivariado 22

babilidade do vetor aleatório Z = (Z1, . . . , Zm)′, no qual Zi = (Xi −µi)/σi, a qual é

dada por:

p(z_|γ) = 2m

"_m Y

i=1

γi

1 +γ2 i

σi

#

p(z∗₎_, _(2.11)

sendo, z∗ i =       

(ziσi+µi)/γi, se zi ≥ −µi/σi

(ziσi+µi)γi, se zi <−µi/σi.

(2.12)

A seguir aplicaremos o método para as distribuições de probabilidade Normal,

t-Student e GED multivariadas. Vale lembrar que para obter o caso univariado das

distribuições a seguir, basta utilizarm = 1.

2.2.1 Normal

A distribuição Normalm-Variada denotada por N(0_,_I_m) é deﬁnida como produto de

m distribuições Normais Padrão N(0,1), logo possui distribuições marginais N(0,1).

A distribuiçãoN(0_,_I_m) é dada por:

p(x) = 1

(2π)m/2 exp

(

−1₂

m

X

i=1

x2i

)

. (2.13)

Calculando o momento absoluto da N(0,1), temos:

M1 =

2 (2π)1/2

Z ∞

0 xiexp

( −x 2 i 2 ) dxi = 2

(2π)1/2. (2.14)

Logo, substituindo (2.14) em (2.9) obtemos as médias marginais da versão

assimé-trica da função de densidade (2.13):

µi = (2/π)1/2(γi−γ

−₁

(37)

Para i = 1, . . . , m. As variâncias marginais são obtidas diretamente da expressão

(2.10). Por ﬁm, da expressão (2.11) obtemos a distribuição de probabilidade Normal

Assimétrica e Padronizada (SSN(0_,_I_m,_γ),_{Standard Skew Normal}).

p(z|γ) =

2

π

m/2 m Y

i=1

γiσi

1 +γ2 i

!

exp

(

−1₂

m X i=1 z∗ i 2 ) ,

sendo,z∗

i dado pelas expressões (2.12).

2.2.2 t-Student

Uma generalização multivariada da distribuição t-Student é deﬁnida como:

p(x_|ν) = Γ((ν+m)/2)

Γ(ν/2)[π(ν₋2)]m/2 1 +

x′_x

ν₋2

!−₍_m₊_ν₎_/₂

. (2.15)

Essa distribuição de probabilidade será denotada por ST(0_,_I_{m, ν}) (_Standard

t-Student), sendo essa padronizada e com distribuições marginais ST(0,1, ν). A

dis-tribuição ST(0_,_I_{m, ν}) satisfaz a Deﬁnição 2.1 e portanto, podemos aplicar o método

de Bauwens & Laurent (2005).

Calculemos inicialmente o primeiro momento absoluto da distribuição ST(0,1, ν):

M1 =

2Γ((ν+ 1)/2)

Γ(ν/2)(π(ν₋2))1/2

Z ∞

0 xi 1 +

x2 i

ν₋2

!−ν+1 2

dxi

= 2Γ((ν+ 1)/2) Γ(ν/2)(π(ν₋2))1/2

(ν₋2)

(ν₋1)

= Γ((ν−1)/2)

√

ν₋2

Γ(ν/2)√π . (2.16)

(38)

assi-2.2 Método Multivariado 24

métrica da função de densidade (2.15) são formados pelos elementos:

µi = (γi−γi−1)

Γ((ν₋1)/2)√ν₋2

Γ(ν/2)√π .

Por ﬁm, da expressão (2.12) obtemos a distribuição de probabilidade t-Student

assimétrica e padronizada (SST(0_,_I_m,_{γ, ν}), _{Standard Skew t-Student}).

p(z|γ, ν) = _√2 π

!m _m Y

i=1

γiσi

1 +γ2 i

!

Γ(ν+m 2 )

Γ(ν

2)(ν−2)m/2

1 + z∗

′

z∗

ν₋2

!−

m+ν 2

, (2.17)

sendo,σi e zi∗ dado pelas expressões (2.10) e (2.12), respectivamente.

2.2.3 GED

A distribuição GED (Generalized Error Distribution) padronizada é escrita no caso

univariado como:

p(x_|k) =

"

Γ(3/k)

Γ(1/k)

#1/2 exp

−hΓ(3Γ(1/k/k))x 2ik/2

2Γ((k+ 1)/k) . (2.18)

Essa distribuição generaliza a distribuição Normal podendo ter caudas mais leves

(k > 2) ou mais pesadas (k <2) do que a Normal Padrão (N(0,1)) e se k = 2 obtemos

a distribuição Normal.

Algumas generalizações multivariadas da distribuição GED foram propostas na

li-teratura, como por exemplo em Gómez et al. (1998) e Giller (2005), mas as marginais

dessas distribuições são difíceis de obter, assim como os momentos absolutos das

mar-ginais. Por este motivo, neste trabalho optou-se por utilizar a distribuição conjunta de

mvariáveis aleatórias independentes, garantindo assim, que as marginais serão a

(39)

do vetor aleatórioX = (X1, . . . , Xm)′ é dada por:

p(x_|k) =

"

Γ(3/k)

Γ(1/k)

#m/2 exp

−hΓ(3Γ(1/k/k))

ik/2 Pm

i=1|xi|k

[2Γ((k+ 1)/k)]m . (2.19)

Como a distribuição (2.18) é padronizada, teremos E(X) = 0 e _{V ar}(_X) = _I_m

e assim podemos utilizar o método de Bauwens & Laurent (2005) para inserir

assi-metria. Para facilitar a notação referiremos a distribuição GED Multivariada como

GED(0_,_I_{m, k}) e a distribuição resultante da aplicação do método e padronizada como

SSGED(0_,Im,γ, k) (Standard Skew GED).

Calculemos inicialmente o primeiro momento absoluto da distribuiçãoGED(0,1, k):

M1 = 2

"

Γ(3/k)

Γ(1/k)

#1/2

1 2Γ((k+ 1)/k)

Z ∞

0 x exp

 



−

"

Γ(3/k)

Γ(1/k)x

2

#k/2 



dx

=

"

Γ(3/k)

Γ(1/k)

#1/2

1 Γ((k+ 1)/k)

Γ((k+ 1)/k)Γ(2/k)

Γ(3/k)

= Γ(2/k)

[Γ(1/k)Γ(3/k)]1/2. (2.20)

Logo, substituindo (2.20) na expressão (2.8) temos que o vetor de médias da versão

assimétrica da função de densidade (2.19) é formado pelos elementos:

µi = (γi−γ

−₁

i )

Γ(2/k)

[Γ(1/k)Γ(3/k)]1/2, (2.21)

para i= 1, . . . , m.

(40)

Assimétrica e Padronizada (SSGED(0_,_I_m,_{γ, k}), _{Standard Skew} GED):

p(z_|γ) = 2m

"_m Y

i=1

γi

1 +γ2 i

σi

# "

Γ(3/k)

Γ(1/k)

#m/2 exp

−hΓ(3Γ(1/k/k))

ik/2 Pm

i=1|z ∗ i|k

(2/k)m_[Γ(1_/k_)]m , (2.22)

sendoµi, σ2i e z ∗

i dados por (2.21), (2.10) e (2.12), respectivamente.

Assim, como a distribuição SSN consiste em caso particular da SST, também

consiste em um caso particular daSSGED, com k= 2.

As distribuições de probabilidade apresentadas neste capítulo serão aplicadas no

contexto de modelos GARCH univariados e multivariados, os quais serão apresentados

(41)

Capítulo 3

Modelos GARCH

Na modelagem estatística paramétrica de volatilidade, os modelos GARCH (

Genera-lized Autoregressive Conditional Heteroscedasticity) estão entre os principais modelos

empregados. O sucesso desses modelos deve-se principalmente à incorporação de

cer-tas características de dados ﬁnanceiros em suas estruturas, tais como acomodação de

caudas pesadas e autocorrelação entre os quadrados de retornos ﬁnanceiros.

É uma extensão natural considerar-se a modelagem simultânea de um conjunto de

séries de retornos deﬁnindo-se modelos GARCH multivariados. Podemos estar

inte-ressados por exemplo em estudar as relações entre as volatilidades e co-volatilidades

de vários mercados. Claramente, a construção de medidas de risco de um portfólio de

ativos ﬁnanceiros será inﬂuenciada pela estrutura de dependência entre as séries que

compõem o portfólio.

Neste capítulo serão apresentados o modelo GARCH univariado de Bollerslev (1986)

e duas das principais extensões multivariadas, o CCC-GARCH de Bollerslev (1990) e

o DCC-GARCH de Engle (2002).

(42)

3.1 Modelos Univariados 28

3.1 Modelos Univariados

Considerey=_{yt, t= 1, . . . , T}como uma série de retornos. O modelo GARCH(p,q)

é deﬁnido como:

yt = ǫt

q

ht , ǫt ∼D(0,1) (3.1)

ht = ω+

p

X

i=1

αiy2t−_i+ q

X

j=1

βjht−j, (3.2)

sendo os ǫt independentes e identicamente distribuídos e D(0,1) uma distribuição de

probabilidade com média zero e variância 1. Então ht é a variância condicional (não

observável) de yt dada a informação prévia It = {yt−1, yt−2, . . .}. As restrições

suﬁci-entes de positividade e estacionaridade deht são ω > 0, αi ≥ 0, i = 1, . . . , p, βj ≥ 0,

j = 1, . . . , q e Pp

i=1αi+Pqj=1βj <1.

Considerando a esperança e a variância de yt dadoIt, temos:

E[yt|It] =

q

htE[ǫt|It] =

q

ht E[ǫt] = 0 (3.3)

V ar[yt|It] = E[y2t|It] =ht V ar[ǫt] =ht. (3.4)

Logo, podemos utilizar a equação (3.3) para calcular a esperança incondicional:

E[yt] =E[E[yt|It]] = E[0] = 0.

Considerando agora a equação (3.4) para calcular variância incondicional, temos:

(43)

Assumindo que a série y seja estacionária das equações (3.2) e (3.5) é fácil ver que

E[y_t2] = ω

1₋ Pp

i=1αi+Pqj=1βj

. (3.6)

Da equação (3.6), temos que, para existir a variância incondicional deyté necessário

quePp

i=1αi+Pqj=1βj <1, justiﬁcando assim a restrição de estacionaridade do modelo.

Como da expressão (3.1) temos queǫt=yt/√ht, podemos escrever a fdp condicional

do retornoyt em função da fdp de ǫt. Obtemos assim,

p(yt|It) = (ht)−1/2pǫ(yt/

q

ht), (3.7)

sendopǫ a função de densidade de probabilidade deǫt. Agora, podemos obter a função

de verossimilhança do modelo substituindo (3.7) em (1.1). Logo, a função de

verossi-milhança do modelo será dada por:

L(θ) =

T

Y

t=1

(ht)

−₁_/₂

pǫ(yt/

q

ht),

sendoθ = (ω, α1, . . . , αp, β1, . . . , βq)′ o conjunto de todos os parâmetros.

Vale notar que mesmo se ǫt ∼ N(0,1) a distribuição incondicional de yt não é

a Normal, em particular tendo caudas mais pesadas do que a Normal. No entanto,

existe evidência na literatura de que muitas séries temporais ﬁnanceiras tendem a ter a

curtose observada ainda maior do que aquela implicada por um modelo GARCH com

erros normais. Sendo assim, alguns autores têm proposto distribuições com caudas

mais pesadas do que a Normal para os erros ǫt. Por exemplo, a distribuiçãot-Student

com ν graus de liberdade (Baillie & Bollerslev (1989), Ardia (2008)).

Identiﬁcar a ordem de um modelo GARCH a ser ajustado a uma série pode ser

(44)

exemplo: (1,1), (1,2), (2,1) e (2,2)) e escolhe-se o modelo com base em critérios, como

o AIC (Akaike 1974) e o BIC (Schwarz 1978), entre outros. O autor também aﬁrma,

que na maioria das series ﬁnanceiras um modelo GARCH(1,1) é o mais parcimonioso

para descrever a volatilidade.

Nesta dissertação, o desenvolvimento do algoritmo de estimação será focado no

modelo GARCH(1,1), já que modelos GARCH de outras ordens podem ser estimados

de forma semelhante. A distribuição de probabilidade dos erros será considerada na

forma assimétrica apresentada no Capítulo 2, lembrando que para obter o caso simétrico

basta ﬁxarγ = 1.

Sob o enfoque Bayesiano é necessário determinar a distribuição a priori dos

parâ-metros do modelo. Para os parâparâ-metros do GARCH(1,1) utilizaremos as distribuições

a priori propostas em Ardia (2006). Estás são normais truncadas no espaço

paramé-trico de cada um dos parâmetros, também assumiremos independência a priori entre

os parâmetros, desta forma obtemos: ω _∼ N(µω, σ2ω)I(ω>0), α1 ∼ N(µα, σα2)I(0<α<1)

e β1 ∼ N(µβ, σβ2)I(0<β<1), sendo µω, µα, µβ, σω2, σα2 e σβ2 hiperparâmetros. A notação

N(µ, σ2₎_I

(a<x<b), com b > a, representa a função densidade de probabilidade:

1

φ(b)₋φ(a)×

1

√

2πσ2 exp −

(x₋µ)2

2σ2

!

, x_∈(a, b),

sendo φ(.) a função de densidade acumulada da distribuição normal com média µ e

variânciaσ2_.

No caso, de utilizamos uma distribuição assimétrica, como as apresentadas no

Ca-pítulo 2, será necessário estimar o parâmetro assimetria, neste caso Fernandez & Steel

(45)

esco-3.1 Modelos Univariados 31

lher os valores de a e b de modo queE(γ) = 1.

1 =Eγ2(γ) =

ba

Γ(a)

Z ∞

0 γ (γ 2₎a−1

e−bγ2

dγ2

= ba Γ(a)

Z ∞

0 (γ

2₎(a+0,5)−₁

e−_bγ2

dγ2

= ba Γ(a)

Γ(a+ 0.5) ba+0.5 ,

o que implica,

b=





Γ

a+1 2

Γ(a)





2

. (3.8)

Considerando b como em (3.8) podemos ﬁxar o valor de a controlando a variância

a priori e a probabilidade a priori de γ _∈ (0,1). Fixando a = 0,5 obtemos b _≈ 0,32,

o que nos leva a V ar(γ) = π/2₋1 _≈ 0,57 e P(0 < γ < 1) _≈ 0,58 o que parece ser

uma escolha razoável. Além disso, esta particular escolha é equivalente a especiﬁcar

γ _∼N(0, 0,64−₁)

I(γ>0), pois considerando Πγ e Πγ2 como as densidades a priori de γ

eγ2_{, respectivamente, temos:}

Πγ(γ|a= 0,5, b= 0,32) = 2γ×Πγ2

γ2_|a= 0,5, b = 0,32

∝ γ (γ2)1/2−1

exp(−0,32γ2)

∝ exp

−1₂ 0,64γ2

∝ exp

(

− γ

2

2 (0,64)−₁

)

, γ_∈(0,_∞).

Ainda, quando utilizarmos a distribuição SST(0,1, γ, ν) apresentada em (2.17)

ou SSGED(0,1, γ, k) apresentada em (2.22) devemos estimar o parâmetro de cauda

ν ou k, respectivamente. Neste caso, será utilizado ν _∼ N(µν, σν2)I(ν>2) e k ∼

N(µk, σk2)I(k>0), sendoµν, µk, σν2 e σ2k hiperparâmetros.

(46)

3.2 Modelos Multivariados 32

prioris, facilita a inserção de informação em uma determinada região de interesse

atra-vés dos parâmetros µ e σ2 _{da distribuição Normal (}_N₍_{µ, σ}2_{)), mesmo que no caso de}

truncamento esses hiperparâmetros não representem a média e a variância, mas ainda

controlam a região de maior massa de probabilidade. A seguir apresentaremos os

mo-delos multivariados e logo, em seguida apresentaremos dois algoritmos de simulação

da distribuição a posteriori dos parâmetros que pode ser tanto usado para o modelo

multivariado quando para o modelo univariado.

3.2 Modelos Multivariados

Considere yt = (yt1, . . . , yt,m)′ como sendo um vetor de retornos no instantet para m

séries temporais. Assim, as extensões multivariadas dos modelos GARCH podem ser

escritas como:

yt =H

1/2

t ǫt, (3.9)

sendoHt a matriz de covariâncias condicionais eH

1/2

t a matrizm×mpositiva deﬁnida,

obtida pela decomposição de Cholesky da matrizHt. O vetor dos erros ǫt tem ordem

m_×1 e tem média e variância dado por:

E(ǫt) = 0

V ar(ǫt) = Im,

sendo,Im a matriz identidade de ordem m.