DIEBOLD-LI
MÁRCIO POLETTI LAURINI LUIZ KOODI HOTTA
Resumo. Neste artigo propomos um modelo estatístico para ajustar, interpolar e prever a estrutura a termo das taxas de juros, baseada em algumas extensões para o modelo de estrutura a termo de taxas de juros proposto por [Diebold & Li, 2006], através de uma estimação bayesiana usando MCMC. As extensões propostas são o uso de uma forma paramétrica mais exível para a curva de juros; tornar todos os parâmetros do modelo variantes no tempo usando uma estrutura de fatores latentes, e adicionar uma estrutura de volatilidade estocástica para controlar a presença de heterocedasticidade condicional observada nas taxas de juros.
A estimação bayesiana permite obter a distribuição dos estimadores em amostras nitas, e como subproduto obter a distribuição das previsões para a estrutura a termo das taxas de juros. A metodologia desenvolvida não necessita de uma pré-interpolação da curva de juros como usual em modelos de estimação de estrutura a termo. Realizamos um exercício empírico desta metodologia ajustando dados diários da estrutura a termo das taxas de juros implícita em contratos de Swap DI-PRÉ transacionados na Bolsa de Mercadorias e Futuros (BM&F).
1. Introdução
A estrutura a termo das taxas de juros pode ser denida como uma coleção de taxas de juros indexadas em duas dimensões, maturidade e tempo. O primeiro índice mostra a relação entre taxas com diferentes maturidades para contratos de uma mesma natureza em determinado dia. O segundo índice mostra a evolução das taxas no tempo contratos com mesmas maturidades. Desta forma a estrutura a termo das taxas de juros mostra a evolução dinâmica de curvas de juros diárias, unindo uma estrutura funcional de observações em cross-section (evolução das taxas em função das maturidades) e a evolução da curva de juros no tempo pode ser representado como processo estocástico multivariado.
A modelagem da estrutura a termo das taxas de juros é de elevada importância no mercado nanceiro. Observando apenas o mercado brasileiro entre janeiro a julho de 2006 cerca de 88 mil-hões de contratos de DI, correspondendo a um patrimônio líquido de nanceiro de 172 Bilmil-hões/R$ . O mercado de títulos públicos emitidos pelo governo brasileiro, de acordo com números forneci-dos pelo Sistema Especial de Liquidação e Custódia de janeiro a julho de 2006 as operações com títulos correspondem a um giro de 2,3 Trilhões de R$ e cerca de 310 mil negociações de compras e vendas denitivas desses títulos. Operações de instrumentos nanceiro de renda xa são uma parte fundamental do portfólio das instituições nanceiras.
A modelagem da estrutura a termo das taxas de juros é de fundamental importância, já que as instuições nanceiras necessitam controlar a sua exposição ao risco de oscilação de taxas de juros
Primeiro autor - Ibmec São Paulo e aluno de doutorado em Estatística no Departamento de Estatística, Instituto de Matemática, Estatística e Computação Cientíca, Universidade Estadual de Campinas - UNICAMP. Segundo autor - Departamento de Estatística, Instituto de Matemática, Estatística e Computação Cientíca, Universidade Estadual de Campinas - UNICAMP. email de contato [email protected] .
através do balanceamento de suas posições em títulos de dívida pública ou contratos futuros que possuem seu valor atrelado às taxas de juros, e as estratégias de imunização de portfólio necessitam de medidas preditivas dos movimentos na estrutura a termo das taxas de juros.
Existe uma grande literatura sobre a modelagem da estrutura a termo das taxas de juros, e podemos de forma simplicada dividir esta literatura em 3 classes de modelos. A primeira classe são os modelos de equilíbrio, como [Vasicek, 1977], [Brennan & Schwartz, 1979], [Cox et al. , 1985] e [Due & Kan, 1996]. Nestes modelos a evolução da estrutura a termo das taxas de juros é dada pela especicação de um processo gerador das taxas de juros de curto prazo, normalmente na forma de um processo de difusão e de uma função de desconto, que dá a relação entre as taxas das maturidades mais longas em função da taxa de curto prazo. A estimação econométrica dos modelos de equilíbrio compreende estimar os parâmetros do processo de difusão da taxa de juros de curto prazo. Como um exemplo de estimação de modelos de equilíbrio temos o clássico artigo de [Chan et al. , 1992].
A segunda classe de modelos da estrutura a termo das taxas de juros são os modelos de não-arbitragem, aonde o representante mais importante é o modelo de [Heath et al. , 1992]. Nestes modelos o ajuste da curva é realizado de forma a não existirem condições de arbitragem entre as taxas, e não envolve diretamente a estimação de parâmetros subjacentes ao processo gerador das taxas de juros. A curva observada é ajustada perfeitamente em cada dia (normalmente utilizando árvores binomiais ou trinomiais), mas não existe diretamente uma estrutura dinâmica nas taxas de curto prazo e o problema não envolve estimação de parâmetros. O objetivo destes modelos não é a previsão da curva mas a precicação de instrumentos nanceiros utilizando a curva de juros observada no mercado.
Uma terceira literatura importante é o uso de modelos estatísticos sem uma interpretação estrutural, isto é, modelos para sintetizar o comportamento e permitir a previsão da curva, sem necessariamente representarem o ajuste de modelos teóricos sob condições de equilíbrio e não arbitragem. Exemplos desse tipo de modelo incluem a metodologia de componentes prin-cipais de [Litterman & Scheinkman, 1991], modelos de interpolação da curva como os splines de [Shea, 1984], smoothing splines de [Fisher et al. , 1995], regressão por kernel de [Linton. et al. , 2001] e modelos paramétricos de ajuste da curva como [Nelson & Siegel, 1987] e [Svensson, 1994].
Embora estejam baseados nos modelos teóricos das taxas de juros, os modelos estruturais baseados em condições de equilíbrio tem um poder preditivo baixo para a estrutura a termo. Os modelos de calibração baseados em não arbitragem não permitem diretamente uma previsão para a curva de juros. Modelos estatísticos são normalmente utilizados no ajuste e previsão da estrutura a termo das taxas de juros pelo seu ajuste superior aos modelos econométricos e sua maior simplicidade.
2. Modelo de Diebold-Li
Entre os modelos estatísticos para a taxa de juros, um modelo importante e bastante utilizado em aplicações de mercado é o modelo de Diebold-Li [Diebold & Li, 2006]. Este modelo é uma extensão dinâmica de um modelo para o ajuste cross-section para a curva de juros conhecido como modelo de Nelson-Siegel. O modelo de Nelson-Siegel [Nelson & Siegel, 1987] corresponde ao ajuste da seguinte equação para a curva de taxa de juros observada no mercado em um dia especíco:
(1) yit(mit) = β1t+ β2t 1 − e−mit/τt mit/τi + β3t 1 − e−mit/τt mit/τt − e−mit/τt
aonde yit(mit)são as taxas observadas para o dia i e a maturidade t, e a em função das
maturi-dades mit, e β1t, β2t, β3te τtsão parâmetros. O modelo de Nelson-Siegel é uma forma parcimoniosa
de ajustar a curva de juros, e consegue capturar uma parte dos fatos estilizados observados, como por exemplo os formatos exponencias presentes nas curvas de juros, e os parâmetros βitpossuem
interpretações econômicas, aonde β1t tem uma interpretação de nível de longo prazo β2t de
com-ponentes de curto prazo e β3tde componentes de médio prazo. Também podem ser interpretados
como decomposições de nível, inclinação e curvatura da curva de juros, de acordo com a termino-logia desenvolvida por [Litterman & Scheinkman, 1991]. Esses componentes podem ser utilizados diretamente no processo de imunização de portfólios de tequation ns.ls axas de juros.
Uma possível extensão neste modelo é utilizar no ajuste da cross-sections de juros a formulação proposta por [Svensson, 1994], dada pela adição de um termo adicional na formulação proposta por [Nelson & Siegel, 1987], e correspondente a :
(2) yit(mit) = β1t+β2t 1 − e−mit/τ1t mit/τ2t +β3t 1 − e−mit/τ1t mit/τ1t − e−mit/τ1t +β4t 1 − e−mit/τ2t mit/τ2t − e−mit/τ2t
permitindo um ajuste mais exível para a curva de juros, o que possibilita capturar mais de uma mudança de inclinação na curva de juros. O modelo de Svensson é especialmente importante já que mudanças na inclinação são normalmente observadas em momentos de mudanças de expectativas quanto as taxas futuras, como por exemplo taxas altas no curto prazo, mais baixas no médio prazo e novamente mais elevadas para maturidades mais longas, sinalizando expectativas de mudanças na política econômica.
O objetivo destes modelos é permitir o ajuste, e posteriores interpolações e e extrapolações da curva de juros baseados em uma estrutura paramétrica, concorrendo com outras formas de ajuste não paramétricas como smoothing-splines. O modelo de [Nelson & Siegel, 1987] possui duas vantagens adicionais sobre os modelos não-paramétricos, além da parcimônia na estimação. A primeira vantagem é que a extrapolação da curva funciona melhor, pela natureza exponencial utilizada. A segunda vantagem é que os parâmetros β1t,β2t e β3t possuem uma interpretação
de nível, inclinação e concavidade compatíveis com a interpretação de três fatores proposta por [Litterman & Scheinkman, 1991], um dos benchmarks desta literatura, facilitando a interpretação e a comparação dos resultados obtidos no ajuste da curva.
A extensão dinâmica formulada por [Diebold & Li, 2006] torna o modelo de [Nelson & Siegel, 1987] dinâmico (ajustando os diversos dias observados para a curva de juros) através de um procedimento em 3 estágios:
(1) O modelo de Nelson-Siegel (com τ xo, e assim tornando o modelo linear nos parâmetros) é estimado por Mínimos Quadrados Ordinários para cada data estimando-se vetores de parâmetros β1t, β2t, β3t.
(2) A dinâmica do sistema é capturada através de um modelo vetorial autoregressivo (VAR) para os vetores dos parâmetros β1t,β2t e β3t, estimados no primeiro estágio.
(3) Através do modelo VAR estimado para os vetores β1t,β2t e β3t, são realizadas previsões
para os estes parâmetros e substituindo-se as previsões no modelo de Nelson-Siegel dado pela equação 2.
Esta formulação dinâmica, conforme [Diebold & Li, 2006], tem o objetivo de capturar um conjunto de fatos estilizados existentes na estrutura a termo das taxas de juros, como o fato da curva de juros ser crescente e côncava, mas podendo assumir formatos invertidos como curvas decrescentes e com mudanças de inclinação. Outros fatos estilizados capturados pelo modelos de [Diebold & Li, 2006] são a alta persistência na dinâmica temporal (taxas de mesma maturidade tem alta dependência com o passado), e a persistência nas taxas longas é maior do que nas taxas curtas. Outro fato estilizado se refere aos padrões de volatilidade, aonde se observa que a volatilidade nas taxas longas é muito maior do que nas taxas curtas.
Embora o modelo de Diebold-Li seja simples de ser implementando e tenha um potencial pre-ditivo superior a outros modelos relatados na literatura, ainda existem alguns problemas em seu uso. As três principais objeções a este modelo são:
(1) Considerar o τ xo (linearização imposta no modelo) pode ser problemático para curvas de juros mais instáveis, como curvas de juros de países emergentes.
(2) A forma funcional adaptada do modelo de [Nelson & Siegel, 1987] não permite capturar curvas mais complicadas de taxas de juros, como por exemplo mais de uma mudança na curvatura.
(3) Nenhuma propriedade econométrica do método de estimação foi apresentada. Note que é uma estimação em dois estágios, aonde o VAR é estimado com base em um vetor de parâmetros estimados. O principal problema é a construção de intervalos de conança em amostras nitas para as previsões deste modelo que levem em conta a incerteza na estimação do vetor de hiperparâmetros β1t,β2t e β3t.
(4) Existe uma resistência grande ao uso de modelos que não são baseados em condições de não-arbitragem, já que a curva prevista pode estar contaminada com situações de arbitragem.
Existem algumas soluções propostas para estes problemas. O problema 1 pode ser enfrentado pela estimação dos modelos de [Nelson & Siegel, 1987] e [Svensson, 1994] usando as formas não-lineares sem xar o parâmetro τ , normalmente utilizando mínimos quadrados não-lineares. Mas note que dado o número limitado de observações na curva de juros, o problema de minimização de mínimos quadrados lineares podem ser complicado e ter mais de um mínimo local, o que pode levar a um gerando um ajuste inadequado da curva de juros. Esta é uma das motivações para se manter o parâmetro τ xo, evitando os problemas de otimização numérica envolvidos na estimação de modelos não lineares com um número restrito de observações.
A estimação simultânea dos Betas pode ser realizada através de uma formulação em espaço de estado utilizando o ltro de Kalman, mas o τ é mantido xo na amostra dada a necessidade de linearidade no uso do ltro de Kalman linear. Algumas propriedades estatísticas de um modelo derivado da formulação de [Diebold & Li, 2006] foram derivadas em [Huse, 2007], que utiliza uma forma semelhante do modelo de Nelson-Siegel, mas incorporando dependência espacial e variáveis macroeconômicas. A estimação é realizada em dois estágios, mas algumas propriedades do método
de estimação em amostras nitas são estudadas por simulação de Monte Carlo. O problema 4 é difícil de ser tratado sem a imposição de nenhuma estrutura a priori neste modelo.
3. Extensões propostas
Para superar estes problemas, nós propomos uma versão extendida do modelo de [Diebold & Li, 2006] através de métodos bayesianos. Métodos bayesianos baseados em Markov Chain Monte Carlo estão sendo propostos como alternativas aos métodos frequentistas de estimação em problemas de eco-nometria em um grande número de situações aonde os métodos frequentistas são complicados ou não factíveis de serem aplicados. Exemplos da estimação usando MCMC incluem a estimação de processos de difusão em tempo contínuo como modelos de equilíbrio de estrutura a termo das taxas de juros; modelos de precicação de ativos, volatilidade estocástica e mudanças de regime, como sumarizado em [Johannes & Polson, 2007].
As vantagens da formulação bayesiana são de que podemos tratar tanto parâmetros quanto vetores de estado como variáveis latentes, e no caso, tratamos como variáveis latentes os vetores de hiperparâmetros β1tβ2t, β3t,β4t τ1t e τ2t, Isto é realizado através da formulação de um modelo
dinâmico linear para modelar a evolução destes parâmetros no tempo. Na formulação bayesiana não é necessário assumir linearidade na formulação, e por isso não precisamos xar o parâmetro τ como realizado por Diebold-Li. Note que a maximização da verossimilhança é realizada por simulação, e por isso não sofremos do problema de múltiplos mínimos locais que afetam a estimação baseada em mínimos quadrados não-lineares das equações 1 e 2.
Uma primeira formulação bayesiana do modelo de [Diebold & Li, 2006] foi proposta por [Migon & Abanto-Valle, 2007], e corresponde a uma especicação análoga ao modelo original, utilizando a equação de
Nelson-Siegel 1 com o parâmetro τ mantido xo, mas estimado conjuntamente com os demais parâ-metros do modelo. Propomos algumas extensões para a formulação bayesiana do modelo de [Diebold & Li, 2006] proposta por [Migon & Abanto-Valle, 2007]. A primeira é utilizar a especi-cação do modelo de Svensson (Equação 2) ao invés da formula original de Nelson-Siegel (Equação 1), tornando o formato da curva mais exível. A segunda extensão é tornar os parâmetros τ1 e τ2
variantes no tempo, adicionando dois fatores latentes para estes componentes. A terceira extensão é que a formulação de nosso modelo permite trabalhar com um número diferente de observações para cada dia, evitando uma primeira etapa de interpolação nas curvas para obter um conjunto de observações para as mesmas maturidades como realizado no artigo original de [Diebold & Li, 2006] e que pode introduzir distorções nas curvas de juros utilizadas na estimação.
A última extensão introduzida é adicionar uma estrutura de volatilidade estocástica para os erros de ajuste do modelo. Esta adição é de importância fundamental, já que um dos fatos estilizados em taxas de juros é a presença de heterocedasticidade condicional, normalmente cap-turada em modelos de não-arbitragem e equilíbrio pela adição de fatores adicionais controlando especicamente a evolução da variância. Exemplos desse tipo de formulação incluem os mo-delos de [Hull & White, 1990] e [Scott, 1996] e uma discussão ampla pode ser encontrada em [Fouque et al. , 2000].
Uma análise sobre a importância de modelagem de efeitos de volatilidade pode ser encontrada em [Chan et al. , 1992]. Neste artigo são estudados uma ampla variedade de modelos de equilíbrio para a taxa de juros de curto prazo, e todos os modelos estudados que assumiam a volatilidade constante eram estatisticamente rejeitados como caracterizações empíricas adequadas das taxas
de juros de curto prazo, indicando a necessidade da inclusão de fatores de volatilidade estocástica na modelagem da estrutura a termo das taxas de juros.
Outras vantagens da formulação bayesiana são de que as propriedades do estimadores são obtidas de forma exata para amostras nitas, permitindo calcular os intervalos de conança para os hiperparâmetros e para as previsões da estrutura a termos das taxas de juros levando em conta a incerteza na estimação dos parâmetros. Também mostramos que algumas restrições simples de não arbitragem podem ser incorporadas na estimação do modelo através das escolhas das distribuições das priores deste modelo. A estrutura do modelo será descrita na próxima Seção e na Seção 5 mostramos o mecanismo de estimação deste modelo usando algoritmo de Markov Chain Monte Carlo híbrido, utilizando simultaneamente o algoritmos de Gibbs e o algoritmo de Metropolis-Hastings.
4. Descrição do Modelo
Podemos descrever as extensões propostas neste artigo pelo seguinte conjunto de equações:
(3) yit(mit) = β1t+β2t 1 − e−mit/τ1t mit/τ2t +β3 1 − e−mit/τ1t mit/τ1t − e−mit/τ1t +β4t 1 − e−mit/τ2t mit/τ2t − e−mit/τ2t +eσtηt (4) β1t β2t β3t β4t τ1t τ2t = µβ1 µβ2 µβ3 µβ4 µτ1 µτ2 + Φ β1t−1 β2t−1 β3t−1 β4t−1 τ1t−1 τ2t−1 + t (5) lnσ2t = φ0+ φ1lnσ2t−1+ υt (6) ηt∼ IID(0, 1) e ηt⊥ ηsY i 6= s X η,,υ = ση 0 0 0 Ω 0 0 0 σv
Nesta especicação, que pode ser vista como um modelo formulado em espaço de estado não linear, a Equação 3 corresponde a uma equação de medida, ligando as taxas yit observadas que
descrevem a taxa de juros como funções das maturidades i no tempo t. A formulação desta equação segue a especicação do modelo de Svensson, mas com a adição de fatores latentes βij
e τih , j = 1, 2, 3, 4 e h = 1, 2 variantes no tempo ao invés de parâmetros xos. A matriz Pε,,υ
denota a matriz expandida de variância-covariância, aonde ση é um escalar com variância da
equação de medida, Ωé a matriz de variância-covariância entre os fatores latentes e σv é um
escalar com a variância da equação da volatilidade estocástica. Assumimos que essa matriz é diagonal, exceto pelo sub-matriz de componentes de Ω que podem ser correlacionados.
A evolução dos fatores latentes é dada pela Equação 4, que descreve um modelo autoregressivo de primeira ordem para estes componentes com uma matriz de parâmetros dada por Φ, contendo os coecientes da estimação autoregressiva. Adotamos uma especicação de primeira ordem para o modelo autoregressivo, embora notando que não existe nenhuma limitação teórica a uma ordem superior. Uma possibilidade é implementar uma forma restrita da especicação de Vetor Autore-gressivo trabalhando apenas com uma estrutura autoregressiva para cada parâmetro. Embora isso possa ser imposto a priori, uma forma possível é o uso de priors informativas na estimação de mode-los de vetores autoregressivos, como advogado por [Doan et al. , 1984]. Desta forma trabalhamos com a estrutura de um vetor autoregressivo, mas notando estas duas possibilidades.
Finalmente a Equação 5 descreve o componente de volatilidade estocástica para os erros da equação de medida. A formulação utilizada é a de um modelo autoregressivo para o compo-nente não observado de volatilidade estocástica, conforme a especicação original do modelo de volatilidade estocástica introduzida por [Taylor, 1986]. A adição do componente de volatilidade estocástica representa uma extensão relevante, já que um fato estilizado na modelagem de séries de taxas de juros é a presença de heterocedasticidade condicional. Uma ampla classe de mode-los é baseada na construção de modemode-los multi fatores para a estrutura a termos das taxas de juros com fatores especícos descrevendo a evolução da volatilidade como [Hull & White, 1990], [Lund & Andersen, 1997], e [Fouque et al. , 2000] para uma revisão destes modelos sob a per-spectiva da precicação de derivativos. Notamos que a adição do componente de volatilidade estocástica é especialmente importante nos momentos de mudança de formato da curva de juros, ligadas a maiores incertezas sobre taxas futuras de juros e expectativas sobre a condução da política monetária e scal. Um fato estilizado relevante é que a volatilidade das taxas de juros é maior em economias emergentes, e desta forma o componente de volatilidade estocástica é especialmente relevante para o conjunto de dados utilizado neste estudo.
5. Estimação por MCMC
Note que a especicação do modelo dada pelo sistema de equações 3,4 e 5 corresponde a um modelo em espaço de estado não linear, e assim não pode ser tratado pelos métodos de estimação como o Filtro de Kalman Linear. Uma forma de realizar a estimação simultânea é através de métodos de inferência bayesiana usando Markov Chain Monte Carlo.
Quando utilizamos métodos de inferência bayesiana , o objetivo é encontrar a chamada distri-buição posterior dos parâmetros de interesse condicionados a amostra observada, denotada por p(Θ|y). Para encontrar a distribuição dos parâmetros condionados a amostra, usa-se a relação relação :
(7) p(Θ|y) = p(Θ, y)/p(Θ) = p(y|Θ)p(Θ)/p(y)
onde p(y|Θ) é a verossimilhança do modelo, p(Θ) denota a distribuição a priori assumida para o parâmetro e p(y) é a distribuição marginal da amostra, que precisa ser conhecida até uma constante de integração. Através do Lema de Bayes podemos escrever:
e assim temos que a posterior é proporcional ao produto da verossimilhança pela distribuição a priori:
(9) p(Θ|y) ∝ p(y|Θ)p(Θ)
A obtenção dos estimadores usando inferência bayesiana é através do cálculo da distribuição posterior p(Θ|y), o que envolve o cálculo desta integral, o que exceto em alguns casos de priors conjugadas não pode ser realizado analiticamente e envolve o uso de métodos numéricos, como a metodologia de Markov Chain Monte Carlo que utilizaremos e será descrita a seguir. Após a obtenção da distribuição a posterior, a sumarização dos resultados pode ser feita calculando-se os valores esperados e a variância da distribuição posterior de cada parâmetro:
(10) E(θk|y) =
Z
θkp(Θ|y)dθ
(11) V ar(θk|y) =
Z
θ2kp(Θ|y)dθ − [E(θk|y)]2
e podemos avaliar a densidade marginal de parâmetro θj usando:
(12) p(θj|y) =
Z
p(Θ|y)dθ1dθ2...dθd
Exceto em alguns casos especícos, formas analíticas para estas expressões não podem ser obtidas. Uma forma de se obter estas expressões é utilizar técnicas de integração usando métodos de Monte Carlo. Uma metodologia de Monte Carlo especialmente útil em inferência bayesiana é a metodologia conhecida como Markov Chain Monte Carlo (MCMC). A idéia do método de MCMC é simular uma cadeia de Markov cuja distribuição estacionária convirja para a distribuição de p(Θ|y). A metodologia de MCMC simplica o cálculo de p(Θ|y) fatorando esta distribuição em um conjunto de distribuições condicionais, de dimensão inferior e que podem ser mais facilmente simuladas. A idéia principal para obter estimadores para o conjunto de parâmetros Θ1, Θ2, ..., Θn
é utilizar o conjunto de distribuições condicionais:
(13)
p(Θ1|Θ2, Θ3, ..., Θn, y)
p(Θ2|Θ1, Θ3, ...., Θn, y)
...
p(Θn|Θ2, Θ3., ..., Θn−1, y)
O Teorema de Cliord-Hammersley (veja [Robert & Casella, 2004] para uma derivação deste resultado) assegura que este conjunto de distribuições condicionais caracteriza unicamente a dis-tribuição p(Θ|y). A metodologia de MCMC é baseada em obter amostras aleatórias (e daí segue a denominação de método de simulação de Monte Carlo) das distribuições condicionais dadas por 13, onde é usada uma estrutura de cadeia de Markov. A metodologia de MCMC pode ser resumida de forma simples como uma forma de se avaliar a integral relacionada a distribuição posterior usando simulações das distribuições condicionais através de cadeias de Markov.
Uma vantagem evidente deste método é que ele não envolve nenhuma metodologia de maxi-mização numérica, e desta forma evitamos os problemas numéricos envolvidos em maximaxi-mização de funções não lineares como as encontradas em nosso problema. A validade da metodologia é vericada através de métodos para vericar a convergência das cadeias de Markov para a sua distribuição estacionária1.
Quando o modelo a ser estimado pode ser colocado em uma formulação de espaço de estado, uma forma conveniente de tratar o problema é através da metodologia de estimadores de Bayes Hierárquicos. Em modelos de Bayes Hierárquicos, ao invés de utilizar uma distribuição a priori usando uma função simples, a especicação é baseada em uma hierarquia. Seguindo o exemplo dado em [Lehmann & Casella, 1998] uma forma de representar estes modelos seria como:
X|θ ∼ f (x|θ) Θ|γ ∼ π(θ|γ)
Γ ∼ ψ(γ)
e desta forma colocamos uma estrutura de hierarquia entre as distribuições condicionais. Esta formulação é especialmente útil em modelos em espaço de estado já que a especicação hierárquica permite estimar a distribuição dos hiperparâmetros relacionados aos fatores latentes utilizando os próprios dados, especicando uma dinâmica de evolução para os fatores latentes. Por exemplo em um modelo de nível local:
(14) yt= µt+ εt
µt= µt−1+ νt
podemos utilizar como distribuição a priori do fator latente µt o valor de µt−1 e assim µt ∼
p(µt−1), o que corresponde a idéia da equação de estado na formulação em espaço de estado. A
especicação dos fatores latentes utiliza a formulação generalizada ξt∼ p(ξt−1)4 , aonde ξ denota
o conjunto de fatores latentes em nosso modelo dados por βit, τite σ2i.Esta metodologia também
é conhecida com o nome de estimadores empíricos de Bayes ([Lehmann & Casella, 1998] ). Dada a complexidade das distribuições condicionais, não é possível amostrar diretamente de to-das distribuições condicionais envolvito-das. Uma forma simples de algoritmo de MCMC é o chamado amostrador de Gibbs, aonde a estimação é realizada amostrando-se diretamente das distribuições condicionais. Uma limitação é que todas as distribuições condicionais precisam ser conhecidas analiticamente. Caso não seja possível amostrar da distribuição condicional analítica, uma idéia é utilizar o algoritmo de Metropolis-Hastings, que pode ser visto como uma generalização do método de aceitação-rejeição de simulação de variáveis aleatórias para a amostragem de distribuições con-dicionais2.
Em nosso problema não podemos amostrar diretamente de todas as distribuições condicionais, dada as formas não-lineares envolvidas. Desta forma usaremos um algoritmo de Markov Chain Monte Carlo Híbrido, utilizando simultaneamente o algoritmo de Gibbs e algoritmo de Metropolis-Hastings, metodologia proposta inicialmente em [Tierney, 1994]. Um algoritmo híbrido de MCMC ([Robert & Casella, 2004]) pode ser visto através como iterações nas seguintes etapas:θ
1Para uma discussão detalhada deste tópico veja Cap. 12 em [Robert & Casella, 2004]
2Veja [Robert & Casella, 2004] uma revisão do amostrado de Gibbs, a algoritmo de Metropolis-Hastings e os demais métodos utilizados a seguir.
Para i=1,...,p , e dados (θ(t+1) 1 , ..., θ (t+1) i−1 , θ (t) i , ...θ (t) p ) 1 - Simule e θi∼ qi(θ|θ (t+1) 1 , ..., θ (t+1) i−1 , θ (t) i , ...θ (t) p ) 2 - Aceite θi(t+1), = ( θi(t) com probabilidade 1 − ρ e θi com probabilidade ρ onde ρ^ gii( eθi|θ1(t+1),...,θ (t+1) i−1 ,,θ (t) i ,...θ (t) p ) qii( eθi|θ1(t+1),...,θ (t+1) i−1 ,θ (t) i ,θ (t) i ,...θ (t) p ) gii(θ(t)i |θ (t+1) 1 ,...,θ (t+1) i−1 ,,θ (t) i ,...θ (t) p ) qii(θi(t)|θ (t+1) 1 ,...,θ (t+1) i−1 ,θ (t) i ,θ (t) i ,...θ (t) p )
onde q é a chamada distribuição tentativa (assumimos como distribuição tentativa uma normal multivariada) e g é a distribuição condicional.
Uma forma mais simples é utilizar a a chamada amostragem de Gibbs Metropolizada, onde o algoritmo anterior é simplicado para:
Dado θ(t)
1- Simule zi6= θ(t) com probabilidade
gi(zi|θ (t) j , j 6= i) 1 − gi(θ (t) i |θ (t) j , j 6= i) 2 - Aceite θ(t+1)= z i com probabilidade 1 − gi(θ (t) i |θ (t) j , j 6= i) 1 − gi(zi|θ (t) j , j 6= i) ^ 1
Iterando nos passos 1 e 2 até a convergência obtemos nossos estimadores para os parâmetros e hiperparâmetros relacionados aos fatores latentes não-observados em nosso modelo.
Para caracterizar completamente nosso modelo, as distribuições a priori são o par normal-gamma inversa para βit e τitusando a caracterização hierárquica com média dada pela estrutura
de vetor autoregressiva. Para os parâmetros do vetor autoregressivo Φ assumimos uma estrutura normal multivariada com matriz de variância dada por uma distribuição Wishart, para o fator latente de volatilidade estocástica assumimos σ2
t ∼ LogN ormal(φ0 + φ1tσ 2
t−1, τσ2), com uma
distribuição gamma para τσ2 , normal para φ0e nalmente φ1∼ Beta.
Para os parâmetros βit, φ0, parâmetros da distribuição Wishart e as distribuições gamma
usa-mos uma etapa de Gibbs ; para τitusamos Metropolis-Hastings e para o parâmetro φ1utilizamos
o algoritmo conhecido como Slice Sampler ([Neal, 2003]).
6. Aplicação
Mostramos uma aplicação deste modelo para a previsão da estrutura a termo existente nas curvas de Swap DI-PRÉ fornecidas pela BM&F, uma curva de juros notoriamente difícil de ser ajustada pelos métodos convencionais. Utilizamos os dados fornecidos pela BM&F das curvas de juros implícitas nas operações de Swap para o intervalo de tempo de 12/01/2004 até 05/12/2006,
Figura 1. Curvas de Juros Swap Di-PRÉ
compreendendo 722 dias de curvas de juros. A Figura 1 mostra a evolução das curvas de juros no tempo.
Esta curva é interessante já que no período em estudo ela apresenta várias mudanças de incli-nação e curvatura, mudando do formato crescente para a curva invertida várias vezes nesse período. Temos também neste intervalo vários dias com curvas de juros com duas mudanças de inclinação, normalmente não são capturadas de forma adequada pelo modelo de [Diebold & Li, 2006], já que a parametrização baseada na formulação de [Nelson & Siegel, 1987] não permite capturar mais de uma mudança na inclinação e curvatura. Outro ponto importante é que a curva de juros no Brasil oscila de forma intensa, tanto em termos de nível das curvas como em formato, reforçando a ne-cessidade de tornar os parâmetros variantes no tempo, e principalmente desaando a manutenção do parâmetro τ assumida pelo modelo de [Diebold & Li, 2006].
Um outro ponto importante é que a curva de juros se alonga e retrai neste período, ou seja, as maturidades máximas observadas nos contratos de Swap se alteram nesse período, variando entre contratos com maturidades máximas entre 1800 a 2400 dias. Note que trabalhamos sem realizar uma pré-interpolação e extrapolação nos dados, trabalhando com as curvas de maturidades distintas em cada dia. Essa etapa é importante já que a etapa de interpolação pode introduzir distorções nos dados, e o modelo estimado pode ser utilizado para interpolar e extrapolar a curva. Para estimar o modelo, utilizamos 10000 iterações no algoritmo MCMC descrito na Seção 5, descartando as primeiras 5000 iterações (período de Burn-In) e utilizando as demais 5000 no cálculo dos resultados. Os diagnósticos de convergência indicam que as cadeias de Markov convergem de forma adequada para a sua distribuição estacionária, assim validando a metodologia de estimação utilizada.
A Figura 2 mostra o ajuste do modelo dentro da amostra e os resíduos do em relação as curvas observadas. É possível ver que o modelo consegue reproduzir as variações observadas na estrutura a termo das taxas de juros, e que a magnitude relativa dos resíduos é muito baixa, não existindo nenhum padrão sistemático nos resíduos do modelo. Note que com os parâmetros estimados, é possível realizar qualquer interpolação e extrapolação das curvas de juros, bastando apenas substituir o valor para a maturidade a ser interpolada na equação 3.
Figura 2. Curva Ajustada e Resíduos de Ajuste
Figura 3. Beta 1
As guras 3, 4, 5 e 10 mostram a evolução dos fatores latentes β1tβ2t, β3t, β4t. A evolução do β1t
mostra claramente a interpretação de nível médio da curva, acompanhando a evolução da curva de juros no tempo. A evolução dos demais hiperparâmetros também captura de forma adequada a evolução dos componentes de inclinação e curvatura da estrutura a termo observada nas taxas de juros.
As Figuras 7 e 8 são de especial importância, já que mostram que a xação a priori do parâmetro τ assumida no modelo de [Diebold & Li, 2006] não é uma restrição válida, como ca evidente pela grande variação temporal observada nos parâmetros τ1e τ2, evidenciando a necessidade de
incorporar variação nestes parâmetros para curvas de juros com grande variação de formato com observadas em países emergentes.
O componente de Volatilidade Estocástica (Figura 9) estimado mostra a capacidade do modelo em capturar o fato estilizado da existência de heterocedasticidade condicional existente nas taxas de juros. A estrutura de volatilidade condicional captura a incerteza existente nos momentos de mudança nas curvas de juros, já que podemos notar que a correlação entre aumento de volatilidade e períodos de inversão do formato da curva.
A gura 10 mostra outro fato capturado pela estrutura de Volatilidade Estocástica - a alta persistência de choques na estrutura da volatilidade, já que podemos notar que o parâmetro φ1 é
Figura 4. Beta 2
Figura 5. Beta 3
Figura 6. Beta 4
concentrado em valores próximos de 1. A alta persistência dos choques na volatilidade de taxas de juros e de séries nanceiras em geral é um dos fatos estilizados mais importantes em econometria nanceira.
Figura 7. Tau1
Figura 8. Tau 2
Figura 9. Volatilidade Estocástica
A Tabela 1 mostra os intervalos de conança calculados para a matriz de coecientes Φ. Para vericar a estacionaridade do processo, calculamos os autovalores da matriz Phi para os limites superiores e inferiores desta matriz. O maior autovalor para o limite superior é 1.0029, e para o
Tabela 1. Intervalos de Conança 95% - Φ µ β1t−1 β2t−1 β3t−1 β4t−1 β5t−1 β6t−1 Φβ1(.025) .2310 1.262 .5203 -.1122 -.4625 -.0152 -.1183 Φβ1(.50) .2407 1.281 .5504 -.1077 -.4432 -.0136 -.1115 Φβ1(.975) .2532 1.293 .5721 -.1033 -.4266 -.0139 -.0999 Φβ2(.025) -.2582 -.2877 .4215 .1051 .4337 .0135 .1005 Φβ2(.50) -.2453 -.2755 .4437 .1102 .4490 .0141 .1126 Φβ2(.975) -.2316 -.2572 .4746 .1149 .4702 .0154 .1189 Φβ3(.025) -.4741 -.4378 -.9778 1.141 .5951 .0183 .1253 Φβ3(.50) -.4020 -.3385 -.8204 1.171 .7172 .0224 .1619 Φβ3(.975) -.3331 -.2330 -.6642 1.201 .8445 .0270 .1998 Φβ4(.025) .1570 .1605 .3217 -.0822 .1397 -.0115 -.0896 Φβ4(.50) .1764 .1918 .3705 -.0728 .1782 -.0100 -.0783 Φβ4(.975) .1984 .2205 .4234 -.0639 .2124 -.0087 -.0659 Φβ5(.025) .3965 .4719 .9298 -.5165 -2.2090 .9181 -.6076 Φβ5(.50) .7881 1.1180 1.8360 -.3394 -1.5045 .9456 -.3833 Φβ5(.975) 1.1680 1.8060 2.787 -.1688 -.7929 .9707 -.1819 Φβ6(.025) .2788 .3752 .6515 -.1911 -.8212 -.0282 .7723 Φβ6(.50) .3651 .5022 .8621 -.1567 -.6838 -.0232 .8116 Φβ6(.975) .4360 .6283 1.0570 -.1191 -.5263 -.0173 .8538
Figura 10. Distribuição - Phi0 e Phi1
limite inferior .9783, indicando que a região de não estacionariedade está incluída nos intervalos de conança. Embora isso não seja um problema em inferência bayesiana, este resultado evidencia a natureza de alta persistência e no limiar da não estacionariedade observada no componente do nível das taxas de juros para o Brasil.
Para demonstrar o potencial preditivo do modelo, mostramos as previsões para alguns dias especícos, caracterizados por formatos distintos da curva de juros e depois as previsões e erros de previsão um passo a frente para todos os dias observados na amostra.
A gura 11 mostra previsões um passo a frente obtidas pelo modelo extendido de Diebold-Li, com os intervalos de conança nos limites de 2.5% e 97.5%, para 4 dias observados na curva de juros. A primeira sub-gura mostra a previsão para 20/07/2004, com o formato normalmente observado em taxas de juros, com uma tendência crescente na maturidade. A segunda curva prevista para o dia 01/02/2005 mostra uma curva com uma mudança na inclinação, normalmente
Figura 11. Previsão um passo a frente e Erros de Previsão - Dias Especícos
(a) 20/07/2004 (b) 01/02/2005
(c) 27/06/2006 (d) 06/12/2006
associada com mudanças esperadas na taxa de juros de longo prazo. A curva prevista para o dia 27/06/2006 mostra um situação oposta, com uma curva decrescente nas maturidades de médio-prazo e crescente no longo médio-prazo. A sub-gura (d) mostra a previsão um passo a frente para a ultima observação na amostra, dia 06/12/2006.
Previsões um passo a frente, com a inclusão das extrapolações para maturidades não observadas e os erros de previsão associados estão colocados na Figura 12. Os erros de previsão tem magnitude relativamente baixa, e podemos notar que os maiores erros estão concentrados nos momentos de mudança no formato da curva de juros.
Também realizamos uma análise comparativa de poder preditivo entre o modelo de Diebold-Li extendido, com a formulação original de Diebold-Diebold-Li com τ xo, a especicação do modelo de Diebold-Li com τ variando no tempo, e uma modicação no modelo de Diebold-Li usando a Equação 2 de Svensonn no lugar da formulação original baseada na especicação de Nelson-Siegel, com parâmetros τ1e τ2 xos e variantes no tempo.
A estimação destes modelos de referência para τ variantes no tempo é baseada em mínimos quadrados não-lineares, enquanto que as formas linearizadas são baseadas na estimação por mí-nimos quadrados ordinários. A Tabela 2 apresenta a Raiz do Erro Quadrático Médio para os 5
Figura 12. Previsão um passo a frente e Erros de Previsão
(a) Previsão um Passo a Frente (b) Erros de Previsão
Tabela 2. Raiz do Erro Quadrático Médio
Modelo Raiz do Erro Quadrático Médio
Diebold-Li Extendido 1.1987
Diebold-Li τ xo 36.61
Diebold-Li τ variante 23.92
Diebold-Li-Svensson τ1e τ2xo 17.05
Diebold-Li-Svensson τ1e τ2 variantes 204.6
modelos comparados, baseada nos erros de previsão um passo a frente. Os parâmetros τ, τ1e τ2
são xados pelo valor médio dos parâmetros correspondentes variantes no tempo.
Os resultados desta análise comparativa mostram que o desempenho do modelo de Diebold-Li com as extensões propostas é muito superior em poder preditivo aos comparação demais modelos comparados, como mostra a Tabela 2. A xação do parâmetro τ no modelo original de Diebold-Li, utilizando a especicação de Nelson-Siegel, não é uma restrição válida, já que reduz de forma substancial o poder preditivo do modelo, comparado com a versão deste modelo com o parâmetro variante.
No caso do modelo de Diebold-Li utilizando a especicação de Svensonn, a xação dos parâ-metros resulta em um melhor poder preditivo do que a estimação com os parâparâ-metros livres. Este resultado pode ser explicado pela diculdade de estimação da especicação de Svensonn, já que em muitos dias a estimação não converge devido a não-linearidade, tornando o ajuste do modelo inadequado, e assim elevando o valor do erro quadrático médio com a presença de erros de previsão elevados para todas as maturidades observadas nestes dias. Este problema também contamina a estimação do vetor autoregressivo, prejudicando a previsão da curva para o dia seguinte. O uso de estimação bayesiana com priors informativas permite o uso da especicação mais exível de Svensonn, mas sem sofrer dos problemas de instabilidade na estimação não-linear que ocorrem na estimação clássica utilizando mínimos-quadrados não lineares.
7. Conclusões
Neste artigo implementamos algumas extensões para o modelo de [Diebold & Li, 2006], in-cluindo o uso de métodos de estimação bayesiana usando MCMC para os parâmetros e fatores latentes deste modelo.
As extensões propostas para o modelo foram a mudança no forma funcional para a forma mais exível baseado em na especicação de [Svensson, 1994]; inclusão de fatores latentes tornando os parâmetros do modelo variantes no tempo; possibilidade do uso de diferentes observações em cada dia e inclusão de uma estrutura de volatilidade estocástica.
A forma mais exível adotada permite capturar as mudanças de formatos associadas a curvas de juros de países emergentes, e esta exibilidade se reete nos baixos erros de ajuste e previsão observados neste modelo. O uso de estimação bayesiana associada a priors informativas na especi-cação dos fatores latentes evita o procedimento de estimação linearizada em dois estágios utilizado no modelo de Diebold-Li, obtendo ajustes e previsões mais precisas.
A especicação dos parâmetros como fatores latentes modelados através de uma estrutura hierárquica bayesiana permite obter a distribuição em amostras nitas dos parâmetros e das pre-visões do modelo, permitindo quanticar a incerteza presente na estimação da estrutura a termo das taxas de juros. Mostramos que o relaxamento do pressuposto do parâmetro τ constante é im-portante para o ajuste da estrutura a termo, em especial para curvas de juros de países emergentes com freqüentes modicações no formato da curva de juros, como observamos pelo comportamento dos fatores latentes τ1t e τ2t.
Os fatores latentes, com sua estrutura de priors informativas, permitem superar o problema comum de instabilidade numérica associada a estimação não-linear do modelo de Nelson-Siegel na presença de um número restrito de observações. A modelagem bayesiana utilizada não necessita da pré-interpolação na curva de juros, evitando as distorções que podem ser introduzidas neste processo.
O componente de volatilidade estocástica introduzido tem dois objetivos - o primeiro é capturar um dos fatos estilizados mais importantes nas taxas de juros, a presença de heterocedasticidade condicional e a elevada persistência de choques na volatilidade. Este componente também per-mite quanticar a incerteza associada a curva de juros em cada dia, de especial importância nos momentos de mudança de formato da curva.
A metodologia de estimação bayesiana através de algoritmos de Markov Chain Monte Carlo realiza a estimação de forma simultânea e permite evitar a linearização do modelo e a estimação em dois estágios utilizada em [Diebold & Li, 2006]. A especicação do modelo é baseada em um conjunto standard de priors, e o algoritmo de estimação, baseado em uma mistura de amostragem de Gibbs e Metropolis-Hastings, é bastante utilizado e suas propriedades já foram extensivamente estudadas, tornando a estimação do modelo simples e conável.
Referências
[Brennan & Schwartz, 1979] Brennan, M. J., & Schwartz, E. J. 1979. A Continuos Time Approach to the Pricing of Bonds. Journal of Banking and Finance, 3, 133155.
[Chan et al. , 1992] Chan, K. G., Karolyi, G.A., Longsta, F.A., & Sanders, A. B. 1992. An Empirical Comparasion of Alternative Models of Term Structure of Interest Rates. Journal of Finance, 47, 12091227.
[Cox et al. , 1985] Cox, J. C., Ingersoll, J . E., & Ross, S. A. 1985. A Theory of the Term Structure of Interest Rates. Econometrica, 53, 385408.
[Diebold & Li, 2006] Diebold, F.X., & Li, C. 2006. Forecasting the Term Structure of Government Bond Yields. Journal Of Econometrics, 130, 337364.
[Doan et al. , 1984] Doan, T., Litterman, R., & Sims, C. 1984. Forecasting and conditional projection using realistic prior distributions. Econometric Reviews, 3, 1100.
[Due & Kan, 1996] Due, D., & Kan, R. 1996. A yield-factor model of interest rates. Mathematical Finance, 6, 379406.
[Fisher et al. , 1995] Fisher, M., Nychka, D., & Zervos, D. 1995. Fitting the Term Structure of Interest Rates Using Smoothing Splines. Finance and Economics Discussion Series, Board of Governors of Federal Reserve System, 1995-1, nd.
[Fouque et al. , 2000] Fouque, J-P., Papanicolaou, G., & Sircar, K. R. 2000. Derivatives in Financial Markets with Stochastic Volatility. Cambridge University Press.
[Heath et al. , 1992] Heath, David, Jarrow, Robert, & Morton, Andrew. 1992. Bond Pricing and the term structure of interest rates: A new methodology for contingent claims valuation. Econometrica, 60(1).
[Hull & White, 1990] Hull, John, & White, Alan. 1990. Pricing interest rate derivative securities. Review of Finan-cial Studies, 3(4), 57394.
[Huse, 2007] Huse, C. 2007. Term Structure Modelling with Observable State Variables. Unpublished Working Paper - FMG - LSE.
[Johannes & Polson, 2007] Johannes, M., & Polson, N. 2007. Handbook of Financial Econometrics. Chap. MCMC Methods for Continuos Time Financial Econometrics.
[Lehmann & Casella, 1998] Lehmann, E., & Casella, G. 1998. Theory of Point Estimation (2nd Edition). Springer. [Linton. et al. , 2001] Linton., O., Mammen, E., Nielsen, J., & Tanggard, C. 2001. Estimating Yield Curves By
Kernel Smoothing Methods. Journal Of Econometrics, 105:1, 185223.
[Litterman & Scheinkman, 1991] Litterman, R., & Scheinkman, J. 1991. Common Factors Aecting Bond Returns. Journal of Fixed Income, 1, 5461.
[Lund & Andersen, 1997] Lund, J., & Andersen, T. 1997. Estimating Continuous-Time Stochastic Volatility Models of the Short-Term Interest Rate. Journal Of Econometrics, 77, 343377.
[Migon & Abanto-Valle, 2007] Migon, H., & Abanto-Valle, C. 2007. A Bayesian Term Structure Modelling. Pages 200203 of: Fernandes, C., Schimidli, H., & Kolev, N. (eds), Proceedings of the Third Brazilian Conference on Statistical Modelling in Insurance and Finance. IME-USP.
[Neal, 2003] Neal, R. 2003. Slice Sampling (with discussions). Annals of Statistics, 31, 705767.
[Nelson & Siegel, 1987] Nelson, C. R., & Siegel, A. F. 1987. Parsimonous Modelling of Yield Curves. Journal of Business, 60(4), 473489.
[Robert & Casella, 2004] Robert, C., & Casella, G. 2004. Monte Carlo Statistical Methods. Springer.
[Scott, 1996] Scott, L. O. 1996. Simulating a multi-factor term structure model over relatively long discrete time periods. In: Procedings of the IAFE First Annual Computacional Finance Conference.
[Shea, 1984] Shea, G. 1984. Pitfalls in Smoothing Interest Rate Structure Data: Equilibrium Models and Spline Approximation. Journal of Financial and Quantitative Analysis, 19, 253269.
[Svensson, 1994] Svensson, L. E. O. 1994. Estimating and Interpreting Forward Interest Rates: Sweden 1992-1994. NBER Working Paper.
[Taylor, 1986] Taylor, S. J. 1986. Modelling Financial Time Series. John Wiley& Sons.
[Tierney, 1994] Tierney, L. 1994. Markov Chains for Exploring Posterior Distributions (with Discussion). Annals of Statistics, 22, 17011786.
[Vasicek, 1977] Vasicek, O. 1977. An equilibrium characterization of the term structure. Journal of Financial Eco-nomics, 5, 17788.