• Nenhum resultado encontrado

Modelagem de dependencia em series financeiras multivariadas

N/A
N/A
Protected

Academic year: 2021

Share "Modelagem de dependencia em series financeiras multivariadas"

Copied!
148
0
0

Texto

(1)

Modelagem de Dependˆ

encia em S´

eries

Financeiras Multivariadas

Campinas - SP 2009

(2)

Omar Muhieddine Franco Abbara

Modelagem de Dependˆ

encia em S´

eries

Financeiras Multivariadas

Disserta¸c˜ao apresentada junto ao Depar-tamento de Estat´ıstica do Instituto de Matem´atica, Estat´ıstica e Computa¸c˜ao Cient´ıfica da Universidade Estadual de Campinas, para obten¸c˜ao do T´ıtulo de Mestre em Estat´ıstica.

Orientador:

Prof. Dr. Mauricio Enrique Zevallos Herencia

Universidade Estadual de Campinas

Instituto de Matem´atica, Estat´ıstica e Computac¸˜ao Cient´ıfica Departamento de Estat´ıstica

Campinas - SP 2009

(3)
(4)
(5)
(6)

v

(7)

Agradecimentos

Ao Prof. Dr. Maur´ıcio Zevallos, pela amizade e dedica¸c˜ao em todos os momentos no desenvolvimento deste trabalho.

`

A minha m˜ae, Ana Maria, e minha irm˜a, Fatme, pelo apoio e pelo amor incondi-cional.

Ao Prof. Dr. Luiz Koodi Hotta e Prof. Dr. Pedro Luiz Valls Pereira, pelos coment´arios finais que contribu´ıram para o aperfei¸coamento deste trabalho.

Aos funcion´arios da PBLM Consultoria Empresarial, em especial ao Paulo e Luiz Carlos, por compreenderem meus momentos de ausˆencia.

Aos meus amigos do mestrado de estat´ıstica na Unicamp, pelo companheirismo e por proporcionarem que minha trajet´oria em todo o mestrado fosse a mais agrad´avel poss´ıvel.

`

A todos os professores do programa de mestrado em estat´ıstica na Unicamp, pela dedica¸c˜ao e empenho nas atividades acadˆemicas.

Aos funcion´arios da Secretaria de P´os Gradua¸c˜ao do IMECC/Unicamp, pela ajuda.

`

A Kjersti Aas e Daniel Berg, por fornecerem as rotinas de estima¸c˜ao do modelo de Pair Copula.

`

(8)

ix

Resumo

A modelagem multivariada de s´eries financeiras se constitui em um dos mais importantes e desafiadores problemas na ´area de econometria financeira. Um dos modelos populares nesta ´area ´e o modelo de c´opulas, dada sua flexibilidade para construir fun¸c˜oes de distribui¸c˜ao multivariadas que reproduzam dependˆencias n˜ao lineares. Este trabalho est´a focado no estudo e aplica¸c˜ao de modelos de c´opulas com dimens˜ao maior que trˆes, em problemas de interdependˆencia, cont´agio e gerencia-mento de risco. Primeiramente ´e realizada a modelagem bivariada de retornos de ´ındices considerando os mercados de Estados Unidos, os principais mercados finan-ceiros latino-americanos e europeus, utilizando copulas variando no tempo segundo a metodologia proposta por Patton(2006). Em seguida ´e proposta a especifica¸c˜ao de um modelo de c´opulas trivariado com parˆametros variando no tempo combinando as propostas de Patton (2006) e Aas et. al. (2009). Em terceiro lugar a an´alise de dependˆencia e contagio entre os retornos estudados ´e feita atrav´es do uso de copulas condicionais. Esta an´alise, conjuntamente com a proposta do modelo trivariado de c´opulas com parˆametros variando no tempo, constituem as principais contribui¸c˜oes metodol´ogicas deste trabalho. Finalmente, c´opulas tetravariadas s˜ao empregadas na an´alise de risco de a¸c˜oes negociadas no mercado `a vista brasileiro.

(9)

Abstract

Multivariate modelling of financial time series is one of the most important and challenging issue in financial econometrics. One of the most popular model in this subject is copula models, mainly because its flexible properties to construct multi-variate distributions in which it is possible to reproduce nonlinear dependence. This work studies and applies copula models with dimension higher than two in issues of interdependence, contagion and risk management. At first it is fitted bivariate copula models with time-varying parameters proposed by Patton (2006) considering the north american stock markets and the most important markets of latin america and europe. After that it is proposed a trivariate copula model with time-varying parameter which combines the methodologies of Patton (2006) and Aas et. al. (2009). At third the analysis of dependence and contagion among returns under study is made through a conditional copula model. Both the analysis through a conditional copula and the trivariate copula model with time-varying parameters are the main methodological contributions of this work. Finally, 4-variate copula models are applied in risk management in brazilian stock market.

(10)

xiii

Sum´

ario

Lista de Tabelas xvii

Lista de Figuras xix

1 Introdu¸c˜ao 1

1.1 Breve descri¸c˜ao da disserta¸c˜ao . . . 4

2 Fatos Estilizados de S´eries Financeiras 7 2.1 Introdu¸c˜ao . . . 7 2.2 Retornos . . . 7 2.3 Volatilidade condicional . . . 11 2.4 Dependˆencia . . . 16 3 Modelos de C´opula 21 3.1 Introdu¸c˜ao . . . 21

3.2 C´opulas e medidas de dependˆencia . . . 24

3.3 Algumas Fam´ılias de C´opulas . . . 25

3.3.1 C´opulas el´ıpticas . . . 26

3.3.2 C´opulas arquimedianas . . . 28

(11)

3.5 Modelagem . . . 33

3.5.1 Estima¸c˜ao . . . 33

3.5.2 Bondade de ajuste . . . 35

3.6 Simula¸c˜ao de c´opulas . . . 38

4 Modelagem de c´opulas multivariadas 41 4.1 Introdu¸c˜ao . . . 41

4.2 Modelos Hier´arquicos Arquimedianos . . . 43

4.3 Pair Copula . . . 49

4.4 Compara¸c˜ao entre as metodologias . . . 58

5 An´alise de Interdependˆencia e Cont´agio 59 5.1 Introdu¸c˜ao . . . 59

5.2 Arcabou¸co te´orico . . . 61

5.3 Dados e modelos marginais . . . 64

5.4 Modelagem Bivariada . . . 68

5.4.1 C´opulas est´aticas . . . 70

5.4.2 C´opulas com parˆametros variando no tempo . . . 72

5.5 Modelagem Trivariada . . . 83

5.5.1 Metodologia . . . 85

5.6 An´alise da interdependˆencia entre os mercados . . . 87

5.7 An´alise de cont´agio entre os mercados . . . 94

5.8 Compara¸c˜ao com a literatura . . . 98

(12)

Sum´ario xv

6 Gerenciamento de risco 101

6.1 Introdu¸c˜ao . . . 101

6.2 Dados e modelos marginais . . . 105

6.3 C´opulas estimadas . . . 107

6.4 Estima¸c˜ao do VaR e CVaR . . . 111

6.4.1 Metodologia . . . 111

6.4.2 Resultados e backtesting . . . 114

6.5 Conclus˜ao . . . 116

7 Conclus˜oes Finais 117

Apˆendice A -- Propriedades das medidas de dependˆencia 119

Apˆendice B -- Limites de Frechet-Hoeffding 123

Apˆendice C -- Modelos de C´opulas Dinˆamicas 125

(13)

Lista de Tabelas

2.1 Estat´ıstica descritiva dos ´ındices de bolsa do Brasil. . . 9

2.2 Compara¸c˜ao entre as medidas de dependˆencia ρ, ρS e τ . . . 18

3.1 Principais c´opulas arquimedianas . . . 28

4.1 Principais c´opulas arquimedianas para o caso d-variado . . . 42

4.2 Compara¸c˜ao entre os Modelos Hier´arquicos Arquimedianos . . . 49

4.3 Compara¸c˜ao entre as estimativas da c´opula t-Student entre D vine e uma c´opula tetradimensional. . . 57

5.1 Estat´ısticas descritivas dos retornos dos ´ındices de bolsa em estudo . 67 5.2 Estimativa dos modelos marginais.Erros padr˜ao est˜ao dados em parˆenteses 69 5.3 ´Indices de cauda emp´ıricos . . . 70

5.4 Resultados das c´opulas est´aticas . . . 71

5.5 P-valores do teste de influˆencia de outras vari´aveis na distribui¸c˜ao condicional . . . 74

5.6 Estimativas das c´opulas gaussiana com parˆametros variando no tempo 76 5.7 Estimativas das c´opulas SJC com parˆametros variando no tempo . . . 77

5.8 An´alise de bondade de ajuste para as c´opulas gaussiana e SJC com parˆametro variando no tempo . . . 84 5.9 Resultado da c´opula SJC condicionada nos EUA (est´atica e dinˆamica) 88

(14)

xviii Lista de Tabelas 5.10 Resultados da c´opula Gaussiana condicionada nos EUA (est´atica e

dinˆamica) . . . 89

5.11 Resultados da c´opula t-Student condicionada nos EUA (est´atica e dinˆamica) . . . 90

5.12 An´alise de bondade de ajuste para as c´opulas trivariadas estimadas . 91 6.1 Estat´ısticas descritivas dos retornos das a¸c˜oes em estudo . . . 105

6.2 Estimativa dos modelos marginais. Erros padr˜ao est˜ao dados em parˆenteses. . . 108

6.3 Correla¸c˜ao de Pearson e τ de Kendall das a¸coes estudadas . . . 109

6.4 Modelos de c´opulas estimados . . . 111

6.5 Estimativa das fun¸c˜oes de c´opulas . . . 112

(15)

Lista de Figuras

2.1 S´erie de Retornos do Ibovespa . . . 8

2.2 Caracter´ısticas dos retornos do Ibovespa . . . 10

2.3 Gr´afico das volatilidades estimadas do Ibovespa . . . 14

2.4 Gr´afico das autocorrela¸c˜oes dos res´ıduos padronizados . . . 15

2.5 Gr´afico dos res´ıduos padronizados da s´erie do Ibovespa e Merval, ap´os o ajuste de um modelo AR(1)-EGARCH(1,1) com inova¸c˜oes t-Student 19 3.1 Curvas de n´ıvel das densidades das c´opulas gaussiana e t-Student com marginais N (0, 1). . . 27

3.2 Curvas de n´ıvel das densidades das c´opulas Clayton, Gumbel e Frank com marginais N (0, 1). . . 29

3.3 Curvas de n´ıvel da densidade da c´opula SJC. . . 30

4.1 Diagrama FNAC . . . 46

4.2 Diagrama HNAC . . . 47

4.3 Diagrama do D vine . . . 53

4.4 Diagrama do Vine Canˆonico . . . 54

4.5 Exemplo de vine regular que n˜ao pertence ao D vine e ao vine canˆonico 55 5.1 Evolu¸c˜ao dos retornos dos pa´ıses analisados . . . 66

(16)

xx Lista de Figuras 5.3 Evolu¸c˜ao do ´ındice de cauda superior (coluna da esquerda) e de cauda

inferior (coluna da direita) para os mercados latino-americanos e o mercado dos EUA . . . 79 5.4 Evolu¸c˜ao do ´ındice de cauda superior (coluna da esquerda) e de cauda

inferior (coluna da direita) para os mercados latino-americanos e o mercado dos EUA (cont.) . . . 80 5.5 Evolu¸c˜ao do ´ındice de cauda superior (coluna da esquerda) e de cauda

inferior (coluna da direita) para os mercados europeus e o mercado dos EUA . . . 81 5.6 Evolu¸c˜ao da correla¸c˜ao entre os mercados latino-americanos

condi-cionada a informa¸c˜ao dos EUA. . . 92 5.7 Evolu¸c˜ao da correla¸c˜ao e dos ´ındices de cauda entre Alemanha e

Inglaterra condicionada a informa¸c˜ao dos EUA. . . 93 5.8 Compara¸c˜ao entre a evolu¸c˜ao do ´ındice de cauda inferior para os

mercados latino-americanos. A linha constante representa o modelo incondicional, enquanto a linha tracejada indica o caso condicional. . 96 5.9 Compara¸c˜ao da evolu¸c˜ao do ´ındice de cauda inferior entre os mercados

alem˜ao e inglˆes. O gr´afico de cima se refere ao modelo incondicional, enquanto o de baixo se trata do modelo condicional. . . 97 6.1 Evolu¸c˜ao dos retornos das a¸c˜oes analisados . . . 106 6.2 Dispers˜ao das fun¸c˜oes de distribui¸c˜ao emp´ıricas das a¸c˜oes estudadas . 110 6.3 Retornos do portf´olio e VaR para α = 1% , 2,5% e 5% . . . 114

(17)

1

Introdu¸

ao

A modelagem multivariada ´e uma das mais importantes e desafiadoras ´areas na an´alise de s´eries financeiras. Nesta ´area, um dos principais objetos de estudo consiste na modelagem da interdependˆencia entre as s´eries financeiras. O conhecimento dela ´e crucial em problemas tais como gerenciamento de risco, precifica¸c˜ao de derivativos e avalia¸c˜ao de cont´agio, entre outros.

H´a diversos modelos que permitem a an´alise multivariada de s´eries financeiras. H´a por exemplo o modelo VAR (Vetorial Auto-Regressivo), amplamente utilizado para a modelagem da interdependˆencia. Este modelo estabelece a interdependˆencia e a dinˆamica entre as m´edias das s´eries financeiras estudadas. Em rela¸c˜ao aos modelos que reproduzem a interdependˆencia no segundo momento, escolhas usuais na modelagem s˜ao os modelos da fam´ılia GARCH multivariada, como por exemplo o BEKK proposto por Engle e Kroner (1995) e o DCC, proposto por Engle (2002). Em rela¸c˜ao a distribui¸c˜ao adotada por estes modelos, grande parte deles assumem a hip´otese de normalidade.

Uma das caracter´ısticas mais importantes da dependˆencia entre s´eries financeiras ´e a dependˆencia nas caudas, isto ´e a dependˆencia observada entre valores extremos. No contexto de finan¸cas, esta dependˆencia se traduz na associa¸c˜ao entre fortes altas e/ou fortes baixas nos retornos dos ativos financeiros. Esta caracter´ıstica ´e central em algumas ´areas de econometria de finan¸cas, como por exemplo o gerenciamento de risco.

(18)

gaus-2 1 Introdu¸c˜ao siana n˜ao ´e conveniente, uma vez que esta distribui¸c˜ao n˜ao consegue reproduzir dependˆencia em valores extremos. Com isso, torna-se necess´ario o estudo de mode-los multivariados alternativos em que a n˜ao normalidade seja incorporada.

Dentre os modelos multivariados propostos, o modelo de c´opulas ganha destaque sobretudo pela versatilidade que este modelo tem na constru¸c˜ao de distribui¸c˜oes multivariadas. Para tanto, segundo esta metodologia, ´e preciso conhecer as dis-tribui¸c˜oes marginais e conhecer tamb´em uma fun¸c˜ao, denominada c´opula, que liga as marginais.

A flexibilidade do modelo de c´opulas permite especificar distribui¸c˜oes multi-variadas que, diferentemente da distribui¸c˜ao gaussiana, permitem reproduzir de-pendˆencia nas caudas. Por exemplo, a c´opula Clayton (1978) permite reproduzir dependˆencia somente na cauda inferior, enquanto a dependˆencia na cauda superior ´e igual a zero. Outro exemplo consiste na c´opula Gumbel (1960) que reproduz a dependˆencia na cauda superior, enquanto que na cauda inferior a dependˆencia ´e igual a zero. Foram propostas diversas fun¸c˜oes de c´opulas, e uma revis˜ao acerca delas pode ser encontrada em Becerra e Melo (2008a).

V´arios trabalhos foram feitos utilizando a metodologia de c´opulas em econome-tria financeira. Por exemplo, Cherubini e Luciano (2001), Fortin e Kuznics (2002), Mendes (2005), Palaro e Hotta (2006) , Fantazzini (2006), Ozun e Cifter (2007), Silva Filho e Ziegelmann (2008) e Becerra e Melo (2008b), dentre outros, aplicam a metodologia de c´opulas para a an´alise de risco. Georges et al (2001) aplicam a metodologia de c´opulas para precifica¸c˜ao de derivativos e modelagem do tempo de exerc´ıcio de op¸c˜oes, enquanto Cherubini e Luciano (2002) e Assis e Laurini (2008) aplicam a metodologia de c´opulas na precifica¸c˜ao de derivativos e op¸c˜oes. e Ro-driguez (2007) e Viale et. al. (2008) aplicam a metodologia de c´opulas para a an´alise de cont´agio. Todos os trabalhos mencionados envolveram a estima¸c˜ao de c´opulas bivariadas.

Outra importante evidˆencia emp´ırica que exibem as s´eries financeiras ´e o car´ater ou natureza dinˆamica da dependˆencia ao longo do tempo. Desta forma, ´e

(19)

conve-niente incorporar parˆametros que variem no tempo nos modelos de c´opulas. Patton (2006) apresenta a primeira contribui¸c˜ao neste assunto, em que foram especificadas evolu¸c˜oes dos parˆametros das c´opulas Gaussiana e SJC na an´alise da dependˆencia entre taxas de cˆambio da Alemanha e Jap˜ao. Jondeau e Rockinger (2006) e Zhang e Guegan (2008) apresentam alternativas para a evolu¸c˜ao da correla¸c˜ao. Bartram et al. (2007) aplica o modelo de c´opula Gaussiana com parˆametros variando no tempo para avaliar a altera¸c˜ao na dependˆencia entre os mercados financeiros europeus ap´os a ado¸c˜ao do Euro como moeda em alguns pa´ıses. Todas as an´alises destes trabalhos foram feitas para o caso bivariado.

A partir dos artigos revisados na literatura, pode-se constatar que grande parte das aplica¸c˜oes dos modelos de c´opulas se concentram no caso bivariado. Assim, um desenvolvimento natural dos modelos de c´opulas consiste em modelar dimens˜oes maiores que dois. As principais contribui¸c˜oes neste assunto foram propostas por Savu e Trede (2006), Aas et al. (2009) e Serban et al. (2007).

O assunto principal desta disserta¸c˜ao ´e a modelagem de copulas multivariadas, isto ´e com dimens˜ao maior que 2. Os trˆes objetivos espec´ıficos s˜ao: (i) aplica¸c˜ao de modelos de c´opula variando no tempo na an´alise de s´eries financeiras, (ii) propor uma metodologia para medir interdependencia e avaliar contagio entre mercados financeiros, assim como a aplica¸c˜ao desta em dois grupos de paises, e (iii) estima¸c˜ao do Valor em Risco (VaR) e Expected Shortfall (Valor em Risco Condicional) para um portf´olio de ativos brasileiros.

A an´alise da interdependˆencia entre os mercados financeiros envolver´a dois gru-pos de pa´ıses. Um primeiro grupo ´e formado por Brasil, Argentina, M´exico e EUA, e o segundo grupo ´e formado por Alemanha, Inglaterra e EUA. Ser´a analisado o per´ıodo entre os dias 09/06/1995 e 13/08/2008. O per´ıodo estudado compreende o in´ıcio da crise financeira do subprime, e segundo nosso conhecimento este seria o primeiro trabalho que inclui o per´ıodo de 2007 a agosto de 2008 com c´opulas evoluindo no tempo. O primeiro passo consistir´a na an´alise bivariada entre os mercados de cada grupo atrav´es da metodologia de Patton (2006). Em seguida

(20)

4 1 Introdu¸c˜ao ser´a avaliado o efeito que o mercado norte-americano exerce sobre a dinˆamica da dependˆencia bivariada em cada grupo estudado, e para tanto ser´a combinada as metodologias de Aas et al. (2009) e Patton (2006). Esta consiste na principal contribui¸c˜ao metodol´ogica desta disserta¸c˜ao.

Finalmente, ser´a avaliada como diferentes constru¸c˜oes da dependˆencia multivari-ada, atrav´es da metodologia de Aas et. al. (2009), altera as estimativas do Valor em Risco e do Valor em Risco Condicional para o retorno de quatro a¸c˜oes de alta liquidez na Bolsa de Valores de S˜ao Paulo.

1.1

Breve descri¸

ao da disserta¸

ao

No Cap´ıtulo 2 s˜ao apresentadas as principais caracter´ısticas das s´eries finan-ceiras, os chamados fatos estilizados. Atrav´es de uma an´alise de uma s´erie real s˜ao discutidas a n˜ao-normalidade das s´eries financeiras, a existˆencia de volatilidade variando no tempo e o problema em especificar medidas de dependˆencia coerentes para o estudo de s´eries financeiras. As caracter´ısticas dos retornos s˜ao discutidas na Se¸c˜ao 2.2. Na Se¸c˜ao 2.3 s˜ao apresentados as propriedades da volatilidade das s´eries, e por fim a Se¸c˜ao 2.4 s˜ao apresentadas as principais medidas de dependˆencia propostas na literatura.

O Cap´ıtulo 3 apresenta resumidamente a Teoria de C´opulas com ˆenfase no caso bivariado. Na Se¸c˜ao 3.1 ´e apresentada a defini¸c˜ao de modelos de c´opulas e sua modelagem, enquanto a Se¸c˜ao 3.2 trata da rela¸c˜ao da fun¸c˜ao de c´opulas com as medidas de dependˆencia apresentadas na Se¸c˜ao 2.4. Algumas fam´ılias de fun¸c˜oes de c´opulas s˜ao apresentadas nas Se¸c˜oes 3.3 e a extens˜ao desses modelos para o caso com parˆametros variando no tempo s˜ao apresentados na Se¸c˜ao 3.4. A estrat´egia de modelagem, que envolve a estima¸c˜ao e a an´alise de bondade de ajuste, ´e apresentada na Se¸c˜ao 3.5 e, por fim, algoritmos para simular amostras de modelo de c´opulas ´e apresentado na Se¸c˜ao 3.6.

(21)

c´opulas envolvendo dimens˜oes maior que dois: os Modelos Hier´arquicos Arquimedi-anos, propostos por Savu e Trede (2006), e os modelos Pair Copula, propostos por Aas et al. (2009). Este cap´ıtulo complementa a exposi¸c˜ao do Cap´ıtulo 3, na qual foram discutidas basicamente c´opulas bivariadas. Na Se¸c˜ao 4.2 s˜ao apresentados os modelos Hier´arquicos Arquimedianos, enquanto que na Se¸c˜ao 4.3 ´e apresentada a metodologia de Pair Copula. Por fim a Se¸c˜ao 4.4 ´e dedicada a compara¸c˜ao das duas metodologias em termos das vantagens e desvantagens de cada uma.

No Cap´ıtulo 5 a metodologia de c´opulas ´e aplicada na an´alise da interdependˆencia e cont´agio entre os principais mercados financeiros latino-americanos, europeus e os Estados Unidos. Na Se¸c˜ao 5.2 ´e feita uma breve discuss˜ao referente ao arcabou¸co te´orico de cont´agio. Na Se¸c˜ao 5.3 s˜ao apresentados os dados utilizados na aplica¸c˜ao, assim como a estima¸c˜ao dos modelos marginais. A Se¸c˜ao 5.4 apresenta os resultados bivariados da modelagem de c´opulas, bem como os primeiros resultados referentes `a an´alise de interdependˆencia. A Se¸c˜ao 5.5 apresenta a modelagem trivariada, em que ´e proposto um modelo trivariado com parˆametro variando no tempo. Aqui ´e combinado o modelo Pair Copula de Aas et. al. (2009) com a abordagem de Patton (2006). Esta ´e a principal contribui¸c˜ao metodol´ogica desta disserta¸c˜ao. Uma revis˜ao cr´ıtica da an´alise da evolu¸c˜ao da dependˆencia entre os mercados financeiros estuda-dos, com base nos resultados da Se¸c˜ao 5.5, est´a presente na Se¸c˜ao 5.6, enquanto a an´alise de cont´agio ´e realizada na Se¸c˜ao 5.7. A Se¸c˜ao 5.8 faz uma compara¸c˜ao dos resultados obtidos neste cap´ıtulo com trabalhos similares em que foram aplicadas as metodologia de c´opulas. Por fim, a Se¸c˜ao 5.9 apresenta as conclus˜oes deste cap´ıtulo. No Cap´ıtulo 6 o modelo de Pair Copula ´e aplicado na estima¸c˜ao do Valor em Risco (VaR) e do VaR condicional (CVaR) para retornos de quatro ativos de alta liquidez negociados na Bolsa de Valores de S˜ao Paulo. Esta metodologia admite v´arias decomposi¸c˜oes de c´opulas. Assim, ser´a avaliado o impacto da decomposi¸c˜ao escolhida na estima¸c˜ao do VaR e do CVaR. Na Se¸c˜ao 6.2 ´e apresentada uma an´alise explorat´oria dos dados em estudo, bem como as estimativas dos modelos marginais cujos res´ıduos padronizados s˜ao utilizados para estimar os modelos de c´opulas apre-sentadas na se¸c˜ao 6.3. A Se¸c˜ao 6.4 apresenta os resultados e an´alise do backtesting

(22)

6 1 Introdu¸c˜ao das estimativas do VaR e ES, bem como os resultados obtidos. Finalmente a Se¸c˜ao 6.5 apresenta as conclus˜oes deste cap´ıtulo.

Por fim, no Cap´ıtulo 7 s˜ao consignadas as conclus˜oes finais do trabalho e s˜ao listadas alguns temas de pesquisa futuras.

(23)

2

Fatos Estilizados de S´

eries

Financeiras

2.1

Introdu¸

ao

Neste cap´ıtulo s˜ao apresentadas as principais caracter´ısticas das s´eries finan-ceiras, os chamados fatos estilizados. Atrav´es de uma an´alise de uma s´erie real s˜ao discutidas a n˜ao-normalidade das s´eries financeiras, a existˆencia de volatilidade variando no tempo e o problema em especificar medidas de dependˆencia coerentes para o estudo de s´eries financeiras. As caracter´ısticas dos retornos s˜ao discutidas na Se¸c˜ao 2.2. Na Se¸c˜ao 2.3 s˜ao apresentados as propriedades da volatilidade das s´eries, e por fim a Se¸c˜ao 2.4 s˜ao apresentadas as principais medidas de dependˆencia propostas na literatura.

2.2

Retornos

Seja Pt o pre¸co de um determinado ativo, e seja rt = ln(Pt/Pt−1) o respectivo retorno. A t´ıtulo de exemplifica¸c˜ao, a Tabela 2.1 a seguir apresenta as estat´ısticas descritivas dos retornos do Ibovespa, principal ´ındice de bolsa do Brasil1. O Gr´afico 2.1 apresenta a evolu¸c˜ao dos retornos do Ibovespa apresentados. A partir deste gr´afico ´e possivel verificar que a mais forte queda deste ´ındice (baixa de -17,21%) ocorreu nos finais de 1998 enquanto a mais forte alta (de 28,82%) ocorreu no in´ıcio de 1999.

(24)

8 2 Fatos Estilizados de S´eries Financeiras tempo Retor nos 1996 1998 2000 2002 2004 2006 −0.1 0.0 0.1 0.2 0.3

(25)

Tabela 2.1: Estat´ıstica descritiva dos ´ındices de bolsa do Brasil. Estat´ıstica Valor m´edia (x104) 8,38 m´aximo 0,29 m´ınimo -0,17 variˆancia (x104) 5,21 curtose 16,30 assimetria 0,30

Teste Jarque Bera (p-valor) 0,00 n´umero de observa¸c˜oes 2961

A partir da Tabela 2.1, pode-se constatar que os retornos apresentados possuem curtose elevada (maior do que 3), indicando que esta s´erie apresenta caudas pesadas. Isto constitue-se em uma importante caracter´ıstica das s´eries financeiras, em que ´e poss´ıvel identificar a ocorrˆencia de eventos extremos, isto ´e, fortes altas e fortes baixas comparada com a evolu¸c˜ao “normal” dos mercados. Al´em disso, a s´erie apresentam pequena assimetria e m´edia pr´oxima de zero.

A caracter´ıstica das caudas pesadas influencia, consequentemente, a especi-fica¸c˜ao adequada da distribui¸c˜ao a ser utilizada na modelagem dos retornos. Isto ´e evidenciado a partir dos resultados do teste de Jarque-Bera, em que para a s´erie em estudo rejeita-se a hip´otese nula de normalidade com valor-p menor que 1%.

A Figura 2.2 apresenta algumas caracter´ısticas da s´erie de retornos do Ibovespa. O Quadro (A) apresenta o histograma, o Quadro (B) apresenta o gr´afico de proba-bilidade normal e os Quadros (C) e (D) apresentam a fun¸c˜ao de autocorrela¸c˜ao da s´erie e de seu quadrado, respectivamente.

A existˆencia de caudas pesadas nas s´eries financeiras pode ser visualizada na Figura 2.2, Quadro (B), em que ´e apresentado o gr´afico de probabilidade normal. Constata-se para valores grandes dos quantis te´oricos os quantis do Ibovespa se afastam do valor esperado supondo que a distribui¸c˜ao ´e N (0, 1).

No que se refere a dinˆamica do n´ıvel dos retornos, a principal caracter´ıstica consiste na presen¸ca de pouca ou nenhuma presen¸ca de autocorrela¸c˜ao. Neste caso,

(26)

10 2 Fatos Estilizados de S´eries Financeiras Quadro (A) Ibovespa Densidade −0.2 −0.1 0.0 0.1 0.2 0.3 0 5 10 15 20 −3 −2 −1 0 1 2 3 −0.1 0.0 0.1 0.2 0.3 Quadro (B)

Quantis da Distribuição Normal Padrão

Quantis dos retor

nos do Ibo v espa 0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagens A utocorrelação do Ibo v espa Quadro (C) 0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagens A utocorrelação do quadr ado do Ibo v espa Quadro (D)

(27)

a dinamica poderia ser capturada atrav´es dos modelos AR(1) ou MA(1), expressos por Yt = φYt1+ ǫt e Yt= ǫt+ θǫt−1, com parˆametros φ ou θ pequenos.

2.3

Volatilidade condicional

Outra caracter´ıstica encontrada na an´alise de s´eries de retornos ´e que a volati-lidade, entendida como o grau de variabilidade dos mercados, evolui no tempo. Por exemplo, em per´ıodos de turbulˆencia financeira a volatilidade dos retornos ´e maior comparada com per´ıodos “normais”. Para exemplificar, na Figura 2.1, ´e poss´ıvel constatar que a volatilidade dos retornos do Ibovespa aumenta, por exemplo, em per´ıodos de crise, como o in´ıcio de 1999 (crise da desvaloriza¸c˜ao do Real) e o se-gundo semestre de 2001 (crise na Argentina). Alguns modelos que reproduzem esta caracter´ısticas s˜ao descritos nesta se¸c˜ao.

A principal caracter´ıstica das s´eries de retornos referente a estrutura de cor-rela¸c˜ao, e a presen¸ca simultˆanea de ausˆencia ou pequena correla¸c˜ao no n´ıvel das s´eries e a existˆencia de estrutura de correla¸c˜ao no quadrado das s´eries. Por exemplo, a Figura 2.2, Quadro (D), apresenta a fun¸c˜ao de autocorrela¸c˜ao para o quadrado dos retornos do Ibovespa, e a partir deste gr´afico ´e poss´ıvel constatar que o quadrado dos retornos do Ibovespa apresenta correla¸c˜ao serial, diferentemente dos retornos.

Uma fam´ılia de modelos capaz de reproduzir volatilidades que evoluem no tempo, assim como os conglomerados de volatilidade, s˜ao os modelos de variˆancia condi-cional heteroced´astica, proposto originalmente por Engle (1982) com a formula¸c˜ao do modelo ARCH (Auto-Regressive Conditional Heteroscedasticity). Um modelo ARCH de ordem p, denotado por ARCH(p), ´e expresso por:

yt = ut = σtǫt, (2.1) σ2t = β0+ p X i=1 αiu2i, (2.2)

(28)

12 2 Fatos Estilizados de S´eries Financeiras de distribui¸c˜ao para estes erros s˜ao a distribui¸c˜ao normal padr˜ao, a t-Student com ν graus de liberdade, ou a Distribui¸c˜ao Generalizada do Erro, tamb´em conhecida como GED (Generalized Error Distribution). A distribui¸c˜ao especificada para ǫt ir´a fornecer a distribui¸c˜ao condicional F (yt|Ωt−1), em que Ωt−1 = (yt−1, yt−2, ...) representa o conjunto de informa¸c˜ao at´e o instante t − 1.

Em modelos da fam´ılia ARCH, ´e importante distinguir a variˆancia incondicional da variˆancia condicional. Por exemplo, no processo ARCH(1) a variˆancia incondi-cional de Yt ´e:

V ar(Yt) = β0

1 − α1. (2.3)

enquanto que a variancia condicional de Yt dada a informa¸c˜ao passada Ωt−1 ´e dada por σ2

t da equacao (2.2). Desta forma, pode-se constatar que nos modelos ARCH a variˆancia incondicional ´e fixa, enquanto que a variˆancia condicional varia no tempo. Nesta disserta¸c˜ao ser´a considerada como volatilidade a variancia condicional, a qual evolui no tempo.

Uma extens˜ao do modelo ARCH foi sugerido por Bollerslev (1986), no chamado Generalized Auto-Regressive Conditional Heteroscedasticity (GARCH). Evidˆencia emp´ırica mostra que este modelo permite modelar a volatilidade de maneira mais parcimoniosa (isto ´e, com menor n´umero de parˆametros) comparado com o modelo ARCH. A equa¸c˜ao de evolu¸c˜ao da volatilidade de um modelo GARCH(p, q) ´e dado por: σt2 = β0+ p X i=1 αiu2i + q X i=1 βiσ2i. (2.4)

Tanto os modelos ARCH quanto os modelos GARCH imp˜oem uma estrutura sim´etrica para a evolu¸c˜ao da volatilidade, por´em sabe-se que a volatilidade se com-porta diferentemente em fun¸c˜ao de boas not´ıcias (retornos positivos) e de not´ıcias ru-ins (retornos negativos). Esta propriedade ´e denominada como alavancagem (lever-age effects). Uma classe de modelos que permite incorporar esta propriedade foi

(29)

proposta por Nelson (1991) em que ´e apresentado o modelo EGARCH (Exponential Generalized Auto-Regressive Conditional Heteroscedasticity), no qual:

ln(σt2) = ω + p X

i=1 

αi|ǫt−i| + γiut−i σt−i  + q X i=1 βiln(σ2t−i). (2.5) ´

E importante notar que se ǫt−i> 0 (boas not´ıcias), ent˜ao o efeito na volatilidade ´e igual a (1+γi|ǫt−i|), e no caso em que ǫt−i< 0 (m´as not´ıcias) o efeito na volatilidade ´e igual a (1 − γi|ǫt−i|). Se γi < 0, ent˜ao as m´as not´ıcias exercem maior impacto na volatilidade do que as boas not´ıcias, o que ´e esperado.

Outros modelos foram propostos para incluir o efeito alavanca na evolu¸c˜ao da volatilidade. Glosten, Jagannathan e Runkle (1993) propoem o modelo TARCH, e Ding, Granger e Engle (1993) propoem o modelo PGARCH.

Seja Y1, ..., YN a s´erie de retornos observada. O modelo geral da evolu¸c˜ao dos retornos ´e dado pela seguinte equa¸c˜ao:

Yt = µt+ ut, (2.6)

ut = σtǫt. (2.7)

em que µt´e a m´edia condicional e σt a volatilidade. A m´edia condicional µt engloba um intercepto e pode incluir estrutura AR(1) ou MA(1), discutido anteriormente, e a evolu¸c˜ao de σt ´e dado pelos modelos GARCH, EGARCH, ou qualquer outro do grupo de modelos de variˆancia condicional heteroced´astica.

O m´etodo usual para estima¸c˜ao dos modelos de variˆancia condicional hete-roced´asticas citadas ´e o m´etodo de M´axima Verossimilhan¸ca. Seja a fun¸c˜ao de verossimilhan¸ca:

L(Φ|ΩN) = f (yN|ΩN −1)f (yN −1|ΩN −2)...f (yr+1|Ωr)f (y1, ..., yr|Φ), (2.8) em que r = max(p, q) e Φ corresponde ao conjunto de parˆametros, tanto da m´edia condicional quanto da volatilidade, do modelo de variˆancia condicional em quest˜ao.

(30)

14 2 Fatos Estilizados de S´eries Financeiras O estimador de M´axima Verossimilhanca ´e definido como:

ˆ

Φ = arg sup

Φ ln L(Φ|Ω

N). (2.9)

Propriedades dos estimadores de m´axima verossimilhan¸ca podem ser encontrada em Gourieroux (1997).

Para ilustrar o ajuste de modelos da fam´ıla GARCH, foram estimados modelos AR(1) - EGARCH(1,1) com inova¸c˜oes t-Student, com ν graus de liberdade, para os retornos do Ibovespa. As equa¸c˜oes (2.10) apresentam os resultados da estima¸c˜ao,

IBOVt = 0, 0012 + 0, 0362IBOVt−1+ ut,

ut = σIBOV,tǫt, (2.10)

ln(σ2IBOV,t) = −0, 3174 + 0, 1643|ǫt−1| − 0, 1033ut−1σt−1 + 0, 9599 ln(σt−12 ),

ut ∼ t(ˆv = 8, 897).

A volatilidade estimada para o Ibovespa ´e apresentada na Figura 2.3. Constata-se a partir desta figura que a volatilidade ´e alta nos finais de 1997 (per´ıodo da criConstata-se asi´atica) e finais de 1998 at´e in´ıcio de 1999 (crises russa e brasileira).

95 96 97 98 99 00 01 02 03 04 05 06 07 08 09 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 Volatilidade do Ibovespa

Figura 2.3: Gr´afico das volatilidades estimadas do Ibovespa

(31)

definidos como:

et = Yt− ˆµt ˆ

σt . (2.11)

onde µt e σt foram definidos nas equa¸c˜oes (2.6) e (2.7).

Caso o modelo (ambos m´edia condicional e volatilidade) foi adequadamente especificado, ele n˜ao dever´a apresentar estrutura de correla¸c˜ao, tanto nos res´ıduos quanto nos quadrados dos mesmos. O Gr´afico 2.4 apresenta a autocorrela¸c˜ao dos res´ıduos padronizados e de seu quadrado do modelo ECARCH expresso nas equa¸c˜oes (2.10). Verifica-se com estes gr´aficos que o modelo AR(1) - EGARCH(1,1) ´e um modelo apropriado, na medida em que n˜ao h´a estrutura de correla¸c˜ao nos res´ıduos padronizados e nos seus quadrados.

0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagens A utocorrelação 0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Defasagens A utocorrelação do quadr ado

Figura 2.4: Gr´afico das autocorrela¸c˜oes dos res´ıduos padronizados

Por outro lado, um problema em econometria de finan¸cas ´e examinar a de-pendˆencia de dois ´ındices. Considere, por exemplo, que um modelo apropriado de volatilidade foi ajustado para os retornos do Merval (o principal ´ındice de bolsa do mercado argentino). A id´eia ´e examinar a dependˆencia entre os res´ıduos

(32)

padroniza-16 2 Fatos Estilizados de S´eries Financeiras dos do Ibovespa e do Merval uma vez retirada a correla¸c˜ao entre os n´ıveis dessas s´eries.

Assim, uma pergunta relevante ´e se ainda restou alguma dependˆencia que n˜ao pode ser capturada pelas correla¸c˜oes. Ent˜ao torna-se necess´aria, por exemplo, o estudo de outras medidas de dependˆencia, que ser˜ao abordadas na Se¸c˜ao 2.4.

2.4

Dependˆ

encia

Nesta se¸c˜ao ser´a discutido o problema de estimar o grau de dependˆencia entre duas s´eries financeiras. Ser´a dado enfoque especial nas propriedades e limita¸c˜oes do uso da correla¸c˜ao linear como medida de dependˆencia.

Dentre todas as medidas de dependˆencia, a correla¸c˜ao de Pearson, denotada por ρ, ´e uma das medidas mais populares para mensurar a associa¸c˜ao entre duas vari´aveis aleat´orias. Esta medida ´e expressa por:

ρ = p Cov(X, Y )

Var(X)Var(Y ) (2.12)

A popularidade da correla¸c˜ao como medida de dependˆencia resulta do fato de que parte significativa da an´alise estat´ıstica segue o suposto de normalidade ou usa distribui¸c˜oes el´ıpticas2. Embrechts et. al. (2002) apresenta maiores detalhes sobre o tema.

Apesar da sua popularidade, a correla¸c˜ao linear apresenta as seguintes limita¸c˜oes: 1. Var(X) e Var(Y ) devem ser finitas, ou ent˜ao a correla¸c˜ao n˜ao ser´a definida 2. Independˆencia de 2 vari´aveis aleat´orias implica em ρ=0, por outro lado se ρ=0

n˜ao implica em independˆencia. Para que isso ocorra, basta por exemplo que a dependˆencia entre elas seja n˜ao linear

2Uma distribui¸c˜ao el´ıptica, a grosso modo, ´e definida quando sua densidade conjunta ´e expressa

como uma fun¸c˜ao de uma forma quadr´atica de suas marginais. A distribui¸c˜ao gaussiana e a

(33)

3. A correla¸c˜ao linear n˜ao ´e invariante sob transforma¸c˜oes n˜ao lineares

Assim, surge o problema de quais propriedades uma medida de dependˆencia deve ter. Estas propriedades s˜ao discutidas no Apˆendice A.

Por causa das limita¸c˜oes da correla¸c˜ao linear, foram propostas medidas alterna-tivas de dependˆencia. Um primeiro conjunto trata-se da correla¸c˜ao de postos (rank correlation), do qual fazem parte a correla¸c˜ao de Spearman (ρS) e o tau de Kendall (τ ) definidas como:

ρS = ρ(F (X), F (Y )), (2.13)

τ = P ((X1− X2)(Y1− Y2) > 0) − P ((X1− X2)(Y1− Y2) < 0), (2.14) em que (X1, Y1) e (X2, Y2) s˜ao dois pares de vari´aveis aleat´orias independentes. Em outros termos, a correla¸c˜ao de Spearman ´e a correla¸c˜ao de Pearson calculada com base nas fun¸c˜oes de distribui¸c˜ao de X e Y , em vez das vari´aveis originais, e o tau de Kendall ´e a diferen¸ca da probabilidade de ocorrerem pares concordantes e discordantes.

As propriedades de ρS e τ s˜ao apresentadas no Apˆendice A. A principal van-tagem de ρS e τ , comparado com a correla¸c˜ao linear, ´e que estas medidas s˜ao in-variantes a quaisquer transforma¸c˜oes mon´otonas. Por outro lado, seu c´alculo n˜ao envolve manipula¸c˜oes simples das matrizes de variˆancias e covariˆancias, como a cor-rela¸c˜ao linear.

Para ilustrar o comportamento das medidas ρ, ρS e τ , veja a Tabela 2.2 a seguir. Foram simulados 1.000 observa¸c˜oes de uma distribui¸c˜ao normal bivariada com correla¸c˜ao igual a 0,5 e, para esta amostra, foram calculadas as estimativas das medidas de dependˆencia para duas fun¸c˜oes n˜ao lineares. Pode-se constatar que os valores de ρ se alteram nos trˆes casos, inclusive ´e diferente de 1 no par (X, X3) em que h´a dependˆencia perfeita entre as vari´aveis. As medidas τ e ρS n˜ao se alteraram entre os pares (X, Y ) e (X, Y3) e s˜ao iguais a 1 para o par (X, X3), indicando que τ e ρS identificarm associa¸c˜ao perfeita neste par, o que ´e esperado.

(34)

18 2 Fatos Estilizados de S´eries Financeiras

Tabela 2.2: Compara¸c˜ao entre as medidas de dependˆencia ρ, ρS e τ

Pares ρ ρS τ

X, Y 0,508 0,506 0,351 X, Y2 0,015 -0,001 -0,001 X, Y3 0,368 0,506 0,351 X, X3 0,780 1,000 1,000

H´a um segundo conjunto de medidas que capturam a dependˆencia nas caudas, isto ´e capturam a dependˆencia entre as vari´aveis aleat´orias em eventos extremos e que assumem grande importˆancia na an´alise de s´eries financeiras. Estas medidas, conhecidas como ´ındices de caudas, s˜ao definida como:

λl= lim u→0+P (Y < F −1 Y (u)|X < FX−1(u)), (2.15) λu = lim u→1−P (Y > F −1 Y (u)|X > F −1 X (u)). (2.16)

em que λl e λurepresentam os ´ındices de cauda inferior e superior, respectivamente, e FX−1(·) e FY−1(·) representam as fun¸c˜oes quantil de X e Y . A grosso modo, λlmede a probabilidade de uma vari´avel estar abaixo de um certo valor pequeno dado que a outra vari´avel est´a abaixo de um certo valor, e analogamente λlmede a probabilidade de uma vari´avel estar acima de um certo valor alto dado que a outra est´a acima de um certo valor. Estas medidas s˜ao utilizadas para capturar associa¸c˜ao entre vari´aveis em eventos extremos, isto ´e, entre valores muito pequeno e/ou muito grande das vari´aveis. Por exemplo, no contexto da an´alise de s´eries financeiras, λl mede a associa¸c˜ao entre fortes baixas de dois retornos, enquanto λu mede a associa¸c˜ao entre as fortes altas.

Se λl e λu pertencem ao intervalo (0,1], o par de vari´aveis aleat´orias ´e dito ser assintoticamente dependente, ou seja h´a um grau de dependˆencia entre os valores extremos das vari´aveis. No caso em que λl = λu = 0, ent˜ao este par ´e dito assin-toticamente independente. Pode-se encarar a existˆencia de dependˆencia nas caudas como uma extens˜ao da caracter´ıstica de n˜ao normalidade para o caso multivariado, na medida em que para a distribui¸c˜ao normal ambos os ´ındices de caudas s˜ao iguais

(35)

a zero.

A dependˆencia nas caudas configura uma das mais importantes caracter´ısticas da an´alise multivariada de retornos de ativos financeiros. A Figura 2.5 ilustra esta caracter´ıstica para as fun¸c˜oes de distribui¸c˜ao emp´ıricas dos res´ıduos padronizados do modelo AR(1)-EGARCH(1,1) para os ´ındices Ibovespa e Merval. Constata-se, a partir deste gr´afico, que h´a um ac´umulo de observa¸c˜oes pr´oximos aos pontos (0,0) e (1,1), o que ´e evidˆencia de dependˆencia nas caudas. Se o par de retornos fosse assintoticamente independente, ent˜ao n˜ao deveria ser observado esses acumulos.

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 Merval Ibovespa

Figura 2.5: Gr´afico dos res´ıduos padronizados da s´erie do Ibovespa e Merval, ap´os o ajuste de um modelo AR(1)-EGARCH(1,1) com inova¸c˜oes t-Student As medidas de dependˆencia apresentadas anteriormente s˜ao ´uteis para descrever a dependˆencia, por´em h´a outra metodologia, a Teoria de C´opulas, a qual permite modelar a dependencia assim como expressar as medidas ρ, ρS e τ em termos das fun¸c˜oes de copulas. Como fazer isto ´e discutido no cap´ıtulo a seguir

(36)

21

3

Modelos de C´

opula

Neste cap´ıtulo ´e apresentada resumidamente a Teoria de C´opulas com ˆenfase no caso bivariado, enquanto a modelagem de dimens˜oes maiores que dois ser´a discutida no Cap´ıtulo 4. Na Se¸c˜ao 3.1 ´e apresentada a defini¸c˜ao de modelos de c´opulas e sua modelagem, enquanto a Se¸c˜ao 3.2 trata da rela¸c˜ao da fun¸c˜ao de c´opulas com as medidas de dependˆencia apresentadas na Se¸c˜ao 2.4. Algumas fam´ılias de fun¸c˜oes de c´opulas s˜ao apresentadas nas Se¸c˜oes 3.3 e a extens˜ao desses modelos para o caso com parˆametros variando no tempo s˜ao apresentados na Se¸c˜ao 3.4. A estrat´egia de modelagem, que envolve a estima¸c˜ao e a an´alise de bondade de ajuste, ´e apresentada na Se¸c˜ao 3.5 e, por fim, algoritmos para simular amostras de modelo de c´opulas ´e apresentado na Se¸c˜ao 3.6.

Revis˜oes ´uteis da teoria de c´opulas s˜ao Nelsen (1999), Becerra e Melo (2008a) e Trivedi e Zimmer (2005), entre outros.

3.1

Introdu¸

ao

Uma fun¸c˜ao de c´opulas pode ser definida como uma distribui¸c˜ao multivariada cujas marginais s˜ao uniformemente distribu´ıdas no intervalo [0,1], ou seja, U (0, 1)1. O resultado mais conhecido no que se refere a sua aplica¸c˜ao est´a associado ao Teo-rema de Sklar (1959), que ´e enunciado a seguir.

Seja x = (X1, ..., Xd) um vetor aleat´orio, C : Rd → R uma fun¸c˜ao de c´opulas,

(37)

F (x1, ..., xd) uma fun¸c˜ao de distribui¸c˜ao conjunta qualquer com marginais Fxi(xi),

i = 1, ..., d; ent˜ao o teorema garante que existe uma fun¸c˜ao de c´opula C de tal forma que: F (x1, ..., xd) = C(Fx1(x1), ..., Fxd(xd)), (3.1) ou, analogamente, C(u1, ..., ud) = F (F−1 x1 (u1), ..., F −1 xd (ud)). (3.2)

Seja a densidade da c´opula, definida por: c(Fx1(x1), ..., Fxd(xd)) = ∂

dC(Fx1(x1), ..., Fxd(xd))

∂Fx1(x1) · · · ∂Fxd(xd) . (3.3) Ent˜ao, a densidade multivariada de x ´e igual a:

f (x1, ..., xd) = c(Fx1(x1), ..., Fxd(xd)) d Y i=1

fxi(xi). (3.4)

O Teorema de Sklar garante que, se as vari´aveis aleat´orias em quest˜ao forem cont´ınuas, ent˜ao h´a uma ´unica fun¸c˜ao de c´opulas que relaciona a distribui¸c˜ao con-junta com suas distribui¸c˜oes marginais.

A partir deste ponto, a exposi¸c˜ao sobre a teoria de c´opulas ser´a focada no caso bivariado.

Pode-se constatar, a partir da equa¸c˜ao (3.4), que a densidade de um vetor bivari-ado (X, Y ), fx,y(x, y), ´e fatorada pelas suas marginais e pela densidade da c´opula, a qual captura a informa¸c˜ao contida da estrutura de dependˆencia entre as vari´aveis X e Y . Como medir esta dependˆencia ser´a abordado na Se¸c˜ao 3.2.

A equa¸c˜ao (3.4) constitui uma importante ferramenta da fun¸c˜ao de c´opulas para a constru¸c˜ao de distribui¸c˜oes bivariadas. Assim, para construir uma distribui¸c˜ao bivariada, ´e preciso:

(38)

3.1 Introdu¸c˜ao 23

1. As marginais fx(x) e fy(y)

2. A fun¸c˜ao de densidade de c´opula c(·, ·), que estabelece a dependˆencia entre as densidades marginais fx(x) e fy(y).

Desta forma, ´e poss´ıvel construir distribui¸c˜oes multivariadas com consider´avel flexibilidade. Por exemplo, pode-se construir uma distribui¸c˜ao multivariada a partir de uma c´opula t-Student com ν graus de liberdade enquanto cada uma de suas marginais seguem distribui¸c˜ao t-Student com ν1 e ν2 graus de liberdade. Se, em vez de considerar esta constru¸c˜ao de c´opulas fosse considerada a distribui¸c˜ao t-Student multivariada com ν graus de liberdade, suas marginais iriam seguir obrigatoriamente distribui¸c˜ao t-Student com os mesmos graus de liberdade ν. Outro exemplo consiste em considerar as marginais com distribui¸c˜ao gama, enquanto a fun¸c˜ao de c´opulas ´e gaussiana. Se em vez desta constru¸c˜ao de c´opulas mencionada fosse adotado uma distribui¸c˜ao multivariada gaussiana, suas marginais seguiriam obrigatoriamente distribui¸c˜ao normal. Em resumo, a abordagem de c´opulas permite, com grande flexibilidade, construir distribui¸c˜oes multivariadas de maneira anal´ıtica. Este fato traz uma importante contribui¸c˜ao na modelagem, uma vez que ´e poss´ıvel construir padr˜oes de dependˆencia entre as s´eries com grande flexibilidade.

Apesar da grande flexibilidade obtida pela metodologia de c´opulas, h´a limites nos valores em que a dependˆencia assume. Esta limita¸c˜ao ´e dada, principamente, pelos limites de Hoeffding e Frech´et, discutidos no Apˆendice B.

Al´em de vincular as fun¸c˜oes de distribui¸c˜ao marginais com a sua conjunta, a fun¸c˜ao de c´opula tamb´em permite resgatar a informa¸c˜ao da distribui¸c˜ao condicional, atrav´es da seguinte equa¸c˜ao:

FX|Y(X|Y ) = ∂C(Fx(x), Fy(y))

∂Fy(y) . (3.5)

Cabe destacar que se X e Y seguem uma distribui¸c˜ao U (0, 1), ent˜ao F (X|Y ) = ∂C(x,y)

∂y

(39)

an´alise pressup˜oe o conhecimento, a priori, da fun¸c˜ao de c´opula. Existe tamb´em um enfoque n˜ao param´etrico para a an´alise de c´opulas atrav´es da c´opula emp´ırica ( ˆC), definida por Deheuvels (1978). A c´opula emp´ırica ´e expressa por:

b C i n, j n  = 1 n n X k

1{u1,k≤u1,k(i),u2,(i)≤u2,(j)}, (3.6)

para i, j = 1, ..., n. Por uma vez, a densidade da c´opula emp´ırica ´e dada por: b c i n, j n  = ( 1

n se (u1,(i), u2,(j)) for um elemento da amostra,

0 caso contr´ario. (3.7)

O estudo da c´opula emp´ırica permite uma avalia¸c˜ao inicial da estrutura de dependˆencia sem a necessidade de se impor qualquer express˜ao para a fun¸c˜ao de c´opulas. Esta fun¸c˜ao pode orientar a escolha da c´opula. Por exemplo Palaro e Hotta (2006) avaliam a bondade de ajuste do modelo atrav´es da distˆancia quadr´atica entre c´opulas estimadas e a c´opula emp´ırica. Nesta disserta¸c˜ao a c´opula emp´ırica ser´a uti-lizada para avaliar, preliminarmente, a dependˆencia nas caudas atrav´es dos ´ındices de cauda emp´ıricos, que ser˜ao apresentados na Se¸c˜ao 3.2

3.2

opulas e medidas de dependˆ

encia

As medidas de dependˆencia discutidas na Se¸c˜ao 2.4 podem ser escritos em termos da fun¸c˜ao de c´opulas. Assim, o ρS de Spearman e o τ de Kendall s˜ao expressos por:

ρs = 12 Z Z [0,1]2 C(u1, u2)du1du2− 1, (3.8) τ = 4 Z Z

[0,1]2C2(u1, u2)dC1(u1, u2) − 1.

E os ´ındices de caudas s˜ao escritos como: λu= lim u→1− ¯ C(u, u) 1 − u , λl= limu→0+ C(u, u) u ,

(40)

3.3 Algumas Fam´ılias de C´opulas 25

em que ¯C(u1, u2)=1 - u1 - u2 + C(u1, u2) denota a c´opula de sobrevivˆencia2. As medidas de dependˆencia tamb´em podem ser expressas atrav´es das fun¸c˜oes de c´opulas emp´ıricas ˆC(·, ·). Nelsen (1999) mostra que as medidas de dependˆencia ρs e κ s˜ao expressas por:

ˆ ρs = 12 n2− 1 n X j=1 n X i=1 " b C i n, j n  − i n − j n # , (3.9) ˆ κ = 2n n − 1 n X j=2 n X i=2 " b C i n, j n  b Ci − 1 n , j − 1 n  (3.10) − bC i n, j − 1 n  b Ci − 1 n , j n # .

Por sua vez, os ´ındices de cauda emp´ıricos podem ser calculados a partir dos gr´aficos das seguintes equa¸c˜oes:

ˆ λu(q) = 1−2q+ ˆ1−qC(q,q), para q> 1 2 ˆ λl(q) = C(q,q)ˆq , para q< 1 2 (3.11)

como fun¸c˜ao de q. Os valores emp´ıricos dos ´ındices de cauda s˜ao obtidos visual-mente a partir dos gr´aficos de ˆλu(q) e ˆλl(q) avaliados quando q → 1 e q → 0, respectivamente.

3.3

Algumas Fam´ılias de C´

opulas

Nesta se¸c˜ao ser˜ao apresentadas as fam´ılias de c´opulas mais utilizadas na lite-ratura de econometria de finan¸cas: c´opulas el´ıpticas e arquimedianas. H´a outras fam´ılias de c´opulas; como a c´opula de Valor Extremo, Farlie-Gumbel-Morgenstein, Fr´echet, dentre outras; que n˜ao ser˜ao apresentadas neste trabalho. Ver Nelsen (1999) para maiores detalhes.

2A c´opula de sobrevivˆencia vincula as fun¸c˜oes de sobrevivˆencia marginais com a conjunta, de

(41)

3.3.1

opulas el´ıpticas

A primeira fam´ılia de c´opulas que ser´a apresentada nesta se¸c˜ao ser´a a c´opula el´ıptica. Para se obter uma c´opula el´ıptica, com base na equa¸c˜ao (3.2), basta que a fun¸c˜ao de distribui¸c˜ao conjunta F perten¸ca a fam´ılia el´ıptica, como a normal e a t-Student. Assim, se for especificado F (·) = Φ(·) e F−1(·) = Φ−1(·), em que Φ(·) e Φ−1(·) s˜ao a fun¸c˜ao de distribui¸c˜ao acumulada e a fun¸c˜ao quantil da normal padr˜ao respectivamente, ´e obtida a c´opula Gaussiana e Φ2´e a fun¸c˜ao de distribui¸c˜ao acumulada bivariada normal padr˜ao.

A partir da equa¸c˜ao (3.2) ´e poss´ıvel expressar a c´opula Gaussiana (CG) da seguinte forma:

CG(u1, u2|ρ) = Φ2(Φ−1(u1), Φ−1(u2)). CG(u1, u2|ρ) = Z Φ−1(u 1) −∞ Z Φ−1(u 2) −∞ 1 2π(1 − ρ2) expn−x 2− 2ρxy + y2 2(1 − ρ2) o dxdy. (3.12)

O parˆametro da c´opula CG ´e a correla¸c˜ao linear, ρ. Para esta c´opula, os ´ındices de cauda s˜ao iguais a zero, indicando que as vari´aveis aleat´orias s˜ao assintoticamente independentes, ou dito de outra forma n˜ao possui dependˆencia em eventos extremos.

Por sua vez, a c´opula t-Student ´e expressa por: CT(u1, u2|ρ, ν) = T2,ν(T−1 1,ν(u1), T1,ν−1(u2)) CT(u1, u2|ρ, ν) = Z T1,ν−1(u1) −∞ Z T1,ν−1(u2) −∞ Γ(ν+2 2 ) Γ(ν 2) p (πν)2(1 − ρ2) expn1 +x 2− 2ρxy + y2 ν(1 − ρ2) o−ν+2 2 dxdy, (3.13)

em que Td,ν ´e a fun¸c˜ao de distribui¸c˜ao acumulada da t-Student d variada.

A c´opula t-Student possui dois parˆametros: a correla¸c˜ao (ρ), e o parˆametro ν que representa os graus de liberdade. Para esta c´opula ambos os ´ındices de cauda

(42)

3.3 Algumas Fam´ılias de C´opulas 27 s˜ao iguais a: λu= λl= 2Tν+1−√ν + 1 r 1 − ρ 1 + ρ  . (3.14)

Assim, a c´opula t-Student permite reproduzir a dependˆencia entre os valores extremos da distribui¸c˜ao, por´em ela imp˜oe que essa dependˆencia seja da mesma magnitude para ambas as caudas, o que pode ser um fator limitante na an´alise dos dados por exemplo quando estudamos ganhos e perdas.

A Figura 3.1 compara as curvas de n´ıvel das densidades de distribui¸c˜oes com c´opulas gaussiana (ρ=0,5) e t-Student (ρ=0,5 e ν=3) considerando as marginais como N (0, 1). Nesta figura pode-se visualizar que a c´opula t-Student permite re-produzir a dependˆencia nas caudas, diferentemente da c´opula gaussiana. Assim, por exemplo, verifique que a ´area da densidade da t-Student na regi˜ao [-2,5;-1,5] x [-2,5;-1,5] ´e maior que a ´area nesta mesma regi˜ao para a c´opula Gaussiana.

Cópula t−Student, ρ = 0.5, ν = 3 −2 −1 0 1 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Cópula gaussiana, ρ = 0.5 −2 −1 0 1 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2

Figura 3.1: Curvas de n´ıvel das densidades das c´opulas gaussiana e t-Student com marginais N (0, 1).

(43)

3.3.2

opulas arquimedianas

Seja ϕ(·) uma fun¸c˜ao [0,1] → [0,∞) diferenci´avel duas vezes no intervalo (0,1) com as seguintes propriedades: i) ϕ(1) = 0, ϕ′(t) < 0 (primeira derivada decrescente) e ϕ′′(t) > 0 (fun¸c˜ao convexa), e ii) ϕ(0) = ∞. A partir da fun¸c˜ao ϕ(·) satisfazendo estas propriedades, define-se a c´opula arquimediana, da segunte forma:

C(u1, u2) = ϕ−1(ϕ(u1) + ϕ(u2)) (3.15) onde ϕ(·) ´e chamada fun¸c˜ao geradora da c´opula arquimediana.

As c´opulas arquimedianas apresentam as seguintes propriedades: i) s˜ao sim´etricas, no sentido em que C(u1, u2) = C(u2, u1) e ii) s˜ao associativas, pois C(u1, C(u2, u3)) = C(C(u1, u2), u3)

Com base na equa¸c˜ao (3.15), a densidade da c´opula pode ser expressa por: c(u1, u2) = ϕ

′′(C(u1, u2))ϕ(u1)ϕ(u2)

[ϕ′(C(u1, u2))]3 (3.16)

A partir de diferentes fun¸c˜oes ϕ(·) obt´em-se diferentes especifica¸c˜oes para C(u1, u2). Na Tabela 3.1 s˜ao apresentadas a fun¸c˜ao geradora e a especifica¸c˜ao de algumas das c´opulas arquimedianas mais populares.

Tabela 3.1: Principais c´opulas arquimedianas

Nome ϕ(t) ϕ−1(t) Clayton θ−1(t−θ− 1) (1 − t)− 1 θ Gumbel (− ln(t))−θ exp(−t− 1 θ)

Frank − lnexp(−θt−1)exp(−θ−1) −θ−1ln(1 + e−t(e−θ− 1))

Nome C(u1, u2|θ) Valores de θ Clayton (u−θ 1 + u−θ2 − 1)− 1 θ [0,∞) Gumbel exp(−(˜uθ 1+ ˜uθ2) 1 θ) [1,∞) em que ˜u1= − ln(u1) Frank −1 θln 1+(exp(−θu1−1))(exp(−θu2−1)) exp (−θ−1)  (-∞,∞)

(44)

3.3 Algumas Fam´ılias de C´opulas 29

Como ilustra¸c˜ao, as curvas de n´ıvel de cada fun¸c˜ao de c´opula apresentadas na Tabela 3.1 est˜ao apresentadas na Figura 3.2. Nesta figura s˜ao apresentadas curvas de n´ıvel das densidades das c´opulas Clayton (θ=1), Gumbel (θ=1,5) e Frank (θ=1). Em todos os modelos as marginais foram especificadas como N (0, 1).

Cópula Clayton, θ = 1 −2 0 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Cópula Gumbel, θ = 1.5 −2 0 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Cópula Frank, θ = 1 −2 0 2 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2

Figura 3.2: Curvas de n´ıvel das densidades das c´opulas Clayton, Gumbel e Frank com marginais N (0, 1).

A partir dos gr´aficos apresentados na Figura 3.2, constata-se que a c´opula Clay-ton permite reproduzir a dependˆencia na cauda inferior, enquanto a c´opula Gumbel reproduz a dependˆencia na cauda superior e, por fim, a c´opula Frank n˜ao permite reproduzir dependˆencia nas caudas. Isto pode ser visualizado comparando, por exemplo, a ´area na regi˜ao [-2,5;-1,5] x [-2,5;-1,5] de cada c´opula para avaliar a de-pendˆencia na cauda inferior, e de maneira similar avaliar a regi˜ao [1,5;2,5] x [1,5;2,5] para avaliar a cauda superior. De fato, a partir das equa¸c˜oes (2.15) e (2.16) e das express˜oes das c´opulas da Tabela 3.1, pode-se calcular que para a c´opula Clayton, λl = 2−1

θ e λu = 0; para a c´opula Gumbel, λl = 0 e λu = 2 − 2− 1

θ; e para a Frank,

todos os ´ındices de cauda s˜ao iguais a zero.

(45)

uniparam´etricas, na medida que a estrutura de dependˆencia ´e controlada por ape-nas um parˆametro. H´a um grupo de c´opulas arquimediaape-nas que s˜ao biparam´etricas, sendo a mais popular a c´opula Joe-Clayton (JC), apresentada por Joe (1997). A equa¸c˜ao da referida c´opula ´e apresentada a seguir:

CJC(u1, u2|λu, λl) = 1 − (1 − {[1 − (1 − u1)κ]−γ (3.17) +[1 − (1 − u2)κ]−γ − 1}1/γ)1/κ,

κ = 1/log2(2 − λu), γ = −1/log2(λl). (3.18) Os ´ındices de cauda da c´opula JC s˜ao iguais a λu e λl. A c´opula JC possui um inconveniente que, mesmo no caso γ = κ, ainda h´a dependˆencia assim´etrica nas caudas. Para contornar este problema, Patton (2006) prop˜oe a c´opula Symmetrized Joe Clayton (SJC), a qual ´e definida como:

CSJC(u1, u2|λu, λl) = 0.5[CJC(u1, u2|λu, λl) (3.19) +CJC(1 − u1, 1 − u2|λl, λu) + u1+ u2− 1].

A Figura 3.3 apresenta a curva de n´ıvel para a c´opula SJC com λl=0,6 e λu=0,3, com marginais iguais a N (0, 1). Pode-se observar nesta figura que a c´opula SJC permite reproduzir dependˆencia assim´etrica nas caudas.

Cópula SJC, λl = 0,6 e λu = 0,3 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5 −2.5 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 2.5

(46)

3.4 C´opulas com parˆametros variando no tempo 31

3.4

opulas com parˆ

ametros variando no tempo

A evidˆencia emp´ırica encontrada em grande parte da literatura de econometria de finan¸cas aponta que a dependˆencia entre s´eries financeiras ´e dinˆamica, isto ´e muda com o tempo. Portanto, ´e conveniente definir c´opulas que permitam reproduzir esta propriedade.

Nesta se¸c˜ao ser˜ao apresentados modelos de c´opulas com os parˆametros variando no tempo. Estas permitem reproduzir mudan¸cas no comportamento da dependˆencia entre vari´aveis aleat´orias, o qual ´e um aspecto crucial na modelagem em algumas aplica¸c˜oes importantes em econometria de finan¸cas, como por exemplo cont´agio, que ser´a discutido no Cap´ıtulo 5. Esta se¸c˜ao ´e toda baseada no trabalho de Patton (2006). H´a outros trabalhos que prop˜oem alternativas diferentes para especificar a c´opula dinˆamica, como por exemplo Zhang e Guegan (2008), Jondeau e Rockinger (2006) e Serban et. al. (2007). Uma breve apresenta¸c˜ao deles se encontra no Apˆendice C.

A incorpora¸c˜ao de estrutura variante no tempo nos parˆametros das c´opulas consiste em uma reparametriza¸c˜ao do modelo; ou, em outros termos, os parˆametros s˜ao re-especificados de tal forma que inclua a dinˆamica temporal. O parˆametro ρ das c´opulas Gaussiana e t-Student3 ´e reescrito da seguinte forma:

ρt = ˜Λδ0+ δ1ρt−1+ δ21 k k X i=1 F−1(u1,t−i)F−1(u2,t−i), (3.20) ˜ Λ(x) = tanh(x/2). (3.21)

Se a c´opula for Gaussiana, F (·) = Φ(·). Por sua vez, se a c´opula for t-Student, F (·) = T (·).

As equa¸c˜oes de evolu¸c˜ao dos parˆametros para a c´opula SJC est˜ao especificadas

3Originalmente Patton (2006) propˆos a especifica¸c˜ao da equa¸c˜ao (3.20) unicamente para a

(47)

a seguir:

λu,t = Λ(θ1,u+ θ2,uλu,t−1+ θ3,u1 k k X i=1 |u1,t−i− u2,t−i|), (3.22) λl,t = Λ θ1,l+ θ2,lλl,t−1+ θ3,l1 k k X i=1 |u1,t−i− u2,t−i|, (3.23) Λ(x) = (1 + exp(x))−1. (3.24)

Ser˜ao adotadas neste trabalho as equa¸c˜oes de evolu¸c˜ao dos parˆametros expressas pelas equa¸c˜oes (3.20), (3.22) e (3.23) paras as c´opulas Gaussiana, t-Student e SJC. Permanece um tema em aberto, at´e o momento da conclus˜ao deste trabalho, o estudo e proposi¸c˜ao de metodologias para verificar se a equa¸c˜ao de evolu¸c˜ao foi especificada de forma correta.

De maneira te´orica, a especifica¸c˜ao do modelo com parˆametros variando no tempo exige o conceito de c´opula condicional, proposto por Patton (2006) e definido por:

F (u1, u2|V ) = C(F (u1|V ), F (u2|V )|V ). (3.25) Para especificar que os parˆametros variem no tempo ´e preciso conhecer a evolu¸c˜ao do passado das s´eries temporais em estudo. Neste sentido, especifica-se v = Ωt−1, em que Ωt−1 representa o conjunto de informa¸c˜ao at´e o instante t − 1.

Todas as propriedades de c´opulas apresentadas anteriormente (sejam elas, (i) capturar a dependˆencia entre as vari´aveis aleat´orias e (ii) ser ´unica quando as vari´aveis envolvidas forem cont´ınuas), continuam v´alidas para a c´opula condicional. Isto ´e, o Teorema de Sklar ´e v´alido para a c´opula condicional em rela¸c˜ao as dis-tribui¸c˜oes condicionais. Para que a fun¸c˜ao C(·, ·|v) seja realmente uma c´opula, ´e preciso que todas as distribui¸c˜oes condicionais e a c´opula sejam condicionadas na mesma vari´avel aleat´oria. Caso as marginais sejam condicionadas em diferentes

(48)

3.5 Modelagem 33

vari´aveis v1 e v2, ´e preciso garantir a seguinte propriedade:

Fx|v1(X|V1) = Fx|V1,V2(x|V1, V2) (3.26)

Fy|v2(Y |V2) = Fy|V1,V2(y|V1, V2) (3.27)

para quaisquer (X, Y, V1, V2).

Uma forma de avaliar (3.26) e (3.27) foi sugerida por Patton (2006). Este procedimento foi implementado na Se¸c˜ao 5.4.2.

3.5

Modelagem

O procedimento de modelagem de c´opulas consiste nos seguintes passos: i) es-colha do modelo apropriado de c´opulas, ii) estima¸c˜ao dos parˆametros do modelo, e iii) an´alise de diagn´ostico, para se avaliar se o modelo de c´opulas foi apropriadamente escolhido.

Esta se¸c˜ao se dedica a apresentar os procedimentos para estimar (subse¸c˜ao 3.5.1) e proceder a an´alise de bondade de ajuste (subse¸c˜ao 3.5.2) dos modelos de c´opulas especificado.

3.5.1

Estima¸

ao

O m´etodo mais usual na estima¸c˜ao dos parˆametros da c´opula ´e o m´etodo de M´axima Verossimilhan¸ca, que ser´a discutido em detalhes nesta se¸c˜ao. Pode-se aplicar outros m´etodos como, por exemplo, GMM (Generalized Method of Moments), que n˜ao ser´a abordado neste trabalho, mas pode ser encontrado em Prokhorov e Schmidt (2006).

Seja (X1, Y1),...,(Xn, Yn) uma amostra aleat´oria bivariada de interesse na mode-lagem, e seja Θ = (θ, φx, φy) o vetor de parˆametros a ser estimado. θ consiste no vetor (ou escalar) de parˆametros de dependˆencia entre X e Y , enquanto φxe φy s˜ao

(49)

os vetores de parˆametros da distribui¸c˜ao marginal de X e Y , respectivamente. Nesta se¸c˜ao ser´a considerado que o modelo tem parˆametros fixos, entretanto a metodologia apresentada pode ser implementada para o caso de parˆametros variando no tempo. Com base na densidade bivariada de um vetor aleat´orio, expresso pela equa¸c˜ao (3.4), a fun¸c˜ao de log-verossimilhan¸ca ´e dada por:

ln L = n X i=1 ln c(FX(xi), FY(yi)|θ) + n X i=1 ln fx(xi|φx) + n X i=1 ln fy(yi|φy) (3.28) Ent˜ao o estimador de M´axima Verossimilhan¸ca ´e:

ˆ

Θ= arg sup Θ

ln L (3.29)

Cabe destacar que, em geral, n˜ao h´a solu¸c˜ao anal´ıtica para a equa¸c˜ao (3.29), e a maximiza¸c˜ao da fun¸c˜ao ´e feita numericamente.

Joe e Xu (1997) prop˜oem o procedimento IFM (Inference Function for Margins) que consiste em duas etapas: i) estimativa de φxe φy por M´axima Verossimilhan¸ca utilizando para tanto as fun¸c˜oes de verossimilhan¸ca do modelo marginal, e ii) utilizar

ˆ

βxe ˆβy para estimar θ. Este procedimento corresponde a seguinte equa¸c˜ao: ˆ

θ = arg sup θ

ln L(X, Y, θ, ˆφx, ˆφy) (3.30)

No procedimento descrito na equa¸c˜ao (3.29) todos os parˆametros da distribui¸c˜ao conjunta s˜ao estimados conjuntamente, e na equa¸c˜ao (3.30) os parˆametros das marginais e da c´opula s˜ao estimados em separado. O custo computacional envolvido no m´etodo IFM ´e menor, tendo em vista que a fun¸c˜ao de verossimilhan¸ca ´e mais sim-ples e ´e reduzido o numero de parˆametros. Uma compara¸c˜ao entre os dois m´etodos de estima¸c˜ao pode ser encontrada em Joe e Xu (1997)

(50)

3.5 Modelagem 35

3.5.2

Bondade de ajuste

Avaliar se o modelo de c´opulas captura apropriadamente a estrutura de de-pendˆencia entre as vari´aveis aleat´orias ´e equivalente a avaliar se a verdadeira dis-tribui¸c˜ao de (X1, ..., Xd) ´e dada por F (x1, ..., xd).

A literatura relacionada ao tema possui um grande n´umero de metodologias que permitem avaliar se (X1, ..., Xd) segue a distribui¸c˜ao F (x1, ..., xd). Uma compara¸c˜ao exaustiva entre elas pode ser encontrada em Berg (2007) e Genest et. al. (2009). Nesta disserta¸c˜ao foram utilizados duas metodologias para a an´alise de bondade de ajuste: os testes baseados nas transformadas integral de probabilidade (PIT - Probability Integral Transformation) e o teste dos hits, apresentado por Patton (2006).

Considere as seguintes defini¸c˜oes de Transformada Integral de Probabilidade (T ) definidas para v.a. cont´ınua como:

T (X1,t) = F (X1,t) (3.31)

T (X2,t) = F (X2,t|X1,t) ...

T (Xd,t) = F (Xd,t|Xd−1,t, ..., X1,t)

Sob a hip´otese nula de que a verdadeira distribui¸c˜ao seja dada pela fun¸c˜ao de dis-tribui¸c˜ao multivariada F (x1, ..., xd), ent˜ao o vetor aleat´orio T (Xt) = (T (X1,t), ..., T (Xd,t)) deve ter distribui¸c˜ao uniforme multivariada independentes na regi˜ao (0, 1)d, ou U (0, 1)d. Para avaliar se T (Xt) ∼ U(0, 1)d um dos procedimentos mais adotados ´e calcular St=Pdi=1Φ−1(T (Xd,t)) e testar se St´e distribuido por uma qui-quadrado com d graus de liberdade. Por sua vez, para se testar esta hip´otese pode-se adotar os testes de Kolmogorov-Smirnov (KS) e o teste de Anderson Darling (AD), cujas

(51)

estat´ısticas do teste est˜ao expressas nas equa¸c˜oes a seguir: KS = sup x | ˆF (x) − F (x)|, (3.32) AD = −n − 1 n n X i=1 (2i − 1)[ln( ˆF (xj)) + ln(1 − ˆF (xn−i+1))], (3.33)

em que ˆF (x) denota a fun¸c˜ao de distribui¸c˜ao emp´ırica de X.

A estat´ıstica do teste de Kolmogorov-Smirnov converge para uma distribui¸c˜ao de Kolmogorov, independentemente da distribui¸c˜ao sob a hip´otese nula. Entretanto, a distribui¸c˜ao da estat´ıstica do teste AD ´e sens´ıvel a distribui¸c˜ao adotada. At´e o presente momento n˜ao foi proposto nenhuma tabula¸c˜ao da distribui¸c˜ao da estat´ıstica AD quando a hip´otese nula ´e dada por uma distribui¸c˜ao qui-quadrada. Para con-tornar esta limita¸c˜ao, pode ser seguido o procedimento de bootstrap sugerido por Genest et. al. (2006), que consiste nos seguintes passos:

1. Encontre estimadores consistentes de θ 2. Simule n amostras de c´opulas com θ = ˆθ

3. Para cada amostra, calcule a estat´ıstica desejada

4. Com base nos n valores da estat´ıstica encontrados, calcule a propor¸c˜ao dos valores que s˜ao maiores que o valor da estat´ıstica obtida na amostra original. Os testes dos hits, diferentemente daqueles baseados nas PITs, consiste em uma compara¸c˜ao das probabilidades do vetor aleat´orio se encontrar em alguma regi˜ao do suporte da distribui¸c˜ao com a frequˆencia emp´ırica obtida com os dados em an´alise. Esta metodologia se restringe aos modelos de c´opulas bivariadas, diferentemente dos testes baseados nos PITs que podem ser implementados para qualquer dimens˜ao. Este teste foi proposto por Patton (2006), e toda discuss˜ao a seguir est´a relacionado a esse artigo.

Considere Rj kj=0 parti¸c˜oes do suporte da distribui¸c˜ao, seja Πt =ΠRj

k

j=1 a

(52)

3.5 Modelagem 37

probabilidade obtida do modelo. Al´em disso, defina os hits Hj,t = I(xt,yt)∈Rj, uma

vari´avel indicadora que verifica se a observa¸c˜ao (xt, yt) pertence a regi˜ao Rj em estudo. O teste dos hits avalia a bondade de ajuste do modelo em J regi˜oes atrav´es de uma regress˜ao log´ıstica, expressa pela seguinte equa¸c˜ao:

Πj,t = Π(Zj,t, βj, pj,t) = Λ  λ(Zj,t, βj) − ln  1 − pj,t pj,t  (3.34)

em que Λ(·) ´e a transforma¸c˜ao log´ıstica. λ(Zj,t, βj) ´e uma fun¸c˜ao linear de uma constante, do n´umero de hits no dia anterior, nos ´ultimos 5 dias e nos ´ultimos 10 dias, e βj um vetor de coeficientes associado a cada uma dessas vari´aveis.

Foram consideradas 7 regi˜oes do suporte da distribui¸c˜ao definidos da seguinte forma: (i) ambas as s´eries est˜ao abaixo do 10o percentil; (ii) ambas as s´eries est˜ao acima do 90o percentil, (iii) ambas as s´eries est˜ao entre o 10o e o 25o percentil, (iv) ambas as s´eries est˜ao entre o 75o e o 90o percentil, (v) ambas as s´eries est˜ao entre o 25o e o 75o percentil, (vi) uma das s´eries est´a abaixo dos 10o percentil e a outra est´a acima do 75o percentil (vii) O oposto da regi˜ao 6.

Os parˆametros βj podem ser estimados por M´axima Verossimilhan¸ca, e para testar se o modelo captura a estrutura de dependˆencia apropriadamente na regi˜ao Rj´e similar ao teste βj=0 e isto pode ser feito pelo teste de raz˜ao de verossimilhan¸ca. A an´alise apresentada avalia isoladamente a j-´esima regi˜ao. Para avaliar em conjunto todas as regi˜oes, defina Mt =

k X

j=0

jI(wt ∈ Rj), ou seja, a nova vari´avel Mt dir´a em que regi˜ao pertence um par de observa¸c˜oes. Para isso, utiliza-se as mesmas regi˜oes definidas para o teste dos hits, definindo adicionalmente a regi˜ao zero como aquela que n˜ao pertence a nenhuma das 7 detalhadas anteriormente, e tamb´em se utiliza a mesma especifica¸c˜ao para λ(Zj,t, βj). Desta forma, avaliar se o modelo captura todas as regi˜oes simultaneamente consiste em testar se Mt ∼ Multinomial(Πt), contra a hip´otese alternativa de que Mt ∼ Multinomial(Pt).

(53)

O modelo que ´e estimado para esta hip´otese ´e expresso por: Π1(Z1,t, β, p1,t) = Λ  λ(Z1,t, β) − ln  1 − p1,t p1,t  , (3.35) Πj(Z1,t, β, p1,t) = h1 − j−1 X i=1 ΠiiΛ  λ(Zj,t, β) − ln  1 − pj,t pj,t  , (3.36) Π0 = 1 − k X i=1 Πj. (3.37)

A an´alise do teste ´e procedida de maneira similar ao teste de uma ´unica regi˜ao. ´

E testado se β = 0 pelo m´etodo de Raz˜ao de Verossimilhan¸ca.

3.6

Simula¸

ao de c´

opulas

Nesta se¸c˜ao ser˜ao apresentadas as principais metodologias para simular ob-serva¸c˜oes a partir de uma fun¸c˜ao de c´opula especificada. Aqui ser´a apresentada a metodologia para o caso multivariado, em que a fun¸c˜ao de c´opulas envolve di-mens˜oes maiores ou iguais que dois.

O primeiro procedimento, o mais utilizado para simular uma amostra de n observa¸c˜oes obtida atrav´es de uma fun¸c˜ao de c´opula C(u1, ..., ud) d-dimensional ´e obtido atrav´es da Simula¸c˜ao Condicional (conditional sampling). Este procedimento utiliza basicamente a equa¸c˜ao (3.5) que expressa a fun¸c˜ao de distribui¸c˜ao condicional com base em uma derivada parcial da fun¸c˜ao de c´opula (do qual origina o nome do algoritmo).

Este algoritmo consiste nos seguintes passos:

1. Gere u=(u1, ..., ud) com distribui¸c˜ao U (0, 1)d independentes. u1 ´e a primeira vari´avel de interesse.

2. Calcula as fun¸c˜oes (quase) inversas de F (u2|u1), F (u3|u2, u1),...,F (ud|ud−1, ..., u1), expressa por F−1(uj|uj−1, ..., u1), para j = 2, ..., d.

Referências

Documentos relacionados

Segundo Vilmário, 46 anos e presidente da associação quilombola, “a questão da memória pelas casas de taipas, até por uma questão da própria FUNASA 6 (...) quando

Algumas sementes e castanhas vão ficar só nessa etapa de hidratação pois já passaram por um processo térmico no caso de algumas castanhas e nozes, outras sementes descascadas

A literatura, como ressalta Cândido (2004), é uma manifestação universal do homem, seja em que tempo for, pois ela traz elementos essenciais para uma com- preensão dialética

Este trabalho tem o objetivo de reunir algumas informações sobre um período tão importante do desenvolvimento humano que é a adolescência, objetivando os fatores

In this study aspects of the ecophysiology and morphology of the seed and seedling of Raulinoa echinata was analyzed aiming to contribute with taxonomic studies, ecology and

reconhecendo sua importância. · Maior valorização do processo de aprendizagem e não apenas dos resultados. · Desenvolvimento de ambientes de aprendizagem que centrem o aluno

A minha participação no referido estudo será no sentido de dar uma entrevista para responder perguntas sobre a qualidade do ensino, do processo, suas motivações, vantagens

a Os grãos de pólen de Toona ciliata são pequenos, perfeitamente formados e binucleados, desde o estádio de flor fechada; b A espessura da exina do pólen é menor na flor fechada; c