Modelando contágio financeiro através de cópulas

(1)

ESCOLA DE ECONOMIA DE SÃO PAULO

RICARDO PIRES DE SOUZA SANTOS

MODELANDO CONTÁGIO FINANCEIRO ATRAVÉS DE

CÓPULAS

SÃO PAULO

(2)

MODELANDO CONTÁGIO FINANCEIRO ATRAVÉS DE

CÓPULAS

Dissertação apresentada à Escola de Economia da

Fundação Getúlio Vargas, para a obtenção de Título

de Mestre em Economia.

Orientador: Prof. Dr. Pedro Luiz Valls Pereira

(3)

Pires de Souza Santos, Ricardo.

Modelando Contágio Financeiro através de Cópulas / Ricardo Pires de

Souza Santos - 2010.

94 f.

Orientador: Pedro Luiz Valls Pereira

Dissertação (mestrado) - Escola de Economia de São Paulo.

1. Crise financeira. 2. Mercado financeiro -- Previsão. 3. Mercado

financeiro – Modelos matemáticos. 4. Cópulas (Estatística matemática). I.

Valls, P. (Pedro). II. Dissertação (mestrado) - Escola de Economia de São

Paulo. III. Título.

(4)

aqui tratada, por sua competência, atenção criteriosa e indispensável prestada em todas as etapas desta Tese de Mestrado. Pelo tempo dispensado às discussões semanais, pela oportunidade de crescimento e aprendizado no trabalho conjunto e pela con…ança em mim depositada.

Aos profesores Dr. Emerson Fernandes Marçal e Dr. Ricardo Ratner Rochman que participaram da banca de quali…cação com comentários e sugestões para a melhoria do trabalho e pela ajuda fora da banca.

Aos professores Dr. Luiz Koodi Hotta e Dr. Emerson Fernandes Marçal que participaram da banca de defesa com suas críticas e sugestões para a melhoria da dissertação.

Aos meus pais e irmãos, que sempre me deram apóio e força, valorizando meus potenciais. Em particular agradeço ao meu pai pelas sugestões e ajuda na etapa …nal da dissertação.

À Cynthia Rieder por seu sorriso e alegria, que mesmo morando do outro lado do oceano, me incentivou constantemente.

Aos amigos e colegas de mestrado: Hugo, Felipe, Eduardo, Priscila, Perosa, Dárcio, Politi, Serigati, Luiz Fernando, Barbi e outros, pela convivência nesses dois anos. Em particular agradeço ao Leonardo Correia, pelas conversas …adas sobre econometria fora da sala de aula.

A todos os amigos, professores e pessoas que, direta ou indiretamente, con-tribuíram para a execução desse trabalho.

(5)

À Cynthia

aos meus pais, José Carlos e Zuleima,

(6)

Sumário

Lista de Figuras iv

Lista de Tabelas v

I Teoria 1

1 Introdução 2

2 Contágio …nanceiro 5

2.1 De…nições de contágio …nanceiro . . . 7

2.2 Testes empíricos sobre contágio . . . 11

2.3 Contágio …nanceiro no Brasil . . . 12

3 Introdução à cópulas 14 3.1 Cópulas . . . 16

3.1.1 Transformação Integral de probabilidade . . . 17

3.2 Teorema de Sklar . . . 18

3.3 Funções cópulas . . . 19

3.4 Copulas especiais . . . 23

3.5 Métodos de estimação . . . 26

3.5.1 Máxima Verossimilhança Exata . . . 27

3.5.2 Inferência para as Marginais . . . 28

3.5.3 Máxima Verossimilhança Canônica . . . 29

3.6 Exemplo ilustrativo . . . 30

4 Medidas de Dependência 33 4.1 Correlação de Pearson (coe…ciente de correlação linear) . . . 36

4.2 Correlação de Spearman . . . 38

4.3 Tau de Kendall . . . 39

4.4 Dependência quantílica . . . 41

4.5 Dependência das caudas . . . 41

(7)

5 Cópulas condicionais 45

5.1 Cópulas condicionais . . . 46

5.2 Cópulas condicionais orientadas a observações . . . 48

II Análise Empírica 52 6 Testando a hipótese de contágio …nanceiro 53 6.1 Dados . . . 53

6.2 Estatísticas descritivas dos retornos . . . 55

6.2.1 Períodos de análise . . . 63

6.3 Modelos para as distribuições marginais . . . 64

6.4 Modelos para as cópulas . . . 69

6.4.1 Cópula gaussiana . . . 69

6.4.2 Cópula SJC . . . 75

7 Conclusão 86

(8)

Lista de Figuras

3.1 Diagrama de dispersão das funções cópulas gaussiana (coluna esquerda) e as respectivas distribuições bivariadas (coluna direita) construídas a partir

desta copula e distribuições marginais N(0;1). . . 22

3.2 Diagrama de dispersão das funções cópulas Joe-Clayton (coluna esquerda) e as respectivas distribuições bivariadas (coluna direita) construídas a partir desta copula e distribuições marginais N(0;1). . . 24

3.3 Cópulas especiais: C ,C+ eC? . . . 25

3.4 Diagrama de dispersão de distribuições geradas a partir de diversas cópulas e distribuições marginais padrão N(0;1) . . . 31

5.1 Distância mínima do ponto (u1;t; u2;t) em relação à diagonal principal (de-pendência positiva perfeita). . . 49

6.1 Índices de mercados selecionados . . . 54

6.2 Retornos (logarítmicos) diários . . . 56

6.3 Diagrama de dispersão dos retornos diários . . . 60

6.4 Medidas de associação - (escuro), _S (médio), K (claro) e (linha) . . . 62

6.5 Média anual dos retornos (logarítmicos) diários . . . 63

6.6 Distribuiçãot-student assimétrica . . . 66

6.7 Copula gaussiana - coe…ciente de correlação linear _t . . . 71

6.8 Copula gaussina - correlação linear _t com a presença de quebra estrutural . 76 6.9 Copula SJC - Dependência das caudas superior U _{(verde, escala esquerda)} e inferior L _{(azul, escala direita) . . . .} ₈₀

6.10 Copula SJC – dependência da cauda superior U _{com a presença de quebra} estrutural . . . 83

(9)

Lista de Tabelas

3.1 Medidas de dependência para distribuições conjuntas obtidas a partir das

funções copulas e de distribuições marginaisN(0,1) . . . 32

6.1 Estatísticas Descritivas dos Retornos Diários . . . 59

6.2 Modelos ARMAst-GARCH para as distribuições marginais . . . 67

6.3 Estimativas dascopulas condicionais: gaussiana . . . 73

(10)

Parte I

(11)

Capítulo 1

Introdução

As medidas de dependência entre mercados …nanceiros exercem notável in‡uência

e são de extensa aplicação. Administradores de carteiras exploram as correlações entre

mercados de modo a se bene…ciar da diversi…cação internacional. Formuladores de política

monitoram a dependência entre mercados …nanceiros a …m de avaliar a possibilidade de

contágio …nanceiro.

O presente trabalho testa a hipótese de contágio …nanceiro entre quatros mercados

selecionados seguindo-se a metodologia de cópulas.

A hipótese da ocorrência de contágio …nanceiro entre mercados desenvolveu-se

principalmente a partir de crises …nanceiras que ocorreram na década de 90. O corpo

teórico que abrange tal hipótese consiste na identi…cação dos canais de transmissão

inter-nacional do choque e na avaliação de sua estabilidade durante os períodos de crise,i.e. da

sua intensidade na transmissão de choques. No presente estudo, contágio …nanceiro será

(12)

país especí…co. Tal de…nição se encaixa na classe de de…nições de contágio, identi…cada e

denominada por Rigobon (2002) deshift-contagion. A presença do fenômeno, portanto, será

evidenciada por meio de uma quebra estrutural do comportamento padrão da dependência

entre os mercados. De acordo com Forbes e Rigobon (2002), o uso desta de…nição apresenta

a vantagem da não necessidade de explicitação do canal de transmissão do choque.

A vantagem da modelagem do contágio …nanceiro por meio de funções copulas é

evidente, posto que ambos tomam as medidas de dependência como protagonista de seus

corpos teóricos. A teoria de copulas é uma metodologia de modelagem de distribuições

multivariadas. Como alicerce principal, admite que toda distribuição multivariada pode ser

decomposta em uma estrutura para as distribuições marginais e uma estrutura de

dependên-cia, representada pelas funções cópulas que, por sua vez, "ligam"as distribuições marginais

numa estrutura única. A metodologia sobressai-se outras abordagens alternativas,e.g.

val-ores extremos, por modelar toda a distribuição conjunta das variáveis, fornencendo além

de medidas de locação e dispersão, e.g. média e variância, outras medidas de dependência

como dependências de cauda e correlações de postos.

Não se questiona o extraordinário avanço dos instrumentos …nanceiros e do setor de

tecnologia de informação, que reduziram as barreiras para a movimentação da informação

e pode-se inferir que os mercados …nanceiros, de forma geral, estejam mais interligados.

Entretanto, não é possível a…rmar que estes mercados estejam mais suscestíveis a contágio

…nanceiro. De acordo com o Global Financial Report, FMI (2008), com a recente crise

do Subprime, iniciada nos Estados Unidos, a hipótese de descolamento1 _{(que pode ser}

interpretada como hipótese de não-contágio) das economias emergentes foi posta a teste.

(13)

Este trabalho compreende um bloco teórico, onde são apresentados os fundamentos

econômicos e estatísticos que abrangem o tema e que, em um segundo bloco empírico,

servirão para o desenvolvimento dos modelos e testes necessários para se testar a hipótese

da evidência de contágio. No capítulo 2 é feita uma concisa revisão bibliográ…ca acerca da

teoria de contágio …nanceiro expondo, inclusive, de…nições e alguns estudos sobre contágio

…nanceiro envolvendo o Brasil. O capítulo 3 apresenta a teoria da metodologia de cópulas,

destacando sua …nalidade para modelagem de distribuições multivariadas. O capítulo 4

introduz algumas medidas de dependência, objeto de estudo na teoria de contágio, e destaca

as suas propriedades e …nalidades. Por …m, a teoria de cópulas condicionais e o método

para modelagem do fenômeno contágio são tratados no capítulo 5. Os capítulos 6 e 7

abrangem a parcela empírica desta dissertação, os princípios, testes e procedimentos até

(14)

Capítulo 2

Contágio …nanceiro

Encontra-se na literatura uma série de de…nições e formas de se mensurar o

fenô-meno do contágio …nanceiro, ao qual necessariamente está subjacente uma crise …nanceira

(choque). Devido às diferentes arquiteturas …nanceira-internacionais de cada país, seus

diferentes arranjos institucionais e à própria inerente complexidade das crises …nanceiras,

encontra-se uma grande variedade de estudos e modelos para se explicar o fenômeno do

contágio (Marçalet al. (2010)).Dessa forma, os resultados dos diferentes trabalhos

tornam-se de difícil comparação, di…cultando a apretornam-sentação aqui de um corpo teórico único e

consolidado.

De acordo com Edwards (2000), a literatura sobre contágio desenvolveu-se a partir

das crises …nanceiras da década de 90, que se espalharam para os países emergentes. Mesmo

antes da crise …nanceira mexicana de 1995, estudos e investigações relacionados ao tema

já constituíam parte da literatura econômica. Em pesquisa realizada pelo mesmo autor no

(15)

apresentava-se no abstract e/ou título, apenas 17 datavam de épocas anteriores à 1990.

No que se refere-se às principais crises …nanceiras dos últimos anos, encontram-se

trabalhos sobre contágio aplicados à crise do México de 1995 (desvalorização do peso

mex-icano em dezembro de 1994), à crise asiática de 1997 (desvalorização da moeda tailandesa

em julho de 1997), à crise russa de 1998 (com a declaração de moratória do país em agosto

de 1998), à desvalorização do Real em janeiro de 1999, às quedas das ações das empresas de

tecnologia ao …m de 2000, à crise argentina em 2001 (com o colapso docurrency board em

dezembro de 2001), e mais recentemente à crise do Subprime em 2007 com a subseqüente

quebra do Banco Lehman Brothers no segundo semestre de 2008.

Ressalta-se que muito embora o fenômeno contágio tenha se iniciado a partir de

crises …nanceiras em mercados emergentes, não se restringe apenas a estes. É possível

encontrar uma série de estudos acerca de contágio …nanceiro entre países desenvolvidos,

como por exemplo, sobre a crise do Exchange Rate Mechanism em 1992, que atingiu vários

países da Europa (ver Giavazzi, et al. (2000)).

Segundo Rigobon (2002), acredita-se que o estudo do contágio começou com as três

grandes crises …nanceiras de meados dos anos 90 (mexicana, asiática e russa) que colocaram

vários países em desenvolvimento sob intenso estresse …nanceiro. Ainda, o autor a…rma que

a propagação das crises da Ásia e da Rússia, diferentemente da crise mexicana, ainda é de

difícil explicação tendo-se como base apenas as teorias1 _{existentes sobre o assunto.}

(16)

2.1 De…nições de contágio …nanceiro

Embora não exista uma concordância clara que re…ra-se à de…nição de contágio e à

sua identi…cação empírica/cientí…ca, pode-se estabelecer certa identidade comum em todas

as suas de…nições: crises econômicas em fase inicial podem propagar-se para outros países

por meio do aumento das conexões entre os países envolvidos (Rigobon (2002)).

Claessens et al. (2000) de…nem contágio como a propagação de perturbações

no mercado de um país para o mercado de um outro país, evidenciadas por meio de

co-movimentos nas taxas de câmbio, preços de ações, ‡uxos de capitais e spreads soberanos.

Entre as de…nições apresentadas em Pericoli e Massimo (2003) está a que considera

contágio …nanceiro um aumento signi…cante da probabilidade de crise em um país,

condi-cional a uma crise em outro país. Trata-se esta da de…nição também utilizada no estudo

de Eichengrenn et al. (1996) que pretenderam veri…car se a ocorrência da crise cambial em

país aumenta a probabilidade de ataques especulativos em outros países. Após análise, nos

últimos trinta anos, de vintes países industrializados os autores encontraram evidências de

que o canal de transmissão de comércio entre países aumenta a probabilidade de contágio

durante crise cambiais.

Como apontado por Pericoli e Massimo (2003), qualquer corpo teórico sobre

con-tágio deve ser capaz de i) identi…car quais são os canais de transmissão internacional do

choque e ii) veri…car se estes são estáveis, i.e. se há descontinuidades nesses canais, se há

canais ativos apenas em períodos de crise, etc.

Seguindo a taxionomia adotada por Rigobon (2002), é possível agrupar as distintas

(17)

A primeira classe de contágio – shift contagion – engloba todas as de…nições

rela-cionadas a aumentos signi…cativos dos mecanismos de propagação de choques entre países.

Nestas, as transmissões de choques durante períodos de estabilidade econômica são

admiti-das como um canal estável de propagação. Intuitivamente, havendo aumento de intensidade

na transmissão dos choques durante os períodos de crise econômica em relação aos períodos

de estabilidade, esse aumento pode ser considerado contágio. Assim, as relações entre

mer-cados podem ser mensuradas por diversas estatísticas como a correlação entre os retornos

de ativos …nanceiros, a probabilidade de um ataque especulativo e a transmissão de choques

ou volatilidade.

Nota-se que esta classe de de…nições encara o fenômeno do contágio como um

aumento na intensidade das relações entre os países, sem focar em como essa mudança

ocorre. As de…nições de Claessenset al. (2000) e Eichengrennet al. (1996) situam-se aqui.

A segunda classe de contágio – contágio puro – foca no tipo de mecanismo de

propagação que transmite o choque. O princípio base dessas de…nições é considerar apenas

os choques que não são transmitidos pelos canais padrões de transmissão (e.g. relações

comerciais) e que, portanto, não podem ser explicados pelos fundamentos econômicos, como

contágio. Assim, a presença de contágio …ca evidenciada pelos excessos de transmissão de

choques que não são explicados pelos fundamentos econômicos-…nanceiros do país.

A principal vantagem desta segunda classe com relação a primeira (shift

conta-gion), segundo Rigobon (2002), está em sua de…nição extensa de contágio. Nas de…nições

pertencentes acontágio puro, os mecanismos de transmissão de choques são explicitamente

(18)

Na prática, entretanto, a vantagem pode tornar-se incoveniente, posto que a implementação

empírica necessária para testar essa classe de de…nições é consideravelmente mais complexa

do que no caso do shift contagion. Na maior parte dos estudos relacionados a contágio

puro, o contágio é tratado como o resíduo de uma regressão (i.e. a propagação que não

é explicada pelos canais explicitamente modelados). Assim, se algum canal relevante de

transmissão não for considerado na especi…cação, as conclusões da análise empírica poderão

ser viesadas.

No presente estudo, contágio …nanceiro é de…nido como o aumento signi…cante

das conexões entre mercados após choque em um país especí…co, nos moldes da classe de

shift-contagion. Dessa forma, a presença de contágio …nanceiro se provará por meio de uma

quebra (estrutural) do comportamento padrão dessas relações entre países. De acordo com

Forbes e Rigobon (2002), o uso desta de…nição apresenta a vantagem da não necessidade

de explicitação do canal de transmissão do choque. E dado a extensa literatura sobre

canais de propagação internacional de choques, ao de…nir-se contágio como retro-proposto,

evita-se a necessidade de mensuração e diferenciação desses diversos canais de transmissão

de choques. Tal proveito deverá estender-se também a questões empíricas, posto não ser

possível observar todos os canais de transmissão de choques entre países (a de…nição em

questão contorna tal restrição ao considerar toda informação disponível pelas observações

em períodos de estabilidade econômica).

Patton (2009) identi…ca, porém, uma relevante di…culdade enfrentada ao se utilizar

essa de…nição, visto que a mesma exige a proposição de um ponto de referência para o que

(19)

antes de se testar a hipótese da ocorrência de contágio.

Outra limitação, apresentada por Rigobon (2002), reside no fato de a de…nição

aqui pretendida ser aplicável apenas no sentido a…rmativo e não no sentido restritivo. Em

outras palavras, a presença de um aumento da intensidade dos co-movimentos nos preços

de mercados, condicionada a uma crise ocorrendo em um país especí…co, é manifestação

de contágio …nanceiro. Já a ausência dessa mudança nos canais de transmissão não pode

ser considerada uma evidência da inexistência de contágio. Segundo o autor, a de…nição,

portanto, não permite testar a ausência de contágio …nanceiro uma vez que não explicita

um canal especí…co de transmissão de choques.

Por …m, vale ressaltar - princípio básico da teoria sobre investimento - que grande

parte dos distúrbios econômicos são idiossincráticos a cada país, de modo que os

merca-dos de ações em diferentes países devem apresentar, relativamente, baixas correlações. A

correlação entre mercados nacionais é um dos principais elementos para administração de

carteiras internacionais e a diversi…cação internacional entre mercados permite reduzir o

risco total dessas carteiras sem, aparentemente, sacrifícios sobre o retorno. Entretanto, se

as correlações entre mercados aumentam após um choque negativo,i.e. em períodos onde os

benefícios da diversi…cação do risco são mais demandados, a evidência do fenômeno contágio

…nanceiro pode ser interpretada como contrária à e…cácia da diversi…cação internacional,

(20)

2.2 Testes empíricos sobre contágio

Como visto na seção anterior, uma teoria sobre contágio deve ser capaz de

iden-ti…car os canais de transmissão do choque e veri…car se estes são estáveis ou ativos apenas

em períodos de crise.

As di…culdades econométricas enfrentadas na modelagem de contágio devem-se

basicamente ao fato do fenômeno ser, muitas vezes, mensurado com variáveis de freqüência

diária, por exemplo retornos dos mercados de ações, taxas de juros, spread soberano e

taxas de câmbio. Dentre os problemas que essas variáveis apresentam, Rigobon (2001)

aponta para os seguintes: viés de omissão, simultaneidade, heteroscedasticidade condicional

e incondicional, correlação serial, não linearidade e a não normalidade.

Tomando-se como exemplo os retornos diários sob a ótica do mercado …nanceiro,

estes apresentam heteroscedasticidade condicional e incondicional, correlação serial e são

não-normais. Sob a perspectiva macroeconômica, retornos internacionais são

simultanea-mente determinados e estão constantesimultanea-mente sujeitos a choques comuns e não observáveis

como mudanças de expectativa do investidor e choques de liquidez.

Dentre as principais metodologias para se mensurar contágio …nanceiro,

encontram-se na literatura estudos envolvendo o coe…ciente de correlação linear, modelos de

compo-nentes principais, regressões lineares, modelos logit-probit e, mais recentemente, os

mod-elos GARCH multivariados, regressões quantílicas e a modelagem por cópulas. Uma

re-comendável revisão bibliográ…ca de algumas metodologias utilizadas para mensurar o

(21)

2.3 Contágio …nanceiro no Brasil

Entre os primeiros trabalhos realizados sobre o tema, destaca-se, dentro do propósito

aqui pretendido, o de Baig e Goldfajn (2000), que examina a ocorrência de contágio na crise

russa com relação ao Brasil, através da análise dos spreads de títulos Brady e índices de

mercado de ações. Os autores, dotando-se de uma técnica de ajuste dos coe…cientes de

correlação, proposta por Forbes e Rigobon (2002), concluem a ocorrência do contágio, por

meio de uma parada súbita no ‡uxo de capitais para Brasil e Rússia, sob o mecanismo de

propagação do mercado de títulos da dívida.

O estudo de Mendes (2005) se destingue por utilizar uma metodologia semelhante

à empregada neste estudo. A autora procura, por meio da teoria de cópulas, evidências de

excesso de co-movimentos entre mercados que não sejam, necessariamente, explicados por

teorias econômicas. A análise é feita para sete mercados de ações da América Latina, Ásia

e África. Dentre os resultados encontrados, destaca-se o aumento de dependência durante

perdas conjuntas, para os pares de países Argentina e México e Brasil e México.

Em Marçal e Valls Pereira (2008), testa-se a hipótese de contágio …nanceiro no

mercado de títulos soberanos de quatros países emergentes (Brasil, Argentina, México e

Rússia) durante as crises da década de 90. O teste é feito a partir de diferentes modelos

de volatilidade multivariada. Os resultados evidenciaram que as estruturas de volatilidade

não foram constantes durantes as crises …nanceiras do período.

No recente trabalho de Marçal et al. (2010), os autores seguem percurso ainda

mais rigoroso ao analisarem a presença de contágio …nanceiro condicionada aos fundamentos

(22)

foi muito bem exposto no trabalho de Pesaran e Pick (2003). Nele, os autores investigam

as condições sob as quais o fenômeno do contágio pode ser diferenciado de movimentos de

interdependência2_.

Em Marçal et al. (2010), a partir da utilização de modelos multivariados DCC,

testa-se a hipótese de contágio entre os países da América Latina e Ásia durante as crises

…nanceiras ocorridas entre 1994 e 2003. Entre os resultados, os autores apresentam

ev-idências de contágio regional na América Latina e Ásia, e contágio …nanceiro da Ásia para

América Latina. Os resultados apontam ainda para os Estados Unidos como vetor de

con-tágio para os países da América Latina e o Japão, como vetor de concon-tágio para países da

Ásia e América Latina.

Por …m, vale a menção ao recente estudo feito por Souza e Tabak (2009), como

ex-emplo ilustrativo da aplicabilidade da teoria de contágio …nanceiro. Estes autores estendem

a de…nição de contágio para investigar sua ocorrência entre os mercados bancários, durante

a crise do Subprime. Considerando uma amostra de 48 países e realizando testes com base

na metodologia proposta por Forbes e Rigobon (2002), os autores criaram umranking dos

países que mais sofreram contágio. No que se aplica ao Brasil, concluem que, de maneira

geral, o efeito do contágio sobre os bancos brasileiros foi limitado.

(23)

Capítulo 3

Introdução à cópulas

A teoria de cópulas está diretamente ligada à teoria de modelagem de distribuições

multivariadas e, portanto, ao conceito de dependência.

Com efeito, toda distribuição multivariada possui informações sobre as distribuições

marginais e sobre as relações de dependência entre as variáveis.

Por de…nição, a distribuição bivariada das variáveis de interesse Y1,Y2 é dada por F(y1; y2) = P(Y1 y1; Y2 y2). De acordo com Trivedi e Zimmer (2007), as seguintes

propriedades são necessárias e su…cientes para queF(y1; y2)seja uma distribuição conjunta

contínua pela direita:

limyj! 1F(y1; y2) = 0 paraj= 1;2.

limyj!1F(y1; y2) = 1 paraj= 1;2.

Peladesigualdade retangular, para todo(a1; b1)e(a2; b2)coma1 a2eb1 b2, temos

(24)

As duas primeiras propriedades garantem 0 F 1, enquanto que a última trata-se simplesmente da versão bidimensional da propriedade análoga de uma função

uni-dimensional não decrescente1_.

A partir da distribuição conjunta F(y1; y2), as distribuições marginais F1(y1) e F2(y2) das variáveisY1 e Y2, respectivamente, são obtidas por:

F1(y1) =P(Y1 y1) =P(Y1 y1 eY2 1)

= lim

y2!1

F(y1; y2)

F2(y2) =P(Y2 y2) =P(Y1 1 eY2 y2)

= lim

y1!1

F(y1; y2):

(3.1)

A distribuição marginal de uma variável é, portanto, obtida pelo limite da outra variável

na distribuição conjunta (o que pela de…nição de distribuição conjunta equivale a dizer que

a ocorrência da outra variável é garantida).

No que tange às relações de dependência, pelo Teorema de Bayes temos que:

F(y1; y2) =F1j2(y1jy2)F2(y2) =F2j1(y2jy1)F1(y1)

Para f1(y1); f2(y2) > 0.Para o caso exclusivo de variáveis independentes, F1j2(y1jy2) =

P(Y1 y1) =F1(y1)ou F2j1(y2jy1) =P(Y2 y2) =F2(y2) e, portanto: F(y1; y2) =F1(y1)F2(y2)

Assim, a distribuição conjunta de um vetor de variáveis independentes está determinada

somente pelas distribuições marginais de cada variável. Para o caso de não independência

entre variáveis, a distribuição conjunta se caracterizará não só pelas distribuições marginais

como também por uma estrutura de dependência entre as variáveis.

(25)

A modelagem da distribuição multivariada por cópulas permite isolar dessa

estru-tura de dependência a estruestru-tura das distribuições marginais, permitindo, como apontado por

McNeil, et al. (2005), uma modelagem das distribuições multivariadas do “especí…co para

o geral”. Parte-se da investigação das distribuições marginais que, via de regra, oferecem

ao pesquisador uma gama maior de informações comparativamente à distribuição conjunta.

A teoria de cópulas possibilita a combinação das distribuições marginais com uma

variedade de modelos de dependência representados pelas funções cópulas. Para simpli…car

a exposição, a teoria apresentada focará apenas nas distribuições bivariadas, muito embora

seja aplicável também a dimensões maiores.

3.1 Cópulas

Antes de apresentar o Teorema de Sklar – base para a teoria de cópulas e pelo

qual se faz a ligação entre a função cópula e a distribuição conjunta – será de…nida a função

cópula.

Uma função cópula bidimensional C é uma função de[0;1]2 ![0;1]que satisfaz as seguintes propriedades:

C(u1;0) =C(0; u2) = 0, para todou1,u2 2[0;1]

C(u1;1) =u1 e C(1; u2) =u2, para todou1,u2 2[0;1]

Para todo (a1; b1) e (a2; b2), onde a1 a2 e b1 b2, é válido

(26)

A partir da de…nição acima, e graças à similaridades com as propriedades que

uma distribuição conjunta deve atender, pode-se interpretar uma função cópula como uma

função que associa o plano unitário (no caso bidimensional) ao intervalo unitário. Ou

alternativamente, e de acordo com Nelsen (2006), cópulas são distribuições conjuntas cujas

distribuições marginais são uniformes no intervalo (0;1).

3.1.1 Transformação Integral de probabilidade

Uma função cópula possui informações, a respeito da distribuição conjunta, que

não pertencem às distribuições marginais. O isolamento das informações contidas nas

dis-tribuições marginais é obtido pela transformação integral de probabilidade, também

con-hecida como transformação quantílica.

Seja Fi a função de distribuição de uma variável Yi, a função quantílica de Fi é

de…nida para todo u₂(0;1)pela sua inversa generalizada2_{, como segue}

F_i (u) = inf_fyi2R:Fi(yi) ug (3.2)

Assim, a transformação integral de probabilidade assegura que Yi distribui-se de forma

Fi. De…nindo as variáveis aleatórias U1 e U2 como Ui Fi(Yi), então Ui distribui-se

uniformemente no intervalo unitário(0;1). Vale ressaltar que a recíproca também é válida,

i.e. seUi U nif orme(0;1)então paraYi Fi (Ui), temos Yi Fi.

2_{A inversa generalizada}

F é a função inversa F 1_{, quando}

(27)

3.2 Teorema de Sklar

Como já mencionado, a estrutura de dependência entre as variáveis de um vetor é

completamente descrita por sua distribuição conjunta. A abordagem por cópulas permite

o isolamento das distribuições marginais de cada variável e de mais uma estrutura de

de-pendência, a partir da distribuição conjunta. Tal separação está assegurada por meio de

um dos mais importantes pilares que fundamentam esta teoria, conhecido como Teorema

de Sklar. Pelo Teorema de Sklar (1959), é possível obter a distribuição conjunta de um

vetor de variáveis a partir da função cópula e das transformações das variáveis em suas

respectivas distribuições marginais uniformes, como segue:

F(y1; y2) =P(Y1 y1; Y2 y2)

=P(U1 F1(y1); U2 F2(y2))

=C(F1(y1); F2(y2))

(3.3)

Para uma melhor visualização da separação da estrutura de dependência e das

distribuições marginais, convém apresentar uma versão do Teorema de Sklar em termos de

funções de densidade de probabilidade.

Sejaf a função de densidade conjunta das variáveisY1 eY2;efi, suas respectivas

funções de densidade marginais, por de…nição:

f(y1; y2) =

@F(y1; y2) @y1@y2

Como foi visto, pelo Teorema de Sklar,F(y1; y2) =C(F1(y1); F2(y2))e, portanto:

f(y1; y2) =

(28)

Utilizando a regra da cadeia e substituindou1 por Fi(yi)para i= 1;2;tem se que

f(y1; y2) = @C_@y(1u1@y;u22)f1(y1)f2(y2)

=c(u1; u2)f1(y1)f2(y2)

(3.4)

onde c( ) é a função de densidade cópula3_{. Pela representação acima, sob a hipótese}

de independência entre as variáveis que compõem a distribuição conjunta, infere-se que

c(u1; u2) = 1 e, portanto,f(y1; y2) =f1(y1)f2(y2).

Assim, a função cópula contém informações, sobre a distribuição conjunta, que não

estão presentes nas distribuições marginais. Ao converter-se, por meio da transformação

quantílica, as variáveisY1 eY2 em variáveis uniformes, a informação das distribuições

mar-ginais será …ltrada, posto que U1 e U2 serão uniformes (0;1), independente de F1 e F2.

Segundo Patton (2002), por essa razão a função cópula também é conhecida como função

de dependência.

3.3 Funções cópulas

Essa seção apresenta de maneira sucinta alguns tipos de funções cópulas. Antes,

porém serão exibidos dois exemplos para obtenção das funções cópulas a partir do método

de …ltragem das informações das distribuições marginais.

Através da própria de…nição da função cópula C( ), como uma distribuição

con-junta com marginais uniformes, pelo Teorema de Sklar tem-se que,

C(u1; u2) =F F1 1(u1); F2 1(u2) (3.5)

(29)

A partir dessa equivalente representação do Teorema de Sklar, é possível obter-se a função

cópula dada uma distribuição conjunta.

Supondo Y1 e Y2 duas variáveis aleatórias que distribuem-se conjuntamente como

uma distribuição logística (Gumbel) bivariada,

F(y1; y2) = 1 +e y1 +e y2 1

Como foi visto, equação 3.1, as distribuições marginais podem ser obtidas por meio de

Fj(yj) = limyi!1F(y1; y2), para i =6 j e, portanto, Fi(yi) = (1 +e yi) para i = 1;2.

Assim, pela transformação quantílica, u1 =F1(y1) e u2 =F2(y2). As funções inversas são

dadas porF_i 1(ui) = log ui 1 1 parai= 1;2. Em vista disso e, através da distribuição

conjuntaF(y1; y2)e das funções inversasF₁ 1(u1)eF₂ 1(u2), é possível determinar a função

cópula logística (Gumbel) bivariada, pela equação 3.5, onde

C(u1; u2) =F F1 1(u1); F2 1(u2)

= u1u2

u1+u2 u1u2

O mesmo princípio pode ser aplicado para determinar a função cópulagaussiana.

Supondo Y1 e Y2 duas variáveis que se distribuem conjuntamente como uma distribuição

gaussiana bivariada, com coe…ciente de correlação linear ,i.e.

F(y1; y2) = (y1; y2)

As distribuições marginais serão distribuições gaussianas univariadas, i.e. F1(y1) = (y1)

eF2(y2) = (y2). Assim, pela transformação quantílica,y1 = 1(u1) ey2 = 1(u2). A

representação da cópula gaussiana é dada por

CG(u1; u2) =F F₁ 1(u1); F₂ 1(u2)

= 1₍_u

(30)

A cópula gaussiana é, portanto, a função de dependência associada a uma normal

bivariada, e embora não possua uma fórmula fechada, sua forma funcional é dada por

CG(u1; u2j ) =

Z 1₍_u

1)

1

Z 1₍_u

2)

1

2 p1 2exp

(

s2 2 st+t2

2 (1 2₎

)

dsdt (3.6)

onde 2( 1;+1). Assim à medida que o coe…ciente de correlação linear se aproxima dos limites de seu domínio, a dispersão das variáveis uniformes u1 e u2 no quadrado unitário

diminui. A Figura 3.1 apresenta diferentes distribuições conjuntas construídas a partir de

marginais normais padrão e a cópula gaussiana.

Outro exemplo de função cópula é a Joe-Clayton, também conhecida como cópula

BB7 de Joe (1997). Essa função cópula é construída a partir da transformação de Laplace

da cópula Clayton, e sua especi…cação é dada por

CJC(u1; u2j ; ) = 1 1

n

[1 (1 u1) ] + [1 (1 u2) ] 1

o 1 1

(3.7)

onde 1e >0. Dentre as propriedades dessa função cópula, destaca-se que ela converge para a cópula Clayton4_para _{= 1}_{, e para} _{! 1}_ou _{! 1}_{a função}_C

JC atinge a fronteira

superior de Fr·echet-Hoe¤ding5_{. Outra propriedade útil dessa função é o fato de que} _e

são diretamente relacionados com as medidas de dependência de cauda, que captam o

comportamento de variáveis aleatórias durante eventos extremos. O comportamento de

e sobre a distribuição conjunta, construída a partir de marginais normais-padrão, é

apresentado na Figura 3.2.

Nota-se que, para ambas funções cópulas, o efeito de diferentes valores do(s)

parâmetro(s) de dependência sobre a distribuição das variáveis uniformes no quadrado

4_{A cópula Clayton é de…na como}

CC(u1; u2j ) = u1 +u2 1 1=

(31)

0 1 1

-2 0 2

ρ= 0.9

0 1

1

-2 0 2

ρ= 0.5

0 1

1

-2 0 2

ρ= 0.2

(32)

unitário. No caso de dependência positiva, quanto maior a direção do parâmetro para

a dependência entre as variáveis, mais próximo o par(u1; u2)estará da diagonal principal.

3.4 Copulas

especiais

Um importante resultado na teoria de cópulas, conhecido como Fronteiras de

Fr·echet-Hoe¤ding, garante que toda função cópula possui uma fronteira inferior e

supe-rior, que são aqui denotadas por C e C+_{, respectivamente. O resultado permite para}

qualquer ponto (u1; u2)2[0;1]2, que

C (u1; u2) C(u1; u2) C+(u1; u2) (3.8)

ondeC (u1; u2) = max [u1+u2 1;0]eC+(u1; u2) = min [u1; u2]. O conhecimento dessas

fronteiras é importantíssimo na escolha da função cópula. Segundo Trivedi e Zimmer (2007),

uma propriedade desejável de uma cópula é que esta cubra todo o espaço amostral entre os

limites superior e inferior, de modo a permitir, à medida que o parâmetro de C(u1; u2) se

aproxime do limite inferior (superior) de seu domínio, que a função cópula se aproxime da

fronteira inferior (superior). Entretanto, devido às suas formas funcionais, algumas funções

cópulas apresentam restrições que as impedem de alcançar uma ou ambas as fronteiras.

Outra cópula merecedora de destaque é a cópula produto, denotada por C?. A

cópula produto é o resultado obtido quando as distribuições marginais são independentes.

Sua forma funcional é dada porC?=u1u2. Nota-se que sua respectiva função de densidade

(33)

0 1 1

-2 0 2

κ= 2,γ= 1

0 1

1

-2 0 2

κ= 1.42,γ= 0.47

0 1

1

-2 0 2

κ= 1,γ= 7

(34)

Uma função cópula que incluaC ,C+_e_C?_{é chamada de}_{compreensiva. A Figura}

3.3 apresenta a distribuição conjunta das três cópulas.

Por …m, vale ainda mencionar a função cópula sobrevida Cb(u1; u2). A função

sobrevida de uma distribuição bivariadaF(y1; y2) é denotada porF(y1; y2) e implica em

F(y1; y2) =P(Y1 > y1; Y2 > y2) (3.9)

Em …nanças, não é raro o interesse sobre o tempo remanescente de um instrumento

…nanceiro, como exemplo, na administração de risco de crédito, a modelagem do tempo para

o default de uma cesta de crédito.

Supondo, pelo Teorema de Sklar, a função cópula implícita emF(y1; y2) dada por C( ), então

F(y1; y2) =P(Y1 y1; Y2 y2)

= 1 P(Y1 > y1; Y2 > y2)

= 1 F1(y1) F2(y2) +F(y1; y2)

u₂

u₁

C−

0

1 1

u₂

u₁

C+

0

1 1

u₁

u₂

C⊥

0

1 1

(35)

Assim, é possível representar F(y1; y2) por

F(y1; y2) =F1(y1) +F2(y2) 1 +C(F1(y1); F2(y2))

=F1(y1) +F2(y2) 1 +C 1 F1(y1);1 F2(y2)

A função cópulasobrevidaCbda funçãoF(y1; y2)pode ser obtida a partir da “representação”

sobrevida do Teorema Sklar, onde F(y1; y2) =C Fb 1(y1); F2(y2) e

b

C(u1; u2) =u1+u2 1 +C(1 u1;1 u2)

De acordo com Nelsen (2006), a cópula sobrevida não deve ser confundida com uma

dis-tribuição conjunta sobrevida C para duas variáveis uniforme u1 e u2, cuja distribuição é

uma cópulaC,i.e.

C(u1; u2) =F(u1; u2)

=P(U1> u1; U2 > u2)

A relação entre as cópulas C e Cb é dada por C(u1; u2) = Cb(1 u1;1 u2). A

função C é utilizada quando se deseja “inverter” a direção da função cópula e, portanto, inverter a relação de dependência da distribuição.

3.5 Métodos de estimação

Esta seção apresenta as principais abordagens presentes na referente literatura

para se estimar os parâmetros da função cópula. A principal metodologia de estimação

utilizada é o método da máxima verossimilhança (ML). Dentre as principais propriedades

do estimador de máxima verossimilhança, encontram-se a consistência, e…ciência assintótica

(36)

Um método alternativo, porém não muito utilizado na prática, é a estimação

dos parâmetros a partir do método de momentos generalizados (GMM). Tal método, não

necessita de hipóteses explícitas sobre as distribuições dos erros, contudo requer as condições

de momentos6_.

Sob o princípio da máxima verossimilhança, a estimação pode ser feita por meio

de três abordagens distintas: MVE (Máxima Verossimilhança Exata), IM (Inferência para

as Marginais) e MVC (Máxima Verossimilhança Canônica).

3.5.1 Máxima Verossimilhança Exata

Seja fy1;t; y2;tgT_t₌₁ uma amostra aleatória de duas variáveis de interesse com T

observações. Pelo Teorema de Sklar, a distribuição conjunta dessas variáveis é descrita por

C(F1(y1;t); F2(y2;t)). A função log-verossimilhança é obtida a partir da equação 3.4 e dada

por

L( ) =

T

X

t=1

lnc(F1(y1;t); F2(y2;t)j c) + T

X

t=1

lnf1(y1;tj 1) +

T

X

t=1

lnf2(y2;tj 2) (3.10)

onde, é um vetor de parâmetros que inclui os parâmetros da cópula e das distribuições

marginais. O estimador MV –b_{M V E} – é determinado por

b_{M V E} = arg max

2 L

( )

Por onde é possível mostrar, Davidson e MacKinnon (1993), que sob certas condições de

reg-ularidades o estimador é consistente, assintoticamente e…ciente e assintoticamente normal,

i.e.

p

T bM V E 0 ! N 0;I 1( 0)

(37)

onde, I( 0) é a matrix de informação de Fisher e 0 o verdadeiro valor do parâmetro.

Visto isso, a abordagem MVE segue o mesmo princípio do método de máxima

verossimilhança, ou seja, os parâmetros das distribuições marginais e da função cópula são

estimados conjuntamente. Uma desvantagem, apontada por Bouyé et al. (2000) e

Pat-ton (2002), …ca evidente ao utilizar-se a abordagem MVE para distribuições com grandes

dimensões. O método torna-se computacionalmente intensivo, uma vez que a

maximiza-ção é feita numericamente – não há solumaximiza-ção analítica para a maximizamaximiza-ção da funmaximiza-ção

log-verossimilhança. Outra desvantagem da abordagem MVE se deve ao fato de que os

parâmet-ros da cópula são estimados sob hipóteses acerca das distribuições das marginais.

3.5.2 Inferência para as Marginais

A abordagem IM, proposta por Joe (1997), tem como princípio a própria teoria de

cópulas. Nessa abordagem há uma separação do vetor de parâmetros em parâmetros

es-pecí…cos para as distribuições marginais( 1 e 2)e em parâmetros comuns para a estrutura

de dependência ( c).

Da equação 3.10, a função log-verossimilhança é dada por

L( ) =

T

X

t=1

lnc(F1(y1;t); F2(y2;t)j c) + T

X

t=1

lnf1(y1;tj 1) +

T

X

t=1

lnf2(y2;tj 2)

Sendo a função log-verossimilhança composta por dois termos aditivos, um envolvendo a

função de densidade da cópula e outro envolvendo a função de densidade das marginais, a

estimação de é feita em dois estágios:

Estimação dos parâmetros das distribuições marginais,i.e.

b_i= arg max

i2

T

P

t=1

(38)

Estimação dos parâmetros da função cópula, condicionada nas estimativas obtidas

para as marginais, i.e.

b_c = arg max

c2

T

X

t=1

lnc F1 y1;tjb1 ; F2 y2;tjb2 j c

Assim, o estimador de máxima verossimilhança na abordagem IMF é dado por

b_IM = b1,b2,bc , onde bc=f b1,b2 . É possível demonstrar que esse estimador é também

consistente, assintoticamente e…ciente e assintoticamente normal,i.e.

p

T b 0 ! N 0;V 1( 0)

onde V 1( 0) é a inversa da matriz de informação de Godambe7, construída a partir da

funçãoscore da função log-verossimilhança.

3.5.3 Máxima Verossimilhança Canônica

Diferentemente das abordagens EML e IMF, a abordagem CML não depende de

hipóteses sobre as distribuições das marginais para estimar os parâmetros c da função

cópula. A transformação das observações (y1;t; y2;t) em variáveis uniformes (u1;t; u2;t) é

feita utilizando-se as funções de distribuições empíricas FT

j (y), onde

F_jT (y) = 1

T+ 1

T

X

t=1

I(Yj;t y) (3.11)

ondeI( )é uma função indicadora. Após tal transformação, os parâmetros da função cópula

são determinados por

b_c = arg max

c2

T

X

t=1

lnc(u_b1;t;ub2;tj c)

(39)

O estimador para c é chamado de estimador Omnibus8. A matrix de informação de

Go-dambe ou a matriz de covariância semi-paramétrica, dada em Genestet al. (1995), podem

ser usadas para inferência. De acordo com Genest et al. (1995), b_{M V C} é consistente, assintoticamente e…ciente e assintoticamente normal.

3.6 Exemplo ilustrativo

Para …nalizar esse capítulo vale apresentar, através de um exemplo, a grande

‡ex-ibilidade que a teoria de cópulas nos fornece para a modelagem de distribuições conjuntas.

A Figura 3.4 apresenta diversas distribuições bivariadas construídas com distribuições

mar-ginais normais-padrão e com diferentes especi…cações de funções cópulas, calibradas de

modo a representar uma distribuição conjunta com coe…ciente de correlação linear igual a

0.5.

Pode-se claramente observar que o conhecimento das distribuições marginais

nor-mais e do coe…ciente de correlação linear não é su…ciente para descrever uma distribuição

conjunta9_{. Por exemplo, no caso da distribuição gerada a partir de uma cópula Clayton,}

observa-se uma disposição das observações mais “a…ada” no quadrante negativo, indicando

uma maior dependência para eventos conjuntamente negativos do que positivos. Por outro

lado, a distribuição gerada a partir de uma cópula Gumbel, apresenta essa mesma

dis-posição “a…ada”, no quadrante positivo direito, evidenciando uma maior associação para

eventos conjuntamente positivos. A distribuição gerada por uma cópula t-student apre-8_{Ou pseudo estimador de verossimilhança.}

(40)

0 -2.5

0.0 2.5

Copula Normal,ρ= 0.5

0.0185 0.037 0.0555 0.074 0.0925 0.111 0.1295 0.148 0.1665 0.0185 0.037 0.05550.0740.0925 0.1110.12950.148 0.1665 0.0185 0.037 0.0555 0.074 0.0925 0.111 0.1295 0.148 0.1665 0.0185 0.037 0.0555 0.074 0.0925 0.111 0.1295 0.148 0.1665 0 -2.5 0.0 2.5

Copulat-student,ρ= 0.5,ν= 3

0.022 0.044 0.066 0.088 0.11 0.132 0.154 0.176 0.198 0.022 0.044 0.066 0.088 0.11 0.1320.154 0.1760.198 0.022 0.044 0.066 0.088 0.11 0.132 0.154 0.176 0.198 0.022 0.044 0.066 0.088 0.11 0.132 0.154 0.176 0.198 0 -2.5 0.0 2.5

Copula Clayton,θ= 1

0.019 0.038 0.057 0.076 0.095 0.114 0.133 0.152 0.171 0.019 0.038 0.057 0.0760.095 0.1140.1330.152 0.171 0.019 0.038 0.057 0.076 0.095 0.114 0.133 0.152 0.171 0.019 0.038 0.057 0.076 0.095 0.114 0.133 0.152 0.171 0 -2.5 0.0 2.5

Copula Gumbel,δ= 1.5

0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0.0195 0.039 0.05850.078 0.0975 0.1170.1365 0.1560.1755 0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0 -2.5 0.0 2.5

Copula Joe-Clayton,κ= 1.42,γ= 0.47

0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0.0195 0.039 0.0585 0.0780.09750.117 0.1365 0.156 0.1755 0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0.0195 0.039 0.0585 0.078 0.0975 0.117 0.1365 0.156 0.1755 0 -2.5 0.0 2.5

Copula Plackett,ψ= 5

0.0215 0.043 0.0645 0.086 0.1075 0.129 0.1505 0.172 0.1935 0.0215 0.043 0.06450.0860.10750.1290.15050.1720.1935 0.0215 0.043 0.0645 0.086 0.1075 0.129 0.1505 0.172 0.1935 0.0215 0.043 0.0645 0.086 0.1075 0.129 0.1505 0.172 0.1935

(41)

Tabela 3.1: Medidas de dependência para distribuições conjuntas obtidas a partir das funções copulas e de distribuições marginaisN(0,1)

Dependência Dependência

Correlação da Cauda Quantílica (5%)

cópula Parâmetros Linear Superior Inferior Superior Inferior

Gaussiana( ) 0.5 0.50 0.00 0.00 0.24 0.24

t-student( ; ) 0.5 3 0.50* 0.31 0.31 0.37* 0.37*

Clayton ( ) 1 0.50* 0.00 0.50 0.10 0.51

Gumbel ( ) 1.5 0.50* 0.41 0.00 0.44 0.17

Joe Clayton ( ; ) 1.42 0.47 0.50* 0.37 0.23 0.38 0.32

Plackett( ) 5 0.50 0.00 0.00 0.18 0.18

Obs: Valores com * foram baseados nas simulações feitas em Patton (2002) e (2009).

senta contornos "a…ados"nos quadrantes positivos e negativos, indicando uma simetria de

dependência para eventos conjuntamente negativos e positivos.

Embora as distribuições conjuntas apresentem um coe…ciente de correlação linear

igual a 0.5, pode-se notar pela Tabela 3.1 que a estrutura de dependência em cada função

cópula, carrega medidas de dependência10 _{com valores distintos uns dos outros. Como}

exemplo, pode-se notar que a cópula Normal não apresenta dependência da cauda inferior e

posterior e as dependências quantílicas são iguais em ambas as caudas. Já a cópula Gumbel,

apresenta dependência na cauda superior e dependência quantílica assimétrica.

(42)

Capítulo 4

Medidas de Dependência

Esta seção introduz de…nições e propriedades acerca das medidas de associação

utilizadas no presente trabalho. Antes, porém, são exibidas algumas propriedades básicas

que uma medida deve atender para medir adequadamente a associação entre quaisquer duas

variáveis aleatórias.

Em Nelsen (2006), é possível encontrar duas métricas de associação que de…nem

duas classes de medidas: a métrica da concordância ( ) e a métrica dadependência ( ). O

autor lista uma série de propriedades que uma medida deve atender para pertencer a cada

uma das métricas. O conceito de concordância é a mais básica de…nição de associação entre

duas variáveis aleatórias. Sejam(x1; y1) e (x2; y2), dois pares de observações das variáveis

aleatórias contínuas X e Y. Os pares são

Concordantes, se(x1 x2) (y1 y2)>0

Discordantes, se(x1 x2) (y1 y2)<0

(43)

análoga, a discordância implica que x1 x2 e y1 y2 possuem sinais opostos.

Uma diferença entre as medidas de dependência e as medidas de concordância é

dada no intervalo na qual elas estão de…nidas, onde ( )₂[ 1;+1]e ( )₂[0;+1]. Nota-se que essa propriedade permite que as medidas de concordância indiquem qual a “direção” da

associação entre as variáveis. Já as medidas de dependência apenas mostram se as variáveis

são funcionalmente dependentes ou não.

Outra característica marcante que distingue as medidas de concordância das

medi-das de dependência é a falta de reciprocidade entre a (in)dependência medi-das variáveis aleatórias

e a medida ser nula. Uma medida de concordância é igual a 1ou +1se as duas variáveis

forem perfeitamente dependentes e igual a zero se elas forem independentes. Entretanto,

o inverso não será necessariamente verdadeiro, i.e. ( ) = 1, 1, ou 0 não implica

var-iáveis perfeitamente dependentes ou independentes. Em outras palavras, independência e

dependência perfeita são condições su…cientes, porém não necessárias, para que a medida de

concordância seja igual a 1,1ou0. Por outro lado, nas medidas de dependência a recíproca

é legítima,i.e. a medida será nula se e somente se as variáveis forem independentes.

Em Embrechts et al. (2002), são listadas algumas propriedades, consideradas

pelos autores, necessárias à uma medida para que esta possa medir de forma adequada a

associação entre variáveis aleatórias. Seja ( ) uma medida de dependência1 _{que designa}

um número real para qualquer par de variáveis aleatórias então, de acordo com os autores,

as propriedades desejáveis dessa medida são:

i. (Y1; Y2) = (Y2; Y1) (simetria)

(44)

ii. 1 (Y1; Y2) +1 (normalização)

iii. (Y1; Y2) = +1,Y1,Y2 são co-monotônicas

(Y1; Y2) = 1,Y1,Y2 são contra-monotônicas2

iv. ParaT :R!Ruma transformação estritamente monotônica no domínio de Y:

(Y1; Y2) =

8 > > < > > :

(T(Y1); Y2), paraT crescente

(T(Y1); Y2), paraT decrescente

Fica evidenciado que o índice de correlação linear satisfaz apenas as propriedades

i e ii. As medidas obtidas a partir das correlações de posto satisfazem as propriedades i a

iv, se as variáveis forem contínuas. Os autores frisam que as propriedades acima são apenas

uma seleção e a lista pode ser alterada e/ou estendida. Como exemplo de extensão, eles

adicionam a propriedade referente à independência: (Y1; Y2) = 0 $ Y1; Y2 são

indepen-dentes. Entretanto, pode-se mostrar que essa adição contradiz a propriedade iv, de não

alteração da medida sobre transformações monotônicas. Como foi apresentado no capítulo

3, a metodologia de cópulas permite decompor a distribuição em uma estrutura composta

pelas distribuições marginais e uma estrutura exclusiva para as relações de dependência

en-tre as variáveis pertencentes à distribuição multivariada. Sendo assim e como indicado logo

abaixo, muitas das medidas de associação podem ser determinadas diretamente a partir da

função cópulaC.

Dentre as medidas de concordância, destacam-se a correlação de Spearman e o tau

de Kendall. Ambas são medidas de correlação entre os postos (ranking) das variáveis, ao

2_{Duas variáveis serão co-monotônicas (}_i.e. _{terão dependência positiva perfeita), se elas possuem a copula}

C+ _{e serão contra-monotônicas (}_i.e. _{dependência negativa perfeita)se elas possuírem a copula}

(45)

invés de seus valores efetivos e, por isso, são também conhecidas como correlações de posto

(rank correlation). Conseqüentemente, tais medidas não são alteradas por transformações

crescentes entre as variáveis. Como pode ser visto abaixo, a correlação de Pearson, mais

conhecida como coe…ciente de correlação linear, é uma medida de concordância aplicável

apenas a variáveis que possuam distribuições elípticas3_{. Dentre as medidas de dependência,}

destacam-se a dependência quantílica e a dependência de caudas.

4.1 Correlação de Pearson (coe…ciente de correlação linear)

O coe…ciente de correlação linear é freqüentemente usado como medida de

de-pendência entre duas variáveis. Seja Y1 e Y2, duas variáveis aleatórias com variâncias

…nitas e não nulas, a correlação entre elas é de…nida por

= _p Cov(Y1; Y2)

var(Y1)pvar(Y2)

(4.1)

onde,Cov(Y1; Y2) =E(Y1Y2) E(Y1)E(Y2). O estimador amostral da correlação de

Pear-son é obtido a partir das contrapartidas amostrais da covariância e variância das variáveis

aleatórias.

A medida de Pearson, embora possa ser escrita a partir das funções cópulas, ela

terá o seu valor como função do tipo de distribuição marginal, pois

cov(Y1; Y2) =

Z Z

D

(F(y1; y2) F1(y1)F2(y2))dy1dy2

=

Z 1

0

Z 1

0

(C(u1; u2) u1u2)dF1 1(u1)dF2 1(u2)

ondeD é o domínio em que Y1 eY2 são de…nidas.

(46)

Embora o coe…ciente de correlação linear seja a medida mais popular utilizada

para medir a associação entre duas variáveis, ele apresenta várias de…ciências. Além disso,

as variáveis precisam atender a uma série de requisitos para que o coe…ciente de correlação

linear seja de fato uma medida de concordância. O estudo de Embrechtset al. (2002) relata

com maiores detalhes sobre a de…ciência do coe…ciente. Dentre suas limitações, os autores

citam:

A variância de ambas as variáveis deve ser …nita para que o coe…ciente seja de…nido.

Conseqüentemente, o estimador não é apropriado para medir dependência em

dis-tribuições com cauda pesadas4_.

Correlação nula não implica independência, a não ser que o par (X; Y) se distribua

como uma normal bivariada. Nesse caso o coe…ciente de correlação linear é

represen-tativo da estrutura de dependência da distribuição.

Correlação não é invariante sob todas as transformações crescentes das variáveis, mas

somente sob as lineares, i.e. (aX+b; cY +d) = sign(a c) (X; Y). Um exemplo

de transformação estritamente crescente não válida é a transformação logarítmica,i.e.

log (X) e log (Y) terão, geralmente, correlação diferente deX,Y.

Dependência perfeita positiva ou negativa entre as variáveis não implica,

necessari-amente, que o valor numérico do coe…ciente é igual a 1 ou 1. O exemplo clássico

encontrado nos livros textos de estatísticas é X; X2 _{= 0}_{, mesmo que}_X_e_X2_sejam

perfeitamente dependentes.

(47)

4.2 Correlação de Spearman

A correlação de Spearman é uma medida não-paramétrica de associação baseada

em dados ordenados (ranked). Sejam(X1; Y1),(X2; Y2) e(X3; Y3)três pares independentes

de variáveis aleatórias com uma função de distribuição comum. A correlação de Spearman

( _S) é de…nida como uma proporção da diferença entre a probabilidade de concordância e a probabilidade de discordância entre os pares(X1; Y1) e (X2; Y3),i.e.

S = 3 (P[(X1 X2) (Y1 Y3)>0] P[(X1 X2) (Y1 Y3)<0]) (4.2)

Como foi dito antes, as medidas de associações podem ser diretamente obtidas a

partir das funções cópulas e, no caso da correlação de Spearman, sua representação …ca

como segue:

S= 12

Z 1

0

Z 1

0

u1u2dC(u1; u2) 3 (4.3)

Nota-se que a integral acima é apenas o valor esperado do produto de duas variáveis

uni-formes em (0;1), cuja distribuição conjunta é dada pela cópula C e, portanto, pode ser reescrita como

S = 12 E(U1U2) 3

= E(U1U2) 1=4

1=12 =

E_p(U1U2) E(U1)E(U2)

var(U1)

p

var(U2)

onde a última igualdade deve-se ao fato de que E(U) = 1₂ e var(U) = ₁₂1. Nota-se, assim,

que a sua forma é idêntica à da correlação linear, o que justi…ca inclusive o seu nome.

O estimador da correlação de Spearman é dado por

bS=

12

n(n2 ₁₎

n

X

i=1

posto(xi)

n+ 1

2 posto(yi)

n+ 1

(48)

onde o posto (rank) de uma observação representa sua posição em uma amostra ordenada.

Outra fórmula representativa do estimador da correlação de Spearman é obtida utilizando

di=posto(xi) posto(yi), onde

bS = 1

6 Pn_i₌₁d2_i n(n2 ₁₎

onde bS é um estimador viesado de S, porém, pode-se mostrar que, Balakrishnan e Lai

(2009),

E(_b_S) = (n 2) S+ 3 K

(n 1) ! S, paran! 1

onde K é o tau de Kendall (de…nido na próxima seção).

4.3 Tau de Kendall

O tau de Kendall também é uma medida de correlação de posto. Sejam (X1; Y1) e

(X2; Y2)dois pares de variáveis aleatórias identicamente e independentemente distribuídas,

o tau de Kendall K entre as variáveis é de…nido pela diferença entre a probabilidade de

concordância e a probabilidade de discordância entre os pares(X1; Y1) e (X2; Y2),i.e.

K =P[(X1 X2) (Y1 Y2)>0] P[(X1 X2) (Y1 Y2)<0] (4.5)

A de…nição de K acima é equivalente a K =cov[sign(X1 X2); sign(Y1 Y2)]5, e sua

representação em termos da função cópulaC é dada por

K = 4

Z 1

0

Z 1

0

C(u1; u2)dC(u1; u2) 1 (4.6)

PorR1 0

R1

0 C(u1; u2)dC(u1; u2)ser equivalente a

R1

0

R1

0 C(u1; u2)c(u1; u2)du1du2, a expressão

4.6 pode ser representada por K= 4 E[C(U1; U2)] 1.

5_{A função}

(49)

Dada uma amostra, com tamanho n, de duas variáveis aleatórias X e Y, seja c o número de pares concordantes edo número de pares discordantes, o estimador amostral do tau de Kendall é dado por

bK =

c d c+d =

c d

n

2

= 2

n(n 1)

X

i<j

sign[(Xi Xj) (Yi Yj)] (4.7)

Diferentemente do estimador da correlação de Spearman, bK é um estimador não

viesado de K. Segundo Balakrishnan e Lai (2009), bK e bS são, relativamente ao b,

estimadores menos sensíveis à presença de outliers.

Embora sejam K e S medidas de probabilidades de concordância e

discordân-cia entre as variáveis aleatórias, dada uma distribuição, seus valores numéricos podem ser

freqüentemente diferentes. Ainda, de acordo com Balakrishnan e Lai (2009), há vários

ex-emplos indicando que uma relação precisa entre as duas medidas não existe para qualquer

distribuição bivariada. Porém é possível obter limites entre as duas medidas, como segue

3 K 1

2 S

1+2 K 2_K

2 , para K 0

2

K+2 K 1

2 S 1 32 K, para K <0

De acordo com Gibbons (1993), a vantagem do tau de Kendall sobre a correlação

de Spearman reside na sua simples interpretação como a diferença, na amostra, entre a

proporção de pares concordantes e pares discordantes. Embora ambas medidas K e S

meçam o grau de associação entre variáveis, a de…nição da correlação de Spearman não

explicita, claramente, qual o tipo de associação entre as variáveis. O autor ainda destaca

que, mesmo que = _S = K = 0:5, o valor 0:5 deve ser intrepretado de três maneiras

(50)

4.4 Dependência quantílica

A dependência quantílica está relacionada à medida de Coles et al. (1999) e mede

a probabilidade de duas variáveis estarem ambas abaixo ou acima de um terminado quantil

de suas distribuições univariadas, i.e. sendo " o limiar inferior e "+ o limiar superior, a

dependência quantílica superior e inferior entre as duas variáveis é dada por

("+) =P Y1 > F1 1("+)jY2 > F2 1("+)

(" ) =P Y1 F1 1(" )jY2 F2 1(" )

(4.8)

Pela equação 4.8, percebe-se que a dependência quantílica é uma medida

direta-mente associada ao conceito econômico de Valor em Risco (VaR) e pode ser representada

equivalentemente por

("+) =P[Y1 > V aRY1("+)jY2 > V aRY2("+)]

(" ) =P[Y1 V aRY1(" )jY2 V aRY2(" )]

ou seja, a dependência quantílica é representada como a probabilidade de ambas as variáveis

ultrapassarem seus valores em risco.

Pela transformação de probabilidade integral é possível obter a representação da

medida em termos da função cópulaC, onde

(u) =

8 > > < > > :

P(U1 > ujU2 > u) =

b

C(u;u)

u =

1 2u+C(u;u)

1 u , parau >1=2

P(U1 ujU2 u) = C(u;u_u ), parau 1=2

4.5 Dependência das caudas

Diferentemente das outras medidas apresentadas até agora, a medida de

(51)

bi-variadas. Sendo U1, U2 duas variáveis aleatórias distribuídas uniformemente no intervalo

unitário (0;1) a dependência das caudas é de…nida como o limite das dependências quan-tílicas, com o limiarudirecionando-se aos extremos zero (no caso de dependência da cauda

inferior) ou 1 (dependência da cauda superior),i.e.

U _{= lim}

u!1 P(U1 > ujU2 > u) = limu!1 P(U2> ujU1> u)

L_{= lim}

u!0+P(U1 ujU2 u) = lim_u_!₀+P(U2 ujU1 u)

(4.9)

Do mesmo modo apresentado até agora para as demais medidas, U _e L_{podem ser obtidas}

diretamente a partir da função cópulaC, onde:

U _{= lim}

u!1

C(u;u)

1 u = lim_u_!₁

1 2u+C(u;u) 1 u

L_{= lim}

u!0+

C(u;u)

u

Assim se U ₂₍₀_;_1]_{então a cópula} _C _{apresenta dependência na cauda superior e}

C não terá dependência na cauda superior se U = 0. Similarmente, se L2(0;1], a cópula

C possui dependência na cauda inferior e para L _{= 0}_{, a cópula} _C _{não tem dependência}

na cauda inferior. Portanto, sempre que U_, L₂₍₀_;_1]_{, as variáveis aleatórias}_Y

1 e Y2 são

assintoticamente dependentes nas caudas superior e inferior. No caso em que U_, L _{= 0}_,

as variáveis são assintoticamente independentes nas caudas superior e inferior.

4.6 Outras medidas de associação

Entre outras medidas que merecem destaque e possuem aplicabilidade na

mode-lagem …nanceira estão o índice de Gini, a Dependência do Quadrante Positivo (DQP) e o

(52)

O índice de Gini de duas variáveis aleatórias, cuja função cópula éC, é dado por

= 2

Z 1

0

Z 1

0

(ju1+u2 1j ju1 u2j)dC(u1; u2) (4.10)

O índice de Gini é, do mesmo modo que o tau de Kendall e a correlação de Spearman, uma

medida de associação baseada na métrica da concordância. O trabalho de Sun e Wu (2009)

usa uma versão condicional do índice como medida de dependência entre o índice S&P500

e o VIX6_.

O beta de Blomqvist também é uma medida de associação que segue a métrica

da concordância e avalia a dependência no centro da distribuição, dado pelas medianas das

distribuições marginais. Por essa razão o beta de Blomqvist também é conhecido como

o coe…ciente de correlação mediana. Assim, sendo (y_e1;ye2) as medianas de duas variáveis

aleatórias, o índice de dependência é dado por

= 2P[(Y1 ye1) (Y2 ye2)>0] 1 = 4C

1 2;

1

2 1 (4.11)

Pode-se notar que, no caso de independência, C( ) =C?( ) = u1u2 e, portanto,

= 0 seY1 e Y2 forem independentes. O beta de Blomqvist, por medir a dependência em

torno da mediana e por esta última ser uma medida de locação mais robusta à presença

de outliers, é também utilizado para modelagem …nanceira. O trabalho de Harvey (2008)

utiliza, além da dependência de cauda, o beta de Blomqvist para detectar a presença de

contágio …nanceiro entre os mercados de Hong Kong e da Coreia do Sul, durante o ataque

especulativo de 1997.

Por …m, destaca-se a Dependência do Quadrante Positivo (DQP), uma associação

(53)

uma medida de dependência. SejamY1eY2duas variáveis aleatórias, elas serão dependentes

no quadrante positivo, se

P(Y1 > y1; Y2 > y2) P(Y1 > y1)P(Y2> y2) (4.12)

o que, em termos da função cópula, é representada por C C?_{. Assim se as variáveis}

aleatórias representam perdas …nanceiras, a dependência do quadrante positivo implicará

em uma perda simultânea maior sob dependência entre as variáveis do que sob variáveis

independentes. Se as variáveis se distribuem de acordo com uma distribuição F( ), então a DQP implica que

F(y1; y2) F1(y1)F2(y2) para todo (y1; y2)2R2

PeloTeorema de Bayes, a desigualdade da DQP implica emP(Y1 y1jY2 y2) P(Y1 y1),

ou equivalentemente, P(Y2 y2jY1 y1) P(Y2 y2). O trabalho de Mendes (2005)

uti-liza uma variação desta última desigualdade para analisar a presença de contágio entre sete

principais índices de mercados no mundo.

Para …nalizar a seção, vale frisar que embora o termo dependência, visto em Nelsen

(2006), envolva um conceito fechado, com propriedades especí…cas, ele é usado no presente

(54)

Capítulo 5

Cópulas

condicionais

Esta seção tem como objetivo fazer a conexão entre as teorias de contágio

…nan-ceiro e a de cópulas, i.e. como se faz possível a modelagem de contágio com cópulas. A

aplicação de cópulas para séries de tempo possui duas abordagens distintas: uma delas se

concentra na cópula de uma seqüencia de observações de série de tempo univariada, e.g. na

distribuição conjunta de (Yt; Yt+1; :::; Yt+n) para capturar eventuais dependências entre as

observações de uma mesma série. Essa abordagem nos leva a considerar modelos de séries

de tempo não lineares. A segunda abordagem se concentra na aplicação de modelos de

séries de tempo multivariados, onde o …m é modelar a distribuição conjunta de um vetor

aleatório Yt = (Y1;t; Y2;t:::; Yk;t) condicional a algum conjunto de informação . Essa

se-gunda abordagem nos leva à de…nição de cópulas condicionais (ou variantes no tempo) e é,