UM TESTE PARA DEPENDÊNCIA DE VALORES EXTREMOS
UTILIZANDO CÓPULAS
LAVRAS – MG
2017
UM TESTE PARA DEPENDÊNCIA DE VALORES EXTREMOS UTILIZANDO CÓPULAS
Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Mestre.
Dr. Devanil Jaques de Souza Orientador
Dr. Lucas Monteiro Chaves Coorientador
LAVRAS – MG 2017
da Biblioteca Universitária da UFLA
Eugênio Filho, Eleanderson Campos
Um Teste Para Dependência de Valores Extremos Uti-lizando Cópulas / Eleanderson Campos Eugênio Filho. – Lavras : UFLA, 2017.
77p. : il.
Dissertação (mestrado acadêmico)–Universidade Federal de Lavras, 2017.
Orientador: Dr. Devanil Jaques de Souza. Bibliografia.
1. Cópulas. 2. Cópulas de valores extremos. 3. Dependên-cia de valores extremos. 4. Medidas de assoDependên-ciação. I. Souza, Devanil Jaques de. II. Título.
UM TESTE PARA DEPENDÊNCIA DE VALORES EXTREMOS UTILIZANDO CÓPULAS
Dissertação apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-graduação em Estatística e Experimentação Agropecuária, área de concentração em Estatística e Experimentação Agropecuária, para a obtenção do título de Mestre.
APROVADA em 16 de janeiro de 2017.
Dr. Devanil Jaques de Souza UFLA Dr. Lucas Monteiro Chaves UFLA Dr. Daniel Furtado Ferreira UFLA
Dr. Leandro Ferreira UNIFAL-MG
Dr. Devanil Jaques de Souza Orientador
Dr. Lucas Monteiro Chaves Coorientador
LAVRAS – MG 2017
A Deus, pela dádiva da vida.
À minha mãe, Lourdes, pelos valores que me ensinou e por sempre ter cuidado de mim. Seu apoio foi fundamental para a realização deste trabalho. Amo você.
Ao meu orientador, Devanil Jaques de Souza, pelo grande profissional e amigo que é. Seus ensinamentos e conselhos foram fundamentais para o meu crescimento acadêmico e pessoal ao longo do mestrado. Meus sinceros agradecimentos.
Ao meu coorientador, Lucas Monteiro Chaves, por sua disposição em ajudar e pelos valiosos conselhos.
Ao professor Daniel Furtado Ferreira, por sua grande contribuição na elaboração deste trabalho, com sugestões e esclarecimentos.
Ao professor Leandro Ferreira, que tanto me ensinou na graduação. Sou grato por ter me motivado a ingressar no mestrado e também pelas contribuições na elaboração deste trabalho.
À Universidade Federal de Lavras (UFLA) e ao Departamento de Estatística (DES), pela oportunidade concedida para realização do mestrado.
À CAPES, pela concessão da bolsa de estudos, que possibilitou minha integral dedica-ção à realizadedica-ção do mestrado.
Aos meus familiares e amigos, que tornaram esta jornada mais simples e leve.
A todos os professores do Programa de Pós-Graduação em Estatística e Experimenta-ção Agropecuária, pelos ensinamentos e disponibilidade em ajudar. Aos funcionários do DES, também agradeço, pela presteza e por sempre estarem dispostos a ajudar e esclarecer dúvidas.
ourselves awake, not by mechanical aid, but by an infinite expectation of the dawn.” (Henry David Thoreau)
Na modelagem estatística de riscos nas áreas de finanças e atuária, é comum que o pressuposto de riscos independentes seja adotado, ou ainda, que sejam modelados por uma distribuição nor-mal multivariada. Na prática, no entanto, a independência entre os riscos é exceção, enquanto que a normal multivariada somente capta dependência linear entre os riscos, os quais, na re-alidade, costumam apresentar complexas estruturas de dependência. As cópulas são modelos que contornam essas limitações, uma vez que abarcam, além da dependência linear, os casos não-lineares. Dentre as várias famílias de cópulas, destacam-se as cópulas de valores extremos, que servem para modelar variáveis/riscos que apresentam dependência de valores extremos, um caso especialmente perigoso para o analista de riscos, uma vez que representa grandes perdas que podem ocorrer conjuntamente. Sendo assim, é importante que a dependência de valores extremos seja detectada no processo de avaliação de riscos. Sendo assim, utilizando cópulas de valores extremos, foi elaborada uma nova metodologia para testar se um conjunto de dados bivariados apresenta dependência de valores extremos. O desempenho do teste foi bastante sa-tisfatório na maioria dos casos, mantendo as taxas de erro tipo I próximas do nível nominal e com poder comparável aos melhores testes.
Palavras-chave: Cópulas. Cópulas de valores extremos. Dependência de valores extremos. Medidas de associação.
In the statistical modeling of risks, in the fields of finance and actuary, it is usual that the as-sumption of independent risks is adopted, or yet, to model the risks by a multivariate normal distribution. In practice, however, independence is exception and the multivariate normal distri-bution only captures linear dependence between risks, which, in reality, often exhibits complex dependence structures. Copulas are models that circumvents theses limitations, since they co-ver, besides linear dependence, nonlinear cases. Among several copula families, stands out extreme value copulas, which models variables/risks that show extreme value dependence, a particularly dangerous case for the risk analyst, once it represents large losses that could hap-pen jointly. Therefore, it is important that extreme value dehap-pendence be detected in the process of risk assessment. Given that, using extreme value copulas, a new method was elaborated to test whether a bivariate dataset exhibits extreme value dependence. The test performed effici-ently in most cases, keeping type I error rates close to the nominal level and being as powerful as the best tests.
Figura 2.1 – Gráficos das cópulas CU, CLe da região que delimita toda cópula. . . 20
Figura 2.2 – Gráfico da cópula Π. . . 20
Figura 2.3 – Curvas de nível da densidade de uma cópula gaussiana com τ = 0,5. . . 34
Figura 2.4 – Curvas de nível da densidade de uma cópula t com tau de Kendall τ = 0,5 e ν = 7. . . 35
Figura 2.5 – Curvas de nível das densidades de duas cópula arquimedianas . . . 37
Figura 2.6 – Curvas de nível da densidade de uma cópula Frank com tau de Kendall τ = 0,5. . . 37
Figura 3.1 – Curvas de nível da densidade de uma cópula Gumbel a um tau de Kendall τ = 0,5. . . 47
Figura 3.2 – Curvas de nível da densidade de uma cópula Galambos a um tau de Kendall τ = 0,5. . . 47
Figura 3.3 – Curvas de nível da densidade de uma cópula Hüsler-Reiss a um tau de Kendall τ = 0,5. . . 48
Figura 3.4 – Curvas de nível da densidade de uma cópula t de valores extremos com tau de Kendall τ = 0,5 e ν = 4. . . 49
Figura 3.5 – Gráficos de TC para as cópulas Clayton e Gumbel . . . 52
Figura 3.6 – A-plot de amostras das cópulas Gumbel e Frank. . . 52
Figura 5.1 – Gráficos de dispersão de amostras das cópulas Gumbel e Clayton . . . 62
Figura 5.2 – Funções pG(k) e pC(k) (tracejada).. . . 63
Figura 5.3 – Funções p(k) teóricas, a um tau de kendall τ = 0,5, das cópulas Gumbel (preta contínua), Galambos (preta contínua), Hüsler-Reiss (preta contínua), t de valores extremos (preta contínua), Clayton (azul tracejada) e Normal (vermelha pontilhada). . . 65
Tabela 2.1 – Algumas famílias de cópulas arquimedianas . . . 36
Tabela 5.1 – Taxas de rejeição (em %) da hipótese nula observadas em 1000 repetições de amostras de tamanho n = 200, 400 e 800 de cópulas Gumbel, Galambos e t de valores extremos (t-EV) com quatro graus de liberdade a valores de tau de Kendall τ = 0,25, 0,5 e 0,75. . . 68
Tabela 5.2 – Taxas de rejeição (em %) da hipótese nula observadas em 1000 repetições de amostras de tamanho n = 200, 400 e 800 de cópulas Clayton, Frank, Normal, Plackett e t com 4 graus de liberdade (t4) a valores de tau de
Ken-dall τ = 0,25, 0,5 e 0,75. . . 68
Tabela 5.3 – Taxas de rejeição (em %) da hipótese nula para alguns testes de dependência de valores extremos a um tamanho amostral n = 200 e valores de tau de
Kendall τ = 0,25, 0,5 e 0,75 para cinco famílias de cópulas. . . 69
Tabela 5.4 – Taxas de rejeição (em %) da hipótese nula para alguns testes de dependência de valores extremos a um tamanho amostral n = 400 e n = 800 e valores
de tau de Kendall τ = 0,25, 0,5 e 0,75 para cinco famílias de cópulas. . . . 70
Tabela 5.5 – Médias dos tempos de execução, em segundos, de alguns testes em 10
repetições a 3 tamanhos amostrais. . . 71
Tabela 5.6 – Médias dos tempos de execução, em segundos, de alguns testes em 10
1 INTRODUÇÃO GERAL . . . 10
2 CÓPULAS E DEPENDÊNCIA . . . 13
2.1 Conceitos Preliminares . . . 13
2.2 Cópulas . . . 17
2.2.1 O Teorema de Sklar: cópulas e probabilidade . . . 22
2.3 Mensurando dependência . . . 26
2.3.1 Medidas de Concordância . . . 27
2.3.2 Coeficiente de correlação de Pearson ρX,Y . . . 28
2.3.3 Cópulas e ρX,Y . . . 29
2.3.4 Tau de Kendall τX,Y . . . 29
2.3.5 Cópulas e τX,Y . . . 30
2.3.6 Rô de Spearman ρXs,Y . . . 31
2.3.7 Cópulas e ρX,Ys . . . 32
2.4 Principais famílias de cópulas. . . 33
2.4.1 Cópulas gaussianas . . . 33
2.4.2 Cópulas t de Student . . . 34
2.4.3 Cópulas de Fréchet . . . 35
2.4.4 Cópulas arquimedianas . . . 35
2.4.5 Cópulas de Marshall-Olkin . . . 38
3 CÓPULAS DE VALORES EXTREMOS . . . 39
3.1 Cópulas e dependência de valores extremos . . . 39
3.2 Teoria clássica dos valores extremos . . . 39
3.3 Dependência nas caudas . . . 41
3.4 Cópulas de valores extremos . . . 42
3.5 Algumas famílias de cópulas de valores extremos . . . 46
3.6 A-plot: uma ferramenta gráfica para detectar dependência de valores extremos 50 3.7 Alguns testes de dependência de valores extremos . . . 53
4 ESTIMAÇÃO E AJUSTE DE CÓPULAS . . . 56
4.1 Inferência estatística sobre cópulas . . . 56
4.1.1 Métodos paramétricos . . . 57
5 UM TESTE PARA DEPENDÊNCIA DE VALORES EXTREMOS . . . 60
5.1 Introdução . . . 60
5.2 Objetivos . . . 61
5.3 Proposta de um teste para dependência de valores extremos . . . 61
5.3.1 Proporção de observações na cauda superior . . . 62
5.3.2 Construção de um teste para a hipótese de dependência de valores extremos 64 5.3.3 Desempenho do teste . . . 66
5.4 Resultados e Discussão . . . 67
5.4.1 Exemplo com dados reais . . . 71
5.5 Conclusões . . . 72
6 CONSIDERAÇÕES FINAIS . . . 73
1 INTRODUÇÃO GERAL
O estudo de fenômenos de comportamento aleatório é do interesse de profissionais e pesquisadores das mais diversas áreas do conhecimento. Um meteorologista, por exemplo, tem por objetivo predizer, com a maior precisão possível, o comportamento de uma série de variáveis climáticas. Um economista gostaria de poder prever o comportamento do mercado, ou ainda, como o mesmo irá reagir a eventos específicos. Investidores do mercado de capitais desejam saber quais ações devem comprar e o momento ideal para a venda. Um atuário precisa quantificar riscos para seguradoras e entidades de previdência.
A palavra risco apareceu apenas no exemplo do atuário, mas está presente tanto para o meteorologista, quanto para o economista ou o investidor do mercado de capitais. O risco, em uma noção geral, tal como apresentada por Vaughan e Vaughan (2014), está relacionado à hipótese de um evento aleatório apresentar um resultado que implique em prejuízo econômico e/ou financeiro. Por exemplo, o prejuízo causado por uma geada que devasta lavouras, ou desvalorização de ativos financeiros em uma carteira de investimentos.
Risco caminha junto com incerteza e é neste aspecto que a teoria de probabilidade de-sempenha um papel fundamental. Modelos probabilísticos são usados para calcular probabilida-des de eventos. Em outras palavras, mensurar a incerteza de ocorrência de diversos fenômenos. Quantificar a incerteza é o grande objetivo de quem trabalha com riscos, o que torna o estudo da teoria de probabilidade essencial.
A teoria de probabilidade é a base de toda Estatística. Sem ela não seria possível rea-lizar inferências. Amostras representam uma parte do todo (população) e compõem o material utilizado no processo de inferência estatística, que busca extrapolar as informações amostrais para a população (CASELLA; BERGER, 2002, p. 1).
Modelos estatísticos, isto é, modelos que trabalham com amostras, precisam respeitar certos pressupostos, que são inerentes a cada modelo. Essas pressuposições geralmente estão relacionadas com hipóteses acerca da distribuição amostral e independência entre componentes do modelo. Estas hipóteses partem da teoria de probabilidade. Dizer, por exemplo, que dois eventos são independentes, em termos de teoria de probabilidade, é dizer que a ocorrência de um não afeta a probabilidade de ocorrência do outro.
É evidente que na prática, a independência entre eventos aleatórios é exceção e não regra e a maioria dos fenômenos de interesse das áreas de atuária, finanças ou economia quase sempre apresenta complexa estrutura de dependência. No contexto atuarial, grande parte dos modelos
e cálculos são construídos em cima da hipótese de independência. No ramo vida, por exemplo, a variável fundamental de interesse é o tempo de vida restante do segurado e dos beneficiários. Assumir que o tempo de vida do segurado é independente do de seus beneficiários é uma forma simplista de análise e não representa bem a realidade. Pode acontecer que o segurado e um ou mais beneficiários estejam expostos a um risco comum, por exemplo: risco de acidente de carro, em que é comum membros da família (segurado e, comumente, beneficiários) estarem no veículo. Disto surge a necessidade de trabalhar com modelos que abarquem a hipótese de dependência.
Dentre diversas formas de dependência entre riscos, a de valores extremos surge como um caso de relevância para o atuário, que deve se preocupar com o comportamento estocástico de variáveis a níveis excepcionalmente elevados (ou baixos), caso de que trata a Teoria de Valores Extremos (TVE). Além da necessidade de analisar o comportamento de cada risco em níveis extremos, é de fundamental importância avaliar se esses riscos apresentam dependência nesses níveis extremos, isto é, se valores altos (ou baixos) tendem a ocorrer conjuntamente, casos com elevado potencial de causar prejuízos aos envolvidos na gestão desses riscos.
Uma ferramenta para estudar a estrutura de dependência entre fenômenos aleatórios são as cópulas. A palavra cópula é derivada do Latim e significa “o que promove um laço ou união entre duas coisas” (ANDREWS, 1879). A palavra foi usada pela primeira vez no contexto probabilístico, de acordo com Nelsen (2006), por Abe Sklar, no ano de 1959, em sua obra Fonctions de répartition à n dimensions et leurs marges. Resumidamente, cópulas são funções que estabelecem uma ligação entre funções distribuição acumuladas multivariadas e suas marginais e representam modelos para estruturas de dependência.
Pela característica de modelarem estruturas de dependência, podem ser encontradas na literatura algumas metodologias embasadas em cópulas, das quais destacam-se os testes para dependência de valores extremos. Esses testes têm por finalidade avaliar se um conjunto de dados apresenta dependência de valores extremos, representando uma importante ferramenta na gestão de riscos.
Testes de valores extremos são relativamente recentes e de crescente importância na li-teratura, podendo-se mencionar as obras de Kojadinovic, Segers e Yan (2011), Cormier, Genest e Nešlehová (2014) e Prado (2016). Os testes propostos por esses autores, no entanto, ainda apresentam algumas limitações com relação a desempenho. Consequentemente, há espaço para novos testes que apresentem melhorias nesse quesito.
Sendo assim, neste trabalho se objetiva abordar alguns dos principais aspectos da teoria de cópulas e propor uma nova metodologia para detectar a presença de dependência de valores extremos em um conjunto de dados/riscos bivariados.
2 CÓPULAS E DEPENDÊNCIA
2.1 Conceitos Preliminares
Antes de definir cópula é necessário apresentar algumas definições e resultados que se-rão frequentemente usados ao longo desta seção. Essas definições e resultados referem-se a cálculo de funções de duas variáveis, teoria de probabilidade ou Estatística. Cópulas bivaria-das, em poucas palavras, são funções que possuem domínio no quadrado unitário e imagem no intervalo real [0,1], daí surge a necessidade do estudo de funções de duas variáveis. Faz-se ne-cessário, também, revisar alguns conceitos de Estatística e teoria de probabilidade, uma vez que a principal aplicação das cópulas está na Estatística, no estudo da dependência entre variáveis aleatórias, que é um dos objetivos deste trabalho.
Nesta seção serão apresentadas algumas definições e resultados que servem de base para o estudo de cópulas. A maior parte desses conceitos tem por referência o livro An Introduction to Copulas, de Roger B. Nelsen (NELSEN, 2006) e fornece o arcabouço teórico para a apresen-tação das cópulas. As cópulas podem ser definidas, como caso mais geral, no Rp, porém, neste trabalho, serão tratadas no R2, como modelos bivariados.
Neste trabalho, entende-se por R, a reta estendida, definida como R = R ∪ {−∞} ∪ {+∞} = [−∞, + ∞]. Desta maneira, limites da forma lim
x→+∞f(x) = a e limx→−∞f(x) = b podem ser
enxergados como f (+∞) = a e f (−∞) = b, respectivamente. Os conjuntos I = [0,1] e I∗⊆ I também serão frequentemente mencionados.
As primeiras três definições, apresentadas a seguir, constituem a base da noção de cópu-las e estão estreitamente relacionadas com teoria de probabilidade. A primeira, F-volume, versa sobre uma medida em R2.
Definição 2.1.1 (F-volume): Sejam A,B ⊆ R, F uma função de duas variáveis com domínio DF= A × B e R = [x1,x2] × [y1,y2] um retângulo com vértices em DF. O F-volume de R, VF(R),
é definido por:
VF(R) = F(x2,y2) − F(x2,y1) − F(x1,y2) + F(x1,y1). (2.1)
O F-volume de uma função de duas variáveis é, então, uma medida associada a algum retângulo com vértices no domínio da função. Esta definição é importante, pois está intima-mente ligada à medida de probabilidade no contexto de variáveis aleatórias (MAI; SCHERER, 2014, p. 7).
A definição a seguir diz respeito a uma condição sobre funções de duas variáveis e é avaliada com base no F-volume de algum retângulo com vértices no domínio da função. Definição 2.1.2 (2-crescente): Uma função F é dita 2-crescente se, ∀R com vértices em DF,
VF(R) ≥ 0, isto é, o F-volume da função é não negativo para todo retângulo com vértices no domínio de F.
É sabido que toda medida de probabilidade é não negativa e é neste ponto que a condição acima limita uma gama de funções, que serão candidatas a funções de distribuição acumulada de probabilidade.
O fato de uma função bivariada ser 2-crescente não significa que ela é não decrescente em cada uma de suas variáveis. A condição 2-crescente não é exatamente análoga à de monoto-nicidade, isto é, uma função ser 2-crescente não implica em monotonicidade e vice-versa. Por isso, funções 2-crescentes também são conhecidas por quase-monótonas (NELSEN, 2006, p. 8).
Um exemplo de função não decrescente em ambas as variáveis, que não é 2-crescente, é a F(x,y) = max(x,y) com domínio no quadrado unitário. É fácil verificar que VF(I2) ≤ 0. Já
a função G(x,y) = (2x − 1)(2y − 1), de mesmo domínio que a anterior, é decrescente em x para 0 ≤ y ≤ 0,5 e em y para 0 ≤ x ≤ 0,5 e no entanto, é 2-crescente.
A seguir um exemplo de função 2-crescente que será revista na seção 2.2:
Exemplo 2.1.1: Seja F(x,y) = xy, (x,y) ∈ [0,1] × [0,1]. É fácil mostrar que F(x,y) é 2-crescente: Considerando qualquer retângulo R = [x1,x2] × [y1,y2] ⊆ [0,1]2, observe que
VF(R) = x2y2− x2y1− x1y2+ x1y1
= (x2− x1)y2− (x2− x1)y1
= (x2− x1)(y2− y1) > 0
⇒ F(x,y) = xy é 2-crescente.
Como será mostrado na seção 2.2, a função do exemplo 2.1.1, F(x,y) = xy, é a cópula da independência e caracteriza a condição de independência entre duas variáveis aleatórias. Lema 2.1.1: Seja F : A × B → R, em que A,B ⊆ R. Se F é 2-crescente, então, para quaisquer x1,x2,a ∈ A com x1≤ x2 e y1,y2,b ∈ B com y1≤ y2, F(a,y2) − F(a,y1) é não decrescente em A
e F(x2,b) − F(x1,b) também é não decrescente em B.
A prova deste lema é trivial, sendo necessário apenas rearranjar os termos da desigual-dade VF([x1,x2] × [y1,y2]) ≥ 0.
Definição 2.1.3: Uma função F(x,y), de domínio DF = [x1,x2] × [y1,y2] com x1≤ x2e y1≤ y2
, é dita aterrada (grounded), se F(x,y1) = 0 = F(x1,y), ∀x,y ∈ DF.
A função 2-crescente F(x,y) = xy apresentada no exemplo 2.1.1 é também uma função aterrada, uma vez que F(x,0) = 0 = F(0,y), ∀x,y ∈ DF.
Da definição 2.1.3 pode ser inferido que o F-volume de funções aterradas, para um retângulo [x1,x] × [y1,y], em que x1,y1são os menores elementos do conjunto a que pertencem,
é sempre VF([x1,x] × [y1,y]) = F(x,y). Se esta função é 2-crescente, então F(x,y) ≥ 0, ∀(x,y) ∈
DF.
Uma função que seja tanto aterrada quanto 2-crescente, apresenta uma característica importante, a de ser não decrescente em cada variável em seu domínio, isto é, seja F : R2→ R, tal que (x,y) 7→ F(x,y), fixado y = y0, F(x,y0) é monótona não decrescente. O mesmo vale para
F(x0,y).
Lema 2.1.2: Se uma função F(x,y), com domínio A × B = [x1,x2] × [y1,y2] é aterrada e
2-crescente, então F(x,y) é não decrescente em x e em y.
Prova: Se F(x,y) é 2-crescente, então F(x,y2) − F(x,y1) e F(x2,y) − F(x1,y) são não
decres-centes em x e y (Lema 2.1.1). Mas, como F é aterrada, segue que F(x,y1) = 0, ∀x ∈ A e
F(x1,y) = 0, ∀y ∈ B. Neste caso, para quaisquer x2∈ A e y2∈ B, F(x,y2) e F(x2,y) também são
não decrescentes.
Definição 2.1.4: As marginais de uma função F(x,y), de domínio DF = R 2
, caso existam, são dadas por:
F(x, + ∞) = Fx(x), ∀x ∈ R; (2.2)
F(+∞,y) = Fy(y), ∀y ∈ R; (2.3)
Exemplo 2.1.2: Seja F(x,y) = (1 − e−x)(1 − e−y), com domínio DF = [0, + ∞]2. Então as
mar-ginais de F são obtidas por: Fx(x) = F(x, + ∞) = (1 − e−x), ∀x ∈ [0, + ∞] e Fy(y) = F(+∞,y) =
(1 − e−y), ∀y ∈ [0, + ∞].
A função F(x,y) = xy do exemplo 2.1.1 possui marginais, uma vez que ∀x ∈ R, F(x, + ∞) = F (x,1) = x e ∀y ∈ R, F(+∞, y) = F(1,y) = y.
Lema 2.1.3: Sejam A,B ⊆ R, não vazios, F(x,y) uma função 2-crescente, aterrada, com domínio DF= A×B e com marginais Fx(x) e Fy(y). Então, para todos os pares (x1,y1) e (x2,y2) em A×B,
segue que:
|F(x2,y2) − F(x1,y1)| ≤ |Fx(x2) − Fx(x1)| + |Fy(y2) − Fy(y1)|. (2.4)
Prova: Assumindo b0como maior elemento de B, x1≤ x2e b como menor elemento de B, como
F é 2-crescente, aterrada e admite marginais, então, pelos lemas 2.1.1 e 2.1.2, tem-se:
F(x2,b) − F(x1,b) ≥ 0,
F(x2,b0) − F(x1,b0) = Fx(x2) − Fx(x1) ≥ F(x2,y2) − F(x1,y2).
As duas desigualdades acima podem ser resumidas em:
0 ≤ F(x2,y2) − F(x1,y2) ≤ Fx(x2) − Fx(x1). (2.5)
Para x2≤ x1, a desigualdade 2.5 pode ser reescrita como:
0 ≥ F(x1,y2) − F(x2,y2) ≥ Fx(x1) − Fx(x2) (2.6)
e por 2.5 e 2.6, segue
|F(x2,y2) − F(x1,y2)| ≤ |Fx(x2) − Fx(x1)|. (2.7)
Para qualquer y1,y2∈ B, a desigualdade resultante é similar à anterior:
|F(x1,y2) − F(x1,y1)| ≤ |Fy(y2) − Fy(y1)|. (2.8)
Somando 2.7 com 2.8, segue que
|F(x2,y2) − F(x1,y2)| + |F(x1,y2) − F(x1,y1)| ≤ |Fx(x2) − Fx(x1)| + |Fy(y2) − Fy(y1)|
e pela desigualdade triangular, decorre que
|F(x2,y2) − F(x1,y1)| ≤ |F(x2,y2) − F(x1,y2)| + |F(x1,y2) − F(x1,y1)|.
|F(x2,y2) − F(x1,y1)| ≤ |Fx(x2) − Fx(x1)| + |Fy(y2) − Fy(y1)|.
2.2 Cópulas
Cópulas, em suma, são funções que podem ser usadas para modelar estruturas de de-pendência entre variáveis aleatórias. O uso dessas funções vem aumentando cada vez mais na modelagem de riscos em finanças e atuária, por uma necessidade de se trabalhar com um elevado número de riscos que se relacionam por meio de estruturas mais complexas do que as proporcionadas pela distribuição normal multivariada (DENUIT et al., 2005, p. 191).
Antes da apresentação de uma definição formal para cópulas, serão definidas, por con-veniência, subcópulas, que representam uma classe de funções 2-crescentes, aterradas e com marginais.
Definição 2.2.1 (Subcópula): Uma subcópula bidimensional é uma função C0: A × B → I∗, (u,v) 7→ C0(u,v), em que I∗⊆ I e A,B ⊆ I, mas necessariamente contêm 0 e 1 e que apresenta as seguintes propriedades:
1. C0é 2-crescente; 2. C0é aterrada;
3. C0possui marginais u e v, i.e., ∀(u,v) ∈ A × B, C0(u,1) = u e C0(1,v) = v;
Exemplo 2.2.1: Sejam A = B = 0 ∪ [12,1] e C0(u,v) = min(u,v). C0(u,v) é uma subcópula? Para verificar se C0(u,v) é uma subcópula, é necessário que as três propriedades da definição 2.2.1 sejam verificadas, além de ter seu domínio e imagem analisados:
• A verificação do domínio e imagem é direta. A,B ⊆ I e contêm 0 e 1;
• Como C0(0,v) = 0 = C0(u,0), C0é aterrada. Para mostrar que C0é 2-crescente, é necessário que, para u1 ≤ u2, v1≤ v2, VC0(S) = C0(u2,v2) − C0(u2,v1) − C0(u1,v2) + C0(u1,v1) seja
maior que 0, para todo retângulo S ⊆ A × B. Demonstrar que C0 é 2-crescente é simples, mas trabalhoso. Para isto, basta mostrar que VC0(S) ≥ 0 para os seis seguintes casos:
u2 ≥ v2 e u1≤ v1; u2≥ v2 e v1 ≤ u1≤ v2; u2≥ v2 e u1≥ v2; v1≤ u2≤ v2 e v1≤ u1;
v1≤ u2≤ v2e u1≤ v1; u2≤ v1;
• A terceira propriedade diz que C0(u,v) deve possuir marginais u e v, i.e., C0(u,1) = u e C0(1,v) = v, o que é verdade neste caso, pois: min(u,1) = u min(1,v) = v. Desta propri-edade, também é direto mostrar que a imagem de C0 está contida em I. E, portanto, fica provado que C0é uma subcópula.
Definição 2.2.2 (Cópula): Uma cópula bidimensional é uma função C : I2→ I, (u,v) 7→ C(u,v), com as seguintes propriedades:
1. C é 2-crescente, isto é, VC≥ 0 para todo retângulo em I2;
2. C é aterrada i.e., C(u,0) = 0, C(0,v) = 0 e
3. C possui marginais u e v, ou seja, ∀(u,v) ∈ I2, C(u,1) = u e C(1,v) = v;
A diferença entre uma cópula e uma subcópula está no domínio e na imagem. Enquanto uma subcópula possui como domínio A × B, tal que A,B ⊆ I e imagem I∗⊆ I, uma cópula tem como domínio todo o I2e imagem I. A cópula, portanto, é uma subcópula cujo domínio é o I2 e imagem o I.
Teorema 2.2.1: Seja uma subcópula C0: A × B → I∗, ∀(u,v) ∈ A × B segue:
max(u + v − 1,0) ≤ C0(u,v) ≤ min(u,v). (2.9)
Prova: Se C0 é uma subcópula, então segue que C0(u,1) = u e C0(1,v) = v. Como C0 é não decrescente em u e v, C0(u,v) ≤ C0(u,1) = u e C0(u,v) ≤ C0(1,v) = v, ∀(u,v) ∈ A × B. Então, C0(u,v) ≤ min(u,v). Tomando o C0-volume do retângulo R = [u,1] × [v,1], tem-se: VC0(R) =
C0(1,1) − C0(1,v) − C0(u,1) + C0(u,v) = 1 − v − u + C0(u,v). Como C0 é uma subcópula, então C0 é aterrada e 2-crescente, i.e., VC0(R) ≥ 0, ou seja, C0(u,v) ≥ u + v − 1 e C0(u,v) ≥ 0. Segue
que C0(u,v) ≥ max(u + v − 1,0).
Afirmação: Os limites inferior e superior da desigualdade 2.9 são cópulas e serão deno-minados por CL(u,v) = max(u + v − 1,0) e CU(u,v) = min(u,v).
Prova: É fácil ver que CL e CU são aterradas. Para todo u ∈ I, CL(u,0) = max(u − 1,0) = 0 e
CU(u,0) = min(u,0) = 0, bem como ∀v ∈ I, CL(0,v) = max(v −1,0) = 0 e CU(0,v) = min(0,v) = 0.
Verificar a existência das marginais também é direto: ∀u ∈ I CL(u,1) = max(u,0) = u e
CU(u,1) = min(u,1) = u, também ∀v ∈ I, CL(1,v) = max(v,0) = v e CU(1,v) = min(1,v) = v.
Dizer que CUe CLsão 2-crescentes é o mesmo que dizer que os F-volumes (C-volumes)
associados a qualquer retângulo R = [u1,u2] × [v1,v2] ⊆ I2, com u1≤ u2e v1≤ v2são positivos.
Para o limite inferior, temos, então, que mostrar que VC([u1,u2] × [v1,v2]) = max(u2+ v2−
1,0) − max(u2+ v1− 1,0) − max(u1+ v2− 1,0) + max(u1+ v1− 1,0) ≥ 0.
É direto verificar que VC([u1,u2] × [v1,v2]) = 0 quando max(u2+ v2− 1,0) = 0, isto é,
1. u2+ v2≥ 1 e u1+ v1≥ 1;
2. u2+ v2≥ 1 e u1+ v1≤ 1.
No primeiro caso, VC([u1,u2] × [v1,v2]) = u2+ v2− 1 − u2− v1+ 1 − u1− v2+ 1 +
u1+ v1− 1 = 0. No segundo caso, existem duas possibilidades, u2+ v1 ≥ 1 e u1+ v2 ≥ 1
ou apenas uma das duas parcelas ser maior que um. Quando ambas são maiores que um VC([u1,u2] × [v1,v2]) = u2+ v2− 1 − u2− v1+ 1 − u1− v2+ 1 = 1 − u1− v1, mas, como u1+ v1≤
1, VC([u1,u2] × [v1,v2]) = 1 − u1− v1≥ 0. Para o caso em que apenas uma das parcelas é maior
que um, o C-volume será igual a v2− v1ou u2− u1, que, em ambos os casos, é maior que zero.
Para provar que CU(u,v) = min(u,v) é 2-crescente, é preciso mostrar que o C-volume de
qualquer retângulo R com vértices em I é positivo nos seis casos a seguir: 1. u1≤ v1≤ v2≤ u2; 2. u1≤ v1≤ u2≤ v2; 3. u1≤ u2≤ v1≤ v2; 4. v1≤ u1≤ u2≤ v2; 5. v1≤ u1≤ v2≤ u2; 6. v1≤ v2≤ u1≤ u2. A verificação é simples: 1. VC([u1,u2] × [v1,v2]) = v2− v1− u1+ u1= v2− v1≥ 0; 2. VC([u1,u2] × [v1,v2]) = u2− v1− u1+ u1= u2− v1≥ 0; 3. VC([u1,u2] × [v1,v2]) = u2− u2− u1+ u1= 0; 4. VC([u1,u2] × [v1,v2]) = u2− v1− u1+ v1= u2− u1≥ 0; 5. VC([u1,u2] × [v1,v2]) = v2− v1− u1+ v1= v2− u1≥ 0; 6. VC([u1,u2] × [v1,v2]) = v2− v1− v2+ v1= 0.
Como toda cópula é uma subcópula, o teorema 2.2.1 também vale para qualquer cópula C, i.e., para toda cópula C : I2→ I e ∀(u,v) ∈ I2,
CL(u,v) ≤ C(u,v) ≤ CU(u,v). (2.10)
A desigualdade acima, apresentada por Sklar (1959), é a versão de cópulas de uma de-sigualdade análoga, enunciada por Hoeffding, no início da década de 40 e Fréchet em 1951. Segundo Nelsen (2006), Fréchet, que foi um matemático francês, obteve muitos dos mesmos resultados enunciados por Hoeffding. Isto aconteceu devido as obras de Hoeffding terem sido
publicadas em periódicos alemães em plena segunda guerra mundial, o que basicamente impos-sibilitou o acesso a elas para pesquisadores de outros países.
Muitos autores apresentam os limites da desigualdade 2.10, como limites de Fréchet. No entanto, devido ao que foi discutido no parágrafo anterior, será adotada a mesma nomenclatura utilizada por Nelsen (2006), dando o devido crédito aos dois autores. CL(u,v) será, então,
chamada de limite inferior de Fréchet-Hoeffding (Figura 2.1 (a)) e CU(u,v) de limite superior
de Fréchet-Hoeffding (Figura 2.1 (b)). A Figura 2.1 (c) ilustra a região delimitada por CLe CU,
que, consonante com o Teorema 2.2.1, contém todas as cópulas.
Figura 2.1 – Gráficos das cópulas CU, CLe da região que delimita toda cópula
(a) Gráfico da cópula CU (b) Gráfico da cópula CL (c) Região que delimita toda cópula
Fonte: Do autor (2017)
A cópula que representa a estrutura de dependência mais trivial, ou seja, justamente a ausência de dependência entre duas variáveis aleatórias, isto é, independência, também recebe uma notação especial. A cópula da independência (Figura2.2) será definida como Π(u,v) = uv. Já foi provado na seção anterior (exemplo 2.1.1), que Π é 2-crescente, aterrada e possui marginais, sendo, de fato, uma cópula.
Figura 2.2 – Gráfico da cópula Π.
O teorema a seguir versa sobre a continuidade uniforme das subcópulas e, portanto, de cópulas.
Teorema 2.2.2: Seja C0(u,v) uma subcópula. Para quaisquer pares (u1,v1),(u2,v2) pertencentes
ao domínio de C0, segue
|C0(u2,v2) −C0(u1,v1)| ≤ |u2− u1| + |v2− v1|. (2.11)
Este teorema já foi provado para funções mais gerais (Lema 2.1.3). As subcópulas go-zam das mesmas propriedades das funções enunciadas no lema 2.1.3, com a particularidade que possuem como domínio subconjuntos do quadrado unitário, enquanto as funções apresentadas no lema 2.1.3 estão definidas em R2. Como subcópulas são casos particulares dessas funções, o teorema está provado e, uma vez que toda cópula é uma subcópula, vale:
|C(u2,v2) −C(u1,v1)| ≤ |u2− u1| + |v2− v1|. (2.12)
Definição 2.2.3: Sejam C(u,v) uma cópula e a ∈ I. Qualquer seção horizontal (v = a) de C(u,v) é uma função de domínio e imagem I, dada por t 7→ C(t,a). Qualquer seção vertical (u = a) de C(u,v) é uma função de I para I, dada por t 7→ C(a,t) e a seção diagonal (u = v) de C(u,v) é, também, uma função de domínio e imagem no intervalo [0,1], dada por t 7→ C(t,t).
Afirmação: As seções horizontal, vertical e diagonal de uma cópula são não decrescentes e uniformemente contínuas em I.
A prova de que as seções são não decrescentes, decorre do lema 2.1.2, que foi provado para funções 2-crescentes e aterradas, as quais admitem cópulas como casos particulares; e são uniformemente contínuas pelos mesmos argumentos usados para provar o teorema 2.2.2. Teorema 2.2.3: Seja C(u,v) uma cópula. Para qualquer u,v ∈ I, as derivadas parciais ∂
∂ uC(u,v) e ∂
∂ vC(u,v) existem em quase todo o I, exceto em um conjunto de medida nula e assumem valores
no intervalo [0,1], isto é,
0 ≤ ∂
∂ uC(u,v) ≤ 1, (2.13)
0 ≤ ∂
∂ vC(u,v) ≤ 1. (2.14)
Prova: Já foi provado que a seção vertical de uma cópula, uma função t 7→ C(a,t), é monótona não decrescente. Como funções monótonas possuem derivadas em quase todo domínio (exceto
em um conjunto de medida nula), então existe ∂
∂ tC(u,t) para quase todo t, o mesmo vale para a
seção horizontal de uma cópula.
A partir de 2.12, tomando t = v2 = v1, tem-se 0 ≤ |C(u2,t) − C(u1,t)| ≤ |u2− u1| e
pelos lemas 2.1.1 e 2.1.3, vale C(u2,t) − C(u1,t) ≤ u2− u1≤ 1. Sabe-se também que a função
t 7→ C(u2,t) − C(u1,t) é monótona não decrescente (lema 2.1.1), portanto existe ∂ t∂[C(u2,t) −
C(u1,t)]. Fazendo u1= 0,u2= u e t = v, tem-se ∂ v∂ [C(u,v) − C(0,v)] = ∂ v∂C(u,v) e ainda, 0 ≤ ∂
∂ vC(u,v) ≤ 1. Fica, assim, provada a desigualdade 2.14. A prova de 2.13 é análoga.
2.2.1 O Teorema de Sklar: cópulas e probabilidade
Nesta seção será apresentado um teorema de fundamental importância no estudo de cópulas, que, inclusive, serviu de inspiração para o nome dado a estas funções. O teorema foi apresentado em 1959, por Abe Sklar, em sua obra Fonctions de répartition à n dimensi-ons et leurs marges(SKLAR, 1959). Esse teorema passa a dar um significado probabilístico para as cópulas, uma vez que destaca o papel que essas funções desempenham em unir duas funções distribuição de probabilidade acumuladas, criando uma função distribuição acumulada conjunta.
De agora em diante, as cópulas serão tratadas do ponto de vista da teoria da proba-bilidade e serão usadas em um contexto de duas variáveis aleatórias, X e Y , às quais também estarão associadas duas funções distribuição acumuladas, FX(x) e FY(y), bem como uma função
distribuição acumulada conjunta FX,Y(x,y). Portanto, é conveniente definir função distribuição
acumulada para uma e duas variáveis. As definições têm por referência Graybill, Mood e Boes (1974).
Uma consideração importante a ser feita, tratando-se de modelos probabilísticos, é defi-nir um espaço de probabilidade, em que todas as variáveis aleatórias estarão definidas.
Definição 2.2.4 (Espaço de probabilidade): Um espaço de probabilidade é uma tripla (Ω, B, P), em que Ω é o espaço amostral e representa os possíveis resultados de um experimento ale-atório; B é uma σ -álgebra de subconjuntos em Ω e P é uma medida de de probabilidade sobre B (RESNICK, 2004, p. 29).
Definição 2.2.5 (Função distribuição acumulada): Seja X uma variável aleatória definida em um espaço de probabilidade (Ω, B, P). A função distribuição acumulada associada à variável aleatória X , é uma função FX(x) de domínio DFX = R e imagem no intervalo real [0,1]. Esta
função possui as seguintes propriedades: 1. FX(−∞) = 0 e FX(+∞) = 1;
2. FX(x) é monótona não decrescente; i.e., FX(x1) ≤ FX(x2), ∀x1≤ x2;
3. FX(x) é contínua à direta, i.e., lim
h→0+FX(x + h) = FX(x).
Definição 2.2.6 (Função distribuição conjunta acumulada (bivariada)): Sejam X e Y variá-veis aleatórias definidas no mesmo espaço de probabilidade (Ω, B, P). A função distribuição conjunta acumulada de X e Y é uma função FX,Y(x,y) de domínio DFX,Y = R
2
e imagem no intervalo real [0,1], com as seguintes propriedades:
1. FX,Y é aterrada, i.e., FX,Y(−∞,y) = 0, FX,Y(x, − ∞) = 0;
2. FX,Ypossui marginais FX e FY, isto é, FX,Y(x,+∞) = FX(x), FX,Y(−∞,y) = FY(y) e FX,Y(+∞,+
∞) = 1;
3. FX,Y é 2-crescente, i.e., VFX,Y ≥ 0.
O teorema que será apresentado a seguir, que leva o nome de seu autor, é o cerne da teoria de cópulas em probabilidade. Ele estabelece o resultado fundamental para a utilização de cópulas como modelos para estruturas de dependência entre variáveis aleatórias.
Teorema 2.2.4 (Teorema de Sklar): Sejam X e Y variáveis aleatórias contínuas, com X ∼ FX(x), Y ∼ FY(y) e função distribuição conjunta FX,Y(x,y). Para todo (x,y) ∈ R
2
, existe uma única cópula C, tal que
FX,Y(x,y) = C(FX(x),FY(y)). (2.15)
Reciprocamente, se C é uma cópula e FX(x) e FY(y) funções distribuição contínuas,
então FX,Y, tal como definida em 2.15, é uma função distribuição conjunta e é única.
Prova: É sabido que FX(X ) e FY(Y ) seguem uma distribuição uniforme no intervalo [0,1]. Seja
C(u,v) a função distribuição conjunta de FX(X ) e FY(Y ), isto é
C(u,v) = P[FX(X ) ≤ u, FY(Y ) ≤ v)] = P[X ≤ FX−1(u),Y ≤ FY−1(v)] = FX,Y(FX−1(u), FY−1(v)).
Lembrando que FX,Y(x,y) = P[X ≤ x,Y ≤ y], pode-se mostrar que X ≤ x ⇔ FX(X ) ≤ FX(x) e
Y ≤ y ⇔ FY(Y ) ≤ FY(y), então vale
FX,Y(x,y) = P[FX(X ) ≤ FX(x), FY(Y ) ≤ FY(y)]. (2.16)
A expressão 2.16 nada mais é que C(u,v) aplicada em FX(x) e FY(y), isto é
FX,Y(x,y) = P[X ≤ x,Y ≤ y]
= P[FX(X ) ≤ FX(x), FY(Y ) ≤ FY(y)]
= C(FX(x),FY(y)).
Pode-se observar que a função C estabelece uma relação entre as duas funções distribui-ção acumuladas, que se traduz em uma fundistribui-ção distribuidistribui-ção conjunta, a qual resume o comporta-mento conjunto de duas variáveis aleatórias. Desta forma, a cópula de duas variáveis aleatórias X e Y , por vezes, será denotada por CX,Y.
Uma versão mais geral do teorema de Sklar, utilizando uma subcópula C0, seria FX,Y(x,y) =
C0(FX(x),FY(y)) e também é verdadeira. A prova deste enunciado mais geral pode ser
encon-trada em Nelsen (2006, p. 18). A versão de subcópulas do teorema de Sklar diz respeito a funções distribuição discretas, isto é, cuja imagem é um subconjunto do intervalo [0,1]. Esta versão mais geral foi omitida propositalmente, pelo fato das aplicações de cópulas no contexto de variáveis discretas serem limitadas, uma vez que não há um análogo do teorema da transfor-mação integral da probabilidade para o caso discreto (DENUIT et al., 2005, p. 193).
Um resultado que é consequência direta do teorema de Sklar é a possibilidade de cons-truir cópulas a partir de funções distribuição conjuntas e marginais através de inversas dessas funções.
Corolário 2.2.1: Sejam X , Y , FX,Y, FX, FY e C tal como definidos no teorema 2.2.4, então, para
todo (u,v) ∈ I2,
Prova: Supondo FX e FY estritamente crescentes, segue que FX(FX−1(u)) = u e FY(FY−1(v)) = v.
Então, pelo teorema de Sklar,
FX,Y(FX−1(u),FY−1(v)) = C(FX(FX−1(u)),FY(FY−1(v)))
= C(u,v) = CX,Y(u,v).
Percebe-se que a cópula define a estrutura de dependência entre X e Y , isto é, o com-portamento das funções distribuição marginais FX e FY não influencia na forma como elas se
associam, função exercida exclusivamente pela cópula. Essa característica das cópulas levou Deheuvels (1978) a chamá-las de funções dependência.
É sabido que se U ∼ U ni[0,1], sua função distribuição é dada por FU(u) = 1[0,1)(u) +
1[1,+∞)(u), para u ∈ R. Disto, surge naturalmente uma segunda definição de cópula a partir da representação de Sklar. Além de serem definidas como uma classe de funções de domínio no quadrado unitário, 2-crescentes, aterradas e com marginais, C(u,v) pode ser enxergada como uma função distribuição conjunta com marginais uniformes no intervalo [0,1]. Esse fato decorre do teorema de Sklar, para FX(x) = u e FY(y) = v.
Uma das principais características das cópulas é a de serem invariantes a transformações estritamente crescentes e, de um modo geral, se alterarem de maneira previsível para outras combinações de transformações monótonas. Formalmente:
Corolário 2.2.2: Sejam X e Y variáveis aleatórias contínuas com cópula CX,Y e α(x) e β (y)
transformações estritamente crescentes em x e y, respectivamente. Então Cα (X ),α (Y )= CX,Y, isto
é, a cópula é invariante por transformações estritamente crescentes.
Prova: Sejam FX, Fα (X ), FY e Fβ (Y ), as fdas de X , Y , α(X ) e β (Y ), respectivamente. Pelo fato
de α ser uma transformação estritamente crescente, segue que Fα (X )= P[α(X ) ≤ x] = P[X ≤ α−1(x)] = FX(α−1(x)), da mesma forma, Fβ (Y ) = FY(β−1(y)). Sendo assim, para qualquer
x,y ∈ R, vale
Cα (X ),α (Y )= P[α(X ) ≤ x, β (Y ) ≤ y] = P[X ≤ α−1(x),Y ≤ β−1(y)] = CX,Y(FX(α−1(x)), FY(β−1(y)))
A prova de que a cópula Π(u,v) (exemplo 2.1.1) caracteriza a condição de independência entre duas variáveis, pode ser obtida, também, por meio da representação de Sklar e configura um resultado importante.
Teorema 2.2.5: Sejam X e Y variáveis contínuas com X ∼ FX e Y ∼ FY e cópula CX,Y. Então,
X e Y são independentes se, e somente se, CX,Y = Π(u,v).
Prova: Se X e Y são independentes, então a função distribuição conjunta acumulada de X e Y , FX,Y, pode ser obtida pelo produto das marginais, isto é, FX,Y(x,y) = FX(x)FY(y). Pelo teorema
de Sklar, é sabido que FX,Y(x,y) = C(FX(x),FY(y)), então, segue que CX,Y(u,v) = uv = Π(u,v).
A prova da recíproca é direta.
2.3 Mensurando dependência
Já foi visto que cópulas servem como modelos para estruturas de dependência entre variáveis aleatórias, mas como medir a intensidade dessa dependência? Existe uma série de medidas para esse fim e, de uma maneira geral, são chamadas de medidas de dependência ou associação.
Introduzida em 1885 por Francis Galton, a correlação linear foi adotada, quase que com exclusividade como medida de associação na Estatística até a década de 1970, período em que o conceito de dependência positiva começou a ser trabalhado. O pioneirismo deste novo conceito de dependência se deu com Erich Leo Lehmann, em sua obra de 1966, denonimada Some Concepts of Dependence(LEHMANN, 1966). Novas medidas baseadas no conceito de dependência positiva revolucionaram a maneira como a dependência era tratada na Estatística, pois possuíam propriedades que não estavam presentes na medida de correlação de Pearson (DENUIT et al., 2005, p. 245).
A maneira com que uma medida de dependência/associação se relaciona com uma có-pula C, pode ser compreendida da seguinte maneira: Sejam duas funções distribuição FX e FY
e uma cópula C. As duas funções distribuição sozinhas não informam nada sobre a estrutura de dependência de X e Y , papel realizado unicamente pela cópula C. É razoável, então, supor que uma medida de dependência possa ser expressa apenas em termos de uma cópula. Este raciocínio é verdadeiro para algumas medidas de associação, em especial, as baseadas na con-cordância, tais como tau de Kendall e rô de Spearman. Estas medidas de concordância ainda compartilham da propriedade das cópulas de serem invariantes a transformações estritamente
crescentes. Apesar de não gozar de nenhuma dessas propriedades, o coeficiente de correlação de Pearson ainda é uma medida bastante razoável para relações lineares entre variáveis aleatórias.
2.3.1 Medidas de Concordância
Duas famílias de medidas de associação foram apresentadas até então, uma baseada em concordância e outra em dependência linear. Estas famílias se diferenciam quanto a algumas propriedades que apresentam. As medidas de concordância, no entanto, são as mais utilizadas quando se trabalha com cópulas, uma vez que possuem propriedades convenientes e podem ser expressas exclusivamente por meio de cópulas.
É dito que há concordância entre duas variáveis aleatórias quando valores altos (baixos) de uma tendem a estar associados a valores altos (baixos) da outra. As medidas baseadas nessa forma de associação apresentam algumas propriedades específicas. Formalmente:
Definição 2.3.1 (Medidas de concordância): Uma medida η, que associa duas variáveis alea-tórias contínuas X e Y é dita uma medida de concordância se respeitar as seguintes propriedades: 1. ηX,Y = ηY,X (simetria);
2. −1 ≤ ηX,Y ≤ 1 (normalização);
3. ηX,Y = 1 se, e somente se, uma variável for, quase certamente (Lebesgue), uma função não
decrescente da outra (Comonotonicity);
4. ηX,Y = −1 se, e somente se, uma variável for, quase certamente, uma função não crescente
da outra (Countermonotonicity);
5. Se α e β são funções que preservam a ordem (monotônicas), então,
ηα (X ),β (Y )=
ηX,Y se α e β são ambas crescentes ou decrescentes,
−ηX,Y caso contrário.
Vale ressaltar que uma propriedade desejável para uma medida de associação seria a de que ηX,Y fosse nula se, e somente se, as variáveis aleatórias fossem independentes. Essa
propriedade, no entanto, entra em conflito com a quinta propriedade de medida de concordância: seja (X ,Y ) um par de variáveis aleatórias com distribuição uniforme no círculo unitário, isto é, (X ,Y ) = (cos Z, senZ), Z ∼ U ni[0,2π]. Como cos Z é igual, em distribuição, a − cos Z, segue
que (X ,Y )= (−X ,Y ) e pela quinta propriedade de medida de concordância,d
ηX,Y = η−X,Y = −ηX,Y,
então, ηX,Y = 0, porém X e Y claramente não são independentes, uma vez que ambas
depen-dem de Z, contrariando a propriedade de que ηX,Y = 0 se, e somente se, as variáveis forem
independentes (DENUIT et al., 2005, p. 247).
O coeficiente de correlação de Pearson não é uma medida de concordância, pois só sa-tisfaz as propriedades 1 e 2. A propriedade de ser invariante em escala para transformações monotônicas não está presente nessa medida, sendo invariante apenas para transformações line-ares. Duas medidas de grande importância que são invariantes em escala para transformações monotônicas são o tau de Kendall e rô de Spearman. Pode ser verificado, inclusive, que es-sas duas últimas medidas possuem as 5 propriedades listadas anteriormente e, portanto, são medidas de concordância.
2.3.2 Coeficiente de correlação de Pearson ρX,Y
O coeficiente de correlação de Pearson é uma das medidas de associação mais simples e utilizadas na Estatística; de fato, a noção de correlação linear, introduzida por F. Galton no final do século XIX, dominou a Estatística até a década de 1970, período em que foram introduzidas novas noções em medidas de associação (DENUIT et al., 2005, p. 245).
A ideia desta medida de associação, também conhecida como coeficiente de correla-ção produto-momento, é captar a intensidade da relacorrela-ção linear que existe entre duas variáveis aleatórias. É definida da seguinte forma:
Definição 2.3.2 (Coeficiente de correlação de Pearson): Sejam duas variáveis aleatórias X e Y, ambas com variâncias finitas. Neste caso, o coeficiente de correlação de Pearson é definido da seguinte forma:
ρX,Y =
COV[X ,Y ] p
VAR[X ]VAR[Y ]. (2.19)
Como já foi visto, o coeficiente de correlação de Pearson não é invariante a trans-formações monotônicas, isto é, para um transformação α : R → R estritamente crescente, ρα (X ),Y 6= ρX,Y. Isso representa uma desvantagem em relação a medidas de concordância, que
có-pulas. Contudo, esta medida é invariante a transformações lineares: ρa1+b1X,a2+b2Y = ρX,Y se b1b2> 0 −ρX,Y caso contrário. ,
em que a1,a2∈ R e b1,b2∈ R\{0} são constantes reais e X e Y são variáveis aleatórias
contí-nuas.
2.3.3 Cópulas e ρX,Y
O coeficiente de correlação de Pearson apresenta uma outra desvantagem, ele não de-pende unicamente da cópula:
ρX,Y = COV[X ,Y ] p VAR[X ]VAR[Y ] = p 1 VAR[X ]VAR[Y ] ZZ R2 [FX,Y(x,y) − FX(x)FY(y)]dxdy. (2.20)
Com a mudança adequada de variáveis, tem-se:
ρX,Y = 1 p VAR[X ]VAR[Y ] ZZ I2 [C(u,v) − uv]dFX−1dFY−1, (2.21)
que é uma expressão envolvendo a cópula de X e Y , contudo, também em função das variâncias de X e Y (DENUIT, 2005, p. 249).
2.3.4 Tau de Kendall τX,Y
A medida de correlação de Pearson, apesar de simples e muito usada, apresenta uma desvantagem se utilizada em um contexto de cópulas, como visto anteriormente. O tau de Kendall, por outro lado, além de ser uma medida simples, não apresenta esse problema, uma vez que pode ser expresso como função exclusiva de uma cópula.
O τ de Kendall é uma medida de associação baseada na concordância, que, em termos amostrais, pode ser entendida da seguinte forma: Sejam (x1,y1) e (x2,y2) duas observações
do vetor de variáveis aleatórias contínuas (X ,Y ). Diz-se que os pares (x1,y1) e (x2,y2) são
(x1,y1) e (x2,y2) são concordantes, também é dizer que x2> x1ao mesmo tempo que y2> y1.
Caso x2> x1e y2< y1ou x2< x1e y2> y1, equivale dizer que são discordantes. Formalmente:
Definição 2.3.3 (Tau de Kendall amostral): Seja {(x1,y1),(x2,y2),...,(xn,yn)} uma amostra
aleatória de tamanho n do vetor aleatório (X ,Y ). Existem n2 pares (xi,yi) e (xj,yj) distintos,
dos quais c podem ser concordantes e d discordantes. O tau de Kendall amostral é então definido da seguinte maneira: ˆ τ = c− d c+ d = c− d n 2 . (2.22)
A versão populacional do tau de Kendall é definida como a probabilidade de concordân-cia menos a de discordânconcordân-cia:
Definição 2.3.4 (Tau de Kendall populacional): Sejam (X1,Y1) e (X2,Y2) cópias independen-tes de um vetor aleatório (X ,Y ) com função distribuição acumulada conjunta FX,Y. A versão
populacional do tau de Kendall é definida da seguinte forma:
τX,Y = P[(X1− X2)(Y1−Y2) > 0] − P[(X1− X2)(Y1−Y2) < 0]. (2.23)
O tau de Kendall apresenta uma propriedade interessante, a de ser invariante a transfor-mações monotônicas (propriedade 5 de medidas de concordância), isto é, τα (X ),Y = τX,Y, em
que α é uma transformação não-decrescente.
2.3.5 Cópulas e τX,Y
O tau de Kendall se relaciona diretamente com as cópulas, tal como é mostrado no teorema a seguir:
Teorema 2.3.1: Sejam X e Y variáveis aleatórias contínuas com cópula C. O tau de Kendall de X e Y (denotado por τX,Y) pode, então, ser expresso da seguinte forma:
τX,Y = τC= 4 ZZ
I2
C(u,v)dC(u,v) − 1. (2.24)
Prova: Sabendo que o tau de Kendall é a probabilidade de concordância (PC) menos a de
dis-cordância (PD), isto é, τX,Y = PC− PD= P[(X1− X2)(Y1−Y2) > 0] − P[(X1− X2)(Y1−Y2) < 0].
A probabilidade de discordância pode ser escrita como PD= 1 − PC. Desta forma, o tau de
A probabilidade de concordância PC= P[(X1−X2)(Y1−Y2) > 0] = P(X1> X2,Y1> Y2)+
P(X1< X2,Y1< Y2). Como o vetor (X2,Y2) é uma cópia independente de (X1,Y1), a probabilidade
de concordância pode ser simplificada:
PC= 2P(X1< X2,Y1< Y2)
= 2
ZZ
R2
FX,Y(x,y)dFX,Y(x,y)
= 2
ZZ
R2
C(FX(x),FY(y))dC(FX(x),FY(y)).
Fazendo a transformação u = FX(x) e v = FY(y), u,v ∈ [0,1], tem-se
PC= 2 ZZ
I2
C(u,v)dC(u,v). (2.25)
Desta forma, τX,Y = 4RR I2
C(u,v)dC(u,v) − 1.
A integral dupla ainda pode ser interpretada como E[C(U,V )], de uma função distribui-ção acumulada conjunta C em que U e V seguem uma distribuidistribui-ção uniforme no intervalo [0,1] e, portanto, τX,Y = τC= 4E[C(U,V )] − 1.
O fato de τ de Kendall poder ser expresso exclusivamente em função de uma cópula, o torna uma medida de associação interessante, propriedade não compartilhada pelo coeficiente de correlação produto-momento de Pearson.
2.3.6 Rô de Spearman ρXs,Y
O rô de Spearman, assim como o tau de Kendall, é uma medida de associação baseada na concordância e, portanto, goza das cinco propriedades de medidas de concordância, além de possuir representação em função exclusiva de cópulas. Uma maneira de definir o rô de Spearman populacional, tal como é feito em Nelsen (2006), é a seguinte:
Definição 2.3.5 (Rô de Spearman): Sejam (X1,Y1), (X2,Y2) e (X3,Y3), cópias independentes de
um vetor aleatório (X ,Y ) com função distribuição acumulada conjunta FX,Y. O rô de Spearman
pode, então, ser definido como:
2.3.7 Cópulas e ρX,Ys
As medidas de associação apresentadas até então são as três mais conhecidas e utilizadas na Estatística e estão diretamente relacionadas com cópulas. O coeficiente de correlação de Pearson, como foi visto, não é função exclusiva de uma cópula, porém o tau de Kendall sim, bem como o rô de Spearman, tal como formulado no teorema a seguir.
Teorema 2.3.2: Sejam X e Y variáveis aleatórias contínuas com cópula C. O rô de Spearman de X e Y (denotado por ρX,Ys ) pode, então, ser expresso da seguinte forma:
ρX,Ys = ρCs = 12
ZZ
I2
uvdC(u,v) − 3. (2.27)
Prova: Definindo P[(X1− X2)(Y1− Y3) > 0] como PC2 e P[(X1− X2)(Y1− Y3) < 0] como PD2
segue que ρX,Ys = 3PC2− 3PD2. A probabilidade de discordância 2, PD2, pode ser escrita como
PD2= 1 − PC2. Desta forma, o rô de Spearman pode ser reescrito como ρX,Ys = 6PC2− 3.
Observando que PC2= P[(X1−X2)(Y1−Y3) > 0] = P(X2< X1,Y3< Y1)+P(X2> X1,Y3>
Y1) e sabendo que os pares (X1,X2) e (Y1,Y3) são independentes e identicamente distribuídos, a
probabilidade de concordância 2 pode, então, ser simplificada:
PC2= 2P(X2< X1,Y3< Y1)
= 2
ZZ
R2
FX2,Y3(x,y)dFX,Y(x,y).
Notando que X2e Y3são independentes, segue que
PC2= 2 ZZ
R2
FX(x)FY(y)dFX,Y(x,y)
= 2
ZZ
R2
C(FX(x),FY(y))dC(FX(x),FY(y)).
Fazendo u = FX(x) e v = FY(y), tem-se
PC2= 2 ZZ
I2
uvdC(u,v).
Desta forma, ρX,Ys = 12RR I2
A integral dupla ainda pode ser interpretada como E[UV ], em que U e V possuem a mesma cópula de (X ,Y ) e seguem uma distribuição uniforme no intervalo [0,1]. Portanto, ρXs,Y = ρCs = 12E[UV ] − 3.
O rô de Spearman, por ser uma medida de concordância, possui a propriedade de ser invariante a transformações que preservam a ordem, isto é, dada uma transformação monotônica não-decrescente α, ρs
α (X ),Y = ρ s X,Y.
2.4 Principais famílias de cópulas
Dentre as inúmeras cópulas na literatura, existem algumas famílias paramétricas mais conhecidas e que são comumente mais utilizadas nas áreas de finanças e atuária, a saber: cópulas gaussianas, t de Student, Fréchet, arquimedianas, Marshall-Olkin e cópulas de valores extremos (CHERUBINI et al., 2004, p. 95).
2.4.1 Cópulas gaussianas
As cópulas gaussianas, também conhecidas por cópulas normais, representam uma das estruturas de dependência mais simples entre variáveis aleatórias, a linear. Essas cópulas, nos casos bivariados, reproduzem a mesma estrutura de dependência que uma distribuição normal bivariada. A intensidade dessa dependência linear é dada por meio do coeficiente de correlação de Pearson ρ.
Definição 2.4.1 (Cópulas gaussianas): As cópulas gaussianas são definidas da seguinte ma-neira:
CρGa(u,v) = Φρ(Φ−1(u),Φ−1(v)). (2.28)
Em que Φρ é a função distribuição acumulada conjunta da normal padrão bivariada, com
coefi-ciente de correlação linear de Pearson ρ, i.e.
CρGa(u,v) = 1 2πp1 − ρ2 Φ−1(u) Z −∞ Φ−1(v) Z −∞ exp −(ξ 2 1 − 2ρξ1ξ2+ ξ22) 2(1 − ρ2) dξ1dξ2.
Na Figura2.3podem ser observadas as curvas de nível de uma cópula gaussiana (densi-dade) a um tau de Kendall τ = 0,5.
Figura 2.3 – Curvas de nível da densidade de uma cópula gaussiana com τ = 0,5.
Fonte: Do autor (2017)
2.4.2 Cópulas t de Student
Caso semelhante ao das cópulas gaussianas, as cópulas t de Student representam a es-trutura de dependência reproduzida por uma distribuição t de Student bivariada.
Definição 2.4.2 (Cópulas t de Student): A cópula t de Student é definida da seguinte maneira:
Ctν ,α(u,v) = tν ,α(tν−1(u),t −1
ν (v)). (2.29)
Em que tν ,α é a função distribuição acumulada conjunta bivariada t de Student, com ν graus de
liberdade e −1 < α < 1, i.e. Cν ,αt (u,v) = 1 2π√1 − α2 tν−1(u) Z −∞ tν−1(v) Z −∞ 1 +ξ 2 1 − 2αξ1ξ2+ ξ22) ν (1 − α2) −ν +22 dξ1dξ2.
Na Figura2.4 podem ser observadas as curvas de nível de uma cópula t (densidade) a um tau de Kendall τ = 0,5 e ν = 7.
Figura 2.4 – Curvas de nível da densidade de uma cópula t com tau de Kendall τ = 0,5 e ν = 7.
Fonte: Do autor (2017)
2.4.3 Cópulas de Fréchet
Proposta por Fréchet, em 1958, esta família de dois parâmetros é uma combinação con-vexa de três outras cópulas conhecidas (CHERUBINI et al., 2004, p. 118).
Definição 2.4.3 (Cópulas de Fréchet): A família de cópulas de Fréchet é definida da seguinte maneira:
CFp,q(u,v) = pCL+ (1 − p − q)Π + qCU
= p max(u + v − 1,0) + (1 − p − q)uv + q min(u,v),
(2.30)
em que 0 ≤ p + q ≤ 1 e p,q ∈ [0,1].
De uma forma geral, essa família de cópulas pode ser obtida a partir de um resultado básico sobre cópulas: qualquer combinação linear convexa de cópulas também é uma cópula (NELSEN, 2006, p. 14).
2.4.4 Cópulas arquimedianas
Cópulas arquimedianas representam uma classe de cópulas da qual várias famílias fazem parte. Estas famílias são geradas a partir de uma função denominada geradora, que possui
algumas características específicas. A função geradora das cópulas arquimedianas, φ : I → [0, + ∞], deve ser contínua e decrescente, além disto, também deve ser convexa e tal que φ (1) = 0. Caso φ (0) = +∞, φ é uma geradora estrita e sua inversa é a inversa convencional φ−1. Caso φ (0) < +∞, torna-se necessário definir uma pseudo-inversa de φ , denotada por φ[−1], em que
φ[−1]= φ−1 , 0 ≤ t ≤ φ (0) 0 , φ (0) ≤ t ≤ +∞ , (2.31)
de tal forma que φ[−1](φ (t)) = t, ∀t ∈ I.
Definição 2.4.4 (Cópula arquimediana): Se θ ∈ R e φ uma função geradora, a cópula arqui-mediana de parâmetro θ é definida como:
CθA(u,v) = φθ[−1](φθ(u) + φθ(v)). (2.32)
A relação entre medidas de associação e cópulas arquimedianas se dá de forma simples, tal como mostrado por Genest e MacKay (1986) para o caso do tau de Kendall.
τC= 4 Z
I
φ (t)
φ0(t)dt+ 1. (2.33)
Algumas outras famílias importantes de cópulas arquimedianas também são mostradas na Tabela 2.1.
Tabela 2.1 – Algumas famílias de cópulas arquimedianas
Família φθ(t) θ ∈ Cθ(u,v) Gumbel (− lnt)θ [1, + ∞) exp{−[(− ln u)θ+ (− ln v)θ]θ1} Clayton 1 θ(t −θ− 1) [−1, + ∞)\{0} [max(u−θ+ v−θ − 1,0)]−1 θ Ali-Mikhail-Haq ln1−θ (1−t)t [−1,1) 1−θ (1−u)(1−v)uv Frank − lne−θt−1 e−θ−1 (−∞,∞)\{0} −1 θln 1 +(e−θ u−1)(e−θ v−1) e−θ−1 Fonte: Do autor (2017)
Como já foi visto, cada família de cópula reproduz uma estrutura de dependência dife-rente. Pode-se observar, por exemplo, que no caso da cópula Gumbel (Figura 2.5 (a)), há uma associação mais acentuada na cauda superior em comparação com as cópulas Clayton (Figura 2.5 (b)) e Frank (Figura 2.6). Isso se deve ao fato da cópula de Gumbel, além de arquimediana, ser de valores extremos, tal como será mostrado na seção 3.
Figura 2.5 – Curvas de nível das densidades de duas cópula arquimedianas
(a) Curvas de nível de uma cópula Gumbel (densidade) com tau de Kendall τ = 0,5.
(b) Curvas de nível de uma cópula Clayton (densidade) com tau de Kendall τ = 0,5. Fonte: Do autor (2017)
Figura 2.6 – Curvas de nível da densidade de uma cópula Frank com tau de Kendall τ = 0,5.
2.4.5 Cópulas de Marshall-Olkin
Esta família, tal como a de Fréchet, é caracterizada por possuir dois parâmetros, que serão denotados por m,n ∈ I. A cópula de Marshall-Olkin é dada por:
CMO(u,v) = min(u1−mv,uv1−n). (2.34)
Nota-se que algumas cópulas básicas podem ser obtidas através de algumas combina-ções dos parâmetros m e n; por exemplo, a cópula da independência (Π) é obtida quando m ou nsão nulos e a cópula CU quando ambos valem 1.
Tal como as cópulas arquimedianas, esta família também apresenta uma relação simples com medidas de associação (NELSEN, 2006).
τCMO= mn m− mn + n, (2.35) ρCsMO= 3mn 2m − mn + 2n. (2.36)
3 CÓPULAS DE VALORES EXTREMOS
3.1 Cópulas e dependência de valores extremos
Considere uma situação em que um gestor tenha que avaliar dois riscos distintos, ambos relacionados a perdas financeiras. Um interesse imediato é o de se proteger contra prejuízos elevados inerentes a cada risco. No entanto, existe um cenário ainda mais adverso: pode existir uma relação entre ambos os riscos, de tal forma que valores extremos (perdas elevadas) de um tendam a ocorrer conjuntamente com valores elevados do outro, isto é, há uma dependência de valores extremos. Do ponto de vista estatístico, a teoria dos valores extremos é uma área que lida com estas questões e as cópulas podem auxiliar na modelagem da dependência de valores extremos.
3.2 Teoria clássica dos valores extremos
A teoria dos valores extremos é uma área da estatística que tem como objeto básico de interesse o estudo do comportamento de Mn= max(X1,...,Xn), em que X1,...,Xn são
variá-veis aleatórias iid. Para contextualizar, suponha que elas se referem a um risco X . A função distribuição acumulada de Mnpode ser derivada da seguinte maneira:
FMn(z) = P(Mn≤ z) = P[max(X1,...,Xn) ≤ z]
= P(X1≤ z,...,Xn≤ z) = P(X1≤ z)...P(Xn≤ z)
= FXn(z).
(3.1)
Sendo assim, conhecer FX é o suficiente para entender o comportamento de Mn. Porém,
há um problema no processo de estimação, pois pequenas variações na estimação de FX podem
levar a grandes discrepâncias na FMn estimada (COLES, 2001, p. 46).
Uma alternativa é tomar FX como desconhecida e buscar famílias de distribuições para
FXn, estimada a partir dos extremos amostrais. A ideia é derivar essas famílias de forma assin-tótica, semelhantemente ao caso do Teorema Central do Limite, em que a distribuição normal é limite para distribuições de médias amostrais. Analisar o comportamento de FXnquando n tende ao infinito não resolve o problema, uma vez que, para um z < z∗, em que z∗ é o menor valor tal que FX(z∗) = 1, FXn(z) tende a uma distribuição degenerada com massa de probabilidade em
z= z∗. Uma forma de contornar isto, é realizar uma padronização em Mn:
Mn0 = Mn− bn
an , (3.2)
em que {an > 0} e {bn} representam sequências de constantes. Desta forma, para escolhas
adequadas de {an} e {bn}, é possível encontrar P(Mn0 ≤ z), tal como enunciado no teorema a
seguir, de papel fundamental na teoria dos valores extremos:
Teorema 3.2.1 (Teorema de Fisher-Tippett-Gnedenko): Caso existam {an} e {bn}, tais que
lim
n→+∞P(M 0
n≤ z) = G(z) (3.3)
para G(z) não degenerada, então G(z) pertence a uma das três famílias seguintes:
I: G(z) = exp − exp − z − b a , −∞ < z < ∞ II: G(z) = 0 , z ≤ b exp h − z−ba −αi , z > b III: G(z) = exp n −h− z−ba αio , z ≤ b 1 , z > b (3.4) em que a > 0, b ∈ R e α > 0.
Estas três distribuições de valores extremos, conhecidas por Gumbel, Fréchet e Wei-bull, respectivamente, são casos particulares da família da distribuição generalizada de valores extremos, GVE, de forma geral dada por:
G(z) = exp ( − 1 + ξ z − µ δ −1/ξ) (3.5) em que z ∈ {z : 1 + ξ (z − µ)/δ > 0}, −∞ < µ < +∞, σ > 0 e −∞ < ξ < +∞.
A prova do teorema 3.2.1 pode ser encontrada em Gnedenko (1943) e, em outras pa-lavras, diz que a distribuição dos máximos amostrais converge para uma das três distribuições acima à medida que o tamanho amostral tende ao infinito. Isto pode ser entendido como um caso similar ao TCL.
A teoria clássica de valores extremos pode ser estendida para o caso multivariado de forma análoga ao univariado, tal como feito para o caso bivariado, em Tawn (1988). A ideia é derivar uma função distribuição conjunta de probabilidade acumulada para os máximos dos pa-res de variáveis aleatórias iid (X1,Y1),...,(Xn,Yn), M1n= max(X1,...,Xn) e M2n = max(Y1,...,Yn),
i.e., feitas as normalizações tal como no caso univariado, busca-se uma G(x,y), de tal sorte que
P M1n− b1n a1n ≤ x, M2n− b2n a2n ≤ y n→+∞ = G(x,y), (3.6)
em que as marginais de G(x,y) são da forma (3.5).
Como será mostrado nas próximas seções, a noção de dependência de valores extremos e cópulas de valores extremos surge naturalmente da função G(x,y).
3.3 Dependência nas caudas
No contexto atuarial, distribuições de perdas tendem a possuir caudas pesadas, uma característica que modelos gaussianos não possuem. Para o caso multivariado, além da possi-bilidade de caudas pesadas para as marginais, há a hipótese de dependência nas caudas entre as variáveis (DENUIT et al., 2005, p. 217).
O conceito de dependência nas caudas parte da dependência positiva em quadrante, definida da seguinte forma em Prado (2016, p. 46):
Definição 3.3.1 (Dependência positiva em quadrante): Sejam X e Y variáveis aleatórias con-tínuas de função distribuição conjunta acumulada FX,Y(x,y) e funções distribuição marginais
acumuladas FX(x) e FY(y), respectivamente. Diz-se que X e Y apresentam dependência positiva
em quadrante se:
P[X > x,Y > y] ≥ P[X > x]P[Y > y]. (3.7)
A autora mostrou que (3.7) é equivalente a P[X ≤ x,Y ≤ y] ≥ P[X ≤ x]P[Y ≤ y], que por sua vez é igual a FX,Y(x,y) ≥ FX(x)FY(y). Note ainda que
P[X > x,Y > y] ≥ P[X > x]P[Y > y] ⇔ P[Y > y|X > x]P[X > x] ≥ P[X > x]P[Y > y] ⇔ P[Y > y|X > x] ≥ P[Y > y],
isto é, duas variáveis aleatórias X e Y apresentam dependência positiva em quadrante se for mais provável que aconteça Y > y dado que ocorreu X > x do que seria no caso de X e Y independentes.
Partindo da definição de dependência positiva em quadrante, o conceito de dependência nas caudas, pode ser enxergado, também, em termos de probabilidade condicional. Levando em conta dois riscos associados a duas variáveis aleatórias X e Y , uma medida de dependência na cauda superior é a probabilidade de se observar um valor elevado de X , dado a ocorrência de um valor alto em Y . Formalmente:
Definição 3.3.2 (Parâmetro de dependência na cauda superior): Sejam X e Y variáveis ale-atórias contínuas com funções distribuição acumulada FX e FY, respectivamente. O parâmetro
de dependência na cauda superior λU é dado por:
λU= lim t→1−P[Y > F −1 Y (t)|X > F −1 X (t)]. (3.8)
Diz-se que X e Y apresentam dependência na cauda superior caso o limite acima exista e seja não nulo. Caso λU = 0, não há dependência na cauda superior. Pode ser concluído, portanto,
que dependência na cauda superior é uma forma de dependência positiva em quadrante quando x→ +∞ e y → +∞. De forma análoga, pode-se definir o parâmetro de dependência na cauda inferior, λL, como o limite lim
t→0+P[Y ≤ F
−1
Y (t)|X ≤ F −1 X (t)].
Uma forma alternativa para3.8, em função da cópula de X e Y , tal como apresentado em Nelsen (2006) é a seguinte:
λU = lim t→1−
1 − 2t +C(t,t)
1 − t . (3.9)
Um exemplo de cópula que não apresenta esse tipo de dependência é a gaussiana, que possui coeficiente de dependência na cauda superior λU = 0 para ρ 6= 1 e λU = 1 para o caso
de dependência perfeita (ρ = 1) (DENUIT et al., 2005, p. 218).
3.4 Cópulas de valores extremos
O conceito de cópula de valores extremos parte da aproximação multivariada da teoria dos valores extremos, construída na seção 3.2. Essa família de cópulas é derivada, via teorema de Sklar, da G(x,y) em (3.6), isto é, as cópulas obtidas a partir de G(x,y) são chamadas de cópulas de valores extremos.