• Nenhum resultado encontrado

Eventos caudais na prática : modelagem bayesiana via cópulas

N/A
N/A
Protected

Academic year: 2021

Share "Eventos caudais na prática : modelagem bayesiana via cópulas"

Copied!
152
0
0

Texto

(1)

Instituto de Matemática, Estatística e

Computação Científica

RAFAEL RODRIGUES DE MORAES

Eventos caudais na prática : modelagem

bayesiana via cópulas

Campinas

2020

(2)

Eventos caudais na prática : modelagem bayesiana via

cópulas

Dissertação apresentada ao Instituto de Mate-mática, Estatística e Computação Científica da Universidade Estadual de Campinas como parte dos requisitos exigidos para a obtenção do título de Mestre em Estatística.

Orientadora: Verónica Andrea González López

Este exemplar corresponde à versão

final da Dissertação defendida pelo

aluno Rafael Rodrigues de Moraes e

orientada pela Profa. Dra. Verónica

Andrea González López.

Campinas

2020

(3)

Biblioteca do Instituto de Matemática, Estatística e Computação Científica Ana Regina Machado - CRB 8/5467

Moraes, Rafael Rodrigues de,

M791e MorEventos caudais na prática : modelagem bayesiana via cópulas / Rafael Rodrigues de Moraes. – Campinas, SP : [s.n.], 2020.

MorOrientador: Verónica Andrea González-López.

MorDissertação (mestrado) – Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica.

Mor1. Cópulas (Estatística matemática). 2. Teoria dos valores extremos. 3. Inferência bayesiana. 4. Desigualdades sociais. 5. Barragens de rejeitos. I. González-López, Verónica Andrea, 1970-. II. Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica. III. Título.

Informações para Biblioteca Digital

Título em outro idioma: Tail events in practice : bayesian modelling using copulas Palavras-chave em inglês:

Copulas (Mathematical statistics) Extreme value theory

Bayesian inference Social inequalities Tailings dams

Área de concentração: Estatística Titulação: Mestre em Estatística Banca examinadora:

Verónica Andrea González-López [Orientador] Mariela Fernández

Márcio Luis Lanfredi Viola

Data de defesa: 29-06-2020

Programa de Pós-Graduação: Estatística

Identificação e informações acadêmicas do(a) aluno(a)

- ORCID do autor: https://orcid.org/0000-0002-5782-3839 - Currículo Lattes do autor: http://lattes.cnpq.br/3112015760652111

(4)

pela banca examinadora composta pelos Profs. Drs.

Prof(a). Dr(a). VERÓNICA ANDREA GONZÁLEZ LÓPEZ

Prof(a). Dr(a). MÁRCIO LUIS LANFREDI VIOLA

Prof(a). Dr(a). MARIELA FERNÁNDEZ

A Ata da Defesa, assinada pelos membros da Comissão Examinadora, consta no SIGA/Sistema de Fluxo de Dissertação/Tese e na Secretaria de Pós-Graduação do Instituto de Matemática, Estatística e Computação Científica.

(5)

Ao meu grande amor, minha companheira Claudia pela convivência e co-evolução. Sem sua ajuda eu não teria superado os momentos mais críticos pelos quais passei nos últimos 3 anos. A você devo a ousadia de voltar, fazer o mestrado e levantar a cabeça novamente.

Aos meus pais Marta e Marçal pelo amor incondicional com o qual sempre pude contar em todos os momentos de vida pelos quais passei até hoje. Ambos constituem-se nos meus exemplos concretos de bondade e compaixão e, junto com os ensinamentos budistas, formam a base de meus valores e moralidade.

Ao meu amor Claudia, às amigas Daniela Badi Abrahms e Camila Pedroso Estevam e às Profas. Dras. Nancy Lopes Garcia e Hildete Pinheiro Prisco pelo encoraja-mento no moencoraja-mento em que o mestrado era somente um desejo incerto, planejado durante o início do inverno alemão de 2017, 4 meses antes de minha volta ao Brasil.

À Profa. Dra. Verónica Andrea González-Lopez, por quem tenho grande ad-miração, pela orientação de minha dissertação, pelo curso impecável de probabilidade (MI401A-2018/1S) e pela inspiração na estatística bayesiana.

Aos meus Professores do Departamento de Estatística do IMECC/Unicamp, tanto de graduação (2001-2006) quanto de mestrado (2018-2020), por viabilizarem a expansão e consolidação de meus conhecimentos em estatística, recordando-me da excelência desta universidade, à qual devo praticamente todo o meu conhecimento técnico-científico.

Aos colegas do Mestrado em Estatística pela convivência bem humorada, especialmente nas épocas de exame de qualificação: Amanda Merian Freitas Mendes, Thainá Soares Silva, Hugo Calegari, Leonardo Uchoa Pedreira, Sergio Henrique Andrade de Azevedo, Matheus Gorito de Paula e Jose Edmilson Ferreira.

Ao Prof. Dr. Roberto do Carmo e aos colegas da Pós-Graduação em Demografia, companhias enriquecedoras nas discussões e leituras dirigidas.

Aos membros da banca examinadora, PhD. Mariela Fernández e Prof. Dr. Márcio Luis Lanfredi Viola, pelos seus comentários construtivos.

Ao Conselho Nacional de Desenvolvimento Científico e Tecnológico - CNPq pelo privilégio de dedicação exclusiva ao mestrado no período de 01/08/2018 a 30/11/2018 por meio do processo 134682/2018-1, GM/GD-Cotas do Programa de Pós-Graduação.

O presente trabalho foi realizado com apoio da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - Brasil (CAPES) - Código de Financiamento 001.

(6)

e apanhar o que ficou atrás.” Provérbio Akan

(7)

O presente trabalho tem como objetivo analisar a dependência entre variáveis aleatórias de interesse ao inspecionar o comportamento da probabilidade condicional de valores caudais (extremos). A análise estatística será feita por meio da Teoria de Cópulas, usando estimação bayesiana dos parâmetros que indexam a família de cópulas. A estimação de cópulas concerne somente à dependência entre as variáveis e nessa dissertação suas marginais são estimadas transformando as variáveis originais em pseudo-observações para, a partir disso, trabalhar apenas com a cópula. A estimação deste parâmetro será feita via métodos bayesianos de simulação baseados em algoritmos de Monte Carlo Hamiltoneano (HMC). Por fim, a probabilidade condicional associada a valores caudais pode ser reescrita em termos da função de cópula e, consequentemente, calculada a partir do parâmetro estimado de acordo com um determinada função de perda. Ao concluir o trabalho, a dependência estatística entre variáveis relevantes à população de interesse nas caudas (valores extremos) será quantificada em 3 aplicações distintas – (1) relação entre o índice de Gini e o percentual da renda nacional concentrada no 1% mais rico em sociedades organizadas, com melhor ajuste via cópula de Joe corroborando a forte associação positiva e existência de dependência caudal à direita, ou seja, países com pior distribuição de renda concentram mais a renda no 1% mais rico da sociedade; (2) relação entre o volume total antes da quebra, o volume liberado de rejeitos e a distância percorrida em km nos casos de quebras de barragens conhecidos, com ajustes igualmente eficientes via cópulas gaussiana e Gumbel-Hougaard, que permitem confirmar distâncias extremas dado um elevado fator de barragem; e (3) relação entre idade média ao morrer e percentual da população preta e parda em bairros de São Paulo, com melhores ajustes via cópula de Frank e gaussiana, em que à medida que o percentual de pretos e pardos aumenta e troca de faixa, a idade média cai 10 anos, ratificando a desigualdade racial entre bairros de SP. Por fim, será documentada a análise de convergência do parâmetros obtidos através das simulações estocásticas.

Palavras-chave: cópulas, teoria dos valores extremos, inferência bayesiana, desigualdade

(8)

The goal of the current study is to analyze the dependence between random variables by assessing the conditional probability at tail values (extreme values). The statistical analysis will be done with the theory of copulas, thereby estimating the indexing parameters of the copula family with bayesian methods. The copula estimation concerns only the dependence structure between the random variables at hand and, in this master thesis, the marginal distributions are to be estimated by first transforming them into pseudo-observations and later concentrating only in the copula. The estimation of this parameter will be made with bayesian simulation methods based on Hamiltonean Monte Carlo (HMC). Finally, the conditional probability associated to tail values can be expressed in terms of the copula function and accordingly calculated using the estimated parameter. Upon concluding this study, the statistical dependency between random variables in the tails will be quantified among 3 distinct applications – (1) relation between Gini’s Inequality Index and total income concentration in the richest 1%, with best model being the Joe copula attesting the strong positive association and right tail dependence, in other words, countries with greatest income inequality tend to concentrate its income among the top 1% richest citzens; (2) relation between total volume before the dam breaking, released tailings volume and the traveled distance by the tailings in case of known tailings dams failures, with equally good fits given by Gaussian and Gumbel-Hougaard copulas, which confirm great distances travelled given an elevated damfactor; and (3) relation between the age at death and proportion of black and brown population among all districts of São Paulo, with better fits given by Gaussian and Frank copulas, where an increasing range of percentage of black and brown people corresponds to an average 10 years decline in the mean age at death, signaling the race inequality between neighbourhoods in the city of São Paulo . Finally, the documentation of the convergence of dependency measures estimates, obtained by means of stochastic simulations, will be laid out.

Keywords: copulas, extreme value theory, bayesian inference, income inequality, tailings

(9)

v.a. variável aleatória

a.a. amostra aleatória

iid independente e identicamente distribuído

fda função de distribuição acumulada

(10)

1tAu Função indicadora; assume o valor 1 se o evento A ocorre e 0 caso

contrário. Possui distribuição Bernoulli(P pAq).

I Intervalo r0, 1s

I2 Quadrado unitário r0, 1s ˆ r0, 1s

R linha real ordinária p´8, 8q

R linha real extendida r´8, 8s

R2 plano real extendido R ˆ R “ r´8, 8s ˆ r´8, 8s

X „ F A v.a. X tem (função de) distribuição F

X “ YD A v.a. X tem a mesma distribuição que a v.a. Y

F pxq Função distribuição acumulada de X, definida como P pX ď xq F pxq Função de sobrevivência de X, definida como

P pX ą xq “1 ´ P pX ď xq “ 1 ´ F pxq

Hpx, yq P pX ď x, Y ď yq, a distribuição bivariada conjunta de pX, Y q Hpx, yq P pX ě x, Y ě yq, a função de sobrevivência conjunta de pX, Y q F p´8q lim

xÑ´8F pxq

F p`8q lim

xÑ`8F pxq

Cpu, v|θq Família de cópulas de pU, V q indexada pelo parâmetro de associação θ

(11)

Introdução . . . 13

1 DEPENDÊNCIA ENTRE VARIÁVEIS ALEATÓRIAS . . . 17

1.1 Problemas reais . . . 17 1.1.1 Quebras de barragens . . . 17 1.1.2 Desigualdade de Renda . . . 19 1.1.3 Mapa da Desigualdade . . . 19 1.2 Fundamentos de cópulas . . . 20 1.2.1 Teorema de Sklar . . . 27

1.2.2 Alguns aspectos da dependência . . . 28

1.3 Quantificação da relação entre variáveis aleatórias . . . 31

1.4 Problemas reais definidos em termos das cópulas . . . 40

1.4.1 Cópula bivariada empírica . . . 42

1.5 Conclusão . . . 46 2 MODELOS DE CÓPULAS . . . 47 2.1 Cópulas Elípticas . . . 47 2.1.1 Cópula Gaussiana . . . 49 2.1.2 Cópula de T-Student . . . 51 2.2 Cópulas Arquimedianas . . . 52 2.2.1 Cópula Frank . . . 61 2.2.2 Cópula Gumbel-Hougaard . . . 62 2.2.3 Cópula Joe . . . 64

2.3 Alguns testes de hipóteses sob o escopo de cópulas . . . 65

2.3.1 Independência . . . 66

2.3.2 Simetria radial e permutabilidade. . . 67

2.3.3 Aplicação dos testes nos problemas reais . . . 68

2.4 Diagnósticos gráficos. . . 68

2.4.1 Chi-Plot . . . 69

2.4.2 K-Plot. . . 69

2.4.3 Diagnósticos gráficos nos problemas reais . . . 70

2.5 Conclusão . . . 73

3 ESTIMAÇÃO DA DEPENDÊNCIA . . . 74

3.1 Estimação ingênua do parâmetro da cópula . . . 74

(12)

3.3 Método de Máxima Verossimilhança . . . 87

3.4 Tipos de estimação via Teorema de Sklar. . . 91

3.4.1 Estimação Paramétrica Completa . . . 93

3.4.2 Estimação Semi-Paramétrica . . . 95

3.4.3 Estimação Não Paramétrica Completa . . . 96

3.5 Critério de informação bayesiano . . . 99

3.6 Conclusão . . . 100

4 PROBLEMAS REAIS ABORDADOS A PARTIR DA DEPENDÊNCIA101 4.1 Análise de dados . . . 102 4.2 Desigualdade de Renda . . . 103 4.3 Quebras de barragens . . . 109 4.4 Mapa da Desigualdade. . . 117 4.5 Conclusão . . . 123 5 CONCLUSÕES . . . 124 5.1 Trabalhos Futuros . . . 125 REFERÊNCIAS . . . 127

APÊNDICE A – RESULTADOS ADICIONAIS DE CÓPULAS . . . 133

A.1 Cópulas de transformações estritamente monótonas de v.a.’s . . . . 133

A.2 Cópula de Sobrevivência . . . 135

APÊNDICE B – DEPENDÊNCIA CAUDAL . . . 138

B.1 Propriedades adicionais das cópulas elementares . . . 143

APÊNDICE C – INTEGRAÇÃO DE CÓPULAS . . . 144

APÊNDICE D – OUTRAS FAMÍLIAS DE CÓPULAS . . . 145

D.1 Cópula Clayton . . . 145

D.2 Cópula Ali-Mikhail-Haq . . . 147

D.3 Cópula FGM (Farlie-Gumbel-Morgenstern) . . . 148

APÊNDICE E – PROGRAMAÇÃO PROBABILÍSTICA - STAN & GNU R . . . 150

(13)

Introdução

Atualmente, bastante difundidas, principalmente, em aplicações de engenharia e finanças, as cópulas constituem-se em uma teoria recente dentro da Estatística e sua descoberta remonta a não mais do que 80 anos.

Féron (1956) definiu funções auxiliares com suporte no cubo unitário (r0, 1s ˆ r0, 1s ˆ r0, 1s) que lhe permitissem conectar as distribuições trivariadas de seu interesse às respectivas distribuições marginais univariadas fixadas. Apesar de ter sido objeto de estudo de vários pesquisadores como Fréchet, Dall‘Aglio, Féron e Hoeffding, foi Abe Sklar quem notou que funções similares poderiam ser definidas no hipercubo unitário n-dimensional que igualmente ligavam a distribuição conjunta n-dimensional às distribuições univariadas marginais (Sklar (1996),Sklar (1959)).

Após sua descoberta, as cópulas foram, inicialmente, empregadas no esforço de desenvolvimento da teoria conhecida, atualmente, como espaços métricos probabilísticos (Nelsen (2007)).

A noção de espaço métrico introduzida por Fréchet (1906) lida genericamente como a distância entre objetos – denominada métrica naquele ramo da matemática (Schweizer e Sklar (1960)). Pode-se definir uma métrica d num conjunto N como uma função d : N ˆ N Ñ R que mede a distância de x a y, x, y P R, denotada por dpx, yq, respeitando as condições i. dpx, xq “ 0, ii. dpx, yq ą 0 ðñ x ‰ y, iii. dpx, yq “ dpy, xq e iv. dpx, zq ď dpx, yq ` dpy, zq, para x, y, z P N, sendo a última condição conhecida como a desigualdade triangular, válida em qualquer espaço euclidiano (Lima (1983)). O

espaço métrico é definido então como o par pN, dq, em que N é um conjunto e d uma

métrica em N.

Como contextualizado em Schweizer e Sklar (1960), há muitas situações nas quais a associação entre um único número (distância) e um par de elementos não é realista, por exemplo, quando à cada medição está associada uma variabilidade, tanto do instrumento de medida quanto de quem realiza a medição. Desta maneira, torna-se mais intuitivo abordá-la em termos estatísticos (estocásticos), como o resultado da média de uma série de diferentes medições. A linguagem natural para descrever a natureza estocástica de tal série de medições é a probabilidade. Ainda segundo Schweizer e Sklar (1960), ao invés de associar ao par de elementos pp, qq um único número dpp, qq, associa-se a ele uma função distribuição de probabilidade Fpq e, para cada número positivo x, interpreta-se Fpqpxq como a probabilidade de que a distância entre p e q seja inferior a x. Esta generalização do conceito de espaço métrico foi introduzida por Menger (1942), motivo pelo qual o atualmente denominado espaço métrico probabilístico era originalmente chamado de espaço

(14)

métrico estatístico.

Das tentativas e consequentes dificuldades inerentes à investigação sobre a validade da desigualdade triangular nesses espaços métricos resultou o surgimento da classe de normas triangulares arquimedianas; se possuírem características de cópulas, essas funções são denominadas cópulas arquimedianas (Nelsen (2007, p. 3)). Da mesma forma que trabalhar com distribuições de probabilidade é mais conveniente dentro da família exponencial (Bickel e Doksum (2015)), as cópulas arquimedianas permitem um ambiente de trabalho muito profícuo às aplicações. Dentre as vantagens pode-se elencar a facilidade com a qual elas podem ser construídas e a grande variedade de cópulas pertencentes a essa família (Nelsen (2007, p. 109)); os pacotes estatísticos como o copula no R dispõem de muitas das cópulas arquimedianas já programadas e prontas para serem utilizadas em aplicações.

Quando todas as distribuições marginais univariadas são absolutamente con-tínuas, o Teorema de Sklar garante tanto a existência quanto a unicidade da cópula que as une, permitindo a reconstrução da distribuição acumulada conjunta Seção 1.2.1. Nas aplicações nesta dissertação as variáveis aleatórias são consideradas absolutamente contínuas. As cópulas discretas são objeto de intensa pesquisa, por exemplo nos trabalhos de Genest e Nešlehová (2007), Faugeras (2017), Genest et al. (2014), Nikoloulopoulos e Karlis (2009) e Nikoloulopoulos(2013), e fogem do escopo desta dissertação.

Em consequência do teorema da transformada integral da probabilidade, que estabelece que a função de distribuição acumulada F avaliada na variável aleatória absolu-tamente contínua X resulta em uma variável aleatória com distribuição uniforme, ou seja,

Z “ F pXq „ U p0, 1q (Casella e Berger(2002, p. 54)), a modelagem dos problemas

aborda-dos nessa dissertação torna-se mais parcimoniosa, uma vez que as marginais são estimadas de forma não-paramétrica, o que possibilita quantificar unicamente a dependência entre as variáveis aleatórias através das funções de cópula.

Por serem invariantes às transformações estritamente monótonas de variáveis aleatórias (ver Seção A.1), as cópulas conseguem captar puramente a dependência entre elas, contanto que as distribuições marginais univariadas sejam modificadas de maneira estritamente monótona. Medidas de dependência baseadas nos postos das observações podem ser escritas em função de cópulas e oferecem um contraponto robusto e racional à utilização indiscriminada de medidas como a correlação de Pearson, que mede somente a associação linear entre variáveis. Com base no conceito de concordância, que mede se valores de uma variável tendem a aumentar (diminuir) à medida que os valores da outra variável aumentam (diminuem), foram propostas medidas alternativas de dependência como o τ de Kendall, o ρS de Spearman e os coeficientes de dependência caudal λL e λU. Tais medidas são discutidas na Seção 1.2.2e Apêndice B.

(15)

modelagem de eventos raros, nos quais há a ocorrência de valores extremos nos domínios das variáveis aleatórias, daí o termo alternativo denotado por eventos caudais, relativos por exemplo ao comportamento do vetor bivariado pX, Y q „ H, onde X „ F e Y „ G. Ao traduzir questões práticas de interesse do pesquisador em expressões probabilísticas do tipo

P pX ą x|Y ą yq, pode-se mostrar que ao desenvolver analiticamente esta probabilidade

condicional, chega-se a uma expressão que pode ser escrita como função da distribuição conjunta P pX ď x, Y ď yq, que por sua vez pode ser reescrita em termos de uma cópula

CpF pxq, Gpyq|θq, indexada pelo parâmetro θ, não necessariamente unidimensional. Ou

seja, pode-se modelar indiretamente a distribuição conjunta entre X e Y por meio da cópula ao estimar o parâmetro θ, denominado comumente de parâmetro de associação.

Como o parâmetro de associação está matematicamente associado a algumas medidas de dependência, como o τ de Kendall, por exemplo. Ao calcular o τ de Kendall empírico dos dados e encontrar o θ empírico correspondente, pode-se compará-lo com o suporte de θ de diferentes famílias de cópulas, possibilitando a identificação das cópulas que são inicialmente mais apropriadas aos dados. Tal análise não isenta uma inspeção visual da estrutura de dependência entre os dados padronizados pelos postos com o intuito de descartar determinadas cópulas teóricas, nos casos em que sua estrutura não seja aderente aos padrões presentes no gráfico empírico de comparação dos postos das observações.

Como ocorre em praticamente todo problema de estimação, a escolha da me-lhor maneira de estimar o parâmetro cabe ao usuário e as possibilidades são os métodos não-paramétricos, semi-paramétricos e completamente paramétricos tanto de forma fre-quentista quanto de forma bayesiana, sujeitas às vantagens e desvantagens próprias de cada abordagem. A ênfase nesta dissertação será dada aos métodos bayesianos por permitirem a flexibilidade de atribuição de distribuições a priori dos parâmetros e, consequentemente, pela caracterização probabilística do parâmetro de interesse através de simulações de Monte Carlo Hamiltoneano (HMC). O interesse reside também no cálculo de uma banda de credibilidade para essas probabilidades condicionais com base nas simulações da posteriori.

Nas 3 aplicações desta dissertação o interesse recai em retratar a relação de dependência em casos reais: (1) relação entre o índice de Gini e o percentual da renda nacional concentrada nos 1% indivíduos mais ricos em sociedades organizadas, (2) relação entre o volume total liberado e a distância máxima percorrida pelos rejeitos em caso de quebra de barragens e (3) relação entre idade média ao morrer e percentual da população preta e parda em bairros de São Paulo. Adicionalmente, o interesse é responder a questões que podem ser colocadas em termos de probabilidades condicionais e de esperanças condicionais, que envolvam as cópulas.

A dissertação está estruturada como a seguir.

No Capítulo 1 aborda-se a dependência entre variáveis aleatórias via cópulas, são apresentadas as aplicações e suas questões de interesse formuladas em termos das

(16)

cópulas e apresentam-se os fundamentos das funções de cópula, além de aspectos como simetria, permutabilidade, função concordância e as pseudo-observações.

No Capítulo 2 são vistas as classes de cópulas elípticas e arquimedianas, além dos testes de hipótese de independência, simetria radial e permutabilidade bem como os diagnósticos gráficos K-Plot e Chi-Plot para atestar existência de dependência nos dados.

NoCapítulo 3são vistos os métodos que permitem ajustar as cópulas aos dados através da estimação de seu parâmetro de associação, o critério de ajuste BIC para escolha do melhor modelo, bem como a relação entre o τ de Kendall e a função de cópula. Neste capítulo também é contextualizada, brevemente, a inferência bayesiana e as simulações da distribuição a posteriori.

No Capítulo 4 são apresentadas as análises para as aplicações com base em problemas reais, definidos previamente ao longo da dissertação. A primeira aplicação aborda a desigualdade de renda nos países e estuda a dependência entre o índice de gini e o percentual de renda concentrada no 1% mais rico da sociedade. A segunda aplicação trata das quebras de barragens de rejeitos industriais e utiliza o conhecimento prévio e dados de quebras de barragens ao redor do mundo como variáveis preditoras da distância em km percorrida com base no volume de rejeitos liberados em caso de quebra da barragem. A terceira aplicação aborda a desigualdade racial e busca analisar a dependência entre o percentual da população preta/parda e a idade média ao morrer dos bairros da cidade de São Paulo.

(17)

1 Dependência entre variáveis aleatórias

Neste capítulo aborda-se a dependência entre variáveis aleatórias via cópulas, começando porém pela Seção 1.1em que são apresentadas as aplicações e as questões de interesse formuladas em termos das cópulas, motivando a discussão por vir sobre classes de cópulas, determinação da família de cópula mais adequada aos dados, testes de hipóteses, diagnósticos gráficos e estimação.

Na Seção 1.2 são apresentados os fundamentos das funções de cópula, as propriedades que as caracterizam, a interpretação geométrica de onde as cópulas estão definidas e, na Seção 1.2.1, o Teorema de Sklar.

Na Seção 1.2.2 são vistos, em detalhes, alguns aspectos importantes da depen-dência como a simetria e permutabilidade, necessários para justificação teórica dos testes de hipóteses a serem vistos em detalhes na Seção 2.3. Também é introduzida a função de concordância que possibilita definir as medidas de dependência, como τ de Kendall e ρS de Spearman, em termos da função de cópula.

Por fim, ao discutir sobre a função de cópula empírica discute-se as pseudo-observações, uma transformação efetuada nas observações originais e que possibilita realizar a estimação de funções de cópula, a ser vista em detalhes no Capítulo 3.

1.1

Problemas reais

1.1.1

Quebras de barragens

Os desastres ambientais de Mariana (05/11/2015) e Brumadinho (25/01/2019) possibilitaram a retomada da discussão sobre a estabilidade e segurança das barragens utilizadas para contenção de rejeitos oriundos da atividade de mineração, que representa um alto risco ambiental, bem como social e econômico para as regiões onde ocorre a mineração, apesar da contrapartida financeira decorrente da exportação das commodities associadas à mineração.

Dentre os tipos de barragens destacados na Seção 1.1.1, o mais instável e propenso às falhas estruturais é o alteamento a montante, de custo inferior em relação aos demais por utilizar a menor quantidade de material de suporte à estrutura da barragem. Além disso esse tipo de construção deve ser adotado somente em locais com clima seco devido ao risco elevado de liquefação. Lamentavelmente, este é o tipo de construção mais utilizado nas barragens brasileiras, apesar de construções como a linha de centro, que oferecem mais segurança a um custo inferior do alteamento a jusante, o tipo mais seguro

(18)

de barragens de rejeitos.

Figura 1.1 – Tipos de Construção de Barragens de Rejeitos

(a) A montante (b) A jusante (c) Linha de centro

Nota: (a) Deve ser usado somente em climas secos; drenagem é uma questão chave da segurança. (b) Mais seguro de todos, a desvantagem é o volume de material empregado na escoragem dos

rejeitos.

(c) Compromisso entre alteamento a montante e alteamento a jusante.

Por causa do alto risco ambiental, há o interesse da comunidade científica e dos governos na estimação da extensão dos danos ambientais, seja pela distância máxima percorrida pelos rejeitos, seja pelo volume total liberado em caso de quebra da barragem.

Com base nos dados prévios de quebras de barragens compilados por Larrauri e Lall (2018), as seguintes variáveis podem ser usadas na modelagem

VF o volume total de rejeitos, em 106m3, liberado na quebra da barra-gem;

Dmax a distância total, em km, percorrida pelos rejeitos após a quebra da barragem;

VT a capacidade total da barragem, em 106m3;

H a altura (em metros) dos rejeitos no momento da quebra da

barra-gem.

Adicionalmente às variáveis acima, os autores complementaram o artigo original de Rico, Benito e Diez-Herrero (2008) ao introduzirem as seguintes variáveis preditoras de

Dmax e duas noções de fator de risco (Damfactor): (1) H ˆ VF e (2) Hf “ H ˆ

VF

VT

ˆ VF, onde o segundo fator de risco é uma adaptação do primeiro e relativo à razão entre o volume vazado e o volume total da barragem.

O interesse imediato nessa aplicação é estimar a extensão, em km, percorrida pelos rejeitos em caso de quebra de barragem após modelar a dependência entre damfactor e Dmax. Uma vez modelada a dependência via cópulas e estimação bayesiana, dado um intervalo de damfactor, será estimada a probabilidade de a distância percorrida pelos rejeitos (Dmax) superar um limiar de interesse.

(19)

1.1.2

Desigualdade de Renda

Piketty(2014), em seu tratado sobre a desigualdade e crescente concentração de renda, aponta que as principais economias ocidentais, ao reduzirem as alíquotas de impostos mais elevadas destinadas às grandes fortunas e rendas, permitiram uma concentração de renda nos 1% indivíduos mais ricos, fazendo com que a desigualdade atual se aproxime daquela observada na antevéspera da primeira guerra mundial. Aquele trabalho mudou o foco da discussão sobre desigualdade para a concentração de renda no 1% mais rico. No relatório OECD(2014), é recomendado tanto aos países membros quanto aos não membros, medidas concretas para reduzir a desigualdade de renda e suas consequências.

A motivação desta aplicação provém de OECD (2014), no qual foi consta-tada uma associação positiva entre concentração e desigualdade de renda. Com base em informações do ano de 2013, buscou-se quantificar a dependência utilizando-se as variáveis

p99p100 % da renda concentrada no 1% mais rico (pré-tributação)1 gini Índice de gini, (pós-tributação).2

O interesse consiste então em estimar o grau de associação entre a desigualdade de renda e a concentração de renda no 1% mais rico, na situação em que a renda já é muito concentrada no 1% mais rico da sociedade, ou seja, um evento extremo (caudal).

1.1.3

Mapa da Desigualdade

O objetivo desta aplicação é quantificar a desigualdade racial em 96 bairros da cidade de São Paulo, tendo como base o levantamento Mapa da Desigualdade 2019, de autoria da Rede Nossa São Paulo, “uma organização da sociedade civil que tem por missão mobilizar diversos segmentos da sociedade para, em parceria com instituições públicas e privadas, construir e se comprometer com uma agenda e um conjunto de metas, articular e promover ações, visando a uma cidade de São Paulo justa, democrática e sustentável”3.

A inspiração provém da reportagem feita pela agência de jornalismo investiga-tivo e independente Agência Pública4 que uniu dois indicadores do Mapa da Desigualdade 2019:

pct Proporção da população preta e parda em relação ao total da

população

1 Fonte: World Inequality Database,<https://wid.world.data/>. 2 Fonte: Banco Mundial,

<https://data.worldbank.org/>

3 <https://www.nossasaopaulo.org.br/quemsomos/#rnsp>, acessada em 29/2/2020.

4 <https://apublica.org/2019/11/na-periferia-de-sao-paulo-morte-chega-20-anos-mais-cedo-que-em-bairros-ricos>, de

(20)

idade Média de idade com que as pessoas morreram.

Nesta aplicação o interesse consiste em estimar a idade média ao morrer com base em alguns intervalos definidos de proporção da população preta e parda, ou seja, dado um percentual de pretos e pardos pertencente a um intervalo determinado, qual é a idade média ao morrer?

1.2

Fundamentos de cópulas

Sabe-se da teoria de probabilidade que de posse da função distribuição acumu-lada obtém-se a caracterização completa de uma variável aleatória.

Generalizar a função de distribuição acumulada para dimensões superiores é uma condição necessária tanto para o estudo da dependência de variáveis aleatórias quanto para o estudo das cópulas e pressupõe a definição dos conceitos correspondentes às propriedades da função distribuição acumulada no caso univariado, como continuidade à direita, monotonicidade crescente, limites F p´8q “ 0 e F p`8q “ 1 e, finalmente, dado o intervalo pa, bs, a relação P pa ă X ď bq “ F pbq ´ F paq ě 0.

Definem-se previamente

• um retângulo B em R2 como o produto cartesiano de dois

inter-valos fechados B – rx1, x2s ˆ ry1, y2s de vértices px1, y1q, px1, y2q,

px2, y1q e px2, y2q, onde x1 ă x2 e y1 ă y2.

• e o operador H-Volume de B, aplicado em uma função Hpx, yq, como VHpBq – Hpx2, y2q ´ Hpx2, y1q ´ Hpx1, y2q ` Hpx1, y1q,

po-dendo também ser expresso como a diferença de segunda ordem

VHpBq “yy21∆ x2 x1Hpx, yq, onde ∆ x2 x1Hpx, yq “ Hpx2, yq ´ Hpx1, yq e ∆y2 y1Hpx, yq “ Hpx, y2q ´ Hpx, y1q.

Segundo Nelsen (2007, p. 8), a função Hpx, yq é denominada bi-crescente quando VHpBq ě0 para todo e qualquer retângulo B pertencente ao seu domínio e o fato de uma função Hpx, yq ser bi-crescente não implica que Hpx, yq seja marginalmente não decrescente em cada argumento e o inverso tampouco vale, ou seja, o fato de uma função

Hpx, yq ser marginalmente não-decrescente não implica que ela será bi-crescente, como se

pode notar nos seguintes exemplos:

Exemplo 1.1 (Exemplo 2.1 de Nelsen (2007)). Seja H : I2 Ñ r0, 1s tal que Hpx, yq “

maxpx, yq e I2 “ r0, 1s ˆ r0, 1s. Dados x

1, x2, y P r0, 1s tais que x1 ď x2, deseja-se apurar

(21)

• 0 ď y ď x1 ď x2 ď 1, o que implica que maxpx1, yq “ x1 e

maxpx2, yq “ x2; porém como x1 ď x2 tem-se que maxpx1, yq ď

maxpx2, yq

• 0 ď x1 ď y ď x2 ď 1, o que implica que maxpx1, yq “ y e

maxpx2, yq “ x2; porém como neste caso y ď x2 por construção,

tem-se que maxpx1, yq ďmaxpx2, yq

• 0 ď x1 ď x2 ď y ď 1, o que implica que maxpx1, yq “ y e

maxpx2, yq “ y, e como y ď y, tem-se que maxpx1, yq ďmaxpx2, yq

O mesmo raciocínio vale para o argumento y e portanto demonstra-se que Hpx, yq “

maxpx, yq é marginalmente não decrescente em ambos os argumentos x e y. Por outro

lado, VHpI2q “ VHpr0, 1s ˆ r0, 1sq “ Hp1, 1q ´ Hp1, 0q ´ Hp0, 1q ` Hp0, 0q “ maxp1, 1q ´ maxp1, 0q ´ maxp0, 1q ` maxp0, 0q “ 1 ´ 1 ´ 1 ` 0 “ ´1, ou seja, a função H não é

bi-crescente.

Exemplo 1.2 (Exemplo 2.2 de Nelsen (2007)). Seja H : I2 Ñ r0, 1s tal que Hpx, yq “

p2x ´ 1qp2y ´ 1q; adicionalmente sejam x1, x2, y1, y2 P I tais que x1 ď x2 e y1 ď y2. Então

VHprx1, x2s ˆ ry1, y2sq “ p2x2 ´1qp2y2 ´1q ´ p2x1qp2y1 ´1q ´ p2x1 ´1qp2y2 ´1q `

p2x1´1qp2y1q “ rp2x1q ´ p2x1qsp2y1q ´ rp2x1q ´ p2x1qsp2y1´1q “

2px2´x1qrp2y2´1q´p2y1´1qs “ 2px2´x1q2py2´y1q ě 0, ou seja, Hpx, yq “ p2x´1qp2y´1q

é bi-crescente.

Finalmente, x1 ď x2 ðñ 2x1 ď 2x2 ðñ p2x1 ´1q ď p2x2 ´ 1q e

p2x1 ´1qp2y ´ 1q ď p2x2 ´1qp2y ´ 1q para 2y ´ 1 ě 0 ðñ y P r1{2, 1s, ou seja,

Hpx, yq “ p2x ´ 1qp2y ´ 1q é marginalmente não decrescente somente para determinados valores de x e y.

Um vez respeitada a condição de monotonicidade não-descrescente, tanto conjunta quanto marginal, segue que a função Hpx, yq é monótona não-decrescente em ambos os argumentos simultaneamente e neste caso é denominada, alternativamente,

quase-monótona (Shemyakin e Kniazev (2017, p. 197)).

Para estabelecer a continuidade das subcópulas e das cópulas, definidas mais adiante, são necessários três lemas, descritos na sequência:

Lema 1.1 (Monotonicidade em cada argumento da função H). Sejam S1 e S2 subconjuntos

próprios não vazios de R, sendo R “ r´8, 8s, e H uma função bivariada quase-monótona (bi-crescente) com domínio em S1 ˆ S2. Além disso, sejam x1, x2 P S1 com x1 ď x2 e

y1, y2 P S2 com y1 ď y2. Então a função t ÞÑ Hpt, y2q ´ Hpt, y1q é não decrescente em S1 e

(22)

Demonstração. Como H é bi-crescente segue que VHprx1, x2s ˆ ry1, y2sq “ Hpx2, y2q ´

Hpx2, y1q ´ Hpx1, y2q ` Hpx1, y1q ě 0, o que equivale a Hpx1, y2q ´ Hpx1, y1q ď Hpx2, y2q ´

Hpx2, y1q, portanto a função t ÞÑ Hpt, y2q ´ Hpt, y1q é não decrescente em S1.

Analogamente, VHprx1, x2s ˆ ry1, y2sq “ Hpx2, y2q ´ Hpx2, y1q ´ Hpx1, y2q `

Hpx1, y1q ě0 equivale a Hpx2, y1q ´ Hpx1, y1q ď Hpx2, y2q ´ Hpx1, y2q, portanto a função

t ÞÑ Hpx2, tq ´ Hpx1, tq é não decrescente em S2.

Supondo existentes a1 e a2, os menores elementos de S1 e S2, respectivamente,

a função H : S1 ˆ S2 Ñ R é dita aplanada se Hpx, a2q “ Hpa1, yq “ 0 para todo

px, yq P S1ˆ S2.

Lema 1.2 (Monotonicidade em cada argumento da função aplanada H). Sejam S1 e S2

subconjuntos próprios não vazios de R e H uma função bivariada aplanada quase-monótona (bi-crescente) com domínio em S1ˆ S2. Então H é não decrescente em cada argumento.

Demonstração. Nelsen (2007, p. 9)

Por fim, supondo igualmente existentes b1 e b2, os maiores elementos de S1 e S2,

respectivamente, diz-se que a função H : S1ˆ S2 ÑR tem marginais dadas pelas funções

contínuas F (de domínio S1) e G (de domínio S2), em que F pxq “ Hpx, b2q @x P S1 e

Gpyq “ Hpb1, yq @y P S2. Dado que a função H é aplanada e possui marginais, utiliza-se

o seguinte lema para definir uma subcópula mais adiante.

Lema 1.3 (Continuidade uniforme no domínio de H). Sejam S1 e S2 subconjuntos próprios

não vazios de R e H uma função bivariada aplanada quase-monótona (bi-crescente), com marginais F e G, cujo domínio está em S1ˆ S2. Sejam px1, y1q e px2, y2q pontos quaisquer

em S1 ˆ S2. Então

|Hpx2, y2q ´ Hpx1, y1q| ď |F px2q ´ F px1q| ` |Gpy2q ´ Gpy1q| .

Demonstração. Nelsen (2007, p. 9).

Define-se então uma subcópula como uma classe de funções aplanadas, quase-monótonas e que contém marginais (Nelsen (2007, p. 10)).

Definição 1.1 (Subcópula bivariada). Uma subcópula é uma função C1 com as seguintes

propriedades:

1. DomíniopC1

q “ S1 ˆ S2, onde S1 e S2 são subconjuntos de I e que contém

ambos 0 e 1

(23)

3. Para todos u P S1 e v P S2 valem ambas C1pu,1q “ u e C1p1, vq “ v.

Tanto u quanto v na definição acima pertencem aos subconjuntos contidos em I, portanto a função C1 está contida no intervalo r0, 1s, ou seja, 0 ď C1

pu, vq ď 1 e, consequentemente, a Imagem de C1 é também um subconjunto de I (Nelsen (2007, p. 10)).

Em consequência do Lema 1.3, o teorema a seguir estabelece que a subcó-pula é uma função Lipschitz contínua em I2, ou seja, possui continuidade uniforme e

consequentemente uma limitação na velocidade com a qual sofre alterações5.

Teorema 1.1 (Continuidade uniforme de subcópulas). Seja C1 uma subcópula. Então

para todos os pares ordenados pu1, v1q e pu2, v2q pertencentes ao DomíniopC1q,

|C1pu2, v2q ´ C1pu1, v1q| ď |u2´ u1| ` |v2´ v1| .

Portanto, C1 é uniformemente contínua em seu domínio.

Demonstração. Nelsen (2007, p. 11) em consequência da aplicação da Desigualdade Trian-gular e do Lema 1.3, que por sua vez depende do Lema 1.1 e do Lema 1.2.

Como definido na sequência, toda cópula é uma subcópula, portanto uniforme-mente contínua em seu domínio por consequência do Teorema 1.1.

Definição 1.2 (Cópula bivariada). Uma cópula bivariada é definida como uma

subcó-pula bivariada C cujo domínio é I ˆ I (Nelsen (2007, p. 10)) ou, alternativamente, como a função C : I ˆ I Ñ I tal que (Shemyakin e Kniazev (2017, p. 198))

1. @u P I, Cpu, 0q “ 0 2. @v P I, Cp0, vq “ 0 3. @u P I, Cpu, 1q “ u 4. @v P I, Cp1, vq “ v

5. VCpru1, u2s ˆ rv1, v2sq ě 0 @u1, u2, v1, v2 P I tais que 0 ď u1 ď u2 ď 1 e

0 ď v1 ď v2 ď1

Outra forma de definir a cópula bivariada é como a distribuição conjunta de variáveis aleatórias cujas distribuições marginais tenham distribuição Up0, 1q e tal fato ficará mais evidente por meio do Teorema 1.3 mais a frente.

Dependendo do contexto e, principalmente, quando for necessário enfatizar o parâmetro de associação θ da cópula, será feito o uso da notação Cpu, v|θq ao invés da 5 uma função real f :

R Ñ R é Lipschitz contínua se existir um número real k tal que, para x1 e x2

(24)

Tabela 1.1 – Verificação da propriedade VMpBq ě0 para a cópula Mpu, vq “ minpu, vq. Combinações possíveis VMpBq 0 ď u1 ď v1 ď v2 ď u2 ď1 v2´ v1´ u1 `u1 ě0 0 ď u1 ď v1 ď u2 ď v2 ď1 u2´ v1´ u1 `u1 ě0 0 ď v1 ď u1 ď u2 ď v2 ď1 u2´ v1 ´ u1`v1 ě0 0 ď v1 ď u1 ď v2 ď u2 ď1 vv1 ´ u1`v1 ě0 0 ď u1 ď u2 ď v1 ď v2 ď1 u2 ´u2 ´ZuZ1 `ZuZ1 “0 0 ď v1 ď v2 ď u1 ď u2 ď1 v2 ´ZvZ1 ´v2 `ZvZ1 “0

notação Cpu, vq definida acima. Assim, qualquer função bivariada que verifique todas as 5 propriedades acima pode ser considerada uma cópula.

Exemplo 1.3 (Exercício 2.2 de Nelsen(2007)). Mpu, vq “ minpu, vq é uma cópula, pois

M pu,0q “ Mp0, vq “ 0, Mpu, 1q “ u e Mp1, vq “ v @u, v P I, bem como VMpBq ě 0,

conforme a Tabela 1.1.

Exemplo 1.4 (Exercício 2.2 de Nelsen (2007)). W pu, vq “ maxpu ` v ´ 1, 0q é uma

cópula, pois W pu, 0q “ W p0, vq “ 0, W pu, 1q “ u e W p1, vq “ v @u, v P I. Além disso, dados u1, u2, v1, v2 P I tais que u1 ď u2 e v1 ď v2, há 4 possibilidades para VWpBq “

VWpru1, u2s ˆ rv1, v2sq:

1. u2` v2 ď1 ùñ W pu2, v2q “ W pu2, v1q “ W pu1, v2q “ W pu1, v1q “ VWpBq “0

2. u2` v1 ě1 e u1` v2 ď1 ùñ VWpBq “ u2` v1 ´ u2´ v1`1 “ v2´ v1 ě0

3. u2` v1 ď1 e u1` v2 ě1 ùñ VWpBq “ u2` v1 ´ u1´ v2`1 “ u2´ u1 ě0

4. u1` v1 ď1 ùñ VWpBq “ u2` v1 ´ u2´ v1`1 ´ u1´ v2`1 ` u1` v1´1 “ 0

Exemplo 1.5 (Exercício 2.2 deNelsen (2007)). Πpu, vq “ uv é uma cópula, pois Πpu, 0q “

Πp0, vq “ 0, Πpu, 1q “ u e Πp1, vq “ v @u, v P I. Além disso, dados u1, u2, v1, v2 P I tais

que u1 ď u2 e v1 ď v2, VΠpBq “ VΠpru1, u2s ˆ rv1, v2sq “ u2v2 ´ u2v1 ´ u1v2 ` u1v1 “

u2pv2´ v1q ´ u1pv2´ v1q “ pu2´ u1qpv2´ v1q ě0.

Exemplo 1.6 (Exercício 2.4 de Nelsen (2007)). Cpu, v|α, βq “ αMpu, vq ` p1 ´ α ´

βqΠpu, vq ` βW pu, vq, com α P I, β P I e α ` β ď 1. Esta é a família de cópulas Fréchet-Mardia, também denominada família compreensiva, por incluir as três cópulas M pu, vq “ minpu, vq, W pu, vq “ maxpu ` v ´ 1, 0q e Πpu, vq “ uv definidas mais adiante.

1.

Cpu,0|α, βq “ αMpu, 0q ` p1 ´ α ´ βqΠpu, 0q ` βW pu, 0q

“ α ¨0 ` p1 ´ α ´ βq ¨ 0 ` β ¨ 00, @u P r0, 1s

(25)

2. Cp0, v|α, βq “ 0 @v, devido à simetria da cópula 3.

Cpu,1|α, βq “ αMpu, 1q ` p1 ´ α ´ βqΠpu, 1q ` βW pu, 1q

“ α ¨ u ` p1 ´ α ´ βq ¨ u ` β ¨ u “ pα `1 ´ α ´ β ` βq ¨ u “ u, @u P r0, 1s

4. Cp1, v|α, βq “ v @v, devido à simetria da cópula 5. para B “ ru1, u2s ˆ rv1, v2s com u1 ď u2 e v1 ď v2

VCpBq “ Cpu2, v2|α, βq ´ Cpu2, v1|α, βq ´ Cpu1, v2|α, βq ` Cpu1, v1|α, βq

“ αM pu2, v2q ` p1 ´ α ´ βqΠpu2, v2q ` βW pu2, v2q

´ tαM pu2, v1q ` p1 ´ α ´ βqΠpu2, v1q ` βW pu2, v1qu

´ tαM pu1, v2q ` p1 ´ α ´ βqΠpu1, v2q ` βW pu1, v2qu

` αM pu1, v1q ` p1 ´ α ´ βqΠpu1, v1q ` βW pu1, v1q

“ α ¨ tM pu2, v2q ´ M pu2, v1q ´ M pu1, v2q ` M pu1, v1qu

` p1 ´ α ´ βq ¨ tΠpu2, v2q ´Πpu2, v1q ´Πpu1, v2q `Πpu1, v1qu

` β ¨ tW pu2, v2q ´ W pu2, v1q ´ W pu1, v2q ` W pu1, v1qu

“ α ¨ VMpBq ` p1 ´ α ´ βq ¨ VΠpBq ` β ¨ VWpBq

ě0

O teorema abaixo enuncia que uma subcópula C1 está sempre restrita a dois

limitantes para todo par ordenado pu, vq pertencente a seu domínio.

Teorema 1.2. Seja C1 uma subcópula, então para todo pu, vq P DomíniopC1

q vale maxpu ` v ´ 1, 0q ď C1

pu, vq ďminpu, vq.

Demonstração. Nelsen (2007, p. 22).

Como toda cópula Cpu, vq é uma subcópula, segue que maxpu ` v ´ 1, 0q ď Cpu, vq ď minpu, vq.

O limitante inferior, denotado por W pu, vq, e o limitante superior, denotado por Mpu, vq, são conhecidos como os Limitantes de Fréchet-Hoeffding.

Ambos os limitantes são cópulas, conforme demonstrado em Shemyakin e Kniazev (2017, pp. 200-203), no Exemplo 1.3 eExemplo 1.4. Geralmente a demonstração da quase-monotonicidade (propriedade 5) é mais trabalhosa do que a checagem trivial

(26)

u v W p u, v q “ max p u ` v ´ 1, 0q

Figura 1.2 – Limitante inferior de Fréchet-Hoeffding u v M p u, v q “ min p u, v q

Figura 1.3 – Limitante superior de Fréchet-Hoeffding u v Π p u, v q “ uv

Figura 1.4 – Cópula produto – Πpu, vq

das demais propriedades (1 a 4), como pode ser notado nos cálculos do Exemplo 1.4. A cópula W pu, vq é denominada alternativamente contramonotônica e a cópula Mpu, vq,

comonotônica.

No caso das cópulas bivariadas, a consequência prática dos limitantes de Fréchet-Hoeffding é que toda e qualquer cópula existente ocupa necessariamente a região compreendida entre os limitantes inferior (Figura 1.2) e superior (Figura 1.3) no cubo unitário r0, 1s ˆ r0, 1s ˆ r0, 1s, ou seja, a cópula Cpu, vq está espremida entre as cópulas

W pu, vq e Mpu, vq. Este resultado é muito interessante já que independentemente de quais

(27)

na região compreendida entre os limitantes de Fréchet-Hoeffding.

Além das cópulas Mpu, vq e W pu, vq há também a importante cópula produto, Πpu, vq “ uv, exibida na Figura 1.4.

Quanto mais próxima a cópula estiver de seu limitante superior, mais próximos da dependência positiva perfeita os dados estarão6. Quanto mais próxima a cópula estiver de seu limitante inferior, mais próximos da dependência negativa perfeita os dados estarão. A independência das variáveis aleatórias pode ser atestada caso a cópula seja igual à cópula produto, resultado garantido pelo Teorema 1.4 naSeção 1.2.1.

1.2.1

Teorema de Sklar

Neste ponto a utilidade das funções de cópula torna-se mais evidente, já que é através do teorema a seguir que se pode representar uma função de distribuição acumulada conjunta como a cópula aplicada em suas funções de distribuição acumuladas marginais. Apesar de ser uma tarefa não trivial, isso permite uma simplificação enorme por separar a modelagem do problema em duas etapas: a modelagem das marginais e a modelagem da dependência (Shemyakin e Kniazev (2017, p. 199)). Este teorema é central na teoria das cópulas.

Teorema 1.3(Teorema de Sklar). Seja H uma função de distribuição acumulada bivariada

com marginais F e G. Então existe uma cópula C tal que para todo x, y P R

Hpx, yq “ CpF pxq, Gpyqq. (1.1) Se F e G são absolutamente contínuas, então C é única; caso contrário, C é unicamente determinada na ImagempF q ˆ ImagempGq. Por outro lado, se C é uma cópula e F e G são funções de distribuição acumuladas, então a função definida em (1.1) é uma função de distribuição conjunta bivariada com distribuições acumuladas marginais F e G.

Demonstração. Nelsen (2007, p. 21).

Corolário 1.1. Seja H uma função de distribuição bivariada conjunta com funções de

distribuição acumuladas marginais contínuas F , G e cópula C. Então para todos u, v P I, Cpu, vq “ HpF´1

puq, G´1pvqq. (1.2)

Demonstração. Partindo do Teorema de Sklar – Hpx, yq “ CpF pxq, Gpyqq – definem-se u “ F pxq e v “ Gpyq. Como F e G são contínuas, segue-se que F´1

puq “ x e G´1pvq “ y; substituindo-os no Teorema de Sklar, tem-se HpF´1

puq, G´1pvqq “ Cpu, vq.

6 ou seja, se um componente da cópula aumenta, o outro aumentará quase certamente, i.e., com

(28)

Uma maneira alternativa de provar a independência entre variáveis aleatórias é através da utilização das cópulas, conforme o teorema a seguir.

Teorema 1.4. Sejam X e Y variáveis aleatórias absolutamente contínuas e C a função

de cópula do vetor aleatório bidimensional pX, Y q. Então X e Y são independentes se e somente se Cpu, vq “ Πpu, vq.

Demonstração. Sejam Hpx, yq a distribuição conjunta de pX, Y q, F pxq a função de

distri-buição acumulada marginal de X e Gpyq a função de distridistri-buição acumulada marginal de

Y.

pùñq X e Y são variáveis aleatórias independentes

ùñ Hpx, yq – P pX ď x, Y ď yq ind.“ P pX ď xqP pY ď yq – F pxqGpyq. Segundo o Corolário 1.1, tem-se

Cpu, vq “ HpF´1

puq, G´1pvqq “ F pF´1puqqGpG´1pvqq “ uv

Πpu, vq.

pðùq Cpu, vq “ Πpu, vq – uv. Pelo Teorema de Sklar, Hpx, yq “ CpF pxq, Gpyqq “

F pxqGpyq, portanto X e Y são independentes.

O Teorema de Sklar garante a existência de uma cópula para qualquer distribui-ção conjunta e também garante que o modelo correto de dependência pode ser encontrado dentro da classe de funções de cópulas, porém tal classe é muito vasta e todavia não existe um algoritmo que permita que se escolha dentro dessa classe a cópula mais adequada aos dados e à distribuição conjunta (Shemyakin e Kniazev (2017, p. 235)).

1.2.2

Alguns aspectos da dependência

Muitas famílias de cópulas verificam determinados tipos de simetria e essas características permitem uma melhor inspeção da compatibilidade entre famílias de copulas e o desempenho de dados reais. Por tal motivo abordamos algumas noções frequentemente consideradas.

No caso univariado, a variável aleatória X „ F é simétrica em torno de a se

X ´ a tiver a mesma distribuição que a ´ X, o que, sob uma notação mais compacta,

(29)

Definindo-a em termos probabilísticos, a simetria equivale a

P pX ´ a ď xq “ P pa ´ X ď xq @x PR

e, se X for uma variável aleatória absolutamente contínua e F pxq “ P pX ě xq, então

P pX ´ a ď xq “ P pa ´ X ď xq ùñ F pa ` xq “ F pa ´ xq @x PR,

pois P pa ´ X ď xq “ P pX ě a ´ xq – F pa ´ xq e P pX ´ a ď xq “ P pX ď a ` xq –

F pa ` xq, @x PR.

Estender o conceito de simetria para o caso bivariado requer a definição de três tipos de simetria em torno de um ponto pa, bq P R2.

Definição 1.3 (Simetria no caso bivariado). Sejam X e Y variáveis aleatórias e pa, bq

um ponto em R2.

1. pX, Y q é marginalmente simétrica em torno de pa, bq se X é simétrica em torno de a e Y é simétrica em torno de b

2. pX, Y q é radialmente simétrica em torno de pa, bq se pX ´a, Y ´bq tem a mesma distribuição de pa ´ X, b ´ Y q, ou seja, se pX ´ a, Y ´ bq D

“ pa ´ X, b ´ Y q

3. pX, Y q é conjuntamente simétrica em torno de pa, bq se todos os 4 pares seguintes têm uma distribuição conjunta em comum:

pX ´ a, Y ´ bq pX ´ a, b ´ Y q pa ´ X, Y ´ bq pa ´ X, b ´ Y q.

Teorema 1.5. Sejam X e Y variáveis aleatórias absolutamente contínuas, tais que o

vetor bivariado pX, Y q tem distribuição conjunta H, a v.a. X tem distribuição F , a v.a. Y tem distribuição G e pa, bq P R2. Então pX, Y q é radialmente simétrico em torno de pa, bq

se e somente se Hpa ` x, b ` yq “ Hpa ´ x, b ´ yq, @px, yq P R2, onde Hpx, yq “ P pX ě

x, Y ě yq. Demonstração. pX ´ a, Y ´ bq“ pa ´ X, b ´ Y qD ðñ P pX ´ a ď x, Y ´ b ď yq “ P pa ´ X ď x, b ´ Y ď yq, @px, yq PR2 ðñ P pX ď a ` x, Y ď y ` bq “ P pX ě a ´ x, Y ě b ´ yq, @px, yq PR2 ðñ Hpx ` a, y ` bq “ Hpa ´ x, b ´ yq, @px, yq PR2

A simetria conjunta, que é uma condição muito forte, implica em simetria radial, que por sua vez implica em simetria marginal. Por esse motivo, trabalha-se com o

(30)

conceito de simetria radial nas aplicações de cópulas no caso bivariado (Nelsen (2007, p. 37)). À simetria radial está comumente associada a equivalência das áreas em ambas as caudas da distribuição conjunta (mais detalhes em Nelsen (2007, pp. 47-48)), restringindo desta forma os modelos de cópula a serem ajustados aos dados, conforme a heurística apresentada na Figura 4.1 noCapítulo 4.

Por meio da cópula de sobrevivência (Apêndice A.2) é possível reformular o

Teorema 1.5 em termos da cópula de sobrevivência.

Teorema 1.6. Sejam X e Y variáveis aleatórias absolutamente contínuas, tais que o

vetor bivariado pX, Y q tem distribuição conjunta H e cópula C; a v.a. X tem distribuição F e é simétrica em torno de a e por fim a v.a. Y tem distribuição G e é simétrica em torno de b. Então pX, Y q é radialmente simétrico em torno de pa, bq ðñ C “ C, onde Cpu, vq “ u ` v ´1 ` Cp1 ´ u, 1 ´ vq, @pu, vq P r0, 1s2.

Demonstração. Nelsen (2007, pp. 37-38)

X e Y são radialmente simétricos em torno de pa, bq

ðñ Hpa ` x, b ` yq “ Hpa ´ x, b ´ yq @px, yq PR2 pTeorema 1.5q

ðñ CpF pa ` xq, Gpb ` yqq “ Hpa ´ x, b ´ yq @px, yq PR2 pTeor. de Sklarq ðñ CpF pa ` xq, Gpb ` yqq “ CpF pa ´ xq, Gpb ´ yqq @px, yq PR2 pDefin. A.1e A.2q ðñ CpF pa ` xq, Gpb ` yqq “ CpF pa ` xq, Gpb ` yqq @px, yq PR2 pX e Y simétricasq ðñ Cpu, vq “ Cpu, vq @pu, vq PI2

Há ainda uma outra forma de simetria que pressupõe que as variáveis aleató-rias X e Y sejam identicamente distribuídas, ou seja, que tenham uma mesma função distribuição acumulada.

Definição 1.4. X e Y são permutáveis se pX, Y q “ pY, XqD , ou equivalentemente, se

Hpx, yq “ Hpy, xq @px, yq PR2.

Teorema 1.7 (Permutabilidade). Sejam X e Y variáveis aleatórias absolutamente

con-tínuas, tais que o vetor bivariado pX, Y q tem distribuição conjunta H e cópula C, a v.a. X tem distribuição F e a v.a. Y tem distribuição G. Então X e Y são permutáveis se e somente se F “ G e Cpu, vq “ Cpv, uq @pu, vq P I2.

(31)

Demonstração.

X e Y são permutáveis

ðñ pX, Y q“ pY, XqD pDefinição 1.4q

ðñ P pX ď x, Y ď yq “ P pY ď x, X ď yq

ðñ CpF pxq, Gpyqq “ CpF pyq, Gpxqq pTeorema de Sklarq

ðñ F “ G e Cpu, vq “ Cpv, uq @pu, vq P I2

1.3

Quantificação da relação entre variáveis aleatórias

O ponto de partida para muitas análises estatísticas é investigar a relação entre variáveis aleatórias, documentada tipicamente através dos gráficos de dispersão7 bivariados que exibem padrões de dependência entre variáveis aleatórias.

De maneira geral, a relação (de dependência) entre variáveis aleatórias pode ser linear ou não linear, bem como positiva, negativa ou neutra. Por relação positiva entende-se a situação na qual valores ‘elevados’ de uma variável estão associados (ou ocorrem, na maioria das vezes, concomitantemente) com valores ‘elevados’ da outra variável.

Por meio desta simples verificação de relação entre duas variáveis é possível proceder a análises tradicionais como regressões – lineares ou não – que podem quantificar adequadamente o grau de dependência entre as variáveis, além de fornecer todo um ferramental próprio para entendimento da variação, realização de inferência e predição de observações futuras.

Neste contexto os termos dependência, associação, relação e correlação acabaram tornando-se sinônimos na Estatística, apesar de terem significados ligeiramente distintos sob o ponto de vista semântico.

Além da constatação gráfica da dependência entre variáveis aleatórias, pode-se resumir o grau de dependência em um número, porém sob o custo de perda de informação e redução da dimensão dos dados, a exemplo do que ocorre com a média amostral sX –

1

n

n ÿ

i“1

Xi, que é uma medida de locação; a variância amostral S2 – 1

n ´1 n ÿ i“1 `Xi´ sX ˘2 , que é uma medida de dispersão; o coeficiente de assimetria 1

n n ÿ i“1 „ Xi´ sX ? S2 3 , que é uma medida de simetria dos dados e com a curtose amostral 1

n n ÿ i“1 „ Xi ´ sX ? S2 4 , que é uma medida do achatamento da distribuição.

(32)

Ao buscar resumir a dependência de duas variáveis aleatórias a um único número, recorre-se, comumente, ao coeficiente de correlação linear de Pearson – ρ.

O coeficiente ρ, contido sempre no intervalo r´1, 1s, mede unicamente depen-dência linear entre duas variáveis aleatórias. Tal fato não acarreta consequências mais sérias contanto que ambas as variáveis possuam o segundo momento finito8 e que a dependência entre elas seja de fato linear.

O coeficiente é invariante às transformações lineares positivas, porém não às estritamente crescentes, o que deixa de ser interessante quando se leva em conta a vantagem proporcionada pelas cópulas em tais transformações (Apêndice A.1). Em termos matemáticos, isso significa que ρpa1X `b1, a2Y `b2q “Sinalpa1¨b1qρpX, Y qpara constantes

a1, a2, b1, b2 P R – e evidentemente ρpa1X ` b1, a2Y ` b2q “ ρpX, Y q quando a1 e b1 são

constantes positivas – porém, no geral ρpX, Y q ‰ ρpαpXq, βpY qq para funções monótonas crescentes não-lineares αpxq e βpyq.

Uma característica indesejada do coeficiente é que ρpX, Y q “ 0 não implica independência de X e Y , exceto quando X e Y possuem distribuição normal; o contrário vale sempre, ou seja, se X e Y são independentes, então por definição CovpX, Y q “ 0 e consequentemente ρpX, Y q “ 0.

Por todas essas razões, o ρ de Pearson pode ser considerado sem sentido quando se trabalha fora da classe das distribuições elípticas (como nas cópulas gaussiana ou T), já que naquela classe o coeficiente de correlação linear caracteriza corretamente a dependência entre as distribuições marginais.

Há uma distinção básica entre medidas de dependência – denotadas por δ – e concordância – denotadas por κ. Medidas de dependência quantificam o grau de relacionamento entre variáveis ao atribuir números entre 0 (independência mútua) e 1 (dependência monótona), porém não distinguem entre associação positiva ou negativa; esta distinção provém das medidas de concordância, limitadas por sua vez entre ´1 (associação negativa perfeita) e 1 (associação positiva perfeita) (Nicoloutsopoulos (2005, p.

17)).

Ambas possuem uma série de características desejáveis, resumidas naTabela 1.2

a seguir. Qualquer medida, tanto de dependência quanto de concordância, que possua tais características viabiliza análises mais aprofundadas que a mera investigação de uma relação linear entre variáveis aleatórias.

O conceito de concordância refere-se ao comportamento de valores ‘elevados’ de uma variável tenderem a estar associados a valores ‘elevados’ da outra variável. Em outros termos, sejam pxi, yiqe pxj, yjq duas observações do vetor aleatório absolutamente contínuo pX, Y q, então pxi, yiqe pxj, yjqsão concordantes se xi ă xj e yi ă yj ou xi ą xj e 8 A v.a. X possui segundo momento finito se

(33)

Tabela 1.2 – Características desejáveis das medidas de dependência e concordância

Medidas de dependência (δ) Medidas de concordância (κ)

a) δ deve estar definida para todo par pX, Y q de v.a. absolutamente contínuas;

b) 0 ď δpX, Y q ď 1; c) δpX, Y q “ δpY, Xq;

d) δ “ 0 se e somente se X e Y forem inde-pendentes;

e) δpX, Y q “ 1 se e somente se cada um de

X,Y é quase certamente uma função

estri-tamente monótona do outro;

f) se f e g forem quase certamente fun-ções estritamente monótonas definidas em ImagempXq e ImagempY q respectivamente, então δpf pXq, gpY qq “ δpX, Y q g) se tpXn, Ynqu8n“1 tal que pXn, Ynq D ÝÑ nÑ8 pX, Y q então δpXn, Ynq D ÝÑ nÑ8δpX, Y q

a) κ deve estar definida para todo par pX, Y q de v.a. absolutamente contínuas;

b) ´1 ď κpX, Y q ď 1, κpX, Xq “ 1 e

κpX, ´Xq “ ´1;

c) κpX, Y q “ κpY, Xq;

d) se X e Y forem independentes então

κpX, Y q “ 0; e) κp´X, Y q “ κpX, ´Y q “ ´κpX, Y q; f) se pX, Y q ă pX1, Y1 q então κpX, Y q ď κpX1, Y1 q; g) se tpXn, Ynqu8n“1 tal que pXn, Ynq D ÝÑ nÑ8 pX, Y q então κpXn, Ynq D ÝÑ nÑ8κpX, Y q

Fonte: Medidas de dependência – Rényi (1959 apud NICOLOUTSOPOULOS, 2005) e Medidas de

concordância –Scarsini(1984apud NICOLOUTSOPOULOS,2005)

yi ą yj; analogamente, pxi, yiqe pxj, yjq são discordantes se xi ă xj e yi ą yj ou xi ą xj e

yi ă yj. Adotando uma notação mais compacta, tem-se: pxi, yiq e pxj, yjqsão concordantes se pxi´ xjqpyi´ yjq ą0 e discordantes se pxi´ xjqpyi´ yjq ă0 (Nelsen(2007, pp. 157-158)).

O assunto da dependência estatística é vasto e constitui-se objeto de estudo de obras muito importantes na literatura de probabilidade e estatística: entre elas as obras de Mari e Kotz(2001) e Joe (2014), este último uma das referências mais importantes no estudo das cópulas.

Em seu estudo de dependência por meio de estatística não paramétrica, Schwei-zer, Wolff et al. (1981) já haviam notado que Πpu, vq é responsável pela caracterização da independência estocástica de variáveis aleatórias X e Y por meio de sua cópula C, de forma que qualquer distância em norma – denotada por Lp – entre C e Π define uma medida de dependência que possui todas as características presentes no lado esquerdo da

Tabela 1.2. A norma Lp é definida naquele artigo como uma distância entre as superfícies

z “ Cpu, vq e w “ uv. Ao todo são apresentadas três normas no artigo deSchweizer, Wolff

et al. (1981) L1 definida por σpX, Y q “ 12 ż1 0 ż1 0

|Cpu, vq ´ uv| dudv

L2 definida por γpX, Y q “ ˆ 90ż1 0 ż1 0

pCpu, vq ´ uvq2dudv

˙12

(34)

original-mente emBlum, Kiefer e Rosenblatt (1961) e

L8 definida por pX, Y q “ 4 sup

u,vPr0,1s

|Cpu, vq ´ uv|

Em todos os três exemplos de medida de dependência listados acima há somente dois extremos: 0 ou 1, em que o valor 0 corresponde à ausência de afastamento entre as cópulas C e Π, significando a independência entre as variáveis aleatórias X e Y e o valor 1 representa a dependência perfeita entre as variáveis. No segundo extremo porém a pergunta de interesse é se a dependência perfeita é negativa – quando X é por exemplo uma função monótona não crescente de Y – ou positiva. A especificidade sobre o sinal da dependência pode ser tratada por meio da função conforme a Definição 1.5.

Em complemento ao uso do coeficiente de correlação ρ de Pearson, trabalha-se, habitualmente, com medidas de dependência ou concordância baseadas nos postos9 das observações, que por consequência do Teorema A.1e por dependerem somente das cópulas, são invariantes às transformações estritamente crescentes das variáveis aleatórias.

Ambas as medidas τ de Kendall e ρS de Spearman, quando aplicadas no limitante superior de Fréchet-Hoeffding, resultam em 1; além disso, quando aplicadas no limitante inferior de Fréchet-Hoeffding, ambas resultam em -1. Em outros termos, dadas

X e Y variáveis aleatórias contínuas com função de cópula dada por Cpu, v|θq, tem-se

• Cpu, v|θq “ Mpu, vq “ minpu, vq ðñ τpX, Y q “ ρSpX, Y q “1

• Cpu, v|θq “ W pu, vq “ maxpu`v ´1, 0q ðñ τpX, Y q “ ρSpX, Y q “ ´1. A demonstração das relações acima pode ser encontrada em Viola (2009, pp. 71-73).

A generalização de medidas de dependência e associação para cópulas de dimensão superior ao caso bivariado torna-se rapidamente um tema de grande complexidade. Em sua investigação no espaço R3, García, González-López e Nelsen(2013) propõem um

novo índice para medir dependência positiva em distribuições trivariadas.

Nelsen (2007) define uma função de concordância entre dois vetores aleatórios que serve de base para explorar relações entre as cópulas destes vetores aleatórios. O autor estabelece, por meio do Teorema 1.8, que a função de concordância depende das distribuições dos vetores aleatórios somente através das suas cópulas.

Definição 1.5. (Nelsen (2007, p. 158)). Sejam pX1, Y1qe pX2, Y2q dois vetores aleatórios

absolutamente contínuos com distribuições conjuntas H1 e H2, respectivamente. Seja a

9

Referências

Documentos relacionados

Uma pequena parte das indústrias têxtil utilizam água oriunda de redes públicas, no entanto, grande parte das indústrias captam a água para seus processos de

No capítulo 6 são apresentados os principais aspectos que se relacionam com a aplicação do método dos elementos finitos (MEF), iniciando com uma breve história da sua

Ficou claro que os experimentos presentes nos livros analisados apresentam a ausência de critérios significativos, nesse sentido, entende-se a importante dos professores

teres pesados e modernos, modernização de indústrias obsoletas, implantação de modernas indústrias impropriamente chamadas de 10 tradicionais&#34; (como a têxtil,

A ansiedade não-situacional pode ser pervasiva, podendo ser um estado de início recente ou uma característica persistente da personalidade do indivíduo (ANDRADE e

homeostática pode assim ser considerada como preferível à homeostase.. Os fatores que operam no corpo para manter a uniformidade são amiúde tão peculiarmente

a- Módulo de corte. b- Módulo de posicionamento. c- Módulo de Geo-gerenciamento. d- Módulo de potência. e- Módulo estrutural. f- Módulo de segurança. Será analisada a

 Demais documentos que o candidato considere necessário para compro- var os requisitos obrigatórios e desejáveis indicados no item 3.1. 4.2.1 Não será admitida nenhuma