• Nenhum resultado encontrado

Alguns testes de hipóteses sob o escopo de cópulas

O processo de escolha da família de cópulas mais adequada a uma determinada aplicação é um misto de técnica e experiência profissional do analista, no qual devem ser feitas decisões com base nos dados observados.

Por meio dos gráficos de dispersão dos postos das observações já é possível identificar empiricamente a presença de dependência estocástica nos dados, simetria, assimetria moderada ou forte bem como dependência caudal, e com base nessas análises empíricas, elencar cópulas candidatas ao melhor ajuste dos dados.

Com o objetivo de formalizar tais observações empíricas e tornar o processo de decisão mais objetivo, são feitos testes de hipóteses específicos para suportar tecnicamente os passos seguintes das análises.

Desta forma, o primeiro teste de hipóteses é o de dependência estocástica dos dados, visto em detalhes naSeção 2.3.1. Igualmente importante e equivalente para aplicação bayesiana de cópulas é o teste de permutabilidade, visto em detalhes na Seção 2.3.2. A

rejeição da hipótese nula em ambos os testes de hipóteses indica ausência de estrutura de dependência nos dados, o que inviabiliza o estudo de dependência e, consequentemente, a quantificação da dependência via funções de cópulas.

Uma vez confirmada estatisticamente, via teste de hipótese, de que há depen- dência estocástica entre as observações sob estudo, procede-se à verificação da eventual simetria radial nos dados, conforme descrito na Seção 2.3.2. A presença de simetria radial nos dados e no marco desta dissertação restringe a classe de cópulas candidatas às cópulas gaussiana, T e Frank. A ausência de simetria radial nos dados sugere outras famílias de cópulas candidatas, a depender do grau e do tipo de dependência dos dados e tal conside- ração requer experiência do analista, já que pressupõe um conhecimento aprofundado dos diferentes padrões de dependência permitidos por diferentes famílias de cópulas, conforme esquematicamente ilustrado na Figura 4.1.

Para os testes de hipótese a seguir a cópula empírica Cn, conformeDefinição 1.12, é muito importante, já que as estatísticas do teste aplicados nesta dissertação são baseadas nela.

2.3.1

Independência

O teste de hipótese de independência estocástica das observações constitui-se no primeiro e principal teste formal a ser feito nas observações da aplicação sob estudo. Uma vez rejeitada a hipótese nula de dependência estocástica, não há razão para prosseguir com a análise e estimação via cópulas para a modelagem da dependência das observações4.

Dado que sob independência estocástica a cópula C equivale à cópula produto Π, o teste de hipóteses para independência pode ser enunciado simplesmente como

H0 : C “ Π vs H1 : C ‰ Π.

Como descrito emHofert(2018, p. 174), uma maneira direta de testar a hipótese

H0 supracitada consiste em, dado um conjunto de n pares ordenados iids, avaliar a distância

entre a cópula empírica Cn (conforme Definição 1.12) e a cópula produto Π através da estatística do teste SnΠ“ ż1 0 ż1 0 npCnpu, vq ´Πpu, vqq2du dv.

Pode-se obter uma aproximação numérica do p-valor associado a este teste de hipótese através de um grande número N de simulações de n pares ordenados independentes via cópula produto e sua diferença em relação à cópula empírica SΠ,p1q

n , . . . , S

Π,pN q

n , conforme

descrito no artigo de Genest e Rémillard (2004). Sob a hipótese nula de independência, o 4 Nota: Evidentemente os dados podem ser analisados de forma univariada e com outras técnicas da

p-valor pode ser aproximado pela expressão 1 N `1 ˜ N ÿ k“1 1tSΠ,pkq n ěSΠnu` 1 2 ¸ .

No pacote copula do R este teste de hipótese está implementado através da função indepTest.

2.3.2

Simetria radial e permutabilidade

Uma vez confirmada a dependência estocástica nos dados, a modelagem da dependência via cópulas pode ser realizada com base no padrão dessa dependência. As famílias elípticas e arquimedianas de cópulas permitem, ao usuário de cópulas, modelar um leque amplo de dependência presente nos dados, com a vantagem de estas cópulas estarem implementadas em praticamente qualquer software especializado de análise de dados.

Em problemas aplicados, é necessário identificar se algum tipo de simetria está presente nos dados, pois isto determina quais famílias de cópulas deve ser consideradas como candidatas na modelagem de dependência nos dados.

Como será visto mais adiante no Seção 4.1, somente parte das cópulas mais usuais possuem algum tipo de simetria, motivo pelo qual os conceitos de simetria radial e de permutabilidade (Seção 1.2.2), verificados formalmente através dos testes de hipóteses descritos a seguir, permitem restringir formalmente o leque de cópulas candidatas às mais adequadas segundo as características de dependência que elas conseguem abarcar.

Em termos mais simples e como descrito em Hofert(2018, p. 45), geometrica- mente a simetria radial pode ser descrita como a simetria da densidade da cópula, caso ela exista, ao redor do ponto

ˆ 1 2, 1 2 ˙

. Esta é uma maneira visual de identificar a simetria radial nos dados.

Com base no fato de que um vetor aleatório é radialmente simétrico se Cpu, vq “ s

Cpu, vq @pu, vq P I2, sendo Cpu, vq “ u ` v ´ 1 ` Cp1 ´ u, 1 ´ vq, conforme descrito no

Teorema 1.6, Genest e Nešlehová (2014) propuseram um teste de hipóteses baseado na estatística Snsym “ ż1 0 ż1 0 npCnpu1, u2q ´ sCnpu1, u2qq2du1du2.

No pacote copula do R este teste de hipótese está implementado através da função radSymTest.

O indício visual, ao inspecionar graficamente os dados, de que eles são per- mutáveis é uma simetria ao longo da diagonal principal (Hofert (2018, p. 45)). Como

muitas famílias paramétricas de cópulas são permutáveis, pode-se testar formalmente a permutabilidade com o objetivo guiar a escolha das cópulas candidatas a melhor ajuste.

De acordo com o Teorema 1.7, duas variáveis aleatórias podem ser consideradas permutáveis caso se observe Cpu, vq “ Cpv, uq @pu, vq P I2, em que C é uma função de

cópula. Com base nesta identidade, Genest, Nešlehová e Quessy (2012) propuseram um teste baseado na cópula empírica Cn (Definição 1.12) e no estimador natural abaixo

Snexc“ ż1 0 ż1 0 npCnpu1, u2q ´ Cnpu2, u1qq2du1du2.

No pacote copula do R este teste de hipótese está implementado através da função exchTest.

2.3.3

Aplicação dos testes nos problemas reais

No Exemplo 1.9, referente à aplicação da Desigualdade de Renda, verificou-se uma associação positiva forte entre desigualdade de renda (medida pelo índice de gini) e o percentual da renda nacional concentrada no 1% mais rico, fato confirmado pela rejeição da hipótese nula de independência entre elas (p-Valor“ 0.0004995). Não há evidências para rejeitar a hipótese nula de simetria radial (p-Valor=0.13337) nem a de permutabilidade entre as variáveis (p-Valor“ 0.9985).

No Exemplo 1.10, referente à aplicação Quebras de barragens, verificou-se uma forte associação positiva entre a distância percorrida pelos rejeitos (Dmax) e o fator de barragem (damfactor“ H ˆ VF), ratificada pela rejeição da hipótese nula de independência ao nível de 0.0004995. Não há evidências para rejeitar a hipótese nula de simetria radial (p-Valor=0.58691) nem a hipótese nula de permutabilidade (p-Valor“ 0.43906).

Por fim, noExemplo 1.11, referente à aplicaçãoMapa da Desigualdade, verificou- se uma forte associação negativa entre idade média ao morrer (idade) e o percentual de pretos e pardos na população dos bairros da cidade de São Paulo (pct), ratificada pela rejeição da hipótese nula de independência ao nível de 0.0004995. Não há evidências para rejeitar a hipótese nula de simetria radial (p-Valor=0.16134) nem a hipótese nula de permutabilidade (p-Valor“ 0.26823).

Documentos relacionados