Universidade Federal de Lavras
Departamento de Ciências Exatas
Dependência via Cópulas
Devanil Jaques de Souza Lucas Monteiro Chaves
Variável aleatória bi-dimensional
(
X Y
,
)
~
F
X Y,( )
x y
,
Variável aleatória bi-dimensional
(
X Y
,
)
~
F
X Y,( )
x y
,
As
marginais:
F
X( )
x e
F
Y( )
y
Variável aleatória bi-dimensional
(
X Y
,
)
~
F
X Y,( )
x y
,
As
marginais:
F
X( )
x e
F
Y( )
y
A estrutura de dependência entre X e Y
O coeficiente de correlação de Pearson
(
)(
)
(
)
2(
)
2 ,,
X Y X Y X Y X Y E X E YE X
Y
Cov X Y
μ μμ
μ
σ σ
ρ
⎡⎣ ⎤⎦ ⎡⎢⎣ ⎤⎥⎦ = ⎡ − ⎤ ⎡ − ⎤ ⎣ ⎦ ⎣ ⎦−
−
=
, , X Y aX b cY dρ
=ρ
+ +Problema: Capta dependência linear
1
Como modelar outras dependências:
Tau de Kendall amostral
Uma amostra bivariada de tamanho n:
(
x y1, 1)
,
(
x y2, 2)
, ...,
(
xn,yn)
c – número de pares concordantes
(
xi−xj)(
yi −yj)
>0d – número de pares discordantes
(
xi−xj)(
yi −yj)
<0O coeficiente Tau de Kendall amostral
:c d
t
c d
−
=
+
Tau de Kendall populacinal
(
X Y1, 1)
e(
X Y2, 2)
duas cópias independentes de uma população FX Y, .Probabilidade de concordância do tipo 1
P c1 =P⎣⎡
(
X2−X1)(
Y2−Y1)
>0⎤⎦ 2 FX Y,( )
x y f, X Y,( )
x y dx dy,∞ ∞
−∞ −∞
=
∫ ∫
, Probabilidade de discordância do tipo 1P d1 =P⎡⎣
(
X2 −X1)(
Y2−Y1)
<0⎦⎤= −1 P c1 Tau de Kendall populacional 11
c d
Se X e Y têm distribuição conjunta normal bivariada então
`
τ =
2
arcsin
ρ
(
) (
)
sgn sgn i j j i j i A = X −X Y −Y(
j≠i)
( )
1 caso 0 sgn -1 caso 0 u u u > ⎧ = ⎨ < ⎩(
)
1 1 1 2 1 n n i j i j i T A n n − = = + = −∑ ∑
O RHO de Spearman amostral
Amostra
(
x y1, 1) (
, x y2, 2)
,...,(
xn,yn)
de uma população bivariada(
X Y,)
. Sejam(
p q1, 1) (
, p q2, 2)
,...,(
p qn, n)
os respectivos postos.(
)
2 1 n i i i S p q = =∑
− .O Rho de Spearman amostral
(
)
(
)(
)
(
) (
)
2 2 2 1 1 1 6 1 1 n i i i n n i i i i P P Q Q S R n n P P Q Q = = = − − = − = − − −∑
∑
∑
O RHO de Spearman populacional
(
X Yi, i)
,(
X Yj, j)
e(
X Yk, k)
três cópias independentes de uma população bivariada e contínua(
X Y,)
.Probabilidade de concordância do tipo 2: P c2 =P⎣⎡
(
Xj −Xi)
(
Yk −Yi)
>0⎤⎦ Probabilidade de discordância do tipo 2:
2
d
P =P⎣⎡
(
Xj−Xi)
(
Yk −Yi)
<0⎤⎦RHO de Spearman populacional
(
2 2)
2 23 6 3 3 6
S c d c d
Relação entre o RHO de Spearman e o coeficiente de correlação produto-momento de Pearson
X e Y com distribuição conjunta normal bivariada: 6 arcsin 2 S ρ ⎛ ⎞ ρ = ⎜ ⎟ π ⎝ ⎠
Variável aleatória bidimensional
(
X Y
,
)
( )
( )
( )
( )
,,
,
X Y X YF
x y
F
x
F
y
x y
⎧ ⎪ ⎪ → ⎨ ⎪ ⎪⎩( )
( )
(
F
Xx F
, Yy
)
→F
X Y,( )
x y
,
Uma cópula
Sejam
I
=
⎡⎣0,1
⎤⎦( )
u v
,
∈
I
2Cópula bi-dimensional: uma função
C I
:
2→
I
P1 -
C
( ) ( )
0,
v
=
C u
,0
=
0
,
C u
( )
,1
=
u
e
C
( )
1,
v
=
v
P2 -
C b d
( ) ( ) ( )
,
−
C a d
,
−
C b c
,
+
C a c
( )
,
≥
0
em que
a<b
c<d
v C(u,v)
Exemplos de Cópulas
E1 -
C u v
I( )
,
=
u v
Desigualdade de Fréchet-Hoeffding:
Se
C u v
0( )
,
=
max
{
u v
+ −
1,0
}
e
C u v
1( )
,
=
min
{ }
u v
,
então
( ) ( )
( )
0,
,
1,
C u v
≤C u v
≤C u v
Teorema de Sklar:
Sejam X e Y variáveis aleatórias com distribuições marginais
( )
P[
]
X F x = X ≤xGY
( )
y =P[
Y ≤ y]
e
distribuição
conjunta
( )
[
]
, , P , X Y H x y = X ≤x Y≤ y.
Então, tomando-se
u=FX( )
xe
v=GY( )
y,
( )
(
1( )
1( )
)
, , X Y X , Y C u v =H F− u G− vé uma cópula.
Além disso:
• para quaisquer
FX( )
xe
GY( )
ye qualquer cópula
( )
,C u v
,
HX Y,( )
x y, =C F(
X( )
x G, Y( )
y)
é uma conjunta
admissível.
• se
FX( )
xe
GY( )
ysão contínuas, para cada conjunta
(
)
, ,
X Y
H x y
admissível existe uma e somente uma cópula
( )
,Propriedade: Se
f
( )
.
e
g
( )
.
são funções
estritamente crescentes então
, , U V f U g V
C
C
⎛ ⎞ ⎛ ⎞ ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ⎝ ⎠ =Cópulas e o TAU de Kendall τ 4 FX Y,
( )
x y f, X Y,( )
x y dx dy, 1 ∞ ∞ −∞ −∞ =∫ ∫
−( )
2( )
1 1 0 0 , 4 C u v, C u v du dv 1 u v ∂ = − ∂ ∂∫ ∫
Cópulas e o RHO de Spearman
ρ S 12 FX
( ) ( )
x FY y fX Y,(
x y,)
3 ∞ ∞ −∞ −∞ =∫ ∫
−( )
2 1 1 0 0 , 12 u v C u v du dv 3 u v ∂ = − ∂ ∂∫ ∫
Construção de Cópulas
-
Método da mistura (compound)
Exemplo:
( )
(
)
P | 1 P P | 1 1 ~ , x r X x e X x E X x x Gama r γ γγ
γ
λ
γ
λ
− − ⎧ ⎡ ⎤ = ⎪ ⎣ ⎦ ⎡ ⎤ ⎡ ⎡ ⎤⎤ ⎨ ⎣ ⎦ ⎣ ⎣ ⎦⎦ ⎪⎩ ≤ − → ≤ = ≤ = − + 1X
e
X2independentes, a menos de um risco
γ
.
F x x
(
1, 2)
( )
( )
(
( )
)
(
( )
)
1 1 1 1 2 2 1 1 1 1 1 2 2 1 r r r F x F x F x − F x − − ⎡ ⎤ = + − ⎢ − + − − ⎥ ⎣ ⎦C u v
( )
, 1 1(
)
1(
1)
1 1 r r r u v u − v − − ⎡ ⎤ = + − ⎣ − + − − ⎦Construção de Cópulas
- Cópulas
Arquimedianas
: 0,1 0,
φ
⎡⎣ ⎤⎦→⎡⎣ ∞⎤⎦função convexa estritamente decrescente
( ) ( )
(
)
( )
1 , u v C u vφ
⎡ ⎤φ
φ
⎣−⎦ + =( )
( )
( )
( )
1 1 0 0 0 t t t tφ
φ
φ
φ
⎡ ⎤ ⎣ ⎦ − − ⎧⎪ ⎨ ⎪⎩ ≤ = ≥( )
.φ função geradora da cópula
( )
1(
( ) ( )
)
,
Ajuste de Cópulas:
τ( )
( )
2 1 1 0 0 , 4 C u v, C u v du dv 1 u v ∂ = − ∂ ∂∫ ∫
Os dados: X – índice de estresse hídrico da região de Castro – Paraná Y – produtividade de soja no município de Castro – Paraná
Período de 1980/1981 a 2007/2008
(
1.156, 1.147, ..., 1.2446)
X =(
2200, 2134, ..., 3126)
Y =(
,)
0.47 Corr X Y =As cópulas e a relação entre os parâmetros e o Tau de Kendall
( )
(
)
(
) (
)
( )
( )
(
)
( )
(
)(
)
1 1 1 1 1 ,Família Expressão , parâmetro Tau de Kendall
Clayton max 1 ,0 1 +2 Gumbel exp ln ln 1 1 2 Normal , 1 1 arcsin 2 Morgenstern 1 1- 1 1 1 9 U V X Y C u v u v u v N N u N u uv u v θ θ θ θ θ θ θ θ θ θ θ ρ ρ π θ θ θ − − − − − − ⎛⎡ + − ⎤ ⎞ ≥ − ⎜⎣ ⎦ ⎟ ⎝ ⎠ ⎧− −⎡ + − ⎤ ⎫ ≥ − ⎨ ⎣ ⎦ ⎬ ⎩ ⎭ − ≤ ≤ + − − ≤ ≤ ⎡ ⎤ ⎣ ⎦ Clayton 1.024 Gumbel 1.512 0.3386 Normal 0.518 Morgenstern NA θ θ τ ρ = ⎧ ⎪ = ⎪ = → ⎨ = ⎪ ⎪⎩
Qualidade do ajuste
Método gráfico: comparar o scatter plot de uma amostra grande da
cópula ajustada e os pontos
(
Ri(
n+1 ,)
Si(
n+1)
)
(suporte da cópula
0.0 0.2 0.4 0.6 0.8 1.0 0. 0 0 .2 0. 4 0 .6 0. 8 1 .0 Clayton(1,024) samp.clayton[, 1] sa m p .c la yt o n [, 2 ] 0.0 0.2 0.4 0.6 0.8 1.0 0. 0 0 .2 0. 4 0 .6 0. 8 1 .0 Gumbel-Hougaard(1,512) samp.gumbel[, 1] s a m p .gum bel [, 2]
0.0 0.2 0.4 0.6 0.8 1.0 0 .0 0 .2 0. 4 0 .6 0. 8 1 .0 Clayton(1,024) samp.clayton[, 1] sa m p .c la yt o n [, 2 ] 0.0 0.2 0.4 0.6 0.8 1.0 0 .00 .2 0 .40 .6 0 .81 .0 Normal(0,518) samp.normal[, 1] s a mp .n o rma l[ , 2 ]
0.0 0.2 0.4 0.6 0.8 1.0 0. 0 0 .2 0 .4 0 .6 0. 8 1 .0 Gumbel-Hougaard(1,512) samp.gumbel[, 1] s a mp .g u m b e l[, 2 ] 0.0 0.2 0.4 0.6 0.8 1.0 0 .00 .2 0 .40 .6 0 .81 .0 Normal(0,518) samp.normal[, 1] s a m p .n or m a l[ , 2]
Referências
Anjos, U.U., Ferreira, F.H., Kolev, N.V., Mendes, B.V.M., 2004. Modelando dependências via
Cópulas. ABE. 16º SINAPE.
Joe, H., 1997, Multivariate Models and Dependence Concepts, Chapman&Hall-CRC
Nelsen, R.B., 2005. Dependence Modeling with Archimedian Copulas. Proceedings of the First Brazilian Conference on Statistical Modeling in Insurance and Finance. IME-USP.
http://www.lclark.edu/~mathsci/nelsen.html
Nelsen, R.B., 2002. Concordance and copulas: A survey. Kluwer Academic Publishers, Dordrecht, pp. 169-178. http://www.lclark.edu/~mathsci/nelsen.html
Nelsen, R.B. 1999, An Introduction to Copulas, Springer.
Yan, J. 2007, Enjoy the joy of copulas: With a package copula.Journal of Statistical Software, Volume 21, Issue 4. http://www.jstatso.org/
Genest, C., Rémillard, B. e Beaudoin, D. 2007, Goodness-of-fit for copulas: A review and a
power study. Insurance:Mathematics and Economics 44, 199-213, www.sciencedirect.com
Genest, C. e Favre, A.C. , 2007. Everything You Always Wanted to Know about Copula
Modeling but Were Afraid to Ask. Journal of Hydrological Engineering .
Frees, E.W. e Valdez, E.A., 1998, Understanding Relationships Using Copulas. North American Actuarial Journal, volume 2, number 1.1