Mestrado em Meio Ambiente e
Recursos Hídricos
Noções de correlação e
regressão.
Correlação
Variáveis X e Y com variações no mesmo
sentido correlação positiva
Variações em sentido contrário correlação
negativa
Noções de correlação e
regressão.
Covariância mede a variação
concomitante dessas variáveis.
(
)(
)
(
)
n y x n f y x n y y x x s k i i i i k i i i xy − − − = − −Exemplo de correlação
positiva:
xi yi xi - x yi-y (xi-x)(yi-y)
1 3 -2 -2 4
2 4 -1 -1 1
3 5 0 0 0
4 6 1 1 1
5 7 2 2 4
3 5 10
10
Exemplo de correlação
negativa:
xi yi xi - x yi-y (xi-x)(yi-y)
1 7 -2 2 -4
2 6 -1 1 -1
3 5 0 0 0
4 4 1 -1 -1
5 3 2 -2 -4
3 5 -10
10
− = −
Exemplo de não-correlação:
xi yi xi - x yi-y (xi-x)(yi-y)
1 3 -2 -0,4 0,8
2 4 -1 0,6 -0,6
3 3 0 -0,4 0
4 4 1 0,6 0,6
5 3 2 -0,4 -0,8
Noções de correlação e
regressão.
A covariância possui um sinal que coincide com o sentido da correlação.
No primeiro caso existe uma relação linear
Y = X + 2 correlação perfeita positiva.
No segundo caso existe uma relação linear
Noções de correlação e
regressão.
Covariância (sentido da correlação) não pode ser usada por si só como medida sintética e absoluta do grau de correlação entre X e Y.
Grau de correlação função da ordem de
grandeza das variáveis X e Y.
Duas situações que apresentam correlação
Noções de correlação e
regressão.
Exemplo
xi 1 2 3 4 5
yi 3 4 5 6 7
2
+
=
X
Noções de correlação e
regressão.
xi 1 2 3 4 5
yi 3 5 7 9 11
1
2
+
=
X
Noções de correlação e
regressão.
A magnitude da variância não pode por si só medir o grau de correlação.
Noções de correlação e
regressão.
=
−
−
−
=
= = = − − − −.
1 2 1 2 1 2 1 21 1 1
Noções de correlação e
regressão.
Como os desvios padrão sx e sy são sempre positivos, r mantém o sinal da covariância.
xi 1 2 3 4 5
yi 3 4 5 6 7
Noções de correlação e
regressão.
r será sempre igual a +1 para a correlação perfeita positiva.
No caso da correlação negativa:
xi 1 2 3 4 5
yi 7 6 5 4 3
Noções de correlação e
regressão.
No caso de não correlação:
xi 1 2 3 4 5
yi 2 4 3 4 2
8
,
0
2
2 2
=
=
y x
s
s
0
=
Noções de correlação e
regressão.
Correlação de Pearson
0 Não-correlação
+ 1 Correlação perfeita positiva
Exemplo
Peso(kg) Altura(cm) fi (xi-x).fi (yi-y).fi (xi-x)(yi-y)fi (xi-x)^2fi (yi-y)^2fi
Noções de correlação e
regressão.
(
)(
)
94
,
21
20
80
,
438
1+
=
=
−
−
=
−n
f
y
y
x
x
s
k i i i i xy87
,
0
94
,
21
+
+
=
=
s
xyExemplo 2:
Regressão:
Correlação perfeita abstração na prática
Existência de resíduo valor observado e o
valor teórico modelo matemático
Conhecimento sobre um fenômeno incompleto
Noções de correlação e
regressão.
Onde u mede o resíduo modelo
estatístico.
( )
X
u
f
Regressão linear simples de Y
em X
O modelo estatístico mais simples é aquele que expressa Y como função de X:
i
i
T
i
x
u
Noções de correlação e
regressão.
Onde β é o coeficiente angular e α, o
coeficiente linear.
β = coeficiente de regressão de Y em X ou
simplesmente coeficiente de regressão.
Uma vez que α e β são conhecidos, o
primeiro passo para resolver o problema
Noções de correlação e
regressão.
Onde yi é um estimador de yiT e a e b são
estimadores de α e β, respectivamente.
i
i
a
bx
Noções de correlação e
regressão.
e1 = desvio entre um valor observado yi e um valor ajustado ^yi.
e1 = yi - ^yi
a e b determinados para que seja mínima
a quantidade:
n
Noções de correlação e
regressão.
a e b são valores que minimizam a soma dos quadrados:
(
)
[
(
)
]
= =
+
−
=
−
n
i
i i
n
i
i
i
y
f
y
a
bx
f
y
1
2 1
Noções de correlação e
regressão.
x
b
y
a
=
−
Noções de correlação e
regressão.
O coeficiente de regressão de Y em X, da reta ajustada, b, não seria o mesmo se se tratasse da regressão de X em Y.
b’ = coeficiente da reta de regressão ajustada de X em Y:
(
)(
)
−
− −
=
n i
i i
i x y y f
x
Noções de correlação e
regressão.
Diferença entre a correlação e a regressão:
Se r = 0 b = 0 a reta de regressão de Y
em X é paralela ao eixo dos X.
y x
s
s
b
Noções de correlação e
regressão.
Variação “explicada” pela regressão
(
)
(
)
iNoções de correlação e
regressão.
r2 mede a proporção de variação total de
Y, que é explicada através do ajuste do modelo linear.
Para um número fixo n de observações, quanto melhor for o ajuste dos dados
maior será o valor de r2
Noções de correlação e
regressão.
Aquilatação da qualidade do ajuste coeficiente de variação:
(
)
y
y
y
CV
n i
i i
=
−
=
12
Noções de correlação e
regressão.
CV compara a variação dos valores de Y
em torno da reta ajustada Y com o valor
médio de Y, fornecendo uma medida relativa do ajuste.
Quanto menor o valor de CV melhor o
Exemplo:
Quantidade de assimilação de glucose
X Y
n Glucose injetada Glucose retida
1 0,073 0,072
2 0,159 0,154
3 0,222 0,217
4 0,390 0,290
5 0,463 0,458
6 0,512 0,500
7 0,753 0,686
8 0,926 0,832
9 1,130 0,820
10 1,160 1,040
11 1,193 0,871
12 1,301 1,065
13 1,323 1,132
14 1,460 1,430
X Y
n Glucose injetada Glucose retida xy x^2
1 0,073 0,072 0,005256 0,005329
2 0,159 0,154 0,024486 0,025281
3 0,222 0,217 0,048174 0,049284
4 0,390 0,290 0,1131 0,1521
5 0,463 0,458 0,212054 0,214369 x= 1,036389
6 0,512 0,500 0,256 0,262144 y= 0,879556
7 0,753 0,686 0,516558 0,567009
8 0,926 0,832 0,770432 0,857476
9 1,130 0,820 0,9266 1,2769
10 1,160 1,040 1,2064 1,3456
11 1,193 0,871 1,039103 1,423249 b = 0,804145
12 1,301 1,065 1,385565 1,692601 a = 0,046148
13 1,323 1,132 1,497636 1,750329
14 1,460 1,430 2,0878 2,1316
y = 0,8041x + 0,0461 R2 = 0,9319
0,500 1,000 1,500 2,000 2,500
G
lu
c
o
s
e
r
e
ti
d
a
(
g
/k
g
Exemplo:
Nível de ruído de tráfego (Y) e distância da rodovia (X)
x (m) y [dB(A)]
1 20 90
2 40 90
3 60 86
4 80 81