Regressão linear
Tiago M. Magalhães
XLVII Programa de Verão - IME-USP
São Paulo, 30 de janeiro de 2018
Roteiro
1 Correlação linear
2 Regressão linear
Roteiro
1 Correlação linear
2 Regressão linear
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas. Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade;
Expectativa de vida e taxa de analfabetismo.
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade;
Correlação linear
Correlação
É o relacionamento entre duas variáveis quantitativas.
Exemplos:
Idade e altura das crianças;
Tempo de prática de esportes e ritmo cardíaco;
Tempo de estudo e nota na prova;
Taxa de desemprego e taxa de criminalidade;
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva; ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas
Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se: ρ= 1, correlação linear perfeita positiva;
ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva; ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva;
ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva;
ρ=−1, correlação linear perfeita negativa;
ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva;
ρ=−1, correlação linear perfeita negativa;
ρ= 0, não existe correlação.
Correlação linear
Coeficiente de correlação de Pearson
Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:
ρ= 1, correlação linear perfeita positiva;
ρ=−1, correlação linear perfeita negativa;
ρ= 0, não existe correlação.
Correlação linear
Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:
ρXY =
Pn
i=1XiYi− Pn
i=1XiPn
i=1Yi
n
s Pn
i=1Xi2−(Pni=1Xi)2
n
Pn
i=1Yi2−(Pni=1Yi)2
n
.
Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.
Correlação linear
Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:
ρXY =
Pn
i=1XiYi− Pn
i=1XiPn
i=1Yi
n
s Pn
i=1Xi2−(Pni=1Xi)2
n
Pn
i=1Yi2−(Pni=1Yi)2
n
.
Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.
Correlação linear
Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:
ρXY =
Pn
i=1XiYi− Pn
i=1XiPn
i=1Yi
n
s Pn
i=1Xi2−(Pni=1Xi)2
n
Pn
i=1Yi2−(Pni=1Yi)2
n
.
Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.
Correlação linear
Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:
ρXY =
Pn
i=1XiYi− Pn
i=1XiPn
i=1Yi
n
s Pn
i=1Xi2−(Pni=1Xi)2
n
Pn
i=1Yi2−(Pni=1Yi)2
n
.
Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ: 0,7≤ |ρ|<1,0; indicando uma forte correlação. 0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ:
0,7≤ |ρ|<1,0; indicando uma forte correlação. 0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ:
0,7≤ |ρ|<1,0; indicando uma forte correlação.
0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ:
0,7≤ |ρ|<1,0; indicando uma forte correlação.
0,3≤ |ρ|<0,7; indicando correlação moderada.
0<|ρ|<0,3; indicando fraca correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ:
0,7≤ |ρ|<1,0; indicando uma forte correlação.
0,3≤ |ρ|<0,7; indicando correlação moderada.
0<|ρ|<0,3; indicando fraca correlação.
Correlação linear
Interpretação
Na literatura, temos a seguinte classificação para ρ:
0,7≤ |ρ|<1,0; indicando uma forte correlação.
0,3≤ |ρ|<0,7; indicando correlação moderada.
0<|ρ|<0,3; indicando fraca correlação.
Roteiro
1 Correlação linear
2 Regressão linear
Regressão linear
Ideia
Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.
Regressão linear
Ideia
Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.
Regressão linear
Ideia
Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.
Regressão linear
Modelo
Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:
Y =α+βX+ε,
em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosε∼N(0, σ2).
Regressão linear
Modelo
Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:
Y =α+βX+ε,
em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosε∼N(0, σ2).
Regressão linear
Modelo
Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:
Y =α+βX+ε,
em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosε∼N(0, σ2).
Regressão linear
Modelo
Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:
Y =α+βX+ε,
em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosε∼N(0, σ2).
Regressão linear
Reta ajustada
Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira: βˆ =
Pn
i=1XiYi −nX¯Y¯ (n−1)SX2 , ˆ
α = Y¯ −βˆX¯.
E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.
Regressão linear
Reta ajustada
Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:
βˆ = Pn
i=1XiYi −nX¯Y¯ (n−1)SX2 , ˆ
α = Y¯ −βˆX¯.
E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.
Regressão linear
Reta ajustada
Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:
βˆ = Pn
i=1XiYi −nX¯Y¯ (n−1)SX2 , ˆ
α = Y¯ −βˆX¯.
E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.
Regressão linear
Reta ajustada
Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:
βˆ = Pn
i=1XiYi −nX¯Y¯ (n−1)SX2 , ˆ
α = Y¯ −βˆX¯.
E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.
Regressão linear
Como vimos, Y =α+βX+ε, em que ε∼N(0, σ2). Pelas propriedades da distribuição normal, temos que
Y ∼N(µY, σ2),
com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.
Regressão linear
Como vimos, Y =α+βX+ε, em que ε∼N(0, σ2). Pelas propriedades da distribuição normal, temos que
Y ∼N(µY, σ2), com µY =α+βX.
Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.
Regressão linear
Como vimos, Y =α+βX+ε, em que ε∼N(0, σ2). Pelas propriedades da distribuição normal, temos que
Y ∼N(µY, σ2),
com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.
Regressão linear
Como vimos, Y =α+βX+ε, em que ε∼N(0, σ2). Pelas propriedades da distribuição normal, temos que
Y ∼N(µY, σ2),
com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.
Regressão linear
Generalizações
SeY ∼N(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;
Se Y ∼ N(µY, σ2), µY = f(α+β1X1+β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;
SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.
Regressão linear
Generalizações
SeY ∼N(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;
Se Y ∼ N(µY, σ2), µY = f(α+β1X1+β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;
SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.
Regressão linear
Generalizações
SeY ∼N(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;
Se Y ∼ N(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;
SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.
Regressão linear
Generalizações
SeY ∼N(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;
Se Y ∼ N(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;
SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.
Regressão linear
Generalizações
SeY ∼N(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;
Se Y ∼ N(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;
SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.
Obrigado!
Contato: tiagomm@ime.usp.br Sala 136-B