• Nenhum resultado encontrado

Regressão linear

N/A
N/A
Protected

Academic year: 2022

Share "Regressão linear"

Copied!
57
0
0

Texto

(1)

Regressão linear

Tiago M. Magalhães

XLVII Programa de Verão - IME-USP

São Paulo, 30 de janeiro de 2018

(2)

Roteiro

1 Correlação linear

2 Regressão linear

(3)

Roteiro

1 Correlação linear

2 Regressão linear

(4)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas. Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(5)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(6)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(7)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco; Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(8)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco;

Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(9)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco;

Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade; Expectativa de vida e taxa de analfabetismo.

(10)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco;

Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade;

Expectativa de vida e taxa de analfabetismo.

(11)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco;

Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade;

(12)

Correlação linear

Correlação

É o relacionamento entre duas variáveis quantitativas.

Exemplos:

Idade e altura das crianças;

Tempo de prática de esportes e ritmo cardíaco;

Tempo de estudo e nota na prova;

Taxa de desemprego e taxa de criminalidade;

(13)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva; ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.

(14)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas

Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se: ρ= 1, correlação linear perfeita positiva;

ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.

(15)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva; ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.

(16)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva;

ρ=−1, correlação linear perfeita negativa; ρ= 0, não existe correlação.

(17)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva;

ρ=−1, correlação linear perfeita negativa;

ρ= 0, não existe correlação.

(18)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva;

ρ=−1, correlação linear perfeita negativa;

ρ= 0, não existe correlação.

(19)

Correlação linear

Coeficiente de correlação de Pearson

Quantifica o relacionamento linear entre duas variáveis quantitativas Essa quantificação, denotada por ρ, assume valores entre -1 e 1, se:

ρ= 1, correlação linear perfeita positiva;

ρ=−1, correlação linear perfeita negativa;

ρ= 0, não existe correlação.

(20)
(21)
(22)
(23)
(24)

Correlação linear

Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:

ρXY =

Pn

i=1XiYiPn

i=1XiPn

i=1Yi

n

s Pn

i=1Xi2−(Pni=1Xi)2

n

Pn

i=1Yi2−(Pni=1Yi)2

n

.

Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.

(25)

Correlação linear

Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:

ρXY =

Pn

i=1XiYiPn

i=1XiPn

i=1Yi

n

s Pn

i=1Xi2−(Pni=1Xi)2

n

Pn

i=1Yi2−(Pni=1Yi)2

n

.

Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.

(26)

Correlação linear

Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:

ρXY =

Pn

i=1XiYiPn

i=1XiPn

i=1Yi

n

s Pn

i=1Xi2−(Pni=1Xi)2

n

Pn

i=1Yi2−(Pni=1Yi)2

n

.

Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.

(27)

Correlação linear

Dado n pares de observações (X1,Y1),(X2,Y2), . . . ,(Xn,Yn), define-se co- eficiente de correlação como o coeficiente:

ρXY =

Pn

i=1XiYiPn

i=1XiPn

i=1Yi

n

s Pn

i=1Xi2−(Pni=1Xi)2

n

Pn

i=1Yi2−(Pni=1Yi)2

n

.

Observação: Quando ρXY é calculado na amostra, por convenção, utiliza- se ˆρXY ourXY como notação para o coeficiente de correlação.

(28)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ: 0,7≤ |ρ|<1,0; indicando uma forte correlação. 0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.

(29)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ:

0,7≤ |ρ|<1,0; indicando uma forte correlação. 0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.

(30)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ:

0,7≤ |ρ|<1,0; indicando uma forte correlação.

0,3≤ |ρ|<0,7; indicando correlação moderada. 0<|ρ|<0,3; indicando fraca correlação.

(31)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ:

0,7≤ |ρ|<1,0; indicando uma forte correlação.

0,3≤ |ρ|<0,7; indicando correlação moderada.

0<|ρ|<0,3; indicando fraca correlação.

(32)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ:

0,7≤ |ρ|<1,0; indicando uma forte correlação.

0,3≤ |ρ|<0,7; indicando correlação moderada.

0<|ρ|<0,3; indicando fraca correlação.

(33)

Correlação linear

Interpretação

Na literatura, temos a seguinte classificação para ρ:

0,7≤ |ρ|<1,0; indicando uma forte correlação.

0,3≤ |ρ|<0,7; indicando correlação moderada.

0<|ρ|<0,3; indicando fraca correlação.

(34)

Roteiro

1 Correlação linear

2 Regressão linear

(35)

Regressão linear

Ideia

Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.

(36)

Regressão linear

Ideia

Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.

(37)

Regressão linear

Ideia

Investigar a presença ou ausência de relação linear entre duas variáveis quan- titativas. A correlação quantifica a força dessa relação. E a explicitação da forma dessa relação é a regressão.

(38)

Regressão linear

Modelo

Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:

Y =α+βX+ε,

em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosεN(0, σ2).

(39)

Regressão linear

Modelo

Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:

Y =α+βX+ε,

em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosεN(0, σ2).

(40)

Regressão linear

Modelo

Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:

Y =α+βX+ε,

em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosεN(0, σ2).

(41)

Regressão linear

Modelo

Assumindo a existência de uma relação linear entre as variáveis X e Y, ela descrita da seguinte forma:

Y =α+βX+ε,

em que α é o intercepto, β é a inclinação ou coeficiente angular e ε é o termo aleatório ou erro. Além disso, supomosεN(0, σ2).

(42)
(43)
(44)

Regressão linear

Reta ajustada

Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira: βˆ =

Pn

i=1XiYinX¯Y¯ (n−1)SX2 , ˆ

α = Y¯ −βˆX¯.

E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.

(45)

Regressão linear

Reta ajustada

Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:

βˆ = Pn

i=1XiYinX¯Y¯ (n−1)SX2 , ˆ

α = Y¯ −βˆX¯.

E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.

(46)

Regressão linear

Reta ajustada

Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:

βˆ = Pn

i=1XiYinX¯Y¯ (n−1)SX2 , ˆ

α = Y¯ −βˆX¯.

E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.

(47)

Regressão linear

Reta ajustada

Os coeficientes estimados ˆα e ˆβ são calculados da seguinte maneira:

βˆ = Pn

i=1XiYinX¯Y¯ (n−1)SX2 , ˆ

α = Y¯ −βˆX¯.

E a reta ajustada é dada por ˆY = ˆα+ ˆβX. Um interpretação seria: para um aumento de uma unidade em X,Y aumenta, em média, ˆβ unidades.

(48)

Regressão linear

Como vimos, Y =α+βX+ε, em que εN(0, σ2). Pelas propriedades da distribuição normal, temos que

YN(µY, σ2),

com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.

(49)

Regressão linear

Como vimos, Y =α+βX+ε, em que εN(0, σ2). Pelas propriedades da distribuição normal, temos que

YN(µY, σ2), com µY =α+βX.

Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.

(50)

Regressão linear

Como vimos, Y =α+βX+ε, em que εN(0, σ2). Pelas propriedades da distribuição normal, temos que

YN(µY, σ2),

com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.

(51)

Regressão linear

Como vimos, Y =α+βX+ε, em que εN(0, σ2). Pelas propriedades da distribuição normal, temos que

YN(µY, σ2),

com µY =α+βX. Isto é, quando ajustamos um reta de regressão linear, estamos estimando a média de uma variável aleatória normal.

(52)

Regressão linear

Generalizações

SeYN(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;

Se YN(µY, σ2), µY = f(α+β1X1+β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;

SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.

(53)

Regressão linear

Generalizações

SeYN(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;

Se YN(µY, σ2), µY = f(α+β1X1+β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;

SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.

(54)

Regressão linear

Generalizações

SeYN(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;

Se YN(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;

SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.

(55)

Regressão linear

Generalizações

SeYN(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;

Se YN(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;

SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.

(56)

Regressão linear

Generalizações

SeYN(µY, σ2) eµY =α+β1X1+β2X2+· · ·+βpXp, temos uma regressão linear múltipla;

Se YN(µY, σ2), µY = f(α+β1X1 +β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos uma regressão não linear;

SeY ∼família exponencial de distribuições(µY, φ),µY =f(α+β1X1+ β2X2 +· · ·+βpXp) e f(·) uma função conhecida, temos um modelo linear generalizado.

(57)

Obrigado!

Contato: tiagomm@ime.usp.br Sala 136-B

Referências

Documentos relacionados

Acreditando estar vivenciando uma oportunidade importante para o processo de formação do profissional de Educação Física e o fortalecimento da conquista do espaço

Essa articulação entre a administração pública e a esfera privada tem assumido novos contornos em função da reforma do Estado brasileiro e é uma tendência que tem se multiplicado

corrente mantida pela FORNECEDORA, preferencialmente em, até o 5º (quinto) dia útil contado a partir da data da apresentação da nota fiscal/fatura discriminativa acompanhada

Danish Natural Science Research Council, the Carlsberg Founda- tion and the Danish National Research Foundation; The European Research Council under the European Community’s

Metodologia De Trabalhos Acadêmicos Álgebra Linear E Geometria Analítica Cálculo II.. 10 5804.180104 Trabalho Final De Curso 180 10 4 Desenho Técnico Física II Probabilidade

Segundo Koenig, a medicina tem sido mais precisa e científica, mas também mais reducionista, pois as enfermidades têm sido compreendidas como um fenômeno localizado, afetando

The Baseline of Brazil has, as a starting and a final point, respectively, the points whose coordinates set the reference for the delimitation of the lateral maritime limits

BRA233 UNIVERSIDADE FEDERAL DO SUL DA BAHIA BRA236 INSTITUTO PAULISTA DE ENSINO E PESQUISA BRA239 INSTITUTO SUMARE DE EDUCAÇÃO SUPERIOR LTDA BRA240 INSTITUTO TECNOLÓGICO