Exemplo Regressão Linear Simples

33 

Loading.... (view fulltext now)

Loading....

Loading....

Loading....

Loading....

Texto

(1)

Exemplo Regressão Linear Simples

Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1oSemestre 2013

(2)

Área e Preço de Imóveis

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(3)

Área e Preço de Imóveis

Área e Preço de Imóveis

Descrição dos Dados

Vamos considerar neste exemplo uma amostra aleatória de 50 imóveis em que foi observado para cada um opreço de venda(em mil USD) e

aárea total(em mil pés quadrados)anuma região de Eugene, EUA

(Gray, 1989). O objetivo principal do estudo é tentar explicar (ou prever) o preço de venda do imóvel dada a área total.

a1

ft2=0,092903m

(4)

Análise de Dados Preliminar

Sumário

1 Área e Preço de Imóveis

2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(5)

Análise de Dados Preliminar

Medidas Resumo

Descrição

Medida Área Total Preço Venda

n 50 50 Média 1,900 74,30 D.Padrão 0,627 26,48 CV 33% 36% Mínimo 0,800 30,60 1oQuartil 1,500 57,00 Mediana 1,945 68,40 3oQuartil 2,240 85,57 Máximo 4,000 165,00

(6)

Análise de Dados Preliminar

Boxplot Área Total do Imóvel

1.0 1.5 2.0 2.5 3.0 3.5 4.0 Área do Imó v el

(7)

Análise de Dados Preliminar

Boxplot Preço de Venda do Imóvel

40 60 80 100 120 140 160 Preço de V enda do Imó v el

(8)

Análise de Dados Preliminar

Dispersão Área Total e Preço de Venda

1.0 1.5 2.0 2.5 3.0 3.5 4.0 40 60 80 100 120 140 160 Área do Imóvel Preço de V enda

(9)

Ajuste Preliminar Regressão Linear Simples

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(10)

Ajuste Preliminar Regressão Linear Simples

Regressão Linear Simples

Descrição

Nota-se indícios de aumento do preço de venda do imóvel com o aumento da área total do imóvel, sugerindo inicialmente o seguinte modelo de regressão linear simples:

yi = β1+ β2× areai+ ǫi,

para i =1, . . . ,50, em que yi denota o preço de venda do i-ésimo

(11)

Ajuste Preliminar Regressão Linear Simples

Resíduos Modelo Ajustado

−2 −1 0 1 2 −2 0 2 4 Percentil da N(0,1) Residuo Studentizado

(12)

Ajuste Preliminar Regressão Linear Simples

Distribuição Empírica Resíduos

−2 0 2 4 6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Resíduo Studentizado Densidade

(13)

Ajuste Alternativo Regressão Linear Simples

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples

4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações 6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(14)

Ajuste Alternativo Regressão Linear Simples

Regressão Linear Simples

Descrição

Nota-se pelos gráficos de resíduos indícios de afastamentos da distribuição dos erros com indicação para assimetria à direita. Assim, sugerimos como alternativa, o seguinte modelo de regressão linear simples:

logyi = β1+ β2× areai+ ǫi,

para i =1, . . . ,50, em que yi denota o preço de venda do i-ésimo

imóvel eǫi

iid

(15)

Ajuste Alternativo Regressão Linear Simples

Resíduos Modelo Ajustado

−2 −1 0 1 2 −2 0 2 4 Percentil da N(0,1) Residuo Studentizado

(16)

Ajuste Alternativo Regressão Linear Simples

Diagnóstico Modelo Ajustado

0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Indice Medida h 50 0 10 20 30 40 50 0.0 0.1 0.2 0.3 0.4 0.5 Índice Distância de Cook 50 0 10 20 30 40 50 −2 0 2 4 Índice Resíduo P adronizado 49 4.0 4.5 5.0 −2 0 2 4 Valor Ajustado Resíduo P adronizado 49

(17)

Ajuste Alternativo Regressão Linear Simples

Diagnóstico Modelo Ajustado

Identificação Pontos Discrepantes

Pelos gráficos de diagnóstico temos que a observação #50 é identificada como ponto de alavanca e ponto influente, enquanto a observação #49 é identificada como ponto aberrante.

(18)

Ajuste Alternativo Regressão Linear Simples

Identificação pontos Discrepantes

1.0 1.5 2.0 2.5 3.0 3.5 4.0 40 60 80 100 120 140 160 Área do Imóvel Preço de V enda 49 50

(19)

Ajuste Alternativo Regressão Linear Simples

Resíduos Modelo Ajustado sem Ponto Aberrante

−2 −1 0 1 2 −4 −3 −2 −1 0 1 2 3 Percentil da N(0,1) Residuo Studentizado

(20)

Ajuste Alternativo Regressão Linear Simples

Estimativas

Descrição

As estimativas dos parâmetros são descritas na tabela abaixo. Efeito Estimativa Erro padrão valor-t valor-P

Constante 3,280 0,064 50,91 0,00 Área 0,510 0,032 15,82 0,00 R2 0,84 R2-ajustado 0,84 s 0,14 F 250,30 (1 e 48 g.l.) 0,00

(21)

Interpretações

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples

5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(22)

Interpretações

Interpretações

Valor Predito

Pelo modelo ajustado o preço predito para um imóvel com área total x fica aproximadamente dado por

ˆ

µ(x) =e3,28+0,51x.

Por exemplo, para um imóvel com x =2,0 mil pés quadrados o valor predito de venda é dado porµ(xˆ ) =e3,28+0,51x 2,0∼=73,70mil USD.

(23)

Interpretações

Interpretações

Variação Valor Predito

Quanto varia o valor predito de venda de um imóvel se há um aumento de x =1,0 mil pés quadrados na área total?

Essa variação fica aproximadamente dada por

ˆ µ(x +1) ˆ µ(x) = e 0,51 = 1,665(66,5%).

Portanto, para um aumento de mil pés quadrados na área total do imóvel, espera-se aumento no preço de venda do imóvel de aproximadamente66,5 %.

(24)

Interpretações

Interpretações

Estimativa Intervalar

Estimativa intervalar de 95% para a variação no valor predito de venda do imóvel quando há aumento de mil pés quadrados na área total

e0,51±2,01×0,032 = e0,51±0,0643

= [1,561;1,776][56,1%;77,6%].

Portanto, para um aumento de mil pés quadrados na área total, espera-se aumento no preço de venda entre 56,1% e 77,6%.

(25)

Curvas Ajustadas

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(26)

Curvas Ajustadas

Comparação Curvas Ajustadas

1.0 1.5 2.0 2.5 3.0 3.5 4.0 50 100 150 200 Área Total Preço de V enda todos ptos sem #49 sem #50

(27)

Bandas de Confiança

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(28)

Bandas de Confiança

Banda de Confiança para a Média

0 1 2 3 4 50 100 150 200 Área do Imóvel Preço de V enda

(29)

Bandas de Confiança

Banda de Confiança para Nova Observação

0 1 2 3 4 0 50 100 150 200 250 300 Área do Imóvel Preço de V enda

(30)

Conclusões

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(31)

Conclusões

Conclusões

Considerações Finais

Este é um exemplo em que através de análise de resíduos verifica-se fortes indícios de afastamentos das suposições feitas para o modelo inicial.

Através de uma transformação logarítmica na resposta chega-se a um modelo linear simples que apresenta um ajuste superior ao

apresentado inicialmente. Duas observações aparecem como

discrepantes, contudo a eliminação das mesmas não leva a mudanças inferenciais importantes.

(32)

Referências

Sumário

1 Área e Preço de Imóveis 2 Análise de Dados Preliminar

3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações

6 Curvas Ajustadas

7 Bandas de Confiança

8 Conclusões

(33)

Referências

Referências

Referência

Gray, J. B. (1989). On the use of regression diagnostics. The

Imagem

Referências

temas relacionados :