Exemplo Regressão Linear Simples
Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 1oSemestre 2013Área e Preço de Imóveis
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Área e Preço de Imóveis
Área e Preço de Imóveis
Descrição dos Dados
Vamos considerar neste exemplo uma amostra aleatória de 50 imóveis em que foi observado para cada um opreço de venda(em mil USD) e
aárea total(em mil pés quadrados)anuma região de Eugene, EUA
(Gray, 1989). O objetivo principal do estudo é tentar explicar (ou prever) o preço de venda do imóvel dada a área total.
a1
ft2=0,092903m
Análise de Dados Preliminar
Sumário
1 Área e Preço de Imóveis
2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Análise de Dados Preliminar
Medidas Resumo
Descrição
Medida Área Total Preço Venda
n 50 50 Média 1,900 74,30 D.Padrão 0,627 26,48 CV 33% 36% Mínimo 0,800 30,60 1oQuartil 1,500 57,00 Mediana 1,945 68,40 3oQuartil 2,240 85,57 Máximo 4,000 165,00
Análise de Dados Preliminar
Boxplot Área Total do Imóvel
1.0 1.5 2.0 2.5 3.0 3.5 4.0 Área do Imó v el
Análise de Dados Preliminar
Boxplot Preço de Venda do Imóvel
40 60 80 100 120 140 160 Preço de V enda do Imó v el
Análise de Dados Preliminar
Dispersão Área Total e Preço de Venda
1.0 1.5 2.0 2.5 3.0 3.5 4.0 40 60 80 100 120 140 160 Área do Imóvel Preço de V enda
Ajuste Preliminar Regressão Linear Simples
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Ajuste Preliminar Regressão Linear Simples
Regressão Linear Simples
Descrição
Nota-se indícios de aumento do preço de venda do imóvel com o aumento da área total do imóvel, sugerindo inicialmente o seguinte modelo de regressão linear simples:
yi = β1+ β2× areai+ ǫi,
para i =1, . . . ,50, em que yi denota o preço de venda do i-ésimo
Ajuste Preliminar Regressão Linear Simples
Resíduos Modelo Ajustado
−2 −1 0 1 2 −2 0 2 4 Percentil da N(0,1) Residuo Studentizado
Ajuste Preliminar Regressão Linear Simples
Distribuição Empírica Resíduos
−2 0 2 4 6 0.0 0.1 0.2 0.3 0.4 0.5 0.6 Resíduo Studentizado Densidade
Ajuste Alternativo Regressão Linear Simples
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples
4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações 6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Ajuste Alternativo Regressão Linear Simples
Regressão Linear Simples
Descrição
Nota-se pelos gráficos de resíduos indícios de afastamentos da distribuição dos erros com indicação para assimetria à direita. Assim, sugerimos como alternativa, o seguinte modelo de regressão linear simples:
logyi = β1+ β2× areai+ ǫi,
para i =1, . . . ,50, em que yi denota o preço de venda do i-ésimo
imóvel eǫi
iid
Ajuste Alternativo Regressão Linear Simples
Resíduos Modelo Ajustado
−2 −1 0 1 2 −2 0 2 4 Percentil da N(0,1) Residuo Studentizado
Ajuste Alternativo Regressão Linear Simples
Diagnóstico Modelo Ajustado
0 10 20 30 40 50 0.0 0.2 0.4 0.6 0.8 1.0 Indice Medida h 50 0 10 20 30 40 50 0.0 0.1 0.2 0.3 0.4 0.5 Índice Distância de Cook 50 0 10 20 30 40 50 −2 0 2 4 Índice Resíduo P adronizado 49 4.0 4.5 5.0 −2 0 2 4 Valor Ajustado Resíduo P adronizado 49
Ajuste Alternativo Regressão Linear Simples
Diagnóstico Modelo Ajustado
Identificação Pontos Discrepantes
Pelos gráficos de diagnóstico temos que a observação #50 é identificada como ponto de alavanca e ponto influente, enquanto a observação #49 é identificada como ponto aberrante.
Ajuste Alternativo Regressão Linear Simples
Identificação pontos Discrepantes
1.0 1.5 2.0 2.5 3.0 3.5 4.0 40 60 80 100 120 140 160 Área do Imóvel Preço de V enda 49 50
Ajuste Alternativo Regressão Linear Simples
Resíduos Modelo Ajustado sem Ponto Aberrante
−2 −1 0 1 2 −4 −3 −2 −1 0 1 2 3 Percentil da N(0,1) Residuo Studentizado
Ajuste Alternativo Regressão Linear Simples
Estimativas
Descrição
As estimativas dos parâmetros são descritas na tabela abaixo. Efeito Estimativa Erro padrão valor-t valor-P
Constante 3,280 0,064 50,91 0,00 Área 0,510 0,032 15,82 0,00 R2 0,84 R2-ajustado 0,84 s 0,14 F 250,30 (1 e 48 g.l.) 0,00
Interpretações
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples
5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Interpretações
Interpretações
Valor Predito
Pelo modelo ajustado o preço predito para um imóvel com área total x fica aproximadamente dado por
ˆ
µ(x) =e3,28+0,51x.
Por exemplo, para um imóvel com x =2,0 mil pés quadrados o valor predito de venda é dado porµ(xˆ ) =e3,28+0,51x 2,0∼=73,70mil USD.
Interpretações
Interpretações
Variação Valor Predito
Quanto varia o valor predito de venda de um imóvel se há um aumento de x =1,0 mil pés quadrados na área total?
Essa variação fica aproximadamente dada por
ˆ µ(x +1) ˆ µ(x) = e 0,51 = 1,665(66,5%).
Portanto, para um aumento de mil pés quadrados na área total do imóvel, espera-se aumento no preço de venda do imóvel de aproximadamente66,5 %.
Interpretações
Interpretações
Estimativa Intervalar
Estimativa intervalar de 95% para a variação no valor predito de venda do imóvel quando há aumento de mil pés quadrados na área total
e0,51±2,01×0,032 = e0,51±0,0643
= [1,561;1,776][56,1%;77,6%].
Portanto, para um aumento de mil pés quadrados na área total, espera-se aumento no preço de venda entre 56,1% e 77,6%.
Curvas Ajustadas
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Curvas Ajustadas
Comparação Curvas Ajustadas
1.0 1.5 2.0 2.5 3.0 3.5 4.0 50 100 150 200 Área Total Preço de V enda todos ptos sem #49 sem #50
Bandas de Confiança
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Bandas de Confiança
Banda de Confiança para a Média
0 1 2 3 4 50 100 150 200 Área do Imóvel Preço de V enda
Bandas de Confiança
Banda de Confiança para Nova Observação
0 1 2 3 4 0 50 100 150 200 250 300 Área do Imóvel Preço de V enda
Conclusões
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Conclusões
Conclusões
Considerações Finais
Este é um exemplo em que através de análise de resíduos verifica-se fortes indícios de afastamentos das suposições feitas para o modelo inicial.
Através de uma transformação logarítmica na resposta chega-se a um modelo linear simples que apresenta um ajuste superior ao
apresentado inicialmente. Duas observações aparecem como
discrepantes, contudo a eliminação das mesmas não leva a mudanças inferenciais importantes.
Referências
Sumário
1 Área e Preço de Imóveis 2 Análise de Dados Preliminar
3 Ajuste Preliminar Regressão Linear Simples 4 Ajuste Alternativo Regressão Linear Simples 5 Interpretações
6 Curvas Ajustadas
7 Bandas de Confiança
8 Conclusões
Referências
Referências
Referência
Gray, J. B. (1989). On the use of regression diagnostics. The