Exemplo Preferência de Automóveis
Gilberto A. Paula Departamento de Estatística IME-USP, Brasil giapaula@ime.usp.br 2oSemestre 2013Preferência Automóveis Sumário
1 Preferência Automóveis 2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Preferência Automóveis Preferência Automóveis
Descrição dos Dados
Como ilustração de exemplo de modelo binomial para dados não
agrupados, vamos considerar os dados sobre apreferência de
automóveis(1: americano, 0: japonês) de uma amostra aleatória de 263 consumidores (Foster, Stine e Waterman, 1998, pp. 338-339). A probabilidade de preferência por carro americano será relacionada
com as seguintes variáveis explicativas do comprador(a): idade(em
anos),sexo(0: masculino; 1: feminino) eestado civil(0:casado(a),
Análise de Dados Preliminar Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar 3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Análise de Dados Preliminar Descrição dos Dados
Preferência segundo o Sexo
Masculino Feminino
Americano 61 (42,4%) 54 (45,4%)
Japonês 83 (57,6%) 65 (54,6%)
Análise de Dados Preliminar Descrição dos Dados
Preferência segundo o Sexo
Masculino Feminino
Americano 61 (42,4%) 54 (45,4%)
Japonês 83 (57,6%) 65 (54,6%)
Total 144 119
Preferência segundo o Estado Civil
Casado Solteiro
Americano 83 (48,8%) 32 (34,4%)
Japonês 87 (51,2%) 65 (65,6%)
Análise de Dados Preliminar
Boxplots da Idade segundo a Preferência
Japonês Americano 20 30 40 50 60 Idade do Compr ador
Modelo Binomial Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Modelo Binomial Modelo Binomial
Descrição
Denotaremos por Yi a preferência do i-ésimo comprador (=1
automóvel americano, =0 automóvel japonês). Vamos propor o
seguinte modelo binomial para explicar a probabilidade de preferência por automóvel americano:
Yi ind ∼ Be(πi), log n πi 1−πi o
= β1+ β2× Idadei+ β3× Sexoi + β4× ECivili,
em queπi denota a probabilidade do i-ésimo comprador preferir
Resultados Modelo Ajustado Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Resultados Modelo Ajustado Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.Padrão
Constante -1,653 0,708 -2,33
Idade 0,050 0,022 2,27
SexoF -0,094 0,256 -0,37
ECivilS -0,518 0,272 -1,90
Resultados Modelo Ajustado Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.Padrão
Constante -1,600 0,692 -2,31
Idade 0,050 0,021 2,38
Resultados Modelo Ajustado Modelo Binomial
Estimativas
Efeito Estimativa E.Padrão E/E.Padrão
Constante -1,600 0,692 -2,31
Idade 0,050 0,021 2,38
ECivilS -0,526 0,272 -1,93
Interação
O teste de ausência de interação entre idade e estado civil forneceu o seguinte valor para a estatística da razão de verossimilhanças
ξRV =0,81com nível descritivoP=0,368, portanto não rejeitamos a
Resultados Modelo Ajustado Interpretações
Efeito Idade
A probabilidade de preferência por automóvel americano aumenta com a idade do comprador.
Resultados Modelo Ajustado Interpretações
Efeito Idade
A probabilidade de preferência por automóvel americano aumenta com a idade do comprador.
Razão de Chances
A razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano é estimada por
ˆ
ψ = exp(0,526)
= 1,69.
Ou seja, um comprador casado tem uma chance 69% maior de preferir automóvel americano em relação a um comprador solteiro.
Resultados Modelo Ajustado Interpretações
Estimativa Intervalar
Estimativa intervalar de 90% para a razão de chances entre um comprador casado e um comprador solteiro preferir automóvel americano
e0,526±1,65×0,272
= e0,526±0,449
= [1,080;2,651][8,0%;165,1%].
Portanto, um comprador casado tem uma chance entre 8% e 165,1% maior de preferir automóvel americano em relação a um comprador solteiro.
Preferência Auto Americano Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Preferência Auto Americano Preferência Auto Americano
20 30 40 50 60 0.2 0.4 0.6 0.8 Probabilidade Ajustada Casado Solteiro
Preferência Auto Americano Diagnóstico Modelo Final
0.3 0.4 0.5 0.6 0.7 0.02 0.04 0.06 0.08 0.10 Valor Ajustado Medida h 99 223 0 50 100 150 200 250 0.00 0.05 0.10 0.15 0.20 0.25 0.30 Índice Distância de Cook 99
Preferência Auto Americano Resíduos Modelo Final
Percentil da N(0,1) Componente do Desvio -3 -2 -1 0 1 2 3 -2 -1 0 1 2
Preferência Auto Americano Pontos Discrepantes
Sem 0bservação #99
Efeito Estimativa z-valor Variação
Constante -1,942 -2,65 -21,4%
Idade 0,060 2,65 22,4%
Preferência Auto Americano Pontos Discrepantes
Sem 0bservação #99
Efeito Estimativa z-valor Variação
Constante -1,942 -2,65 -21,4%
Idade 0,060 2,65 22,4%
ECivilS -0,474 -1,72 9,9%
Sem observação #223
Efeito Estimativa z-valor Variação
Constante -1,463 -2,07 8,6%
Idade 0,045 2,05 -8,1%
Conclusões Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões 7 Referências
Conclusões Conclusões
Considerações Finais
Neste exemplo em que ajustamos a probabilidade de um comprador preferir automóvel de marca americana em relação a marca japonesa, notamos que a idade do comprador e o estado civil são variáveis importantes. Com essas duas variáveis o modelo logístico se ajusta bem aos dados. Os dois pontos influentes, referentes a dois
compradores com perfil atípico, embora mudem de forma desproporcinal as estimativas não mudam a inferência. Não há indícios de que a distribuição das respostas não seja Bernoulli.
Referências Sumário
1 Preferência Automóveis
2 Análise de Dados Preliminar
3 Modelo Binomial
4 Resultados Modelo Ajustado
5 Preferência Auto Americano
6 Conclusões
Referências Referências
Referência
Foster, D. P.; Stine, R. A. e Waterman, R. P. (1998). Business Analysis using Regression. New York: Springer.