Estatística: Revelando o poder dos dados
Seção 2.5
Duas Variáveis Quantitativas:
Diagrama de Dispersão e
Estatística: Revelando o poder dos dados
Sumário
Duas variáveis quantitativas
Visualização: diagrama de dispersão
Estatística resumo: correlação
Estatística: Revelando o poder dos dados
Direção de Associação
Uma associação positiva significa que os
valores de uma variável tendem a ser maiores
quando os valores da outra variável são mais altos
Uma associação negativa significa que os
valores de uma variável tendem a ser menores
quando os valores da outra variável são mais altos
Duas variáveis são não associadas se conhecer
o valor de uma variável não lhe dá nenhuma informação sobre o valor da outra variável
Estatística: Revelando o poder dos dados
Dados sobre Carros
Variáveis Quantitativas :
Weight – peso do carro (em libras)
CityMPG – milhas por galão para dirigir na cidade
FuelCap – tamanho do tanque de gás (em galões)
Page – nº pág. que o carro aparece no guia de compra
QtrMile – tempo para chegar a 1/4 de milha (seg.)
Acc060 – tempo de aceleração para ir de 0 a 60 mph
Relacionamentos
Weight vs. CityMPG
Weight vs. FuelCapacity
PageNum vs. Fuel Capacity
Weight vs. QtrMile
Acc060 vs. QtrMile
Estatística: Revelando o poder dos dados
Dados sobre Carros
Faça estimativas iniciais para a força e direção
da associação para cada um dos seguintes:
1) Weight vs. CityMPG
2) Weight vs. FuelCapacity
3) PageNum vs. Fuel Capacity 4) Weight vs. QtrMile
5) Acc060 vs. QtrMile 6) CityMPG vs. QtrMile
Estatística: Revelando o poder dos dados
Diagrama de Dispersão
Um
diagrama de dispersão
é o gráfico da
relação entre duas variáveis quantitativas
.
Estatística: Revelando o poder dos dados
Car Associations
Acc060 18 20 22 24 26 28 100 150 200 250 2500 3000 3500 4000 6 8 10 12 18 22 26 CityMPG FuelCap 12 16 20 100 200 Page QtrMile 14 16 18 6 7 8 9 10 11 12 2500 3500 12 14 16 18 20 14 15 16 17 18 19 WeightEstatística: Revelando o poder dos dados
Correlação
A
correlação
é uma medida da força e
direção da associação linear entre duas
variáveis quantitativas
•
Correlação amostral: r
Estatística: Revelando o poder dos dados
Matriz de Correlações (Carros)
What are the properties of correlation?
Acc060 CityMPG FuelCap Page QtrMile Weight Acc060 1.00 0.51 -0.47 0.21 0.99 -0.45 CityMPG 0.51 1.00 -0.77 0.33 0.51 -0.89 FuelCap -0.47 -0.77 1.00 -0.09 -0.47 0.88 Page 0.21 0.33 -0.09 1.00 0.20 -0.26 QtrMile 0.99 0.51 -0.47 0.20 1.00 -0.45 Weight -0.45 -0.89 0.88 -0.26 -0.45 1.00
Estatística: Revelando o poder dos dados
Correlação
1. -1 ≤ r ≤ 1
2. O sinal indica a direção da associação
1. associação linear positiva: r > 0
2. associação linear negativa: r < 0
3. sem associação linear: r 0
3. Quanto mais próximo r for de ± 1, mais forte é a
associação linear
4. r é adimensional e não depende das unidades de
medida
5. A correlação entre X e Y é a mesma que a
Estatística: Revelando o poder dos dados
Jogo de Advinhação da Correlação
http://istics.net/stat/correlations/
Maior pontuador da classe recebe um
ponto extra no primeiro exame!
Estatística: Revelando o poder dos dados
Correlação
3.0 3.5 4.0 4.5 5.0 -1 .5 -1 .0 -0 .5 0 .0 0 .5 1 .0Malevolence Rating of Uniform
z-sco re f o r Pe n a lt y Ya rd s r = 0.43 NFL Teams
Estatística: Revelando o poder dos dados
Correlação
3.0 3.5 4.0 4.5 5.0 -0 .8 -0 .4 0 .0 0 .4Malevolence Rating of Uniform
z-sco re f o r Pe n a lt y Ya rd s
Mesmo diagrama anterior, mas com Golfinhos e Raiders (outliers) removidos
Estatística: Revelando o poder dos dados
Cuidados com a Correlação
1.
Correlação pode ser fortemente afetada
Estatística: Revelando o poder dos dados
Bala de Canhão Humana
Y
X
Plot Y vs. X
Qual é a correlação
entre X e Y? X e Y estão associados?
Estatística: Revelando o poder dos dados
Cuidados com a Correlação
1.
Correlação pode ser fortemente afetada
por outliers. Sempre plote seus dados!
2.
r = 0 significa que não há associação
linear. As variáveis podem ainda estar
Estatística: Revelando o poder dos dados 0 200 400 600 800 1000 40 50 60 70 80
TV and Life Expectancy
TVs per 1000 People L if e E xp e ct a n cy Angola Australia Cambodia Canada China Egypt France Haiti Iraq Japan Madagascar Mexico Morocco Pakistan Russia South Africa Sri Lanka Uganda
United KingdomUnited States
Vietnam
Yemen
r = 0.74
Estatística: Revelando o poder dos dados
Cuidados com a Correlação
1.
Correlação pode ser fortemente afetada
por outliers. Sempre plote seus dados!
2.
r = 0 significa que não há associação
linear. As variáveis podem ainda estar
associadas. Sempre plote seus dados!
3.
Correlação não implica necessariamente
Estatística: Revelando o poder dos dados
Resumo: Duas Variáveis Quantitativas