• Nenhum resultado encontrado

Seção 2.5 Duas Variáveis Quantitativas: Diagrama de Dispersão e Correlação

N/A
N/A
Protected

Academic year: 2021

Share "Seção 2.5 Duas Variáveis Quantitativas: Diagrama de Dispersão e Correlação"

Copied!
19
0
0

Texto

(1)

Estatística: Revelando o poder dos dados

Seção 2.5

Duas Variáveis Quantitativas:

Diagrama de Dispersão e

(2)

Estatística: Revelando o poder dos dados

Sumário

Duas variáveis quantitativas

Visualização: diagrama de dispersão

Estatística resumo: correlação

(3)

Estatística: Revelando o poder dos dados

Direção de Associação

 Uma associação positiva significa que os

valores de uma variável tendem a ser maiores

quando os valores da outra variável são mais altos

 Uma associação negativa significa que os

valores de uma variável tendem a ser menores

quando os valores da outra variável são mais altos

 Duas variáveis são não associadas se conhecer

o valor de uma variável não lhe dá nenhuma informação sobre o valor da outra variável

(4)

Estatística: Revelando o poder dos dados

Dados sobre Carros

 Variáveis Quantitativas :

 Weight – peso do carro (em libras)

 CityMPG – milhas por galão para dirigir na cidade

 FuelCap – tamanho do tanque de gás (em galões)

 Page – nº pág. que o carro aparece no guia de compra

 QtrMile – tempo para chegar a 1/4 de milha (seg.)

 Acc060 – tempo de aceleração para ir de 0 a 60 mph

 Relacionamentos

 Weight vs. CityMPG

 Weight vs. FuelCapacity

 PageNum vs. Fuel Capacity

 Weight vs. QtrMile

 Acc060 vs. QtrMile

(5)

Estatística: Revelando o poder dos dados

Dados sobre Carros

 Faça estimativas iniciais para a força e direção

da associação para cada um dos seguintes:

1) Weight vs. CityMPG

2) Weight vs. FuelCapacity

3) PageNum vs. Fuel Capacity 4) Weight vs. QtrMile

5) Acc060 vs. QtrMile 6) CityMPG vs. QtrMile

(6)

Estatística: Revelando o poder dos dados

Diagrama de Dispersão

Um

diagrama de dispersão

é o gráfico da

relação entre duas variáveis ​​quantitativas

.

(7)

Estatística: Revelando o poder dos dados

Car Associations

Acc060 18 20 22 24 26 28 100 150 200 250 2500 3000 3500 4000 6 8 10 12 18 22 26 CityMPG FuelCap 12 16 20 100 200 Page QtrMile 14 16 18 6 7 8 9 10 11 12 2500 3500 12 14 16 18 20 14 15 16 17 18 19 Weight

(8)

Estatística: Revelando o poder dos dados

Correlação

A

correlação

é uma medida da força e

direção da associação linear entre duas

variáveis ​​quantitativas

Correlação amostral: r

(9)

Estatística: Revelando o poder dos dados

Matriz de Correlações (Carros)

What are the properties of correlation?

Acc060 CityMPG FuelCap Page QtrMile Weight Acc060 1.00 0.51 -0.47 0.21 0.99 -0.45 CityMPG 0.51 1.00 -0.77 0.33 0.51 -0.89 FuelCap -0.47 -0.77 1.00 -0.09 -0.47 0.88 Page 0.21 0.33 -0.09 1.00 0.20 -0.26 QtrMile 0.99 0.51 -0.47 0.20 1.00 -0.45 Weight -0.45 -0.89 0.88 -0.26 -0.45 1.00

(10)

Estatística: Revelando o poder dos dados

Correlação

1. -1 ≤ r ≤ 1

2. O sinal indica a direção da associação

1. associação linear positiva: r > 0

2. associação linear negativa: r < 0

3. sem associação linear: r  0

3. Quanto mais próximo r for de ± 1, mais forte é a

associação linear

4. r é adimensional e não depende das unidades de

medida

5. A correlação entre X e Y é a mesma que a

(11)

Estatística: Revelando o poder dos dados

Jogo de Advinhação da Correlação

http://istics.net/stat/correlations/

Maior pontuador da classe recebe um

ponto extra no primeiro exame!

(12)

Estatística: Revelando o poder dos dados

Correlação

3.0 3.5 4.0 4.5 5.0 -1 .5 -1 .0 -0 .5 0 .0 0 .5 1 .0

Malevolence Rating of Uniform

z-sco re f o r Pe n a lt y Ya rd s r = 0.43 NFL Teams

(13)

Estatística: Revelando o poder dos dados

Correlação

3.0 3.5 4.0 4.5 5.0 -0 .8 -0 .4 0 .0 0 .4

Malevolence Rating of Uniform

z-sco re f o r Pe n a lt y Ya rd s

Mesmo diagrama anterior, mas com Golfinhos e Raiders (outliers) removidos

(14)

Estatística: Revelando o poder dos dados

Cuidados com a Correlação

1.

Correlação pode ser fortemente afetada

(15)

Estatística: Revelando o poder dos dados

Bala de Canhão Humana

Y

X

Plot Y vs. X

Qual é a correlação

entre X e Y? X e Y estão associados?

(16)

Estatística: Revelando o poder dos dados

Cuidados com a Correlação

1.

Correlação pode ser fortemente afetada

por outliers. Sempre plote seus dados!

2.

r = 0 significa que não há associação

linear. As variáveis ​​podem ainda estar

(17)

Estatística: Revelando o poder dos dados 0 200 400 600 800 1000 40 50 60 70 80

TV and Life Expectancy

TVs per 1000 People L if e E xp e ct a n cy Angola Australia Cambodia Canada China Egypt France Haiti Iraq Japan Madagascar Mexico Morocco Pakistan Russia South Africa Sri Lanka Uganda

United KingdomUnited States

Vietnam

Yemen

r = 0.74

(18)

Estatística: Revelando o poder dos dados

Cuidados com a Correlação

1.

Correlação pode ser fortemente afetada

por outliers. Sempre plote seus dados!

2.

r = 0 significa que não há associação

linear. As variáveis ​​podem ainda estar

associadas. Sempre plote seus dados!

3.

Correlação não implica necessariamente

(19)

Estatística: Revelando o poder dos dados

Resumo: Duas Variáveis Quantitativas

Visualização: diagram de dispersão

Estatística resumo: correlação

Referências

Documentos relacionados

Segue-se cerca de 1 minuto de silêncio, durante o qual todos agradecem a Jesus pelo amor dos pais, avós e/ou outras pessoas mais velhas que fazem parte da nossa vida e gostam de

Essa articulação entre a administração pública e a esfera privada tem assumido novos contornos em função da reforma do Estado brasileiro e é uma tendência que tem se multiplicado

Os restantes estudantes, 17 (29,8%) no pré-ensino e 16 (28,1%) no pós-ensino, não apresentaram qualquer valor, argumentando que era difícil determinar o valor pretendido

O populismo, depois de uma longa fase durante a qual se recusou a responder pelo nome, voltou a assumir protagonismo num Mundo ainda à procura de uma Nova Ordem Mundial. Muitos

Em suma: a corrida ainda está em aberto, mas, aos poucos, parece corroborar o nosso cenário-base: um candidato de “centro”, favorável às reformas,

O octossílabo de padrão agudo (francês) foi, pois, pratica- do, sobretudo, pelos poetas da escola parnasiana, ou seja, não se trata de um metro primitivo, como o é em francês, e sim

Um dispositivo bastante útil para se verificar a associação entre duas variáveis quantitativas, ou entre dois conjuntos de dados, é o diagrama de dispersão, e sua associação

de itens das notas explicativas integrantes das informações contábeis intermediárias findas no período de 30 de setembro de 2016, tais como: (i) na nota