MEDIDAS DE DISPERSÃO
MEDIDAS DE DISPERSÃO
Neste momento serão abordadas as características da variação, de grande importância para Estatística.
• Busca-se um valor representativo para este conjunto de dados. Sendo um medida de dispersão:
• Amplitude
• Variância
• Desvio-Padrão
Amplitude, Desvio Médio, Variância, Desvio-Padrão
Desvio Médio é a média aritmética dos valores absolutos dos desvios.
∑ | ̅|Exemplo: Considere as seguintes temperaturas em graus Célsius em Gramado (6, 7, 8, 10, 11 e 12).
Determine o desvio médio.
AMPLITUDE
A amplitude de um conjunto de dados é a diferença entre o maior valor e o menor valor.
Fácil cálculo. Contudo não é uma boa medida de variação pois depende apenas do menor e do maior valor.
DESVIO-PADRÃO E VARIÂNCIA
O desvio-padrão é a mais importante medida de variação. Leva em consideração todos os valores e por isso possui os cálculos mais trabalhosos.
Definição: O desvio-padrão de um conjunto de valores é uma medida da variação dos valores em relação à média.
1
)
(
2_
n
x
x
s
Dados amostrais
N
x
(
)
2
Dados populacionais
Exemplo (Variância): Após as 5 primeiras rodadas de um campeonato de basquete, os dois
principais “cestinhas”(jogadores que mais pontuaram) obtiveram médias iguais de pontos por
Partida
1ª 2ª 3ª 4ª 5ª
Jogador A 8
12
9 17
5
Jogador B 10
9 11 10 11
Média de pontos por partida:
A:
̅
B:
̅
Podemos utilizar a variância para verificar qual dos jogadores obteve maior regularidade na
pontuação por partida.
A:
B:
Note que a variância de pontos por partida do jogador A (16,56) é maior que a do jogador B (0,56).
Portanto, o jogador B foi mais regular que o jogador A.
Exemplo (Desvio-Padrão):
EXEMPLO
Determine o desvio-padrão dos tempos de espera em guichês dos clientes do Valley Bank. Esses tempos de espera (em minutos) são dados a seguir:
6,5 6,6 6,7 6,8 7,1 7,3 7,4 7,7 7,7 7,7
x _
x
x _2
) (xx
6,5 -0,65 0,4225 6,6 -0,55 0,3025 6,7 -0,45 0,2025 6,8 -0,35 0,1225 7,1 -0,05 0,0025 7,3 0,15 0,0225 7,4 0,25 0,0625 7,7 0,55 0,3025 7,7 0,55 0,3025 7,7 0,55 0,3025
x71,5
( _)22,0450x x
15 , 7 10
5 , 71
_
n x
x 0,48
1 10
0450 , 2
s
Omitindo tomar a raiz quadrada no processo de cálculo do desvio-padrão, obtemos a variância.
1
)
(
2_
2
n
x
x
s
Variância amostral
N
x
22
(
)
Variância populacional
Pode-se estabelecer uma fórmula para o cálculo de desvio-padrão quando os dados se apresentam resumidos em uma tabela de freqüências.
1
)
.(
2_
INTERPRETAÇÃO DO
DESVIO-PADRÃO
Teorema de Tcheibichev: a proporção ou fração de qualquer conjunto de dados a menos de K desvios-padrão a contar da média é sempre ao menos .
2
1 1
K
•Para K=2 , ao menos 3/4 (75%) de todos os valores estão no intervalo que vai de 2 desvios-padrão abaixo da média e a 2 desvios-padrão acima da média.
•Para K=3 ao menos 8/9 (89%) de todos os valores estão no intervalo que vai de 3 desvios-padrão abaixo da média e a 3 desvios-padrão acima da média.
EXEMPLO
Os QIs de um grupo de adultos apresentam distribuição com média 100 e desvio-padrão 15.
• Fazendo K=2 e utilizando o teorema de Tchebichev concluímos que aproximadamente 75% de todos os valores estarão no intervalo entre 100 –(2 .15) = 70 e 100 + (2 . 15) = 130.