Professor: Adhimar
e-mail: [email protected]
https://sites.google.com/site/adhimarflavio/unifei/fis004
2 An´alise da dispers˜ao de dados estat´ısticos
Valores de tendˆencia central
Atabela de frequˆencia e ou o histograma tr´as uma vis˜ao clara, mas n˜ao resumida dos dados experimentais.
Existe a necessidade de obter valores num´ericos mais objetivos.
Estes valores s˜ao chamados de valores representativos da amostra ou popula¸c˜ao.
Ponto m´edio
Pm =
Valor maior + Valor menor
Moda
A moda ´e o valor mais frequente da amostra ou popula¸c˜ao.
A moda ´e bastante utilizada quando os dados s˜ao n´umeros inteiros e
a amostra ou popula¸c˜ao ´e grande.
Quando trabalhamos com n´umeros reais, ou seja, dados
experimentais, podemos utilizar como moda o ponto m´edio da classe mais frequente.
M = Limite superior da classe - Limite inferior da classe
Mediana
A mediana (m) ´e o valor que divide a amostra ou popula¸c˜ao de N
elementos (Xi) exatamente em duas partes iguais.
Para obter a mediana:
Deve-se colocar a amostra ou popula¸c˜ao em ordem crescente.
Se o n´umero N de dados ´e:
´Impar:
m=xN+1
Exemplos:
Seja o seguinte conjunto de valores: 5, 7, 8, 10, 12, 15, 20 N = 7
m=x7+1
2 =
x4 = 10 (5)
Seja o seguinte conjunto de valores: 1, 4, 5, 6, 7, 9 N=6
m= x
6 2 +x
6 2+1
2 =
5 + 6
M´edia aritm´etica:
Quando a amostra ou popula¸c˜ao tem uma distribui¸c˜ao relativamente sim´etrica a m´edia ´e sempre o melhor estimador da tendˆencia central dos dados.
A m´edia aritm´etica (µ) dos N dados (xi) ´e calculada como
µ= Soma de todos os dados
N = 1 N N X i=1
M´edia ponderada:
A m´edia ponderada ´e semelhante `a aritm´etica, mas cada elemento da popula¸c˜ao tem um peso estat´ıstico diferente.
A m´edia ponderada (µp) dos N dados (xi), com pesos estat´ısticos (pi) ´e
calculada da forma:
µ= Soma ponderada de todos os dados
Soma de todos os pesos =
PN i=1xipi PN
i=1pi
Exemplo
Dada uma amostra de alturas de adultos do sexo masculino (em m): 1,58 1,64 1,66 1,69 1,70 1,71 1,72 1,72 1,72 1,73 1,73 1,74 1,74 1,75 1,75 1,76 1,76 1,76 1,77 1,77 1,77 1,78 -1,78 - 1,79 - 1,80 - 1,83 - 1,85 - 1,87 - 1,90 - 1,91
pm =
1,58 + 1,91
Moda
Figura:Histrograma da amostra de
alturas
O ponto m´edio da classe mais frequente:
M = 1,713 + 1,778
2 = 1,7455m
Mediana
m=
x30 2 +x
30 2+1
2 =
1,75 + 1,76
M´edia Aritm´etica:
µ= Soma de todos os dados
N =
1
N N X
i=1
An´alise da dispers˜ao de dados estat´ısticos
Qual a principal diferen¸ca entre os histogramas abaixo?
A principal diferen¸ca entre as duas distribui¸c˜oes ´e adispers˜ao.
Os dados da primeira variam no intervalo aproximado de 8 a 17, 5 anos.
Na segunda, esta varia¸c˜ao vai de 11,5 a 14,5 aproximadamente. A largura de cada classe do histograma tamb´em mostra que a segunda distribui¸c˜ao tem dispers˜ao menor.
Desvio M´edio
O desvio m´edio ´e calculado em rela¸c˜ao `a m´edia aritm´etica. Ele ´e calculado como:
desvio m´edio =d =
PN
i=1|xi−µ|
Desvio Padr˜ao
O desvio padr˜ao de uma amostra ´e a medida de dispers˜ao mais robusta. Ela leva em conta o desvio quadr´atico m´edio em rela¸c˜ao `a m´edia aritm´etica. Ele ´e calculado como:
desvio padr˜ao =σ=
s PN
i=1(xi−µ) 2
Exemplo
Dada uma amostra de alturas de adultos do sexo masculino (em m): 1,58 1,64 1,66 1,69 1,70 1,71 1,72 1,72 1,72 1,73 1,73 1,74 1,74 1,75 1,75 1,76 1,76 1,76 1,77 1,77 1,77 1,78 -1,78 - 1,79 - 1,80 - 1,83 - 1,85 - 1,87 - 1,90 - 1,91
O desvio m´edio ´e
d =
PN
i=1|xi −µ|
N = 0,0507m (15)
J´a o desvio padr˜ao
σ =
s PN
i=1(xi−µ)2
Medidas de Posi¸c˜ao da distribui¸c˜ao
Escore
O escore indica quanto um determinado dado da amostra est´a afastado da
m´edia aritm´etica (m) em termos de desvios padr˜oes (σ). O escore (zi) ´e
dado por:
zi = xi −µ
σ (17)
O escore ´e pr´oprio de cada dado e pode ser negativo ou positivo. Escores negativos est˜ao aqu´em da m´edia,
Escores positivos est˜ao al´em dela. ´
Quartis
Semelhante `a mediana, os quartis s˜ao valores que separam as quartas partes dos dados da amostra da popula¸c˜ao, quando ordenadas de forma crescente.
A an´alise dos quartis fornece uma boa indica¸c˜ao da simetria da distribui¸c˜ao.
Eles s˜ao definidos como:
Q1, tal que teremos N/4 elementos para xi <Q1
Q2, tal que teremos N/2 elementos para xi <Q2
Exemplo
Dada uma amostra de alturas de adultos do sexo masculino (em m): 1,58 1,64 1,66 1,69 1,70 1,71 1,72 1,72 1,72 1,73 1,73 1,74 1,74 1,75 1,75 1,76 1,76 1,76 1,77 1,77 1,77 1,78 -1,78 - 1,79 - 1,80 - 1,83 - 1,85 - 1,87 - 1,90 - 1,91
Lembrando que: µ= 1,756 m eσ= 0,0709 m. Qual o escore das alturas
1,70 m e 1,87 m?
z5 =
x5−µ
σ =
1,70−1,756
0,0709 =−0,79 (18)
z28=
x28−µ
σ =
1,87−1,756
0,0709 = 1,61 (19)
Quartis
Para esta amostra de 30 valores, temos:
a mediana ou segundo quartil divide a amostra em duas partes de 15 elementos;
as metades de 15 elementos s˜ao por sua vez divididas na metade.
Q1 =x8 = 1,72 m
Q2 = (x15+x16)/2 = 1,755 mQ3 = 1,78 m
Se a distribui¸c˜ao de uma amostra ´e sim´etrica ent˜ao (Q2−Q1) ´e
Exerc´ıcios
1) Para as amostras abaixo, fa¸ca a tabela de frequˆencias, calcule os valores de tendˆencia central (ponto m´edio, moda, mediana, m´edia aritm´etica) e os valores de dispers˜ao ( desvio m´edio e desvio padr˜ao):
a) amostra de notas de uma turma:
1,7 3,4 4,4 4,7 5,2 5,3 5,6 5,6 5,9 6,1 6,2 6,4 6,6 6,6 -6,8 - 6,9 - 7,2 - 7,7 - 7,9 - 8,4 - 8,6 - 9,0 - 9,0 - 9,5 - 10,0
b) amostra de medidas de PH de ´agua de um rio:
6,4 6,5 6,7 6,8 6,8 6,8 6,9 6,9 6,9 6,9 6,9 7,0 7,0 7,1 -7,1 - 7,2 - 7,2 - 7,3 - 7,3 - 7,5
c) amostra do n´umero de ocorrˆencias di´arias em uma delegacia de pol´ıcia:
-2) Em rela¸c˜ao `as amostras acima, responda, embasado nas medidas de posi¸c˜ao:
a) Elas s˜ao sim´etricas, levemente assim´etricas ou assim´etricas? b) O PH de 6,1 ´e extremamente incomum?