ESTATÍSTICA I
Professora Kelly Alonso
Medidas de Posição e Dispersão
2
Através da distribuição de frequência podemos
observar a distribuição dos valores em diferentes formas.
Dessa forma, podemos localizar também a concentração
dos valores. Existem diferentes elementos estatísticos para
observar as tendências características dos valores. E as
medidas mais conhecidas são:
-
medidas de posição;
- medidas de variabilidade ou dispersão;
- medidas de assimetria;
- medidas de curtose.
*Vamos concentrar nossos estudos nas duas primeiras.
3
As medidas de posição mais importantes são as
Medidas de Tendência Central. Essas medidas são
assim denominadas por indicarem um ponto em torno
do qual se concentram os dados. Este ponto tende a
ser o centro da distribuição dos dados. Entre as
medidas de tendência central, as principais são:
-
a média aritmética;
- a mediana;
- a moda.
Medidas de Posição – Média Aritmética
A média aritmética é a soma de todos os valores
observados da variável dividida pelo número total de
observações. Sob uma visão geométrica a média de uma
distribuição é o centro de gravidade, representa o ponto de
equilíbrio de um conjunto de dados. É a medida de tendência
central mais utilizada para representar a massa de dados.
Seja (x1, ..., xn) um conjunto de dados. A média é dada por:
, onde n é o tamanho da amostra.
, onde N é o tamanho da população.
Medidas de Posição – Média Aritmética
Caso os dados estejam apresentados segundo uma
distribuição de freqüência, tem-se:
, onde n é o tamanho da amostra.
, onde N é o tamanho da população.
Dados agrupados:
Dados agrupados:
Neste caso, como as frequências são números indicadores
da intensidade de cada valor da variável, elas funcionam como
fatores de ponderação, o que nos leva a calcular a média
aritmética ponderada.
Medidas de Posição – Média Aritmética
∑
∑
=
i i if
f
x
x
O modo mais prático de obtenção da
média ponderada é abrir, na tabela, uma coluna
correspondente aos produtos
x
i
f
i
:
Medidas de Posição – Média Aritmética
Exemplos:
1) Sabendo-se que a produção leiteira diária da vaca B, durante
uma semana foi (em litros):
12 18 16 15 13 14 10 Dom Sab Sex Qui Quar Ter Seg
Qual é a produção média da semana?
litros
X
14
7
12
18
16
15
13
14
10
=
+
+
+
+
+
+
=
Medidas de Posição – Média Aritmética
Exemplos:
Qual é a média de filhos do sexo masculino?
2) Consideremos a distribuição relativa a 34 famílias de quatro
filhos, tomando para variável o número de filhos do sexo
masculino:
Medidas de Posição – Média Aritmética
Então:
Logo:
2) Consideremos a distribuição relativa a estatura de alunos de
uma disciplina:
Medidas de Posição – Média Aritmética
Qual é a estatura média dos alunos?
Como, neste caso: Temos:
,
40
,
440
.
6
∑
∑
∑
∑
=
=
=
i i i i i if
f
x
x
e
f
f
x
cm
x
x
161
161
40
440
.
6
=
⇒
=
=
Conclusão? 11Medidas de Posição – Mediana
A mediana de um conjunto de dados é o número central,
quando os números estão ordenados segundo suas grandezas
(crescente ou decrescente). Se o tamanho da amostra é impar, a
mediana, Md, é o número central, quando o tamanho da amostra
é par, a mediana é a média dos dois números centrais.
Exemplos:
1) Encontre a mediana dos dados abaixo:
4, 13, 11, 2, 21, 15, 6, 16, 9
Em ordem: 2, 4, 6, 9, 11, 13, 15, 16, 21
Medidas de Posição – Mediana
2) Encontre a mediana dos dados abaixo:
2, 18, 7, 12, 6, 10, 21, 13
Em ordem: 2, 6, 7, 10, 12, 13, 18, 21
Md =2
12
10 +
Md = 11
Medidas de Posição – Mediana
Se os dados se agrupam em uma distribuição
de frequência, o cálculo da mediana se processa de
modo muito semelhante àquele dos dados
não-agrupados, implicando, porém, a determinação prévia
das frequências acumuladas.
Para o caso de uma distribuição, a ordem, a partir
de qualquer um dos extremos, é dada por:
2
Sem intervalos de classe: identificar a frequência acumulada
imediatamente superior à metade da soma das frequências. A
mediana será aquele valor da variável que corresponde a tal
frequência acumulada.
Medidas de Posição – Mediana
Exemplo: 8 2 fa 30 18 34
2
17
2
34
2
=
=
⇒
=
∑
Md
f
imeninos
Com intervalos de classe: Neste caso, o problema consiste em
determinar o ponto do intervalo em que está compreendida a mediana. Para tanto, temos que determinar a classe na qual se acha a mediana
-classe mediana. Tal -classe será aquela correspondente à frequência
acumulada imediatamente superior a .
2
∑
fiMedidas de Posição – Mediana
- é o limite inferior da classe mediana;
- é a frequência acumulada da classe anterior à classe mediana;
- é a frequência simples da classe mediana; - é a amplitude do intervalo da classe mediana.
20
2
2
40
2
=
∑
⇒
=
∑
f
if
i[
]
cm
Md
Md
.
4
160
,
5
11
13
20
158
+
−
⇒
=
=
l*
l*
l*
l*
= 158 F(ant)= 13 h*= 4 f*= 11 20 2 = ∑ fi 11 fa 4 13 24 32 37 40 OBSMedidas de Posição – Moda
A moda (Mo) é o valor que ocorre maior número de vezes no conjunto de dados.
Exemplos:
1) Encontre a moda dos dados abaixo:
a) 7, 8, 9, 10, 10, 10, 11, 12, 13, 15 Mo = 10
b) 3, 5, 8, 10, 12, 13 Mo = Amodal
c) 2, 3, 4, 4, 4, 5, 6, 7, 7, 7, 8, 9, 9 Mo = 4 e 7 Bimodal
2) Encontre a moda da distribuição abaixo:
Medidas de Posição – Moda
3) Encontre a moda da distribuição abaixo:
Obs.: Com intervalo de classe
Medidas de Posição – Moda
A classe que apresenta a maior frequência é
denominada classe modal. Pela definição, podemos afirmar que
a moda, neste caso, é o valor dominante que está compreendido
entre os limites da classe modal.
O método mais simples para o cálculo da moda consiste
em tomar o ponto médio da classe modal. Damos a esse valor
denominação de moda bruta.
Temos então:
Onde llll* é o limite inferior da classe modal;
L* é o limite superior da classe modal.
2
*
L
l
3) Encontre a moda da distribuição abaixo:
Medidas de Posição – Moda
Temos que a classe modal é i=3, l*=158 e L*=162.
Medidas de Posição
A mediana caracteriza uma série de valores devido à sua posição central, mas também separa a série em dois grupos que
apresentam o mesmo número de valores.
Assim, além das medidas de posição, há outras que, consideradas individualmente, não são medidas de tendência central, mas estão ligadas à mediana relativamente à sua segunda característica. Essas medidas _ os quartis, os percentis e os decis _ são, juntamente com a mediana, conhecidas pelo nome genérico de separatrizes.
Quartis: os valores de uma série que a dividem em quatro partes iguais.
- o primeiro quartil – Q1 – 25% das observações;
- o segundo quartil – Q2 - (igual à mediana);
Quando os dados são agrupados, para determinar os quartis usamos a mesma técnica do cálculo da mediana, bastando substituir, na fórmula da mediana, por:
2 ∑ fi
4
∑
f
ik
*
*
)
(
4
*
1h
f
ant
F
f
l
Q
i
−
∑
+
=
, sendo k o número de ordem do quartil.
Assim temos:
*
*
)
(
4
3
*
3h
f
ant
F
f
l
Q
i
−
∑
+
=
Medidas de Posição
1) Encontre o primeiro e terceiro quartis da distribuição abaixo: Exemplo
Medidas de Posição
Percentis: os noventa e nove valores que separam uma série em 100 partes iguais.
Medidas de Posição
Indicamos
O cálculo de um percentil segue a mesma técnica do cálculo da mediana, porém a fórmula passa a ser:
.
,...,
...,
,
,
2 32 99 1P
P
P
P
100
∑
f
ik
K – número de ordem do percentilObs.: com intervalo de classe
Pk
k
Exemplo:
Calcule o 37o percentil para a distribuição abaixo:
P37
37
[
]
cm
P
P
P
7
,
158
65
,
158
4
11
13
8
,
14
158
37 37 37=
=
⇒
−
+
=
8
,
14
100
40
.
37
100
37
⇒
=
∑
⇒
f
i K = 3737%
P10 Q
1 Md Q3 P90
Exercício: Observando a distribuição abaixo, calcule: a) a média
b) a mediana c) a moda
d) o primeiro e o terceiro quartis e) o 23º percentil Estaturas (cm) 150 l 158 5 158 l 166 166 l 174 174 l 182 182 l 190 12 18 27 8 70
São utilizadas para medir a variabilidade dos dados de uma amostra ou população. As principais medidas são:
- a amplitude, - a variância,
- o desvio padrão.
Medidas de Dispersão ou Variabilidade
São medidas da dispersão de um conjunto de dados em torno da média, ou seja, da maior ou menor variabilidade dos resultados obtidos.
Elas permitem identificar até que ponto os resultados se concentram ou não ao redor da tendência central de um conjunto de observações.
Medidas de Dispersão – Amplitude
É a diferença entre o maior e o menor valor observado num conjunto de dados, servindo para caracterizar a abrangência do estudo. Exemplo: Calcule a média, mediana e amplitude para as amostras abaixo: Amostra 1: 40, 60, 70, 50, 80, 90 Amostra 2: 67, 63, 64, 66, 40, 90 40, 50, 60, 70, 80, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 40, 63, 64, 66, 67, 90 Média: 65 Mediana: 65 Amplitude: 90 - 40 = 50 Amostra 3: 64, 63, 60, 70, 67, 66 60, 63, 64, 66, 67, 70 Média: 65 Mediana: 65 Amplitude: 70 - 60 = 10
Medidas de Dispersão – Variância
É a soma dos quadrados dos desvios da média dividido por n-1, em amostras.
Sendo n, o número de elementos da amostra.
Sendo N, o número de elementos da população.
1
)
(
1 2 2−
∑
−
=
=n
X
X
s
n i iN
X
n i i∑
−
=
=1 2 2(
µ
)
σ
Medidas de Dispersão – Desvio Padrão
É definido pela raiz quadrada positiva da variância
Sendo n, o número de elementos da amostra.
Sendo N, o número de elementos da população.
1
)
(
1 2−
∑
−
=
=n
X
X
s
n i iN
X
n i i∑
−
=
=1 2)
(
µ
σ
2 2
∑
−
∑
=
n
X
n
X
s
i i 2 2
∑
∑
−
∑
∑
=
i i i i i if
X
f
f
X
f
s
Com intervalo de classe Observação:
Exemplos:
1) Calcule a variância e o desvio padrão para os dados abaixo: 8, 10, 11, 15, 16, 18 ∑ =1090 ∑ = 78 324 18 256 16 225 15 121 11 100 10 64 8 Xi2 Xi 2 2
∑
−
∑
=
n
X
n
X
s
i i7
,
3
6
78
6
1090
2=
−
=
s
s
S2 = 12,678, 10, 11, 15, 16, 18 n = 6 X = 13
1
)
(
1 2−
∑
−
=
=n
X
X
s
n i i(
)
(
)
(
)
(
)
(
)
(
)
1
6
13
18
13
16
13
15
13
11
13
10
13
8
2 2 2 2 2 2 2−
−
+
−
+
−
+
−
+
−
+
−
=
s
S2 = 15,2 S = 3,9Exemplos:
fiXi fiXi2 0 6 20 36 16 ∑=78 ∑=218 0 6 40 108 64 2 2
∑
∑
−
∑
∑
=
i i i i i if
X
f
f
X
f
s
234
78
34
218
−
=
s
S2 = 1,149 S = 1,07 XiExemplos:
S2 = 31
Observações sobre desvio padrão:
Através da sua definição e propriedades, para distribuições normais*, isso significa que:
a) 68,26% dos casos estão incluídos entre X-s e X+s (isto é, um desvio padrão de cada lado da média)
b) 95,46% dos casos estão incluídos entre X-2s e X+2s (isto é, dois desvio padrão de cada lado da média)
c) 99,73% dos casos estão incluídos entre X-3s e X+3s (isto é, três desvio padrão de cada lado da média)
X-s X X s
X-2s X 2s
Observações sobre desvio padrão:
Variável reduzida, escores reduzidos:
A variável
, que mede o desvio em relação à
s
X
X
z
=
−
média, em unidades de desvio padrão, é denominada variável
reduzida e é uma quantidade abstrata (ou seja, independe das
unidades usadas).
Se os desvios em relação à média forem dados em unidades
de desvio padrão, diz-se que estão expressos em unidades
reduzidas ou escores reduzidos. Essas grandezas são muito
importantes em comparações entre distribuições.
Exemplos:
1) Um estudante recebeu grau 84 em um exame final de matemática, para o qual o grau médio foi 76 e o desvio padrão 10. No exame de geografia, para o qual o grau médio foi 82 e o desvio 16, ele recebeu o grau 90. em que matéria sua posição relativa foi mais elevada?