Capítulo 3
Problema 01.
(a) Sendo x o número médio de erros por página, tem-se:
66 , 50 0 33 50
1 4 1 3 3 2 20 1 25
0× + × + × + × + × = =
= x
Representando o número mediano de erros por md, tem-se, pela ordenação dos
valores observados, que os valores de ordem 25 e 26 são 0 e 1, respectivamente. Assim 5
, 2 0
1 0+ =
= md
(b) = ×
(
−)
+ ×(
−)
+ ×(
−)
+ ×(
−)
+ ×(
−)
=50
66 , 0 4 1 66 , 0 3 1 66 , 0 2 3 66 , 0 1 20 66 , 0 0 ) 25
var(
2 2
2 2
2
X
7044 , 50 0
22 , 35 50
1556 , 11 1 4756 , 5 1 7956 , 1 3 1156 , 0 20 4356 , 0
25× + × + × + × + × = =
= Logo,
8393 , 0 7044 , 0 )
(X = =
dp
(c)
0 5 10 15 20 25 30
0 1 2 3 4
Número de erros de impressão
Freqüência absoluta (ni)
Gráfico de barras do número de erros por página
(d) Uma vez que a média de erros por página é 0,66 e o livro tem 500 páginas, o número esperado de erros no livro é 0,66×500=330
Problema 02.
Média:
595 , 10 2
64 , 2 63 , 2 50 , 2 61 , 2 55 , 2 57 , 2 62 , 2 60 , 2 64 , 2 59 ,
2 + + + + + + + + + =
= x
Mediana:
605 , 2 2
610 , 2 600 ,
2 + =
= md
Desvio Padrão:
( ) ( ) ( ) ( ) ( ) ( ) ( )
10
045 , 0 045
, 0 025
, 0 025
, 0 005 , 0 045 , 0 005 , ) 0 var(
2 2
2 2
2 2
2 + + + + − + − + −
= − X
( ) ( )
0,0018 ( ) 0,0018 0,042410 095 , 0 015
,
0 2 2
=
=
= ⇒
−
+ + dp X
Problema 03.
(a)
100 80
60 40 20 0 0.015
0.010
0.005
0.000
Núm ero de casas por quarteirao
Densidade
Histograma do número de casas por quarteirão (b) Média: 40,42; desvio-padrão: 25,81.
Problema 04.
(a) A mediana é uma medida de posição mais importante do que a média, por
(b) exemplo, em situações em que a variável em estudo tem algum valor muito discrepante que
“puxa” a média para cima ou para baixo.
(c)
16 14 12 10 8 6 4 0.2
0.1
0.0
Densidade
Em distribuições simétricas, a média e a mediana coincidem.
(d)
30 20
10 0
-10 0.10
0.05
0.00
Densidade
Média =10,0 e Variância = 4
30 20
10 0
-10 0.08
0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
Densidade
Média =10,0 e Variância = 16
30 20 10 0 -10 0.06 0.05 0.04 0.03 0.02 0.01 0.00
Densidade
Média =10,0 e Variância = 36
Problema 05.
Nessa situação, tanto a média quanto a mediana (que coincidem) não se apresentam como boas medidas de posição. Elas não retratam bem a distribuição da variável estudada. Nessas condições, seria melhor considerar a moda, ou modas, pois nesse caso a distribuição é bi-modal.
Problema 06.
(a) A mediana do número de filhos é a média aritmética das observações de ordem (b) 50 e 51, que é 2.
(c) A moda do número de filhos é 2.
(d) O cálculo da média fica prejudicado pelo fato de haver uma categoria representada por
“mais que 5” filhos, sem a especificação do valor exato. Neste caso, deve-se usar o conhecimento empírico que se tem da variável para propor um valor máximo para o intervalo, ou o ponto médio da classe. Aqui vamos supor que as famílias com “mais que 5”, tenham em média 8 filhos. Desse modo tem-se:
21 , 100 2
5 8 4 5 7 4 19 3 28 2 20 1 17
0× + × + × + × + × + × + × =
= x
Problema 07.
50
31
20 61
2 97
• Intervalo interquartil: q3 −q1 =61−20=41
• Dispersão inferior (di): q2−x(1) =31−2=29
• Dispersão superior (ds): x(n) −q2 =97−31=66
Para que a distribuição dos dados tenha forma normal (simétrica, em geral), é necessário:
ds di≅
2 3 1
2 q q q
q − ≅ −
di e ds q
q q
q2 − 1e 3 − 2 <
Os valores acima obtidos indicam que a distribuição dos dados não tem forma normal.
Problema 08.
37 35
31 40
21 49
• Intervalo interquartil: q3 −q1 =40−31=9
• Dispersão inferior (di): q2−x(1) =35−21=14
• Dispersão superior (ds): x(n) −q2 =49−35=14
Problema 09.
Temos que:
( )
13,52 14 ) 13
10 , 0
( = + =
q , q(0,25)=19,5, q(0,50)=31,0, q(0,75)=61,0,
( )
0 , 2 79
80 ) 78
90 , 0
( = + =
q
Problema 10.
Temos que:
841 , 576 ) 10 , 0
( =
q , q(0,25)=1,580,217, q(0,50)=2,776,006, q(0,75)=5,095,113, 975
, 704 , 6 ) 80 , 0
( =
q , q(0,95)=12,993,918 Problema 11.
25
15
5
Salarios (S.M.)
Box-Plot dos Salários dos funcionários da Companhia MB Pode-se perceber uma distribuição assimétrica à direita.
Problema 12.
100 90 80 70 60 50 40 30 20 10 0
Box-Plot para os dados do Problema 3
Problema 13.
30000
20000
10000
0
Populacao (x10000)
Box-Plot do Problema 10
Problema 14.
(a)
( )
01 1 1
=
−
=
−
=
−
∑ ∑
∑
=
=
=
x n x n x x x
x
n
i n
i i n
i i
(b)
( ) ( ) 2
1 _ 1
1 2 1
2 2 1
2
∑
2∑
2∑ ∑
∑
=
=
=
=
=
+
−
= +
−
=
− n
i n
i i n
i i n
i
i i n
i
i x x x x x x x x x
x
( ) ( )
n x x
x n x n x
n
i n i
i i n
i i
2
1 1
2 2 2
1
2 2
−
= +
−
=
∑ ∑
∑
==
=
(c)
∑ ( )
− =∑ ( − + )
=∑
− ∑
+∑
=
=
=
=
=
=
2
1 _ 1
1 2 1
2 2 2
1
2 2
k
i i k
i i i k
i i i k
i
i i i k
i i
i x x n x x x x nx x nx n x
n
( )
21
2 nx
x n
k
i i
∑
i=
−
=
(d)
∑ ( )
− =∑ ( − + )
=∑
− ∑
+∑
=
=
=
=
=
=
2
1 _ 1
1 2 1
2 2 2
1
2 2
k
i i k
i i i k
i i i k
i
i i i k
i i
i x x f x x x x f x x f x f x
f
( )
21
2 x
x f
k
i i
∑
i=
−
= Problema 16.
(a)
70 65 60 55 50 45 40 35 30 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0.00
Vendas sem anais (em S.M.)
Densidade
Histograma das vendas semanais de vendedores de gêneros alimentícios
(b) Supondo uma variável discreta com todas as observações do intervalo concentradas no ponto médio:
× = +
×
× +
× +
× +
× +
× +
= ×
200
2 5 , 67 18 5 , 3062 5 , 57 70 5 , 52 50 5 , 47 18 5 , 42 10 5 , 37 2 5 , x 32
2 , 200 51 10240=
=
(c) var(X)=
(
−18,7)
2×0,01+(
−13,7)
2×0,05+(
−8,7)
2×0,09+(
−3,7)
2×0,25+( )
1,32×0,35+( )
6,32×0,15+( )
11,32×0,09+( )
16,3 2×0,01=43,81 +Logo,
62 , 6 ) (X = dp
(d) Temos que: x−2s=51,2−2×6,62=37,96 e x+2s=51,2+2×6,62=64,44 Assim, queremos achar as seguintes áreas do histograma:
% 04 , 96 2
, 37 40
% 5
35
40− = − ⇒ =
A A
% 99 , 60 7
44 , 644
% 9
60
65− = − ⇒ =
B B
Desse modo, o intervalo em questão abriga: 2,04%+9%+25%+35%+15%=94,03% (e) Pela distribuição de freqüências, vê-se que a mediana bruta é 52,5.
Problema 18.
(a) Mediana:
14 , 24 37
20 28
20 40
2
2 − ⇒ =
− =
q q
(b) 1º decil:
69 , 10 7
0 26
0
20− = − ⇒ =
x x
(c) Intervalo interquartil(dq):
23 , 25 19
0 26
0 20
1
1− ⇒ =
− = q q
00 , 03 63
, 0
60 20
, 0
60 80
3
3− ⇒ =
− =
q q
Portanto, dq=63,00−19,23=43,77 Problema 19.
casamento.
de tempo : X
X ni fi Fi
[0;6) 2800 0,56 0,56
[6;12) 1400 0,28 0,84
[12;18) 600 0,12 0,96
[18;24) 150 0,03 0,99
[24;30) 50 0,01 1,00
Total 5000 1,00
(a) x=3×0,56+9×0,28+15×0,12+21×0,03+27×0,01=6,90 36
,
=5 md
(b) var(X)=
(
−3,9)
2×0,56+( )
2,12×0,28+( )
8,12×0,12+( )
14,12×0,03+( )
20,12×0,01= anos26 , 5 ) ( 63 ,
27 ⇒ =
= dp X
(c)
30 24
18 12
6 0
0.10
0.05
0.00
Densidade
(d) 1º decil: 1,07anos 10
0 56
0
6− = − ⇒ =
x x
9º decil: 15anos
6 12 12
12
18− = − ⇒ =
y y
(e) 1º quartil: 2,68anos
25 0 56
0 6
1
1− ⇒ =
− = q q
(f) 3º quartil: 10,07anos
19 6 28
6 12
3
3 − ⇒ =
− = q q
39 , 7 68 , 2 07 ,
10 − =
= dq
Problema 20.
(a)
10 6
4 2
0 0.2
0.1
0.0
Salario (em SM)
Densidade
Histograma para os Salários mensais dos funcionários do setor administrativo
(b) Média: x=1×0,25+3×0,40+5×0,20+8×0,15=3,65 Variância:
(
2,65)
0,25(
0,65)
0,40( )
1,35 0,20(
4,35)
0,15 28,19)
var(X = − 2× + − 2× + 2× + 2× =
Variância: dp(X)= 28,19=5,31 (c) 1º quartil: q1 =2
Mediana: 3,25
25 , 0
2 40
, 0
2
4− = − ⇒ =
md md
(d) Se todos os salários aumentarem em 100%, ou seja, dobrados, a média dos salários dobrará e a sua variância será multiplicada por 4.Trata-se de um resultado geral que pode ser demonstrado da seguinte maneira.
Suponha que haja uma coleção de n valores, denotados por x1,x2,...,xn com média x e variância s2(X). Seja k uma constante real. Se todos os n valores da coleção acima forem multiplicados por k, teremos:
(i) Para a média:
x n k
kx xk = kx1+...+ n = (ii) Para a variância:
( )
1( )
( )1 2 2
1 2 2 1
2 2
X s k x n x
k x k n kx
s
n
i i n
i i
k =
∑
− =∑
− ==
=
(e) Dar um abono de 2 SM para todos os funcionários significa aumentar a média e a mediana em duas unidades. A variância não se altera. Novamente, esse resultado pode ser
generalizado para a soma de qualquer constante real k. Vejamos:
Para a média:
( ) ( )
k n x
x x
kn n
x k x
x = k+ 1 +...+ + n = + 1 +...+ n = +
2
Um raciocínio semelhante serve para a mediana.
Para a variância:
( ) ( )
[ ]
1( )
1( )
( )1 2
1
2 1
2 1
2 2
X s x n x
k x k n x
k x k n x
s
n
i i n
i i n
i i
k =
∑
+ − + =∑
+ − − =∑
− ==
=
=
Problema 21.
(a) – média: fica multiplicada por 2 - mediana: fica multiplicada por 2 - desvio-padrão: fica multiplicado por 2 (b) – média: aumenta em 10 unidades
- mediana: aumenta em 10 unidades - desvio-padrão: não se altera
(c) – média: fica igual a zero:
− + + − = + + − = − =
... 0
... 1
1 x x
n x n x x
n
x x x
x n n
- mediana: fica reduzida em xunidades - desvio-padrão: não se altera
(d) – média: fica igual a zero
- mediana: como todas as observações, fica reduzida emxunidadese dividida por dp(X)
- desvio-padrão: fica igual a um. 1
) var(
) var(
) ( 1
1
2
=
=
−
∑
= X
X X
dp x x n
n
i i