Resolu¸c˜ ao da Lista 02
Rodolfo C. Oliveira Unicamp - FCA 19 de abril de 2014
1. Para um conjunto com um n´ umero ´ımpar (n) de valores, a mediana (M ) ´ e dada pelo n´ umero na posi¸ c˜ ao
n+12.
Exemplo: Seja o conjunto de valores: S = {2, 4, 6, 8, 10}
Notamos que S cont´ em n = 5 n´ umeros, ent˜ ao o valor na posi¸ c˜ ao:
5+1
2
=
62= 3 ´ e a mediana.
Assim a mediana de S ´ e: M = 6.
Para um conjunto com um n´ umero par (m) de valores, a mediana (M ) ´ e dada pela m´ edia aritm´ etica dos n´ umeros nas posi¸c˜ oes
m2e
m+22.
Exemplo: Seja o conjunto de valores: T = {2, 4, 6, 8, 10, 12}
Notamos que T cont´ em m = 6 n´ umeros, ent˜ ao a m´ edia entre os valores nas posi¸c˜ oes:
6 2
= 3 e
6+2
2
=
82= 4 compoem a mediana.
Assim a mediana de T ´ e: M =
6+82=
142= 7.
2.Um outlier ´ e um valor distante da m´ edia dos dados coletados. Exemplo:
Considere o conjunto S = {1, 2, 4, 5, 350}. Neste conjunto, o n´ umero 350 ´ e um outlier.
A m´ edia de S ´ e dada por:
1+2+4+5+3505
=
3615= 72.4
Como S cont´ em 5 elementos a mediana de S encontra-se na posi¸ c˜ ao
5+12=
62= 3, neste caso a Mediana ´ e igual 4.
Assim, nota-se que a mediana representa os dados melhor do que a m´ edia na presen¸ca de
um outlier.
3. Aproveitando o exemplo do exerc´ıcio anterior:
Considere o conjunto S = {1, 2, 4, 5, 350}. Neste conjunto, o n´ umero 350 ´ e um valor extremo.
A m´ edia de S ´ e dada por:
1+2+4+5+3505
=
3615= 72.4
Ao remover o valor extremo 350 e recalculando a m´ edia encontramos:
1+2+4+5
4
=
124= 3
Logo, para utilizar a m´ edia como uma boa tendˆ encia central para um conjunto de dados ´ e necess´ ario remover os poss´ıveis valores extremos.
4. Exemplo:
Considere o conjunto S = {1, 1, 2, 3, 3}
A m´ edia de S ´ e dada por:
1+1+2+3+35=
105= 2.
A mediana de S ´ e o terceiro elemento = 2.
A moda de S ´ e 1 e 3, pois os dois possuem duas ocorrˆ encias.
Logo, entre as medidas de tendˆ encia central, a moda ´ e aquela que pode assumir mais de um valor.
5. Em um histograma sim´ etrico, as trˆ es medidas de tendˆ encia central possuem o mesmo valor.
No caso de um histograma assim´ etrico ` a esquerda temos que: M´ edia < Mediana < Moda Por fim, em um histograma assim´ etrico ` a direita temos que: Moda < Mediana < M´ edia
6. Como o conjunto de dados apresenta outliers, o ideal ´ e utilizar a mediana como resumo do conjunto de dados.
7. Considerando o conjunto de dados S = 5, −7, 2, 0, −9, 16, 10, 7 ou o mesmo ordenado de
modo crescente: S = −9, −7, 0, 2, 5, 7, 10, 16. Temos que:
A m´ edia de S ´ e dada por:
−9−7+0+2+5+7+10+168
=
248= 3.
A mediana de S ´ e a m´ edia entre o quarto e o quinto elemento =
2+52=
72= 3.5 N˜ ao possui moda pois todos os valores aparecem com a mesma frequˆ encia .
8. Considerando o conjunto de dados S = 14, 18, −10, 8, 8, −16 ou o mesmo ordenado de modo crescente: S = −16, −10, 8, 8, 14, 18. Temos que:
A m´ edia de S ´ e dada por:
−16−10+8+8+14+186
=
226≈ 3.7.
A mediana de S ´ e a m´ edia entre o terceiro e o quarto elemento =
8+82=
162= 8 A moda neste caso ´ e 8 pois ´ e o valor com mais ocorrˆ encias.
9. Considerando o conjunto de carros roubados nos ´ ultimos 12 dias S = 6, 3, 7, 11, 4, 3, 8, 7, 2, 6, 9, 15 ou o mesmo ordenado de modo crescente: S = 2, 3, 3, 4, 6, 6, 7, 7, 8, 9, 11, 15. Temos que:
A m´ edia de S ´ e dada por:
2+3+3+4+6+6+7+7+8+9+11+1512
=
8112= 6.75.
A mediana de S ´ e a m´ edia entre o sexto e o s´ etimo elemento =
6+72=
132= 6.5 A moda neste caso assume mais de um valor: 3, 6 e 7.
10.Considerando o conjunto de sal´ arios S = 750, 10429, 14600, 630, 8500, 720 ou o mesmo ordenado de modo crescente: S = 630, 720, 750, 8500, 10429, 14600. Temos que:
A m´ edia de S ´ e dada por:
630+720+750+8500+10429+146006
=
356296≈ 5938.17 mil d´ olares.
A mediana de S ´ e a m´ edia entre o terceiro e o quarto elemento =
750+85002=
92502= 4625 mil d´ olares
Como todos os valores possuem a mesma frequˆ encia esses dados n˜ ao tˆ em uma moda.
11. Considerando o conjunto de jornais publicados nos estados S = 7, 16, 92, 29, 6, 12, 11, 8, 18, 19, 6, 24, 9 ou o mesmo ordenado de modo crescente: S = 6, 6, 7, 8, 9, 11, 12, 16, 18, 19, 24, 29, 92.
a) A m´ edia de S ´ e dada por:
6+6+7+8+9+11+12+16+18+19+24+29+9213
=
25713≈ 19.8 jornais A mediana de S ´ e o s´ etimo valor = 12 jornais
b) O valor 92 ´ e um valor extremo. Refazendo os c´ alculos sem o mesmo temos:
A m´ edia de S:
6+6+7+8+9+11+12+16+18+19+24+2912
=
25712≈ 13.75 jornais
A mediana de S ´ e a m´ edia entre o sexto e s´ etimo valores =
11+122=
232= 11.5 jornais.
Com a remo¸ c˜ ao do valor extremo notamos que a m´ edia sofre maior altera¸ c˜ ao que a mediana.
c) Para estes dados a melhor medida resumida ´ e a mediana pois ela sofre menor influˆ encia do valor extremo 92.
12. Substituindo os valores na f´ ormula proposta no enunciado:
M AC = ¯ x = n
1x ¯
1+ n
2x ¯
2n
1+ n2 = 10 ∗ 95 + 8 ∗ 104
10 + 8 = 1782
18 = 99 (1)
13. Considerando a f´ ormula proposta no enunciado do exerc´ıcio anterior e considerando o n´ umero de alunos de administra¸ c˜ ao n
1= 20, a m´ edia aritm´ etica da pontua¸ c˜ ao dos alunos de administra¸ c˜ ao x
1=?, o n´ umero de alunos de economia n
2= 18 a m´ edia aritm´ etica da pontua¸ c˜ ao dos alunos de economia x
2= 144 e a m´ edia aritm´ etica combinada dos 38 alunos M AC = ¯ x = 150, temos:
M AC = ¯ x = n
1x ¯
1+ n
2x ¯
2n
1+ n2 (2)
150 = 20x
1+ 18 ∗ 144
20 + 18 (3)
150 = 20x
1+ 2592
38 (4)
5700 = 20x
1+ 2592 (5)
3108 = 20x
1(6)
x
1= 155.4 (7)
14. Considerando a f´ ormula proposta no enunciado e substituindo n = 10, ¯ x = 85.5, encon- tramos que a quantia total em dinheiro gasta em compras foi de:
10
X
i=1
x
i= n¯ x = 85.5 ∗ 10 = 855 reais (8) 15. Considerando a f´ ormula proposta no enunciado do exerc´ıcio anterior e substituindo n = 5, ¯ x = 69520, encontramos que a renda total em 2002 foi de:
5
X
i=1
x
i= n¯ x = 69520 ∗ 5 = 347600 reais (9) 16. Considerando a f´ ormula proposta no enunciado do exerc´ıcio 14:
6
X
i=1
x
i= n¯ x = 46 ∗ 6 (10)
x
1+ x
2+ x
3+ x
4+ x
5+ x
6= 276 (11) 57 + 39 + 44 + 51 + 37 + x
6= 276 (12) 57 + 39 + 44 + 51 + 37 + x
6= 276 (13)
228 + x
6= 276 (14)
x
6= 276 − 228 = 48 anos (15)
17. A amplitude representa a dispers˜ ao entre o menor e o maior valor de um conjunto de dados, entretanto, na presen¸ ca de um outlier, este valor acaba sendo distorcido. Exemplo:
Considere o conjunto S = {1, 2, 3, 4, 500}, a amplitude deste conjunto ´ e dada por:
A = 500 − 1 = 499
O que ´ e um valor extremamente alto e n˜ ao representa bem a dispers˜ ao dos dados. Entre- tanto ao removermos o outlier 500 do conjunto S e recalcularmos a amplitude obtemos:
A = 4 − 1 = 3
Notamos neste caso que a amplitude representa melhor a dispers˜ ao dos dados.
18. N˜ ao, pois ele ´ e a raiz quadrada da variˆ ancia.
19. O desvio padr˜ ao de um conjunto de dados ´ e zero, quando todos elementos do conjunto s˜ ao iguais.
Considere o conjunto S = {1, 1, 1}, o desvio padr˜ ao ´ e dado por:
σ
2= P
Ni=1
(x
i− µ)
2N (16)
Tomando N = 3, x
1= x
2= x3 = 1 e a m´ edia aritm´ etica µ = 1, temos:
σ
2= (x
1− µ)
2+ (x
2− µ)
2+ (x
3− µ)
2N (17)
σ
2= (1 − 1)
2+ (1 − 1)
2+ (1 − 1)
23 (18)
σ
2= (0)
2+ (0)
2+ (0)
23 (19)
σ
2= 0
3 (20)
σ
2= 0 (21)
σ = 0 (22)
20. Considerando o conjunto de dados S = {5, −7, 2, 0, −9, 16, 10, 7} ou o mesmo ordenado de modo crescente: S = {−9, −7, 0, 2, 5, 7, 10, 16} pertencem a uma popula¸ c˜ ao. Temos que:
A amplitude ´ e: A = 16 − (−9) = 16 + 9 = 25 Calculando a m´ edia do conjunto de dados:
µ = −9 − 7 + 0 + 2 + 5 + 7 + 10 + 16
8 = 3 (23)
A variˆ ancia (σ
2) ´ e dada por:
σ
2= P
Ni=1
(x
i− µ)
2N (24)
σ
2= (−9 − 3)
2+ (−7 − 3)
2+ (0 − 3)
2+ (2 − 3)
2+ (5 − 3)
2+ (7 − 3)
2+ (10 − 3)
2+ (16 − 3)
28 (25)
σ
2= (−12)
2+ (−10)
2+ (−3)
2+ (−1)
2+ (2)
2+ (4)
2+ (7)
2+ (13)
28 (26)
σ
2= 144 + 100 + 9 + 1 + 4 + 16 + 49 + 169
8 (27)
σ
2= 492
8 (28)
σ
2= 61.5 (29)
E o desvio padr˜ ao (σ):
σ ≈ 7.84 (30)
21. Considerando o conjunto de dados S = {14, 18, −10, 8, 8, −16} ou o mesmo ordenado de modo crescente: S = {−16, −10, 8, 8, 14, 18} pertencem a uma amostra. Temos que:
A amplitude ´ e: A = 18 − (−16) = 18 + 16 = 34
Calculando a m´ edia do conjunto de dados:
¯
x = −16 − 10 + 8 + 8 + 14 + 18
6 ≈ 3.7 (31)
A variˆ ancia (s
2) ´ e dada por:
s
2= P
ni=1
(x
i− x) ¯
2n − 1 (32)
s
2= (−16 − 3.7)
2+ (−10 − 3.7)
2+ (8 − 3.7)
2+ (8 − 3.7)
2+ (14 − 3.7)
2+ (18 − 3.7)
25 (33)
s
2= (−19.7)
2+ (−13.7)
2+ (4.3)
2+ (4.3)
2+ (10.3)
2+ (14.3)
25 (34)
s
2= 388.09 + 187.69 + 18.49 + 18.49 + 106.09 + 204.49
5 (35)
s
2= 923.34
5 (36)
s
2= 184.668 (37)
E o desvio padr˜ ao (s):
s ≈ 13.6 (38)
22. Considerando o conjunto de dados S = {89, 57, 104, 73, 26, 121, 81} ou o mesmo orde- nado de modo crescente: S = {26, 57, 73, 81, 89, 104, 121} pertencem a uma amostra. Temos que:
a) Calculando a m´ edia do conjunto de dados:
¯
x = 26 + 57 + 73 + 81 + 89 + 104 + 121
7 ≈ 78.7 (39)
Calculando agora o desvio para cada um dos dados:
d
1= 26 − 78.7 = −52.7 d
2= 57 − 78.7 = −21.7 d
3= 73 − 78.7 = −5.7 d
4= 81 − 78.7 = 2.3 d
5= 89 − 78.7 = 11.7 d
6= 104 − 78.7 = 26.7 d
7= 121 − 78.7 = 42.3 Somando estes valores temos:
d
1+ d
2+ d
3+ d
4+ d
5+ d
6+ d
7= −52.7 − 21.7 − 5.7 + 2.3 + 11.7 + 26.7 + 42.3 = 2.9
Portanto, n˜ ao a soma desses desvios n˜ ao ´ e igual a zero.
b) A amplitude ´ e: A = 121 − 26 = 95 A variˆ ancia (s
2) ´ e dada por:
s
2= P
ni=1
(x
i− x) ¯
2n − 1 (40)
s
2= (26 − 78.7)
2+ (57 − 78.7)
2+ (73 − 78.7)
2+ (81 − 78.7)
2+ (89 − 78.7)
2+ (104.7 − 78)
2+ (121 − 78.7)
26 (41)
s
2= (−52.7)
2+ (−21.7)
2+ (−5.7)
2+ (2.3)
2+ (11.7)
2+ (26.7)
2+ (42.3)
26 (42)
s
2= 2777.29 + 470.89 + 32.49 + 5.29 + 136.89 + 712.89 + 1789.29
6 (43)
s
2= 5925.03
6 (44)
s
2= 987.505 (45)
E o desvio padr˜ ao (s):
s ≈ 31.42 (46)
23. Considerando o conjunto de dados S = {18.3, 36.7, 34.4, 12.1, 24.7, 3, 14, 4.3} ou o mesmo ordenado de modo crescente: S = {3, 4.3, 12.1, 14, 18.3, 24.7, 34.4, 36.7} pertencem a uma amos- tra. Temos que:
A amplitude ´ e: A = 36.7 − 3 = 33.7
¯
x = 3 + 4.3 + 12.1 + 14 + 18.3 + 24.7 + 34.4 + 36.7
8 = 18.4375 (47)
A variˆ ancia (s
2) ´ e dada por:
s
2= P
ni=1
(x
i− x) ¯
2n − 1 (48)
s
2= (3 − 18.4375)
2+ (4.3 − 18.4375)
2+ (12.1 − 18.4375)
2+ (14 − 18.4375)
2+ (18.3 − 18.4375)
2+ (24.7 − 18.4375)
2+ (34.4 − 18.4375)
2+ (36.7 − 18.4375)
7 (49)
s
2= (−15.4375)
2+ (−14.1375)
2+ (−6.3375)
2+ (−0.1375)
2+ (6.3375)
2+ (16.0375)
2+ (18.3375)
27 (50)
s
2= 1111.99734375
7 (51)
s
2≈ 158.9 (52) E o desvio padr˜ ao (s):
s ≈ 12.6 (53)
24. Inicialmente calculamos o ponto m´ edio de cada intervalo:
m
1= 4 + 2 2 = 6
2 = 3 (54)
m
2= 5 + 7 2
12
2 = 6 (55)
m
3= 8 + 10 2 = 18
2 = 9 (56)
m
4= 11 + 13 2 = 24
2 = 12 (57)
m
5= 14 + 16 2 = 30
2 = 15 (58)
Assim, dada a frequˆ encia f
ino enunciado podemos calcular a m´ edia:
Lembre-se que
N = f
1+ f
2+ f
3+ f
4+ f
5= 5 + 9 + 14 + 7 + 5 = 40
µ = P
5i=1
m
if
i40 = 3 ∗ 5 + 6 ∗ 9 + 9 ∗ 14 + 12 ∗ 7 + 15 ∗ 5
40 = 15 + 54 + 126 + 84 + 75
40 = 354
40 = 8.9 (59) A variˆ ancia ´ e dada por:
σ
2= P
ni=1
f
i(m
i− µ)
2N =
P
5i=1
f
i(m
i− 8.9)
240 (60)
σ
2= 5(3 − 8.9)
2+ 9(6 − 8.9)
2+ 14(9 − 8.9)
2+ 7(12 − 8.9)
2+ 5(15 − 8.9)
240 (61)
σ
2= 5(−5.9)
2+ 9(−2.9)
2+ 14(0.1)
2+ 7(3.1)
2+ 5(6.1)
240 (62)
σ
2= 174 + 75.7 + 0.1 + 67.3 + 186
40 = 503.1
40 ≈ 12.6 (63)
E o desvio padr˜ ao:
σ =
√
12.6 ≈= 3.5 (64)
25. Inicialmente calculamos o ponto m´ edio de cada intervalo:
m
1= 0 + 4 2 = 4
2 = 2 (65)
m
2= 4 + 8 2
12
2 = 6 (66)
m
3= 8 + 12 2 = 20
2 = 10 (67)
m
4= 12 + 16 2 = 28
2 = 14 (68)
m
5= 16 + 20 2 = 36
2 = 18 (69)
m
6= 20 + 24 2 = 44
2 = 22 (70)
Assim, dada a frequˆ encia f
ino enunciado podemos calcular a m´ edia:
Lembre-se que
n = f
1+ f
2+ f
3+ f
4+ f
5+ f
6= 17 + 23 + 15 + 11 + 8 + 6 = 80
¯ x =
P
6 i=1m
if
i80 = 2 ∗ 17 + 6 ∗ 23 + 10 ∗ 15 + 14 ∗ 11 + 18 ∗ 8 + 22 ∗ 6
80 = 34 + 138 + 150 + 154 + 144 + 132
80 = 752
80 = 9.4 (71)
A variˆ ancia ´ e dada por:
s
2= P
ki=1
f
i(m
i− µ)
2n − 1 =
P
6i=1
f
i(m
i− 9.4)
279 (72)
s
2= 17(2 − 9.4)
2+ 23(6 − 9.4)
2+ 15(10 − 9.4)
2+ 11(14 − 9.4)
2+ 8(18 − 9.4)
2+ 6(22 − 9.4)
279 (73)
s
2= 17(−7.4)
2+ 23(−3.4)
2+ 15(0.6)
2+ 11(4.6)
2+ 8(8.6)
2+ 6(12.6)
279 (74)
s
2= 930.9 + 265.9 + 5.4 + 232.8 + 591.7 + 952.6
79 = 2979.3
79 =≈ 37.7 (75)
E o desvio padr˜ ao:
s = √
37.7 ≈= 6.1 (76)
26. Inicialmente calculamos o ponto m´ edio de cada intervalo:
m
1= 0 + 20 2 = 20
2 = 10 (77)
m
2= 20 + 40 2
60
2 = 30 (78)
m
3= 40 + 60 2 = 100
2 = 50 (79)
m
4= 60 + 80 2 = 140
2 = 70 (80)
m
5= 80 + 100
2 = 180
2 = 90 (81)
Assim, dada a frequˆ encia f
ino enunciado podemos calcular a m´ edia:
Lembre-se que
n = f
1+ f
2+ f
3+ f
4+ f
5= 5 + 16 + 11 + 10 + 8 = 50
¯ x =
P
5 i=1m
if
i50 = 10 ∗ 5 + 30 ∗ 16 + 50 ∗ 11 + 70 ∗ 10 + 90 ∗ 8
50 = 50 + 480 + 550 + 700 + 720
50 = 2500
50 = 50 (82)
A variˆ ancia ´ e dada por:
s
2= P
ki=1
f
i(m
i− µ)
2n − 1 =
P
5i=1
f
i(m
i− 50)
249 (83)
s
2= 5(10 − 50)
2+ 16(30 − 50)
2+ 11(50 − 50)
2+ 10(70 − 50)
2+ 8(90 − 50)
249 (84)
s
2= 5(−40)
2+ 16(−20)
2+ 11(0)
2+ 10(20)
2+ 8(40)
249 (85)
s
2= 8000 + 6400 + 0 + 4000 + 12800
49 = f rac3120049 ≈ 637 (86)
E o desvio padr˜ ao:
s = √
637 ≈= 25 (87)
O valor m*f representa a soma aproximada de quanto cada fam´ılia num dado intervalo gas-
tou. Por exemplo: m
1∗ f
1= 10 ∗ 5 = 50, ou seja a soma dos gastos m´ edios das 5 fam´ılias no
primeiro intervalo ´ e de 50 reais.
J´ a a soma P
ni=1