Desenhando
um
experimento
estatístico
OUTLINE
Amostragem
Qualidade
Quantidade: o desvio padrão da média e
o tamanho da amostra
AMOSTRAGEM
O problema: é inviável
medirmos todos elementos
AMOSTRAGEM: é a técnica
Pesquisa eleitoral: “qual candidato o sr.
Está mais inclinado à votar?
Critérios para amostragem:
Qualidade da amostra:
Qualidade, tão
importante quanto
a quantidade
Uma pesquisa
eleitoral que
sistematicamente
elimina eleitores
negros, seria inútil
Qual o melhor modo então de escolher
os itens a serem amostrados????
A amostragem deve ser o mais aleatória
possível:
Princípio da amostragem
aleatória simples
•
População grande
(N infinito);
•
Extrair sub-amostra de n
elementos;
•
Escolhe-se um método
que os n escolhidos são
igualmente prováveis
Amostragem aleatória simples
1. Não tendenciosa: todos
tem igual chance de
serem escolhidos
2. Seleção independente:
a seleção de 1 indivíduo
não afeta a seleção dos
outros
A. Amostragem aleatória
Estratificada
Neste exemplo,
separaram-se os
tipos de pickles, e
espera-se que
dentro de certo
estrato (tipo) a
variabilidade seja
menor
B. Amostragem aleatória em
clusters
Pesquisa a
domicílio:
separa-se a pesquisa em
bairros, e
pesquisa-se um
subconjunto em
cada bairro.
C. Amostragem aleatória
sistemática
Por exemplo, no
pedágio, amostrar
de 50 em 50 carros
a partir do
momento que se
escolhe um
primeiro (e
aleatório) carro,
para se fazer uma
pesquisa.
IMPORTANTE:
TODOS métodos estatísticos estão
baseados na premissa dos dados serem
Não tendenciosos
Independentes
Se não é este o caso, há métodos de
contornar isso, que é tema mais
O Contra-exemplo:
Amostragem de oportunidade: pega os n
primeiras unidades que aparece
Amostragem de
oportunidade: pega os
n primeiras unidades
O caso clássico de erro:
Livro de Shere Hite, Women and Love: 100 mil
questionários foram enviados a organizações
de mulheres (amostra de oportunidade).
Apenas 4.5% preencheram e retornaram os
questionários (tendenciosidade de resposta)
Os resultados refletem uma amostragem
feminina altamente motivada para
responder as questões do questionário (por
qualquer razão que seja
AMOSTRAGEM
Quantidade: qual o tamanho necessário da
amostra?
Qual o tamanho ideal da amostra???
governado por 1/(n
1/2
)
Dados gaussianos aleatórios,
com média = 10, σ = 3
1
2
3
4
5
6
7
8
9 10 11 12 13 14 15 16 17 18 19 20
1 13.9 12.5 9.0 13.4 9.2 10.7 7.9 11.5 13.1 9.1 15.5 8.3 8.3 10.0 7.1 13.2 18.2 10.8 8.5 16.6
2 5.6 10.7 14.2 8.7 11.3 7.5 11.0 10.0 11.0 5.5 8.9 4.5 10.7 12.1 10.6 10.6 9.1 14.5 12.1 12.4
3 4.8 4.3 14.5 11.9 9.6 6.2 17.1 9.9 12.0 7.3 5.6 8.7 12.3 7.4 9.0 12.6 11.7 14.3 14.0 12.1
4 10.6 8.4 12.2 12.4 9.9 11.9 8.6 18.8 9.2 8.8 8.1 12.8 11.2 6.8 13.9 10.6 14.7 9.9 16.4 7.0
5 13.6 9.1 11.5 7.3 11.4 11.8 11.9 8.1 10.7 7.8 12.8 12.2 12.1 9.7 14.0 8.8 18.2 12.8 10.2 11.3
6 7.6 15.4 8.2 10.5 14.1 10.9 6.9 9.9 14.4 7.4 13.2 16.9 9.7 9.2 8.3 11.1 10.9 9.0 10.5 11.6
7 6.2 12.7 12.2 14.8 11.4 11.2 14.0 18.0 3.2 8.7 10.5 10.5 9.9 13.6 12.6 10.1 7.6 12.0 8.1 6.7
8 9.6 9.8 7.5 10.3 14.9 7.4 7.1 6.6 5.1 7.2 10.9 3.5 10.3 11.8 14.2 8.9 12.4 15.7 14.8 9.3
9 5.1 13.9 11.7 9.1 3.9 8.5 10.6 11.7 11.2 14.0 11.9 15.1 7.6 11.6 11.0 15.3 6.0 10.5 9.8 8.8
10 10.1 6.9 10.8 11.4 8.7 9.7 8.1 6.8 8.0 7.0 5.6 13.8 14.3 5.7 14.9 10.7 9.2 9.1 8.6 11.6
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3 4.0 6.0 8.0 10.0 12.0 14.0 16.0 0 5 10 15 20 25 M édi a e de sv io padr ão Dezena
Médias de dados em cada
coluna
•
Comportamento oscilante
•
Amplitude varia de maneira
aproximadamente
constante
•
Desvio padrão não muda
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3 N 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 Média acumulativa 9.29 9.87 10.07 9.86 9.97 10.00 10.04 9.87 9.95 9.98 9.89 9.83 9.85 9.96 9.98 9.89 9.89 9.91 9.96 9.96 Sigma amostral 3.30 2.78 2.82 2.84 2.83 2.89 2.90 2.89 2.79 2.73 2.74 2.78 2.75 2.74 2.81 2.80 2.74 2.68 2.71 2.73
Média com n crescendo
2.00 2.50 3.00 3.50 4.00 9.00 9.25 9.50 9.75 10.00 10.25 0 50 100 150 200 250
Média e desvio padrão acumulativos
Média acumulativa Sigma amostral
•
Conforme n cresce, média
vai “afunilando”
•
Desvio padrão ainda assim
Desvio padrão:
amostral x da média
Desvio padrão amostral: é uma
característica daquela população.
2.00 2.50 3.00 3.50 4.00 9.00 9.25 9.50 9.75 10.00 10.25 0 50 100 150 200 250
Média e desvio padrão acumulativos
Média acumulativa Sigma amostral 4.0 6.0 8.0 10.0 12.0 14.0 16.0 0 5 10 15 20 25 M édi a e de sv io padr ão Dezena