• Nenhum resultado encontrado

aula9.1.Sampling design

N/A
N/A
Protected

Academic year: 2021

Share "aula9.1.Sampling design"

Copied!
33
0
0

Texto

(1)

Desenhando

um

experimento

estatístico

(2)

OUTLINE

Amostragem

Qualidade

Quantidade: o desvio padrão da média e

o tamanho da amostra

(3)

AMOSTRAGEM

(4)

O problema: é inviável

medirmos todos elementos

(5)

AMOSTRAGEM: é a técnica

Pesquisa eleitoral: “qual candidato o sr.

Está mais inclinado à votar?

(6)

Critérios para amostragem:

Qualidade da amostra:

Qualidade, tão

importante quanto

a quantidade

Uma pesquisa

eleitoral que

sistematicamente

elimina eleitores

negros, seria inútil

(7)

Qual o melhor modo então de escolher

os itens a serem amostrados????

A amostragem deve ser o mais aleatória

possível:

(8)

Princípio da amostragem

aleatória simples

População grande

(N  infinito);

Extrair sub-amostra de n

elementos;

Escolhe-se um método

que os n escolhidos são

igualmente prováveis

(9)

Amostragem aleatória simples

1. Não tendenciosa: todos

tem igual chance de

serem escolhidos

2. Seleção independente:

a seleção de 1 indivíduo

não afeta a seleção dos

outros

(10)

A. Amostragem aleatória

Estratificada

Neste exemplo,

separaram-se os

tipos de pickles, e

espera-se que

dentro de certo

estrato (tipo) a

variabilidade seja

menor

(11)

B. Amostragem aleatória em

clusters

Pesquisa a

domicílio:

separa-se a pesquisa em

bairros, e

pesquisa-se um

subconjunto em

cada bairro.

(12)

C. Amostragem aleatória

sistemática

Por exemplo, no

pedágio, amostrar

de 50 em 50 carros

a partir do

momento que se

escolhe um

primeiro (e

aleatório) carro,

para se fazer uma

pesquisa.

(13)

IMPORTANTE:

TODOS métodos estatísticos estão

baseados na premissa dos dados serem

Não tendenciosos

Independentes

Se não é este o caso, há métodos de

contornar isso, que é tema mais

(14)

O Contra-exemplo:

Amostragem de oportunidade: pega os n

primeiras unidades que aparece

Amostragem de

oportunidade: pega os

n primeiras unidades

(15)

O caso clássico de erro:

Livro de Shere Hite, Women and Love: 100 mil

questionários foram enviados a organizações

de mulheres (amostra de oportunidade).

Apenas 4.5% preencheram e retornaram os

questionários (tendenciosidade de resposta)

Os resultados refletem uma amostragem

feminina altamente motivada para

responder as questões do questionário (por

qualquer razão que seja

(16)

AMOSTRAGEM

Quantidade: qual o tamanho necessário da

amostra?

(17)

Qual o tamanho ideal da amostra???

governado por 1/(n

1/2

)

(18)

Dados gaussianos aleatórios,

com média = 10, σ = 3

1

2

3

4

5

6

7

8

9 10 11 12 13 14 15 16 17 18 19 20

1 13.9 12.5 9.0 13.4 9.2 10.7 7.9 11.5 13.1 9.1 15.5 8.3 8.3 10.0 7.1 13.2 18.2 10.8 8.5 16.6

2 5.6 10.7 14.2 8.7 11.3 7.5 11.0 10.0 11.0 5.5 8.9 4.5 10.7 12.1 10.6 10.6 9.1 14.5 12.1 12.4

3 4.8 4.3 14.5 11.9 9.6 6.2 17.1 9.9 12.0 7.3 5.6 8.7 12.3 7.4 9.0 12.6 11.7 14.3 14.0 12.1

4 10.6 8.4 12.2 12.4 9.9 11.9 8.6 18.8 9.2 8.8 8.1 12.8 11.2 6.8 13.9 10.6 14.7 9.9 16.4 7.0

5 13.6 9.1 11.5 7.3 11.4 11.8 11.9 8.1 10.7 7.8 12.8 12.2 12.1 9.7 14.0 8.8 18.2 12.8 10.2 11.3

6 7.6 15.4 8.2 10.5 14.1 10.9 6.9 9.9 14.4 7.4 13.2 16.9 9.7 9.2 8.3 11.1 10.9 9.0 10.5 11.6

7 6.2 12.7 12.2 14.8 11.4 11.2 14.0 18.0 3.2 8.7 10.5 10.5 9.9 13.6 12.6 10.1 7.6 12.0 8.1 6.7

8 9.6 9.8 7.5 10.3 14.9 7.4 7.1 6.6 5.1 7.2 10.9 3.5 10.3 11.8 14.2 8.9 12.4 15.7 14.8 9.3

9 5.1 13.9 11.7 9.1 3.9 8.5 10.6 11.7 11.2 14.0 11.9 15.1 7.6 11.6 11.0 15.3 6.0 10.5 9.8 8.8

10 10.1 6.9 10.8 11.4 8.7 9.7 8.1 6.8 8.0 7.0 5.6 13.8 14.3 5.7 14.9 10.7 9.2 9.1 8.6 11.6

(19)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15

(20)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3

(21)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3 4.0 6.0 8.0 10.0 12.0 14.0 16.0 0 5 10 15 20 25 M édi a e de sv io padr ão Dezena

Médias de dados em cada

coluna

Comportamento oscilante

Amplitude varia de maneira

aproximadamente

constante

Desvio padrão não muda

(22)

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 1 7.09 7.36 8.94 4.44 10.92 13.04 11.31 8.83 12.08 9.40 8.91 13.17 7.93 12.00 8.55 4.01 10.03 9.53 9.72 6.32 2 8.58 11.94 10.40 10.16 7.18 7.22 9.57 7.93 7.94 12.65 7.78 8.24 12.01 12.48 10.72 8.93 10.61 10.39 7.24 9.02 3 8.00 13.15 18.02 8.69 13.71 13.73 8.98 8.66 10.95 9.83 5.56 10.91 10.45 10.02 12.33 8.99 8.77 11.53 7.22 12.67 4 11.44 13.97 9.98 10.84 10.10 8.23 16.17 12.14 10.49 7.48 10.46 10.66 7.03 9.29 12.77 10.75 11.99 9.91 7.12 10.86 5 6.88 8.45 12.13 10.25 10.37 14.47 8.88 6.05 13.48 9.54 9.05 7.37 12.51 11.96 11.76 10.86 10.68 8.63 15.35 16.80 6 7.54 10.07 8.61 12.19 10.82 7.58 9.43 11.88 10.39 13.57 10.96 1.42 11.42 15.89 14.13 7.94 9.36 11.79 9.40 9.86 7 10.30 9.51 8.42 12.70 12.26 6.66 7.18 6.01 13.12 8.76 5.63 11.61 13.76 12.65 15.55 7.56 9.87 9.66 12.82 5.34 8 13.25 8.18 8.96 6.02 14.57 12.87 7.56 9.61 9.65 8.02 13.97 8.97 7.32 10.25 4.31 12.38 11.37 12.42 11.05 11.33 9 4.44 10.82 11.69 5.43 9.21 5.91 8.25 4.52 8.06 12.95 11.46 8.21 7.31 8.28 4.66 8.85 8.68 9.73 15.58 7.26 10 15.40 11.08 7.60 11.51 4.81 12.04 15.13 11.61 9.89 10.30 5.30 11.26 10.94 11.50 7.23 5.89 6.84 9.98 12.78 10.15 Média da coluna 9.3 10.5 10.5 9.2 10.4 10.2 10.2 8.7 10.6 10.2 8.9 9.2 10.1 11.4 10.2 8.6 9.8 10.4 10.8 10.0 Desvio padrão 3.3 2.2 3.0 3.0 2.9 3.3 3.1 2.7 1.9 2.1 2.9 3.3 2.5 2.1 3.9 2.5 1.5 1.2 3.2 3.3 N 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 Média acumulativa 9.29 9.87 10.07 9.86 9.97 10.00 10.04 9.87 9.95 9.98 9.89 9.83 9.85 9.96 9.98 9.89 9.89 9.91 9.96 9.96 Sigma amostral 3.30 2.78 2.82 2.84 2.83 2.89 2.90 2.89 2.79 2.73 2.74 2.78 2.75 2.74 2.81 2.80 2.74 2.68 2.71 2.73

Média com n crescendo

2.00 2.50 3.00 3.50 4.00 9.00 9.25 9.50 9.75 10.00 10.25 0 50 100 150 200 250

Média e desvio padrão acumulativos

Média acumulativa Sigma amostral

Conforme n cresce, média

vai “afunilando”

Desvio padrão ainda assim

(23)

Desvio padrão:

amostral x da média

Desvio padrão amostral: é uma

característica daquela população.

2.00 2.50 3.00 3.50 4.00 9.00 9.25 9.50 9.75 10.00 10.25 0 50 100 150 200 250

Média e desvio padrão acumulativos

Média acumulativa Sigma amostral 4.0 6.0 8.0 10.0 12.0 14.0 16.0 0 5 10 15 20 25 M édi a e de sv io padr ão Dezena

Médias de dados em cada

coluna

(24)

Desvio padrão amostral: porque certos

padrões não dependem de n

Qual a fração da população que tem

altura maior que 2,00 m;

Fração dos parafusos que aguentam

determinada torção;

Fração dos produtos que vem com

defeito de fábrica;

NENHUM DESSES MUDA, PORQUE É UMA

PROPRIEDADE DA POPULAÇÃO DE

(25)

Desvio padrão da média

É o Erro da média, quão incerta minha

média é;

O Erro da média cai com inverso de raiz

de n

(26)

N

10

100

1000

10000

media

11.60

10.69

10.11

10.00

sigma

2.54

2.51

2.92

3.00

N = 10

N = 100

N = 1000

N = 10000

(27)

Desvio padrão da média

É, de fato, o erro da média

que você obteve no final

(28)

Observe então que: ‘

O desvio padrão da amostra INDEPENDE

de n

O desvio padrão da média CAI com

1/n

0.5

É com ele que podemos planejar o

tamanho de nossa amostra.

(29)

Exercício

O erro de um instrumento de medida é

de metade da menor divisão. Exemplo:

Instrumento

Menor divisão

Erro

Régua

1 mm

0.5 mm

(30)

Exercício

Suponha que desejemos medir a

espessura de uma barra utilizando

réguas, mas queremos que a média final

tenha erro idêntico ao de um

paquímetro. Isso é possível?

Instrumento

Menor divisão

Erro

Régua

1 mm

0.5 mm

(31)

Exercício

RESOLUÇÃO: vide lousa

Instrumento

Menor divisão

Erro

Régua

1 mm

0.5 mm

(32)

n

10

100

1000

10000

media

11.60

10.69

10.11

10.00

sigma

2.54

2.51

2.92

3.00

Média = 11.60 +- 0.80

Média = 10.69 +- 0.25

Média = 10.113 +- 0.092

Média = 10.004 +- 0.030

(33)

Onde isso se aplica?

Próxima seção: comparação entre

médias, o princípio dos testes de

hipótese;

Referências

Documentos relacionados

Estas percepções podem ter implicações clínicas uma vez que os pacientes estão mais dispostos a seguir o aconselhamento, quando detectam por parte dos terapeutas uma atitude

Neto e Soares (2004) preconizam que esta constitui-se em uma proposta alternativa aos programas de capacitação para o trabalho, pois procura a integração entre educação e trabalho

Os títulos correntes são geralmente colocados no topo da página, embora também possam ser encontrados ao longo da borda exterior do bloco de texto, ou na margem

A pesquisa realizada no arquivo do TJ-PB traz para este arquivo uma contribuição cultural de grande valor e pode ser considerada como um primeiro passo

As medidas elétricas nos três terminais da estrutura, que caracterizam o comportamento do transistor eletrodepositado através dos ganhos de corrente em base comum e emissor

Os conservantes são usados para preservar as amostras de leite desde a coleta até o momento da análise no laboratório.. Existem vários tipos que podem ser usados desde que

O professor Cristiano Holanda Montinegro está à frente da disciplina na referida escola há três anos, possui uma postura tradicional, suas aulas são de caráter

The two protocols for the determination of soil water retention properties compared in this study, the traditional method based on the assumption of hydrostatic equilibrium on