Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Técnicas de Amostragem
Prof. Alan Ricardo da Silva
Departamento de Estatística Universidade de Brasília - UnB IE-Instituto de Ciências Exatas
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Agenda
1 Vantagens do Método de Amostragem; 2 Fases de um Levantamento por Amostragem; 3 Amostragem Aleatória Simples;
4 Amostragem Aleatória Estraticada; 5 Amostragem Sistemática;
6 Amostragem por Conglomerado; 7 Regressão com Plano Amostral.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Vantagens do Método de Amostragem
Objetivo Principal:
Obter informações sobre o todo, baseando-se no resultado de uma amostra.
Importância
Conveniente no estudo de populações grandes; Indispensável no estudo de populações innitas; Indispensável quando ocorre destruição de material.
Vantagens
Redução de Custo; Maior Velocidade; Maior Escopo; Maior Precisão.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada;
3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados;
4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração;
6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção;
8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo;
10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Fases de um Levantamento por Amostragem
1 Objetivos;
2 População a ser amostrada; 3 Dados a serem coletados; 4 Grau de precisão;
5 Métodos de mensuração; 6 Cadastro (frame);
7 Tamanho da amostra/seleção; 8 Pré-teste (não-aleatório);
9 Organização do trabalho de campo; 10 Análise dos resultados;
11 Informação obtida para levantamentos futuros; 12 Relatório nal.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tipos de Amostragem
O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas.
Tipos de Amostragem
Amostragem Acidental;
Amostragem Típica; Amostragem Proposital; Amostragem por Cotas; Amostragem Probabilística.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tipos de Amostragem
O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas.
Tipos de Amostragem
Amostragem Acidental; Amostragem Típica;
Amostragem Proposital; Amostragem por Cotas; Amostragem Probabilística.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tipos de Amostragem
O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas.
Tipos de Amostragem
Amostragem Acidental; Amostragem Típica; Amostragem Proposital;
Amostragem por Cotas; Amostragem Probabilística.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tipos de Amostragem
O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas.
Tipos de Amostragem
Amostragem Acidental; Amostragem Típica; Amostragem Proposital; Amostragem por Cotas;
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tipos de Amostragem
O papel da teoria de amostragem é fazer amostragem mais eciente, ou seja, com o menor custo possível produzir estimativas mais precisas.
Tipos de Amostragem
Amostragem Acidental; Amostragem Típica; Amostragem Proposital; Amostragem por Cotas; Amostragem Probabilística.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Vantagens do Método de Amostragem
Exemplo: População com 6 elementos. Amostra de tamanho 2. C62 =15
S1= (1, 2), S2 = (1, 3), . . . , S15 = (5, 6).
Sorteia-se um número entre 1 e 15.
Se o número é j, Sj é a amostra selecionada.
Com reposição;
Com probabilidades iguais; Com probabilidades diferentes;
Sem Reposição.
Com probabilidades iguais; Com probabilidades diferentes;
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples (AAS)
AAS é um método de selecionar n unidades de N tal qualquer uma das CN
n amostras distintas tenha mesma chance de ser selecionada.
Exemplo: Pop = {a,b,c,d}. C4 2=6 ab ac ad p= 16 = 1 CN n bc bd cd n.n−1.n−2... 1 = n!(N−n)! = 1
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples (AAS)
O Plano é descrito do seguinte modo: Seja o Universo U= {1, 2, . . . , N}
i) Utilizando-se de um processo aleatório, sorteia-se com igual probabilidade um elemento da população U.
ii) Repete-se o processo anterior até que sejam sorteadas n unidades.
iii) Caso seja permitido o sorteio de uma unidade mais de uma vez, tem-se o processo AAS com reposição (AASc). Quando o
elemento sorteado é removido de U antes do sorteio da próxima unidade, tem-se o plano AAS sem reposição (AASs).
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples (AAS)
Do ponto de vista prático, o plano AASsé muito mais interessante,
pois é intuitivo Não se ganha mais informação se uma mesma unidade aparece mais de uma vez na amostra. Por outro lado, o plano AASc introduz vantagens matemáticas e estatísticas, como a
independência entre as unidades sorteadas, o que facilita muito a determinação das propriedades dos estimadores.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples (AAS)
Parâmetros da População TOTAL: T=∑Nj=1Yj =NY MÉDIA: Y= ∑ N j=1Yj N =µ VARIÂNCIA: σ2 = ∑Nj=1(Yj−Y)2 N S2= ∑N j=1(Yj−Y)2 N−1 Estimadores TOTAL: ˆT=Ny MÉDIA: y= ∑ n j=1yj n VARIÂNCIA: s2= ∑nj=1(yj−y)2 n−1
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples com Reposição (AAS
c)
Exemplo: Seja a variável renda familiar dada por (12, 30, 18), com
T=60, µ=20e σ2=168/3=56. Tomada uma amostra de
n=2, tem-se as seguintes amostras.
(12,12) (12,30) (12,18) (30,12) (30,30) (30,18) (18,12) (18,30) (18,18)
P 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9 1/9
y 12 21 15 21 30 24 15 24 18
s2 0 162 18 162 0 72 18 72 0
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples com Reposição (AAS
c)
y 12 15 18 21 24 30 P 1/9 2/9 1/9 2/9 2/9 1/9 E(y) = 12+30+18+942+48+30 = 1809 =20=µ Var(y) = σ2 n = 562 =28 s2 0 18 72 162 P 3/9 2/9 2/9 2/9 E(s2) = 0+36+1449 +324 = 5049 =56=σ2 ˆT 24 30 36 42 48 60 P 1/9 2/9 1/9 2/9 2/9 1/9 E(ˆT) = 24+60+36+984+96+60 = 3609 =406=T
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
À medida que o tamanho da amostra aumenta, as distribuições de ye ˆT vão se aproximando da distribuição normal de acordo com o Teorema Central do Limite (TCL). Então, para n sucientemente grande, temos que
y−µ √ σ2/n a ∼N(0, 1) ˆT−T N√ 2/n a ∼N(0, 1)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Assim, com relação à média populacional P |y−µ| √ σ2/n ≤zα/2 ≈1−α ngrande Py−zα/2 p σ2/n≤µ≤y+zα/2 p σ2/n ≈1−α Na falta de σ2, usar s2.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Determinar o tamanho da amostra n, de tal forma que o estimador obtido tenha um erro máximo de estimação igual a e, com determinado grau de conança γ.
P(|y−µ| ≤e) ≈1−α
n grande P(|y−µ| ≤zα/2
p
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo1: Seja o intervalo (18±1, 96√48/10) = (18±4, 29)
para a renda familiar com 95% de conança. Sabendo que σ2 =48,
qual o tamanho da amostra para se ter um erro máximo de√2.
n= 1,962×48
(√2)2 =
3,84×48
2 =3, 84×24≈93
Exemplo2: Deseja-se estimar determinada característica da
população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV=20%?
n= 1,962×0,22 0,12 = 3,84 ×0,04 0,01 = 0,15360,01 ≈16 P(|y−Y| ≤rY) =1−α ⇒n= z α/2×σ rY 2 n=zα/2×CV r 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo1: Seja o intervalo (18±1, 96√48/10) = (18±4, 29)
para a renda familiar com 95% de conança. Sabendo que σ2 =48,
qual o tamanho da amostra para se ter um erro máximo de√2. n= 1,962×48
(√2)2 =
3,84×48
2 =3, 84×24≈93
Exemplo2: Deseja-se estimar determinada característica da
população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV=20%?
n= 1,962×0,22 0,12 = 3,84 ×0,04 0,01 = 0,15360,01 ≈16 P(|y−Y| ≤rY) =1−α ⇒n= z α/2×σ rY 2 n=zα/2×CV r 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo1: Seja o intervalo (18±1, 96√48/10) = (18±4, 29)
para a renda familiar com 95% de conança. Sabendo que σ2 =48,
qual o tamanho da amostra para se ter um erro máximo de√2. n= 1,962×48
(√2)2 =
3,84×48
2 =3, 84×24≈93
Exemplo2: Deseja-se estimar determinada característica da
população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV=20%?
n= 1,962×0,22 0,12 = 3,84 ×0,04 0,01 = 0,15360,01 ≈16 P(|y−Y| ≤rY) =1−α ⇒n= z α/2×σ rY 2 n=zα/2×CV r 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo1: Seja o intervalo (18±1, 96√48/10) = (18±4, 29)
para a renda familiar com 95% de conança. Sabendo que σ2 =48,
qual o tamanho da amostra para se ter um erro máximo de√2. n= 1,962×48
(√2)2 =
3,84×48
2 =3, 84×24≈93
Exemplo2: Deseja-se estimar determinada característica da
população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV=20%?
n= 1,962×0,22 0,12 = 3,84 ×0,04 0,01 = 0,15360,01 ≈16 P(|y−Y| ≤rY) =1−α ⇒n= z α/2×σ rY 2 n=zα/2×CV r 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo1: Seja o intervalo (18±1, 96√48/10) = (18±4, 29)
para a renda familiar com 95% de conança. Sabendo que σ2 =48,
qual o tamanho da amostra para se ter um erro máximo de√2. n= 1,962×48
(√2)2 =
3,84×48
2 =3, 84×24≈93
Exemplo2: Deseja-se estimar determinada característica da
população com 95% de conança e erro máximo de 10% da média. Qual o tamanho da amostra sabendo que CV=20%?
n= 1,962×0,22 0,12 = 3,84 ×0,04 0,01 = 0,15360,01 ≈16 P(|y−Y| ≤rY) =1−α ⇒n= z α/2×σ rY 2 n=zα/2×CV r 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples sem Reposição (AAS
s) - C
NnA AASs funciona de modo idêntico à AASc, a não ser pela não
recolocação do elemento sorteado. Portanto, cada elemento da população só pode aparecer uma vez na amostra.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimação do Total e da Média Populacional
Não é dicil mostrar que os estimadores não-viesados para µ e T são: y= n1∑ni=1yi Var(y) = (1−f)Sn2 = NN−−n1σ2 n, f = Nn ˆT=Ny Var(ˆT) =N2 NN−−n1σ2 n onde N−n
N−1 é chamado de Correção para Populações Finitas (CPF),
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples sem Reposição (AAS
s)
e c
var(y) = (1−f)sn2 varc(ˆT) =N2(1−f)s2
n
Exemplo: Considere o mesmo exemplo da renda familiar, com valores(12, 30, 18), e T=60, µ=20 e S2=168/2=84.
Tomada uma amostra de n=2, tem-se as seguintes amostras.
(12,30) (12,18) (30,18)
P 1/3 1/3 1/3
y 21 15 24
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Aleatória Simples sem Reposição (AAS
s)
y 15 21 24 P 1/3 1/3 1/3 E(y) = 15+213+24 = 603 =20=µ Var(y) = (1−f)Sn2 = 1− 2 3 84 2 =14 s2 18 72 162 P 1/3 1/3 1/3 E(s2) = 18+723+162 = 2523 =84=S2 ˆT 30 42 48 P 1/3 1/3 1/3 E(ˆT) = 30+423+48 = 1203 =406=T
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Verique que a Variância de y é menor do que na AASc.
y−µ p (1−f)S2/n a ∼N(0, 1) ˆT−T Np(1−f)S2/n a ∼N(0, 1) P p |y−µ| (1−f)S2/n ≤zα/2 ! ≈1−α q q
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Exemplo: Seja y=1, 296, s2 =2, 397, n=1000e N =36000.
Estime o intervalo para µ com 95% de conança.
IC(µ; 0, 95) = 1, 296±1, 96 q 1− 1000 36000 2,397 1000 IC(µ; 0, 95) = 1, 296±1, 96 q 35 362,3971000 IC(µ; 0, 95) = (1, 296±1, 96×0, 048) = (1, 296±0, 094) IC(µ; 0, 95) = (1, 20; 1, 39)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Exemplo: Seja y=1, 296, s2 =2, 397, n=1000e N =36000.
Estime o intervalo para µ com 95% de conança. IC(µ; 0, 95) = 1, 296±1, 96 q 1− 3600010002,397 1000 IC(µ; 0, 95) = 1, 296±1, 96 q 35 362,3971000 IC(µ; 0, 95) = (1, 296±1, 96×0, 048) = (1, 296±0, 094) IC(µ; 0, 95) = (1, 20; 1, 39)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Exemplo: Seja y=1, 296, s2 =2, 397, n=1000e N =36000.
Estime o intervalo para µ com 95% de conança. IC(µ; 0, 95) = 1, 296±1, 96 q 1− 3600010002,397 1000 IC(µ; 0, 95) = 1, 296±1, 96 q 35 362,3971000 IC(µ; 0, 95) = (1, 296±1, 96×0, 048) = (1, 296±0, 094) IC(µ; 0, 95) = (1, 20; 1, 39)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Normalidade Assintótica e Intervalos de Conança
Exemplo: Seja y=1, 296, s2 =2, 397, n=1000e N =36000.
Estime o intervalo para µ com 95% de conança. IC(µ; 0, 95) = 1, 296±1, 96 q 1− 3600010002,397 1000 IC(µ; 0, 95) = 1, 296±1, 96 q 35 362,3971000 IC(µ; 0, 95) = (1, 296±1, 96×0, 048) = (1, 296±0, 094) IC(µ; 0, 95) = (1, 20; 1, 39)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Determinar o tamanho da amostra n, de tal forma que o estimador obtido tenha um erro máximo de estimação igual a e, com determinado grau de conança γ.
Var(y) = (1−f)Sn2 = Sn2 (1−f) = Sn20, onde n0 = 1−nf e=zα/2 √ S2/n0 ⇒ n0 = z2α/2S2 e2 Note que n0 = n 1−n N ⇒ n= n 0 1+nN0
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05.
n0 = 1, 96 2×2, 397 (0, 05)2 = 3, 84×2, 397 0, 0025 =3683, 8 n= 3683, 8 1+3683,836000 = 3683, 8 1, 10 ≈3342
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05.
n0 = 1, 96 2×2, 397 (0, 05)2 = 3, 84×2, 397 0, 0025 =3683, 8 n= 3683, 8 1+3683,836000 = 3683, 8 1, 10 ≈3342
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Determinação do Tamanho da Amostra
Exemplo: Considere o exemplo anterior. Qual o tamanho da amostra com 95% de conança para se ter um erro de 0, 05.
n0 = 1, 96 2×2, 397 (0, 05)2 = 3, 84×2, 397 0, 0025 =3683, 8 n= 3683, 8 1+3683,836000 = 3683, 8 1, 10 ≈3342
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Comparação entre AAS
ce AAS
sQuando existem 2 planos amostrais é importante saber qual é o melhor. Um conceito importante, chamado de Efeito do
Planejamento (EPA) ou do inglês Design Eect (De), compara a variância de um plano amostral qualquer com relação a um plano considerado padrão. A estatística y é em ambos os planos um estimador não-viesado de µ. Assim,
Deff =EPA= Var(AASs(y))
Var(AASc(y)) = (1−f)S2/n σ2/n = N−n N−1σ2/n σ2/n = N−n N−1
Quando Deff >1, tem-se que o plano do numerador é menos
eciente que o padrão e quando Deff <1, tem-se a situação
contrária. Da expressão acima verica-se que N−n
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Comparação entre AAS
ce AAS
sou seja, o plano AASs é sempre melhor do que o plano AASc.
Note que esse resultado conrma a intuição popular de que amostras sem reposição são melhores do aquelas com elementos repetidos.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem para Proporções e Porcentagens
Algumas vezes desejamos estimar o número total, a proporção ou a porcentagem de unidades na população que possuem alguma característica ou atributo.
Exemplos: Número de pessoas desempregadas; a porcentagem da população que é nativa; porcentagem de votos de determinado candidato.
A classicação pode ser introduzida diretamente no questionário com questões do tipo Sim ou Não.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Variância da Estimativa Amostral
AAS(n) A= {e1, e2, . . . , en}
Dena: yi =1, se ei possui A; e yi =0, caso contrário.
y= n1∑ni=1yi =p é um estimador não-viesado de P.
s2= n−11∑ni=1(yi−y)2= n−n1pq
Var(p) =Var(y) = NN−nSn2 = NNn−nNPQN−1 = NN−−n1PQn
d
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Total com o Atributo A
ˆ NA=Np d Var(NˆA) =N2Vard(p) =N2 NN−n pq n−1 = N(N−n)pq n−1
Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa.
N=3042, n=200, nA=38, p=38/200=0, 19 ˆ NA=Np=3042×0, 19=578 EP(NˆA) =N q 3042(3042−200) 200−1 ×0, 19×0, 81= √ 6686=81, 8
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Total com o Atributo A
ˆ NA=Np d Var(NˆA) =N2Vard(p) =N2 NN−n pq n−1 = N(N−n)pq n−1
Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa.
N=3042, n=200, nA=38, p=38/200=0, 19 ˆ NA=Np=3042×0, 19=578 EP(NˆA) =N q 3042(3042−200) 200−1 ×0, 19×0, 81= √ 6686=81, 8
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Total com o Atributo A
ˆ NA=Np d Var(NˆA) =N2Vard(p) =N2 NN−n pq n−1 = N(N−n)pq n−1
Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa.
N=3042, n=200, nA=38, p=38/200=0, 19 ˆ NA=Np=3042×0, 19=578 EP(NˆA) =N q 3042(3042−200) 200−1 ×0, 19×0, 81= √ 6686=81, 8
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Total com o Atributo A
ˆ NA=Np d Var(NˆA) =N2Vard(p) =N2 NN−n pq n−1 = N(N−n)pq n−1
Exemplo: De uma lista de 3042 nomes e endereços, uma AAS de 200 nomes mostrou 38 endereços errados. Estime o número total de endereços que precisam de correção na lista e encontre o erro padrão dessa estimativa.
N=3042, n=200, nA=38, p=38/200=0, 19
ˆ
NA=Np=3042×0, 19=578
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Intervalo de Conança para P
y≈N(Y, Var(y)) P y−zα/2 q d Var(y) ≤Y≤y+zα/2 q d Var(y) ≈1−α IC(P; γ) =p±zα/2 p (1−f)pq/(n−1)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tamanho de Amostra para Proporções
P(|p−P| ≥d) =α pé normalmente distribuído σp2 =Var(p) = NN−−n1PQn d=zα/2 q N−n N−1 PQ n ⇒ n= z2α/2PQ d2 1+1 N " z2 α/2PQ d2 ! −1 # n0= z2 α/2PQ d2 n= n0 1+n0N Se N↑ ⇒ n≈ z2α/2PQ d2 P=0, 5 ⇒ PQ=0, 25 n= 4×22d2 = d12
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tamanho de Amostra para Proporções
Exemplo: d=0, 05 ⇒ n= 0,0512 = 0,00251 =400
Se N=3200 ⇒ n=356
Fazendo o tamanho mínimo temos:
α=0, 05 d=0, 05 ⇒ n= 1,96 2×0,25
0,052 =385
Considerando um erro de 2%:
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tamanho de Amostra para Proporções
Exemplo: d=0, 05 ⇒ n= 0,0512 = 0,00251 =400
Se N=3200 ⇒ n=356 Fazendo o tamanho mínimo temos:
α=0, 05 d=0, 05 ⇒ n= 1,96 2×0,25
0,052 =385
Considerando um erro de 2%:
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Tamanho de Amostra para Proporções
Exemplo: d=0, 05 ⇒ n= 0,0512 = 0,00251 =400
Se N=3200 ⇒ n=356 Fazendo o tamanho mínimo temos:
α=0, 05 d=0, 05 ⇒ n= 1,96 2×0,25
0,052 =385
Considerando um erro de 2%:
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Na amostragem estraticada a população de N unidades é primeiro dividida em subpopulações de N1, N2, . . . , NL unidades. Essas
subpopulações, que são chamadas de estratos, não se sobrepõem e juntas compreendem toda a população, tal que
N1+N2+. . .+NL=N.
Para obter o benefício total da estraticação, os valores de Nh
precisam ser conhecidos. Os tamanhos das amostras dentro de cada estrato são denotados por n1, n2, . . . , nL, respectivamente.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Na amostragem estraticada a população de N unidades é primeiro dividida em subpopulações de N1, N2, . . . , NL unidades. Essas
subpopulações, que são chamadas de estratos, não se sobrepõem e juntas compreendem toda a população, tal que
N1+N2+. . .+NL=N.
Para obter o benefício total da estraticação, os valores de Nh
precisam ser conhecidos. Os tamanhos das amostras dentro de cada estrato são denotados por n1, n2, . . . , nL, respectivamente.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A estraticação é usada principalmente para resolver alguns problemas como:
1 A melhoria da precisão das estimativas;
2 Produzir estimativas para toda a população e subpopulações; 3 Garantir que elementos de cada subpopulação estejam na
amostra.
Vamos abordar muito mais o primeiro problema. Considere que seja possível dividir uma população heterogênea em subpopulações ou estratos internamente homogêneos. Se cada estrato é homogêneo, em que as medições variam pouco de uma unidade para outra, uma estimativa precisa da média de qualquer estrato pode ser obtida de uma amostra menor desses estratos. Essa estimativas podem então ser combinadas dentro de uma estimativa precisa para toda a população.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A estraticação é usada principalmente para resolver alguns problemas como:
1 A melhoria da precisão das estimativas;
2 Produzir estimativas para toda a população e subpopulações; 3 Garantir que elementos de cada subpopulação estejam na
amostra.
Vamos abordar muito mais o primeiro problema. Considere que seja possível dividir uma população heterogênea em subpopulações ou estratos internamente homogêneos. Se cada estrato é homogêneo, em que as medições variam pouco de uma unidade para outra, uma estimativa precisa da média de qualquer estrato pode ser obtida de uma amostra menor desses estratos. Essa estimativas podem então ser combinadas dentro de uma estimativa precisa para toda a população.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Exemplo: Considere uma pesquisa feita em uma população com N=8 domicílios, onde são conhecidas as variáveis Renda Domiciliar (Y) e o Local do Domicílio (W), com os códigos A para Região de Alta Renda e B para Região de Baixa Renda. Tem-se então
Y 13 17 6 5 10 12 19 6
W B A B B B A A B
µ= 13+17+6+5+810+12+19+6 = 888 =11 2 2 2 2 2 2 2 2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Retirando uma AASc de tamanho n=4, sabe-se que
Var(y) = σ2
n = 244 =6
Usando W para estraticar a população em 2 estratos, constrói-se as seguintes subpopulações:
YA 17 12 19 µA=16 σA2 =8, 7
YB 13 6 5 10 6 µB=8 σB2=9, 2
Sorteando-se em cada estrato uma AASc de tamanho n=2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Com base em yA e yB pode-se construir um estimador para µ yes= 3yA+5yB 3+5 = 3yA+5yB 8 Var(yes) = 382 Var(yA) + 582 Var(yB) = 6494, 35+25644, 60 Var(yes) =2, 40 Deff = Var(yes) Var(y) = 2,40 6 =0, 40
Ou seja, como o mesmo tamanho de amostra, diminuiu-se a variância do estimador em mais da metade. O resultado será mais ecaz quanto mais homogêneos forem os estratos. Mas a simples
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Exemplo: Considere que os estratos do exemplo anterior sejam: YA 13 17 6 5 µA=10, 25 σA2 =24, 69
YB 10 12 19 6 µA=11, 75 σA2 =22, 19
Sorteando-se em cada estrato uma AASc de tamanho n=2
Var(yA) = 24,692 =12, 34 Var(yB) = 22,192 =11, 09 Var(yes) = 166412, 34+ 166411, 09=5, 86
Deff = 5,866 =0, 98
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A execução de um plano de amostragem estraticada (AE) possui os seguintes passos:
1 Divisão da população em subpopulações bem denidas
(estratos);
2 De cada estrato retira-se uma amostra, geralmente
independente;
3 Em cada estrato usam-se estimadores convenientes para os
parâmetros do estrato;
4 Monta-se para a população um estimador combinando os
estimadores de cada estrato e determinam-se suas propriedades.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A execução de um plano de amostragem estraticada (AE) possui os seguintes passos:
1 Divisão da população em subpopulações bem denidas
(estratos);
2 De cada estrato retira-se uma amostra, geralmente
independente;
3 Em cada estrato usam-se estimadores convenientes para os
parâmetros do estrato;
4 Monta-se para a população um estimador combinando os
estimadores de cada estrato e determinam-se suas propriedades.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A execução de um plano de amostragem estraticada (AE) possui os seguintes passos:
1 Divisão da população em subpopulações bem denidas
(estratos);
2 De cada estrato retira-se uma amostra, geralmente
independente;
3 Em cada estrato usam-se estimadores convenientes para os
parâmetros do estrato;
4 Monta-se para a população um estimador combinando os
estimadores de cada estrato e determinam-se suas propriedades.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A execução de um plano de amostragem estraticada (AE) possui os seguintes passos:
1 Divisão da população em subpopulações bem denidas
(estratos);
2 De cada estrato retira-se uma amostra, geralmente
independente;
3 Em cada estrato usam-se estimadores convenientes para os
parâmetros do estrato;
4 Monta-se para a população um estimador combinando os
estimadores de cada estrato e determinam-se suas propriedades.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
A estimativa usada para a média na amostragem estraticada é yes= yst(es de estraticada e st de stratied).
yst= H
∑
h=1 Nhyh N = H∑
h=1 Whyh onde N=N1+N2+. . .+NH.ycoincidirá com ystse para todo estrato
nh n = Nh N ou nh Nh = n N ou fh =f
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Estraticada
Com a alocação proporcional, temos que nh =Whn= NNhn.
Substituindo na fórmula dadVar(yst), d
Var(yst) = (1−nf)∑ Whs2 h
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Alocação Ótima
Em AE, o problema está em selecionar os valores de nh. Eles
podem ser selecionados para minimizar a Var(yst)para um custo
especicado de tomar a amostra ou para minimizar o custo para um valor especicado da Var(yst). A função de custo mais simples
é da forma:
C=Co+∑Hh=1Chnh
onde: C= custo total da amostragem;
C0= custo xo da amostragem (conhecido);
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Alocação Ótima
Dentro de qualquer estrato o custo é proporcional ao tamanho da amostra, mas o custo por unidade Ch pode variar de estrato para
estrato. Se os custos de viagem entre unidades são substanciais, estudos matemáticos e empíricos sugerem que os custos são melhores representados pela expressão ∑ th
√
nh.
1 Quais são os valores de n1, n2, . . . , nH tal que Var(yst) seja
mínima?(custo xo)
2 Quais são os valores de n1, n2, . . . , nH tal que C seja
mínimo?(variância xa)
Teorema: Em amostragem aleatória estraticada com uma função de custo linear, a variância da média estimada yst é mínima para um cuto xo C, e o custo é mínimo para uma variância xa V, quando nh é proporcional a WhSh/
√
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Alocação Ótima
Dentro de qualquer estrato o custo é proporcional ao tamanho da amostra, mas o custo por unidade Ch pode variar de estrato para
estrato. Se os custos de viagem entre unidades são substanciais, estudos matemáticos e empíricos sugerem que os custos são melhores representados pela expressão ∑ th
√
nh.
1 Quais são os valores de n1, n2, . . . , nH tal que Var(yst) seja
mínima?(custo xo)
2 Quais são os valores de n1, n2, . . . , nH tal que C seja
mínimo?(variância xa)
Teorema: Em amostragem aleatória estraticada com uma função de custo linear, a variância da média estimada y é mínima para
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Alocação Ótima
Se Ch =C, isto é, se o custo por unidade é o mesmo em todos os
estratos, a função de custo se torna C=C0+Cn, e a alocação
ótima para um custo xo se reduz para uma alocação ótima para um tamanho de amostra xo.
Teorema: Em AE, a Var(yst)é minimizada para um tamanho de
amostra total n xa se
nh=n∑ WWhShShh =n∑ NNhShShh
Essa alocação é denominada Alocação Ótima de Neyman (Neyman(1934) provou o resultado).
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Efeito do Planejamento
Se inteligentemente usada, a estraticação quase sempre resulta em uma menor variância para a média ou total estimado do que a dada por uma AAS comparável. Não é verdade, entretanto, que qualquer AE fornece uma variância menor do que a AAS.
Se os valores de nh estão longe do ótimo, a AE pode ter uma
variância maior. Por isso, vamos comparar a AAS com a AE com alocação proporcional e ótima. Essa comparação mostra como o ganho devido à estraticação é alcançado.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Efeito do Planejamento
Assim, sempre que os estratos tiverem médias distintas (σ2 e
grande), deve-se usar alocação proporcional ou ótima. Se além disso, os desvios padrões de cada estrato diferirem muito entre si (σ2
dp grande), recomenda-se a alocação ótima. Daí
Deff(AEpr) = VVAAScpr = σ 2 d σ2 =1− σe2 σ2 Deff(AEot) = VVot AASc = σ2d−σdp2 σ2 =1− σe2 σ2 − σdp2 σ2
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Efeito do Planejamento
Exemplo: Exemplo dos habitantes de 64 cidades americanas.
Cálculo da Alocação Ótima
Estrato Nh Sh NhSh nh
1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00
Quando a estraticação produz ganhos substanciais?
1 A população é composta de unidades variando amplamente no
tamanho;
2 As principais variáveis a serem medidas estão fortemente
relacionadas ao tamanho das instituições;
3 Uma boa medida de tamanho está disponível para separar os
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Efeito do Planejamento
Exemplo: Exemplo dos habitantes de 64 cidades americanas.
Cálculo da Alocação Ótima
Estrato Nh Sh NhSh nh
1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00 Quando a estraticação produz ganhos substanciais?
1 A população é composta de unidades variando amplamente no
tamanho;
2 As principais variáveis a serem medidas estão fortemente
relacionadas ao tamanho das instituições;
3 Uma boa medida de tamanho está disponível para separar os
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Efeito do Planejamento
Exemplo: Exemplo dos habitantes de 64 cidades americanas.
Cálculo da Alocação Ótima
Estrato Nh Sh NhSh nh
1 16 232,04 3712,64 12,21 2 48 74,71 3586,08 11,79 Total 64 306,75 7298,72 24,00 Quando a estraticação produz ganhos substanciais?
1 A população é composta de unidades variando amplamente no
tamanho;
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Idealização
Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N=nk, onde k é um inteiro. Deseja-se retirar
uma amostra de tamanho n. Considere a seguinte estratégia:
1)Selecionar aleatoriamente um número entre 1 e k, onde k=N/n. Seja x esse número.
2)Tome como elementos da amostra os seguintes: x, x+k, x+2k, . . . , x+ (n−1)k
AAS(n) ⇒ CNn (Número de amostras)
AS(n)⇒ k amostras (mutuamente excludentes) P(Ei∈ A) = 1k
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Idealização
Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N=nk, onde k é um inteiro. Deseja-se retirar
uma amostra de tamanho n. Considere a seguinte estratégia:
1)Selecionar aleatoriamente um número entre 1 e k, onde k=N/n. Seja x esse número.
2)Tome como elementos da amostra os seguintes: x, x+k, x+2k, . . . , x+ (n−1)k
AAS(n) ⇒ CNn (Número de amostras)
AS(n)⇒ k amostras (mutuamente excludentes) P(Ei∈ A) = 1k
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Idealização
Vamos supor que uma população de N elementos está ordenada. Suponha ainda que N=nk, onde k é um inteiro. Deseja-se retirar
uma amostra de tamanho n. Considere a seguinte estratégia:
1)Selecionar aleatoriamente um número entre 1 e k, onde k=N/n. Seja x esse número.
2)Tome como elementos da amostra os seguintes: x, x+k, x+2k, . . . , x+ (n−1)k
AAS(n)⇒ CNn (Número de amostras)
AS(n)⇒ k amostras (mutuamente excludentes) P(Ei∈A) = 1k
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Se N não é um número múltiplo de k, as diferentes amostras variam de tamanho de uma para outra.
N=23 n=5 k= 235 ≈5 N6=nk Possíveis Amostras I II III IV V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 n=5 n=5 n=5 n=4 n=4
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Se N não é um número múltiplo de k, as diferentes amostras variam de tamanho de uma para outra.
N=23 n=5 k= 235 ≈5 N6=nk Possíveis Amostras I II III IV V 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 n=5 n=5 n=5 n=4 n=4
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Isso introduz uma pertubação na teoria de amostragem sistemática. Se n>50 isso será ignorado, por simplicidade.
Outro método de seleção das amostras foi sugerido por Lahiri(1952);
1)Seja k o inteiro mais próximo de N n;
2)Suponha que os números estejam organizados como um círculo;
3)Selecione aleatoriamente um número entre 1 e N. Seja x esse número;
4)Selecione a amostra a partir desse número de k em k posições. x, x+k, x+2k, . . . ,retorno ao início.
Exemplo: k= 235 ≈5
x=19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igual x=22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Isso introduz uma pertubação na teoria de amostragem sistemática. Se n>50 isso será ignorado, por simplicidade.
Outro método de seleção das amostras foi sugerido por Lahiri(1952);
1)Seja k o inteiro mais próximo de N n;
2)Suponha que os números estejam organizados como um círculo;
3)Selecione aleatoriamente um número entre 1 e N. Seja x esse número;
4)Selecione a amostra a partir desse número de k em k posições. x, x+k, x+2k, . . . ,retorno ao início.
Exemplo: k= 235 ≈5
x=19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igual x=22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Isso introduz uma pertubação na teoria de amostragem sistemática. Se n>50 isso será ignorado, por simplicidade.
Outro método de seleção das amostras foi sugerido por Lahiri(1952);
1)Seja k o inteiro mais próximo de N n;
2)Suponha que os números estejam organizados como um círculo;
3)Selecione aleatoriamente um número entre 1 e N. Seja x esse número;
4)Selecione a amostra a partir desse número de k em k posições. x, x+k, x+2k, . . . ,retorno ao início.
Exemplo: k= 235 ≈5
x=19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igual x=22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Sistemática (todo k-ésimo)
Isso introduz uma pertubação na teoria de amostragem sistemática. Se n>50 isso será ignorado, por simplicidade.
Outro método de seleção das amostras foi sugerido por Lahiri(1952);
1)Seja k o inteiro mais próximo de N n;
2)Suponha que os números estejam organizados como um círculo;
3)Selecione aleatoriamente um número entre 1 e N. Seja x esse número;
4)Selecione a amostra a partir desse número de k em k posições. x, x+k, x+2k, . . . ,retorno ao início.
Exemplo: k= 235 ≈5
x=19 ⇒ 19, 1, 6, 11, 16 Todas as unidades tem igual x=22 ⇒ 22, 4, 9, 14, 19 probabilidade de seleção.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Populações em Ordem Aleatória
A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo.
Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos.
Teorema: Considere todas as N! populações nitas que são
formadas pelas N! permutações de qualquer série nita de números y1, y2, . . . , yN. Então, em média sobre essas populações nitas
E(Var(ys)) =Var(y)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Populações em Ordem Aleatória
A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo.
Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos.
Teorema: Considere todas as N! populações nitas que são
formadas pelas N! permutações de qualquer série nita de números y1, y2, . . . , yN. Então, em média sobre essas populações nitas
E(Var(ys)) =Var(y)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Populações em Ordem Aleatória
A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo.
Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos.
Teorema: Considere todas as N! populações nitas que são
formadas pelas N! permutações de qualquer série nita de números y , y , . . . , y . Então, em média sobre essas populações nitas
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Populações em Ordem Aleatória
A AS é algumas vezes usada, por sua conveniência, em populações em que a numeração das unidades é efetivamente aleatória. Isso acontece em amostras de um arquivo organizado alfabeticamente por nomes, se o item que está sendo medido não tem relação com o nome do indivíduo.
Nessas situações esperamos que a AS seja equivalente à AAS, e tenha a mesma variância. Para qualquer população nita, dado n e k, isso não é exatamente verdade, principalmente quando n e k são pequenos.
Teorema: Considere todas as N! populações nitas que são
formadas pelas N! permutações de qualquer série nita de números y1, y2, . . . , yN. Então, em média sobre essas populações nitas
E(Var(ys)) =Var(y)
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
Os planos amostrais vistos até agora sorteavam unidades
elementares diretamente da população ou de estratos desta mesma população. Quando os sistemas de referências (cadastros ou frames) não são adequados e o custo de atualizá-los é muito elevado, ou ainda quando a movimentação para identicar as unidades elementares no campo é cara e consome muito tempo, a tarefa amostral pode ser facilitada se forem selecionados grupos de unidades elementares, os chamados conglomerados ou clusters.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
Pop= {E1, E2, . . . , EN}
Elemento: pessoa adulta que mora no Plano Piloto.
1)Em algumas situações não existe um cadastro dos elementos da população. Existe um cadastro das residências.
Pop= { R1 |{z} M1 , R2 |{z} M2 , . . . , RN |{z} MN }
Mi= número de pessoas adultas na Ri.
Cada residência é um Conglomerado de pessoas.
Conglomerado: é um conjunto de elementos da população.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
Pop= {E1, E2, . . . , EN}
Elemento: pessoa adulta que mora no Plano Piloto.
1)Em algumas situações não existe um cadastro dos elementos da população. Existe um cadastro das residências.
Pop= { R1 |{z} M1 , R2 |{z} M2 , . . . , RN |{z} MN }
Mi= número de pessoas adultas na Ri.
Cada residência é um Conglomerado de pessoas.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
2)Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um.
Mas grandes custos são envolvidos em localizar as 600 casas e na viagem entre elas do que em localizar 20 blocos e visitar todas as casas desses blocos. Quando custo é balanceado contra precisão, a unidade maior pode se mostrar superior.
Um dos inconvenientes do uso da amostragem por conglomerados (AC) é que as unidades, dentro de um mesmo conglomerado, tendem a ter valores parecidos, e isto torna esses planos menos ecientes.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
2)Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um.
Mas grandes custos são envolvidos em localizar as 600 casas e na viagem entre elas do que em localizar 20 blocos e visitar todas as casas desses blocos. Quando custo é balanceado contra precisão, a unidade maior pode se mostrar superior.
Um dos inconvenientes do uso da amostragem por conglomerados (AC) é que as unidades, dentro de um mesmo conglomerado, tendem a ter valores parecidos, e isto torna esses planos menos ecientes.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
2)Em algumas situações, mesmo existindo um cadastro, é mais econômico a amostragem por conglomerados. Por exemplo, uma AAS de 600 casas cobre mais uniformemente uma cidade do que 20 blocos contendo uma média de 30 casas cada um.
Mas grandes custos são envolvidos em localizar as 600 casas e na viagem entre elas do que em localizar 20 blocos e visitar todas as casas desses blocos. Quando custo é balanceado contra precisão, a unidade maior pode se mostrar superior.
Um dos inconvenientes do uso da amostragem por conglomerados (AC) é que as unidades, dentro de um mesmo conglomerado, tendem a ter valores parecidos, e isto torna esses planos menos ecientes.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
A AC tende a:
i)Ter um menor custo por elemento;
ii)Ter maior variância; e
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem por Conglomerados (Cluster)
A AC tende a:
i)Ter um menor custo por elemento;
ii)Ter maior variância; e
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimativas em Conglomerados
Se cada unidade contém o mesmo número m de elementos, seja pi = ai
m a proporção de elementos na i-ésima unidade que cai na
classe C. A proporção caindo em C na amostra é p= ∑ni=1ai
nm = 1n∑nj=1pj
ou seja, p é uma média não ponderada das quantidades pi.
Consequentemente, se yi é substituído por pi, as fórmulas para a
média podem ser aplicadas diretamente para fornecer a verdadeira e estimada variância de p.
Var(p) = 1−f ∑iN=1 (pi−P)2 −
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimativas em Conglomerados
Se o tamanho do conglomerado não é constante, seja mi o número
de elementos no i-ésimo conglomerado e seja pi = maii. A proporção
de unidades caindo na classe C na amostra é p= ∑ na i ∑nm i ← aleatório ← aleatório
Estruturalmente, isso é uma típica estimativa de razão. Ela é levemente viesada, embora o viés raramente tenha importância prática.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimativas em Conglomerados
Se trocarmos yi por ai e xi por mi
Var(Rˆ) = 1−f nX2 1 N−1∑ N i=1(Yi−RXi)2 R= XY Rˆ = yx P= ∑Ni=1Ai ∑N i=1Mi p = ∑ni=1ai ∑n i=1mi A variância aproximada de p é Var(p) = 1−f nM2 1 N−1∑ N i=1(Ai−PMi)2 M= ∑ N i=1mi N d Var(p) = 1−f nm2 1 n−1∑ni=1(ai−pmi)2 m= ∑ n i=1mi n
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimativas em Conglomerados
Exemplo: Uma AAS de 30 domicílios foi retirada de uma população de 15.000 domicílios e foi vericada a proporção de pessoas que consultaram um médico no último ano.
Domicílio No. pessoas Masc Fem Visitou o Médico Sim Não 1 5 1 4 5 0 2 6 3 3 0 6 ... ... ... ... ... ... 30 4 2 2 1 3 Total 104 53 51 30 74
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Estimativas em Conglomerados
binomial: n=104 p= 10430 =0, 2885 d Var(p) = npq−1 = 0,2885104×−0,71151 = 0,20526775103 =0, 00199 correto: n=30 p= ∑ ai ∑ mi = 10430 =0, 2885(como antes) m= 10430 =3, 4667 ∑ a2i =86 ∑ m2i =404 ∑ aimi =113 d Var(p) = 86−2×0,288530×29×113×3,4667+0,28852 2×404 =0, 00520Estimando a proporção de homens na população binomial: Var(p) =0, 00240
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Complexa
O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003).
Geralmente em pesquisas com grandes conjuntos de dados, a amostra é coletada a partir de uma combinação dessas técnicas, como por exemplo, uma pesquisa pode utilizar estraticação com diversos estágios de conglomerados e utilizar estimadores tipo razão e regressão para a estimação dos parâmetros (Lohr, 1999).As fórmulas para estimação dos erros padrão se tornam horrendas, especialmente se existem diversos estágios de aglomeração sem reposição.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Complexa
O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003).
Geralmente em pesquisas com grandes conjuntos de dados, a amostra é coletada a partir de uma combinação dessas técnicas, como por exemplo, uma pesquisa pode utilizar estraticação com diversos estágios de conglomerados e utilizar estimadores tipo razão e regressão para a estimação dos parâmetros (Lohr, 1999).
As fórmulas para estimação dos erros padrão se tornam horrendas, especialmente se existem diversos estágios de aglomeração sem reposição.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Complexa
O termo Amostragem Complexa é utilizada quando a amostra é coletada utilizando conglomerados, estraticação e probabilidade de seleção desigual (Chambers e Skinner,2003).
Geralmente em pesquisas com grandes conjuntos de dados, a amostra é coletada a partir de uma combinação dessas técnicas, como por exemplo, uma pesquisa pode utilizar estraticação com diversos estágios de conglomerados e utilizar estimadores tipo razão e regressão para a estimação dos parâmetros (Lohr, 1999).As fórmulas para estimação dos erros padrão se tornam horrendas, especialmente se existem diversos estágios de aglomeração sem reposição.
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Complexa
Aplicar métodos estatísticos clássicos para analisar tais dados leva a inferências erradas. Em particular, ignorar o desenho amostral pode levar a uma séria subestimação do erro padrão das estimativas e consequentemente uma baixa cobertura dos intervalos de conança e uma superestimação dos níveis dos testes (Chambers e
Skinner,2003).
Considere o exemplo a seguir sobre a estimação do total de mosquiteiros em Gambia, na África, a m de reduzir os casos de Malária (Lohr, 1999):
Em 1991 um pesquisa nacional foi feita para estimar a prevalência de mosquiteiros nas casas em áreas rurais. A amostra e os
Agenda Vantagens Fases AAS AE Alocação AS AC Complexa Regressão com Plano Amostral
Amostragem Complexa
Aplicar métodos estatísticos clássicos para analisar tais dados leva a inferências erradas. Em particular, ignorar o desenho amostral pode levar a uma séria subestimação do erro padrão das estimativas e consequentemente uma baixa cobertura dos intervalos de conança e uma superestimação dos níveis dos testes (Chambers e
Skinner,2003).
Considere o exemplo a seguir sobre a estimação do total de mosquiteiros em Gambia, na África, a m de reduzir os casos de Malária (Lohr, 1999):
Em 1991 um pesquisa nacional foi feita para estimar a prevalência de mosquiteiros nas casas em áreas rurais. A amostra e os