Método de amostragem por conglomerados em dois estágios para estimativa de população canina/felina domiciliada.

Texto

(1)

M´etodo de amostragem por conglomerados em

dois est´

agios para estimativa de popula¸c˜

ao

canina/felina domiciliada.

Fernando Ferreira, Ricardo Augusto Dias,

Jos´

e Soares Ferreira Neto, Marcos Amaku

1 de fevereiro de 2011

Resumo

Prop˜oe-se a utiliza¸c˜ao de amostra por conglomerados em dois est´agios com reposi¸c˜ao para estimar a popula¸c˜ao de c˜aes/gatos em munic´ıpios. Apresenta-se um exemplo para o c´alculo do tamanho da amostra ne-cess´aria para estimar a popula¸c˜ao de c˜aes no munic´ıpio de S˜ao Paulo

1

Amostra por conglomerados em dois

est´

agios

A amostragem por conglomerados ´e caracterizada pela sele¸c˜ao de uni-dades amostrais compostas por grupos de uniuni-dades menores chamados de elementos. A utilidade deste m´etodo, quando comparado ao processo aleat´orio simples, est´a associada ao menor custo na coleta das amostras e `

a possibilidade de realizar a amostragem na ausˆencia de quadros amostrais detalhados, ou seja, a falta de um cadastro de domic´ılios. Para o proce-dimento descrito a seguir ser´a necess´ario a obten¸c˜ao da lista de setores censit´arios do munic´ıpio junto ao IBGE ou, eventualmente, `a secretaria de planejamento do munic´ıpio.

Para a estima¸c˜ao de popula¸c˜ao de c˜aes e/ou gatos vamos explicar o processo de amostragem por conglomerados em dois est´agios. O processo proposto a seguir n˜ao ´e ´unico e cada munic´ıpio poder´a, a seu crit´erio e com orienta¸c˜ao estat´ıstica, modific´a-lo de acordo com suas necessidades considerando-se aspectos de custo, operacionaliza¸c˜ao e precis˜ao da esti-mativa desejada. As f´ormulas aqui apresentadas foram obtidas de [1].

O processo de amostragem por conglomerados em dois est´agios aqui proposto est´a baseado na utiliza¸c˜ao do estimador de Hansen-Hurwitz que consiste no sorteio inicial de um n´umero pr´e-definido de setores cen-sit´arios, com probabilidade proporcional ao n´umero de domic´ılios exis-tentes e com reposi¸c˜ao, nos quais um n´umero fixo de domic´ılios ser˜ao examinados contando-se o n´umero de c˜aes/gatos existentes.

(2)

1.1

Nota¸

ao

Antes de prosseguir com os c´alculos vamos definir a nota¸c˜ao que ser´a adotada no texto:

• M = n´umero de setores censit´arios no munic´ıpio. • m = n´umero de setores censit´arios na amostra. • N = n´umero de domic´ılios no munic´ıpio. • Ni= n´umero de domic´ılios no setor censit´ario i. • n = n´umero de domic´ılios na amostra.

• N = PMi=1Ni

M = n´umero m´edio de domic´ılios por setor censit´ario • ni = n´umero de domic´ılios selecionados no setor censit´ario i. • n = Pmi=1ni

m = n´umero m´edio de domic´ılios amostrados por setor censit´ario.

• X = popula¸c˜ao de c˜aes/gatos total no munic´ıpio. • Xi = n´umero total de c˜aes/gatos no setor censit´ario i.

• Xij = n´umero de c˜aes/gatos no domic´ılio j do setor censit´ario i. • xi= n´umero total de c˜aes/gatos nos domicilios amostrados do setor

i. • x0

ppt= estimativa da popula¸c˜ao de c˜aes/gatos total no munic´ıpio. • x =Pm

i=1xi= n´umero total de c˜aes/gatos na amostra. • π0i= NNi = probabilidade de sele¸c˜ao do setor censit´ario i. • X = PMi=1Xi

M = n´umero m´edio de c˜aes/gatos por setor censit´ario. • X = X

N = n´umero m´edio de c˜aes/gatos por domic´ılio. • σ2

1x= PM

i=1(Xi−X)2

M = variˆancia do n´umero de c˜aes/gatos por setor censit´ario. • σ2 2x = N1  PM i=1  Ni Ni−1  PNi

j=1(Xij− Xi)2 = variˆancia do n´umero de c˜aes/gatos por domic´ılio.

• 1 − α = n´ıvel de confian¸ca.

•  = erro m´aximo da estimativa de c˜aes/gatos.

1.2

Estimativa da popula¸

ao de c˜

aes/gatos

Considere que no munic´ıpio existam M setores censit´arios dos quais m ser˜ao selecionados aleatoriamente, com probabilidade proporcional ao n´umero de domic´ılios existentes, para fazer parte da amostra. N˜ao se preocupe, por enquanto, em saber qual deve ser o n´umero de setores selecionados, em se¸c˜ao posterior discutiremos como determinar esse valor. A seguir, em cada setor censit´ario sorteado ser˜ao examinados n domic´ılios nos quais o n´umero de c˜aes/gatos ser´a contado.

O n´umero de c˜aes/gatos no domic´ılio ser´a obtido utilizando-se a equa¸c˜ao 1.

(3)

x0ppt= N n m X i=1 xi (1)

O intervalo de confian¸ca de 95% para a X ser´a dado por: x0ppt− 1.96 × dEP ≤ X ≤ x

0

ppt+ 1.96 × dEP (2) onde dEP ´e dado por:

d EP = s Pm i=1 N xi n − x 0 ppt 2 m(m − 1) (3)

1.3

Qual o n´

umero de domic´ılios que devem ser

examinados em cada setor censit´

ario?

Vamos considerar que cada setor ser´a selecionado de forma simples aleat´oria e que em cada um n´umero fixo n dos domic´ılios ser˜ao examinados.

O c´alculo do n´umero m´edio de domic´ılios a serem examinados em cada setor de modo a se obter o menor desvio padr˜ao considerando-se os custos de visita aos setores (C1) e de realiza¸c˜ao de entrevista em cada setor (C2) ´ e dado por: n = C1 C2   1 − δx δx 1/2 (4) onde δx´e uma generaliza¸c˜ao do coeficiente de correla¸c˜ao intraclasse e ´ e dado por: δx= [M/(M − 1)]σ2 1x− N σ22x [M/(M − 1)]σ2 1x+ N (N − 1)σ2x2 (5) O problema agora est´a em determinar os valores de σ21x e σ

2 2x. A variˆancia do n´umero de c˜aes/gatos por setor censit´ario (σ2

1x) e a variˆancia do n´umero de c˜aes/gatos por domicilio podem ser obtidas a partir de uma amostra piloto ou, no impossibilidade de sua realiza¸c˜ao, utilizando-se, como aproxima¸c˜ao, as variˆancias encontradas no munic´ıpio de S˜ao Paulo.

Para o munic´ıpio de S˜ao Paulo, uma aproxima¸c˜ao para as variˆancias ´e dada por: σ2

1x= 20084.02 (c˜aes), σ1x2 = 2343.61 (c˜aes), σ2x2 = 1.24 (c˜aes) e σ22x= 0.48 (gatos).

O pr´oximo passo ´e determinar o n´umero de setores censit´arios a serem amostrados.

1.4

Quantos setores censit´

arios devemos

selecio-nar?

Uma vez determinada a fra¸c˜ao de domic´ılios a serem amostrados em cada setor, devemos estabelecer o n´umero de setores a serem selecionados de modo que a diferen¸ca entre nossa estimativa e o valor real n˜ao seja superior a (100 × )% com uma confian¸ca de 100 × (1 − α)%. Esse valor de m ´e dado por:

(4)

m =z 2 1−α/2 Pm∗ i=1 N xi n − x 0 ppt 2 2(x0 ppt)2(m∗− 1) (6) onde, para uma confian¸ca de 95% temos z1−0.025 = 1.96 e os valores de m∗, n, xi e x0ppts˜ao obtidos a partir de um estudo piloto.

1.5

Exemplo: c´

alculo do tamanho da amostra para

estimar o n´

umero de c˜

aes em S˜

ao Paulo

Vamos calcular o tamanho da amostra necess´aria para estimar a popula¸c˜ao de c˜aes no munic´ıpio de S˜ao Paulo. O n´umero de setores censit´arios existentes no munic´ıpio de S˜ao Paulo em 2001 era 13229 (M ). O n´umero m´edio de domic´ılios por setor censit´ario era 228.7 (N ). Os valores de σ2

1x e σ2x2 foram obtidos de levantamento anterior [2] e s˜ao iguais a σ1x2 = 20084.02 e σ2

2x = 1.24. Estes valores, se n˜ao forem obtidos a partir de um estudo piloto na sua regi˜ao, podem ser considerados uma estimativa inicial razo´avel. Aplicando-se esses valores em 5 obtem-se:

δx=

[13229/(13229 − 1)] × 20084.02 − 228, 7 × 1.24

[13229/(13229 − 1)] × 1.24 + 228.7 × (228.7 − 1) × 1.23 = 0.23 (7) Considerando que o custo para o deslocamento de ida e retorno a cada setor levem em torno de 2 horas×homem (C1) e que cada entrevista demore em torno de 10 min×homem C2 e aplicando-se esses valores e o resultado acima em 6 obtemos:

n = 120 10   1 − 0.23 0.23 1/2 = 6.27 ' 7 (8)

Assim, em cada setor censit´ario necessitamos examinar 7 domic´ılios aleatoriamente selecionados.

Agora ´e necess´ario estimar o n´umero de setores a serem sorteados no munic´ıpio lembrando que o sorteio dos mesmos ser´a realizado com pro-babilidade de sele¸c˜ao de cada setor proporcional ao n´umero de domic´ılios existentes em cada setor.

O mesmo estudo anterior referido acima contou o n´umero de c˜aes/gatos em 20 domic´ılios (n) sorteados aleatoriamente de cada um dos 572 setores censit´arios (m∗) tamb´em sorteados aleatoriamente. No munic´ıpio havia N = 3025473 domic´ılios. Estes dados permitiram obter estimativa inicial de x0ppt = 2507401. Utilizando-se n´ıvel de confian¸ca de 95% e precis˜ao na estimativa de  = 0.10 e conhecendo-se, para cada setor amostrado, o n´umero de c˜aes/gatos existente nos domic´ılios amostrados (xi) podemos utilizar a equa¸c˜ao 6 para estimar o n´umero de setores que deveriam ter sido selecionados e obtendo-se o valor m = 131.

Assim, para o munc´ıpio de S˜ao Paulo seria necess´ario examinar 7 domi-cilios selecionados aleatoriamente em cada um dos 131 setores censit´arios selecionados do universo de setores censit´arios existentes no munic´ıpio de S˜ao Paulo com probabilidade proporcional ao n´umero de domicilios exis-tente em cada um deles com reposi¸c˜ao.

(5)

Referˆ

encias

[1] P. S. Levy, S. Lemeshow. Sampling of populations. Methods and ap-plications, 4 ed. (Wiley, New York, 1999), 525 p´aginas.

[2] B. D. Canatto. Caracteriza¸c˜ao das popula¸c˜oes de c˜aes e gatos domiciliadas no munic´ıpio de S˜ao Paulo. 2010. 92f. Disserta¸c˜ao (Mestrado em Ciˆencias) - Faculdade de Medicina Veterin´aria e Zoo-tecnia, Universidade de S˜ao Paulo, S˜ao Paulo, 2010.

Imagem

Referências

temas relacionados :