• Nenhum resultado encontrado

Parte II - Amostragem

N/A
N/A
Protected

Academic year: 2021

Share "Parte II - Amostragem"

Copied!
7
0
0

Texto

(1)

Universidade Estadual de Santa Cruz – UESC

Departamento de Ciˆ

encias Exatas e Tecnol´

ogicas

Professora: Camila M. L. Nagamine

Curso: Licenciatura Biologia- EaD

Disciplina: Bioestat´ıstica

Parte II - Amostragem

1

Introdu¸

ao

At´e o presente momento, n´os aprendemos a descrever uma amostra atrav´es das medidas de tendˆencia central e de dispers˜ao, que s˜ao parte da chamada ”estat´ıstica descritiva”.

Com a utiliza¸c˜ao da ”inferˆencia estat´ıstica”, desejamos inferir indutivamente propriedades de uma popula¸c˜ao (ou universo) com base nos resultados obtidos com a amostra (ou subcon-junto do inverso ) o que constitui uma ferramenta muito importante no desenvolvimento de uma disciplina cient´ıfica. Toda a inferˆencia na Estat´ıstica est´a baseada na ”teoria das proba-bilidades”, que n´os acabamos de ver.

Frequentemente, devemos tomar decis˜oes sobre popula¸c˜oes com base em informa¸c˜oes obtidas em amostras das mesmas. Tais decis˜oes chamam-se decis˜oes estat´ısticas. Por exemplo, com base em resultados amostrais, podemos querer decidir se determinada droga ´e eficiente na cura de determinada doen¸ca, se um processo educacional ´e melhor do que outro, se um determinado n´umero de caixas de um banco ´e suficiente para um atendimento r´apido ao cliente, etc. Para a tomada de tais decis˜oes utilizaremos a inferˆencia estat´ıstica.

Nesta etapa do nosso curso, iniciaremos a discuss˜ao falando sobre aspectos fundamentais da amostragem, ap´os a qual introduziremos as no¸c˜oes sobre distribui¸c˜ao amostral da m´edia e da propor¸c˜ao, intervalos de confian¸ca e testes de hip´oteses para m´edias e propor¸c˜oes, um m´etodo para avalia¸c˜ao de rela¸c˜oes entre vari´aveis qualitativas, que ´e o teste qui-quadrado de independˆencia, finalizando com dois testes n˜ao-param´etricos.

2

Amostragem

Amostragem ´e o ato de obter uma amostra de uma popula¸c˜ao, podendo-se definir popula¸c˜ao como um conjunto de elementos, cada um deles apresentando uma ou mais caracter´ısticas em comum. Amostra ´e, simplesmente, uma parte da popula¸c˜ao. O levantamento por amostragem, quando comparado com o levantamento total, apresenta certas vantagens:

• custo menor;

• resultado em menor tempo; • objetivos mais amplos; • dados mais fidedignos.

(2)

H´a situa¸c˜oes em que a amostragem se imp˜oe. Assim, pode-se ter o caso de a popula¸c˜ao de estudo ser muito grande, sendo impratic´avel o levantamento total. Em casos em que o processo de investiga¸c˜ao das caracter´ısticas de cada elemento for destrutivo (teste de resistˆencia de materiais, por exemplo), s´o tem sentido trabalhar-se com amostras. H´a tamb´em os problemas de ordem ´etica: novas drogas, vacinas, t´ecnicas cir´urgicas devem ser testadas inicialmente em amostras, antes de seu uso amplo na popula¸c˜ao.

2.1

Etapas de um levantamento por amostragem

Quer a amostragem seja feita dentro de um laborat´orio (por exemplo, para selecionar ratos que ser˜ao usados em um experimento sobre agentes cancer´ıgenos), quer a amostragem seja feita sobre a popula¸c˜ao geral (por exemplo, para obter informa¸c˜oes sobre aspectos de fertilidade de mulheres moradoras em uma grande cidade, como S˜ao Paulo), existem etapas que devem ser seguidas, intimamente ligadas aos princ´ıpios de metodologia de pesquisa cient´ıfica. Tais itens ser˜ao comentados com linguagem mais dirigida a levantamentos objetivando estimar parˆametros de popula¸c˜oes reais de seres humanos. Tais coment´arios, todavia, s˜ao aplic´aveis a qualquer situa¸c˜ao em que se requeira amostragem, bastando para isso pequenos ajustes, basicamente de forma e n˜ao de conte´udo. As principais etapas de um levantamento por amostragem s˜ao:

1. Explicita¸c˜ao dos objetivos com bastante clareza, a fim de evitar d´uvidas posteriores ou mesmo esquecimentos, devendo ficar bem definida qual a unidade elementar (elemento) ou unidade de an´alise a ser trabalhada.

2. Defini¸c˜ao da popula¸c˜ao a ser amostrada.

(a) Em certas situa¸c˜oes isto pode ser relativamente f´acil, como no caso de se desejar tomar uma amostra de uma popula¸c˜ao de crian¸cas que estejam matriculadas e freq¨uentando certo grupo escolar. Terse- ia uma situa¸c˜ao mais complexa para se estudar gestantes que procuram centros de sa´ude para fazer pr´e-natal.

3. Escolha das vari´aveis a serem observadas em cada unidade de an´alise.

(a) Deve ser verificado se todos os dados que v˜ao ser levantados s˜ao relevantes para a pesquisa e se nenhum dado relevante foi omitido. Existe uma tendˆencia, particularmente ao se trabalhar com popula¸c˜oes humanas, usando question´ario, de se fazer muitas pergun-tas, um grande n´umero das quais nunca s˜ao analisadas. Question´arios longos, em geral, levam a diminuir a qualidade da resposta.

4. Especifica¸c˜ao do grau de precis˜ao desejado.Os resultados de levantamento por amostragem s˜ao sujeitos a incerteza, devido a erros de medida e ao fato de apenas parte da popula¸c˜ao ser examinada. O grau de incerteza pode ser diminu´ıdo tomando-se amostras maiores e empregando-se melhores t´ecnicas ou aparelhos de medida.

5. Escolha dos instrumentos de medida e da forma de abordagem.

(a) Em caso de inqu´eritos sobre nutri¸c˜ao, por exemplo, poder´a haver escolha entre ob-serva¸c˜ao ´unica ou observa¸c˜ao durante sete dias; em estudos antropom´etricos ser´a decidido o tipo de balan¸ca, calibrador e outros aparelhos a serem usados. Question´arios podem ser preenchidos pelo pr´oprio indiv´ıduo ou serem aplicados a cada indiv´ıduo por um en-trevistador treinado.

6. Escolha da unidade amostral, que ´e definida como a menor parte distinta e identific´avel da popula¸c˜ao, para fins de enumera¸c˜ao e sorteio da amostra.

(3)

(a) Uma unidade amostral pode ser o pr´oprio elemento de estudo (crian¸ca, cobaia, ci-dade, trecho da estrada) ou um conjunto de elementos (classe de escola, ninhada, Estado, conjunto de trechos continuados de estrada). As unidades amostrais devem cobrir toda a popula¸c˜ao e n˜ao podem apresentar transvaria¸c˜ao, ou seja, um elemento de estudo n˜ao pode pertencer ao mesmo tempo a mais de uma unidade amostral. `A rela¸c˜ao, lista ou mapa contendo todas as unidades amostrais d´a-se o nome de sistema de referˆencia ou fundamentos da pesquisa.

7. Execu¸c˜ao de prova experimental, prova-piloto ou pr´e-teste.

(a) Nesta etapa ´e feito um verdadeiro ensaio do trabalho a ser desenvolvido, sendo testados os instrumentos de medida, question´ario, pessoal de campo, a sistem´atica proposta, a rea¸c˜ao da popula¸c˜ao. Orienta os reajustes necess´arios e pode dar informa¸c˜oes valiosas sobre poss´ıvel dura¸c˜ao e custo da pesquisa e indica¸c˜oes sobre a variabilidade do fenˆomeno pesquisado, o que permite calcular melhor o tamanho da amostra.

8. Sele¸c˜ao da amostra ap´os decidido qual deve ser o respectivo tamanho. Esta sele¸c˜ao deve ser feita, de preferˆencia, por meio de sorteio do tipo lot´erico.

2.2

Tipos de Amostragem Probabil´ıstica

A amostragem ´e probabil´ıstica quando cada unidade amostral na popula¸c˜ao tem uma proba-bilidade conhecida e diferente de zero de pertencer `a amostra. De outra forma, a amostragem ´e dita n˜ao-probabil´ıstica. Admita-se, por exemplo, que seja definida uma popula¸c˜ao de dez grupos escolares, cada qual com certo n´umero de alunos, desejando-se uma amostra de tama-nho igual a cinco grupos escolares. Se o pesquisador decidiu simplesmente escolher os grupos escolares A, B, C, I, J, ter-se-ia uma amostragem n˜ao-probabil´ıstica.

´

E poss´ıvel, no entanto (e mesmo desej´avel), que o investigador obtenha o n´umero de alunos de cada grupo escolar e fa¸ca um sorteio para obten¸c˜ao das cinco escolas, cada escola tendo uma probabilidade de ser sorteada proporcionalmente ao seu n´umero de alunos; ser´a uma amostragem probabil´ıstica.

A amostragem n˜ao-probabil´ıstica pode prejudicar sensivelmente a validade externa de um estudo, pois muitos fatores podem influir na escolha de uma unidade amostral para pertencer `a amostra, prejudicando sua representatividade em rela¸c˜ao `a popula¸c˜ao. Mesmo assim, existem situa¸c˜oes em que ela ´e usada, havendo ent˜ao interesse em se conhecer algumas formas de amostragem n˜ao-probabil´ıstica:

• por volunt´arios, que ´e bastante usada em ensaios cl´ınicos para teste de novos medicamen-tos;

• intencional, quando as unidades que comp˜oe a amostra s˜ao escolhidas pelo pesquisador; ´e usada na verifica¸c˜ao de polui¸c˜ao de praias;

• por acesso mais f´acil, em que as unidades s˜ao escolhidas por estarem em melhores condi¸c˜oes de acessibilidade.

Veja-se, por exemplo, o caso em que se defina para estudo todo o conjunto de habitantes de uma ´area rural, tendo o domic´ılio como unidade amostral; se o entrevistador escolheu os dez pri-meiros domic´ılios do seu caminho, teremos este tipo de amostragem, tendo sido desconsideradas as outras unidades amostrais que tamb´em pertencem `a popula¸c˜ao.

(4)

2.2.1 Amostragem Casual Simples

Tamb´em conhecida por amostragem ocasional, acidental, casual, randˆomica, etc. A amos-tragem simples ao acaso destaca-se por ser um processo de sele¸c˜ao bastante f´acil e muito usado. Neste processo, todos os elementos da popula¸c˜ao tem igual probabilidade de serem escolhidos, n˜ao s´o antes de ser iniciado, como tamb´em at´e completar-se o processo de coleta. Eis o proce-dimento para seu uso:

1. Devemos numerar todos os elementos da popula¸c˜ao. Se, por exemplo, nossa popula¸c˜ao tem 5.000elementos, devemos numer´a-los de 0000 a 4999 ou, como acontece geralmente, usamos um n´umero que j´a identifica o elemento.

2. Devemos efetuar sucessivos sorteios com reposi¸c˜ao (ou n˜ao) at´e completar o tamanho da amostra (n). Para realizar este sorteio, podemos usar as ”t´abuas de n´umeros aleat´orios”ou ainda preferencialmente, o uso de programas computacionais pr´oprios para estes fins.

Se, durante o sorteio, unidades amostrais j´a sorteadas poderem ser novamente sorteadas, sendo representadas uma, duas ou mais vezes na amostra, ter-se-´a a chamada amostragem casual simples com reposi¸c˜ao.

Em geral, dar-se preferˆencia ao tipo de amostragem casual simples sem reposi¸c˜ao, princi-palmente quando se trata de popula¸c˜oes com reduzido n´umero de unidades amostrais.

2.2.2 Amostragem Sistem´atica:

Trata-se de uma varia¸c˜ao da amostragem aleat´oria simples, conveniente quando a popula¸c˜ao esta ordenada segundo algum crit´erio, como por exemplo, os prontu´arios m´edicos de um hos-pital, uma linha de produ¸c˜ao, os nomes em uma lista telefˆonica, etc.

Consideremos uma popula¸c˜ao, com elementos ordenados, de tamanho N e dela tiramos uma amostra de tamanho n. Ent˜ao, calcula-se o intervalo de amostragem N/n ou o inteiro mais pr´oximo que chamaremos de ”a”. Sorteia-se um n´umero entre 1 e ”a”e seja x esse n´umero.

Formamos, assim, a amostra dos elementos correspondentes aos n´umeros: x; (x + a); (x + 2a); ...; [x + (n − 1)a].

Exemplo 2.1. Seja N = 500 e n = 50. Ent˜ao, a = 500

50 = 10. Sorteia-se um n´umero de 1 a 10.

Seja 3 (x = 3) o n´umero sorteado. Logo, os elementos numerados por 3; 13; 23; 33; ..., 493.

ser˜ao os componentes da amostra.

Exemplo 2.2. Para uma popula¸c˜ao de tamanho N = 32, numerada sequencialmente de 1 a 32, e amostra de tamanho n = 8, tem-se a = 4.

O in´ıcio casual ”x”deve ser sorteado entre 1, 2, 3 e 4; admita-se que tenha sido x = 3. A amostra fica constitu´ıda das unidades amostrais de n´umero (ou ordem):

3; 7; 11; 15; 19; 23; 27; 31.

Pode ser visto que o resultado ´e obtido somando-se sucessivamente o intervalo de amostragem a = 4 a cada n´umero obtido imediatamente antes.

(5)

2.2.3 Amostragem estratificada:

No caso de popula¸c˜ao heterogˆenea, na qual podemos distinguir subpopula¸c˜oes mais ou menos homogˆeneas denominadas estratos, podemos usar a amostragem estratificada.

Estratificar uma popula¸c˜ao ´e dividi-la em L subpopula¸c˜oes denominadas estratos, tais que n1+ n2 + ... + nL= n, onde os estratos s˜ao mutuamente exclusivos.

Ap´os a determina¸c˜ao dos estratos, seleciona-se uma amostra aleat´oria de cada subpopula¸c˜ao. Muitas vezes uma popula¸c˜ao ´e composta de subpopula¸c˜oes (ou estratos) bem definidos, havendo maior homogeneidade entre as unidades amostrais dentro de cada estrato do que entre as unidades amostrais de estratos diferentes. Sexo, idade, condi¸c˜ao s´ocio-econˆomica, s˜ao exemplos t´ıpicos. Nestas condi¸c˜oes, tais estratos devem ser levados em considera¸c˜ao e o sorteio da amostra deve ser feito em cada um deles independentemente; da´ı o nome de amostragem estratificada.

Um caso muito importante da amostragem estratificada ´e aquele em que o pesquisador deseja que as subpopula¸c˜oes sejam representadas na amostra com a mesma proporcionalidade com que comp˜oe a popula¸c˜ao total. Trata-se da situa¸c˜ao denominada amostragem casual simples estratificada com partilha proporcional ou simplesmente amostragem estratificada proporcional. A principal vantagem oferecida por este m´etodo ´e a alta precis˜ao que se pode alcan¸car na estimativa das amostras. O m´etodo consiste em dividir a popula¸c˜ao em grupos relativamente homogˆeneos e mutuamente exclusivos, chamados estratos, e em selecionar amostras aleat´orias simples e independentes de cada estrato. Em seguida, escolher uma amostra aleat´oria simples separada em cada estrato e combinar essas amostras para formar a amostra estratificada.

Por exemplo, suponha-se que se queira fazer um estudo nas ind´ustrias de uma cidade. Sabe-se que as ind´ustrias foram classificadas em grandes, m´edias e pequenas. Assim, ´e conveniente estratificar as ind´ustrias segundo o porte das mesmas, isto ´e:

1o grupo: estrato 1- Grandes Ind´ustrias

2o grupo: estrato 2- M´edias Ind´ustrias 3o grupo: estrato 3- Pequenas Ind´ustrias

A seguir, retira-se uma amostra aleat´oria simples de cada estrato e comp˜oe a amostra estrati-ficada.

A estratifica¸c˜ao de uma popula¸c˜ao faz sentido quando ´e poss´ıvel identificar sub-popula¸c˜oes que variam muito entre si no que diz respeito `a vari´avel em estudo, mas que variam pouco dentro de cada estrato. Nestas condi¸c˜oes, uma amostra estratificada pode fornecer resultados mais precisos do que uma amostra simples extra´ıda do conjunto da popula¸c˜ao.

2.2.4 Amostragem por Conglomerados

Mais simples seria cham´a-la de amostragem por grupos. O termo “conglomerados” (cluster) designa grupos j´a existentes na popula¸c˜ao, e j´a cadastrados.

Se tivermos interessados por exemplo, no sal´ario m´edio dos oper´arios da ind´ustria automo-bil´ıstica, podemos selecionar uma montadora e, dentro dela, estudar os sal´arios.

H´a uma mudan¸ca fundamental na unidade de sorteio. Passamos de elemento para grupo. Consideramos conglomerados os grupos de elementos com as seguintes caracter´ısticas:

• dentro de cada conglomerado h´a uma grande heterogeneidade, ou ent˜ao uma grande variabilidade;

• entre os conglomerados h´a uma uma pequena variabilidade, ou ent˜ao uma grande homo-geneidade.

(6)

2.3

Determina¸

ao do Tamanho da amostra

O tamanho da amostra e a maneira de selecionar uma amostra precisa de uma popula¸c˜ao s˜ao duas das principais dificuldades encontradas nos trabalhos de levantamento amostral. A obten¸c˜ao de uma boa amostra depende basicamente do n´umero de observa¸c˜oes amostradas e do m´etodo com que essas observa¸c˜oes foram selecionadas.

A determina¸c˜ao do tamanho de uma amostra ´e problema de grande importˆancia, porque: • Amostras desnecessariamente grandes acarretam desperd´ıcio de tempo e de dinheiro; • Amostras excessivamente pequenas podem levar a resultados n˜ao confi´aveis.

O tamanho da amostra ´e fornecido pela rela¸c˜ao entre o n´ıvel de confian¸ca com que o pesqui-sador deseja trabalhar, a precis˜ao que requer em sua estimativa e o desvio padr˜ao da popula¸c˜ao. O tamanho da amostra para estimar a m´edia de uma popula¸c˜ao pode ser obtida de duas maneiras: 1. Popula¸c˜ao Infinita: n = Z σ E 2 Onde: n = tamanho da amostra.

Z = valor cr´ıtico que corresponde ao n´ıvel de confian¸ca desejado da curva normal padr˜ao. σ= desvio-padr˜ao populacional da vari´avel estudada.

E = margem de erro ou erro m´aximo de estimativa. Identifica a diferen¸ca m´axima entre a m´edia amostral( ¯X) e a verdadeira m´edia populacional (µ), isto ´e, |µ − ¯x| < E.

2. Popula¸c˜ao Finita:

n = N σ

2Z2

(N − 1)E2+ σ2(Z2)

Onde:

N = tamanho da popula¸c˜ao. n = tamanho da amostra.

Z = valor cr´ıtico que corresponde ao n´ıvel de confian¸ca desejado da curva normal padr˜ao. σ= desvio-padr˜ao populacional da vari´avel estudada.

E = margem de erro ou erro m´aximo de estimativa. Identifica a diferen¸ca m´axima entre a m´edia amostral( ¯X) e a verdadeira m´edia populacional (µ), isto ´e, |µ − ¯x| < E.

Quando se trabalha com propor¸c˜oes, o c´alculo do tamanho da amostra ´e dado pelas seguintes express˜oes: 1. Popula¸c˜ao Infinita: n = Z 2ˆq E2 Onde: n = tamanho da amostra ˆ

p= estimativa da verdadeira propor¸c˜ao populacional de indiv´ıduos que pertence a cate-goria que estamos interessados em estudar.

ˆ

q= estimativa da propor¸c˜ao populacional de indiv´ıduos que N ˜AO pertence `a categoria que estamos interessados em estudar (ˆq = 1 − ˆp).

E = Margem de erro ou erro m´aximo de estimativa. Identifica a diferen¸ca m´axima entre a propor¸c˜ao amostral (ˆp)e a verdadeira propor¸c˜ao populacional (p) isto ´e, |p − ˆp| < E.

(7)

2. Popula¸c˜ao Finita:

n = N ˆpˆq Z

2

(N − 1)E2+ ˆq(Z2)

Onde:

N = tamanho da popula¸c˜ao. n = tamanho da amostra ˆ

p= estimativa da verdadeira propor¸c˜ao populacional de indiv´ıduos que pertence a cate-goria que estamos interessados em estudar.

ˆ

q= estimativa da propor¸c˜ao populacional de indiv´ıduos que N ˜AO pertence `a categoria que estamos interessados em estudar (ˆq = 1 − ˆp).

E = Margem de erro ou erro m´aximo de estimativa. Identifica a diferen¸ca m´axima entre a propor¸c˜ao amostral (ˆp)e a verdadeira propor¸c˜ao populacional (p) isto ´e, |p − ˆp| < E. Se “ˆp00 e “ˆq00 n˜ao forem conhecidos determinamos que se substituam os valores ˆp e ˆq por 0, 5, obtendo a seguinte estimativa:

n = [Z

2]0, 25

E2

Para se determinar o tamanho da amostra quando se trabalha com mais de uma vari´avel, deve-se analisar o question´ario, e escolher a vari´avel mais importante para o estudo. Se poss´ıvel, escolha mais de uma vari´avel, calcule o tamanho para cada vari´avel e opte pelo maior n obtido.

Eis alguns exemplos:

Exemplo 2.3. Suponha que a vari´avel escolhida num estudo seja o peso de certa pe¸ca e que a popula¸c˜ao ´e infinita. Pelas especifica¸c˜oes do produto, o desvio padr˜ao ´e de 10kg. Logo, admitindo-se uma n´ıvel de confian¸ca de 95, 5% e um erro amostral de 1, 5kg, tem-se:

σ = 10; E = 1, 5; (1 − α)% = 95, 5% ⇒ Z = 2 n = Z σ E 2 = 2 × 10 1, 5 2 ∼ = 178

Assim, uma amostra aleat´oria simples de 178 pe¸cas, h´a um erro m´aximo de 1, 5kg para construir um IC para o peso m´edio, com n´ıvel de confian¸ca de 95, 5%

Exemplo 2.4. Admita os mesmos dados do exemplo anterior e que a popula¸c˜ao seja finita de 600 pe¸cas. Logo:

n = N σ

2Z2

(N − 1)E2+ σ2(Z2) =

600 10222

Referências

Documentos relacionados

A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se A espectrofotometria é uma técnica quantitativa e qualitativa, a qual se baseia no fato de que uma

A análise dos dados meteorológicos foi dividida em três etapas a partir de um esquema de decomposição temporal-cronológica, iniciando pela série de dados de longo

o transferência interna: poderá requerer transferência interna o aluno que esteja regularmente matriculado na Universidade no semestre em que solicitar a transferência e

A Seqüência de Três Níveis oferece um quadro mais amplo de uma situação e pode ser útil para fazer perguntas a respeito da situação de pessoas que não estão fisicamente

As pontas de contato retas e retificadas em paralelo ajustam o micrômetro mais rápida e precisamente do que as pontas de contato esféricas encontradas em micrômetros disponíveis

No entanto, expressões de identidade não são banidas da linguagem com sentido apenas porque a identidade não é uma relação objetiva, mas porque enunciados de identi- dade

Esses procedimentos, todos eles interrelacionados e definidos a partir da matriz teórica que fundamenta o nosso processo de investigação, envolvem: primeiro, a reafirmação

Com o objetivo de padronizar o critério de provisão para contingências cíveis entre as empresas do grupo Cetelem, a partir de Junho de 2012, o cálculo de