Capítulo
9
Amostragem
Desenvolvimento
9.1 – Introdução
9.2 – Censo versus Amostra
9.3 – Processo de planejamento de uma amostragem 9.4 – Técnicas Amostrais
9.5 – Amostragem Não-probabilística 9.6 – Amostragem Probabilística
9.7 – Determinação do Tamanho da Amostra 9.8 – Cálculo Amostral
9.9 – Notações utilizadas no cálculo do tamanho da amostra
9.1 – Introdução
Vamos iniciar nossa aula de hoje com algumas definições já conhecidas dos senhores:
População: É a soma de todos elementos que compartilham algum conjunto comum de característica, conforme o universo propósito do problema. Resumiríamos assim: População é o “todo”.
Censo: Enumeração completa dos elementos de uma população. Amostra: É um sub-conjunto da população.
È com isso que vamos tratar daqui por diante: “A Amostra”, e em conseqüência temos que o processo de colher amostras de uma população chama-se “Amostragem”, e podemos afirmar que todo esse capítulo nada mais é que um estudo estatístico.
Em realidade, a idéia básica da amostragem é coletar dados de uma amostra, cientificamente calculada, e sua análise fornecer informações precisas a cerca da população. Isto se chama “Inferência Estatística”.
Quando nos deparamos com um projeto de pesquisa, pensamos: que caminho seguir, trabalhar com toda a população (isto se chama censo) ou trabalhar com uma amostra (amostragem). O que é melhor Censo ou Amostra?
9.2 – Censo x Amostra
Há vantagens de se amostrar, como também há vantagens de se realizar o censo, por exemplo: quando a população for muito pequena é mais seguro e confiável realizar o censo. Numa sala de 40 alunos, desejo saber quem fuma e quem não fuma, é mais fácil e seguro realizar o censo.
Por outro lado numa fábrica de fósforo obrigatoriamente temos que testar e medir a qualidade do produto por amostragem. Chega até ser engraçado você pensar em realizar um censo nesta mesma fábrica, pois simplesmente não sobraria nenhum fósforo para comercializar.
Outro exemplo: quando você prepara aquela bebida tipicamente brasileira, a caipirinha, feita em grande quantidade para servir num dia de feijoada para todos os seus amigos e colegas, pergunto você bebe toda a caipirinha ou apenas prova. Logo você está amostrando.
Realizamos o censo também se houver imposição legal.
A tabela abaixo resume as condições que favorecem a utilização da amostra em relação ao censo:
Amostra ou Censo
Condições que favorecem o uso de
Amostra Censo
1. Orçamento Pequena Grande
2. Tempo disponível Curto Longo
3. Tamanho da população Grande Pequeno
4. Variância da característica Pequena Grande 5. Custo de erro de amostragem Baixo Alto
6. Custo de erros não amostrais Alto Baixo
7. Natureza da medição Destrutiva Não-destrutiva
8. Atenção a casos individuais. sim Não
9.3 – Processo de Planejamento de uma Amostragem
O processo de planejamento de uma amostragem, segundo Naresh, inclui 5 estágios. Eles estão inter-relacionados, desde a problematização até a apresentação dos resultados.
Definir a população
Determinação da estrutura Amostral
Escolha da Técnica Amostral
Determinar o tamanho da Amostra
Executar o Processo
Definir a População
Consiste em estabelecer um uma população-alvo. Este é o primeiro passo, e tem que ser feito com precisão. A escolha errada de uma população-alvo resulta sempre em uma pesquisa desorientadora, o que é uma catástrofe.
Determinação da estrutura Amostral
Consiste em representar os elementos que compõe a população-alvo. Um exemplo disto é a lista telefônica.
Escolha da Técnica Amostral
O pesquisador deverá decidir qual a técnica que utilizará: amostragem probabilística ou não-probabilística. Veremos a frente com detalhes.
Determinação do Tamanho da amostra
O pesquisador deverá calcular qual o tamanho da amostra; qual o número de elementos retirados do público-alvo que fornecerá a fidedignidade necessária para inferir sobre a população.
9.4 – Técnicas Amostrais
As técnicas amostrais ou técnicas de amostragem podem ser classificadas como “Amostragem Não-probabilística e Amostragem Probabilística”. Vejamos o organograma a seguir:
9.5 – Amostragem Não-probabilística
Esta técnica consiste em não utilizar uma seleção aleatória da população-alvo e sim na confiança pessoal do pesquisador. Segundo Naresh, as amostras não-probabilísticas podem oferecer boas estimativas das características da população, mas não permitem uma avaliação objetiva da precisão dos resultados amostrais. As técnicas
Técnicas de Amostragem Não-probabilística Probabilística Por Cotas Por Julgamento Por Conveniência Aleatória Simples
de amostragem não-probabilística comumente usadas se dividem em amostragem por julgamento, amostragem por quotas e amostragem por conveniência.
Amostragem não-probabilística por Conveniência:
Obtém-se uma amostra de elementos convenientes, ou seja, que estão a seu dispor. Os elementos estão no lugar exato e no memento certo.
Exemplos:
Questionários aplicados (destacados) em sites da Internet Questionários aplicados em Shopping Center
Questionários aplicados à lista de clientes de determinada loja, etc...
Amostragem não-probabilística por Julgamento:
Não deixa de ser uma variável da amostra não-probabilística por conveniência, só que neste caso a escolha dos selecionados é feita com base no julgamento do pesquisador.
Exemplo:
A rede Mac Donald lançará um novo tipo de Mc Lanche. Foi selecionado o estabelecimento da Av. Bartolomeu de Gusmão, em Santos-SP, com base em critérios de julgamento do pesquisador contratado.
Amostragem não-probabilística por Cotas:
Segundo a Professora Beatriz, o pesquisador procura uma amostra que se identifique em alguns aspectos com o universo. Esta identificação pode estar ligada ao sexo, idade, etc...
Exemplo:
Um determinado pesquisador fará uma pesquisa de opinião sobre o carro “Honda Accord”, para pessoas da classe A, de faixas etárias variáveis de 35 a 60 anos.
9.6 – Amostragem Probabilística
Aquela em que cada elemento da população tem uma chance conhecida e diferente de zero de ser selecionado para compor a amostra. As amostragens probabilísticas geram amostras probabilísticas. Podem ser: Aleatórias Simples, Estratificada, Sistemáticas e por Conglomerado.
Amostra Probabilística Aleatória Simples:
É feita uma escolha aleatória dos elementos que farão parte da amostra aplicando a Tabela de Números Aleatórios. Utiliza-se comumente o sorteio aleatório disponível em planilhas eletrônicas como o Excel. É impraticável quando a população for muito grande, entretanto é a técnica mais indicada para se obter uma amostra representativa da população.
Amostra Probabilística Estratificada:
Para a Professora Beatriz a amostra probabilística estratificada é aplicada quando há a necessidade de subdividir a população em estratos homogêneos, como, por exemplo, por classe social, idade, sexo etc. Determinados os estratos, os elementos da amostra são selecionados pela técnica probabilística simples. Segundo o professor Mattar, nessa categoria de amostragem ainda podemos ter uma variância de estratificação, ou seja, torná-la proporcional ou não.
Amostra Probabilística Sistemática
Segundo Naresh Malhotra, escolhe-se uma amostra e selecionando um ponto de partida aleatório e, em seguida, extraindo cada i-ésimo elemento sucessivamente da minha estrutura amostral. O intervalo amostral i é determinado dividindo o tamanho N da população pelo tamanho n da minha amostra. Por exemplo:
População : 10.000 Amostra: 1000 logo N/n = 10 Cada traço vertical abaixo representa um domicílio:
1 2 3 4 5 6 7 8 9 10 11 12 13 14
Começa-se aleatoriamente com a terceira unidade da amostra que pode ser uma pessoa, um domicílio etc., em seguida passa-se para a 13ª e assim sucessivamente, somando-se o valor do intervalo calculado.
se influenciam e que, utilizando-se um intervalo para aplicação dos questionários, diminuem as possíveis distorções provenientes dessa influência.
Amostra Probabilística por conglomerado:
“A técnica probabilística por conglomerado requer a utilização de mapas de regiões, estados, municípios e cidades, pois, para a seleção da amostra, há subdivisão da área a ser pesquisada por bairros, quarteirões e domicílios, que serão sorteados para composição dos elementos da amostra, e a pesquisa será realizada de forma sistemática para que não haja interferência nas informações”.(SAMARA & BARROS,2002)
Por exemplo, se desejamos fazer uma pesquisa em um bairro de sua cidade, em primeiro lugar dividimos o bairro por quarteirões, em seguida identificamos a população do quarteirão e então estabelecemos o intervalo por meio da fórmula da técnica probabilística sistemática já conhecida.
9.7 – Determinação do Tamanho da Amostra
Chegamos ao passo mais importante da nossa aula: o cálculo amostral. Logicamente vamos nos ater a apenas às fórmulas estatísticas mais usadas para o referido cálculo amostral.
Para o cálculo do tamanho da amostra partimos do princípio que a população e a amostra tem uma distribuição normal de freqüência (curva normal ou curva simétrica), e ainda há a presença do desvio-padrão e das principais medidas de tendência central, que são a média aritmética, a mediana e a moda.
Desta maneira temos que recordar 2 pontos principais: O desvio-padrão (medidas de posição) e distribuição normal de probabilidade. Estão lembrados?
9.8 – Cálculo Amostral
Vimos e recordamos o que é um desvio-padrão, a distribuição normal de probabilidade, e esteja certo que estão prontos para determinarmos o tamanho da amostra.
Vejamos o que diz a Professora Beatriz Sâmara e o Professor José Carlos: “Em pesquisa, o número de desvios utilizados representará a margem de segurança dada ao cálculo da amostra, influindo diretamente na sua amplitude, pois, quanto maior a margem
de segurança, ou intervalo de confiança, maior será a amostra. Em pesquisa, é usual a utilização das seguintes margens de segurança e respectivos desvios padrões:”.
68% - Z = 1 95% - Z = 1,96 95,5% - Z = 2 99,7 % - Z = 3 Vejamos o gráfico:
Também utilizamos, além dos conceitos de desvio-padrão e de normalidade, o conceito de erro amostral, que indica uma proporção da minha amostra que estará fora dos valores previstos. Por exemplo: Se realizarmos uma pesquisa com um erro amostral de 3%, isto quer dizer que em nossos resultados devemos considerar que há uma variação de ± 3%. Isto lembra eleições.
9.9 – Notações utilizadas no cálculo do tamanho das amostras
N = Universo. Todas as pessoas que detém a informação procurada n = Amostra. Parte representativa do universo.
68.26 % 99.73 % µ µ+σ µ+3σ µ+2σ µ-σ µ-2σ µ-3σ 95.46 %
p = Proporção ou porcentagem dos elementos da amostra favorável ao atributo pesquisado.
q = Proporção ou porcentagem dos elementos da amostra desfavorável ao atributo pesquisado.
σp = erro amostral Onde p + q = 100%
Resta sabermos se a população é infinita ou finita. Para alguns autores uma população infinita é acima de 100.000, já para SAMARA & BARROS, nosso livro texto, população infinita é acima de 10.000.
Portanto vamos adotar a linha do nosso livro texto.
População FINITA
Quando o universo é igual e/ou menor que 10 mil
População INFINITA
Quando o universo é desconhecido ou maior que 10 mil
Exemplo 1:
Deseja-se fazer uma pesquisa para saber a aceitação de um novo produto no mercado. Determine o número de pessoas que devem ser entrevistados com 5% de erro e 94% de segurança. ? n= ?
σ
p
p q
n
Z
n
=
−
−
.
.
.
1
σ
p
p q
n
Z
=
.
.
N = desconhecido (infinito) p = 50%
q = 50%
Como não sabemos quem será favorável ou desfavorável, então estimamos 50% para os atributos.
σp = 5%
94% de segurança = consultando a tabela para uma área de 94/2 = 47% ou 0,47000 vai encontrar um Z: 1,88
z
0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09 1,7 0,45543 0,45637 0,45728 0,45818 0,45907 0,45994 0,46080 0,46164 0,46246 0,46327 1,8 0,46407 0,46485 0,46562 0,46638 0,46712 0,46784 0,46856 0,46926 0,46995 0,47062 1,9 0,47128 0,47193 0,47257 0,47320 0,47381 0,47441 0,47500 0,47558 0,47615 0,47670 2,0 0,47725 0,47778 0,47831 0,47882 0,47932 0,47982 0,48030 0,48077 0,48124 0,48169 2,1 0,48214 0,48257 0,48300 0,48341 0,48382 0,48422 0,48461 0,48500 0,48537 0,48574 2,2 0,48610 0,48645 0,48679 0,48713 0,48745 0,48778 0,48809 0,48840 0,48870 0,48899 3,4 0,49966 0,49968 0,49969 0,49970 0,49971 0,49972 0,49973 0,49974 0,49975 0,49976 3,5 0,49977 0,49978 0,49978 0,49979 0,49980 0,49981 0,49981 0,49982 0,49983 0,49983 3,6 0,49984 0,49985 0,49985 0,49986 0,49986 0,49987 0,49987 0,49988 0,49988 0,49989 3,7 0,49989 0,49990 0,49990 0,49990 0,49991 0,49991 0,49992 0,49992 0,49992 0,49992 3,8 0,49993 0,49993 0,49993 0,49994 0,49994 0,49994 0,49994 0,49995 0,49995 0,49995 3,9 > etc ...Logo, introduzindo esses dados na fórmula teremos:
88 1 50 50 5= × × , n 25 n = 2500 x 3,534 25 n = 8836 n = 353,44 n = 354 Exemplo 2:
Seja agora o exemplo de uma pesquisa que tenha por objetivo verificar quantos dos 10.000 empregados de uma fábrica são sindicalizados. Presume-se que esse número
não seja superior a 30% do total, deseja-se um nível de confiança de 95,5% e tolera-se um erro de até 3%. n= ? N = 10.000 (finito) p = 30% q = 70% σp = 3%
95,5% de segurança = consultando a tabela para uma área de 95,5/2 = 47,75% ou 0,47750 vai encontrar um Z: 2,00 1 10000 10000 70 30 3 − − × × × = Z n n 98391n = 84000000 n = 854 Bibliografia:
1) SAMARA, Beatriz Santos. Pesquisa de Marketing. Editora Prentice Hall. 2003. 2) MALHOTRA, Naresh. Pesquisa de Marketing. Editora Bookman. 2001
3) MATTAR, Fauze. Pesquisa de Marketing. Editora Atlas. 1998 4) TOLEDO & OVALLE. Estatística Básica. Editora Atlas
5) OSVALDO TANAKA. Estatística Conceitos Básicos. Editora Makron Books 6) ARNOT CRESPO. Estatística Fácil. Editora Saraiva
7) ALMEIDA, Elizabeth Gomes. Estatística para Concursos. São Paulo: Pró-concurso. 2002