IFBA
Probabilidade e Estat´ıstica
Vers˜ao 1Allan de Sousa Soares
Gradua¸c˜ao: Licenciatura em Matem´atica - UESB Especiliza¸c˜ao: Matem´atica Pura - UESB
Mestrado: Matem´atica Pura - UFMG
Vit´oria da Conquista - BA 2015
Aula 17
Pesquisas estat´ısticas, em geral, s˜ao realizadas estudando-se uma amostra extra´ıda da popula¸c˜ao que se pretende es-tudar. Fatores como tempo para a realiza¸c˜ao da pesquisa e seu custo tornam, na grande maioria das vezes, invi´avel o estudo de toda a popula¸c˜ao. Contudo, pode-se ainda ter boa representatividade tomando-se parte da popula¸c˜ao (amostra). Para tanto precisaremos observar:
a) O tamanho da amostra; b) A composi¸c˜ao da Amostra.
0.1
Dimensionamento da Amostra
O dimensionamento depender´a de dois fatores: a.1) o tipo de vari´avel: cont´ınua ou nominal/ordinal; a.2) o tamanho da popula¸c˜ao: finita ou infinita(muito grande).
? Para vari´aveis cont´ınuas e popul¸c˜ao infinita, temos: n = Z.σ
d 2
? Para vari´aveis cont´ınuas e popul¸c˜ao finita, temos:
n = Z
2.σ2.N
d2(N − 1) + Z2σ2
onde
N ´e o tamanho populacional;
Z ´e abscissa da curva normal padr˜ao; σ ´e o desvio padr˜ao populacional;
d ´e o erro amostral, expresso na unidade da vari´avel. O erro amostral ´e a m´axima diferen¸ca que o investigador admite suportar entre µ e x, isto ´e, |x − µ| < d.
Em alguns casos, n˜ao temos o conhecimento de σ para a determina¸c˜ao amostral. Neste caso temos alguns pro-cedimentos:
i) Assuma que σ ≈ aplitude/4; (TRIOLA, 2013, pg. 87); ii) Comece o processo de coleta da amostra sem o conhec-imento de σ e, com base em v´arios dos primeiros valores, calcule o desvio-padr˜ao normal s e use-o no lugar de σ. Observe que o valor de σ pode ser melhorado fazendo o tamanho amostral se aproximar do ideal `a medida que mais dados v˜ao sendo analisados;
iii) Estime o valor de σ usando os resultados de algum outro estudo feito anteriormente.
Exemplo 1. Suponha que a vari´avel escolhida num estudo seja o peso de certa pe¸ca. Pelas especifica¸c˜oes do produto,
o desvio-padr˜ao ´e de 10 kg. Admitindo um erro amostral de 1, 5 kg, determine o tamanho populacional:
a) considerando uma popula¸c˜ao infinita e um n´ıvel de con-fian¸ca de 95, 5%;
b) considerando uma popula¸c˜ao finita de 600 pe¸ca e um n´ıvel de confian¸ca de 95, 5%;
c) considerando uma popula¸c˜ao infinita e um n´ıvel de con-fian¸ca de 99%;
d) considerando uma popula¸c˜ao finita e um n´ıvel de con-fian¸ca de 99%; Solu¸c˜ao: a) n =2.101,5 2 = 178 b) n = 1,52(600−1)+222.102.6002.102 = 138 c) n =2,57.101,5 2 = 294 d) n = 1,52(600−1)+2,572,572.102.6002.102 = 198
Observa¸c˜ao 2. Observe como o n´ıvel de confian¸ca e o tamanho da popula¸c˜ao finita/infinita modificam os taman-hos amostrais!
? Para vari´aveis nominais ou ordinais e popula¸c˜ao infinita, temos:
n = Z
2pˆˆq
d2
? Para vari´aveis nominais ou ordinais e popula¸c˜ao finita, temos: n = Z 2pˆˆqN d2(N − 1) + Z2pˆˆq onde N ´e o tamanho populacional;
Z ´e a abscissa da curva normal padr˜ao; ˆ
p ´e estimativa da verdadeira propor¸c˜ao de um dos n´ıveis da vari´avel escolhida;
ˆ
q = 1 − ˆp;
d ´e o erro amostral, expresso na unidade da vari´avel. O erro amostral ´e a m´axima diferen¸ca que o investigador admite suportar entre µ e x, isto ´e, |p − ˆp| < d.
Em alguns casos, n˜ao temos qualquer estimativa de ˆ
p. Neste caso, tomamos ˆpˆq como 0, 25, isto ´e, usamos as f´ormulas: n = Z 2.0, 25 d2 n = Z 2.0, 25 d2(N − 1) + Z2.0, 25
Exemplo 3. Suponha que a vari´avel escolhida num estudo seja a propor¸c˜ao de eleitores favor´aveis ao candidato X.
Admita a popula¸c˜ao infinita e que se deseje um n´ıvel de confian¸ca de 99% e um erro amostral de 2%. Determine o tamanho amostral:
a) admitindo uma popula¸c˜ao infinita e que o investigador suspeite que a porcentagem de eleitores favor´aveis seja de 30%.
b) admitindo uma popula¸c˜ao finita de 20000 eleitores e que o investigador suspeite que a porcentagem de eleitores favor´aveis seja de 30%.
c) admitindo uma popula¸c˜ao infinita e que o investigador n˜ao tenha qualquer informa¸c˜ao sobre a propor¸c˜ao de eleitores favor´aveis.
d) admitindo uma popula¸c˜ao finita de 20000 eleitores e que o investigador n˜ao tenha qualquer informa¸c˜ao sobre a propor¸c˜ao de eleitores favor´aveis.
Solu¸c˜ao: a) n = 2,5720,02.0,30.0,702 = 3468; b) n = 0,022(20000−1)+2,572,572.0,30.0,70.200002.0,30.0,70 = 2956 c) n = 2,570,022.0,252 = 4129 d) n = 0,022(20000−1)+2,572,572.0,25.200002.0,25 = 3422
0.2
Composi¸
c˜
ao
da
Amostra
-M´
etodos Probabil´ısticos
Um m´etodo de amostragem ´e dito probabil´ıstico se cada elemento da popula¸c˜ao tenha a mesma probabilidade de ser selecionado, isto ´e, em uma popula¸c˜ao de N in-div´ıduos, a probabilidade de qualquer indiv´ıduo ser se-lecionado deve ser 1/N . Isso garante cientificamente a representatividade de uma amostra a fim de se realizar indu¸c˜oes ou inferˆencias sobre a popula¸c˜ao.
? Amostragem Aleat´oria Simples: ´E o processo mais elementar e frequentemente utilizado. Atribui-se a cada el-emento da popula¸c˜ao um n´umero distinto (se a popula¸c˜ao j´a for numerada utilizam-se esse r´otulos). Efetuam-se su-cessivos sorteios at´e completar-se o tamanho da amostra n. Nestes sorteios utilizam-se as chamadas ”t´abuas de n´umeros aleat´orios”que consistem em tabelas que apre-sentam sequˆencias dos d´ıgitos 0 a 9 distribu´ıdos aleatori-amente.
Exemplo 4. Suponhamos uma popula¸c˜ao com N = 1000 elementos, numerada de 000 a 999. Escolhendo uma posi¸c˜ao
de qualquer linha da tabela de n´umeros aleat´orios, faz-se o sorteio, ou faz-seja, retiram-faz-se conjuntos de trˆes algar-ismos para se escolherem os elementos que ir˜ao compor a amostra. Assim, imagine que a sequˆecia dos d´ıgitos eleat´orios seja:
385 559 555 432 886...
Dessa forma, os n´umeros sorteados s˜ao 385 − 559 − 555 − 432....
Para entender melhor veja (FONSECA, 1996, pg.318). No nosso exemplo foi tomada a segunda linha correspon-dente aos seguintes d´ıgitos:
38555 95554 32886 59780.... [385][55 9][555][4 32][886] [597][80....
Observa¸c˜ao 5. Se o n´umero sorteado superar o maior n´umero dos elementos rotulados, abandona-se o n´umero sorteado, prosseguindo o processo. Se o n´umero for repetido, conv´em abandon´a-lo. Se os d´ıgitos aleat´orios de uma linha n˜ao s˜ao suficientes v´aa para a pr´oxima.
? Amostragem Sistem´atica: Trata-se de uma varia¸c˜ao da amostragem aleat´oria simples, conveniente quando a popula¸c˜ao est´a ordenada segundo algum crit´erio, como fichas em um fich´ario, listas telefˆonicas etc. Calcula-se o intervalo de amostragem N/n aproximando-o para o inteiro mais pr´oximo a. Utilizando a t´abua de n´umeros aleat´orios, sorteia0se um n´umero x entre 1 e a, formando-se a amostra dos elementos correspondentes aos n´umeros x, x + a, x + 2a, ...
Exemplo 6. Por exemplo, seja N = 1000, n = 200. Logo,
a =N n =
1000 200 = 5
Imagine que trˆes seja o n´umero sorteado entre 1 e 5. Por-tanto, os elementos da popula¸c˜ao numerados por 3, 8, 18, ..., 998 ir˜ao compor a amostra.
? Amostragem Estratificada: Subdividimos a popula¸c˜ao, em pelo menos dois subgrupos (ou estratos), de modo que sujeitos no mesmo subgrupo compartilhem as mes-mas caracter´ısticas e, em seguida, extra´ımos uma amostra aleat´oria simples de cada subgrupo. As vari´aveis de es-tratifica¸c˜ao mais comuns s˜ao: classe social, idade, sexo,
profiss˜ao ... ou qualquer outro atributo que revele os es-tratos dentro da popula¸c˜ao.
? Amostragem por Conglomerado: Primeiro dividi-mos a ´area da popula¸c˜ao em se¸c˜oes (ou conglomerados), depois selecionamos aleatoriamente alguns desses conglom-erados e, a seguir, escolhemos todos os membros desses conglomerados selecionados.
Exemplo 7. Num levantamento da popula¸c˜ao de uma cidade, podemos dispor do mapa indicando cada quarteir˜ao e n˜ao dispor de uma rela¸c˜ao atualizada dos seus moradores. Pode-se, ent˜ao, escolher uma amostra dos quarteir˜oes e fazer uma contagem completa de todos os que residem naqueles quarteir˜oes sorteados.
Observa¸c˜ao 8. ´E f´acil confundir amostragem estratifi-cada com a amostragem por conglomerado uma vez que ambas envolvem a forma¸c˜ao de subgrupos da popula¸c˜ao. Por´em, a amostragem por conglomerado usa todos os mem-bros de uma amostra de conglomerados, equanto que a amostragem estratificada usa uma amostra de membros de todos os extratos. Para maiores detalhes veja o Exemplo 3 (TRIOLA, 2013, pg.23).
0.3
Exerc´ıcios
1) Dada a seguinte popula¸c˜ao (renda em $ 1000)
29 06 34 12 15 31 34 20 08 30 08 15 24 22 35 31 25 26 20 10 30 04 16 21 14 21 16 18 20 12 31 20 12 18 12 25 26 13 10 05 13 19 30 17 25 29 25 28 32 15 10 21 18 07 16 14 11 22 21 36 32 17 15 13 08 12 23 25 13 21 05 12 32 21 10 30 30 10 14 17 34 22 30 48 19 12 08 07 15 20 26 25 22 30 33 14 17 13 10 09
a) Calcule o tamanho de uma amostra para se estimar a m´edia, sendo d = $ 2000, σ = 7000 e 1 − α = 95%; b) Retire uma amostra aleat´oria simples considerando o
tamanho obtido no item a);
c) Agrupe os elementos da amostra em classe; d) Calule sua m´edia;
e) Calcule o desvio-padr˜ao amostral;
f) Calcule a m´edia da popula¸c˜ao e verifique se |µ − x| < d. g) Repita os itens b), c), d), e) e f) considerando uma outra amostra simples.
2) A Internet est´a nos afetando de muitas maneiras difer-entes, de modo que h´a in´umeras raz˜oes para se estimar a propor¸c˜ao de adultos que a usam. Suponha que o gerente de uma E-Bay deseje determinar a porcentagem atual de adultos dos Estados Unidos que usam a Internet. Quan-tos adulQuan-tos devem ser entrevistados apara se ter 95% de confian¸ca em que a porcentagem amostral esteja em erro n˜ao superior a trˆes pontos percentuais (d = 3% = 0, 03)? a) Use o resultado de uma pesquisa do Pew Research Cen-ter: Em 2006, 73% dos adultos americanos usavam Inter-net.
b) Suponha que n˜ao tenhamos nenhuma informa¸c˜ao pr´evia que sugira um poss´ıvel valor da propor¸c˜ao.
3) Suponha que desejamos estimar o QI m´edio para a pop-ula¸c˜ao de estudantes de estat´ıstica. Quantos estudantes de estat´ıstica devem ser selecionados aleatoriamente para os testes de QI, se desejamos estar 95% confiantes em que a m´edia amostral estar´a a menos de trˆes pontos do QI m´edia populacional (d = 3)? Assuma que o desvio padr˜ao populacional seja σ = 15 (TRIOLA, 2013, pg. 284-285).
REPOSTAS: 1.1) a) n = 34
b) Partindo da terceira linha da tabela de d´ıgitos aleat´orios (FONSECA, 1996, pg. 318) e considerando os itens do exerc´ıcio sendo postos na ordem
29 −→ primeiro, 06 −→ segundo, ... temos a seguinte amostra (confira):
12 15 30 15 14 20 12 12 13 10 05 30 28 18 07 16 14 36 17 12 13 12 34 22 30 19 07 15 30 33 14 13 10 09
c) Classe Fi 05| − 11 6 11| − 17 15 17| − 23 5 23| − 29 1 29| − 35 6 35| − 41 1 d) x ≈ 18, 1 (com base na tabela) e) S ≈ 8, 7 (com base na tabela) f) µ = 19, 6 ⇒ |18, 1 − 19, 6| = 1, 5 < 2 g) m˜aos a obra!!!
2) a) 842 b) 1068
3) amostra composta por 97 estudante entre os milhares de estudantes de estat´ıstica.