• Nenhum resultado encontrado

Probabilidade e Estatística

N/A
N/A
Protected

Academic year: 2021

Share "Probabilidade e Estatística"

Copied!
5
0
0

Texto

(1)

IFBA

Probabilidade e Estat´ıstica

Vers˜ao 1

Allan de Sousa Soares

Gradua¸c˜ao: Licenciatura em Matem´atica - UESB Especiliza¸c˜ao: Matem´atica Pura - UESB

Mestrado: Matem´atica Pura - UFMG

Vit´oria da Conquista - BA 2015

(2)

Aula 17

Pesquisas estat´ısticas, em geral, s˜ao realizadas estudando-se uma amostra extra´ıda da popula¸c˜ao que se pretende es-tudar. Fatores como tempo para a realiza¸c˜ao da pesquisa e seu custo tornam, na grande maioria das vezes, invi´avel o estudo de toda a popula¸c˜ao. Contudo, pode-se ainda ter boa representatividade tomando-se parte da popula¸c˜ao (amostra). Para tanto precisaremos observar:

a) O tamanho da amostra; b) A composi¸c˜ao da Amostra.

0.1

Dimensionamento da Amostra

O dimensionamento depender´a de dois fatores: a.1) o tipo de vari´avel: cont´ınua ou nominal/ordinal; a.2) o tamanho da popula¸c˜ao: finita ou infinita(muito grande).

? Para vari´aveis cont´ınuas e popul¸c˜ao infinita, temos: n = Z.σ

d 2

? Para vari´aveis cont´ınuas e popul¸c˜ao finita, temos:

n = Z

22.N

d2(N − 1) + Z2σ2

onde

N ´e o tamanho populacional;

Z ´e abscissa da curva normal padr˜ao; σ ´e o desvio padr˜ao populacional;

d ´e o erro amostral, expresso na unidade da vari´avel. O erro amostral ´e a m´axima diferen¸ca que o investigador admite suportar entre µ e x, isto ´e, |x − µ| < d.

Em alguns casos, n˜ao temos o conhecimento de σ para a determina¸c˜ao amostral. Neste caso temos alguns pro-cedimentos:

i) Assuma que σ ≈ aplitude/4; (TRIOLA, 2013, pg. 87); ii) Comece o processo de coleta da amostra sem o conhec-imento de σ e, com base em v´arios dos primeiros valores, calcule o desvio-padr˜ao normal s e use-o no lugar de σ. Observe que o valor de σ pode ser melhorado fazendo o tamanho amostral se aproximar do ideal `a medida que mais dados v˜ao sendo analisados;

iii) Estime o valor de σ usando os resultados de algum outro estudo feito anteriormente.

Exemplo 1. Suponha que a vari´avel escolhida num estudo seja o peso de certa pe¸ca. Pelas especifica¸c˜oes do produto,

o desvio-padr˜ao ´e de 10 kg. Admitindo um erro amostral de 1, 5 kg, determine o tamanho populacional:

a) considerando uma popula¸c˜ao infinita e um n´ıvel de con-fian¸ca de 95, 5%;

b) considerando uma popula¸c˜ao finita de 600 pe¸ca e um n´ıvel de confian¸ca de 95, 5%;

c) considerando uma popula¸c˜ao infinita e um n´ıvel de con-fian¸ca de 99%;

d) considerando uma popula¸c˜ao finita e um n´ıvel de con-fian¸ca de 99%; Solu¸c˜ao: a) n =2.101,5 2 = 178 b) n = 1,52(600−1)+222.102.6002.102 = 138 c) n =2,57.101,5  2 = 294 d) n = 1,52(600−1)+2,572,572.102.6002.102 = 198

Observa¸c˜ao 2. Observe como o n´ıvel de confian¸ca e o tamanho da popula¸c˜ao finita/infinita modificam os taman-hos amostrais!

? Para vari´aveis nominais ou ordinais e popula¸c˜ao infinita, temos:

n = Z

2ˆq

d2

? Para vari´aveis nominais ou ordinais e popula¸c˜ao finita, temos: n = Z 2ˆqN d2(N − 1) + Z2ˆq onde N ´e o tamanho populacional;

Z ´e a abscissa da curva normal padr˜ao; ˆ

p ´e estimativa da verdadeira propor¸c˜ao de um dos n´ıveis da vari´avel escolhida;

ˆ

q = 1 − ˆp;

d ´e o erro amostral, expresso na unidade da vari´avel. O erro amostral ´e a m´axima diferen¸ca que o investigador admite suportar entre µ e x, isto ´e, |p − ˆp| < d.

Em alguns casos, n˜ao temos qualquer estimativa de ˆ

p. Neste caso, tomamos ˆpˆq como 0, 25, isto ´e, usamos as f´ormulas: n = Z 2.0, 25 d2 n = Z 2.0, 25 d2(N − 1) + Z2.0, 25

Exemplo 3. Suponha que a vari´avel escolhida num estudo seja a propor¸c˜ao de eleitores favor´aveis ao candidato X.

(3)

Admita a popula¸c˜ao infinita e que se deseje um n´ıvel de confian¸ca de 99% e um erro amostral de 2%. Determine o tamanho amostral:

a) admitindo uma popula¸c˜ao infinita e que o investigador suspeite que a porcentagem de eleitores favor´aveis seja de 30%.

b) admitindo uma popula¸c˜ao finita de 20000 eleitores e que o investigador suspeite que a porcentagem de eleitores favor´aveis seja de 30%.

c) admitindo uma popula¸c˜ao infinita e que o investigador n˜ao tenha qualquer informa¸c˜ao sobre a propor¸c˜ao de eleitores favor´aveis.

d) admitindo uma popula¸c˜ao finita de 20000 eleitores e que o investigador n˜ao tenha qualquer informa¸c˜ao sobre a propor¸c˜ao de eleitores favor´aveis.

Solu¸c˜ao: a) n = 2,5720,02.0,30.0,702 = 3468; b) n = 0,022(20000−1)+2,572,572.0,30.0,70.200002.0,30.0,70 = 2956 c) n = 2,570,022.0,252 = 4129 d) n = 0,022(20000−1)+2,572,572.0,25.200002.0,25 = 3422

0.2

Composi¸

ao

da

Amostra

-M´

etodos Probabil´ısticos

Um m´etodo de amostragem ´e dito probabil´ıstico se cada elemento da popula¸c˜ao tenha a mesma probabilidade de ser selecionado, isto ´e, em uma popula¸c˜ao de N in-div´ıduos, a probabilidade de qualquer indiv´ıduo ser se-lecionado deve ser 1/N . Isso garante cientificamente a representatividade de uma amostra a fim de se realizar indu¸c˜oes ou inferˆencias sobre a popula¸c˜ao.

? Amostragem Aleat´oria Simples: ´E o processo mais elementar e frequentemente utilizado. Atribui-se a cada el-emento da popula¸c˜ao um n´umero distinto (se a popula¸c˜ao j´a for numerada utilizam-se esse r´otulos). Efetuam-se su-cessivos sorteios at´e completar-se o tamanho da amostra n. Nestes sorteios utilizam-se as chamadas ”t´abuas de n´umeros aleat´orios”que consistem em tabelas que apre-sentam sequˆencias dos d´ıgitos 0 a 9 distribu´ıdos aleatori-amente.

Exemplo 4. Suponhamos uma popula¸c˜ao com N = 1000 elementos, numerada de 000 a 999. Escolhendo uma posi¸c˜ao

de qualquer linha da tabela de n´umeros aleat´orios, faz-se o sorteio, ou faz-seja, retiram-faz-se conjuntos de trˆes algar-ismos para se escolherem os elementos que ir˜ao compor a amostra. Assim, imagine que a sequˆecia dos d´ıgitos eleat´orios seja:

385 559 555 432 886...

Dessa forma, os n´umeros sorteados s˜ao 385 − 559 − 555 − 432....

Para entender melhor veja (FONSECA, 1996, pg.318). No nosso exemplo foi tomada a segunda linha correspon-dente aos seguintes d´ıgitos:

38555 95554 32886 59780.... [385][55 9][555][4 32][886] [597][80....

Observa¸c˜ao 5. Se o n´umero sorteado superar o maior n´umero dos elementos rotulados, abandona-se o n´umero sorteado, prosseguindo o processo. Se o n´umero for repetido, conv´em abandon´a-lo. Se os d´ıgitos aleat´orios de uma linha n˜ao s˜ao suficientes v´aa para a pr´oxima.

? Amostragem Sistem´atica: Trata-se de uma varia¸c˜ao da amostragem aleat´oria simples, conveniente quando a popula¸c˜ao est´a ordenada segundo algum crit´erio, como fichas em um fich´ario, listas telefˆonicas etc. Calcula-se o intervalo de amostragem N/n aproximando-o para o inteiro mais pr´oximo a. Utilizando a t´abua de n´umeros aleat´orios, sorteia0se um n´umero x entre 1 e a, formando-se a amostra dos elementos correspondentes aos n´umeros x, x + a, x + 2a, ...

Exemplo 6. Por exemplo, seja N = 1000, n = 200. Logo,

a =N n =

1000 200 = 5

Imagine que trˆes seja o n´umero sorteado entre 1 e 5. Por-tanto, os elementos da popula¸c˜ao numerados por 3, 8, 18, ..., 998 ir˜ao compor a amostra.

? Amostragem Estratificada: Subdividimos a popula¸c˜ao, em pelo menos dois subgrupos (ou estratos), de modo que sujeitos no mesmo subgrupo compartilhem as mes-mas caracter´ısticas e, em seguida, extra´ımos uma amostra aleat´oria simples de cada subgrupo. As vari´aveis de es-tratifica¸c˜ao mais comuns s˜ao: classe social, idade, sexo,

(4)

profiss˜ao ... ou qualquer outro atributo que revele os es-tratos dentro da popula¸c˜ao.

? Amostragem por Conglomerado: Primeiro dividi-mos a ´area da popula¸c˜ao em se¸c˜oes (ou conglomerados), depois selecionamos aleatoriamente alguns desses conglom-erados e, a seguir, escolhemos todos os membros desses conglomerados selecionados.

Exemplo 7. Num levantamento da popula¸c˜ao de uma cidade, podemos dispor do mapa indicando cada quarteir˜ao e n˜ao dispor de uma rela¸c˜ao atualizada dos seus moradores. Pode-se, ent˜ao, escolher uma amostra dos quarteir˜oes e fazer uma contagem completa de todos os que residem naqueles quarteir˜oes sorteados.

Observa¸c˜ao 8. ´E f´acil confundir amostragem estratifi-cada com a amostragem por conglomerado uma vez que ambas envolvem a forma¸c˜ao de subgrupos da popula¸c˜ao. Por´em, a amostragem por conglomerado usa todos os mem-bros de uma amostra de conglomerados, equanto que a amostragem estratificada usa uma amostra de membros de todos os extratos. Para maiores detalhes veja o Exemplo 3 (TRIOLA, 2013, pg.23).

0.3

Exerc´ıcios

1) Dada a seguinte popula¸c˜ao (renda em $ 1000)

29 06 34 12 15 31 34 20 08 30 08 15 24 22 35 31 25 26 20 10 30 04 16 21 14 21 16 18 20 12 31 20 12 18 12 25 26 13 10 05 13 19 30 17 25 29 25 28 32 15 10 21 18 07 16 14 11 22 21 36 32 17 15 13 08 12 23 25 13 21 05 12 32 21 10 30 30 10 14 17 34 22 30 48 19 12 08 07 15 20 26 25 22 30 33 14 17 13 10 09

a) Calcule o tamanho de uma amostra para se estimar a m´edia, sendo d = $ 2000, σ = 7000 e 1 − α = 95%; b) Retire uma amostra aleat´oria simples considerando o

tamanho obtido no item a);

c) Agrupe os elementos da amostra em classe; d) Calule sua m´edia;

e) Calcule o desvio-padr˜ao amostral;

f) Calcule a m´edia da popula¸c˜ao e verifique se |µ − x| < d. g) Repita os itens b), c), d), e) e f) considerando uma outra amostra simples.

2) A Internet est´a nos afetando de muitas maneiras difer-entes, de modo que h´a in´umeras raz˜oes para se estimar a propor¸c˜ao de adultos que a usam. Suponha que o gerente de uma E-Bay deseje determinar a porcentagem atual de adultos dos Estados Unidos que usam a Internet. Quan-tos adulQuan-tos devem ser entrevistados apara se ter 95% de confian¸ca em que a porcentagem amostral esteja em erro n˜ao superior a trˆes pontos percentuais (d = 3% = 0, 03)? a) Use o resultado de uma pesquisa do Pew Research Cen-ter: Em 2006, 73% dos adultos americanos usavam Inter-net.

b) Suponha que n˜ao tenhamos nenhuma informa¸c˜ao pr´evia que sugira um poss´ıvel valor da propor¸c˜ao.

3) Suponha que desejamos estimar o QI m´edio para a pop-ula¸c˜ao de estudantes de estat´ıstica. Quantos estudantes de estat´ıstica devem ser selecionados aleatoriamente para os testes de QI, se desejamos estar 95% confiantes em que a m´edia amostral estar´a a menos de trˆes pontos do QI m´edia populacional (d = 3)? Assuma que o desvio padr˜ao populacional seja σ = 15 (TRIOLA, 2013, pg. 284-285).

REPOSTAS: 1.1) a) n = 34

b) Partindo da terceira linha da tabela de d´ıgitos aleat´orios (FONSECA, 1996, pg. 318) e considerando os itens do exerc´ıcio sendo postos na ordem

29 −→ primeiro, 06 −→ segundo, ... temos a seguinte amostra (confira):

12 15 30 15 14 20 12 12 13 10 05 30 28 18 07 16 14 36 17 12 13 12 34 22 30 19 07 15 30 33 14 13 10 09

(5)

c) Classe Fi 05| − 11 6 11| − 17 15 17| − 23 5 23| − 29 1 29| − 35 6 35| − 41 1 d) x ≈ 18, 1 (com base na tabela) e) S ≈ 8, 7 (com base na tabela) f) µ = 19, 6 ⇒ |18, 1 − 19, 6| = 1, 5 < 2 g) m˜aos a obra!!!

2) a) 842 b) 1068

3) amostra composta por 97 estudante entre os milhares de estudantes de estat´ıstica.

Referências

Documentos relacionados

Esperamos que com essa unidade você tenha compreendido as principais definições que usamos em Estatística, como utilizar o método estatístico, o que é uma pesquisa de mercado e

A abordagem para o teste não é simétrica com relação às hipóteses nula e alternativa, pois consideramos somente testes com a propriedade de que a probabilidade de rejeitar

2.2 Uma urna cont´ em 5 bolas brancas e 5 bolas pretas. Dois jugadores, A e B, tiram alter- nadamente e um de cada vez uma bola da urna. Um teste diagn´ ostico para esta doen¸ ca ´

Como exemplo, tomemos as superfícies das cinco regiões geográficas que compoem o Brasil, apresentadas na tabela 2, conforme dados do IBGE (Instituto Brasileiro de Geografia e

 Avaliação nos casos em que o teste ergométrico está contraindicado (hipertensão arterial grave e descontrolada), não pode ser realizado

Para explicar a associação entre o estabelecimento de relações de vinculação durante a infância, desenvolvimento e saúde mental, Bowlby (1969/1982, 1973, 1980, 1988) apoiou-se

O objetivo ´ e descrever dados atrav´ es de gr´ aficos, tabelas, medidas num´ ericas etc.... Popula¸ c˜ ao: cole¸c˜ ao de todos os elementos cujas caracter´ısticas

Isabel Mendes Professor Relator Avaliador Mª Cristina Machado Professor Relator Avaliador Ricardo Gimenez Professor Relator Avaliador Rosa Branco Professor Relator