• Nenhum resultado encontrado

Distribuição de uma proporção amostral

N/A
N/A
Protected

Academic year: 2021

Share "Distribuição de uma proporção amostral"

Copied!
6
0
0

Texto

(1)

1

Distribuição de uma proporção amostral

Exemplo Ilustrativo: Suponha que se saiba que em uma certa população humana uma proporção de pessoas igual a p=0,08 (8%) seja cega para cores. Se fizermos uma amostragem aleatória de 150 indivíduos da população, qual a probabilidade de que a proporção de pessoas dessa amostra que seja cega para cores seja menor que 0,15?

Neste problema, precisamos saber as propriedades da distribuição amostral da proporção dentro de uma amostra. Já que resolvemos chamar a proporção da população de p, vamos chamar a proporção de uma amostra individual de .

Note que este problema poderia ser resolvido usando-se a distribuição binomial, pois só existem duas possibilidades para uma pessoa: ou ela é cega para cores ou não é. No entanto, a sua solução seria mais trabalhosa e o método usado aqui é mais simples quando as amostras têm grandes tamanhos.

A construção de uma distribuição amostral para a proporção de uma amostra é feita da maneira usual: da população, tomam-se todas as possíveis amostras de um dado tamanho (150 no caso do exemplo) e calcula-se, para cada uma delas, a proporção . Com isso, pode-se construir uma tabela de freqüências para que é a distribuição amostral de .

(2)

2

Quando o tamanho das amostras é grande, a distribuição amostral de

é aproximadamente normal pelo T.C.L. Os seguintes resultados são dados sem demonstração: A média da distribuição amostral de é igual a µpˆ = p, a própria proporção da população; e a variância da

distribuição amostral de é igual a

(

)

n p p p − = σ2 1 ˆ .

Um critério normalmente usado para definir quão grande uma amostra tem que ser para que o T.C.L. seja válido e que a distribuição amostral de seja aproximadamente normal é o de que tanto

np

como

(

p

)

n −1 sejam maiores que 5.

Para o problema em questão, o critério acima é satisfeito: 12 08 , 0 150 = = x np e n

(

1− p

)

=150x0,92=138.

Logo, podemos dizer que, neste caso, é aproximadamente normalmente distribuída com média µpˆ = p =0,08 e desvio padrão

( )

0,00049 0,0222 150 92 , 0 08 , 0 1 2 ˆ ˆ = = = − = = x n p p p p σ σ . Portanto, P

(

pˆ <0,15

) (

=P z<zˆ

)

onde 3,15 0222 , 0 08 , 0 15 , 0 ˆ ˆ ˆ = − = − = p p p z σ .

Consultando a tabela, temos que a probabilidade pedida vale: 0,5 + 0,49918 = 0,99918 (99,92 %). Portanto, a probabilidade de se encontrar uma proporção de pessoas cegas para cores abaixo de 0,15 em uma amostra aleatória de 150 pessoas é quase 1.

(3)

3

Mais um resultado a ser dado sem demonstração:

Se amostras aleatórias de tamanhos

n

1 e

n

2 são tomadas de duas populações distintas cujas proporções de casos com a característica de interesse sejam

p

1 e

p

2 respectivamente, a distribuição da diferença entre as proporções amostrais, p −ˆ1 pˆ2, é aproximadamente normal com média µpˆ1pˆ2 = p1p2 e variância

(

)

(

)

2 2 2 1 1 1 2 2 ˆ 1 ˆ 1 1 n p p n p p p p − + − = σ − ,

quando n1 e n2 são grandes.

Exemplo 1: Suponha que a proporção de usuários freqüentes de drogas em uma população seja de 0,50, enquanto que a proporção em outra população seja de 0,33. Qual é a probabilidade de que amostras de tamanho 100 das duas populações tenham um valor p −ˆ1 pˆ2 maior que 0,30?

Assumimos que a distribuição amostral de p −ˆ1 pˆ2 é aproximadamente normal com média ˆ ˆ 1 2 0,50 0,33 0,17

2 1−p = pp = − = p µ e 004711 , 0 100 67 , 0 33 , 0 100 5 , 0 5 , 0 2 ˆ ˆ1− 2 = + = x x p p

σ

. Logo,

(

) (

)

1,89 004711 , 0 17 , 0 30 , 0 ˆ ˆ 2 ˆ ˆ 2 1 2 1 2 1 = − = − − − = − p p p p p p z σ .

E a área sob a curva normal padrão à direita de z =1,89 vale

0294 , 0 4706 , 0 5 , 0 = (2,94 %).

(4)

4

Exemplo 2: Em uma certa população de adolescentes, sabe-se que 10% dos rapazes são obesos. Se a mesma proporção de garotas da população for obesa, qual a probabilidade de que uma amostra aleatória de 250 rapazes e 200 garotas tenha pˆ1− pˆ2 ≥ 0,06?

Assumimos que a distribuição amostral de p −ˆ1 pˆ2 é aproximadamente normal. Se a proporção de obesos for a mesma nas duas populações, a média da distribuição de p −ˆ1 pˆ2 será 0

(

p1− p2 =0

)

e a sua variância

será

(

)

(

)

0,00081 200 9 , 0 1 , 0 250 9 , 0 1 , 0 1 1 2 2 2 1 1 1 2 ˆ ˆ1 2 = + = − + − = − x x n p p n p p p p

σ

. Portanto, 2,11 00081 , 0 0 06 , 0 = − = z .

E a área sob a curva normal padrão à direita de z =2,11 vale

0174 , 0 4826 , 0 5 , 0 = (1,74 %).

(5)

5

Exercícios sobre Distribuições Amostrais

1. O gerente de uma dada agência bancária sabe que o saldo médio dos clientes da sua agência é de R$ 520 com um desvio padrão de R$ 280. Se for escolhida uma amostra aleatória de 50 clientes da agência, qual a probabilidade de que a média dos seus saldos médios seja maior do que R$ 550?

2. Suponha que se saiba que as durações das chamadas telefônicas interurbanas sejam distribuídas de forma aproximadamente normal com média de 9 minutos com desvio padrão de 3 minutos. Se a companhia telefônica escolher uma amostra aleatória de 20 chamadas telefônicas, qual a probabilidade de que a média das suas durações esteja entre 8 e 10 minutos?

3. A distribuição dos tempos gastos por clientes de uma agência bancária nos seus caixas eletrônicos é aproximadamente normal com média de 3,4 minutos e desvio padrão de 1,2 minuto. Em um dado momento, encontram-se 9 clientes usando caixas eletrônicos na agência bancária. Qual a probabilidade de que o seu tempo médio de uso dos caixas eletrônicos seja maior que 3,5 minutos? E qual a probabilidade de que ele seja menor que 2 minutos?

4. Os alunos do Cursinho A tiraram nota média na prova de matemática do vestibular de 5,5 com desvio padrão de 2,1 e os alunos do Cursinho B tiraram nota média na mesma prova de 4,8 com desvio padrão de 2,0. Selecionam-se duas amostras aleatórias de alunos, 35 do Cursinho A e 37 do Cursinho B. Qual a

(6)

6

probabilidade de que a diferença entre as suas notas médias na prova de matemática, x −A xB seja maior que 2?

5. O número de horas semanais que duas populações, uma de estudantes de graduação e outra de estudantes de pós-graduação, passa na cantina de uma faculdade é distribuído de maneira aproximadamente normal para as duas populações. A média de horas/semana da população de estudantes de graduação é de 12 hs com desvio padrão de 4 hs. A média de horas/semana da população de estudantes de pós-graduação é de 7 horas com desvio padrão de 3 horas. Selecionam-se duas amostras aleatórias de 10 estudantes de cada população. Qual a probabilidade de que a diferença entre as médias de horas semanais gastas na cantina pelas duas amostras seja menor do que 2 hs?

6. Com base em estatísticas históricas, sabe-se que 60% das compras feitas com cartão de crédito em um supermercado são para quantias acima de 100 reais. Se for escolhida uma amostra aleatória de 100 compras feitas com cartão de crédito em um certo dia no supermercado, qual a probabilidade de que a proporção de compras acima de 100 reais esteja entre 50% e 70%?

7. As proporções dos carros produzidos pelas fábricas A e B que apresentam defeito durante o primeiro ano de uso são, respectivamente, iguais a 8% e a 5%. Se forem selecionadas amostras aleatórias de carros produzidos pelas duas fábricas com tamanhos iguais a 230 e 250 respectivamente, qual a probabilidade de que a diferença entre as proporções amostrais de carros com defeito no primeiro ano de uso seja maior do que 1%?

Referências

Documentos relacionados

De seguida, vamos adaptar a nossa demonstrac¸ ˜ao da f ´ormula de M ¨untz, partindo de outras transformadas aritm ´eticas diferentes da transformada de M ¨obius, para dedu-

•   O  material  a  seguir  consiste  de  adaptações  e  extensões  dos  originais  gentilmente  cedidos  pelo 

A cor “verde” reflecte a luz ultravioleta, porém como as minhocas castanhas são mais parecidas com as minhocas verdadeiras, não se confundem com a vegetação, sendo

Considera-se que a interdisciplinaridade contribui para uma visão mais ampla do fenômeno a ser pesquisado. Esse diálogo entre diferentes áreas do conhecimento sobre

Código Descrição Atributo Saldo Anterior D/C Débito Crédito Saldo Final D/C. Este demonstrativo apresenta os dados consolidados da(s)

Apesar dos esforços para reduzir os níveis de emissão de poluentes ao longo das últimas décadas na região da cidade de Cubatão, as concentrações dos poluentes

No código abaixo, foi atribuída a string “power” à variável do tipo string my_probe, que será usada como sonda para busca na string atribuída à variável my_string.. O

Glomus etunicatum foi mais eficiente no aumento do peso das raízes secas, do número de raízes laterais primárias e secundárias e no aumento do teor de P na planta, em todas as doses