Estat´ıstica e Probabilidade - PROFMAT - UFRJ
Per´ıodo: 2019/2
Aula #02 de Inferˆencia Estat´ıstica: 01/11/2019
Intervalos de Confian¸ca
Suponha que se deseja estimar a m´edia µ de uma popula¸c˜ao qualquer e que para isso sele- cionaremos uma amostra aleat´oria de tamanho n, suficientemente grande, dessa popula¸c˜ao e usaremos a m´edia amostral ¯X para estimar o valor da m´edia populacional (µ).
Pelo TCL (Teorema Central do Limite) X¯ − µ
σ/√ n
∼a N(0,1)
em que σ ´e o desvio padr˜ao da popula¸c˜ao.
Usando a tabela da normal padr˜ao, P(−1,96 <
X¯ − µ
σX¯ < 1,96) = 0,95 com σX¯ = √σ
n, chamado erro padr˜ao de ¯X.
Por meio de opera¸c˜oes alg´ebricas, ´e poss´ıvel reescrever a equa¸c˜ao anterior na forma
P X¯ − 1,96σX¯ < µ < X¯ + 1,96σX¯ = 0,95 e, essa equa¸c˜ao nos fornece os limites de 95%
de confian¸ca de µ, a saber, X¯ ± 1,96σX¯
Nota¸c˜ao: IC(µ,0.95) : X¯ ± 1,96σX¯
com σX¯ = √σ
n.
Intervalo de 95% de confian¸ca para µ.
Interpreta¸c˜ao do intervalo: a figura a seguir ´e
´
util na interpreta¸c˜ao.
Resumindo: Se selecionarmos um grande n´umero de amostras aleat´orias de tamanho n da po- pula¸c˜ao e, para cada uma delas, calcularmos os intervalos da forma ¯X ±1,96σX¯, 95% deles cobririam o parˆametro µ.
No exemplo que acabamos de apresentar, 95%
´e dito ser o n´ıvel ou coeficiente de confian¸ca do intervalo.
E claro que podemos usar um n´´ ıvel de con- fian¸ca qualquer. Em geral escolhem-se n´ıveis de confian¸ca altos, pr´oximos de 1.
1,96 ´e o quantil da distribui¸c˜ao normal padr˜ao tal que P(−1,96 < Z < 1,96) = 0,95.
Vamos adotar a seguinte nota¸c˜ao seja z(γ) tal que
P(−z(γ) < Z < z(γ)) = γ, 0 < γ < 1.
Observe que com essa nota¸c˜ao z(0.95) = 1,96 e um intervalo de n´ıvel de confian¸ca γ para µ
´e dado por
X¯ ± z(γ)σX¯
em que γ ´e o coeficiente de confian¸ca, P(−z(γ) < Z < z(γ)) = γ e σX¯ = √σ
n,
σ ´e o desvio padr˜ao populacional e n ´e o tamanho da amostra.
Intervalos de Confian¸ca com n´ıvel de confian¸ca γ para a m´edia populacional para amostras da distribui¸c˜ao normal ou amostras suficien- temente grandes n ≥ 30
IC(µ, γ) : X¯
m´edia amostral|{z}
±z(γ) σ
√n
| {z } erro padr˜ao
Se o valor de σ n˜ao for conhecido substitua-o na express˜ao acima por uma estimativa.
Intervalos de Confian¸ca para a propor¸c˜ao po- pulacional
No caso de intervalos para a propor¸c˜ao, se fos- semos usar a express˜ao dada em (1) ter´ıamos
IC(p, γ) : pˆ
propor¸c˜ao amostral|{z}
±z(γ)
q
p(1 − p)
√n
| {z } erro padr˜ao de ˆp
No entanto o valor de p n˜ao ´e conhecido e aparece na express˜ao do erro padr˜ao. Nesse contexto costuma-se adotar duas estrat´egias.
A primeira, conservadora, trabalha com o pior cen´ario poss´ıvel e substitui p na f´ormula do erro padr˜ao por 1/2, que produz o intervalo mais largo poss´ıvel.
A segunda , que pode ser usada para tamanhos amostrais suficientemente grandes, substitui p por ˆp.
Assim temos,
Alternativa conservadora:
IC(p, γ) : ˆp ± z(γ)
s 1 4n Outra alternativa:
IC(p, γ) : ˆp ± z(γ)
q
p(1ˆ − p)ˆ
√n
Exemplo 1: (Pinheiro e outros - Estat´ıstica B´asica: a arte de trabalhar com dados - Cap.
7- ex. 7.6)
Levando em conta simultaneamente as respos- tas dadas por 200 clientes de uma empresa a todos os itens de um question´ario, foi calcu- lado um ´ındice de satisfa¸c˜ao global correspon- dente a cada respondente. Este ´ındice varia de 0 (totalmente insatisfeito) a 100 (totalmente satisfeito). Com respeito a esse ´ındice de sa- tisfa¸c˜ao foi constru´ıdo um intervalo de 95%
de confian¸ca para o n´ıvel m´edio de satisfa¸c˜ao da popula¸c˜ao de clientes dessa empresa e que resultou nos seguintes limites
IC(µ,95%) : (43,5 ; 63,9).
Quais das afirma¸c˜oes a seguir est˜ao corretas e quais n˜ao est˜ao? Justifique cada uma de suas respostas.
(a) A probabilidade de que µ esteja entre 43,5 e 63,9 ´e 95%.
(b) Se fosse extra´ıda uma outra amostra, tam- b´em com 200 clientes, a probabilidade de a m´edia amostral dos ´ındices de satisfa¸c˜ao ob- servados cairem entre 43,5 e 63,9 ´e 95%.
(c) Se fossem extra´ıdas 100 amostras de tama- nho 200 e se usasse o mesmo procedimento que deu origem ao intervalo apresentado no enunciado para cada amostra, cerca de 95%
dos intervalos obtidos conteriam o valor de µ.
(d) O desvio padr˜ao populacional do ´ındice de satisfa¸c˜ao ´e aproximadamente igual a 5,1.
(e) Todos os entrevistados apresentaram ´ındices
A ´unica afirma¸c˜ao verdadeira no exemplo 2 est´a no item (c).
Exemplo 2: (Levine e outros - Estat´ıstica:
Teoria e Aplica¸c˜oes - Cap. 6 - exerc´ıcio 6.56) O diretor de pessoal de uma grande corpora¸c˜ao deseja estudar o absente´ısmo dos trabalhadores administrativos do escrit´orio central da cor- pora¸c˜ao durante o ano. Uma amostra aleat´o- ria de 36 empregados administrativos revelou o seguinte:
• x¯ = 9,7 dias, s = 4 dias
• 12 trabalhadores administrativos estiveram ausentes mais de 10 dias.
(a) Construa um intervalo de 99% de con- fian¸ca, para o n´umero m´edio de ausˆencias de trabalhadores administrativos no ano passado.
Como n > 30, temos
IC(µ, 0,99) : 9,7 ± z(0,99) × s
√36
Da tabela da distribui¸c˜ao normal padr˜ao z(0,99) ≈ 2,58. Logo,
IC(µ,0,99) : 9,7 ± 2,58 × √4
36 : 9,7 ± 1,7 : (8,0; 11,4)
(b) Construa um intervalo de 95% de con- fian¸ca para a propor¸c˜ao de trabalhadores ad- ministrativos que estiveram ausentes por mais de 10 dias durante o ano passado.
Tem-se ˆp = 1236. Usando o enfoque conser- vador,
q 1
A determina¸c˜ao do tamanho da amostra ´e uma quest˜ao importante na Estat´ıstica.
Por exemplo, suponha que estejamos estimando a m´edia µ de uma popula¸c˜ao e usaremos a m´edia amostral ¯X como estimador da m´edia populacional µ a partir de uma amostra aleat´oria de tamanho n.
Uma forma de resolver esse problema ´e es- pecificar o erro absoluto de estima¸c˜ao m´aximo aceit´avel () em que o erro absoluto de es- tima¸c˜ao ´e dado por |X¯ − µ| e uma probabili- dade γ (de preferˆencia alta) para que o erro fique dentro desses limite.
O problema se torna: qual deve ser o tamanho n da amostra se desejamos errar por no m´aximo com probabilidade pelo menos γ:
n =?
tal que P(
erro abs. de est. de µ z }| {
|X¯ − µ| ≤
pequeno|{z}
) ≥ γ
grande|{z}
Observe que que deve ser maior que zero e 0 < γ < 1.
Se n ´e suficientemente grande, podemos usar o TCL tal que
γ = P
|X¯ − µ|
σX¯
| {z }
∼N(0,1)
≤ σ
X¯
Isso implica em
σX¯ = z(γ). Lembrando que σX¯ = √σ
n segue que
Logo,
n = z2
(γ)σ2 2
Esse c´alculo foi feito supondo que a popula¸c˜ao
´e infinita e que a amostra ´e retirada com re- posi¸c˜ao. Existem ajustes para o caso de po- pula¸c˜oes finitas e amostras sem reposi¸c˜ao. Se conhecemos o tamanho N da popula¸c˜ao, uma f´ormula para o tamanho da amostra ´e dada por:
n0 = n 1 + n/N em que n ´e obtido como antes.
Determina¸c˜ao do tamanho amostral na es- tima¸c˜ao de uma propor¸c˜ao.
No caso da estima¸c˜ao de uma propor¸c˜ao, a de- termina¸c˜ao do tamanho da amostra ´e similar.
E necess´´ ario especificar o erro absoluto de es- tima¸c˜ao m´aximo e a probabilidade de come- ter esse erro γ.
O valor de σ2 = p(1 − p) ´e substitu´ıdo por
1
2 × 12 = 14 que corresponde `a maior variˆancia poss´ıvel. Assim,
n = z2
(γ)
42
Observa¸c˜ao: quando se disp˜oe de alguma in- forma¸c˜ao sobre o valor de p, podemos us´a- la na express˜ao anterior de modo a reduzir o tamanho amostral. Por exemplo, se sabemos que 0 < p < 0,2 no lugar de 1 podemos usar
Exemplo 3: Suponha que uma ind´ustria far- macˆeutica deseja saber em quantos volunt´arios deve aplicar uma vacina, de modo que a pro- por¸c˜ao de indiv´ıduos imunizados na amostra difira de menos de 4% da propor¸c˜ao verdadeira de imunizados na popula¸c˜ao com probabilidade 90%. Qual deve ser o tamanho da amostra?
Solu¸c˜ao: Temos = 0,04, γ = 0,90 tal que z(0,9) = 1,645. Logo,
n = 1,6452
4 × 0,042 ≈ 422.8164 ≈ 423.
Suponha agora que sabe-se que a verdadeira propor¸c˜ao de imunizados na popula¸c˜ao ´e de pelo menos 70%. Nesse caso, qual seria o tamanho da amostra?
n = 1,6452 × 0,7 × 0,3
0,042 ≈ 355,1658 ≈ 356.
Exerc´ıcios sugeridos do livro do Bussab e Moret- tin:
Cap´ıtulo 10: 1, 7 a 13, 21 a 28 Cap´ıtulo 11: 14 a 21