Estatística e Probabilidade - PROFMAT - UFRJ. Período: 2019/2

(1)

Estat´ıstica e Probabilidade - PROFMAT - UFRJ

Per´ıodo: 2019/2

Aula #02 de Inferˆencia Estat´ıstica: 01/11/2019

(2)

Intervalos de Confian¸ca

Suponha que se deseja estimar a média µ de uma popula¸cão qualquer e que para isso sele- cionaremos uma amostra aleatória de tamanho n, suficientemente grande, dessa popula¸cão e usaremos a média amostral ¯X para estimar o valor da média populacional (µ).

Pelo TCL (Teorema Central do Limite) X¯ − µ

σ/√ n

∼a N(0,1)

em que σ é o desvio padrão da popula¸cão.

Usando a tabela da normal padr˜ao, P(−1,96 <

X¯ − µ

σ_X_¯ < 1,96) = 0,95 com σ_X_¯ = ^√^σ

n, chamado erro padr˜ao de ¯X.

(3)

Por meio de opera¸cões algébricas, é poss´ıvel reescrever a equa¸cão anterior na forma

P X¯ − 1,96σ_X_¯ < µ < X¯ + 1,96σ_X_¯ = 0,95 e, essa equa¸c˜ao nos fornece os limites de 95%

de confian¸ca de µ, a saber, X¯ ± 1,96σ_X_¯

Nota¸c˜ao: IC(µ,0.95) : X¯ ± 1,96σ_X_¯

com σ_X_¯ = ^√^σ

n.

Intervalo de 95% de confian¸ca para µ.

(4)

Interpreta¸c˜ao do intervalo: a figura a seguir ´e

´

util na interpreta¸c˜ao.

Resumindo: Se selecionarmos um grande número de amostras aleatórias de tamanho n da popula¸cão e, para cada uma delas, calcularmos os intervalos da forma ¯X ±1,96σ_X_¯, 95% deles cobririam o parâmetro µ.

(5)

No exemplo que acabamos de apresentar, 95%

´e dito ser o n´ıvel ou coeficiente de confian¸ca do intervalo.

E claro que podemos usar um n´´ ıvel de confian¸ca qualquer. Em geral escolhem-se n´ıveis de confian¸ca altos, pr´oximos de 1.

1,96 é o quantil da distribui¸cão normal padrão tal que P(−1,96 < Z < 1,96) = 0,95.

Vamos adotar a seguinte nota¸c˜ao seja z_(γ) tal que

P(−z_(γ) < Z < z_(γ)) = γ, 0 < γ < 1.

(6)

Observe que com essa nota¸c˜ao z_(0.95) = 1,96 e um intervalo de n´ıvel de confian¸ca γ para µ

´e dado por

X¯ ± z_(γ)σ_X_¯

em que γ ´e o coeficiente de confian¸ca, P(−z_(γ) < Z < z_(γ)) = γ e σ_X_¯ = ^√^σ

n,

σ é o desvio padrão populacional e n é o tamanho da amostra.

(7)

Intervalos de Confian¸ca com n´ıvel de confian¸ca γ para a m´edia populacional para amostras da distribui¸c˜ao normal ou amostras suficientemente grandes n ≥ 30

IC(µ, γ) : X¯

m´edia amostral|{z}

±z_(γ) σ

√n

| {z } erro padr˜ao

Se o valor de σ n˜ao for conhecido substitua-o na express˜ao acima por uma estimativa.

(8)

Intervalos de Confian¸ca para a propor¸c˜ao populacional

No caso de intervalos para a propor¸c˜ao, se fos- semos usar a express˜ao dada em (1) ter´ıamos

IC(p, γ) : pˆ

propor¸c˜ao amostral|{z}

±z_(γ)

q

p(1 − p)

√n

| {z } erro padr˜ao de ˆp

No entanto o valor de p não é conhecido e aparece na expressão do erro padrão. Nesse contexto costuma-se adotar duas estratégias.

A primeira, conservadora, trabalha com o pior cenário poss´ıvel e substitui p na fórmula do erro padrão por 1/2, que produz o intervalo mais largo poss´ıvel.

A segunda , que pode ser usada para tamanhos amostrais suficientemente grandes, substitui p por ˆp.

(9)

Assim temos,

Alternativa conservadora:

IC(p, γ) : ˆp ± z_(γ)

s 1 4n Outra alternativa:

IC(p, γ) : ˆp ± z_(γ)

q

p(1ˆ − p)ˆ

√n

(10)

Exemplo 1: (Pinheiro e outros - Estat´ıstica B´asica: a arte de trabalhar com dados - Cap.

7- ex. 7.6)

Levando em conta simultaneamente as respostas dadas por 200 clientes de uma empresa a todos os itens de um questionário, foi calcu- lado um ´ındice de satisfa¸cão global correspon- dente a cada respondente. Este ´ındice varia de 0 (totalmente insatisfeito) a 100 (totalmente satisfeito). Com respeito a esse ´ındice de satisfa¸cão foi constru´ıdo um intervalo de 95%

de confian¸ca para o n´ıvel médio de satisfa¸cão da popula¸cão de clientes dessa empresa e que resultou nos seguintes limites

IC(µ,95%) : (43,5 ; 63,9).

Quais das afirma¸cões a seguir estão corretas e quais não estão? Justifique cada uma de suas respostas.

(11)

(a) A probabilidade de que µ esteja entre 43,5 e 63,9 ´e 95%.

(b) Se fosse extra´ıda uma outra amostra, tam- bém com 200 clientes, a probabilidade de a média amostral dos ´ındices de satisfa¸cão ob- servados cairem entre 43,5 e 63,9 é 95%.

(c) Se fossem extra´ıdas 100 amostras de tamanho 200 e se usasse o mesmo procedimento que deu origem ao intervalo apresentado no enunciado para cada amostra, cerca de 95%

dos intervalos obtidos conteriam o valor de µ.

(d) O desvio padrão populacional do ´ındice de satisfa¸cão é aproximadamente igual a 5,1.

(e) Todos os entrevistados apresentaram ´ındices

(12)

A única afirma¸cão verdadeira no exemplo 2 está no item (c).

Exemplo 2: (Levine e outros - Estat´ıstica:

Teoria e Aplica¸cões - Cap. 6 - exerc´ıcio 6.56) O diretor de pessoal de uma grande corpora¸cão deseja estudar o absente´ısmo dos trabalhadores administrativos do escritório central da corpora¸cão durante o ano. Uma amostra aleató- ria de 36 empregados administrativos revelou o seguinte:

• x¯ = 9,7 dias, s = 4 dias

• 12 trabalhadores administrativos estiveram ausentes mais de 10 dias.

(a) Construa um intervalo de 99% de confian¸ca, para o número médio de ausências de trabalhadores administrativos no ano passado.

(13)

Como n > 30, temos

IC(µ, 0,99) : 9,7 ± z_(0,99) × s

√36

Da tabela da distribui¸c˜ao normal padr˜ao z_(0,99) ≈ 2,58. Logo,

IC(µ,0,99) : 9,7 ± 2,58 × ^√⁴

36 : 9,7 ± 1,7 : (8,0; 11,4)

(b) Construa um intervalo de 95% de confian¸ca para a propor¸c˜ao de trabalhadores administrativos que estiveram ausentes por mais de 10 dias durante o ano passado.

Tem-se ˆp = ¹²₃₆. Usando o enfoque conser- vador,

q 1

(14)

A determina¸cão do tamanho da amostra é uma questão importante na Estat´ıstica.

Por exemplo, suponha que estejamos estimando a média µ de uma popula¸cão e usaremos a média amostral ¯X como estimador da média populacional µ a partir de uma amostra aleatória de tamanho n.

Uma forma de resolver esse problema é especificar o erro absoluto de estima¸cão máximo aceitável () em que o erro absoluto de estima¸cão é dado por |X¯ − µ| e uma probabilidade γ (de preferência alta) para que o erro fique dentro desses limite.

O problema se torna: qual deve ser o tamanho n da amostra se desejamos errar por no m´aximo com probabilidade pelo menos γ:

(15)

n =?

tal que P(

erro abs. de est. de µ z }| {

|X¯ − µ| ≤

pequeno|{z}

) ≥ γ

grande|{z}

Observe que que deve ser maior que zero e 0 < γ < 1.

Se n ´e suficientemente grande, podemos usar o TCL tal que

γ = P







|X¯ − µ|

σ_X_¯

| {z }

∼N(0,1)

≤ _σ

X¯







Isso implica em

σ_X_¯ = z_(γ₎. Lembrando que σ_X_¯ = ^√^σ

n segue que

(16)

Logo,

n = z²

(γ)σ² ²

Esse c´alculo foi feito supondo que a popula¸c˜ao

é infinita e que a amostra é retirada com reposi¸cão. Existem ajustes para o caso de popula¸cões finitas e amostras sem reposi¸cão. Se conhecemos o tamanho N da popula¸cão, uma fórmula para o tamanho da amostra é dada por:

n⁰ = n 1 + n/N em que n ´e obtido como antes.

(17)

Determina¸cão do tamanho amostral na estima¸cão de uma propor¸cão.

No caso da estima¸cão de uma propor¸cão, a determina¸cão do tamanho da amostra é similar.

E necess´´ ario especificar o erro absoluto de estima¸c˜ao m´aximo e a probabilidade de come- ter esse erro γ.

O valor de σ² = p(1 − p) ´e substitu´ıdo por

1

2 × ¹₂ = ¹₄ que corresponde `a maior variˆancia poss´ıvel. Assim,

n = z²

(γ)

4²

Observa¸cão: quando se dispõe de alguma in- forma¸cão sobre o valor de p, podemos usá- la na expressão anterior de modo a reduzir o tamanho amostral. Por exemplo, se sabemos que 0 < p < 0,2 no lugar de ¹ podemos usar

(18)

Exemplo 3: Suponha que uma indústria far- macêutica deseja saber em quantos voluntários deve aplicar uma vacina, de modo que a propor¸cão de indiv´ıduos imunizados na amostra difira de menos de 4% da propor¸cão verdadeira de imunizados na popula¸cão com probabilidade 90%. Qual deve ser o tamanho da amostra?

Solu¸c˜ao: Temos = 0,04, γ = 0,90 tal que z_(0,9) = 1,645. Logo,

n = 1,645²

4 × 0,04² ≈ 422.8164 ≈ 423.

Suponha agora que sabe-se que a verdadeira propor¸cão de imunizados na popula¸cão é de pelo menos 70%. Nesse caso, qual seria o tamanho da amostra?

n = 1,645² × 0,7 × 0,3

0,04² ≈ 355,1658 ≈ 356.

(19)

Exerc´ıcios sugeridos do livro do Bussab e Moret- tin:

Cap´ıtulo 10: 1, 7 a 13, 21 a 28 Cap´ıtulo 11: 14 a 21