• Nenhum resultado encontrado

Estatística e Probabilidade - PROFMAT - UFRJ. Período: 2019/2

N/A
N/A
Protected

Academic year: 2022

Share "Estatística e Probabilidade - PROFMAT - UFRJ. Período: 2019/2"

Copied!
19
0
0

Texto

(1)

Estat´ıstica e Probabilidade - PROFMAT - UFRJ

Per´ıodo: 2019/2

Aula #02 de Inferˆencia Estat´ıstica: 01/11/2019

(2)

Intervalos de Confian¸ca

Suponha que se deseja estimar a m´edia µ de uma popula¸c˜ao qualquer e que para isso sele- cionaremos uma amostra aleat´oria de tamanho n, suficientemente grande, dessa popula¸c˜ao e usaremos a m´edia amostral ¯X para estimar o valor da m´edia populacional (µ).

Pelo TCL (Teorema Central do Limite) X¯ − µ

σ/√ n

a N(0,1)

em que σ ´e o desvio padr˜ao da popula¸c˜ao.

Usando a tabela da normal padr˜ao, P(−1,96 <

X¯ − µ

σX¯ < 1,96) = 0,95 com σX¯ = σ

n, chamado erro padr˜ao de ¯X.

(3)

Por meio de opera¸c˜oes alg´ebricas, ´e poss´ıvel reescrever a equa¸c˜ao anterior na forma

P X¯ − 1,96σX¯ < µ < X¯ + 1,96σX¯ = 0,95 e, essa equa¸c˜ao nos fornece os limites de 95%

de confian¸ca de µ, a saber, X¯ ± 1,96σX¯

Nota¸c˜ao: IC(µ,0.95) : X¯ ± 1,96σX¯

com σX¯ = σ

n.

Intervalo de 95% de confian¸ca para µ.

(4)

Interpreta¸c˜ao do intervalo: a figura a seguir ´e

´

util na interpreta¸c˜ao.

Resumindo: Se selecionarmos um grande n´umero de amostras aleat´orias de tamanho n da po- pula¸c˜ao e, para cada uma delas, calcularmos os intervalos da forma ¯X ±1,96σX¯, 95% deles cobririam o parˆametro µ.

(5)

No exemplo que acabamos de apresentar, 95%

´e dito ser o n´ıvel ou coeficiente de confian¸ca do intervalo.

E claro que podemos usar um n´´ ıvel de con- fian¸ca qualquer. Em geral escolhem-se n´ıveis de confian¸ca altos, pr´oximos de 1.

1,96 ´e o quantil da distribui¸c˜ao normal padr˜ao tal que P(−1,96 < Z < 1,96) = 0,95.

Vamos adotar a seguinte nota¸c˜ao seja z(γ) tal que

P(−z(γ) < Z < z(γ)) = γ, 0 < γ < 1.

(6)

Observe que com essa nota¸c˜ao z(0.95) = 1,96 e um intervalo de n´ıvel de confian¸ca γ para µ

´e dado por

X¯ ± z(γ)σX¯

em que γ ´e o coeficiente de confian¸ca, P(−z(γ) < Z < z(γ)) = γ e σX¯ = σ

n,

σ ´e o desvio padr˜ao populacional e n ´e o tamanho da amostra.

(7)

Intervalos de Confian¸ca com n´ıvel de confian¸ca γ para a m´edia populacional para amostras da distribui¸c˜ao normal ou amostras suficien- temente grandes n ≥ 30

IC(µ, γ) : X¯

edia amostral|{z}

±z(γ) σ

√n

| {z } erro padr˜ao

Se o valor de σ n˜ao for conhecido substitua-o na express˜ao acima por uma estimativa.

(8)

Intervalos de Confian¸ca para a propor¸c˜ao po- pulacional

No caso de intervalos para a propor¸c˜ao, se fos- semos usar a express˜ao dada em (1) ter´ıamos

IC(p, γ) : pˆ

propor¸ao amostral|{z}

±z(γ)

q

p(1 − p)

√n

| {z } erro padr˜ao de ˆp

No entanto o valor de p n˜ao ´e conhecido e aparece na express˜ao do erro padr˜ao. Nesse contexto costuma-se adotar duas estrat´egias.

A primeira, conservadora, trabalha com o pior cen´ario poss´ıvel e substitui p na f´ormula do erro padr˜ao por 1/2, que produz o intervalo mais largo poss´ıvel.

A segunda , que pode ser usada para tamanhos amostrais suficientemente grandes, substitui p por ˆp.

(9)

Assim temos,

Alternativa conservadora:

IC(p, γ) : ˆp ± z(γ)

s 1 4n Outra alternativa:

IC(p, γ) : ˆp ± z(γ)

q

p(1ˆ − p)ˆ

√n

(10)

Exemplo 1: (Pinheiro e outros - Estat´ıstica B´asica: a arte de trabalhar com dados - Cap.

7- ex. 7.6)

Levando em conta simultaneamente as respos- tas dadas por 200 clientes de uma empresa a todos os itens de um question´ario, foi calcu- lado um ´ındice de satisfa¸c˜ao global correspon- dente a cada respondente. Este ´ındice varia de 0 (totalmente insatisfeito) a 100 (totalmente satisfeito). Com respeito a esse ´ındice de sa- tisfa¸c˜ao foi constru´ıdo um intervalo de 95%

de confian¸ca para o n´ıvel m´edio de satisfa¸c˜ao da popula¸c˜ao de clientes dessa empresa e que resultou nos seguintes limites

IC(µ,95%) : (43,5 ; 63,9).

Quais das afirma¸c˜oes a seguir est˜ao corretas e quais n˜ao est˜ao? Justifique cada uma de suas respostas.

(11)

(a) A probabilidade de que µ esteja entre 43,5 e 63,9 ´e 95%.

(b) Se fosse extra´ıda uma outra amostra, tam- b´em com 200 clientes, a probabilidade de a m´edia amostral dos ´ındices de satisfa¸c˜ao ob- servados cairem entre 43,5 e 63,9 ´e 95%.

(c) Se fossem extra´ıdas 100 amostras de tama- nho 200 e se usasse o mesmo procedimento que deu origem ao intervalo apresentado no enunciado para cada amostra, cerca de 95%

dos intervalos obtidos conteriam o valor de µ.

(d) O desvio padr˜ao populacional do ´ındice de satisfa¸c˜ao ´e aproximadamente igual a 5,1.

(e) Todos os entrevistados apresentaram ´ındices

(12)

A ´unica afirma¸c˜ao verdadeira no exemplo 2 est´a no item (c).

Exemplo 2: (Levine e outros - Estat´ıstica:

Teoria e Aplica¸c˜oes - Cap. 6 - exerc´ıcio 6.56) O diretor de pessoal de uma grande corpora¸c˜ao deseja estudar o absente´ısmo dos trabalhadores administrativos do escrit´orio central da cor- pora¸c˜ao durante o ano. Uma amostra aleat´o- ria de 36 empregados administrativos revelou o seguinte:

• x¯ = 9,7 dias, s = 4 dias

• 12 trabalhadores administrativos estiveram ausentes mais de 10 dias.

(a) Construa um intervalo de 99% de con- fian¸ca, para o n´umero m´edio de ausˆencias de trabalhadores administrativos no ano passado.

(13)

Como n > 30, temos

IC(µ, 0,99) : 9,7 ± z(0,99) × s

√36

Da tabela da distribui¸c˜ao normal padr˜ao z(0,99) ≈ 2,58. Logo,

IC(µ,0,99) : 9,7 ± 2,58 × 4

36 : 9,7 ± 1,7 : (8,0; 11,4)

(b) Construa um intervalo de 95% de con- fian¸ca para a propor¸c˜ao de trabalhadores ad- ministrativos que estiveram ausentes por mais de 10 dias durante o ano passado.

Tem-se ˆp = 1236. Usando o enfoque conser- vador,

q 1

(14)

A determina¸c˜ao do tamanho da amostra ´e uma quest˜ao importante na Estat´ıstica.

Por exemplo, suponha que estejamos estimando a m´edia µ de uma popula¸c˜ao e usaremos a m´edia amostral ¯X como estimador da m´edia populacional µ a partir de uma amostra aleat´oria de tamanho n.

Uma forma de resolver esse problema ´e es- pecificar o erro absoluto de estima¸c˜ao m´aximo aceit´avel () em que o erro absoluto de es- tima¸c˜ao ´e dado por |X¯ − µ| e uma probabili- dade γ (de preferˆencia alta) para que o erro fique dentro desses limite.

O problema se torna: qual deve ser o tamanho n da amostra se desejamos errar por no m´aximo com probabilidade pelo menos γ:

(15)

n =?

tal que P(

erro abs. de est. de µ z }| {

|X¯ − µ| ≤

pequeno|{z}

) ≥ γ

grande|{z}

Observe que que deve ser maior que zero e 0 < γ < 1.

Se n ´e suficientemente grande, podemos usar o TCL tal que

γ = P

|X¯ − µ|

σX¯

| {z }

∼N(0,1)

σ

X¯

Isso implica em

σX¯ = z). Lembrando que σX¯ = σ

n segue que

(16)

Logo,

n = z2

(γ)σ2 2

Esse c´alculo foi feito supondo que a popula¸c˜ao

´e infinita e que a amostra ´e retirada com re- posi¸c˜ao. Existem ajustes para o caso de po- pula¸c˜oes finitas e amostras sem reposi¸c˜ao. Se conhecemos o tamanho N da popula¸c˜ao, uma f´ormula para o tamanho da amostra ´e dada por:

n0 = n 1 + n/N em que n ´e obtido como antes.

(17)

Determina¸c˜ao do tamanho amostral na es- tima¸c˜ao de uma propor¸c˜ao.

No caso da estima¸c˜ao de uma propor¸c˜ao, a de- termina¸c˜ao do tamanho da amostra ´e similar.

E necess´´ ario especificar o erro absoluto de es- tima¸c˜ao m´aximo e a probabilidade de come- ter esse erro γ.

O valor de σ2 = p(1 − p) ´e substitu´ıdo por

1

2 × 12 = 14 que corresponde `a maior variˆancia poss´ıvel. Assim,

n = z2

(γ)

42

Observa¸c˜ao: quando se disp˜oe de alguma in- forma¸c˜ao sobre o valor de p, podemos us´a- la na express˜ao anterior de modo a reduzir o tamanho amostral. Por exemplo, se sabemos que 0 < p < 0,2 no lugar de 1 podemos usar

(18)

Exemplo 3: Suponha que uma ind´ustria far- macˆeutica deseja saber em quantos volunt´arios deve aplicar uma vacina, de modo que a pro- por¸c˜ao de indiv´ıduos imunizados na amostra difira de menos de 4% da propor¸c˜ao verdadeira de imunizados na popula¸c˜ao com probabilidade 90%. Qual deve ser o tamanho da amostra?

Solu¸c˜ao: Temos = 0,04, γ = 0,90 tal que z(0,9) = 1,645. Logo,

n = 1,6452

4 × 0,042 ≈ 422.8164 ≈ 423.

Suponha agora que sabe-se que a verdadeira propor¸c˜ao de imunizados na popula¸c˜ao ´e de pelo menos 70%. Nesse caso, qual seria o tamanho da amostra?

n = 1,6452 × 0,7 × 0,3

0,042 ≈ 355,1658 ≈ 356.

(19)

Exerc´ıcios sugeridos do livro do Bussab e Moret- tin:

Cap´ıtulo 10: 1, 7 a 13, 21 a 28 Cap´ıtulo 11: 14 a 21

Referências

Documentos relacionados

CONCLUSIONS The correlation between pre and postoperative findings of the upper digestive endoscopies indicated a reduction of hiatal hernia, erosive esophagitis,

Áreas entre -0,1 a 0,2 representadas pelas cores azul claro e roxa apresentam estado de degradação menor, porém com a intensificação antrópica, através,

A prova do ENADE/2011, aplicada aos estudantes da Área de Tecnologia em Redes de Computadores, com duração total de 4 horas, apresentou questões discursivas e de múltipla

mos, tende pie dade de todos nós e dai-nos parti- cipar da vida eterna, com a Virgem Maria, Mãe de Deus, com São José, seu esposo, com os santos Apóstolos e todos os que

A estratégia integradora, através dos corredores ecológicos, é assegurar a restauração de ecossistemas e a manutenção de florestas que protegem rios, lagos e aquíferos das

Nesse contexto, torna-se indispensável manter uma comunicação empresarial integrada, ou seja, mantendo todo o esforço de trabalhar a comunicação da organização interna,

As observações de Lipovetsky (1989) provocam e levam a pensar que, para além das tentativas de compreensão da dinâmica da moda enquanto indústria, mercado (cuja preocupação

Moreover, two extreme sleep pro files emerged as representative of the ontogeny of homeostatic and circa- dian sleep regulation; morningness and worse quality of sleep are