Aula06 - Intervalo de Confiança- EstatProb

(1)

INFERÊNCIA ESTATÍSTICA

INTERVALO DE CONFIANÇA

PROF. ÁTILA

Aula 06

Introdução à inferência estatística Intervalo de confiança para 𝜇

• 𝜎2 conhecida.

(2)

1ª parte:

Como resumir descritivamente variáveis

associadas a um ou mais conjuntos de dados.

2ª parte:

Estudamos modelos probabilísticos capazes de

representar o comportamento das variáveis.

3ª parte:

Vamos estudar os argumentos estatísticos para

fazer afirmações sobre uma população.

(3)

•

Como modelar a distribuição referente as alturas

dos brasileiros?

Resposta: Modelo normal.

𝜇 =?

𝜎 = ?

(4)

•

Como modelar a distribuição referente as alturas

dos brasileiros?

Resposta: Modelo normal. Nova questão: 𝜇 =? 𝜎 =?

Solução: coletar uma amostra, analisá-la e inferir

(5)

•

População: conjunto de todos os elementos.

•

Amostra: qualquer subconjunto da população.

Exemplo

Estudar a proporção de indivíduos na cidade de Juiz

de Fora que são favoráveis ao partido político A.

• População: todos os habitantes (550 000)

(6)

Exemplo

Considere 𝑋 o peso real de pacotes de café

enchidos por uma máquina. Considere que

𝑋~𝑁 𝜇, 𝜎

2

, cujos parâmetros são desconhecidos.

• População: todos os pacotes enchidos ou que virão a ser enchidos pela máquina.

• Amostra: sorteamos 100 pacotes com pesos 𝑋₁, 𝑋₂, … , 𝑋₁₀₀

(7)

Inferência Estatística

Produzir afirmações sobre a característica da

população a partir de informações colhidas de uma

amostra.

Se temos a função de probabilidade (ou de

(8)

uma v.a. 𝑋 que descreve a característica de interesse.

• Amostra aleatória simples: conjunto de v.a. 𝑋₁, 𝑋₂, … , 𝑋_𝑛

independentes e identicamente distribuídas.

Exemplo

• Se 𝑋 representa a altura das pessoas de uma cidade.

• 𝑋₁= “altura do primeiro elemento”; • 𝑋₂ =“altura do segundo elemento”

...

(9)

uma v.a. 𝑋 que descreve a característica de interesse.

• Amostra aleatória simples: conjunto de v.a. 𝑋₁, 𝑋₂, … , 𝑋_𝑛

independentes e identicamente distribuídas, obtidas por retiradas com reposição.

• Média amostral:

𝑋 =

𝑋1+𝑋2+⋯+𝑋𝑛

𝑛

• Variância amostral:

𝑆

2

=

1

𝑛−1

∑ 𝑋

𝑖

− 𝑋

2

(10)

Média 𝜇 𝑋 Variância 𝜎2 𝑆2 Número de elementos 𝑁 𝑛 𝜇 = 𝐸 𝑋 = 1 𝑁 𝑋𝑖 𝑁 𝑖=1 𝑉𝑎𝑟 𝑋 = 1 𝑁 𝑋𝑖 − 𝐸 𝑋 2 𝑁 𝑖=1

(11)

• Considere que o conjunto dos valores da característica de interesse da população é

{1,3,6,8}

. • 𝐸 𝑋 = 𝜇 = 1 4 1 + 3 + 6 + 8 = 4,5 • 𝑉𝑎𝑟 𝑋 = 𝜎2 = 1₄ 1 − 4,5 2 − 3 − 4,5 2 − 6 − 4,5 2 − 8 − 4,5 2 = 7,25 • Amostra 1,3 : 𝑋 = 1 2 1 + 3 = 2 e 𝑆 2 _{= 2} • Amostra 1,1 : 𝑋 = 1 2 1 + 1 = 1 e 𝑆2 = 0 • Amostra 3,8 : 𝑋 = 1 2 3 + 8 = 5,5 e 𝑆2 = 12,5

(12)

Intervalo de confiança para

𝜇 com 𝜎

conhecido.

• A média amostral 𝑋 fornece uma boa estimativa para a

media populacional 𝜇.

𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎2 𝑛

Objetivo:

• Obter um intervalo [𝑎 − 𝜖, 𝑎 + 𝜖] onde espera-se que o

verdadeiro valor de um certo parâmetro da população esteja contido “na maioria das diferentes amostras

(13)

Pode ser escrita como distribuição normal padrão:

𝑍 =

𝑋 − 𝜇

𝜎

2 𝑛

= 𝑛

𝑋 − 𝜇

𝜎

~𝑁 0,1

(14)

Notação

Dada uma v.a. 𝑍~𝑁(0,1)

𝑃 𝑍 > 𝑧

_𝛼

= 𝛼

(15)

Observe

(16)

𝑃 −𝑧_𝛼/2≤ 𝑛 𝜎 ≤ 𝑧𝛼/2 = 1 − 𝛼 𝑃 𝑋 −𝑧_𝛼/2 𝜎 𝑛 ≤ 𝜇 ≤ 𝑋 + 𝑧𝛼/2 𝜎 𝑛 = 1 − 𝛼 𝑃 𝜇 ∈ 𝑋 −𝑧_𝛼/2 𝜎 𝑛 , 𝑋 + 𝑧𝛼2 𝜎 𝑛 = 1 − 𝛼

(17)

Conclusão: Intervalo de confiança para a média de uma

população normal com variância conhecida.

Seja 𝑋~𝑁 𝜇, 𝜎2 uma população normal com variância 𝜎2 conhecida. Se 𝑋₁, 𝑋₂, … , 𝑋_𝑛 é uma amostra aleatória simples dessa população, então o intervalo de confiança de nível de confiança 1 − 𝛼 para a média populacional 𝜇 é dado por:

𝑋 −𝑧

_𝛼/2

𝜎

𝑛

, 𝑋 + 𝑧

𝛼/2

𝜎

𝑛

(18)

Conclusão: Intervalo de confiança para a média de uma

população normal com variância conhecida.

X − ϵ , X + ϵ

onde

ϵ = z

_α/2 σ

n é a margem de erro.

Diferentes amostras fornecem diferentes intervalos de

confiança, mas uma proporção de 1 − α desses intervalos irá conter o verdadeiro valor de 𝜇.

(19)

Na prática...

• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2

25 , 5 + 1,96 2

25 com

nível de confiança 0,95.

• Sorteamos outra amostra, construímos outro intervalo com mesmo nível de confiança.

• Então 95% dos intervalos construídos conteriam o verdadeiro valor de 𝜇.

(20)

• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2 25 , 5 + 1,96 2 25 com nível de confiança 0,95.

• É ERRADO afirmar: há uma probabilidade de 0,95 do intervalo 𝟓 − 1,96 2

25 , 𝟓 + 1,96 2

25 conter o verdadeiro

valor de μ.

• É CORRETO afirmar: há uma probabilidade de 0,95 do intervalo 𝑿 − 1,96 2

25 , 𝑿 + 1,96 2

25 conter o verdadeiro

(21)

Em determinada população, o peso dos homens adultos é distribuído normalmente com um desvio padrão de 16 kg. Uma amostra aleatória simples de 36 homens adultos é sorteada desta população, obtendo-se um peso médio de 78,2 kg. Construa um intervalo de confiança de nível de confiança 0,95 para o peso médio de todos os homens adultos dessa população.

Solução

• 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔

• Nível de confiança: 1 − 𝛼 = 0,95 ⇒ 𝛼 = 0,05 e 𝛼

(22)

Solução 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑃 𝑍 > 𝑧_𝛼/2 = 𝛼 2 = 0,025 𝑃 𝑍 ≤ 𝑧_𝛼/2 = 0,975

(23)

(24)

𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼

2 = 0,025 𝑧𝛼/2 = 1,96

(25)

𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑧𝛼/2 = 1,96 𝑥 −𝑧_𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 78,2 − 1,96 × 16 36 , 78,2 + 1,96 × 16 36 = [72,9733 ; 83,7267]

OBS: Esse intervalo contém ou não o verdadeiro valor de 𝜇, mas o procedimento

utilizado para sua obtenção nos garante que há 95% de chance de estarmos

(26)

X − ϵ , X + ϵ

Margem de erro: 𝜖 =

𝑧

_𝛼/2 𝜎

𝑛

A margem de erro:

• É inversamente proporcional ao tamanho da amostra.

• É diretamente e proporcional ao desvio padrão populacional.

Aumentar a probabilidade de acerto significa aumentar o nível de confiança, o que acarreta em um valor crítico 𝑧_𝛼/2 maior.

(27)

De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da

amostra?

Solução

Nível de confiança 0,90 ⇒ 𝛼 = 0,10

(28)

(29)

De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da

amostra?

Solução

Nível de confiança 0,90 ⇒ 𝛼 = 0,10

𝑃 𝑍 > 𝑧_0,05 = 𝛼₂ = 0,05 ⇒ 𝑃 𝑍 ≤ 𝑧_0,05 = 0,95 ⇒ 𝑧_0,05 = 1,645 2 = 𝜖 = 1,645 × 5_𝑛 ⇒ 𝑛 = 16,91 ≈ 17 (sempre para cima)

(30)

O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.

a) Obtenha o intervalo de confiança para 𝜇 com nível de

confiança 0, 99.

b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.

Escolhida aleatoriamente uma peça da população, qual a probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor

𝑥 +

1

(31)

O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.

a) Obtenha o intervalo de confiança para 𝜇 com nível de

confiança 0, 99. Solução 𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧_𝛼/2 = 𝛼 2 = 0,005 ⇒ 𝑍 ≤ 𝑧𝛼/2 = 0,995

(32)

(33)

𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧_𝛼/2 = 0,005 ⇒ 𝑍 ≤ 𝑧_𝛼/2 = 0,995 ⇒ 𝑧_𝛼/2 = 2,575 Intervalo de confiança: 𝑥 −𝑧_𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 2,8 − 2,575 × 1,7 25 , 2,8 + 2,575 × 1,7 25 = [1,9245 ; 3,6755]

(34)

𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8

b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.

Escolhida aleatoriamente uma peça da população, qual a

probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor 𝑥 + 1 6𝜖. Solução 𝜖 = 2,575 × 1,7₂₅ ⇒ 𝑥 + 1₂𝜖 = 2,8 + 1₆ × 2,575 × 1,7₅ = 2,946 Considere 𝑋~𝑁(2,946; 1,72) 𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03

(35)

𝑃(𝑍 < 0,14)

𝑃𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03 = 0,5120 A probabilidade de fornecer maior lucro é de 51,20%

(36)

•

Estimação de um intervalo para média de uma

população normal, cuja variância é desconhecida;

•

Com uma única amostra precisamos estimar média

e a variância;

(37)

Já vimos: 𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎 2 𝑛 ⇒ 𝑍 = 𝑛 𝑋 − 𝜇 𝜎 ~𝑁(0,1) E construímos o intervalo de confiança:

𝑋 −𝑧

_𝛼/2

𝜎

𝑛

, 𝑋 + 𝑧

𝛼/2

𝜎

𝑛

Para o caso em que conhecemos o desvio padrão 𝜎. Como fazer quando tal parâmetro é desconhecido??

(38)

Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:

𝑆2 = 1

𝑛 − 1 𝑋𝑖 − 𝑋

2 𝑛

(39)

𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 Forma simplificada para cálculos

(40)

𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1

Vamos substituir o valor de 𝜎 por 𝑆. 𝑍 = 𝑛 𝑋 − 𝜇

𝜎 ~𝑁 0,1 ⇒ 𝑇 = 𝑛

𝑋 − 𝜇 𝑆

Ao fazer a substituição a distribuição amostral deixa de ser normal

(41)

Teorema

Se 𝑋₁, 𝑋₂, … , 𝑋_𝑛 é uma amostra aleatória simples de uma população 𝑋~𝑁(𝜇, 𝜎2) então:

𝑇 = 𝑛 𝑋 − 𝜇

𝑆 ~𝑡(𝑛 − 1)

Onde 𝑡(𝑛 − 1) representa a distribuição t-Student com grau de liberdade 𝑛 − 1.

(42)

Definição do intervalo de confiança:

Seja 𝑋₁, 𝑋₂, … , 𝑋_𝑛 é uma amostra aleatória simples de uma

população 𝑋~𝑁(𝜇, 𝜎2) então o intervalo de confiança de nível de confiança 1 − 𝛼 é:

𝑋 − 𝑡_{𝑛−1;𝛼/2} 𝑆

𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆

𝑛

Onde 𝑡_{𝑛−1;𝛼/2} é o valor crítico da distribuição t-Student com 𝑛 − 1 graus de liberdade que deixa área 𝛼

(43)

• cada coluna corresponde a uma área 𝛼

2 na cauda superior.

(44)

Margem de erro

Novamente o intervalo de confiança é dado por 𝑋 ± 𝜖. Onde

𝜖 = 𝑡

_{𝑛−1;𝛼/2} 𝑆

𝑛 é chamado margem de erro.

Comparação com o caso “𝝈𝟐 conhecido”.

(45)

Exemplo

De uma população normal com média e variância

desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-se 𝑥 = 12 e 𝑠2 = 49. Obtenha um intervalo de

confiança para a verdadeira média populacional, utilizando o nível de confiança 95%.

SOLUÇÃO

Temos 𝜎 desconhecido.

O intervalo de confiança para 𝜇 é dado por 𝑋 − 𝑡_{𝑛−1;𝛼/2} 𝑆

𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆

(46)

Exemplo: SOLUÇÃO

Distribuição t-Student com grau de liberdade

𝑛 − 1 = 15 − 1 = 14

Nível de confiança:

1 − 𝛼 = 0,95 ⇒ 𝛼/2 = 0,025

(47)

(48)

•

𝑥 = 12 e 𝑠

2

= 49

(dados do problema)

•

𝑡

₁₄

; 0,025 =2,145

Logo o intervalo de confiança para 𝜇 é: 12 − 2,145 7

15 , 12 + 2,145 7

(49)

Amostras grandes para distribuição normal

• Para obter o intervalo de confiança:

• Quando o σ2 é desconhecido usamos a distribuição t.

• Quando o σ2 é conhecido usamos a distribuição N(0,1).

• Quando 𝑛 é suficientemente grande (𝑛 > 31)

• a diferença entre as distribuições 𝑡 e 𝑁(0,1) é desprezível.

(50)

simples 𝑋₁, 𝑋₂, … , 𝑋_𝑛 com o objetivo de obter uma estimativa intervalar para média da população (𝜇) com nível de confiança 1 − α.

• 𝝈𝟐 conhecida

Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑧_𝛼/2. 𝜎_𝑛

• 𝝈𝟐 deconhecida

Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑡_{𝑛−1;𝛼/2}. 𝜎_𝑛

Quando 𝑛 > 31 pode-se usar 𝑧_𝛼/2 no lugar de 𝑡_{𝑛−1;𝛼/2}.

• Margem de erro: 𝜖

(51)

Os tempos gastos por quinze funcionários em uma das tarefas de um programa de treinamento estão listados abaixo.

É razoável supor, nesse caso, que essa seja uma amostra aleatória simples de uma população normal, ou seja, é

razoável supor que a população de todos os tempos de funcionários submetidos a esse treinamento seja

aproximadamente normal. Obtenha o intervalo de confiança de nível de confiança de 90% para o tempo médio

populacional.

52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

(52)

𝑛 = 15

1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡_14;0,05 =? ? ? 52 44 55 44 45 59 50 54

(53)

(54)

𝑛 = 15 1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡_14;0,05 = 1,761 𝑥 = ∑𝑥𝑖 15 = 53,87 𝑆2 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 = 1 14 44176 − 15. 53,87 2 = 46,5524 𝑆 = 46,5524 𝜖 = 𝑡_14;0,05 × 𝜎 𝑛 = 1,761 × 46,5524 15 = 3,1023 52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

(55)

𝑛 = 15 Então o intervalo de confiança é 𝑥 − 𝜖; 𝑥 + 𝜖

53,8667 − 3,1023 ; 53,8667 + 3,1023 =

= 50,7644 ; 56,969

.

Se o nível de confiança exigido fosse 𝟗𝟗% a margem de erro seria maior ou menor que a obtida?

52 44 55 44 45 59 50 54 62 46 54 58 60 62 63