INFERÊNCIA ESTATÍSTICA
INTERVALO DE CONFIANÇA
PROF. ÁTILA
Aula 06
Introdução à inferência estatística Intervalo de confiança para 𝜇
• 𝜎2 conhecida.
1ª parte:
Como resumir descritivamente variáveis
associadas a um ou mais conjuntos de dados.
2ª parte:
Estudamos modelos probabilísticos capazes de
representar o comportamento das variáveis.
3ª parte:
Vamos estudar os argumentos estatísticos para
fazer afirmações sobre uma população.
•
Como modelar a distribuição referente as alturas
dos brasileiros?
Resposta: Modelo normal.
𝜇 =?
𝜎 = ?
•
Como modelar a distribuição referente as alturas
dos brasileiros?
Resposta: Modelo normal. Nova questão: 𝜇 =? 𝜎 =?
Solução: coletar uma amostra, analisá-la e inferir
•
População: conjunto de todos os elementos.
•
Amostra: qualquer subconjunto da população.
Exemplo
Estudar a proporção de indivíduos na cidade de Juiz
de Fora que são favoráveis ao partido político A.
• População: todos os habitantes (550 000)
Exemplo
Considere 𝑋 o peso real de pacotes de café
enchidos por uma máquina. Considere que
𝑋~𝑁 𝜇, 𝜎
2, cujos parâmetros são desconhecidos.
• População: todos os pacotes enchidos ou que virão a ser enchidos pela máquina.
• Amostra: sorteamos 100 pacotes com pesos 𝑋1, 𝑋2, … , 𝑋100
Inferência Estatística
Produzir afirmações sobre a característica da
população a partir de informações colhidas de uma
amostra.
Se temos a função de probabilidade (ou de
uma v.a. 𝑋 que descreve a característica de interesse.
• Amostra aleatória simples: conjunto de v.a. 𝑋1, 𝑋2, … , 𝑋𝑛
independentes e identicamente distribuídas.
Exemplo
• Se 𝑋 representa a altura das pessoas de uma cidade.
• 𝑋1= “altura do primeiro elemento”; • 𝑋2 =“altura do segundo elemento”
...
uma v.a. 𝑋 que descreve a característica de interesse.
• Amostra aleatória simples: conjunto de v.a. 𝑋1, 𝑋2, … , 𝑋𝑛
independentes e identicamente distribuídas, obtidas por retiradas com reposição.
• Média amostral:
𝑋 =
𝑋1+𝑋2+⋯+𝑋𝑛𝑛
• Variância amostral:
𝑆
2=
1𝑛−1
∑ 𝑋
𝑖− 𝑋
2Média 𝜇 𝑋 Variância 𝜎2 𝑆2 Número de elementos 𝑁 𝑛 𝜇 = 𝐸 𝑋 = 1 𝑁 𝑋𝑖 𝑁 𝑖=1 𝑉𝑎𝑟 𝑋 = 1 𝑁 𝑋𝑖 − 𝐸 𝑋 2 𝑁 𝑖=1
• Considere que o conjunto dos valores da característica de interesse da população é
{1,3,6,8}
. • 𝐸 𝑋 = 𝜇 = 1 4 1 + 3 + 6 + 8 = 4,5 • 𝑉𝑎𝑟 𝑋 = 𝜎2 = 14 1 − 4,5 2 − 3 − 4,5 2 − 6 − 4,5 2 − 8 − 4,5 2 = 7,25 • Amostra 1,3 : 𝑋 = 1 2 1 + 3 = 2 e 𝑆 2 = 2 • Amostra 1,1 : 𝑋 = 1 2 1 + 1 = 1 e 𝑆2 = 0 • Amostra 3,8 : 𝑋 = 1 2 3 + 8 = 5,5 e 𝑆2 = 12,5Intervalo de confiança para
𝜇 com 𝜎
conhecido.
• A média amostral 𝑋 fornece uma boa estimativa para a
media populacional 𝜇.
𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎2 𝑛
Objetivo:
• Obter um intervalo [𝑎 − 𝜖, 𝑎 + 𝜖] onde espera-se que o
verdadeiro valor de um certo parâmetro da população esteja contido “na maioria das diferentes amostras
Pode ser escrita como distribuição normal padrão:
𝑍 =
𝑋 − 𝜇
𝜎
2
𝑛
= 𝑛
𝑋 − 𝜇
𝜎
~𝑁 0,1
Notação
Dada uma v.a. 𝑍~𝑁(0,1)
𝑃 𝑍 > 𝑧
𝛼= 𝛼
Observe
𝑃 −𝑧𝛼/2≤ 𝑛 𝜎 ≤ 𝑧𝛼/2 = 1 − 𝛼 𝑃 𝑋 −𝑧𝛼/2 𝜎 𝑛 ≤ 𝜇 ≤ 𝑋 + 𝑧𝛼/2 𝜎 𝑛 = 1 − 𝛼 𝑃 𝜇 ∈ 𝑋 −𝑧𝛼/2 𝜎 𝑛 , 𝑋 + 𝑧𝛼2 𝜎 𝑛 = 1 − 𝛼
Conclusão: Intervalo de confiança para a média de uma
população normal com variância conhecida.
Seja 𝑋~𝑁 𝜇, 𝜎2 uma população normal com variância 𝜎2 conhecida. Se 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples dessa população, então o intervalo de confiança de nível de confiança 1 − 𝛼 para a média populacional 𝜇 é dado por:
𝑋 −𝑧
𝛼/2𝜎
𝑛
, 𝑋 + 𝑧
𝛼/2𝜎
𝑛
Conclusão: Intervalo de confiança para a média de uma
população normal com variância conhecida.
X − ϵ , X + ϵ
onde
ϵ = z
α/2 σn é a margem de erro.
Diferentes amostras fornecem diferentes intervalos de
confiança, mas uma proporção de 1 − α desses intervalos irá conter o verdadeiro valor de 𝜇.
Na prática...
• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2
25 , 5 + 1,96 2
25 com
nível de confiança 0,95.
• Sorteamos outra amostra, construímos outro intervalo com mesmo nível de confiança.
• Então 95% dos intervalos construídos conteriam o verdadeiro valor de 𝜇.
• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2 25 , 5 + 1,96 2 25 com nível de confiança 0,95.
• É ERRADO afirmar: há uma probabilidade de 0,95 do intervalo 𝟓 − 1,96 2
25 , 𝟓 + 1,96 2
25 conter o verdadeiro
valor de μ.
• É CORRETO afirmar: há uma probabilidade de 0,95 do intervalo 𝑿 − 1,96 2
25 , 𝑿 + 1,96 2
25 conter o verdadeiro
Em determinada população, o peso dos homens adultos é distribuído normalmente com um desvio padrão de 16 kg. Uma amostra aleatória simples de 36 homens adultos é sorteada desta população, obtendo-se um peso médio de 78,2 kg. Construa um intervalo de confiança de nível de confiança 0,95 para o peso médio de todos os homens adultos dessa população.
Solução
• 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔
• Nível de confiança: 1 − 𝛼 = 0,95 ⇒ 𝛼 = 0,05 e 𝛼
Solução 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼 2 = 0,025 𝑃 𝑍 ≤ 𝑧𝛼/2 = 0,975
𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼
2 = 0,025 𝑧𝛼/2 = 1,96
𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑧𝛼/2 = 1,96 𝑥 −𝑧𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 78,2 − 1,96 × 16 36 , 78,2 + 1,96 × 16 36 = [72,9733 ; 83,7267]
OBS: Esse intervalo contém ou não o verdadeiro valor de 𝜇, mas o procedimento
utilizado para sua obtenção nos garante que há 95% de chance de estarmos
X − ϵ , X + ϵ
Margem de erro: 𝜖 =𝑧
𝛼/2 𝜎𝑛
A margem de erro:
• É inversamente proporcional ao tamanho da amostra.
• É diretamente e proporcional ao desvio padrão populacional.
Aumentar a probabilidade de acerto significa aumentar o nível de confiança, o que acarreta em um valor crítico 𝑧𝛼/2 maior.
De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da
amostra?
Solução
Nível de confiança 0,90 ⇒ 𝛼 = 0,10
De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da
amostra?
Solução
Nível de confiança 0,90 ⇒ 𝛼 = 0,10
𝑃 𝑍 > 𝑧0,05 = 𝛼2 = 0,05 ⇒ 𝑃 𝑍 ≤ 𝑧0,05 = 0,95 ⇒ 𝑧0,05 = 1,645 2 = 𝜖 = 1,645 × 5𝑛 ⇒ 𝑛 = 16,91 ≈ 17 (sempre para cima)
O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.
a) Obtenha o intervalo de confiança para 𝜇 com nível de
confiança 0, 99.
b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.
Escolhida aleatoriamente uma peça da população, qual a probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor
𝑥 +
1O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.
a) Obtenha o intervalo de confiança para 𝜇 com nível de
confiança 0, 99. Solução 𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼 2 = 0,005 ⇒ 𝑍 ≤ 𝑧𝛼/2 = 0,995
𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧𝛼/2 = 0,005 ⇒ 𝑍 ≤ 𝑧𝛼/2 = 0,995 ⇒ 𝑧𝛼/2 = 2,575 Intervalo de confiança: 𝑥 −𝑧𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 2,8 − 2,575 × 1,7 25 , 2,8 + 2,575 × 1,7 25 = [1,9245 ; 3,6755]
𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8
b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.
Escolhida aleatoriamente uma peça da população, qual a
probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor 𝑥 + 1 6𝜖. Solução 𝜖 = 2,575 × 1,725 ⇒ 𝑥 + 12𝜖 = 2,8 + 16 × 2,575 × 1,75 = 2,946 Considere 𝑋~𝑁(2,946; 1,72) 𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03
𝑃(𝑍 < 0,14)
𝑃𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03 = 0,5120 A probabilidade de fornecer maior lucro é de 51,20%
•
Estimação de um intervalo para média de uma
população normal, cuja variância é desconhecida;
•
Com uma única amostra precisamos estimar média
e a variância;
Já vimos: 𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎 2 𝑛 ⇒ 𝑍 = 𝑛 𝑋 − 𝜇 𝜎 ~𝑁(0,1) E construímos o intervalo de confiança:
𝑋 −𝑧
𝛼/2𝜎
𝑛
, 𝑋 + 𝑧
𝛼/2𝜎
𝑛
Para o caso em que conhecemos o desvio padrão 𝜎. Como fazer quando tal parâmetro é desconhecido??
Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:
𝑆2 = 1
𝑛 − 1 𝑋𝑖 − 𝑋
2 𝑛
Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:
𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 Forma simplificada para cálculos
Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:
𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1
Vamos substituir o valor de 𝜎 por 𝑆. 𝑍 = 𝑛 𝑋 − 𝜇
𝜎 ~𝑁 0,1 ⇒ 𝑇 = 𝑛
𝑋 − 𝜇 𝑆
Ao fazer a substituição a distribuição amostral deixa de ser normal
Teorema
Se 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples de uma população 𝑋~𝑁(𝜇, 𝜎2) então:
𝑇 = 𝑛 𝑋 − 𝜇
𝑆 ~𝑡(𝑛 − 1)
Onde 𝑡(𝑛 − 1) representa a distribuição t-Student com grau de liberdade 𝑛 − 1.
Definição do intervalo de confiança:
Seja 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples de uma
população 𝑋~𝑁(𝜇, 𝜎2) então o intervalo de confiança de nível de confiança 1 − 𝛼 é:
𝑋 − 𝑡𝑛−1;𝛼/2 𝑆
𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆
𝑛
Onde 𝑡𝑛−1;𝛼/2 é o valor crítico da distribuição t-Student com 𝑛 − 1 graus de liberdade que deixa área 𝛼
• cada coluna corresponde a uma área 𝛼
2 na cauda superior.
Margem de erro
Novamente o intervalo de confiança é dado por 𝑋 ± 𝜖. Onde
𝜖 = 𝑡
𝑛−1;𝛼/2 𝑆𝑛 é chamado margem de erro.
Comparação com o caso “𝝈𝟐 conhecido”.
Exemplo
De uma população normal com média e variância
desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-se 𝑥 = 12 e 𝑠2 = 49. Obtenha um intervalo de
confiança para a verdadeira média populacional, utilizando o nível de confiança 95%.
SOLUÇÃO
Temos 𝜎 desconhecido.
O intervalo de confiança para 𝜇 é dado por 𝑋 − 𝑡𝑛−1;𝛼/2 𝑆
𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆
Exemplo: SOLUÇÃO
Distribuição t-Student com grau de liberdade
𝑛 − 1 = 15 − 1 = 14
Nível de confiança:
1 − 𝛼 = 0,95 ⇒ 𝛼/2 = 0,025
Exemplo: SOLUÇÃO
Exemplo: SOLUÇÃO
•
𝑥 = 12 e 𝑠
2= 49
(dados do problema)•
𝑡
14; 0,025 =2,145
Logo o intervalo de confiança para 𝜇 é: 12 − 2,145 7
15 , 12 + 2,145 7
Amostras grandes para distribuição normal
• Para obter o intervalo de confiança:
• Quando o σ2 é desconhecido usamos a distribuição t.
• Quando o σ2 é conhecido usamos a distribuição N(0,1).
• Quando 𝑛 é suficientemente grande (𝑛 > 31)
• a diferença entre as distribuições 𝑡 e 𝑁(0,1) é desprezível.
simples 𝑋1, 𝑋2, … , 𝑋𝑛 com o objetivo de obter uma estimativa intervalar para média da população (𝜇) com nível de confiança 1 − α.
• 𝝈𝟐 conhecida
Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑧𝛼/2. 𝜎𝑛
• 𝝈𝟐 deconhecida
Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑡𝑛−1;𝛼/2. 𝜎𝑛
Quando 𝑛 > 31 pode-se usar 𝑧𝛼/2 no lugar de 𝑡𝑛−1;𝛼/2.
• Margem de erro: 𝜖
Os tempos gastos por quinze funcionários em uma das tarefas de um programa de treinamento estão listados abaixo.
É razoável supor, nesse caso, que essa seja uma amostra aleatória simples de uma população normal, ou seja, é
razoável supor que a população de todos os tempos de funcionários submetidos a esse treinamento seja
aproximadamente normal. Obtenha o intervalo de confiança de nível de confiança de 90% para o tempo médio
populacional.
52 44 55 44 45 59 50 54 62 46 54 58 60 62 63
𝑛 = 15
1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡14;0,05 =? ? ? 52 44 55 44 45 59 50 54
𝑛 = 15 1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡14;0,05 = 1,761 𝑥 = ∑𝑥𝑖 15 = 53,87 𝑆2 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 = 1 14 44176 − 15. 53,87 2 = 46,5524 𝑆 = 46,5524 𝜖 = 𝑡14;0,05 × 𝜎 𝑛 = 1,761 × 46,5524 15 = 3,1023 52 44 55 44 45 59 50 54 62 46 54 58 60 62 63
𝑛 = 15 Então o intervalo de confiança é 𝑥 − 𝜖; 𝑥 + 𝜖
53,8667 − 3,1023 ; 53,8667 + 3,1023 =
= 50,7644 ; 56,969
.Se o nível de confiança exigido fosse 𝟗𝟗% a margem de erro seria maior ou menor que a obtida?
52 44 55 44 45 59 50 54 62 46 54 58 60 62 63