• Nenhum resultado encontrado

Aula06 - Intervalo de Confiança- EstatProb

N/A
N/A
Protected

Academic year: 2021

Share "Aula06 - Intervalo de Confiança- EstatProb"

Copied!
55
0
0

Texto

(1)

INFERÊNCIA ESTATÍSTICA

INTERVALO DE CONFIANÇA

PROF. ÁTILA

Aula 06

Introdução à inferência estatística Intervalo de confiança para 𝜇

• 𝜎2 conhecida.

(2)

1ª parte:

Como resumir descritivamente variáveis

associadas a um ou mais conjuntos de dados.

2ª parte:

Estudamos modelos probabilísticos capazes de

representar o comportamento das variáveis.

3ª parte:

Vamos estudar os argumentos estatísticos para

fazer afirmações sobre uma população.

(3)

Como modelar a distribuição referente as alturas

dos brasileiros?

Resposta: Modelo normal.

𝜇 =?

𝜎 = ?

(4)

Como modelar a distribuição referente as alturas

dos brasileiros?

Resposta: Modelo normal. Nova questão: 𝜇 =? 𝜎 =?

Solução: coletar uma amostra, analisá-la e inferir

(5)

População: conjunto de todos os elementos.

Amostra: qualquer subconjunto da população.

Exemplo

Estudar a proporção de indivíduos na cidade de Juiz

de Fora que são favoráveis ao partido político A.

• População: todos os habitantes (550 000)

(6)

Exemplo

Considere 𝑋 o peso real de pacotes de café

enchidos por uma máquina. Considere que

𝑋~𝑁 𝜇, 𝜎

2

, cujos parâmetros são desconhecidos.

• População: todos os pacotes enchidos ou que virão a ser enchidos pela máquina.

• Amostra: sorteamos 100 pacotes com pesos 𝑋1, 𝑋2, … , 𝑋100

(7)

Inferência Estatística

Produzir afirmações sobre a característica da

população a partir de informações colhidas de uma

amostra.

Se temos a função de probabilidade (ou de

(8)

uma v.a. 𝑋 que descreve a característica de interesse.

• Amostra aleatória simples: conjunto de v.a. 𝑋1, 𝑋2, … , 𝑋𝑛

independentes e identicamente distribuídas.

Exemplo

• Se 𝑋 representa a altura das pessoas de uma cidade.

• 𝑋1= “altura do primeiro elemento”; • 𝑋2 =“altura do segundo elemento”

...

(9)

uma v.a. 𝑋 que descreve a característica de interesse.

Amostra aleatória simples: conjunto de v.a. 𝑋1, 𝑋2, … , 𝑋𝑛

independentes e identicamente distribuídas, obtidas por retiradas com reposição.

• Média amostral:

𝑋 =

𝑋1+𝑋2+⋯+𝑋𝑛

𝑛

• Variância amostral:

𝑆

2

=

1

𝑛−1

∑ 𝑋

𝑖

− 𝑋

2

(10)

Média 𝜇 𝑋 Variância 𝜎2 𝑆2 Número de elementos 𝑁 𝑛 𝜇 = 𝐸 𝑋 = 1 𝑁 𝑋𝑖 𝑁 𝑖=1 𝑉𝑎𝑟 𝑋 = 1 𝑁 𝑋𝑖 − 𝐸 𝑋 2 𝑁 𝑖=1

(11)

• Considere que o conjunto dos valores da característica de interesse da população é

{1,3,6,8}

. • 𝐸 𝑋 = 𝜇 = 1 4 1 + 3 + 6 + 8 = 4,5 • 𝑉𝑎𝑟 𝑋 = 𝜎2 = 14 1 − 4,5 2 − 3 − 4,5 2 − 6 − 4,5 2 − 8 − 4,5 2 = 7,25 • Amostra 1,3 : 𝑋 = 1 2 1 + 3 = 2 e 𝑆 2 = 2 • Amostra 1,1 : 𝑋 = 1 2 1 + 1 = 1 e 𝑆2 = 0 • Amostra 3,8 : 𝑋 = 1 2 3 + 8 = 5,5 e 𝑆2 = 12,5

(12)

Intervalo de confiança para

𝜇 com 𝜎

conhecido.

• A média amostral 𝑋 fornece uma boa estimativa para a

media populacional 𝜇.

𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎2 𝑛

Objetivo:

• Obter um intervalo [𝑎 − 𝜖, 𝑎 + 𝜖] onde espera-se que o

verdadeiro valor de um certo parâmetro da população esteja contido “na maioria das diferentes amostras

(13)

Pode ser escrita como distribuição normal padrão:

𝑍 =

𝑋 − 𝜇

𝜎

2

𝑛

= 𝑛

𝑋 − 𝜇

𝜎

~𝑁 0,1

(14)

Notação

Dada uma v.a. 𝑍~𝑁(0,1)

𝑃 𝑍 > 𝑧

𝛼

= 𝛼

(15)

Observe

(16)

𝑃 −𝑧𝛼/2≤ 𝑛 𝜎 ≤ 𝑧𝛼/2 = 1 − 𝛼 𝑃 𝑋 −𝑧𝛼/2 𝜎 𝑛 ≤ 𝜇 ≤ 𝑋 + 𝑧𝛼/2 𝜎 𝑛 = 1 − 𝛼 𝑃 𝜇 ∈ 𝑋 −𝑧𝛼/2 𝜎 𝑛 , 𝑋 + 𝑧𝛼2 𝜎 𝑛 = 1 − 𝛼

(17)

Conclusão: Intervalo de confiança para a média de uma

população normal com variância conhecida.

Seja 𝑋~𝑁 𝜇, 𝜎2 uma população normal com variância 𝜎2 conhecida. Se 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples dessa população, então o intervalo de confiança de nível de confiança 1 − 𝛼 para a média populacional 𝜇 é dado por:

𝑋 −𝑧

𝛼/2

𝜎

𝑛

, 𝑋 + 𝑧

𝛼/2

𝜎

𝑛

(18)

Conclusão: Intervalo de confiança para a média de uma

população normal com variância conhecida.

X − ϵ , X + ϵ

onde

ϵ = z

α/2 σ

n é a margem de erro.

Diferentes amostras fornecem diferentes intervalos de

confiança, mas uma proporção de 1 − α desses intervalos irá conter o verdadeiro valor de 𝜇.

(19)

Na prática...

• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2

25 , 5 + 1,96 2

25 com

nível de confiança 0,95.

• Sorteamos outra amostra, construímos outro intervalo com mesmo nível de confiança.

• Então 95% dos intervalos construídos conteriam o verdadeiro valor de 𝜇.

(20)

• Considere uma amostra de tamanho 25 que fornece o intervalo de confiança 5 − 1,96 2 25 , 5 + 1,96 2 25 com nível de confiança 0,95.

É ERRADO afirmar: há uma probabilidade de 0,95 do intervalo 𝟓 − 1,96 2

25 , 𝟓 + 1,96 2

25 conter o verdadeiro

valor de μ.

É CORRETO afirmar: há uma probabilidade de 0,95 do intervalo 𝑿 − 1,96 2

25 , 𝑿 + 1,96 2

25 conter o verdadeiro

(21)

Em determinada população, o peso dos homens adultos é distribuído normalmente com um desvio padrão de 16 kg. Uma amostra aleatória simples de 36 homens adultos é sorteada desta população, obtendo-se um peso médio de 78,2 kg. Construa um intervalo de confiança de nível de confiança 0,95 para o peso médio de todos os homens adultos dessa população.

Solução

• 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔

• Nível de confiança: 1 − 𝛼 = 0,95 ⇒ 𝛼 = 0,05 e 𝛼

(22)

Solução 𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼 2 = 0,025 𝑃 𝑍 ≤ 𝑧𝛼/2 = 0,975

(23)
(24)

𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼

2 = 0,025 𝑧𝛼/2 = 1,96

(25)

𝑛 = 36 𝜎 = 16 𝑥 = 78,2 𝑘𝑔 𝛼 = 0,05 𝛼 2 = 0,025 𝑧𝛼/2 = 1,96 𝑥 −𝑧𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 78,2 − 1,96 × 16 36 , 78,2 + 1,96 × 16 36 = [72,9733 ; 83,7267]

OBS: Esse intervalo contém ou não o verdadeiro valor de 𝜇, mas o procedimento

utilizado para sua obtenção nos garante que há 95% de chance de estarmos

(26)

X − ϵ , X + ϵ

Margem de erro: 𝜖 =

𝑧

𝛼/2 𝜎

𝑛

A margem de erro:

• É inversamente proporcional ao tamanho da amostra.

• É diretamente e proporcional ao desvio padrão populacional.

Aumentar a probabilidade de acerto significa aumentar o nível de confiança, o que acarreta em um valor crítico 𝑧𝛼/2 maior.

(27)

De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da

amostra?

Solução

Nível de confiança 0,90 ⇒ 𝛼 = 0,10

(28)
(29)

De uma população normal com variância 25 extrai-se uma amostra aleatória simples de tamanho 𝑛 com o objetivo de se estimar a média populacional 𝜇 com um nível de confiança de 90% e margem de erro de 2. Qual deve ser o tamanho da

amostra?

Solução

Nível de confiança 0,90 ⇒ 𝛼 = 0,10

𝑃 𝑍 > 𝑧0,05 = 𝛼2 = 0,05 ⇒ 𝑃 𝑍 ≤ 𝑧0,05 = 0,95 ⇒ 𝑧0,05 = 1,645 2 = 𝜖 = 1,645 × 5𝑛 ⇒ 𝑛 = 16,91 ≈ 17 (sempre para cima)

(30)

O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.

a) Obtenha o intervalo de confiança para 𝜇 com nível de

confiança 0, 99.

b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.

Escolhida aleatoriamente uma peça da população, qual a probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor

𝑥 +

1

(31)

O peso 𝑋 de um certo artigo é descrito aproximadamente por uma distribuição normal com desvio padrão 1,7. Uma amostra de tamanho 𝑛 = 25 resultou em 𝑥 = 2,8.

a) Obtenha o intervalo de confiança para 𝜇 com nível de

confiança 0, 99. Solução 𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧𝛼/2 = 𝛼 2 = 0,005 ⇒ 𝑍 ≤ 𝑧𝛼/2 = 0,995

(32)
(33)

𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8 a) Nível de confiança: 1 − 𝛼 = 0,99 ⇒ 𝛼 = 0,01 e 𝛼 2 = 0,005 𝑃 𝑍 > 𝑧𝛼/2 = 0,005 ⇒ 𝑍 ≤ 𝑧𝛼/2 = 0,995 ⇒ 𝑧𝛼/2 = 2,575 Intervalo de confiança: 𝑥 −𝑧𝛼/2 𝜎 𝑛 , 𝑥 + 𝑧𝛼/2 𝜎 𝑛 2,8 − 2,575 × 1,7 25 , 2,8 + 2,575 × 1,7 25 = [1,9245 ; 3,6755]

(34)

𝑛 = 25 𝜎 = 1,7 𝑥 = 2,8

b) Uma peça fornece maior lucro se seu peso é inferior a 3,0.

Escolhida aleatoriamente uma peça da população, qual a

probabilidade da peça fornecer maior lucro? Considere para 𝜇 o valor 𝑥 + 1 6𝜖. Solução 𝜖 = 2,575 × 1,725 ⇒ 𝑥 + 12𝜖 = 2,8 + 16 × 2,575 × 1,75 = 2,946 Considere 𝑋~𝑁(2,946; 1,72) 𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03

(35)

𝑃(𝑍 < 0,14)

𝑃𝑃 𝑋 < 3,0 = 𝑃 𝑍 < 0,03 = 0,5120 A probabilidade de fornecer maior lucro é de 51,20%

(36)

Estimação de um intervalo para média de uma

população normal, cuja variância é desconhecida;

Com uma única amostra precisamos estimar média

e a variância;

(37)

Já vimos: 𝑋~𝑁 𝜇, 𝜎2 ⇒ 𝑋~𝑁 𝜇, 𝜎 2 𝑛 ⇒ 𝑍 = 𝑛 𝑋 − 𝜇 𝜎 ~𝑁(0,1) E construímos o intervalo de confiança:

𝑋 −𝑧

𝛼/2

𝜎

𝑛

, 𝑋 + 𝑧

𝛼/2

𝜎

𝑛

Para o caso em que conhecemos o desvio padrão 𝜎. Como fazer quando tal parâmetro é desconhecido??

(38)

Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:

𝑆2 = 1

𝑛 − 1 𝑋𝑖 − 𝑋

2 𝑛

(39)

Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:

𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 Forma simplificada para cálculos

(40)

Suponha que a variância 𝜎 não seja conhecida. Vamos estimá-la com dados amostrais:

𝑆2 = 1 𝑛 − 1 𝑋𝑖 − 𝑋 2 𝑛 𝑖=1 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1

Vamos substituir o valor de 𝜎 por 𝑆. 𝑍 = 𝑛 𝑋 − 𝜇

𝜎 ~𝑁 0,1 ⇒ 𝑇 = 𝑛

𝑋 − 𝜇 𝑆

Ao fazer a substituição a distribuição amostral deixa de ser normal

(41)

Teorema

Se 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples de uma população 𝑋~𝑁(𝜇, 𝜎2) então:

𝑇 = 𝑛 𝑋 − 𝜇

𝑆 ~𝑡(𝑛 − 1)

Onde 𝑡(𝑛 − 1) representa a distribuição t-Student com grau de liberdade 𝑛 − 1.

(42)

Definição do intervalo de confiança:

Seja 𝑋1, 𝑋2, … , 𝑋𝑛 é uma amostra aleatória simples de uma

população 𝑋~𝑁(𝜇, 𝜎2) então o intervalo de confiança de nível de confiança 1 − 𝛼 é:

𝑋 − 𝑡𝑛−1;𝛼/2 𝑆

𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆

𝑛

Onde 𝑡𝑛−1;𝛼/2 é o valor crítico da distribuição t-Student com 𝑛 − 1 graus de liberdade que deixa área 𝛼

(43)

• cada coluna corresponde a uma área 𝛼

2 na cauda superior.

(44)

Margem de erro

Novamente o intervalo de confiança é dado por 𝑋 ± 𝜖. Onde

𝜖 = 𝑡

𝑛−1;𝛼/2 𝑆

𝑛 é chamado margem de erro.

Comparação com o caso “𝝈𝟐 conhecido”.

(45)

Exemplo

De uma população normal com média e variância

desconhecidas, extrai-se uma amostra de tamanho 15 obtendo-se 𝑥 = 12 e 𝑠2 = 49. Obtenha um intervalo de

confiança para a verdadeira média populacional, utilizando o nível de confiança 95%.

SOLUÇÃO

Temos 𝜎 desconhecido.

O intervalo de confiança para 𝜇 é dado por 𝑋 − 𝑡𝑛−1;𝛼/2 𝑆

𝑛 , 𝑋 + 𝑡𝑛−1;𝛼/2 𝑆

(46)

Exemplo: SOLUÇÃO

Distribuição t-Student com grau de liberdade

𝑛 − 1 = 15 − 1 = 14

Nível de confiança:

1 − 𝛼 = 0,95 ⇒ 𝛼/2 = 0,025

(47)

Exemplo: SOLUÇÃO

(48)

Exemplo: SOLUÇÃO

𝑥 = 12 e 𝑠

2

= 49

(dados do problema)

𝑡

14

; 0,025 =2,145

Logo o intervalo de confiança para 𝜇 é: 12 − 2,145 7

15 , 12 + 2,145 7

(49)

Amostras grandes para distribuição normal

• Para obter o intervalo de confiança:

• Quando o σ2 é desconhecido usamos a distribuição t.

• Quando o σ2 é conhecido usamos a distribuição N(0,1).

Quando 𝑛 é suficientemente grande (𝑛 > 31)

a diferença entre as distribuições 𝑡 e 𝑁(0,1) é desprezível.

(50)

simples 𝑋1, 𝑋2, … , 𝑋𝑛 com o objetivo de obter uma estimativa intervalar para média da população (𝜇) com nível de confiança 1 − α.

• 𝝈𝟐 conhecida

Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑧𝛼/2. 𝜎𝑛

• 𝝈𝟐 deconhecida

Intervalo 𝑋 ± 𝜖, onde 𝜖 = 𝑡𝑛−1;𝛼/2. 𝜎𝑛

Quando 𝑛 > 31 pode-se usar 𝑧𝛼/2 no lugar de 𝑡𝑛−1;𝛼/2.

Margem de erro: 𝜖

(51)

Os tempos gastos por quinze funcionários em uma das tarefas de um programa de treinamento estão listados abaixo.

É razoável supor, nesse caso, que essa seja uma amostra aleatória simples de uma população normal, ou seja, é

razoável supor que a população de todos os tempos de funcionários submetidos a esse treinamento seja

aproximadamente normal. Obtenha o intervalo de confiança de nível de confiança de 90% para o tempo médio

populacional.

52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

(52)

𝑛 = 15

1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡14;0,05 =? ? ? 52 44 55 44 45 59 50 54

(53)
(54)

𝑛 = 15 1 − 𝛼 = 90% ⇒ 𝛼 = 0,10 ⇒ 𝛼 = 0,05 ⇒ 𝑡14;0,05 = 1,761 𝑥 = ∑𝑥𝑖 15 = 53,87 𝑆2 = 1 𝑛 − 1 𝑋𝑖 2 − 𝑛. 𝑋 2 𝑛 𝑖=1 = 1 14 44176 − 15. 53,87 2 = 46,5524 𝑆 = 46,5524 𝜖 = 𝑡14;0,05 × 𝜎 𝑛 = 1,761 × 46,5524 15 = 3,1023 52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

(55)

𝑛 = 15 Então o intervalo de confiança é 𝑥 − 𝜖; 𝑥 + 𝜖

53,8667 − 3,1023 ; 53,8667 + 3,1023 =

= 50,7644 ; 56,969

.

Se o nível de confiança exigido fosse 𝟗𝟗% a margem de erro seria maior ou menor que a obtida?

52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

Referências

Documentos relacionados

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

A estabilidade do corpo docente permanente permite atribuir o conceito muito bom, segundo os parâmetros da área, para o item 2.2 (pelo menos 75% dos docentes permanentes foram

A taxa do INR ideal para os paci- entes com disfunção ventricular e insuficiência cardíaca também não foi estimada por meio de estudos prospectivos e randomizados, e a taxa

Código Descrição Atributo Saldo Anterior D/C Débito Crédito Saldo Final D/C. Este demonstrativo apresenta os dados consolidados da(s)

Ainda nesse passo, impende ressaltar que a presente licitação não impedirá a ora licitante de participar do certame, e como a nulidade detectada não importa em

Se o conserto for necessário dentro do período de garantia, o aparelho deve ser devolvido para um centro de serviço da Home of Living Brands (Pty)

a) As correntes de fases são nulas. No último concurso público realizado em um município do Piauí, verificou-se que numa turma que era composta de 35 candidatos com 22 homens e

Este tipo de implante em forma de lâmina era indicado para ser utilizado unido a dentes ou implantes. Após o preparo de um leito ósseo (canaleta) com uma caneta de