Aula 5. Teste de Hipóteses II.

(1)

Aula 5. Teste de Hipóteses II.

Capítulo 12, Bussab&Morettin “Estatística Básica” 7ª Edição

(2)

Procedimento teste de hipótese para proporção. Resumo.

(1) Estabelecer as hipóteses:

H: 𝑝 =

𝑝

₀

contra uma das alternativas A: 𝑝



𝑝

₀, A:

𝑝



𝑝

₀ ou A:

𝑝



𝑝

₀

.

(2) Escolher um nível de significância 𝜶.

(3) Determinar a região crítica RC da forma

{ 𝑋 ≤ 𝑘

₁ } ∪ { 𝑋 ≥ 𝑘₂ }, { 𝑋 ≥ 𝑘 } ou { 𝑋 ≤ 𝑘 },

respectivamente às hipóteses alternativas, onde 𝑋 é número de elementos na amostra com o atributo

desejado, 𝑋~𝐵(𝑛, 𝑝

₀).

(3)

(4) Selecionar uma amostra aleatória e determinar o número 𝑥 de elementos na amostra com o atributo desejado.

(5) Decidir, usando a evidência 𝑥 , ao nível de significância

𝜶, e concluir.

𝑥 

RC



rejeitamos H.

𝑥



RC



não rejeitamos H.

Procedimento teste de hipótese para

proporção. Resumo.

(4)

Procedimento teste de hipótese para proporção. Região crítica.

Estatística do teste é 𝑋 que é número de elementos na amostra com o atributo desejado, a distribuição de 𝑋 é a

distribuição binomial 𝐵(𝑛, 𝑝

₀

) . A região crítica é determinada

em forma { 𝑋 ≤ 𝑘

₁

} ∪ { 𝑋 ≥ 𝑘

₂

}, { 𝑋 ≤ 𝑘 } ou { 𝑋 ≥ 𝑘 },

respectivamente às hipóteses alternativas, que depende de

nível de significância do teste 𝛼 e da estatística do teste

(5)

Procedimento teste de hipótese para proporção. Região crítica.

Estatística do teste pode ser também a proporção 𝑝 = 𝑋 = 𝑋

𝑛

em que 𝑋 , como antes, é número de elementos na amostra com o atributo desejado. Neste caso a região crítica é

determinada em forma 𝑝 ≤ 𝑘

₁

𝑛 ∪ 𝑝 ≥ 𝑘

₂

𝑛 , 𝑝 ≥ 𝑘

𝑛 , 𝑝 ≤ 𝑘

𝑛

respectivamente às hipóteses alternativas

(6)

Procedimento teste de hipótese para proporção.

Região crítica. Aproximação normal.

Estatística do teste pode ser também 𝑧-estatística 𝑍 = 𝑋 − 𝑛𝑝

₀

𝑛𝑝

₀

(1 − 𝑝

₀

)

em que 𝑋 , como antes, é número de elementos na amostra com o atributo desejado. Neste caso a região crítica é

determinada em forma 𝑍 ≤ 𝑘

₁

− 𝑛𝑝

₀

𝑛𝑝

₀

(1 − 𝑝

₀

) ∪ 𝑍 ≥ 𝑘

₂

− 𝑛𝑝

₀

𝑛𝑝

₀

1 − 𝑝

₀

, 𝑍 ≥ 𝑘 − 𝑛𝑝

₀

𝑛𝑝

₀

(1 − 𝑝

₀

) , 𝑍 ≤ 𝑘 − 𝑛𝑝

₀

𝑛𝑝

₀

(1 − 𝑝

₀

)

(7)

(1) H: 𝑝 = 𝑝

₀

A:

𝑝



𝑝

₀

(2) Escolher um nível de significância

𝜶

. 𝛼 = 0.05

(3) Determinar a região crítica RC da forma 𝑋  𝑘 ou 𝑍 =

^{𝑋−𝑛𝑝}⁰

𝑛𝑝₀(1−𝑝₀)

≥

^{𝑘−𝑛𝑝}⁰

𝑛𝑝₀ 1−𝑝₀

= 𝑧

_𝑐

onde estatística do teste

𝑍 = ^{𝑋 − 𝑛𝑝}

⁰

𝑛𝑝

₀

(1 − 𝑝

₀

) ≈ 𝑁(0,1)

(8)

(3) Determinar a região crítica RC da forma 𝑍 ≥ 𝑧

_𝑐

onde estatística do teste

𝑍 ~𝑁(0,1)

Achamos 𝑧

_𝑐

pela tabela da distribuição normal 𝑃 𝑍 ≥ 𝑧

_𝑐

= 𝛼

(4) Selecionar uma amostra aleatória e determinar o

número 𝑥

de elementos na amostra com o atributo

desejado.

(9)

(5) Decidir, usando a evidência 𝑧

_𝑜𝑏𝑠

:

𝑧_𝑜𝑏𝑠

> 𝑧

_𝑐 

rejeitamos H.

𝑧_𝑜𝑏𝑠

< 𝑧

_𝑐

 não rejeitamos H.

(4) Calcular o valor observado da estatística do teste 𝑧

_𝑜𝑏𝑠

= 𝑥 − 𝑛𝑝

₀

𝑛𝑝

₀

(1 − 𝑝

₀

)

(10)

Procedimento teste de hipótese para proporção. Aproximação normal.

Exemplo: A proporção de analfabetos em um município

era de 15% na gestão anterior.

No início da sua gestão, o prefeito atual implantou um programa de alfabetização e após 2 anos afirma que

reduziu a proporção de analfabetos.

Para verificar a afirmação do prefeito, n = 200 cidadãos foram entrevistados.

(11)

Seja 𝑋 o número de analfabetos entre os 200 cidadãos entrevistados e 𝑋~𝐵 200; 𝑝 , sendo 𝑝 a proporção atual de analfabetos no município (após o programa de alfabetização).

Procedimento teste de hipótese para proporção. Aproximação normal.

(1) Estabelecer as hipóteses:

H: 𝑝 = 0.15

contra alternativa A: 𝑝

 0.15

.

H: A proporção de analfabetos no município não se alterou

(a afirmação do prefeito está incorreta).

A: A proporção de analfabetos no município diminuiu

(a afirmação do prefeito está correta).

(12)

(2) Escolher um nível de significância 𝛼.

𝛼 = 0.05

Procedimento teste de hipótese para proporção. Aproximação normal.

(3) Determinar a região crítica RC da forma 𝑍 < 𝑧

_𝑐

onde achamos 𝑧

_𝑐

pela tabela da distribuição normal 𝑃 𝑍 < 𝑧

_𝑐

= 𝛼

1 − 𝐴 −𝑧

_𝑐

= 𝛼 ⇒ 𝐴 −𝑧

_𝑐

= 1 − 𝛼 = 0.95 𝑧

_𝑐

= −1.64

Então, a região crítica RC é

𝑍 < −1.64

(13)

(4) Buscar a evidência na amostra para concluir.

Se observamos 20 analfabetos entre os 200 entrevistados, qual a conclusão?

Procedimento teste de hipótese para proporção. Aproximação normal.

Calculemos a estatística do teste 𝑧

_𝑜𝑏𝑠

= 20 − 200 ∙ 0.15

200 ∙ 0.15 ∙ 0.85 ≅ −1.98

(14)

Procedimento teste de hipótese para proporção. Aproximação normal.

(5) Decisão e conclusão:

𝑧

_𝑜𝑏𝑠

= −1.98 < −1.64 = 𝑧

_𝑐

⇒ 𝑧

_𝑜𝑏𝑠

∈ 𝑅𝐶

decidimos por rejeitar a hipótese nula ao nível de significância de 5%.

Concluímos que temos evidência suficiente para afirmar

que a proporção de analfabetos (após o programa de

alfabetização) é inferior a 15%, isto é, há evidência

suficiente de que a afirmação do prefeito seja correta.

(15)

Procedimento teste de hipótese para média populacional.

amostra população

normal

𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

: são independentes e

𝑋

_𝑖

~𝑁(𝜇, 𝜎

²

)

2 2

) (

2 )

(

2 2











x

x e f

𝑋

₁

, 𝑋

₂

, … , 𝑋

_𝑛

𝑋

_𝑖

~𝑁(𝜇, 𝜎

²

)

(16)

Nosso objetivo agora é apresentar procedimentos estatísticos simples para verificar se um conjunto de dados amostrais dá ou não suporte à uma conjectura sobre o

valor médio

𝜇 (desconhecido) de uma característica de interesse, observável em “indivíduos” de uma população (normal).

Procedimento teste de hipótese para média populacional.

Mais precisamente, procedimentos para

testar hipóteses sobre

𝜇, tomando como base o valor médio 𝑋 dessa

característica, observado em uma amostra casual simples

de tamanho 𝑛 desses “indivíduos”.

(17)

Exemplo:

Em períodos de pico, os clientes de um banco são obrigados a enfrentar longas filas para sacar dinheiro nos caixas eletrônicos. Dados históricos de vários anos de operação indicam que o tempo de transação nesses caixas tem distribuição normal com média igual a 270 segundos.

Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das transações realizadas nesses caixas.

Procedimento teste de hipótese para média

populacional.

(18)

As etapas a serem cumpridas para este teste de hipóteses são as mesmas que vimos anteriormente.

(1) Formular as hipóteses nula H e a alternativa A

Hipótese Nula : afirmação ou conjectura sobre 𝜇 contra a qual estaremos buscando evidência nos dados amostrais.

Hipótese Alternativa : afirmação ou conjectura sobre 𝜇 que suspeitamos (ou esperamos) ser verdadeira.

H: 𝜇 = 𝜇₀

contra uma das alternativas

A:

𝜇 ≠

𝜇₀, A: 𝜇 < 𝜇₀ ou A: 𝜇 > 𝜇₀

Procedimento teste de hipótese para média populacional.

H: 𝜇 = 270 seg.

A: 𝜇 < 270 seg.

(19)

(2) Fixar o nível de significância

𝛼 do teste. Seja 𝛼 = 5%

. Procedimento teste de hipótese para média

populacional.

(3) Determinar a região crítica RC da forma

𝑍 < −𝑧

_𝑐

∪ 𝑍 > 𝑧

_𝑐

, 𝑍 > 𝑧

_𝑐

ou 𝑍 < −𝑧

_𝑐

ou

𝑇 < −𝑡

_𝑐

∪ 𝑇 > 𝑡

_𝑐

, 𝑇 > 𝑡

_𝑐 ou

𝑇 < −𝑡

_𝑐

respectivamente às hipóteses alternativas

(20)

A estatística do teste 𝑍 ou 𝑇 vai ser definida dependendo do conhecimento de variância populacional 𝜎

² como

𝑍 = ^{𝑋 −𝜇}⁰

𝜎

𝑛 ~ 𝑁 0,1 ^{caso 𝜎}

²

é conhecida, e

𝑇 = ^{𝑋 −𝜇}⁰

𝑠

𝑛 ~ 𝑡

_𝑛−1

caso 𝜎

²

é desconhecida Procedimento teste de hipótese para média

populacional.

Valores 𝑧_𝑐 e 𝑡_𝑐 são definidos pelas hipóteses e 𝛼: 𝑃 𝑍 < −𝑧_𝑐 ∪ 𝑍 > 𝑧_𝑐 = 𝑃 𝑍 > 𝑧_𝑐 = 𝛼,

𝑃 𝑍 > 𝑧_𝑐 = 𝛼 ou 𝑃 𝑍 < −𝑧_𝑐 = 𝛼 usando tabela normal ou

𝑃 𝑇 < −𝑡_𝑐 ∪ 𝑇 > 𝑡_𝑐 = 𝑃 𝑇 > 𝑡_𝑐 = 𝛼,

𝑃 𝑇 > 𝑡_𝑐 = 𝛼 ou 𝑃 𝑇 < −𝑡_𝑐 = 𝛼 usando tabela T-Student

(21)

Procedimento teste de hipótese para média populacional.

No exemplo supomos não que sabemos variância populacional 𝜎² então usaremos a estatística do teste

𝑇 = 𝑋 − 𝜇₀

𝑆 𝑛 ~ 𝑡_𝑛−1

Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das 24 transações realizadas nesses caixas.

Achamos 𝑡_𝑐 de condição 𝑃 𝑇 < −𝑡_𝑐 = 0.05

(22)

𝑃 𝑇 < −1.714 = 0.05 RC= 𝑇 < −1.714

(23)

Procedimento teste de hipótese para média populacional.

(4) Buscar a evidência na amostra para concluir:

Para aliviar essa situação o banco resolve instalar, em caráter experimental, alguns caixas eletrônicos de concepção mais avançada. Após o período de experiência, o banco pretende examinar o tempo médio obtido em uma amostra casual simples das 24 transações realizadas nesses caixas.

Amostra de 24 trasações oferece seguintes dados:

𝑥 = 262.3, 𝑠 = 21.4

Valor observado da estatística do teste é 𝑡_𝑜𝑏𝑠 = 𝑥 − 𝜇₀

𝑠 𝑛 = 262.3 − 270

21.4 24 ≅ −1.76

(24)

(5) Decisão e conclusão:

𝑡_𝑜𝑏𝑠 = −1.76 < −1.71 = 𝑡_𝑐 ⇒ 𝑧_𝑜𝑏𝑠 ∈ 𝑅𝐶

decidimos por rejeitar a hipótese nula ao nível de significância de 5%.

Concluímos que temos evidência suficiente para afirmar que a média de transição diminuiu nas novos caixas eletrônicos

Procedimento teste de hipótese para média

populacional.

(25)

Ou seja, queremos testar

H: O processo está sob controle.

A: O processo não está sob controle.

Exemplo: Um industrial afirma que seu processo de fabricação produz 90% de peças dentro das especificações. O IPEM deseja investigar se esse processo de fabricação está sob controle.

Seja 𝑝 a proporção de peças produzidas dentro das especificações.

H: 𝑝 = 0.9 A: 𝑝 < 0.9

As hipóteses de interesse são:

(26)

Selecionamos uma amostra aleatória de 15 itens e observamos o número 𝑋 de itens satisfatórios.

Então: 𝑋~𝐵(15, 𝑝)

Região crítica: RC= {

𝑋 ≤ 𝑘

}

Para 𝛼 = 6% temos 𝑘 = 11 e RC= 𝑋 ≤ 11

Para

𝛼 = 1%

temos

𝑘 = 9

e RC

= 𝑋 ≤ 9

Nível descritivo. Introdução.

(27)

Crítica: Arbitrariedade na escolha da região crítica (ou do nível de significância).

a) 𝛼 = 6%  10  RC

Rejeitamos H ao nível de significância de 6%.

Se observamos x = 10 peças satisfatórias, então:

Sugestão: Determinar o nível de significância associado à evidência experimental, que é denominado nível descritivo ou p-valor.

b) 𝛼 = 1%  10  RC

Não rejeitamos H ao nível de significância de 1%.

Nível descritivo. Introdução.

(28)

No exemplo, a região crítica é da forma RC = 𝑋 ≤ 𝑘 .

Para 𝑥_𝑜𝑏𝑠 = 10,o nível descritivo ou valor 𝑃 é calculado por:

𝑝 = 𝑃 𝑋 ≤ 10 | 𝑝 = 0.9 = 0.0127

O valor 𝑃 é igual à probabilidade de ocorrerem valores de 𝑋 tão ou mais desfavoráveis para a hipótese nula 𝐻 do que o valor observado 𝑥_𝑜𝑏𝑠 = 10.

Assim, se o processo estivesse sob controle, a probabilidade de encontrarmos uma amostra de 15 peças com 10 ou menos

peças satisfatórias é de apenas 1%.

Isso sugere que a hipótese nula 𝐻 deve ser rejeitada.

Nível descritivo. P-valor.

(29)

Se o valor 𝑃 é “pequeno”, então é pouco provável observarmos valores iguais ou mais extremos que o da amostra, supondo a hipótese nula 𝐻 verdadeira.

Assim, há indícios de que a hipótese nula não seja verdadeira e tendemos a rejeitá-la.

Assim,

P “pequeno”  rejeitamos H

P “não pequeno”  não rejeitamos H

Quão “pequeno” deve ser o valor de P para rejeitarmos H ?

Por outro lado, para valores “não tão pequenos” de 𝑃, não fica evidente que a hipótese nula 𝐻 seja falsa, portanto tendemos a não rejeitá-la.

Nível descritivo. P-valor.

(30)

𝑃 ≤ 𝛼  rejeitamos 𝐻

𝑃 > 𝛼  não rejeitamos 𝐻

Se 𝑃 ≤ 𝛼 , dizemos que a amostra forneceu evidência suficiente para rejeitar a hipótese nula 𝐻.

Lembrando que a ideia inicial de 𝑃 era considerar um nível de significância associado à evidência amostral, podemos compará-lo a um nível de significância 𝛼 fixado, de modo que:



P P

rejeitamos H não rejeitamos H

Nível descritivo. P-valor.

(31)

No exemplo: P-valor = 0,0127.

Adotando 

= 0,05, temos que P <

 , portanto

rejeitamos 𝐻 ao nível de significância 5%.

Assim, o processo não está sob controle.

31

Nível descritivo. P-valor.

Observações:

•

Quanto menor o

valor P, maior é a evidência contra a

hipótese nula 𝐻 contida nos dados.

•

Quando a hipótese nula é rejeitada para um nível de

significância 𝛼 fixado, dizemos também que

a amostra é significante ao nível de significância



.

(32)

(1) Formular as hipóteses nula 𝐻 e a alternativa 𝐴 (2) Fixar o nível de significância 𝛼 do teste.

(3) Coletar os dados e calcular as medidas necessárias. A média amostral 𝑥 _𝑜𝑏𝑠 , e se necessário, o desvio padrão amostral 𝑠.

(4) Determinar o nível descritivo 𝑃.

(5) Tomar a decisão e concluir. Comparar o p-valor com o nível de significância 𝛼 adotado: se p-valor < 𝛼 , então reconhecemos na amostra evidência suficiente para rejeitar 𝐻, isto é, consideramos a amostra significante ao nível 𝛼.

Caso contrário, não rejeitamos 𝐻.

Procedimento teste de hipótese para média

populacional usando p-valor

(33)

(4) Cálculo do nível descritivo 𝑃. Como visto anteriormente o nível descritivo mede a probabilidade de se observar valores mais extremos do que o encontrado na amostra, supondo que a hipótese nula seja verdadeira, isto é,

𝑃 = 𝑃 𝑋 ≤ 𝑥 _𝑜𝑏𝑠 | 𝜇 = 270

Procedimento teste de hipótese para média populacional usando p-valor

No caso do exemplo anterior com novos caixas eletrónicos, temos

(34)

Exemplo:

Um fabricante de cigarros afirma que seus cigarros contêm não mais que 30 mg de nicotina.

Uma ONG anti-tabagismo não concorda com essa afirmação, e colhe uma amostra aleatória de 52 cigarros dessa marca para contestar a afirmação.

Na amostra coletada, o conteúdo médio de nicotina foi 31,1 mg e desvio padrão de 3,4 mg.

Esses resultados são suficientes para contestar a afirmação do fabricante ?

(35)

(2) Nível de significância, por exemplo,   5%.

(3) Evidência amostral

(1) As hipóteses nula e alternativa são H:   30 mg

A:   30 mg

Tamanho da amostra n = 52 Média amostral = 31,1 mg

Desvio padrão amostral s = 3,4 mg ^obs

x

(36)

(4) Cálculo do nível descritivo P

Como P  , decidimos por rejeitar H.

(5) Decisão e conclusão

P = P(  31,1 

X

 = 30 )

Logo, ao nível de 5%, há evidências suficiente para concluir que a afirmação do fabricante está incorreta. A contestação da ONG procede.

= P 𝑇 ≥ ^{52 31,1−30}

3,4

≅ P 𝑍 ≥ ^{52 31,1−30}

3,4

= P 𝑍 ≥ 2,33 = 0,01

(37)

Hipóteses Alternativas Unilaterais e Bilaterais

Quando a hipótese alternativa é bilateral (A:   ₀), o nível descritivo mede o quanto o valor amostral pode se distanciar do valor esperado, sob a hipótese nula H, em ambas as direções.

Quando a hipótese alternativa é A:   ₀, consideramos, no cálculo de P, os valores maiores ou iguais a .

x

obs

Quando a hipótese alternativa é A:   ₀(como no Exemplo 1), no cálculo de P, valores iguais ou mais extremos do que representam os valores menores ou iguais a . ^obs

x

obs

(38)

Exemplo 3:

Uma empresa vende uma mistura de castanhas, em latinha, cuja embalagem afirma que, em média, 25 g do conteúdo total (em g) é de castanha de caju. Sabe-se que o conteúdo de castanha de caju tem distribuição normal com desvio padrão igual a 3,1 g.

Desconfiado de que o conteúdo médio esteja incorreto, o departamento de Garantia da Qualidade (GQ) resolve examinar o conteúdo de 12 latas, e medir a quantidade (em g) de castanha de caju em cada lata. A média amostral resultou em 26,3 g.

Este resultado constitui uma forte evidência em favor do GQ, ao nível de 5% ?

(39)

(1) As hipóteses nula e alternativa são H:   25 e A:   25 (2) Nível de significância

(3) Evidência amostral Pelo texto,   5%.

Não interessa à empresa que se tenha menos castanha de caju do que o especificado na embalagem, por uma questão de qualidade. Por outro lado, não se pode ter muito mais, por uma questão de custo.

Tamanho da amostra n = 12 Média amostral = 26,3 g

Desvio padrão (populacional)  = 3,1 g

x

^obs

(40)

(4) Determinar o nível descritivo

Se a mistura está dentro dos padrões, o conteúdo médio de castanhas de caju seria 25 g.

Observamos um desvio de |26,3 – 25| = 1,3 g.

Logo,

P = P( |

– 25|  1,3)

X X

X

= P(



26,3 ou

X 

23,7 



= 25) (por simetria) = 2 P(



26,3 



= 25)‏

(41)

(5) Decisão e conclusão

Como P > , decidimos por não rejeitar H.

Assim,

= 2 P( Z  1,45) = 2 (0,0735) = 0,1471

Concluímos, ao nível de significância de 5%, que não há evidências suficiente em favor do GQ.

P = 2 𝑃 𝑍 ≥ 12 ^26.3−25

3.1

(42)

RESUMO

Teste de hipóteses para a média populacional

(1) Estabelecer as hipóteses:

H:  = ₀contra uma das alternativas A:   ₀, A:   ₀ ou A:  ₀. (2) Escolher um nível de significância 

(0) Descrever o parâmetro de interesse .

(3) Selecionar uma amostra casual simples de tamanho n  determinar a média amostral e o desvio padrão (populacional  ou amostral s) .

xobs

(43)

(4) Determinar o nível descritivo P

Se A:   ₀, 𝑃 = 𝑃 𝑋 ≥ 𝑥 _𝑜𝑏𝑠 | 𝜇 = 𝜇₀ Se A:   ₀, 𝑃 = 𝑃 𝑋 ≤ 𝑥 _𝑜𝑏𝑠 | 𝜇 = 𝜇₀

Se A:   ₀, 𝑃 = 2𝑃 𝑋 ≥ 𝑥 _𝑜𝑏𝑠 | 𝜇 = 𝜇₀ se 𝑥 _𝑜𝑏𝑠 > 𝜇₀ ou 𝑃 = 2𝑃 𝑋 ≤ 𝑥 _𝑜𝑏𝑠 | 𝜇 = 𝜇₀ se 𝑥 _𝑜𝑏𝑠 < 𝜇₀

Usando no cálculo uma das variáveis padronizadas

𝑍 = 𝑛 𝑋 − 𝜇

ou

𝜎 𝑇 = 𝑛 𝑋 − 𝜇

𝑠

(44)

(5) Decidir, comparando P com o nível de significância , econcluir.

Se P    rejeitamos H

Se P >   não rejeitamos H e lembrando que,

Z  N(0,1) e

T  t de Student com n-1 graus de liberdade.

(Se n é grande, use a aproximação normal.)‏