Notas de Aula. Estatística Elementar. by Mario F. Triola. Tradução: Denis Santos

(1)

Notas de Aula

Estatística Elementar

10ª Edição

by Mario F. Triola

Slide Slide 1

(2)

Capítulo 8

Teste de Hipótese

8-1 Visão Geral 8-1 Visão Geral

8-2 Fundamentos do Teste de Hipótese

8-3 Testando Afirmações sobre uma Proporção

8-4 Testando Afirmações sobre uma Média: σ Conhecido

8-5 Testando Afirmações sobre uma Média: σ

Desconhecido Desconhecido

8-6 Testando Afirmações sobre o Desvio Padrão ou Variância

(3)

Seção 8-1

Visão Geral

Created by Erin Hodgess, Houston, Texas

(4)

Definições

Em estatística, uma

hipótese

é uma afirmação

Em estatística, uma

hipótese

é uma afirmação

ou setença sobre as propriedades de uma

população.

Um

Teste de hipótese

(ou

teste de significância

)

é um procedimento padronizado para testar

uma afirmação sobre as propriedades de uma

população.

(5)

Regra do Evento Raro para a

Inferência Estatística

Se,

sob

uma

dada

suposição,

a

probabilidade de um evento particular

observado é excepcionalmente pequena,

nós

concluímos

que

a

suposição

provavelmente não é correta.

(6)

Exemplo: As Indústrias ProCare Ltda. forneceram, certa vez, um produto chamado “Gender Choice” (Escolha o Sexo) que, de acordo com a propaganda, permitia aos casais “aumentar em até 80% as suas chances de ter uma menina.” Suponha que façamos um experimento com 100 casais que querem ter meninas e que eles sigam o Gender Choice, “um sistema fácil de usar em casa” descrito na Choice, “um sistema fácil de usar em casa” descrito na embalagem cor de rosa para meninas. Com o propósito de testar a afirmação de que há um acréscimo na proporção de meninas vamos assumir que o Gender Choice não tem efeito. Usando o bom senso e nenhum método formal de estatística, o que podemos concluir sobre a suposição de nenhum efeito do Gender Choice se 100 casais usando Gender Choice tiverem 100 bebês sendo:

Gender Choice tiverem 100 bebês sendo:

a) 52 meninas? b) 97 meninas?

(7)

Exemplo:

Indústrias ProCare Industries Ltda.: Parte a)

a) Nós em geral esperamos cerca de 50 meninas em 100 nascimentos. O resultado de 52 meninas é bastante próximo de 50, então não podemos é bastante próximo de 50, então não podemos concluir que o Gender Choice é realmente eficaz. Se os 100 casais não usaram nenhum método especial para seleção de gênero, o resultado de 52 meninas pode ocorrer facilmente. A suposição de não efeito do Gender Choice aparenta ser correta. Não temos

Choice aparenta ser correta. Não temos evidência para afirmar que p Gender Choice é eficiente.

(8)

Exemplo:

Indústrias ProCare Industries Ltda.: Parte b)

b) O resultado de 97 meninas em 100 nascimentos é extremamente improvável de acontecer. é extremamente improvável de acontecer. Podemos explicar este fato por duas maneiras: Um evento extremamente raro ocorreu devido a fatores aleatórios, ou o Gender Choice é eficiente. A probabilidade extremamente baixa em termos 97 meninas em 100 nascimentos é uma forte evidência contra a suposição inicial de que o evidência contra a suposição inicial de que o Gender Choice não funciona.

(9)

Seção 8-2

Fundamentos de Teste de

Hipótese

(10)

Pontos Chave

Esta seção apresenta os componentes individuais de um teste de hipótese, e as seções seguintes usarão estes componentes em um procedimento claro e objetivo.

A função de cada um deles deve ser bem compreendido: A função de cada um deles deve ser bem compreendido:

Hipótese Nula Hipótese Alternativa Estatística do Teste Região Crítica Nível de Significância Nível de Significância Valor Crítico

(11)

Dada

uma

afirmação,

identificar

as

hipóteses nula e alternativa, e expressá-las

em forma simbólica.

Seção 8-2 Objetivos

em forma simbólica.

Dada

uma

afirmação

e

uma

amostra,

calcular o valor da estatística do teste.

Dado um nível de significância. Identificar

o(s) valor(es) crítico(s).

Dado o valor da estatística do teste,

Slide

Slide 11

Dado o valor da estatística do teste,

identificar o P-valor.

Formar uma conclusão a respeito do teste

de hipótese em uma linguagem simples e

não técnica.

(12)

Exemplo:

Vamos usar novamente o exemplo do Gender Choice que foi distribuido pelaws Indústrias ProCare. As Indústrias ProCare afirmaram que os casais que usarem a caixa rosa do Gender Choice terão as chances de terem meninas maiores que 50%, ou 0,5. Vamos novamente considerar o experimento onde 100 casais usam o Gender Choice com a onde 100 casais usam o Gender Choice com a intenção de terem uma menina. Vamos assumir que nos 100 nascimentos temos exatamente 52 meninas, e vamos formalizar algumas análises:

Sob circunstâncias normais a proporção de meninas é de 0,5, então a afirmação de que o Gender Choice é funcional pode ser expressa como p > 0,5.

Usando a distribuição normal como uma aproximação à binomial nós achamos que P(52 ou mais meninas em 100 nascimentos) = 0,3821.

(13)

Slide

Slide 13

Nós não podemos excluir o efeito aleatório como uma possível explicação. Concluímos, então, que a proporção de meninas que nasceram de casais que usaram o Gender Choice não é significantemente maior do que o número esperado devido a fatores aleatórios.

(14)

Afirmação: Para casais que usam Gender Choice, a proporção de meninas é p > 0.5.

Observações

Suposição de trabalho: A proporção de meninas é p = 0.5 (com o Gender Choice sem surtir efeito).

Há duas possíveis explicações para o resultado de 52 meninas

Assumindo que p = 0.5, nós usamos a distribuição normal como uma aproximação à distribuição binomial para achar que P (Pelo menos 52 meninas em 100 nascimentos) = 0.3821.

ˆ

A amostra apresenta 52 meninas em 100 nascimentos, então a proporção amostral é p = 52/100 = 0.52.

(com o Gender Choice sem surtir efeito).

Há duas possíveis explicações para o resultado de 52 meninas em 100 nascimentos: Ou uma variação aleatória ocorreu (com probabilidade igual a 0.3821), ou a proporção de meninas

(15)

Componentes de um

Teste de Hipótese

Formal

(16)

Hipótese Nula:

H

₀

A

hipótese nula

(denotada por H

₀

) é

uma suposição de que o valor de um

0

uma suposição de que o valor de um

parâmetro populacional (tal como a

proporção, média ou desvio padrão) é

igual a

algum valor pré-fixado.

Nós testamos a hipótese nula

diretamente.

(17)

Hipótese Alternativa:

H

₁

A

hipótese alternativa

(denotada por

H ou H ou H ) é a suposição de que

H

₁

ou H

_a

ou H

_A

) é a suposição de que

o parâmetro populacional tem um

valor que difere do apresentado na

hipótese nula.

A forma simbólica para a hipótese

Slide

Slide 17

A forma simbólica para a hipótese

alternativa

deve

usar

um

destes

sinais:

≠≠≠≠

, <, >.

(18)

Notas sobre Como Formar suas

Próprias Afirmações (Hipóteses)

Se você está executando um estudo e

quer usar um teste de hipótese para

basear

a sua afirmação, esta afirmação

dever ser escrita de tal forma que se

torne a hipótese alternativa.

(19)

Notas sobre Como Identificar

H

₀

e H

₁

Figura 8-2

Slide

Slide 19

(20)

Exemplo:

Identifique as hipóteses nulas e alternativas. Use a Figura 8-2 e com base nas afirmações dadas expresse as hipóteses nula e alternativa correspondentes em forma simbólica.

a) A proporção de motoristas que admitem passar em sinal vermelho é maior que 0,5.

b) A altura média dos jogadores de basquetes da liga profissional é de no máximo 2,14m.

c) O desvio padrão do escore de QI dos atores é igual c) O desvio padrão do escore de QI dos atores é igual

(21)

Exemplo:

a) A proporção de motoristas que admitem ultrapassar o sinal vermelho é maior que 0,5. No passo 1 da Figura 8-2, nós expressamos a afirmação dada como p > 0.5. No passo 2I, nós vemos que se p > 0.5 é falso, então p ≤≤≤≤ 0.5 deve ser verdadeiro. No passo 3, observamos que a expressão p > 0.5 não contém a igualdade, então nós determinamos a hipótese alternativa H₁ como p > 0.5, e a hipótese nula H₀ como p =

Slide

Slide 21

alternativa H₁ como p > 0.5, e a hipótese nula H₀ como p = 0.5.

(22)

Exemplo:

b) A altura média dos jogadores de basquetes da liga profissional é de no máximo 2,14m. No passo 1 da Figura 8-2 nós expressamos “a média é de no máximo 2,14m” simbolicamente como µµµµ ≤≤≤≤ 2,14. No passo 2, nós vemos que se µµµµ ≤≤≤≤ 2,14 é falsam então µ > 2,14 deve ser verdadeiro. No passo 3, nós vemos que se a expressão

µ > 2,14 não contém a igualdade, então a hipótese alternativa H será µ > 2,14, e H será µ = 2,14.

(23)

Exemplo:

c) O desvio padrão do escore de QI dos atores é igual a 15. No passo 1 da Figura 8-2 nós representamos esta afirmação como σσσσ = 15. No passo 2, vemos que se σσσσ = 15 é falso, então σσσσ ≠ ≠ ≠ ≠ 15 deve ser verdadeiro. No passo 3, temos que a hipótese alternativa H₁ será σσσσ ≠ ≠ ≠ ≠ 15, e que

σσσσ

Slide

Slide 23

1

(24)

A

estatística do teste

é um valor usado

Estatística de Teste

A

estatística do teste

é um valor usado

para tomar a decisão sobre a hipótese nula,

e é calculada convertendo a estatística

amostral em um escore com a suposição

de que a hipótese nula é verdadeira.

(25)

Estatística do Teste - Fórmulas

z

=

p - p

/\

pq

√√√√

Estatística do

teste para

proporções

z

=

x - µ

x

σ

n

Estatística do

teste para

média

pq

n

√√√√

proporções

Estatística do

χχχχ

2 ₌

(n – 1)s

2 σσσσ

2222

Estatística do

teste para

desvio

padrão

(26)

Exemplo:

Uma pesquisa com uma amostra

aleatória de 880 motoristas adultos mostrou

que 56% (ou p = 0.56) destes respondentes

admitiram que ultrapassavam o sinal fechado.

Encontre o valor da estatística do teste para a

afirmação de que a maioria dos adultos

admitem ultrapassar o sinal fechado. (Na

Seção 8-3 nós veremos que há algumas

suposições a serem observadas. Para este

exemplo, admitamos que estas suposições

são obedecidas e vamos nos focar em

encontrar a estatística do teste adequada.)

(27)

Solução:

O exemplo anterior mostrou que a

afirmação

dada

resulta

nas

seguintes

hipóteses nula e alternativa: H

₀

: p=0.5 e H

₁

:

p>0.5. Devido a trabalharmos sob a suposição

de que a hipótese nula é verdadeira, ou seja,

p=0.5, nós temos a seguinte estatística do

teste:

pq

√√√√

z = p – p

/\

₌

_{0.56 - 0.5}

(

0.5)(0.5)

√√√√

=

3.56 n

pq

√√√√

(

0.5)(0.5)

880

(28)

Interpretação:

Nós

sabemos

dos

capítulos anteriores que o valor de

z=3,56 é excepcionalmente alto. Isto

indica que mais que ser maior que

50%, o resultado amostral de 56% é

significativamente

maior que 50%.

Veja figura abaixo:

(29)

Região Crítica, Valor Crítico,

Estatística do Teste

Slide

Slide 29

(30)

Região Crítica

A

região crítica

(ou

região de rejeição

) é o

A

região crítica

(ou

região de rejeição

) é o

conjunto de valores para a estatística do

teste que nos faz rejeitar a hipótese nula.

Por exemplo, veja a região sombreada em

vermelho na figura anterior.

(31)

Nível de Significância

O

nível de significância

(denotado por

αααα

)

é a

probabilidade de que a estatística do teste irá

pertencer à região crítica quando a hipótese

nula for verdadeira. Este é o mesmo

αααα

que

introduzimos na Seção 7-2. Valores comuns

para

αααα

são 0.05, 0.01, e 0.10.

Slide

Slide 31

(32)

Valor Crítico

Um

valor crítico

é qualquer valor que separa a

região crítica (onde rejeitamos a hipótese

nula) dos valores da estatística do teste que

não nos faz rejeitar a H

₀

. O valor crítico

depende da natureza da hipótese nula, da

distribuição amostral que é utilizada, e do

nível de significância

αααα

.

Veja na figura anterior

nível de significância

αααα

.

Veja na figura anterior

que o valor crítico de z=1.645 corresponde ao

nível de significância de

αααα

=0.05.

(33)

Testes Bilateral, Unilateral à

Esquerda e Unilateral à Direita

As

caudas

em uma distribuição são

regiões

nos

extremos

das

mesmas

limitados por valores críticos.

Slide

Slide 33

(34)

Teste Bilateral

H

₀

: =

H

₁

:

≠≠≠≠

αααα

é dividido igualmente entre as duas caudas da região crítica

H

₁

:

≠≠≠≠

(35)

Teste Unilateral à Direita

H

₀

: =

H : >

H

₁

: >

Pontos à Direita

(36)

Teste Unilateral à Esquerda

H

₀

: =

H : <

H

₁

: <

Pontos à

Esquerda

(37)

P-Valor

O

P-valor

(ou

p-valor

ou

valor

de

probabilidade

) é a probabilidade de ter um

probabilidade

) é a probabilidade de ter um

valor da estatística de teste que está

pelo

menos

tão

extremo

como

a

estatística

calculada

para

a

amostra

em

questão,

assumindo que a hipótese nula é verdadeira.

A hipótese nula é rejeitado se o P-valor é

muito pequeno, tal como 0,05 ou menos.

Slide

Slide 37

(38)

Conclusões em Testes de

Hipótese

Nós sempre testamos a hipótese

nula;

A

conclusão

inicial

será

sempre uma das abaixo:

1. Rejeitar a hipótese nula.

(39)

Método Tradicional:

Rejeitamos H

se a estatística de

Regra de Decisão

Rejeitamos H

₀

se a estatística de

teste pertence à região crítica.

Falhamos em rejeitar H

₀

se a

estatística de teste não pertence à

Slide

Slide 39

estatística de teste não pertence à

região crítica.

(40)

Método do P-valor:

Regra de Decisão - cont

Rejeitamos H

₀

se o P-valor

≤≤≤≤

αααα

(onde

αααα

é o nível de significância, como

0,05, por exemplo.).

Falhamos em rejeitar H

₀

se o

(41)

Uma outra opção:

Regra de Decisão - cont

Ao

invés

de

usar

um

nível

de

significância (feito 0,05, por exemplo),

simplesmente identifique o P-valor e

deixe a decisão para o leitor.

Slide

Slide 41

(42)

Regra de Decisão - cont

Intervalos de Confiança:

Devido ao IC para um parâmetro

populacional conter os valores mais

prováveis

para

este

parâmetro,

rejeitamos a afirmação de que o

parâmetro

não

é

igual

a

um

parâmetro

não

é

igual

a

um

(43)

Procedimento para Encontrar o P-Valor

Figura 8-6

Slide

Slide 43

(44)

Exemplo:

Como calcular o P-valor: Primeiro,

verifique se as condições dadas resultam em

um teste bilateral ou unilateral à esquerda ou à

direita.

Em

seguida,

calcule

o

P-valor

e

formule sua conclusão a respeito da hipótese

nula.

a) Um nível de significância

αααα

=0.05 é usado para testar a afirmação de que p>0.25, e os dados amostrais resultaram em uma estatística de teste z=1.18.

b) Um nível de significância

αααα

=0.05 é usado para testar a afirmação de que p≠≠≠≠ 0.25, e os dados amostrais a afirmação de que p≠≠≠≠ 0.25, e os dados amostrais resultaram em uma estatística de teste z = 2.34.

(45)

Exemplo:

Como calcular o P-valor: Primeiro,

verifique se as condições dadas resultam em

um teste bilateral ou unilateral à esquerda ou

à direita. Em seguida, calcule o P-valor e

formule sua conclusão a respeito da hipótese

nula.

a) Com a afirmação de que p>0.25, temos que o teste é unilateral à direita. Assim, de acordo com a Figura 8-6, temos que o P-valor é a área à direita da estatística do teste z=1.18. Usando a Tabela A-2 encontramos que a área à direita é 0.1190. Assim, temos que o P-valor=0.1190, sendo maior que o nível

Slide

Slide 45

temos que o P-valor=0.1190, sendo maior que o nível de significância, e não podemos rejeitar a hipótese nula. O P-valor é relativamente alto, o que indica que este resultado amostral pode ocorrer facilmente devido à aleatoriedade do processo.

(46)

Exemplo:

Como calcular o P-valor: Primeiro,

verifique se as condições dadas resultam em

um teste bilateral ou unilateral à esquerda ou à

direita. Em seguida, calcule o P-valor

e

formule sua conclusão a respeito da hipótese

nula.

b) Com a afirmação de que p≠≠≠≠ 0.25, o teste é bilateral, e como a estatística do teste z=2.34 está à direita do centro da distribuição, de acordo com a Figura 8-6 temos que o P-valor é igual ao dobro da área à direita de z=2.34. Utilizando a Tabela A-2 nós vemos que a área à direita de z=2.34 é 0.0096, assim, temos que área à direita de z=2.34 é 0.0096, assim, temos que P-valor=2x0.0096=0.0192. O P-valor é menor que o nível de significância, assim rejeitamos a hipótese nula. O

(47)

Escrevendo as Conclusões Finais

Slide

Slide 47

(48)

Aceitar Versus Não Rejeitar

Alguns autores usam “aceitar a

hipótese nula”.

Nós não estamos provando a hipótese

nula.

A amostra evidencia que não temos

força para rejeitar a hipótese nula

(49)

Erro Tipo I

Um

Erro Tipo I

é o erro cometido ao

rejeitarmos

H

₀

quando

ela

é

rejeitarmos

H

₀

quando

ela

é

verdadeira.

A

letra

grega

αααα

é

usada

para

representar a probabilidade de se

cometer o Erro Tipo I.

Slide

Slide 49

(50)

Erro Tipo II

Um

Erro Tipo II

é o erro cometido

quando não rejeitamos H

₀

e ela é

quando não rejeitamos H

₀

e ela é

falsa.

A

letra

grega

ββββ

é

usada

para

representar a probabilidade de se

cometer o Erro Tipo II.

(51)

Exemplo

:

Assuma

que

estamos

realizando um teste de hipótese para

p>0.5. Aqui, temos que as hipóteses nula

e alternativa são: H

₀

:p=0.5, e H

₁

:p>0.5

a) Identifique um erro tipo I.

b) Identifique um erro tipo II.

Slide

Slide 51

(52)

Exemplo:

Assuma

que

estamos

realizando um teste de hipótese para

p>0.5. Aqui, temos que as hipóteses nula

e alternativa são: H

₀

:p=0.5, e H

₁

:p>0.5.

a) Um erro tipo I é o erro de se rejeitar uma

hipótese nula verdadeira, então neste caso, o

erro

tipo

I

ocorrerá

quando

tivermos

evidências de que p>0.5, quando na verdade

temos p=0.5.

(53)

Exemplo:

Assuma

que

estamos

realizando um teste de hipótese para

p>0.5. Aqui, temos que as hipóteses nula

e alternativa são: H

₀

:p=0.5, e H

₁

:p>0.5

b) Um erro tipo II é o erro de não rejeitarmos

uma hipótese nula falsa, ou seja, para este

exemplo seria não rejeitar p=0.5 (e por

conseqüência não aceitar que p>0.5) quando

na verdade temos p>0.5.

Slide

Slide 53

na verdade temos p>0.5.

(54)

(55)

Controlando os Erros Tipo I e

Tipo II

Para qualquer

αααα

fixado, um aumento no tamanho da amostra n causa uma diminuição em

β.

amostra n causa uma diminuição em

β.

Para qualquer tamanho de amostra n fixo, uma diminuição de

αααα

causará em aumento de

ββββ

. Inversamente, um acréscimo em

αααα

causará uma dimnuição em

ββββ

.

Slide

Slide 55

Para diminuir tanto

αααα

quanto

ββββ

, temos que aumentar o tamanho da amostra.

(56)

Definição

O

poder do teste de hipótese

é a probabilidade

(1 -

β

) de rejeitar uma hipótese nula falsa, que

(1 -

β

) de rejeitar uma hipótese nula falsa, que

é calculada usando um valor fixo para o nível

de significância

α

e um valor fixo para o

parâmetro populacional que é uma alternativa

ao

valor

assumido

como

verdadeiro

na

hipótese nula. Em outras palavras, o poder do

teste de hipótese é a probabilidade de aceitar

uma hipótese alternativa verdadeira.

(57)

Metodologia

Detalhada do

Teste de Hipótese

– Método do

P-valor

(58)

Metodologia

Detalhada do

Teste de Hipótese

– Método

Tradicional

(59)

Metodologia Detalhada do Teste

de Hipótese - cont

Um IC para um parâmetro populacional contém os valores mais verossímeis para este parâmetro. Nós valores mais verossímeis para este parâmetro. Nós podemos então rejeitar uma afirmação de que o parâmetro populacional não está incluído bo IC. Veja na Tabela 8-2 abaixo os níveis de confiança do IC para os níveis de significância de acordo com o tipo do teste (bilateral ou unilateral):

Slide

Slide 59

(60)

Metodologia Detalhada do Teste

de Hipótese - cont

Cuidado

:

Em alguns casos, a conclusão

baseada no IC pode diferir da conclusão do

teste

de

hipótese.

Veja

os

comentários

presentes em cada uma das seções seguinte.

(61)

Recapitulando

In this section we have discussed:

Hipótese Nula

Hipótese Alternativa

Estatística do Teste

Região Crítica

Nível de Significância e P-valor

Slide

Slide 61

Nível de Significância e P-valor

Valor Crítico

Erro Tipo I e II

(62)

Seção 8-3

Testando uma Afirmação

sobre uma Proporção

(63)

Pontos Chave

Esta

seção

apresenta

o

procedimento

Esta

seção

apresenta

o

procedimento

completo para testar a hipótese feita sobre

uma proporção populacional. Esta seção

utiliza

os

componentes

apresentados

na

seção anterior para os métodos do P-valor,

tradicional ou uso do I.C.

Slide

Slide 63

tradicional ou uso do I.C.

(64)

1) As observações devem vir de um plano de

Requisitos para Testar Afirmações

sobre uma Proporção Populacional p

1) As observações devem vir de um plano de amostra aleatória simples.

2) As condições para a distribuição binomial são satisfeitas (Seção 5-3).

3) As condições np ≥≥≥≥ 5 e nq ≥≥≥≥ 5 são satisfeitas, então a distribuição binomial pode ser aproximada pela a distribuição binomial pode ser aproximada pela distribuição normal com µ = np and

σσσσ

= npq .

(65)

Notação

n

= número de tentativas

p

= proporção populacional (usada na

hipótese nula)

∧∧∧∧

p

=

x

(proporção

amostral

)

n

(66)

Estatística de Teste para Testar

uma Afirmação sobre uma

Proporção

p – p

pq

n

z

=

∧∧∧∧

n

(67)

Método do P-Valor

Use a mesma metodologia descrita na

Seção 8-2

e na

Figura 8-8

.

Use a distribuição normal padronizada

(Tabela A-2).

Slide

Slide 67

(68)

Método Tradicional

Use a mesma metodologia descrita

na

Seção 8-2

e na

Figura 8-9

.

(69)

Método do Intervalo de Confiança

Use a mesma metodologia descrita

na

Seção 8-2

e na

Tabela 8-2

.

Slide

Slide 69

(70)

Exemplo:

Um

artigo

distribuído

pela

Associated Press incluía estes resultados de

relativos a uma pesquisa nacional: De 880

motoristas selecionados aleatoriamente, 56%

deles admitiam que ultrapassavam o sinal

vermelho. A afirmação é que a maioria dos

americanos avançam no sinal fechado, ou

seja, p>0.5. Os dados amostrais são n=880, e

p=0,56.

∧∧∧∧

np = (880)(0,5) = 440 ≥≥≥≥ 5

(71)

Exemplo:

Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos o∧∧∧∧ Método do P-valor.

p – p

z = ∧∧∧∧ 0.56 – 0.5

De acordo com a Tabela A-2, observamos que para valores de z = 3.50 ou maiores , nós usamos 0.9999 para a área acumulada à

H₀: p = 0.5 H₁: p > 0.5

αααα

= 0.05 pq n p – p z = 0.56 – 0.5 (0.5)(0.5) 880 = ₌_3.56 Slide Slide 71

3.50 ou maiores , nós usamos 0.9999 para a área acumulada à esquerda da estatística do teste. O P-valor é 1 – 0.9999 = 0.0001. Como o P-valor é menor que αααα = 0.05, rejeitamos a hipótese nula. Não temos evidências suficientes para admitirmos a hipótese nula como válida.

(72)

Exemplo:

Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos

∧∧∧∧

Os dados amostrais são n=880, e p=0,56. Nós usaremos o Método do P-valor.

∧∧∧∧

H₀: p = 0.5 H₁: p > 0.5

αααα

= 0.05 z = 3.56

(73)

Exemplo

:

Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5._∧∧∧∧ americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós usaremos o Método Tradicional. ∧∧∧∧ H₀: p = 0.5 H₁: p > 0.5

αααα

= 0.05 pq n p – p z = ∧∧∧∧ 0.56 – 0.5 (0.5)(0.5) 880 = ₌_3.56 Slide Slide 73

αααα

= 0.05 _n

880

Este é um teste bilateral à direita, então a região crítica é uma área de 0,05. Assim, temos que z=1,645 é o valor crítico da região crítica. Portanto, rejeitamos a hipótese nula. Não temos evidências suficientes para admitirmos a afirmação como válida.

(74)

Exemplo:

Um artigo distribuído pela Associated Press incluía estes resultados de relativos a uma pesquisa nacional: De 880 motoristas selecionados aleatoriamente, 56% deles admitiam que ultrapassavam o sinal vermelho. A afirmação é que a maioria dos americanos avançam no sinal fechado, ou seja, p>0.5._∧∧∧∧ americanos avançam no sinal fechado, ou seja, p>0.5. Os dados amostrais são n=880, e p=0,56. Nós

usaremos o Método do IC.

∧∧∧∧

Para testar uma hipótese unilateral com nível de significância

αααα

, nós iremos construir um intervalo de confiança com 1 – 2

αααα

de nível de confiança . Nós contruimos um IC com 90% de confiança.

contruimos um IC com 90% de confiança.

(75)

CUIDADO

Quando testamos afirmações sobre proporção populacional, o método tradicional e o método do P-valor são equivalentes e terão os mesmos resultados valor são equivalentes e terão os mesmos resultados desde que usem o mesmo desvio padrão baseado na

proporção suposta p. Por outro lado, o IC usa um desvio padrão estimado baseado na proporção amostral p. Consequentimente, é possível que os métodos tradicional e P-valor tenham uma conclusão diferente do que o método do IC.

∧∧∧∧

Slide

Slide 75

Uma boa tática é utilizar o IC para estimar a proporção populacional, mas utilizar os métodos tradicional ou P-valor para teste de hipótese.

(76)

∧∧∧∧

p algumas vezes é informado diretamente:

“

10% dos carros esportivos observados são

vermelho” é expresso como

p

∧∧∧∧

Obtendo P

∧∧∧∧

p

algumas vezes é calculado:

“96 residências pesquisadas têm TV a cabo e

54 não” é calculado usando

∧∧∧∧

p

∧∧∧∧

= 0.10

p

∧∧∧∧

= = = 0.64

x

96

(77)

Exemplo:

Quando Gregory Mendel realizou

seu famoso experimento de hibridação com

ervilhas, um dos experimentos resultou em

uma geração constituída de 428 ervilhas com

vagens verdes e 152 com vagens amarelos.

Segundo a teoria de Mendel, 1/4 das ervilhas

desta geração teria bagos amarelos. Use 5% de

significância com o método do P-valor para

testar a afirmação de Mendel.

Nós notamos que n=428+152=580,

∧∧∧∧

Slide

Slide 77

Nós notamos que n=428+152=580,

(78)

Exemplo:

Quando Gregory Mendel realizou seu famoso experimento de hibridação com ervilhas, um dos experimentos resultou em uma geração constituída de 428 ervilhas com vagens verdes e 152 com vagens amarelos. Segundo a teoria de Mendel, 1/4 das ervilhas desta geração teria bagos amarelos. Use 5% de desta geração teria bagos amarelos. Use 5% de significância com o método do P-valor para testar a afirmação de Mendel. H₀: p = 0.25 H₁: p ≠≠≠≠ 0.25 n = 580

αααα

0.262 – 0.25 (0.25)(0.75) = ₌_0.67 z = p – p pq

∧∧∧∧

αααα

= 0.05 p = 0.262

∧∧∧∧

(0.25)(0.75) 580 pq n

(79)

Exemplo:

Quando Gregory Mendel realizou seu famoso experimento de hibridação com ervilhas, um dos experimentos resultou em uma geração constituída de 428 ervilhas com vagens verdes e 152 com vagens amarelos. Segundo a teoria de Mendel, 1/4 das ervilhas desta geração teria bagos amarelos. Use das ervilhas desta geração teria bagos amarelos. Use 5% de significância com o método do P-valor para testar a afirmação de Mendel.

H₀: p = 0.25 H₁: p ≠≠≠≠ 0.25 n = 580

αααα

= 0.05 0.262 – 0.25 (0.25)(0.75) = ₌_0.67 z = p – p pq

∧∧∧∧

O P-valor é 2x0.2514=0.5028. Assim, não podemos rejeitar a hipótese nula, ou seja, não há evidência suficiente para refutar a afirmação de que ¼ das ervilhas desta geração tenham vagens amarelos.

αααα

= 0.05 p = 0.262 (0.25)(0.75) 580 pq n

∧∧∧∧

(80)

Recapitulando

Nesta seção nós vimos:

Teste estatístico para afirmações sobre uma

proporção.

Método do P-valor.

Método do IC.

(81)

Seção 8-4

Testando Afirmações

sobre uma Média:

σσσσ

sobre uma Média:

σσσσ

Conhecido

Slide

Slide 81

(82)

Pontos Chave

Esta seção apresenta os métodos para se

testar afirmações sobre a média de uma

população, dado que o desvio padrão desta

população é conhecido. Esta seção utiliza a

distribuição

normal

com

os

mesmos

componentes introduzidos na Seção 8-2.

(83)

Requisitos para Testar Afirmações sobre

uma Média Populacional (com

σσσσ

Conhecido)

1)

A amostra foi extraída segundo um

1)

A amostra foi extraída segundo um

plano de amostra aleatória simples.

2) O valor do desvio padrão populacional

σσσσ

é conhecido.

3) Pelo menos uma destas condições deve

Slide

Slide 83

3) Pelo menos uma destas condições deve

ser satisfeita: a população é normalmente

distribuída ou n>30.

(84)

Estatística do Teste para Testar

Afirmações sobre uma Média

(com

σσσσ

Conhecido)

n

x

– µ

_x

z

=

_σσσσ

(85)

Exemplo:

Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacional

σσσσ

é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura

=

z =

x

_σσσσ

– µ

x n 98.2 – 98.6 = − 6.64 0.62 106

significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H₀:

µµµµ

= 98.6 H₁:

µµµµ

≠≠≠≠ 98.6

αααα

= 0.05 x = 98.2 Slide Slide 85

n ₁₀₆

x = 98.2

σσσσ

= 0.62

Este é um teste bilateral e a estatística do teste está à esquerda do centro da distribuição, logo o P-valor é igual ao dobro da área à esquerda de z= –6.64. Utilizando a Tabela A-2 calculamos que a área à esquerda de z= –6.64 é 0.0001, assim o P-valor é igual a 2x(0.0001) = 0.0002.

(86)

Exemplo:

Temos uma amostra da temperatura corporal de 106 pessoas, tendo média 98.20°F. Assuma que esta amostra veio de uma amostra aleatória simples e que o desvio padrão populacional

σσσσ

é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H₀:

µµµµ

= 98.6 H₁:

µµµµ

≠≠≠≠ 98.6

αααα

= 0.05 x = 98.2 z = –6.64 x = 98.2

σσσσ

= 0.62

(87)

Exemplo:

σσσσ

é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do P-valor. H₀:

µµµµ

= 98.6 H₁:

µµµµ

≠≠≠≠ 98.6

αααα

= 0.05 x = 98.2

σσσσ

= 0.62 z = –6.64 Slide Slide 87

σσσσ

= 0.62

Como o P-valor é igual a 0.0002, e como este valor é menor que o nível de significância αααα=0.05, nós rejeitamos a hipótese nula. Assim, temos evidência suficiente para concluir que a temperatura corporal média de adultos saudáveis é diferente de 98.6°F.

(88)

Exemplo:

σσσσ

é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método tradicional. H₀:

µµµµ

= 98.6 H₁:

µµµµ

≠≠≠≠ 98.6

αααα

= 0.05 x = 98.2 z = –6.64

Nós encontramos como valores críticos z= –1.96 e z=1.96. Nós rejeitamos a hipótese nula, pois a

x = 98.2

σσσσ

= 0.62

e z=1.96. Nós rejeitamos a hipótese nula, pois a estatística do teste z= –6.64 pertence à região crítica.

(89)

Exemplo:

σσσσ

é conhecido e igual a 0.62°F. Teste com 5% de significância a idéia popular de que a temperatura significância a idéia popular de que a temperatura corporal média de adultos sadios é igual a 98.6°F. Use o método do intervalo de confiança.

Para um teste de hipótese bilateral com 5% de significância, construímos um IC com 95% de confiabilidade. Assim, temos:

98.08 < µµµµ < 98.32 H₀:

µµµµ

= 98.6 H₁:

µµµµ

≠≠≠≠ 98.6

αααα

= 0.05 x = 98.2

σσσσ

= 0.62 Slide Slide 89

Nós estamos 95% confiantes de que o intervalo de 98.08 a 98.32 contém o valor verdadeiro de µµµµ, assim, aparentemente 98.6 nãopode ser o valor verdadeiro de µµµµ.

(90)

Relações Subjacentes ao Teste

de Hipótese

Se, sob uma dada suposição, temos uma probabilidade extremamente pequena de obtermos probabilidade extremamente pequena de obtermos um resultado amostral tão extremo como o que observamos, podemos concluir que a suposição inicial provavelmente não é correta.

Quando testamos uma afirmação, fazemos uma suposição de igualdade (com a hipótese nula). A suposição de igualdade (com a hipótese nula). A seguir, comparamos esta suposição com o

(91)

Se o resultado amostral (ou resultado mais extremo)

Relações Subjacentes ao Teste

de Hipótese - cont

Se o resultado amostral (ou resultado mais extremo) pode ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, podemos atribuir a relativamente curta discrepância entre a suposição e o resultado amostral ter ocorrido devido a fatores aleatórios.

Se o resultado amostral não pode ocorrer facilmente quando a suposição (hipótese nula) é verdadeira, nós

Slide

Slide 91

quando a suposição (hipótese nula) é verdadeira, nós explicamos a relativamente grande discrepância entre a suposição e o resultado amostral concluindo que a suposição inicial não é verdadeira, rejeitando, assim, esta suposição.

(92)

Recapitulando

Nesta seção nós apresentamos:

Requisitos para testar afirmações sobre médias populacionais, com σ conhecido.

Método do P-valor.

Método Tradicional.

Método do Intervalo de Confiança.

(93)

Seção 8-5

Testando Afirmações

sobre uma Média :

σσσσ

sobre uma Média :

σσσσ

Desconhecido

Slide

Slide 93

(94)

Pontos Chave

Esta seção apresenta a metodologia para

testar afirmações sobre a média populacional

quando não temos o valor de

σ

. Os métodos

desta seção utilizam a distribuição t de

Student vista anteriormente.

(95)

Requisitos para Testar

Afirmações sobre a Média com

σσσσ

Desconhecido

1) A amostra foi extraída segundo um plano de

amostra aleatória simples.

2) O valor do desvio padrão populacional

σσσσ

não

é conhecido.

3) Pelo menos uma destas condições deve ser

Slide

Slide 95

3) Pelo menos uma destas condições deve ser

satisfeita:

a

população

é

normalmente

distribuída ou n>30.

(96)

Estatística do Teste para Testar

Afirmações sobre uma Média (com

σσσσ

Desconhecido)

x

– µ

P-valor e Valores Críticos

x

– µ

_x

t =

_s

n

P-valor e Valores Críticos

(97)

Propriedades Importantes da

Distribuição t de Student

1. A distribuição t de Student t é diferente para cada tamanho de amostra (veja Figura 7-5 na Seção 7-4).

2. A distribuição t de Student t tem a mesma forma que a distribuição normal (forma de sino); Sua forma mais alongada reflete uma maior variabilidade que é esperada quando usamos s para estimar

σσσσ

.

3. A distribuição t de Student tem média t=0 (identicamente à distribuição normal padronizada que tem média z=0).

4. TO desvio padrão da distribuição t de Student varia de acordo

Slide

Slide 97

4. TO desvio padrão da distribuição t de Student varia de acordo com o tamanho da amostra e é maior que 1 (ao contrário da distribuição normal padronizada onde temos

σσσσ

=1).

5. Para tamanhos de amostra suficientemente grande, temos que a distribuição t de Student se aproxima da distribuição normal padronizada.