Aula 08 - Teste de Hipóteses (2)

(1)

Teste de

(2)

Teste de Hipóteses

Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma característica de uma população:

 Pesquisadores médicos afirmam que a

temperatura média do corpo humano não é igual a 37 ºC.

 Um novo fertilizante utilizado no cultivo de hortaliças aumenta a produtividade.

(3)

Teste de Hipóteses

A dificuldade nestes casos é que a característica

de interesse varia em cada amostra.

 Daí a necessidade de métodos estatísticos.

 A temperatura média do corpo humano varia

de pessoa para pessoa;

(4)

Estudo de Caso

(temperatura do corpo humano)

Estudos prévios indicam que a temperatura do

corpo humano é 37ºC. Pesquisadores médicos

coletaram dados amostrais e encontraram uma

média

= 36,8ºC e distribuição aproximadamente

normal.

Estes dados amostrais constituem evidência

suficiente para rejeitar a crença comum de que

μ = 37 ºC ???

(5)

Estudo de Caso

(temperatura do corpo humano)

O primeiro passo consiste em formular duas

hipóteses sobre a afirmação.

As hipóteses são explicações potenciais que

procuram levar em conta fatos observados em

situações onde existem algumas incógnitas.

A incógnita em nosso caso é a verdadeira

temperatura do corpo humano.

(6)

Hipótese Nula e Alternativa

A hipótese nula H₀ é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é correta).

H₀ : μ = 37

A hipótese alternativa H₁ é uma afirmação que oferece uma alternativa à alegação (isto é, o parâmetro é maior/menor/diferente que o valor alegado).

(7)

Hipótese Nula e Alternativa

A hipótese nula H

₀

representa o status quo, ou

seja, a circunstância que está sendo testada, e o

objetivo dos testes de hipóteses é sempre tentar

rejeitar a hipótese nula.

A hipótese alternativa H

₁

representa o que se

deseja provar ou estabelecer, sendo formulada

para contradizer a hipótese nula.

(8)

A hipótese nula pode ou

não ser impugnada pelos

resultados

de

um

experimento. Ela

nunca

pode ser provada, mas

pode ser desaprovada no

curso da experimentação.

(9)

Teste Unilateral e Bilateral Unilateral direito: H₀:  ≤ 50 H₁:  > 50 Unilateral esquerdo: H₀:  ≥ 50 H₁:  <50 Bilateral: H₀:  = 50 H₁:   50

(10)

Tipos de Erro

Repare que, ao testarmos uma hipótese nula, chegamos a uma conclusão:

rejeitá-la, ou não rejeitá-la

Entretanto, devemos lembrar que tais conclusões ora são corretas, ora são incorretas (mesmo quando fazemos tudo corretamente!).

Este é o preço a ser pago por estarmos trabalhando em uma situação onde a variabilidade é inerente !!!

(11)

Erro do tipo I:

Um erro do tipo I ocorre quando a hipótese nula é rejeitada, apesar de ser verdadeira. A probabilidade de cometer o erro tipo I é denominada “nível de significância” e é denotada por α.

Erro do Tipo II:

Um Erro de tipo II ocorre

quando a hipótese nula não é rejeitada, apesar de ser falsa.

A probabilidade de cometer o erro tipo II é denotada por β.

(12)

Conceito de aceitar e rejeitar a hipótese H

₀

ACEITAR OU REJEITAR A HIPÓTESE H₀?

O estudo parte do princípio que a hipótese H₀ é verdadeira até que se tenha prova estatística em contrário

 ACEITAR H₀ = não há provas suficientes para rejeitá-la

 REJEITAR H₀ = há evidências suficientes de que as diferenças obtidas (entre o que era esperado e o que foi observado na amostra) não ocorreram por acaso.

Analogia com o direito

Aceitar = não há provas suficientes para condenar o réu (não culpado) Rejeitar = as provas reunidas são suficientes para culpar o réu.

(13)

A eficácia de certa vacina após um ano é de 25% (isto é, o efeito imunológico se prolonga por mais de um ano em apenas 25% das pessoas que a tomam). Desenvolve-se uma nova vacina, mais cara, e deseja-se saber se esta é, de fato, melhor.

Sendo “p”a proporção de imunizados por mais de um ano com a nova vacina...

 Quais hipóteses devem ser formuladas?

 Que erros poderemos cometer?

(14)

Exemplo

Hipótese nula: H

₀

: p ≤ 0,25

Hipótese alternativa: H

₁

: p > 0,25

Erro tipo I: aprovar a vacina quando, na

realidade, ela não tem nenhum efeito superior

ao da vacina em uso.

Erro tipo II: rejeitar a nova vacina quando ela

é, de fato, melhor que a vacina em uso

.

(15)

Passos para realizar um teste de hipóteses

1. Formular as hipóteses nula e alternativa; 2. Escolher a distribuição amostral adequada; 3. Fixar o nível de significância α do teste;

4. Estabeleça a região de rejeição usando o nível de significância (esboçar um gráfico é SEMPRE uma boa opção);

5. Calcular a estatística de teste;

6. Comparar a estatística de teste com os valores críticos:

•Rejeitar a hipótese nula se a estatística de teste excede o valor crítico, ou seja, está na região crítica •Aceitar a hipótese nula, caso contrário.

(16)

Exemplo 1

 Uma máquina automática enche pacotes de café segundo uma distribuição normal com média μ e desvio-padrão 20g

 A máquina foi regulada para μ = 500g

 De meia em meia hora tiramos uma amostra de 16 pacotes para verificar se o empacotamento está sob controle, isto é, se μ = 500g

Se uma dessas amostras apresentasse = 492g, você pararia ou não o empacotamento para verificar

se o ajuste da máquina está correto? x

(17)

Exemplo 1...

Passo 1: Indicamos por X o peso de cada pacote,

então X é uma normal com média μ e σ = 20. As hipóteses que nos interessam são:

Hipótese nula: H₀ : μ = 500g

Hipótese alternativa: H₁ : μ ≠ 500g

Bilateral pois a máquina pode desregular para mais ou para menos

(18)

Exemplo 1...

Passo 2: Escolher a distribuição amostral.

 Se o desvio padrão populacional é conhecido:

Distribuição NORMAL (Z_teste)

Se o desvio é desconhecido e a amostra é pequena (n < 30):

Distribuição de STUDENT(t_teste)

Passo 3: Escolher o nível de significância

 Pela situação descrita no problema, podemos fazer α = 0,01

(19)

Exemplo 1...

Passo 4: Estabeleça a região de rejeição usando o nível de significância

(20)

Exemplo 1...

Passo 4: Estabeleça a região de rejeição usando o nível de significância α = 1% Z = -2,57 μ = 500 Z = 2,57 Área = 0,5 – 0,005 = 0,495 Área = 0,5 – 0,005 = 0,495 % 5 , 0 2   % 5 , 0 2  

(21)

Exemplo 1...

Passo 5: Calcular a estatística de teste;

n

x

Z

_calc





_



0

6 ,

1

5

8

16

20

500

492 











calc

Z

(22)

Exemplo 1...

Passo 6: Comparar a estatística de teste com os valores críticos.

-2,57 -1,6 500 2,57

Não houve evidência amostral significativa no sentido de rejeitar H₀.

(23)

Comparação de Médias

Variância conhecida

Suponha que X é uma variável aleatória com média  desconhecida e variância σ2 conhecida. E queremos testar a hipótese de que a média é igual a um certo valor especificado

₀. O teste de hipótese pode ser formulado como segue:

Para testar a hipótese, toma-se uma amostra aleatória de n observações e se calcula a estatística

0 1 0 o

:

H

:

H











n

X

Z

_calc o

/









(24)

Cálculo da Região Crítica

A região crítica é a região onde H₀ é rejeitada. A área da região crítica é igual ao nível de significância (), que estabelece a probabilidade de rejeitar H₀ quando ela é verdadeira.

Regra de Decisão

Se o valor da estatística do teste cair na região crítica, rejeita-se H₀. Ao rejeitar a hipótese nula (H₀) existe uma forte evidência de sua falsidade.

(25)

Comparação de Média

Variância conhecida

A resistência à tração do aço inoxidável produzido numa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente, a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.

76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2 Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistência à tração de aço? (Adote um nível de significância de 5%).

(26)

Exemplo 2

Passo 1: Formular hipótese nula e alternativa

Ho:  = 72 kg/mm2 H₁:  ≠ 72 kg/mm2 σ = 2kg/mm2

Passo 2: Escolher a distribuição amostral adequada.

O desvio padrão da população é conhecido (Z_teste)

Passo 3: Fixar o nível de significância α do teste.

α = 5%

Passo 4: Estabeleça a região de rejeição usando o nível de significância.

(27)

Exemplo 2...

Passo 5: Calcular a estatística de teste

75 10 2 , 74 2 , 70 7 , 75 4 , 78 6 , 72 7 , 74 4 , 76 3 , 78 2 , 76           X X 74 , 4 6325 , 0 3 10 2 72 75  _ _  calc Z Sendo = 75 e σ = 2 kg/mm², temos: n x Z_calc  _  X

(28)

Exemplo 2...

Passo 6: Comparar a estatística de teste com os valores críticos.

H₀ é rejeitada e concluímos que a resistência à tração do aço mudou.

(29)

Comparação de Média

Variância desconhecida

Suponha que X é uma variável aleatória Normal com média

 e variância σ2 DESCONHECIDA. Para testar a hipótese de que a média é igual a um valor especificado _o , formulamos: o 1 0 o : H : H      

Como σ2 não é conhecido, usa-se a distribuição de

Student para construir a estatística do teste.

n

S

X

t

_calc o

/







(30)

Exemplo 3

Um trecho de uma rodovia estadual, quando é utilizado o radar, são verificadas em média 7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que este número pode ter aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os resultados foram:

8, 9, 5, 7, 8, 12, 6, 9, 6, 10

Os dados trazem evidência de aumento nas infrações?

Passo 1: Formular as hipóteses nula e alternativa.

(31)

Exemplo 3...

Passo 2: Escolher a distribuição amostral adequada.

O desvio padrão da população é desconhecido (t_teste)

Passo 3: Fixar o nível de significância do teste.

α = 5%

Passo 4: Estabeleça a região de rejeição usando o nível de significância.

Grau de liberdade  gl = n -1  gl = 9 t_tab = 1,833

(32)

Exemplo 3...

Passo 5: Calcular a estatística do Teste

Temos = 8.

Não conhecendo σ, estimamos por S (desvio-padrão da amostra), logo, S = 2,10.

Desvio-padrão foi estimado a partir de uma pequena amostra) deve-se usar a estatística t-student.

x

5 ,

1

666 ,

0

1

10

10 ,

2

7

8 

_







n

S

X

t

_calc



o

(33)

Exemplo 3...

Passo 6: Comparar a estatística de teste com os valores críticos

Como aceitamos H₀, a conclusão é que não houve um aumento significativo no número de infrações. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para concluir que o número de infrações aumentou.

(34)

Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:

22 20 21 23 22 20 23 22 20 24 21 20 21 24 22 22 23 22 20 24

Exemplo de um Teste de Hipótese Para Média

H₀ : μ ≤ 20 H₁ : μ > 20 40 , 1 8 , 21   S X 75 , 5 20 40 , 1 20 8 , 21      n S X t_calc



gl 19 % 5 729 , 1 e t_crítico  _{Rejeita-se H}₀

(35)

Como decidir qual teste devo utilizar?

Teste t Teste Z n ≥ 30? _{Teste Z} Início σ é conhecido? Não Não Sim Sim

(36)

Um fabricante de pneu alega que seus pneus suportam uma quilometragem de 40.000 milhas no mínimo. Suponhamos que os resultados de um teste tenham sido: amostra n = 49, média amostral 38.000 milhas. Sabe-se que quilometragem de todos os pneus têm desvio-padrão de 3.500 milhas (duração). Realize o teste de hipótese para testar a afirmação do fabricante.

000 . 40 : 1   H 000 . 40 : 0   H 0 , 4 49 3500 000 . 40 000 . 38 0       calc calc Z n x Z _

Há evidências suficientes para garantir a rejeição da afirmação que a média é maior ou igual à 40 mil Milhas

40000  Adotando: ( = 0,05), temos que Z_crítico = - 1,65 Z_crítico = -1,65 Região de rejeição Z_calc = -4,0 38000

(37)

Exemplo de um Teste de Hipótese Para Média

Um fabricante de fio de arame alega que seu produto tem uma resistência média à ruptura igual ou superior a 10 Kg/cm2, com desvio padrão de 0,5 kg/cm2. O INMETRO resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a qual acusou resistência média de 10,4 kg/cm2. Que conclusão o INMETRO pode chegar?

10 : 1   H 10 :   o H 66 , 5 50 5 , 0 10 4 , 10 0      n x Zcalc  -1,645 +5,66 • Adotando: (=0,05) temos: Z_crítico = -1,645

Há evidências suficientes para garantir que a média é igual ou superior a 10kg/cm².

(38)

Teste de Hipótese

Comparação de duas Médias

Passo 1:

Definição da Hipótese;

Quando há duas populações normais com médias e variâncias desconhecidas, as hipóteses para testar se as médias são iguais são as seguintes:

Passo 2:

Definição do Nível de Significância;

2 1 1 2 1

:







H

_o

(39)

Passo 3:

Calcular a estatística do Teste

O procedimento do teste irá depender de que . Se essa suposição for razoável, então calcula-se a variância combinada.

E a seguir calcula-se a estatística do teste:

2 2 2 1    2 1 2 1 1 1 n n S x x t p cal    2 1 1 2 1 2 2 2 2 1 1 2       n n S ) n ( S ) n ( S _p

Teste de Hipótese

(40)

Passo 4:

Região Crítica

O valor tabelado de t depende do nível de significância e dos graus de liberdade, que são função do tamanho da amostra. gl = n₁ + n₂ – 2

Passo 5:

Regra de Decisão

Comparar o valor da estatística do teste t_cal com o valor tabelado t_tab com n₁+ n₂ – 2 graus de liberdade. H_o será rejeitada se:

2 , 2 / ₁ ₂



_n _n calc

t

_

Teste de Hipótese

(41)

Comparação de duas Médias

O teste t para duas amostras.

Passo a passo

Passo 1: Estabelecer as hipóteses H₀ e H₁;

Passo 2: Decidir o nível de significância do teste(α);

Passo 3: Determinação do valor crítico do teste;

Passo 4: Calcular a média de cada grupo; média do grupo 1 média do grupo 2 n x x₁ 



i n x x₂ 



i

(42)

1 ) ( 2 2 1   



n x x s i variância do grupo 1 1 ) ( 2 2 2   



n x x s i variância do grupo 2

Passo 5: Calcular a variância de cada grupo;

Passo 6: Calcule a variância ponderada;

n₁ é o número de elementos do grupo 1 n₂ é o número de elementos do grupo 2

2 ) 1 ( ) 1 ( 2 1 2 2 2 2 1 1 2       n n s n s n s_p

Passo a passo...

(43)

Passo 7: Calculo da estatística t;

Passo 8: Conclusão do teste:

Feito os cálculos, é preciso comparar o valor calculado de t com o valor da tabela, ao nível de significância estabelecido e com (n₁ + n₂ – 2) graus de liberdade ) 1 1 ( 2 1 2 2 1 n n s x x t p   

Passo a passo...

(44)

Exemplos de comparação de duas médias

• Um químico alega ter descoberto um aditivo para gasolina que revolucionará o rendimento dos automóveis. Para avaliar a afirmação testaram-se 18 carros, com e sem aditivo.

• Doze pneus de duas marcas foram postos à prova quanto à duração, objetivando avaliar se existe diferenças nas vidas médias das duas marcas .

• Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas;

(45)

“Exemplo da aplicação do teste de hipótese

para comparação de duas média”

Foi desenvolvida uma pesquisa com o objetivo de verificar se os filtros de cigarros realmente fazem diferença ou são apenas truques de venda sem qualquer efeito real. Para isso foram selecionadas aleatoriamente amostras de cigarros com e sem filtro e medida a quantidade (em miligramas) de alcatrão presente. Verifique se os filtros são eficazes na eliminação do alcatrão dos cigarros.

Cigarros com filtro Cigarros sem filtro n₁ = 21 n₂ = 8 S₁ = 1,9 S₂ = 1,7 Alcatrão (em mg) 3 , 13 1  x x₂  24,0

(46)

Teste t para amostras independentes

Hipóteses estatísticas: H₀: μ₁ = μ₂ vs. H₁: μ₁ ≠ μ₂ 42 , 3 27 23 , 20 2 , 72 2 8 21 7 , 1 ) 1 8 ( 9 , 1 ) 1 21 ( 2 2 2          p s 9 , 13 77 , 0 7 , 10 8 1 21 1 42 , 3 3 , 13 24         _   calc t _{α = 5% gl = 27} t_crítico = 2,052

Conclusão: Como a estatística de teste (13,9) é maior do que o t_crítico (2,052), podemos concluir de que há indícios que existe diferença estatisticamente significante no conteúdo de alcatrão entre os cigarros com e sem filtro.

(47)

“Exemplo da aplicação do teste de hipótese para

comparação de duas média no setor de serviços”

Um Hospital vem recebendo diversas reclamações de seus clientes

quanto ao elevado tempo de espera para a realização de exames em seus guichês. Uma ação corretiva para melhoria dos serviços foi desenvolvida e o hospital utilizou-se de duas amostras aleatórias antes e depois da implementação dos resultados para verificar se a ação corretiva teve sucesso, uma vez que o número de reclamações havia reduzido. Adote nível de significância igual  =1% = 0,01.

16,3 21 14,5 14,6 25,9 12,1 11,1 14,6 12,6 12,9

6,3 20,8 10,5 15,4 28,5 13,8 17,3 19,9 13,5 8,6

13,9 12,4 14,2 21,7 18 12,1 14,2 6,2 21,3 11,4

29,1 21 18,2 17,2 21,3 10,2 10,7 7,3 6,6 13,8

16,7 17 14,9 14 10,1 4,8 16 17,1 7,9 20,1

Antes da ação Depois da ação

Medida do tempo (em minutos) de espera dos pacientes do hospital, antes e depois da ação corretiva

(48)

1- Estabelecer as Hipóteses nula e alternativa: 2 1

:







o

H

2 1 1 :







H

O hospital quer provar que o tempo médio para atendimento era maior antes da ação corretiva.

2- Determinar a região crítica de teste pela Tabela de distribuição t de student:

45 ,

2

48 ; 01 , 0 2 ; ₁ ₂



t



t

_ _n _n _{A hipótese nula deve ser}

rejeitada se, t_calc > 2,45

2 1

1 :   

H Teste unilateral direito

t_crítico

μ₁ Tempo médio de espera dos clientes antes da ação corretiva

(49)

3- Fazer os cálculos necessários a partir dos dados amostrais: 35 , 3 25 1 25 1 ). 60 , 24 ( 64 , 12 34 , 17 1 1 . 2 1 2 2 1        _            n n s X X t p calc

3.1- Média amostral antes da ação = 17,34 minutos

3.2- Média amostral depois da ação = 12,64 minutos

60 , 24 2 ) 1 ( ) 1 ( 2 1 2 2 2 2 1 1 2        n n s n s n s_p

(50)

5- Decidir se a hipótese nula deve ser rejeitada ou não:

Como t_calc = 3,35 é maior do que 2,45, a hipótese nula foi rejeitada ao nível de significância de 1%.

A equipe técnica tem forte evidência para concluir que o tempo médio de espera antes da ação corretiva é superior ao tempo médio depois da ação. Isto é. A ação corretiva foi eficaz;

Região Crítica 0,01 t_α t_crítico=2,45 1 - α região de rejeição região de aceitação T_calc=3,35

(51)

• Para estudar o efeito de um tratamento muitas vezes se pares de indivíduos. Outra vezes, comparam-se os dois lados dos mesmos indivíduos.

• Por exemplo, para estudar o efeito de um tratamento para prevenção de cáries. O dentista pode aplicar o tratamento em um lado da arcada dentária de cada paciente, e deixar o outro lado sem o tratamento.

• Também são feitos experimentos em que se observam os mesmo indivíduos duas vezes, isto é, uma vez antes outra vez depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento sobre a pressão arterial, o médico pode obter a pressão arterial de seus pacientes, antes e depois de administrar o tratamento.

(52)

Teste t para amostras pareadas

Todos os exemplo anteriores são de observação pareadas (pares de gêmeos, dois lados de um indivíduo, duas observações no mesmo indivíduo).

Procedimentos:

1. Estabeleça as hipóteses;

2. Estabeleça α (alfa);

3. Calcule a estatística do teste

3. 1 Calcule a diferença e as diferenças ao quadrado entre as unidades de cada um dos n pares;

(53)

Teste t para amostras pareadas

1 ) ( 2 2 2   



n n d d s_d Procedimentos:

3.2 Calcule a média das diferenças;

n d d 



(54)

5. Conclusão

Teste t para amostras pareadas

Procedimentos: n s d t d 2 

3. 4 Calcule a estatística de teste;

(55)

Exemplo de aplicação

Na tabela abaixo são dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.

Pesos em kg de 9 pessoas antes e depois da dieta de emagrecimento

Dieta Antes 77 62 61 80 90 72 86 59 88 Depois 80 58 61 76 79 69 90 51 81

1– Definição das Hipóteses

H₀: μ_d = 0 vs. H₁: μ_d ≠ 0

(56)

Exemplo de aplicação...

3.1– Calculo das diferenças e diferenças ao quadrado

Antes Depois d d2 77 80 -3 9 62 58 4 16 61 61 0 0 80 76 4 16 90 79 11 121 72 69 3 9 86 90 -4 16 59 51 8 64 88 81 7 49 Σ 30 300

(57)

Exemplo de aplicação...

3.2– Calculo da média das diferenças

n d d 



3,33 9 30   d

3.3– Calculo da variância das diferenças

1 ) ( 2 2 2   



n n d d s_d 25 8 9 30 300 2 2    d s

(58)

3.4– Calculo da estatística de teste

Exemplo de aplicação...

n s d t d 2  2,0 9 25 33 , 3 _  t 4– Estabelecer o t_crítico

Ao nível de significância de 1% e com 8 graus de liberdade, o valor de t_crítico é 3,36.

5– Conclusão

Com o valor do t calculado (2,0) é menor do que o valor do t_crítico (3,36), conclui-se que o tratamento não tem efeito significante, ao nível de 1%. Em termos práticos, o experimento não provou que a dieta emagrece.