Teste de
Teste de Hipóteses
Em estatística, uma hipótese é uma alegação, ou afirmação, sobre uma característica de uma população:
Pesquisadores médicos afirmam que a
temperatura média do corpo humano não é igual a 37 ºC.
Um novo fertilizante utilizado no cultivo de hortaliças aumenta a produtividade.
Teste de Hipóteses
A dificuldade nestes casos é que a característica
de interesse varia em cada amostra.
Daí a necessidade de métodos estatísticos.
A temperatura média do corpo humano varia
de pessoa para pessoa;
Estudo de Caso
(temperatura do corpo humano)
Estudos prévios indicam que a temperatura do
corpo humano é 37ºC. Pesquisadores médicos
coletaram dados amostrais e encontraram uma
média
= 36,8ºC e distribuição aproximadamente
normal.
Estes dados amostrais constituem evidência
suficiente para rejeitar a crença comum de que
μ = 37 ºC ???
Estudo de Caso
(temperatura do corpo humano)
O primeiro passo consiste em formular duas
hipóteses sobre a afirmação.
As hipóteses são explicações potenciais que
procuram levar em conta fatos observados em
situações onde existem algumas incógnitas.
A incógnita em nosso caso é a verdadeira
temperatura do corpo humano.
Hipótese Nula e Alternativa
A hipótese nula H0 é uma afirmação que diz que o parâmetro populacional é tal como especificado (isto é, a afirmação é correta).
H0 : μ = 37
A hipótese alternativa H1 é uma afirmação que oferece uma alternativa à alegação (isto é, o parâmetro é maior/menor/diferente que o valor alegado).
Hipótese Nula e Alternativa
A hipótese nula H
0representa o status quo, ou
seja, a circunstância que está sendo testada, e o
objetivo dos testes de hipóteses é sempre tentar
rejeitar a hipótese nula.
A hipótese alternativa H
1representa o que se
deseja provar ou estabelecer, sendo formulada
para contradizer a hipótese nula.
A hipótese nula pode ou
não ser impugnada pelos
resultados
de
um
experimento. Ela
nunca
pode ser provada, mas
pode ser desaprovada no
curso da experimentação.
Teste Unilateral e Bilateral Unilateral direito: H0: ≤ 50 H1: > 50 Unilateral esquerdo: H0: ≥ 50 H1: <50 Bilateral: H0: = 50 H1: 50
Tipos de Erro
Repare que, ao testarmos uma hipótese nula, chegamos a uma conclusão:
rejeitá-la, ou não rejeitá-la
Entretanto, devemos lembrar que tais conclusões ora são corretas, ora são incorretas (mesmo quando fazemos tudo corretamente!).
Este é o preço a ser pago por estarmos trabalhando em uma situação onde a variabilidade é inerente !!!
Erro do tipo I:
Um erro do tipo I ocorre quando a hipótese nula é rejeitada, apesar de ser verdadeira. A probabilidade de cometer o erro tipo I é denominada “nível de significância” e é denotada por α.Erro do Tipo II:
Um Erro de tipo II ocorrequando a hipótese nula não é rejeitada, apesar de ser falsa.
A probabilidade de cometer o erro tipo II é denotada por β.
Conceito de aceitar e rejeitar a hipótese H
0ACEITAR OU REJEITAR A HIPÓTESE H0?
O estudo parte do princípio que a hipótese H0 é verdadeira até que se tenha prova estatística em contrário
ACEITAR H0 = não há provas suficientes para rejeitá-la
REJEITAR H0 = há evidências suficientes de que as diferenças obtidas (entre o que era esperado e o que foi observado na amostra) não ocorreram por acaso.
Analogia com o direito
Aceitar = não há provas suficientes para condenar o réu (não culpado) Rejeitar = as provas reunidas são suficientes para culpar o réu.
A eficácia de certa vacina após um ano é de 25% (isto é, o efeito imunológico se prolonga por mais de um ano em apenas 25% das pessoas que a tomam). Desenvolve-se uma nova vacina, mais cara, e deseja-se saber se esta é, de fato, melhor.
Sendo “p”a proporção de imunizados por mais de um ano com a nova vacina...
Quais hipóteses devem ser formuladas?
Que erros poderemos cometer?
Exemplo
Hipótese nula: H
0: p ≤ 0,25
Hipótese alternativa: H
1: p > 0,25
Erro tipo I: aprovar a vacina quando, na
realidade, ela não tem nenhum efeito superior
ao da vacina em uso.
Erro tipo II: rejeitar a nova vacina quando ela
é, de fato, melhor que a vacina em uso
.
Passos para realizar um teste de hipóteses
1. Formular as hipóteses nula e alternativa; 2. Escolher a distribuição amostral adequada; 3. Fixar o nível de significância α do teste;
4. Estabeleça a região de rejeição usando o nível de significância (esboçar um gráfico é SEMPRE uma boa opção);
5. Calcular a estatística de teste;
6. Comparar a estatística de teste com os valores críticos:
•Rejeitar a hipótese nula se a estatística de teste excede o valor crítico, ou seja, está na região crítica •Aceitar a hipótese nula, caso contrário.
Exemplo 1
Uma máquina automática enche pacotes de café segundo uma distribuição normal com média μ e desvio-padrão 20g
A máquina foi regulada para μ = 500g
De meia em meia hora tiramos uma amostra de 16 pacotes para verificar se o empacotamento está sob controle, isto é, se μ = 500g
Se uma dessas amostras apresentasse = 492g, você pararia ou não o empacotamento para verificar
se o ajuste da máquina está correto? x
Exemplo 1...
Passo 1: Indicamos por X o peso de cada pacote,
então X é uma normal com média μ e σ = 20. As hipóteses que nos interessam são:
Hipótese nula: H0 : μ = 500g
Hipótese alternativa: H1 : μ ≠ 500g
Bilateral pois a máquina pode desregular para mais ou para menos
Exemplo 1...
Passo 2: Escolher a distribuição amostral.
Se o desvio padrão populacional é conhecido:
Distribuição NORMAL (Zteste)
Se o desvio é desconhecido e a amostra é pequena (n < 30):
Distribuição de STUDENT(tteste)
Passo 3: Escolher o nível de significância
Pela situação descrita no problema, podemos fazer α = 0,01
Exemplo 1...
Passo 4: Estabeleça a região de rejeição usando o nível de significância
Exemplo 1...
Passo 4: Estabeleça a região de rejeição usando o nível de significância α = 1% Z = -2,57 μ = 500 Z = 2,57 Área = 0,5 – 0,005 = 0,495 Área = 0,5 – 0,005 = 0,495 % 5 , 0 2 % 5 , 0 2
Exemplo 1...
Passo 5: Calcular a estatística de teste;
n
x
Z
calc
06
,
1
5
8
16
20
500
492
calcZ
Exemplo 1...
Passo 6: Comparar a estatística de teste com os valores críticos.
-2,57 -1,6 500 2,57
Não houve evidência amostral significativa no sentido de rejeitar H0.
Comparação de Médias
Variância conhecida
Suponha que X é uma variável aleatória com média desconhecida e variância σ2 conhecida. E queremos testar a hipótese de que a média é igual a um certo valor especificado
0. O teste de hipótese pode ser formulado como segue:
Para testar a hipótese, toma-se uma amostra aleatória de n observações e se calcula a estatística
0 1 0 o
:
H
:
H
n
X
Z
calc o/
Cálculo da Região Crítica
A região crítica é a região onde H0 é rejeitada. A área da região crítica é igual ao nível de significância (), que estabelece a probabilidade de rejeitar H0 quando ela é verdadeira.
Regra de Decisão
Se o valor da estatística do teste cair na região crítica, rejeita-se H0. Ao rejeitar a hipótese nula (H0) existe uma forte evidência de sua falsidade.
Comparação de Média
Variância conhecida
A resistência à tração do aço inoxidável produzido numa usina permanecia estável, com uma resistência média de 72 kg/mm2 e um desvio padrão de 2,0 kg/mm2. Recentemente, a máquina foi ajustada. A fim de determinar o efeito do ajuste, 10 amostras foram testadas.
76,2 78,3 76,4 74,7 72,6 78,4 75,7 70,2 73,3 74,2 Presuma que o desvio padrão seja o mesmo que antes do ajuste. Podemos concluir que o ajuste mudou a resistência à tração de aço? (Adote um nível de significância de 5%).
Exemplo 2
Passo 1: Formular hipótese nula e alternativa
Ho: = 72 kg/mm2 H1: ≠ 72 kg/mm2 σ = 2kg/mm2
Passo 2: Escolher a distribuição amostral adequada.
O desvio padrão da população é conhecido (Zteste)
Passo 3: Fixar o nível de significância α do teste.
α = 5%
Passo 4: Estabeleça a região de rejeição usando o nível de significância.
Exemplo 2...
Passo 5: Calcular a estatística de teste
75 10 2 , 74 2 , 70 7 , 75 4 , 78 6 , 72 7 , 74 4 , 76 3 , 78 2 , 76 X X 74 , 4 6325 , 0 3 10 2 72 75 calc Z Sendo = 75 e σ = 2 kg/mm², temos: n x Zcalc X
Exemplo 2...
Passo 6: Comparar a estatística de teste com os valores críticos.
H0 é rejeitada e concluímos que a resistência à tração do aço mudou.
Comparação de Média
Variância desconhecida
Suponha que X é uma variável aleatória Normal com média
e variância σ2 DESCONHECIDA. Para testar a hipótese de que a média é igual a um valor especificado o , formulamos: o 1 0 o : H : H
Como σ2 não é conhecido, usa-se a distribuição de
Student para construir a estatística do teste.
n
S
X
t
calc o/
Exemplo 3
Um trecho de uma rodovia estadual, quando é utilizado o radar, são verificadas em média 7 infrações diárias por excesso de velocidade. O chefe de polícia acredita que este número pode ter aumentado. Para verificar isso, o radar foi mantido por 10 dias consecutivos. Os resultados foram:
8, 9, 5, 7, 8, 12, 6, 9, 6, 10
Os dados trazem evidência de aumento nas infrações?
Passo 1: Formular as hipóteses nula e alternativa.
Exemplo 3...
Passo 2: Escolher a distribuição amostral adequada.
O desvio padrão da população é desconhecido (tteste)
Passo 3: Fixar o nível de significância do teste.
α = 5%
Passo 4: Estabeleça a região de rejeição usando o nível de significância.
Grau de liberdade gl = n -1 gl = 9 ttab = 1,833
Exemplo 3...
Passo 5: Calcular a estatística do Teste
Temos = 8.
Não conhecendo σ, estimamos por S (desvio-padrão da amostra), logo, S = 2,10.
Desvio-padrão foi estimado a partir de uma pequena amostra) deve-se usar a estatística t-student.
x
5
,
1
666
,
0
1
10
10
,
2
7
8
n
S
X
t
calc
oExemplo 3...
Passo 6: Comparar a estatística de teste com os valores críticos
Como aceitamos H0, a conclusão é que não houve um aumento significativo no número de infrações. Veja que, apesar de 8 ser maior que 7, a diferença não foi significativa para concluir que o número de infrações aumentou.
Um empresário desconfia que o tempo médio de espera para atendimento de seus clientes é superior a 20 minutos. Para testar essa hipótese ele entrevistou 20 pessoas e questionou quanto tempo demorou para ser atendido. O resultado dessa pesquisa aparece a seguir:
22 20 21 23 22 20 23 22 20 24 21 20 21 24 22 22 23 22 20 24
Exemplo de um Teste de Hipótese Para Média
H0 : μ ≤ 20 H1 : μ > 20 40 , 1 8 , 21 S X 75 , 5 20 40 , 1 20 8 , 21 n S X tcalc
gl 19 % 5 729 , 1 e tcrítico Rejeita-se H0Como decidir qual teste devo utilizar?
Teste t Teste Z n ≥ 30? Teste Z Início σ é conhecido? Não Não Sim SimUm fabricante de pneu alega que seus pneus suportam uma quilometragem de 40.000 milhas no mínimo. Suponhamos que os resultados de um teste tenham sido: amostra n = 49, média amostral 38.000 milhas. Sabe-se que quilometragem de todos os pneus têm desvio-padrão de 3.500 milhas (duração). Realize o teste de hipótese para testar a afirmação do fabricante.
000 . 40 : 1 H 000 . 40 : 0 H 0 , 4 49 3500 000 . 40 000 . 38 0 calc calc Z n x Z
Há evidências suficientes para garantir a rejeição da afirmação que a média é maior ou igual à 40 mil Milhas
40000 Adotando: ( = 0,05), temos que Zcrítico = - 1,65 Zcrítico = -1,65 Região de rejeição Zcalc = -4,0 38000
Exemplo de um Teste de Hipótese Para Média
Um fabricante de fio de arame alega que seu produto tem uma resistência média à ruptura igual ou superior a 10 Kg/cm2, com desvio padrão de 0,5 kg/cm2. O INMETRO resolve testar essa afirmativa, extraindo uma amostra de 50 peças de arame, a qual acusou resistência média de 10,4 kg/cm2. Que conclusão o INMETRO pode chegar?
10 : 1 H 10 : o H 66 , 5 50 5 , 0 10 4 , 10 0 n x Zcalc -1,645 +5,66 • Adotando: (=0,05) temos: Zcrítico = -1,645
Há evidências suficientes para garantir que a média é igual ou superior a 10kg/cm².
Teste de Hipótese
Comparação de duas Médias
Passo 1:Definição da Hipótese;
Quando há duas populações normais com médias e variâncias desconhecidas, as hipóteses para testar se as médias são iguais são as seguintes:
Passo 2:
Definição do Nível de Significância;
2 1 1 2 1
:
:
H
H
oPasso 3:
Calcular a estatística do Teste
O procedimento do teste irá depender de que . Se essa suposição for razoável, então calcula-se a variância combinada.
E a seguir calcula-se a estatística do teste:
2 2 2 1 2 1 2 1 1 1 n n S x x t p cal 2 1 1 2 1 2 2 2 2 1 1 2 n n S ) n ( S ) n ( S p
Teste de Hipótese
Passo 4:
Região Crítica
O valor tabelado de t depende do nível de significância e dos graus de liberdade, que são função do tamanho da amostra. gl = n1 + n2 – 2
Passo 5:
Regra de Decisão
Comparar o valor da estatística do teste tcal com o valor tabelado ttab com n1+ n2 – 2 graus de liberdade. Ho será rejeitada se:
2 , 2 / 1 2
n n calct
t
Teste de Hipótese
Comparação de duas Médias
O teste t para duas amostras.
Passo a passo
Passo 1: Estabelecer as hipóteses H0 e H1;
Passo 2: Decidir o nível de significância do teste(α);
Passo 3: Determinação do valor crítico do teste;
Passo 4: Calcular a média de cada grupo; média do grupo 1 média do grupo 2 n x x1
i n x x2
i1 ) ( 2 2 1
n x x s i variância do grupo 1 1 ) ( 2 2 2
n x x s i variância do grupo 2Passo 5: Calcular a variância de cada grupo;
Passo 6: Calcule a variância ponderada;
n1 é o número de elementos do grupo 1 n2 é o número de elementos do grupo 2
2 ) 1 ( ) 1 ( 2 1 2 2 2 2 1 1 2 n n s n s n sp
Passo a passo...
Passo 7: Calculo da estatística t;
Passo 8: Conclusão do teste:
Feito os cálculos, é preciso comparar o valor calculado de t com o valor da tabela, ao nível de significância estabelecido e com (n1 + n2 – 2) graus de liberdade ) 1 1 ( 2 1 2 2 1 n n s x x t p
Passo a passo...
Exemplos de comparação de duas médias
• Um químico alega ter descoberto um aditivo para gasolina que revolucionará o rendimento dos automóveis. Para avaliar a afirmação testaram-se 18 carros, com e sem aditivo.
• Doze pneus de duas marcas foram postos à prova quanto à duração, objetivando avaliar se existe diferenças nas vidas médias das duas marcas .
• Técnicos de uma indústria que opera com duas linhas de produção desejam avaliar a similaridade de produção das linhas a fim de identificar possíveis pontos de melhoria em uma delas;
“Exemplo da aplicação do teste de hipótese
para comparação de duas média”
Foi desenvolvida uma pesquisa com o objetivo de verificar se os filtros de cigarros realmente fazem diferença ou são apenas truques de venda sem qualquer efeito real. Para isso foram selecionadas aleatoriamente amostras de cigarros com e sem filtro e medida a quantidade (em miligramas) de alcatrão presente. Verifique se os filtros são eficazes na eliminação do alcatrão dos cigarros.
Cigarros com filtro Cigarros sem filtro n1 = 21 n2 = 8 S1 = 1,9 S2 = 1,7 Alcatrão (em mg) 3 , 13 1 x x2 24,0
Teste t para amostras independentes
Hipóteses estatísticas: H0: μ1 = μ2 vs. H1: μ1 ≠ μ2 42 , 3 27 23 , 20 2 , 72 2 8 21 7 , 1 ) 1 8 ( 9 , 1 ) 1 21 ( 2 2 2 p s 9 , 13 77 , 0 7 , 10 8 1 21 1 42 , 3 3 , 13 24 calc t α = 5% gl = 27 tcrítico = 2,052Conclusão: Como a estatística de teste (13,9) é maior do que o tcrítico (2,052), podemos concluir de que há indícios que existe diferença estatisticamente significante no conteúdo de alcatrão entre os cigarros com e sem filtro.
“Exemplo da aplicação do teste de hipótese para
comparação de duas média no setor de serviços”
Um Hospital vem recebendo diversas reclamações de seus clientes
quanto ao elevado tempo de espera para a realização de exames em seus guichês. Uma ação corretiva para melhoria dos serviços foi desenvolvida e o hospital utilizou-se de duas amostras aleatórias antes e depois da implementação dos resultados para verificar se a ação corretiva teve sucesso, uma vez que o número de reclamações havia reduzido. Adote nível de significância igual =1% = 0,01.
16,3 21 14,5 14,6 25,9 12,1 11,1 14,6 12,6 12,9
6,3 20,8 10,5 15,4 28,5 13,8 17,3 19,9 13,5 8,6
13,9 12,4 14,2 21,7 18 12,1 14,2 6,2 21,3 11,4
29,1 21 18,2 17,2 21,3 10,2 10,7 7,3 6,6 13,8
16,7 17 14,9 14 10,1 4,8 16 17,1 7,9 20,1
Antes da ação Depois da ação
Medida do tempo (em minutos) de espera dos pacientes do hospital, antes e depois da ação corretiva
1- Estabelecer as Hipóteses nula e alternativa: 2 1
:
oH
2 1 1 :
HO hospital quer provar que o tempo médio para atendimento era maior antes da ação corretiva.
2- Determinar a região crítica de teste pela Tabela de distribuição t de student:
45
,
2
48 ; 01 , 0 2 ; 1 2
t
t
n n A hipótese nula deve serrejeitada se, tcalc > 2,45
2 1
1 :
H Teste unilateral direito
tcrítico
μ1 Tempo médio de espera dos clientes antes da ação corretiva
3- Fazer os cálculos necessários a partir dos dados amostrais: 35 , 3 25 1 25 1 ). 60 , 24 ( 64 , 12 34 , 17 1 1 . 2 1 2 2 1 n n s X X t p calc
3.1- Média amostral antes da ação = 17,34 minutos
3.2- Média amostral depois da ação = 12,64 minutos
60 , 24 2 ) 1 ( ) 1 ( 2 1 2 2 2 2 1 1 2 n n s n s n sp
5- Decidir se a hipótese nula deve ser rejeitada ou não:
Como tcalc = 3,35 é maior do que 2,45, a hipótese nula foi rejeitada ao nível de significância de 1%.
A equipe técnica tem forte evidência para concluir que o tempo médio de espera antes da ação corretiva é superior ao tempo médio depois da ação. Isto é. A ação corretiva foi eficaz;
Região Crítica 0,01 tα tcrítico=2,45 1 - α região de rejeição região de aceitação Tcalc =3,35
• Para estudar o efeito de um tratamento muitas vezes se pares de indivíduos. Outra vezes, comparam-se os dois lados dos mesmos indivíduos.
• Por exemplo, para estudar o efeito de um tratamento para prevenção de cáries. O dentista pode aplicar o tratamento em um lado da arcada dentária de cada paciente, e deixar o outro lado sem o tratamento.
• Também são feitos experimentos em que se observam os mesmo indivíduos duas vezes, isto é, uma vez antes outra vez depois de administrar o tratamento. Por exemplo, para verificar o efeito de um tratamento sobre a pressão arterial, o médico pode obter a pressão arterial de seus pacientes, antes e depois de administrar o tratamento.
Teste t para amostras pareadas
Todos os exemplo anteriores são de observação pareadas (pares de gêmeos, dois lados de um indivíduo, duas observações no mesmo indivíduo).Procedimentos:
1. Estabeleça as hipóteses;
2. Estabeleça α (alfa);
3. Calcule a estatística do teste
3. 1 Calcule a diferença e as diferenças ao quadrado entre as unidades de cada um dos n pares;
Teste t para amostras pareadas
1 ) ( 2 2 2
n n d d sd Procedimentos:3.2 Calcule a média das diferenças;
n d d
5. Conclusão
Teste t para amostras pareadas
Procedimentos: n s d t d 2
3. 4 Calcule a estatística de teste;
Exemplo de aplicação
Na tabela abaixo são dados os pesos de 9 pessoas, antes e depois da dieta para emagrecimento.
Pesos em kg de 9 pessoas antes e depois da dieta de emagrecimento
Dieta Antes 77 62 61 80 90 72 86 59 88 Depois 80 58 61 76 79 69 90 51 81
1– Definição das Hipóteses
H0: μd = 0 vs. H1: μd ≠ 0
Exemplo de aplicação...
3.1– Calculo das diferenças e diferenças ao quadrado
Antes Depois d d2 77 80 -3 9 62 58 4 16 61 61 0 0 80 76 4 16 90 79 11 121 72 69 3 9 86 90 -4 16 59 51 8 64 88 81 7 49 Σ 30 300
Exemplo de aplicação...
3.2– Calculo da média das diferenças
n d d
3,33 9 30 d3.3– Calculo da variância das diferenças
1 ) ( 2 2 2
n n d d sd 25 8 9 30 300 2 2 d s3.4– Calculo da estatística de teste
Exemplo de aplicação...
n s d t d 2 2,0 9 25 33 , 3 t 4– Estabelecer o tcríticoAo nível de significância de 1% e com 8 graus de liberdade, o valor de tcrítico é 3,36.
5– Conclusão
Com o valor do t calculado (2,0) é menor do que o valor do tcrítico (3,36), conclui-se que o tratamento não tem efeito significante, ao nível de 1%. Em termos práticos, o experimento não provou que a dieta emagrece.