Testes de Hip´oteses
Jonathas Magalh˜aes
jonathas@ic.ufal.br
Roteiro
1 Introdu¸c˜ao
2 Definindo Hip´oteses
3 Testes Estat´ısticos
Caracter´ısticas dos Dados P-valor
N´ıvel de Significˆancia Teste t de Student
Introdu¸c˜
ao
Desenvolver e formalizar hip´oteses;
Decidir sobre o teste estat´ıstico mais apropriado; Realizar o teste;
Definindo Hip´
oteses
Exemplos:
A m´edia de aceita¸c˜ao do produto A ´e 90%;
Em m´edia, o combust´ıvel X ´e menos poluente que o combust´ıvel Y;
Hip´otese nula (H0) – o teste avalia evidˆencias contra hip´otese;
Hip´otese alternativa (HA ou H1) – ´e o que supomos e
Definindo Hip´
oteses
Exemplos:
H0: µX = µY HA : µX 6= µY;
H0: µX ≤ µY HA : µX > µY;
H0: µX ≥ µY HA : µX < µY;
A hip´otese nula e alternativa s˜ao complementares e
Testes Estat´ısticos
Diversos tipos de testes existem;
A escolha do teste depende das caracter´ısticas dos dados
Tipo do dado; Normalidade; Paridade; Etc.
Testando a Normalidade – Shapiro-Wilk
Um dos testes mais utilizados para medir a normalidade ´e o Shapiro-Wilk;
Muito adequado para amostras pequenas e m´edias; Hip´oteses do teste:
H0– A amostra ´e origin´aria de uma popula¸c˜ao que tem
distribui¸c˜ao normal;
HA – A amostra n˜ao ´e origin´aria de uma popula¸c˜ao que tem
Testando a Normalidade – Shapiro-Wilk
1 O teste Shapiro-Wilk Retorna uma estat´ıstica W e o p-valor;
2 Significado do p-valor:
Se p-valor ≤ α ent˜ao a amostra ´e origin´aria de uma popula¸c˜ao que n˜ao ´e normal;
Se p-valor > α ent˜ao a amostra ´e origin´aria de uma popula¸c˜ao normal.
3 No R:
Compara¸c˜
oes Pareadas e N˜
ao Pareadas
Compara¸c˜ao Pareada:
Existe uma correspondˆencia um-a-um entre os dados dos dois grupos;
Exemplo:
Comparar a press˜ao arterial de um paciente antes e ap´os tomar algum medicamento;
Compara¸c˜ao n˜ao Pareada:
O n´umero de casos ´e igual mas n˜ao h´a correspondˆencia entre os testes, ou;
O n´umero de casos pode ser diferente. Exemplo:
Testes Estat´ısticos
Um teste estat´ıstico retorna dois resultados poss´ıveis:
Rejeitar a hip´otese nula – Encontrar significˆancia ou resultado significante naquilo que estamos investigando;
N˜ao rejeitar a hip´otese nula – Indica que n˜ao encontramos no estudo espec´ıfico evidˆencias para rejeit´a-la.
P-valor (p-value)
Um n´umero no intervalo [0,1] que indica um n´ıvel de probabilidade.
Sobre o p-valor
Probabilidade da estat´ıstica computada no teste ser obtida
assumindo que a hip´otese nula ´e verdadeira;
Quanto menor o p-valor maior a evidˆencia contra a hip´otese
nula;
Comparamos o p-valor com o n´ıvel de significˆancia (α) que
desejamos ser capazes de encontrar com o teste
N´ıvel de Significˆ
ancia
Fixar em um valor e tornar o resultado do teste um valor bin´ario:
p-valor ≤ α? Rejeita H0;
p-valor > α? Aceita H0.
Outros autores sugerem estabelecer n´ıveis de rejei¸c˜ao para o
Teste de Hip´
otese – Algoritmo
1 Formular hip´oteses nula (H0) e alternativa (HA);
2 Realizar o experimento e coletar os dados;
3 Escolher o teste estat´ıstico adequado e definir o ´ındice de
significˆancia (α);
4 Computar a estat´ıstica e identificar o p-valor;
Qual Teste Escolher?
Comparar uma amostra a um valor hipot´etico
Dados normais
Teste t de Student;
Dados n˜ao normais
Teste Wilcoxon rank sum.
Comparar duas amostras
Dados normais (pareadas ou n˜ao)
Teste t de Student;
Dados n˜ao normais (pareados)
Teste Wilcoxon rank sum.
Teste t de Student
A popula¸c˜ao de onde vem a amostra deve ser normal;
Usado para comparar m´edias.
Deve-se definir as hip´oteses nula e alternativa;
Para avaliar m´edia de 1 ou dois grupos/aternativas.
Computa-se uma estat´ıstica t, que representa uma m´edia padronizada ou uma diferen¸ca m´edia entre dois grupos;
Se H0 for aceita, essa estat´ıstica obedece uma certa
distribui¸c˜ao t de Student
Teste t de Student – Exemplo 1
A turma de Engenharia Qu´ımica obteve as seguintes notas em C´alculo 2: [6, 7.6, 4, 1, 2, 5.7, 8, 9, 3.4, 9.2, 4, 8, 7, 5, 9]
a D´a para afirmar estatisticamente que a m´edia da turma foi
maior que 5?
b D´a para afirmar estatisticamente que a m´edia da turma foi
Teste t de Student – Exemplo 1
Vamos verificar se os dados s˜ao normais;
Aplicando-se o teste Shapiro-Wilk :
> quimica = c (6 , 7.6 , 4 , 1 , 2 , 5.7 , 8 , 9 , 3.4 , 9.2 , 4 , 8 , 7 , > shapiro . test ( quimica )
Shapiro - Wilk normality test data : quimica
W = 0.937 , p - value = 0.3467
Como p-value> α ent˜ao H0 ´e aceita, logo:
Teste t de Student – Exemplo 1
Como os dados s˜ao normais, ent˜ao podemos aplicar o teste t;
Hip´oteses para a letra a:
HA – A m´edia da turma ´e maior que 5;
Teste t de Student – Exemplo 1
Aplicando-se o teste t de Student:> t . test ( quimica , mu =5 , alternative = " greater " ) One Sample t - test
data : quimica
t = 1.3665 , df = 14 , p - value = 0.09666
alternative hypothesis : true mean is greater than 5 95 percent confidence interval :
4.732278 Inf sample estimates : mean of x
5.926667
Teste t de Student – Exemplo 1
Hip´oteses para a letra b:
HA – A m´edia da turma ´e maior que 4;
Teste t de Student – Exemplo 1
Aplicando-se o teste t de Student:> t . test ( quimica , mu =4 , alternative = " greater " ) One Sample t - test
data : quimica
t = 2.8412 , df = 14 , p - value = 0.006538
alternative hypothesis : true mean is greater than 4 95 percent confidence interval :
4.732278 Inf sample estimates : mean of x
5.926667
Teste t de Student – Exemplo 2
A turma de Engenharia Qu´ımica obteve as seguintes notas em C´alculo 2: [6, 7.6, 4, 1, 2, 5.7, 8, 9, 3.4, 9.2, 4, 8, 7, 5, 9] enquanto que a turma de Engenharia Civil obteve as seguintes notas: [5, 8, 2, 1, 0, 2.4, 3.1, 7, 7.3, 3, 1, 4, 9, 8.6, 8].
D´a para afirmar estatisticamente que a turma de Engenharia
Teste t de Student – Exemplo 2
Vamos verificar se os dados s˜ao normais;
Verificaremos s´o os dados de Civil, pois j´a fizemos este procedimento para Qu´ımica.
Aplicando-se o teste Shapiro-Wilk :
> civil = c (5 , 8 , 2 , 1 , 0 , 2.4 , 3.1 , 7 , 7.3 , 3 , 1 , 4 , 9 , 8.6 > shapiro . test ( civil )
Shapiro - Wilk normality test data : civil
W = 0.9122 , p - value = 0.1463
Como p-value> α ent˜ao H0 ´e aceita, logo:
Teste t de Student – Exemplo 2
Como ambos os dados s˜ao normais, ent˜ao podemos aplicar o
teste t; Hip´oteses:
HA – A m´edia da turma de Qu´ımica ´e maior que a m´edia da
turma de Civil;
H0– A m´edia da turma de Qu´ımica ´e menor ou igual a m´edia
Teste t de Student – Exemplo 2
Aplicando-se o teste t de Student:> t . test ( quimica , civil , alternative = " greater " ) Welch Two Sample t - test
data : quimica and civil
t = 1.2366 , df = 27.233 , p - value = 0.1134
alternative hypothesis : true difference in means is greater 95 percent confidence interval :
-0.4901241 Inf
sample estimates : mean of x mean of y
5.926667 4.626667
Teste t de Student – Exemplo 2
A hip´otese nula de que “A m´edia da turma de Qu´ımica ´e
menor ou igual a m´edia da turma de Civil.”;
Podemos verificar se existe diferen¸ca entre as m´edias.
Definindo hip´oteses:
HA – A m´edia da turma de Qu´ımica ´e diferente da m´edia da
turma de Civil;
H0– A m´edia da turma de Qu´ımica ´e igual a m´edia da turma
Teste t de Student – Exemplo 2
Aplicando-se o teste t de Student:> t . test ( quimica , civil )
Welch Two Sample t - test data : quimica and civil
t = 1.2366 , df = 27.233 , p - value = 0.2268
alternative hypothesis : true difference in means is not equa 95 percent confidence interval :
-0.8562275 3.4562275 sample estimates : mean of x mean of y
5.926667 4.626667