Teste de hipótese para a
Teste de hipótese para a
média de populações normais
média de populações normais
Prof.a Dr.a Simone Daniela Sartorio de Medeiros
Teste de hipóteses para média de populações normais
Teste de hipóteses para média de populações normais
a) A afirmação diz respeito a uma média populacional.
Objetivo: avaliar afirmações sobre média(s) populacional(is). Existem, basicamente, 3 tipos de afirmações que se podem fazer
quando se estudam médias populacionais:
b) A afirmação diz que as médias de duas populações são todas iguais.
2) Teste para a comparação de
2) Teste para a comparação de
2
2
médias
Objetivo:
Comparar as médias amostrais de duas populações normais.
1º passo: Verificar se as variáveis estão ou não relacionadas.
2º passo: Considerar a variabilidade associada aos valores populacionais
e amostrais.
dependentes a) independentes Var conhecida 2 populações variâncias iguais b)a) Amostras
a) Amostras
dependentes
dependentes
observações pareadas
observações pareadas
(teste
(teste tt--pareado
pareado))
Teste para comparação de
Teste para comparação de duasduas médiasmédias populações
populações normaisnormais
(teste
(teste tt--pareado
pareado))
São comparadas duas médias populacionais sendo que, para cada unidade amostral, realizou-se duas medições da
característica de interesse.
Correspondem a medidas tomadas antes e após uma dada intervenção.
Duas amostras de elementos são ditas serem dependentes quando existe algo que as relacione.
Exemplo: Se os valores de duas amostras foram obtidos de um mesmo conjunto de elementos amostrais, podemos dizer que as duas amostras de valores são dependentes uma vez que foram tomados de um conjunto de elementos amostrais comum.
O objetivo neste caso é verificar se houve alteração na média de uma população quando a mesma é avaliada sob duas condições diferentes (antes e depois). Cada condição representa uma população distinta, embora se suponha que os elementos populacionais sejam os mesmos nas duas condições.
As medidas tomadas antes e após a intervenção realizada serão representadas pelas v.a.s Xi e Yi, respectivamente. O efeito produzido pelo i-ésimo indivíduo, pode ser representado pela variável:
Di= Yi – Xi
Queremos testar as hipóteses:
H0: mD = 0
Ha: mD 0
A hipótese alternativa também pode ser
unilateral!!!!
ou H0: mX = mY ou H0: mD = mX – mY = 0
Definindo as hipóteses
Definindo as hipóteses
Ou seja, sob H0, segue uma distribuição t-Student com
n – 1 graus de liberdade. ) 1 ( 0
~
ˆ
n D Dt
n
s
m
m
t
A estatística do teste de hipótese será
A estatística do teste de hipótese será::
Exemplo 2:
Exemplo 2:
Como o desempenho dos automóveis foi medido antes e
depois das 15 semanas, é razoável assumir que exista alguma dependência entre as variáveis.
Essa é a típica situação que o teste
t-pareado deve ser utilizado.
Uma distribuidora de combustíveis deseja verificar se um novo tipo de gasolina é eficaz na revitalização de motores velhos.
Selecionou-se 12 automóveis de um mesmo modelo com mais de 8 anos de uso e, após regulagem dos motores, verifica-se o consumo de combustível. Em seguida, o carro é abastecido com o novo tipo de combustível durante 15 semanas e uma nova
aferição é feita (km/litro).
alguma dependência entre as variáveis. utilizado.
As medidas tomadas antes e após a intervenção realizada serão representadas pelas v.a.s Xi e Yi, respectivamente. O efeito produzido pelo i-ésimo indivíduo, pode ser representado pela variável D, onde Di= Yi – Xi , i = 1, ..., 12. Assim, temos:
Valores observados para os 12 automóveis:
• A média e a variância amostrais de D são:
e
1667
94
,
2
ˆ
m
e
s
2
2
,
4
28106
1.º Passo:
1.º Passo:
Definir as hipóteses nula e alternativa:
H
0: m
D= 0 (O novo combustível não aumenta o rendimento)
H
a: m
D> 0 (O novo combustível aumenta o rendimento)
1667
94
,
2
ˆ
D
m
s
D2
2
,
4
28106
2.º Passo:2.º Passo: Fixar e determinar a região crítica. =5%
2.º Passo:
2.º Passo: Fixar e determinar a região crítica. =5% ttab =1,796
5396
,
6
12
28106
4
,
2
0
941667
,
2
calct
3.º Passo:3.º Passo: Obter o tcalc
ttab
0
12
4.º Passo:
4.º Passo: Conclusão
Como tcalc > ttab rejeitamos H0 ao nível de 5% de significância e concluímos que o novo combustível é eficaz na melhora do rendimento.
Tarefa 1
Tarefa 1
:
:
Obtenha o intervalo de confiança de 95% de confiança para a verdadeira diferença entre as médias de consumo do novo combustível.
DICA: procure a fórmula no livros de experimentação para a notação:
### 2 pop - pareado
X <- c(8.1, 7.9, 6.8, 7.8, 7.6, 7.9, 5.7, 8.4, 8.0, 9.5, 8.0, 6.8) # antes Y <- c(11.6, 8.8, 9.9, 9.5, 11.6, 9.1, 10.6, 10.8, 13.4, 10.6, 10.5, 11.4) # apos D <- Y-X # Diferença
t.test(D, paired = F, conf.level = 0.95, alternative='greater')
2 populações dependentespopulações dependentes
Exemplo 2:
Exemplo 2:
Desempenho dos automóveis medido antes (X) e após (Y) a aplicação do novo tipo de combustível. α = 5%.t.test(D, paired = F, conf.level = 0.95, alternative='greater')
# One Sample t-test #
# data: D
# t = 6.5396, df = 11, p-value = 2.097e-05
# alternative hypothesis: true mean is greater than 0 # 95 percent confidence interval:
# 2.133833 Inf # sample estimates: # mean of x
b) Amostras
b) Amostras
independentes
independentes
Teste para comparação de
Teste para comparação de duasduas médiasmédias populações
populações normaisnormais
b.1) Variâncias
Formalizando o problema:
Sejam duas variáveis aleatórias independentes (X
1, ..., X
n1) e (Y
1, ...,
Y
n2), ambas com distribuição normal, tendo a mesma variância.
Obtemos uma amostra de cada variável de tamanho n
1e n
2,
respectivamente, ou seja:
2 2 2 1 2 1,...,
2
,
1
),
,
(
~
,...,
2
,
1
),
,
(
~
n
j
m
N
Y
n
i
m
N
X
j i
OBS: Para ambas as populaçõestemos a mesma variância
(desconhecida!!!)
Como
2é desconhecida, precisará ser estimada.
Como e são estimadores não viciados dessa variância, usaremos
como estimativa para
2uma combinação deles dada por:
2 X
s
s
Y2
1
1
1
1
2 1 2 2 2 1 2
n
n
s
n
s
n
s
C X Yé uma média ponderada entre e e é um estimador não viciado!!!
2 C
s
2 Ys
2 Xs
)
(
)
ˆ
ˆ
(
m
m
m
m
Definindo as hipóteses
Definindo as hipóteses
H
0: m
1= m
2H
a: m
1 m
2H
0: m
1– m
2= 0
H
a: m
1– m
2 0
OUQueremos testar se existe diferença entre as médias populacionais (ou entre as duas populações), ou seja:
A estatística do teste de hipótese será
A estatística do teste de hipótese será::
Se n 30
) 2 ( 2 1 2 02 01 2 1 2 1~
1
1
)
(
)
ˆ
ˆ
(
n n ct
n
n
s
m
m
m
m
t
Exemplo 3:
Exemplo 3:
Digitadores são treinados em uma empresa em duas turmas distintas. Na
primeira (Turma J) utiliza-se um
método japonês
, na segunda (Turma
A) utiliza-se um
método alemão
. Deseja-se comparar os dois métodos
ao nível = 1%.
Foram escolhidas duas amostras aleatoriamente (uma de cada turma) e
mediu-se o tempo gasto na realização de uma tarefa para cada aluno.
Apesar de não conhecidas,
as variâncias
populacionais para as duas
Apesar de não conhecidas,
as variâncias
populacionais para as duas
turmas são consideradas
iguais
com base em estudos anteriores.
Os dados obtidos foram:
H0: mJ = mA Ha: mJ mA
H0: mJ– mA = 0 Há: mJ– mA 0
OU
Como queremos testar se existe diferença entre o tempo médio de digitação dos dois métodos (ou entre as duas turmas), ou seja:
Definindo as hipóteses
Definindo as hipóteses
• As amostras forneceram os seguintes valores:
Turma J: n
J= 14,
e
Turma A: n
A= 13,
ˆ 15,38462e
57143 , 11 ˆ A J m m 2564 , 4 2637 , 4 2 2 A J s s) 2 ( 2 0 0
~
1
1
)
(
)
ˆ
ˆ
(
A J n n A J c A J A Jt
n
n
s
m
m
m
m
t
Logo para = 0,01, temos da tabela t-Student com 25 graus de liberdade, obtemos: Como temos 2 amostras independentes, o total das amostras será
) 2 ( 2 0 0
~
1
1
)
(
)
ˆ
ˆ
(
A J n n A J c A J A Jt
n
n
s
m
m
m
m
t
Logo para = 0,01, temos da tabela t-Student com 25 graus de liberdade, obtemos: Como temos 2 amostras independentes, o total das amostras será
n = nJ + nA 14 + 13 = 27 < 30. Logo, a estatística para o teste será:
ttab= 2,787, ou seja: –2,787 2,787
4,7965
13
1
14
1
260185
,
4
)
0
(
)
38
,
15
57
,
11
(
calct
Então : RC={t | t < –2,787 ou t > 2,787 }Como –4,7965 pertence a região crítica (RC), concluímos que os
métodos de fato diferem a um nível de significância de 1%.
Tarefa 2
Tarefa 2
:
:
Obtenha o intervalo de confiança de 99% de confiança para a verdadeira diferença entre as médias dos 2 métodos de digitação.
DICA: procure a fórmula no livros de experimentação para a notação:
### 2 pop – indep, com var =
tempo<- c(10, 13, 9, 10, 14, 13, 10, 15, 12, 10, 9, 10, 13, 14, 15, 12, 18, 16, 15, 17, 17, 15, 16, 17, 11, 17, 14)
turma<- factor(c(rep("J",14), rep("A",13))); turma tapply(tempo, turma, mean)
tapply(tempo, turma, var)
2 populações independentes 2 populações independentes ccom variâncias iguaisom variâncias iguais
Exemplo 3:
Exemplo 3:
Deseja-se comparar os dois métodos de digitação ao nível = 1%: método japonês com o método alemão.t.test(tempo ~ turma, paired = F, var.equal = T,
alternative="two.sided", conf.level =0.99) Two Sample t-test
#
# data: tempo by turma
# t = 4.7965, df = 25, p-value = 6.313e-05
# alternative hypothesis: true difference in means is not equal to 0 # 99 percent confidence interval:
# 1.597201 6.029173 # sample estimates:
# mean in group A mean in group J # 15.38462 11.57143
b) Amostras
b) Amostras
independentes
independentes
Teste para comparação de
Teste para comparação de duasduas médiasmédias populações
populações normaisnormais
b.2) Variâncias
O teste para o caso com as variâncias desconhecidas e desiguais é semelhante ao anterior, mas a quantidade a ser usada para aceitar ou rejeitar H0.
E os graus de liberdade são corrigidos pela expressão:
) ( 2 2 1 2 02 01 2 1
ˆ
)
(
)
~
ˆ
(
t
n
s
n
s
m
m
m
m
t
Y X
Se n 30
Se n > 30A seqüência do teste é igual aos casos anteriores.
)
1
,
0
(
~
)
(
)
ˆ
ˆ
(
2 2 1 2 02 01 2 1N
n
s
n
s
m
m
m
m
z
Y X
### 2 pop – indep, com var diferentes Y <- c( )
pop <- factor(c(rep(“pop1",n1), rep(“pop2",n2)))
2 populações independentes 2 populações independentes ccom variâncias diferentesom variâncias diferentes
Exemplo
Exemplo 4
4:: Sendo Y a variável resposta observada 2 populações (pop),
usando α = 5%
t.test(Y ~ pop, paired = F,
var.equal = FALSE, conf.level =0.95)
Teste de hipóteses para média de populações normais
Teste de hipóteses para média de populações normais
a) A afirmação diz respeito a uma média populacional.
Objetivo: avaliar afirmações sobre média(s) populacional(is). Existem, basicamente, 3 tipos de afirmações que se podem fazer
quando se estudam médias populacionais:
b) A afirmação diz que as médias de duas populações são todas iguais.