COMPARA¸C ˜OES DE M´EDIAS - 1 FATOR FIXO 1 de abril de 2014
INTRODU ¸
C˜
AO
Testamos H0: µ1 = . . . = µr.
Se H0 n˜ao ´e rejeitada, n˜ao h´a evidˆencias de rela¸c˜ao entre a vari´avel
resposta e o fator.
Se H0 ´e rejeitada, prosseguimos a an´alise com o objetivo de localizar as
diferen¸cas entre as m´edias dos tratamentos.
Consideremos o modelo de m´edias associado ao plano completamente aleatorizado com um fator fixo
yij = µi+ eij.
Exemplo. Embalagens para cereal matinal. Uma companhia desejava testar 4 diferentes embalagens para um novo cereal matinal. 20 lojas, com volumes de vendas similares, foram selecionadas como unidades
experimentais. Para cada loja foi aleatoriamente atribu´ıda uma das embalagens (5 lojas para cada embalagem).
Devido a um incˆendio ocorrido numa das lojas durante o per´ıodo de realiza¸c˜ao do experimento, essa loja foi retirada do estudo. Todas as condi¸c˜oes que pudessem afetar as vendas durante o per´ıodo de realiza¸c˜ao do estudo foram mantidas constantes nas 19 lojas restantes. As vendas (Y ), em n´umero de embalagens, foram anotadas durante o per´ıodo de realiza¸c˜ao do experimento e constam da tabela abaixo. A este experimento pode ser associado um plano completamento aleatorizado, sendo o tipo de embalagem um fator fixo com 4 n´ıveis.
EXEMPLO
Tabela 1. Vendas (em n´umero de embalagens).
Embalagem 1 Embalagem 2 Embalagem 3 Embalagem 4
11 12 23 27 17 10 20 33 16 15 18 22 14 19 17 26 15 11 28 y1.= 73 y2. = 67 y3.= 78 y4.= 136 ¯ y1.= 14, 6 y¯2.= 13, 4 y¯3. = 19, 5 y¯4.= 27, 2 y..= 354 y¯..= 18, 63 n1 = 5 n2 = 5 n3 = 4 n4= 5
4,0 3,5 3,0 2,5 2,0 1,5 1,0 35 30 25 20 15 10 Tipo de embalagem
No. embalagens vendidas
Gr´afico 1. Dispers˜ao de Y por tratamento
A variabilidade de Y por tratamento parece constante. As vendas parecem maiores sob as embalagens 3 e 4.
EXEMPLO
Main Effects Plot das m´edias amostrais: Indica o(s) tratamento(s) que se destaca dos demais. A Embalagem 4 ´e a que se destaca.
4 3 2 1 27,5 25,0 22,5 20,0 17,5 15,0 Tipo de embalagem M é d ia d a s v e n d a s
Este padr˜ao de diferen¸cas reflete apenas uma varia¸c˜ao casual de diferen¸cas entre as m´edias dos tratamentos?
Tabela 2. Vendas (em n´umero de embalagens). FV gl SQ QM F valor P Embalagem 3 588,20 196,1 18,59 < 0, 001
Res´ıduo 15 158,20 10,5 Total 18 746,40
ESTIMA¸
C˜
AO DAS M´
EDIAS SOB OS TRATAMENTOS
Estima¸c˜ao da m´edia µi sob um tratamento;
Estima¸c˜ao da diferen¸ca entre m´edias sob dois tratamentos; Estima¸c˜ao de um contraste entre as m´edias sob os tratamentos; Estima¸c˜ao de uma combina¸c˜ao linear entre as m´edias sob os tratamentos.
1. Estima¸c˜ao da m´edia µi sob um tratamento t∗= yq¯i.− µi QMR ni ∼ tn−r, sendo n =P ini.
Um intervalo de confian¸ca para µi com coeficiente de confian¸ca γ = 1 − α
´ e dado por " ¯ yi.∓ t[1−α 2;n−r] r QMR ni # .
ESTIMA¸
C˜
AO DAS M´
EDIAS SOB OS TRATAMENTOS
Exemplo. Embalagens para cereal matinal. Obter um intervalo de 95% de confian¸ca para a m´edia de vendas sob a Embalagem 4.
Temos ¯y4.= 27, 2, n4 = 5 e QMR = 10, 5. Como α = 0, 05, temos
t[0,975;15] = 2, 131. O intervalo de confian¸ca para µ4 ´e dado por
" 27, 2 ∓ 2, 131 r 10, 5 5 , # ou seja, [24, 11; 30, 29].
4 3 2 1 30 25 20 15 10 Tipo de embalagem
No. embalagens vendidas
Interval Plot of No. embalagens vendidas
95% CI for the Mean - Mesmo desvio padrão
Gr´afico 3. Intervalos de confian¸ca para µi, i = 1, 2, 3, 4.
Os intervalos do Gr´afico 3 foram constru´ıdos com base em QMR.
ESTIMA¸
C˜
AO DAS M´
EDIAS SOB OS TRATAMENTOS
2. Estima¸c˜ao da diferen¸ca entre m´edias sob dois tratamentos
Sejam D = µi− µi0 e ˆD = ˆµi− ˆµi0 = ¯yi.− ¯yi0.. Temos t∗= r D − Dˆ QM Rn1 i + 1 ni0 ∼ tn−r.
Um intervalo de confian¸ca para D com coeficiente de confian¸ca γ = 1 − α ´ e dado por " ˆ D ∓ t[1−α 2;n−r] s QM R 1 ni + 1 ni0 # .
Exemplo. Embalagens para cereal matinal. Estimar a diferen¸ca entre as vendas m´edias sob as embalagens 3 e 4. Usar γ = 0, 95. Temos D = µ3− µ4, . ¯y3. = 19, 5, ¯y4.= 27, 2, ˆD = −7, 7, n3 = 4, n4= 5, QMR = 10, 5 e ˆ var( ˆD) = QM R 1 n3 + 1 n4 = 10, 5 1 4 + 1 5 = 4, 725. Como α = 0, 05, temos t[0,975;15]= 2, 131. O intervalo de confian¸ca para
D = µ3− µ4 com coeficiente de confian¸ca γ = 0, 95 ´e dado por
h
−7, 7 ∓ 2, 131p4, 725 i
, ou seja, [−12, 33; −3, 07].
Como o valor 0 n˜ao pertence ao intervalo de confian¸ca obtido, podemos dizer que existe diferen¸ca entre µ3 e µ4. Assim, conclu´ımos que h´a
evidˆencias de que as vendas m´edias sob a embalagem 3 s˜ao menores do que sob a embalagem 4.
ESTIMA¸
C˜
AO DAS M´
EDIAS SOB OS TRATAMENTOS
3. Estima¸c˜ao de um contraste entre as m´edias sob os tratamentos Defini¸c˜ao. Um contraste C ´e definido como
C = r X i=1 ciµi, com r X i=1 ci= 0.
Exemplos de contrastes. Embalagens para cereal matinal. a)C = µ1− µ2. Aqui, c1= 1, c2 = −1, c3= c4= 0.
b) C = µ1+ µ2 2 −
µ3+ µ4
Um estimador n˜ao viesado de C ´e dado por ˆ C = r X i=1 ciµˆi = r X i=1 ciy¯i.. Al´em disso, var( ˆC) = var( r X i=1 ciy¯i.) = σ2 r X i=1 c2i ni e ˆ var( ˆC) = QM R r X i=1 c2i ni .
ESTIMA¸
C˜
AO DAS M´
EDIAS SOB OS TRATAMENTOS
Um intervalo de confian¸ca para C com coeficiente de confian¸ca γ = 1 − α ´ e dado por ˆ C ∓ t[1−α2;n−r] q ˆ var( ˆC) .
Exemplo. Embalagens para cereal matinal. Obter um intervalo de 95% de confian¸ca para C = µ1+ µ2 2 − µ3+ µ4 2 . Temos ˆ C = y¯1+ ¯y2 2 − ¯ y3+ ¯y4 2 = 14, 6 + 13, 4 2 − 19, 5 + 27, 2 2 = −9, 35, 4 X i=1 c2i ni = (1/2) 2 5 + (1/2)2 5 + (−1/2)2 4 + (−1/2)2 5 = 0, 2125,
ˆ
var( ˆC) = 10, 5 × 0, 2125 = 2, 23125 e t[0,975;15] = 2, 131. O intervalo de confian¸ca para C com coeficiente de confian¸ca γ = 0, 95 ´e dado por
h
−9, 35 ∓ 2, 131p2, 23125i, ou seja, [−12, 53; −6, 07]. Como o valor 0 n˜ao pertence ao intervalo obtido, podemos dizer que h´a evidˆencias de que as vendas m´edias sob as embalagens 1 e 2 s˜ao menores do que sob as embalagens 3 e 4.
Vamos testar as hip´oteses H0: C = 0 contra H1: C 6= 0. Usar α = 0, 05.
Temos t∗ = ˆ C − 0 q ˆ var( ˆC) = √−9, 5 2, 23125 = −6, 26.
Sob H0, o valor P associado a t∗ ´e obtido da distribui¸c˜ao t-Student com
15 graus de liberdade, sendo igual a 2 × 0, 0000076 < 0, 001.
COMPARA¸
C ˜
OES M ´
ULTIPLAS
M´etodo de Tukey; M´etodo de Scheff´e; M´etodo de Bonferroni;
Compara¸c˜oes com um controle;
M´etodo de Tukey: para o conjunto de todas as diferen¸cas (duas a duas) entre as m´edias sob os tratamentos.
Sejam Dk= µi− µi0, k = 1, . . . , r(r − 1)/2, ˆDk= ¯yi.− ¯yi0.e ˆ var( ˆDk) = QM R 1 ni + 1 ni0 . Consideremos T = √1 2q(1 − α; r; n − r),
sendo q(1 − α; r; n − r) o quantil de ordem 1 − α da distribui¸c˜ao studentized range com parˆametros r e n − r, tabelada em Kutner et al. (2004) - Tabela B.9.
M´
ETODO DE TUKEY
Os limites de confian¸ca para Dk com coeficiente de confian¸ca global 1 − α
s˜ao dados por " ˆ Dk∓ T s QM R 1 ni + 1 ni0 # . Coment´arios:
O m´etodo de Tukey quando utilizado para amostras de tamanhos desiguais ´e denominado m´etodo de Tukey-Kramer;
Quando n1= n2= . . . = nr = m, o coeficiente de confian¸ca global
pelo m´etodo de Tukey ´e exatamente 1 − α e o n´ıvel de significˆancia global ´e exatamente α.
O m´etodo de Tukey pode ser usado para compara¸c˜oes de m´edias duas a duas, sejam essas compara¸c˜oes sugeridas ou n˜ao pelos dados. Quando os tamanhos das amostras n˜ao s˜ao todos iguais, o coeficiente de confian¸ca global ´e pelo menos 1 − α e o n´ıvel de significˆancia global ´e no m´aximo α. Em outras palavras, o m´etodo de Tukey ´e conservador quando os tamanhos das amostras n˜ao s˜ao todos iguais.
Exemplo. Embalagens para cereal matinal. Vamos obter todas as compara¸c˜oes duas a duas das m´edias sob as 4 embalagens, utilizando o m´etodo de Tukey com um coeficiente de confian¸ca global igual a 90%.
M´
ETODO DE TUKEY
D1 = µ1− µ2, ˆD1 = 14, 6 − 13, 4 = 1, 2, n1 = n2= 5, QMR = 10, 5 e ˆ var( ˆD) = QM R 1 n1 + 1 n2 = 10, 5 2 5 = 4, 2. Como 1 − α = 0, 10, temos T = √1 2q(1 − α; r; n − r) = T = 1 √ 2q(0, 90; 4; 15) = 1 √ 23, 54 = 2, 50,constante para todas as compara¸c˜oes.
O intervalo de confian¸ca para D1= µ1− µ2 com coeficiente de confian¸ca
global 1 − α = 0, 90 ´e dado por h
Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que n˜ao parece existir diferen¸ca entre µ1 e µ2. Assim, conclu´ımos que as vendas
m´edias sob as embalagens 1 e 2 n˜ao s˜ao diferentes.
D2 = µ1− µ3, ˆD2 = 14, 6 − 19, 5 = −4, 90, n1 = 5, n3 = 4, QMR = 10, 5 e ˆ var( ˆD) = QM R 1 n1 + 1 n3 = 10, 5 1 5 + 1 4 = 4, 725.
O intervalo de confian¸ca para D2= µ1− µ3 com coeficiente de confian¸ca
global 1 − α = 0, 90 ´e dado por h
−4, 9 ∓ 2, 50p4, 725 i
, ou seja, [−10, 33; 0, 534].
M´
ETODO DE TUKEY
Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que n˜ao parece existir diferen¸ca entre µ1 e µ3. Assim, conclu´ımos que n˜ao h´a
evidˆencias de que as vendas m´edias sob as embalagens 1 e 3 sejam diferentes.
Exerc´ıcio. Obter os demais 4 intervalos de confian¸ca e interpret´a-los. Verificar se o m´etodo de Tukey est´a implementado no R.
M´etodo de Scheff´e: para o conjunto de todos os contrastes entre as m´edias sob os tratamentos.
Sejam Ck=Pri=1ciµi com Pri=1ci= 0, para k = 1, 2, . . .
ˆ Ck= Pr i=1ciy¯i. e ˆvar( ˆCk) = QM R r X i=1 c2i ni . Consideremos S2 = (r − 1)F [1−α;r−1,n−r], sendo F[1−α;r−1,n−r] o quantil
de ordem 1 − α da distribui¸c˜ao F-Snedecor com r − 1 graus de liberdade no numerador e n − r no denominador.
M´
ETODO DE SCHEFF´
E
Os limites de confian¸ca para Ck com coeficiente de confian¸ca global 1 − α
s˜ao dados por Cˆk∓ S v u u tQM R r X i=1 c2i ni .
Observa¸c˜ao. Os limites de confian¸ca para C obtidos pelo m´etodo de Scheff´e diferem daqueles obtidos para um ´unico contraste somente atrav´es de um m´ultiplo de
q ˆ
Exemplo. Embalagens para cereal matinal. Vamos estimar os seguintes contrastes entre as m´edias de vendas sob as 4 embalagens, utilizando o m´etodo de Scheff´e com um coeficiente de confian¸ca global igual a 90%:
C1= µ1+ µ2 2 − µ3+ µ4 2 , C2= µ1+ µ3 2 − µ2+ µ4 2 , C3 = µ1− µ2, C4 = µ3− µ4. Como 1 − α = 0, 90, temos F[0,90;4−1,19−4]= 2, 49 e S2 = (4 − 1) × 2, 49 = 7, 47 (cte para todos os contrastes).
M´
ETODO DE SCHEFF´
E
Ck Cˆk var( ˆˆ Ck) Limites de confian¸ca
C1 -9,35 2,23125 [−9, 35 ∓ √ 7, 47 × 2, 23125] [−13, 53; −5, 37] C2 -3,25 2,23125 [−3, 25 ∓ √ 7, 47 × 2, 23125] [−7, 33; 0, 83] C3 1,2 4,2 [1, 2 ∓ √ 7, 47 × 4, 2] [−4, 40; 6, 80] C4 -7,7 4,725 [1, 2 ∓ √ 7, 47 × 4, 725] [−13, 64; −1, 76]
A embalagem 1 tem 3 cores mas n˜ao tem desenhos, a embalagem 2 tem 3 cores e desenhos, a embalagem 3 tem 5 cores mas n˜ao tem desenhos e a embalagem 4 tem 5 cores e desenhos. Assim, pelo intervalo de confian¸ca para C1, temos que parece haver diferen¸ca entre as vendas m´edias sob
embalagens com 3 e 5 cores (as com 3 cores tˆem vendas m´edias menores). J´a, pelo intervalo de confian¸ca para C2, temos que parece n˜ao haver
diferen¸ca entre as vendas m´edias sob embalagens com e sem desenhos. O intervalo de confian¸ca para C3 mostra que n˜ao parece haver diferen¸ca
entre as vendas m´edias sob as embalagens com 3 cores. Contudo, o intervalo de confian¸ca para C4 mostra que parece haver diferen¸ca entre as
vendas m´edias sob as embalagens com 5 cores (a venda m´edia ´e maior com a embalagem 4).
M´
ETODO DE BONFERRONI
M´etodo de Bonferroni: para um subconjunto de todas as diferen¸cas, de todos os contrastes ou combina¸c˜oes lineares entre as m´edias sob os tratamentos.
Seja g o n´umero de afirma¸c˜oes no subconjunto de combina¸c˜oes lineares (notar que contrastes s˜ao combina¸c˜oes lineares).
Os limites de confian¸ca para cada Lk com coeficiente de confian¸ca global
pelo menos igual a 1 − α s˜ao dados por ˆ Lk∓ B q ˆ var( ˆLk) , k = 1, . . . , g,
sendo B = t[1−α/(2g);n−r] e t[1−α/(2g);n−r] o quantil de ordem 1 − α/(2g)
Exemplo. Embalagens para cereal matinal. Vamos estimar apenas os seguintes dois contrastes entre as m´edias de vendas sob as 4 embalagens, utilizando o m´etodo de Bonferroni com um coeficiente de confian¸ca global igual a 0,975: L1 = µ1+ µ2 2 − µ3+ µ4 2 , L2 = µ1+ µ3 2 − µ2+ µ4 2 . Como 1 − α = 0, 975, temos t[1−0,025/(2×2);15] = t[0,99375;15]= 2, 84
(constante para os dois contrastes).
M´
ETODO DE BONFERRONI
Temos
Lk Lˆk var( ˆˆ Lk) Limites de confian¸ca
L1 -9,35 2,23125 [−9, 35 ∓ 2, 84 × √ 2, 23125] [−13, 59; −5, 11] L2 -3,25 2,23125 [−3, 25 ∓ 2, 84 × √ 2, 23125] [−7, 49; 0, 99]
Vale observar que os limites de confian¸ca L1 e L2, pelo m´etodo de Scheff´e
e um coeficiente de confian¸ca global igual a 0,975, se baseiam em S2 = 3 × F[0,975;3,15]= 3 × 4, 15 = 12, 45,
Observa¸c˜ao. Se o coeficiente de confian¸ca global ´e 1 − α e o n´umero de compara¸c˜oes ´e g, n˜ao ´e necess´ario que o coeficiente de confian¸ca
associado a cada compara¸c˜ao seja 1 − α/g. Podemos ter, 1 − α = 1 − (α1+ . . . + αg).
Compara¸c˜oes entre os m´etodos de Bonferroni, Scheff´e e Tukey.
Compara¸c˜oes de m´edias 2 a 2
Todas: Tukey
Algumas: Bonferroni, em geral;
COMPARA¸
C ˜
OES ENTRE OS TRˆ
ES M´
ETODOS
Contrastes
Bonferroni: n´umero de contrastes g ≤ r, sendo r o n´umero de
tratamentos
Scheff´e: n´umero de contrastes a serem estimados excede r por uma
boa quantidade;
Desde que as compara¸c˜oes m´ultiplas sejam estabelecidas a priori, os 3 m´etodos podem ser aplicados e escolhe-se o que fornecer os menores limites de confian¸ca. Para compara¸c˜oes m´ultiplas estabelecidas a posteriori, apenas o m´etodo de Bonferroni n˜ao se aplica.
Outros m´etodos: ver, por exemplo, Miller (1991), Simultaneous Statistical Inference. New York: Springer–Verlag.
Compara¸c˜oes com um controle: Comparar as r − 1 m´edias populacionais com a m´edia sob o tratamento controle. N´umero de compara¸c˜oes ´e r − 1. Dunnett (1964), Biometrics, 20, 482–491. Vamos supor que o tratamento controle seja o r-´esimo tratamento. Queremos testar H0 : µi− µr versus H1: µi 6= µr, i = 1, . . . , r − 1. O
procedimento de Dunnett ´e uma modifica¸c˜ao de teste t. Para cada hip´otese, calculamos
|¯yi.− ¯yr.| i = 1, . . . , r − 1.
Seja α, o n´ıvel de significˆancia global. Rejeitamos H0 se
|¯yi.− ¯yr.| > dα(r − 1, n − r) s QM R 1 ni + 1 nr ,
sendo que dα(r − 1, n − r) ´e tabelado para testes unicaudais e bicaudais.
COMPARA¸
C ˜
OES COM UM CONTROLE - EXEMPLO
Exemplo: Embalagens para carne. Doze bifes de 75g receberam aleatoriamente um de 4 tratamentos (tipos de embalagem). Ap´os 9 dias de armazenamento a 4oC, foi contado, na superf´ıcie de cada bife, o n´umero existente de bact´erias (em log(contagem/cm2) de certa esp´ecie. Os dados constam da tabela abaixo.
Embalagem 1 Embalagem 2 Embalagem 3 Embalagem 4 7,66 5,26 7,41 3,51 6,98 5,44 7,33 2,91 7,80 5,80 7,04 3,66 ¯ y1.= 7, 48 y¯2.= 5, 50 y¯3. = 7, 26 y¯4.= 3, 36 FV gl SQ QM F valor-P Embalagem 3 32,873 10,958 94,58 < 0, 001 Res´ıduo 8 0,927 0,116 Total 11 33,800
Exemplo: Embalagens para carne. Vamos comparar o valor m´edio do log(contagem) do n´umero de bact´erias sob os tratamentos 2, 3 e 4 com o sob tratamento 1 (saco pl´astico), utilizando o m´etodo de Dunnett com um coeficiente de confian¸ca global igual a 95%. Vale relembrar que os
tratamentos 2 a 4 s˜ao descritos como: 2. Embalagem `a v´acuo; 3.
Embalagem com 1% de CO (mon´oxido de carbono), 40% de O2 (oxigˆenio)
e 59% de N (nitrogˆenio) e 4. Embalagem com 100% de CO2 (di´oxido de
carbono). Sendo 0,95, o coeficiente de confian¸ca global, temos que d0,05(3, 8) = 2, 88
(valor obtido da Tabela IX de Montgomery, 2001).
COMPARA¸
C ˜
OES COM UM CONTROLE - EXEMPLO
Compara¸c˜ao Estimativa Variˆancia Limites de estimada confian¸ca µ1− µ2 1,98 0,0773 [1, 98 ∓ 2, 88 √ 0, 0773 ] [1, 18; 2, 78] µ1− µ3 0,22 0,0773 [0, 22 ∓ 2, 88 √ 0, 0773 ] [−0, 58; 1, 02] µ1− µ4 4,12 0,0773 [4, 1 ∓ 2, 88 √ 0, 0773 ] [3, 32; 4, 92]
Observamos que o valor m´edio do log(contagem) do n´umero de bact´erias sob a embalagem padr˜ao (saco pl´astico) pode ser considerado maior do que sob o tratamento 2 e 4, mas n˜ao sob o tratamento 3.
An´alise dos efeitos do fator quando o fator ´e quantitativo
Quando o fator ´e quantitativo, a an´alise dos efeitos dos tratamentos pode ir al´em das compara¸c˜oes m´ultiplas para incluir um estudo da natureza da fun¸c˜ao resposta.
Procedimento: Regress˜ao Y vs X, sendo que os valores de X s˜ao os n´ıveis do fator.
Como experimentos completamente casualizados com um fator sempre envolvem r´eplicas nos diferentes n´ıveis do fator, podemos testar a falta de ajuste do modelo de regress˜ao. Nesse caso, pode ser mostrado que a SQR do modelo de ANOVA ´e igual `a SQEP do modelo de regress˜ao.
FATOR QUANTITATIVO - EXEMPLO
Exemplo. Seja y o n´umero de unidades aceit´aveis produzidas a partir de uma mesma quantidade de mat´eria prima em uma f´abrica de objetos de vidro. Consideremos que 28 empregados da f´abrica (unidades
experimentais) receberam um treinamento especial. Foram considerados 4 per´ıodos de treinamento: 6, 8, 10 e 12 horas (fator per´ıodo com 4 n´ıveis). Sete empregados foram designados ao acaso para cada per´ıodo. Observar que quanto maior for o n´umero de unidades aceit´aveis mais eficiente ´e o empregado. Os dados constam da tabela que segue.
Horas de treinamento
6 horas 8 horas 10 horas 12 horas
40 53 53 63 39 48 58 62 39 49 56 59 36 50 59 61 42 51 53 62 43 50 59 62 41 48 58 61 ¯ y1.= 40, 00 y¯2.= 49, 85 y¯3.= 56, 57 y¯4.= 61, 43 ¯ y..= 51, 96 s1 = 2, 31 s2 = 1, 77 s3= 2, 64 s4 = 1, 27
FATOR QUANTITATIVO - EXEMPLO
Modelo de m´edias associado ao plano completamente aleatorizado com um fator fixo yij = µ + αi+ eij, i = 1, . . . , 4; j = 1, . . . , 7. Suposi¸c˜ao:
eij ∼ N(0, σ2), independentes. Queremos testar H0: µ1 = . . . = µ4.
ANOVA
FV gl SQ QM F valor-P Per´ıodos 3 1808,68 602,89 141,46 < 0, 001
Res´ıduo 24 102,29 4,29 Total 27 1910,97
Vamos comparar as m´edias duas a duas, utilizando o m´etodo de Tukey com um coeficiente de confian¸ca global igual a 95%. Temos
Dk = µi− µi0 e Dˆk= ¯yi.− ¯yi0 k = 1, . . . , 6.
Temos tamb´em, ˆ var( ˆDk) = QM R 1 ni + 1 ni0 = 4, 29 × 2 7 = 1, 23. Al´em disso, q ˆ var( ˆDk) = 1, 11
(comum a todas as compara¸c˜oes pois o experimento ´e balanceado). Como α = 0, 95, temos T = √1 2q(1 − α; r; n − r) = 1 √ 2q(0, 95; 4; 24) = 1 √ 2 × 3, 90 = 2, 76.
µi− µi0 Limites de confian¸ca µ1− µ2 [(40, 00 − 49, 85) ∓ 2, 76 × 1, 11] [−12, 91; −6, 79] µ1− µ3 [(40, 00 − 56, 57) ∓ 2, 76 × 1, 11] [−19, 63; −13, 51] µ1− µ4 [(40, 00 − 61, 43) ∓ 2, 76 × 1, 11] [−24, 49; −18, 37] µ2− µ3 [(49, 85 − 56, 57) ∓ 2, 76 × 1, 11] [−9, 78; −3, 66] µ2− µ4 [(49, 85 − 61, 43) ∓ 2, 76 × 1, 11] [−14, 64; −8, 52] µ3− µ4 [(56, 57 − 61, 43) ∓ 2, 76 × 1, 11] [−7, 92; −1, 80]
Estima¸c˜ao da fun¸c˜ao resposta. Pelo diagrama de dispers˜ao, observamos que as diferen¸cas entre as m´edias diminuem `a medida que o n´umero de horas de treinamento aumenta.
12 11 10 9 8 7 6 65 60 55 50 45 40 35
No. de horas de treinamento
No de unidades aceitáveis
Gr´afico 1. Dispers˜ao do N´umero de unidades aceit´aveis vs N´umero de horas de treinamento
FATOR QUANTITATIVO - EXEMPLO
Indica¸c˜ao. As m´edias µi s˜ao uma fun¸c˜ao quadr´atica do n´umero de horas
de treinamento.
Modelo a ser ajustado e testado. yij = β0+ β1xi+ β2x2i + eij, sendo β
o vetor de parˆametros da regress˜ao de dimens˜ao p = 3 e xi = Xi− ¯X, isto
´
e, xi = Xi− 9, com Xi igual ao n´umero de horas de treinamento. Temos:
Y = 40 39 39 .. . 61 X = 1 -3 9 1 -3 9 1 -3 9 .. . ... ... 1 3 9 .
Modelo ajustado. ˆ yij = 53, 52679 + 3, 55xi− 0, 3125x2i, ou seja, ˆ yij = 53, 53 + 3, 55(Xi− 9) − 0, 3125(Xi− 9)2.
ANOVA para o modelo de regress˜ao
FV gl SQ QM
Regress˜ao 2 (p − 1) 1808,100 904,05 Res´ıduo 25 (n − p) 102,864 4,11
Total 27 (n − 1) 1910,964
Como os dados cont´em r´eplicas, podemos testar a falta de ajuste.
FATOR QUANTITATIVO - EXEMPLO
ANOVA para o teste de falta de ajuste
FV gl SQ QM Regress˜ao 2 (p − 1) 1808,100 904,05 Res´ıduo 25 (n − p) 102,864 4,11 Falta de ajuste 1 (r − p) 0,587 0,58 Erro puro 24 (n − r) 102,286 4,26 Observar que SQResreg = r X i=1 ni X j=1 (yij− ˆyi)2, SQF A = r X i=1 ni(¯yi.− ˆyi)2, SQEP = r X i=1 ni X j=1 (yij − ¯yi.)2,
SQEP = SQResAN OV A,
ou seja, ambas medem a varia¸c˜ao em torno da m´edia a um dado n´ıvel de X, isto ´e, em torno de ¯yi., e
SQF A = SQResreg− SQEP = 102, 864 − 102, 286 = 0, 587.
Al´em disso, temos c = r = 4 n´ıveis de X e p = 3 parˆametros de regress˜ao. Logo, o n´umero de gl associado `a SQFA ´e 4-3 = 1.
Queremos testar
H0: E(Y ) = β0+ β1xi+ β2x2i ou µi = β0+ β1xi+ β2x2i
versus
H1 : E(Y ) 6= β0+ β1xi+ β2x2i ou µi6= β0+ β1xi+ β2x2i.
FATOR QUANTITATIVO - EXEMPLO
Estat´ıstica F. F∗ = QM F A QM EP = 0, 58 4, 26 = 0, 136. Sob H0, F∗ ∼ F[1,24].Adotando α = 0, 05, temos F[0,95;1,24]= 4, 26. Assim, n˜ao h´a evidˆencias
para rejeitarmos H0, ou seja, considerando os valores originais Xi temos
ˆ
Vamos apresentar uma t´ecnica para agrupar tratamentos que combina teste de hip´oteses com an´alise de conglomerados. Essa t´ecnica foi proposta por Calinski e Corsten (1985) e se baseia na distribui¸c˜ao studentized range (ver Tabela B.9 de Kutner et al., 2004).
O algoritmo come¸ca com r conglomerados, representados pelas r m´edias amostrais ¯yi., i = 1, . . . , r, arranjadas em ordem crescente.
Exemplo. T´ecnicas de limpeza (ver arquivo Limpeza.docx).
S C T P
¯
yi. 21,85 22,30 24,42 26,78
AGRUPAMENTO DE TRATAMENTOS
Passo 1. Obter a menor diferen¸ca em valor absoluto |¯yi.− ¯yi0.|. Denot´a-la
por R1 e compar´a-la ao valor cr´ıtico
Cα= q[1−α,r,n−r]
r QM R
k ,
sendo k o n´umero de observa¸c˜oes sob cada tratamento (estudo balanceado).
Se R1< Cα, agrupamos as m´edias ¯yi. e ¯yi0. e passamos para o passo
No exemplo, adotando α = 0, 10, temos C0,10= q[0,90,4,84]
r 27, 7
22 = 3, 295 × 1, 122 = 3, 697. Temos tamb´em,
|¯yC − ¯yS| = 0, 45
|¯yP − ¯yC| = 2, 12
|¯yT − ¯yP| = 2, 36
Assim, R1 = 0, 45 < C0,10= 3, 697 e agrupamos a m´edias sob os
tratamentos C e S.
AGRUPAMENTO DE TRATAMENTOS
PASSO s. A cada passo seguinte, um novo conglomerado ´e formado combinando dois conglomerados adjacentes com a menor distˆancia entre eles.
A distˆancia Rs no Passo s, 1 ≤ s ≤ t − 1, ´e ent˜ao comparada a Cα.
Se Rs > Cα, o processo p´ara e o conglomerado obtido no Passo s − 1 ser´a
o agrupamento final dos tratamentos.
Os grupos assim formados s˜ao considerados internamente homogˆeneos de acordo com o teste studentized range de n´ıvel α.
Passo 2:
Distˆancia entre P e {S, C} = |24, 42 − 21, 85| = 2, 57 Distˆancia entre P e T = |26, 78 − 24, 42| = 2, 36
Logo R2 = 2, 36, R2 < C0,10 e agrupamos as m´edias sob os tratamentos P
e T.
Passo 3. R3 = |26, 78 − 21, 85| = 4, 93 (distˆancia entre {P, T } e {S, C})
> Cα.
Formamos, ent˜ao, dois grupos G1: S, C e G2: P, T.