Experimentos Hier´ arquicos com Dois Fatores Fixos
19/05/2014
Exemplo. Escola e Professor
Tabela 1. Nota de aprendizado.
Fator B (Professor) Fator A (Escola) 1 (j = 1) 2 (j = 2) i = 1 S˜ao Paulo 25 14
29 11
i = 2 Curitiba 11 22
6 18
i = 3 Salvador 17 5
20 2
Tabela 2. M´edias amostrais das notas de aprendizado.
Professor (B)
Escola (A) 1 2 M´edia linha
S˜ao Paulo y¯11 = 27 y¯12 = 12, y¯1.. = 19, 75 Curitiba y¯21 = 8,5 y¯22 = 20 y¯2.. = 14, 25 Salvador y¯31 = 18,5 y¯32 = 3,5 y¯3.. = 11, 00
Fator A: escola (fixo) - a = 3 n´ıveis.
Fator B: professor (fixo) - b =? n´ıveis.
Caso 1. A e B cruzados, b = 6, m = 2 classes selecionadas ao acaso para cada tratamento. Cada n´ıvel j do fator B ocorre em todos os n´ıveis i do fator A. No exemplo, j = 1, . . . ,6.
Tabela 3. Fatores cruzados.
Professor (B) Escola (A) 1 2 3 4 5 6
S˜ao Paulo X X X X X X Curitiba X X X X X X Salvador X X X X X X
Caso 2. B ´e hier´arquico em A, b = 2, m = 2 classes selecio- nadas ao acaso para cada tratamento. Cada n´ıvel j do fator B ocorre em apenas um n´ıvel i de A. No exemplo, j = 1, 2 (cada professor ensina em apenas uma escola; para cada escola i exis- tem b = 2 professores).
Tabela 4. Fatores hier´arquicos.
Professor (B) Escola (A) 1 2 3 4 5 6
S˜ao Paulo X X
Curitiba X X
Salvador X X
Tabela 5. Representa¸c˜ao gr´afica - Fatores hier´arquicos.
Professor (B)
Escola (i) 1 2
(i : 1) (i : 2)
Professor (j) 1 2 3 4
(j : 1) (j : 2) (j : 1) (j : 2)
Classe (k) 1 2 3 4 5 6 7 8
(k : 1) (k : 2) (k : 1) (k : 2) (k : 1) (k : 2) (k : 1) (k : 2)
Tabela 5. Representa¸c˜ao gr´afica - Fatores hier´arquicos - Continua¸c˜ao.
Professor (B)
Escola (i) 3
(i : 3)
Professor (j) 5 6
(j : 1) (j : 2)
Classe (k) 9 10 11 12
(k : 1) (k : 2) (k : 1) (k : 2)
Experimento balanceado: o mesmo n´umero de n´ıveis de B ´e hier´arquico a cada n´ıvel de A assim como o n´umero de r´eplicas
´e a mesma para cada tratamento.
Modelo para dois fatores hier´arquicos fixos - B ´e hier´arquico em A
yijk: valor da vari´avel resposta para a k-´esima unidade expe- rimental submetida ao j-´esimo n´ıvel do fator B hier´arquico ao i-´esimo n´ıvel do fator A.
Vamos assumir que h´a m unidades experimentais para cada tra- tamento, isto ´e, k = 1, . . . , m.
Se A e B s˜ao fixos, um modelo apropriado ´e definido por:
yijk = µ + αi + βj(i) + eijk,
• µ ´e uma constante (m´edia geral; parˆametro);
• αi s˜ao constantes sujeitas `a restri¸c˜ao
Pa
i=1 αi = 0, ou seja, αa = −α1 − α2 − . . . − αa−1.;
• βj(i) s˜ao constantes sujeitas `a restri¸c˜ao
Pb
j=1 βj(i) = 0, ou seja, βb(i) = −β1(i) − β2(i) − . . . − βb−1(i), para todo i;
• eijk ∼ N(0, σ2), indep.; i = 1, . . . , a; j = 1, . . . , b e k = 1, . . . , m.
Observar que
• µij: valor m´edio populacional da v. resposta para o trata- mento definido pelo i-´esimo n´ıvel do fator A e j-´esimo n´ıvel do fator B hier´arquico ao i-´esimo n´ıvel do fator A;
µi.: valor m´edio populacional da v. resposta para o i-´esimo n´ıvel do fator A;
• αi: efeito principal do i-´esimo n´ıvel do fator A; αi = µi. − µ;
• βj(i): efeito do j-´esimo n´ıvel do fator B hier´arquico ao i-´esimo n´ıvel do fator A; βj(i) = µij − µi.;
• µij = µ + αi + βj(i) = µ + (µi. − µ) + (µij − µi.).
Consequˆencias do modelo
• E(yijk) = µ + αi + βj(i);
• var(yijk) = σ2 (variˆancia constante);
• yijk ∼ N(µ + αi + βj(i), σ2), independentes.
Coment´ario. N˜ao h´a necessidade do n´umero de unidades ex- perimentais por tratamento ser constante, nem do n´umero de n´ıveis do fator B ser o mesmo para cada n´ıvel do fator A (ver Se¸c˜ao 28.6 de Neter et al., 1996 ou Se¸c˜ao 26.2 de Kutner et al., 2004).
Ajuste do modelo. Os estimadores dos parˆametros do modelo obtidos por m´axima verossimilhan¸ca s˜ao iguais aos obtidos pelo m´etodo dos m´ınimos quadrados.
Parˆametro Estimador µ µˆ = ¯y...
αi αˆi = ¯yi.. − y¯...
βj(i) βˆj(i) = ¯yij. − y¯i..
Assim, ˆyijk = ¯yij. e ˆeijk = yijk − y¯ij.
Hip´oteses de interesse H1 : α1 = . . . = αa = 0
(n˜ao existe efeito do fator A); A1: pelo menos um dos αi n˜ao ´e nulo.
A hip´otese H1 ´e equivalente a H1 : µ1. = . . . = µa.
H2 : β1(i) = . . . = βb(i) = 0, para todo i
(n˜ao existe efeito do fator B dentro do i-´esimo n´ıvel do fator A, para todo i); A2: pelo menos um dos βj(i) n˜ao ´e nulo.
A hip´otese H2 ´e equivalente a
H2: µ11 = . . . = µ1b; µ21 = . . . = µ2b; µa1 = . . . = µab.
Somas de quadrados e graus de liberdade yijk − y¯... = (¯yi.. − ¯y...) + (¯yij. − y¯i..) + (yijk − y¯ij.)
SQT =
a X
i=1 b X
j=1 m X
k=1
(yijk − ¯y...)2
SQA =
a X
i=1 b X
j=1 m X
k=1
(¯yi.. − y¯...)2
= bm
a X
i=1
(¯yi.. − y¯...)2
SQB(A) =
a X
i=1 b X
j=1 m X
k=1
(¯yij. − y¯i..)2
= m
a X
i=1 b X
j=1
(¯yij. − y¯i..)2
SQR =
a X
i=1 b X
j=1 m X
k=1
(yijk − y¯ij.)2
Podemos mostrar que
SQT = SQA + SQB(A) +SQR, onde,
SQT: mede a variabilidade das observa¸c˜oes em rela¸c˜ao `a m´edia geral, sem considerar os tratamentos;
SQA: mede a variabilidade das m´edias amostrais sob cada n´ıvel do fator A em rela¸c˜ao `a m´edia geral;
SQB(A): mede a variabilidade entre as m´edias amostrais sob os n´ıveis do fator B dentro de cada n´ıvel do fator A, para todo n´ıvel de A;
Temos ainda que
SQB(A) =
a X
i=1
SQB(Ai), onde
SQB(Ai) = m
b X
j=1
(¯yij. − y¯i..)2.
SQB(Ai): mede a variabilidade entre as m´edias amostrais sob os n´ıveis do fator B dentro do i-´esimo n´ıvel do fator A, i = 1, . . . , a.
Tabela . N´umero de graus de liberdade associado a cada SQ.
SQ gl
SQA a-1
SQB(A) a(b-1) SQB(A1) b-1
... ...
SQB(Aa) b-1
SQR ab(m-1)
SQT abm-1
Valores esperados dos quadrados m´edios
QM E(QM)
QMA=SQA/(a-1) σ2 + mb
P
iα2i a−1
QMB(A)=SQB(A)/(a(b-1)) σ2 + m
P
i
P
j β2
j(i)
a(b−1)
QMB(Ai) = SQB(Ai)/(b − 1) σ2 + m
P
j β2
j(i)
(b−1)
QMR σ2
Estat´ısticas e regras de decis˜ao para os testes de H1 e de H2
Para testar H1 : α1 = . . . = αa = 0 contra A1 : os αi n˜ao s˜ao todos nulos temos
F1∗ = QM A QM R.
Para testar H2 : β1(i) = . . . = βb(i) = 0, para todo i contra A2: pelo menos um dos βj(i) n˜ao ´e nulo, temos
F2∗ = QM B(A) QM R .
As distribui¸c˜oes de F1∗ e de F2∗ sob H1 e H2, respectivamente, s˜ao
Rejeitamos H1 ao n´ıvel de significˆancia α se F1∗ > F[1−α;a−1, ab(m−1)]. Rejeitamos H2 ao n´ıvel de significˆancia α se
F2∗ > F[1−α;a(b−1), ab(m−1)].
Se H2 ´e rejeitada, podemos verificar dentro de quais n´ıveis do fator A ocorre diferen¸ca entre os n´ıveis do fator B. Para isto, testamos isoladamente a hip´oteses:
H21 : β1(1) = . . . = βb(1) = 0 ... ...
H2a : β1(a) = . . . = βb(a) = 0
A estat´ıstica de teste de H2i ´e dada por F2i∗ = QM B(Ai)
QM R .
Sob H2i, F2i∗ ∼ F[b−1, ab(m−1)].
H2i ´e rejeitada se, para um n´ıvel de significˆancia α, F2i∗ > F[1−α;b−1, ab(m−1)],
i = 1, . . . , a.
Exemplo. Escola e Professor
Tabela de ANOVA
FV SQ gl QM F∗ P
Escola 156,5 2 78,25 78,25/7,00 = 11,2 0,009 Professor(Escola) 567,5 3 189,17 189,17/7,00 = 27,0 0,001
Res´ıduo 42,0 6 7,00
Total 766,0 11
Decomposi¸c˜ao da SQB(A)
FV SQ gl QM F∗ P
Professor(S˜ao Paulo) 210,25 1 210,25 210,25/7,00 = 30,0 0,002 Professor(Curitiba) 132,25 1 132,25 132,25/7,00 = 18,9 0,005 Professor(Salvador) 225,00 1 225,00 225,00/7,00 = 32,1 0,001
An´alise dos efeitos dos fatores 1. Estima¸c˜ao de µi.
Estimador n˜ao viesado de µi., i = 1, . . . , a,:
µˆi. = ¯yi... Variˆancia de ¯yi..:
var(¯yi..) = σ2 bm.
Estimador n˜ao viesado dessa variˆancia ´e obtido substituindo σ2 por QM R:
var(¯ˆ yi..) = QM R bm .
Um intervalo de confian¸ca para µi. com coeficiente de confian¸ca γ = 1 − α ´e constru´ıdo com base na distribui¸c˜ao t-Student:
y¯i.. ∓ t[1−α
2;ab(m−1)]
q
var(¯ˆ yi..)
Um contraste entre as m´edias µi., i = 1, . . . , a, ´e definido como L =
a X
i=1
ciµi., com
a X
i=1
ci = 0.
Um estimador n˜ao viesado de L ´e dado por Lˆ =
a X
i=1
ciy¯i...
Al´em disso,
var(ˆL) = var(
a X
i=1
ci¯yi..) = σ2 bm
a X
i=1
c2i e var(ˆˆ L) = QM R bm
a X
i=1
c2i .
Uma combina¸c˜ao linear entre as m´edias µi., i = 1, . . . , a, ´e definida como L = Pai=1 ciµi.. Um estimador n˜ao viesado de L ´e dado por Lˆ = Pai=1ci¯yi... Al´em disso, var(ˆˆ L) = QM R/(bm) Pai=1c2i .
Um intervalo de confian¸ca para L (contraste ou combina¸c˜ao li- near entre as m´edias µi.) com coeficiente de confian¸ca γ = 1−α
´e dado por
Lˆ ∓ t[1−α
2;ab(m−1)]
q
var(ˆˆ L)
.
Compara¸c˜oes m´ultiplas pelos m´etodos de Tukey, Bonferroni ou Scheff´e podem ser realizadas da forma usual utilizando um coe- ficiente de confian¸ca global igual a 1 − α.
Exemplo. Escola e Professor. Comparar as m´edias das notas sob as trˆes escolas, duas a duas, usando o m´etodo de Tukey com um coeficiente de confian¸ca global igual a 95%.
D1 = µ2−µ1, Dˆ1 = 14,25−19,75 = −5,5. Sob cada escola temos bm = 4 observa¸c˜oes (m = 2 para cada professor). QMR = 7,0 e
var( ˆˆ D) = 2QM R
bm = 2 × 7,0
4 = 3,5.
Como 1 − α = 0,05, temos T = √1
2q(1 − α; a;ab(m − 1)) =
√1
2q(0,95; 3; 6) = √1
24,34 = 3,07, constante para todas as compara¸c˜oes.
O intervalo de confian¸ca para D1 = µ2 − µ1 com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por
h−5,5 ∓ 3,07p3,5i, ou seja, [−11,24; 0,241].
Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que n˜ao parece existir diferen¸ca entre µ1 e µ2. Assim, con- clu´ımos que as m´edias das notas sob as escolas 1 e 2 n˜ao s˜ao diferentes.
D2 = µ3 − µ1, Dˆ2 = 11,0 − 19,75 = −8,75. O intervalo de confian¸ca para D2 = µ3 −µ1 com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por
h−8,75 ∓ 3,07p3,5i, ou seja, [−14,49;−3,009].
Como o valor 0 n˜ao pertence ao intervalo de confian¸ca obtido, podemos dizer que parece existir diferen¸ca entre µ1 e µ3. Assim, conclu´ımos que h´a evidˆencias de que as m´edias das notas sob as escolas 1 e 3 s˜ao diferentes.
D3 = µ3 − µ2, Dˆ3 = 11,0 − 14,25 = −3,25. O intervalo de confian¸ca para D3 = µ3 −µ2 com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por
h−3,25 ∓ 3,07p3, 5i , ou seja, [−8,991; 2,491].
Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que n˜ao parece existir diferen¸ca entre µ2 e µ3. Assim, con- clu´ımos que n˜ao h´a evidˆencias de que as m´edias das notas sob as escolas 2 e 3 sejam diferentes.
2. Estima¸c˜ao de µij
Um intervalo de confian¸ca para µij com coeficiente de confian¸ca 1 − α ´e dado por
[¯yij. ∓ t[1−α/2;ab(m−1)]
q
var(¯ˆ yij.)], sendo var(¯ˆ yij.) = QM R/m.
Para comparar as m´edias sob os n´ıveis do fator B, dentro de um n´ıvel do fator A, podemos estimar o contraste L = Pbj=1 cjµij, sendo Pbj=1 cj = 0. O estimador de L tem a forma ˆL = Pbj=1 cjy¯ij.
e o intervalo de confian¸ca para L, com coeficiente de confian¸ca 1 − α, ´e dado por
[ˆL ∓ t[1−α/2;ab(m−1)]
q
var(ˆˆ L)], sendo var(ˆˆ L) = QM R Pb c2.
Para comparar as m´edias sob os n´ıveis do fator B, dentro de cada n´ıvel do fator A, o m´etodo mais indicado ´e o de Bonferroni, j´a que os m´etodos de Tukey e Scheff´e s˜ao indicados para compara¸c˜oes entre as ab m´edias.
Exemplo. Escola e Professor. Comparar as m´edias das notas sob os dois professores em cada escola, usando o m´etodo de Bon- ferroni com um coeficiente de confian¸ca global igual a 90%. Para as g = 3 compara¸c˜oes, temos B = t[1−0,10/(2×3);6)] = t[0,983;6] = 2,748. A estimativa da variˆancia para cada compara¸c˜ao ´e
var(ˆˆ L) = 7, 00
2 × 2 = 7,0.
Assim, B × qvar(ˆˆ L) = 2,748 × √
7,0 = 7, 27.
Logo,
Lk Lˆk Limites de confian¸ca
L1 = µ11 − µ12 Lˆ1 = ¯y11. − y¯12. = 27 − 12,5 [14,5 ∓ 7,27]
[7,2; 21,8]
L2 = µ21 − µ22 Lˆ2 = ¯y21. − y¯22. = 8,5 − 20,0 [−11,5 ∓ 7,27]
[−18,8;−4,2]
L3 = µ31 − µ32 Lˆ3 = ¯y31. − y¯32. = 18,5 − 3,5 [15,0 ∓ 7,27]
[7,7; 22,3]
O valor 0 n˜ao pertence a nenhum dos intervalos de confian¸ca.
Podemos concluir que existem evidˆencias de que as m´edias das
Para expressar o modelo de an´alise de variˆancia como um modelo de regress˜ao, vamos considerar para os αi´s (a−1) vari´aveis indi- cadoras, que podem assumir os valores 1, -1 e 0. Para os βj(i)´s vamos considerar, para cada i, (b − 1) vari´aveis indicadoras, que podem assumir os valores 1, -1 e 0.
Exemplo. Escola e Professor Modelo de an´alise de variˆancia
yijk = µ + αi + βj(i) + eijk, i = 1,2,3, j = 1,2, k = 1,2.
Suposi¸c˜ao: eijk ∼ N(0, σ2).
Restri¸c˜oes:
1. α3 = −α1 − −α2;
2. β2(i) = −β1(i), para cada i.
Modelo de regress˜ao equivalente
a − 1 = 3 − 1 = 2 vari´aveis indicadoras para os efeitos do fator A;
b − 1 = 2 − 1 = 1 vari´avel indicadora para os efeitos do fator B, sob cada n´ıvel do fator A.
yijk = µ+α1Xijk1+α2Xijk2+β1(1)Xijk3+β1(2)Xijk4+β1(3)Xijk5+eijk, com
X1 =
1, se a observa¸c˜ao est´a no n´ıvel 1 (S˜ao Paulo) do fator A;
−1, se a observa¸c˜ao est´a no n´ıvel 3 (Salvador) do fator A;
0, caso contr´ario.
X2 =
1, se a observa¸c˜ao est´a no n´ıvel 2 (Curitiba) do fator A;
−1, se a observa¸c˜ao est´a no n´ıvel 3 (Salvador) do fator A;
0, caso contr´ario.
X3 =
1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 1 (SP) do fator A;
−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 1 (SP) do fator A
X4 =
1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 2 (Curitiba) do fator A;
−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 2 (Curitiba) do fator A
X5 =
1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 3 (Salvador) do fator A;
−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 1 (Salvador) do fator A
Temos:
i j k y Xijk0 Xijk1 Xijk2 Xijk3 Xijk4 Xijk5
1 1 1 25 1 1 0 1 0 0
1 1 2 29 1 1 0 1 0 0
1 2 1 14 1 1 0 -1 0 0
1 2 2 11 1 1 0 -1 0 0
2 1 1 11 1 0 1 0 1 0
2 1 2 6 1 0 1 0 1 0
2 2 1 22 1 0 1 0 -1 0
2 2 2 18 1 0 1 0 -1 0
3 1 1 17 1 -1 -1 0 0 1
3 1 2 20 1 -1 -1 0 0 1
3 2 1 5 1 -1 -1 0 0 -1
3 2 2 2 1 -1 -1 0 0 -1
O vetor de parˆametros ´e β> = {µ, α1, α2, β1(1), β1(2), β1(3)}.
Coment´arios:
• Os testes de hip´oteses s˜ao realizados utilizando-se testes F parciais, obtidos por meio do ajuste de um modelo de re- gress˜ao completo e de modelos de regress˜ao reduzidos apro- priados.
• Os testes desenvolvidos por meio de modelos de regress˜ao s˜ao an´alogos aos obtidos, por exemplo, por meio da fun¸c˜ao GLM do MINITAB ou de c´odigos do R.