Experimentos Hier´arquicos com Dois Fatores Fixos

(1)

Experimentos Hier´ arquicos com Dois Fatores Fixos

19/05/2014

(2)

Exemplo. Escola e Professor

Tabela 1. Nota de aprendizado.

Fator B (Professor) Fator A (Escola) 1 (j = 1) 2 (j = 2) i = 1 S˜ao Paulo 25 14

29 11

i = 2 Curitiba 11 22

6 18

i = 3 Salvador 17 5

20 2

(3)

Tabela 2. M´edias amostrais das notas de aprendizado.

Professor (B)

Escola (A) 1 2 M´edia linha

S˜ao Paulo y¯₁₁ = 27 y¯₁₂ = 12, y¯_1.. = 19, 75 Curitiba y¯₂₁ = 8,5 y¯₂₂ = 20 y¯_2.. = 14, 25 Salvador y¯₃₁ = 18,5 y¯₃₂ = 3,5 y¯_3.. = 11, 00

(4)

Fator A: escola (fixo) - a = 3 n´ıveis.

Fator B: professor (fixo) - b =? n´ıveis.

Caso 1. A e B cruzados, b = 6, m = 2 classes selecionadas ao acaso para cada tratamento. Cada n´ıvel j do fator B ocorre em todos os n´ıveis i do fator A. No exemplo, j = 1, . . . ,6.

Tabela 3. Fatores cruzados.

Professor (B) Escola (A) 1 2 3 4 5 6

S˜ao Paulo X X X X X X Curitiba X X X X X X Salvador X X X X X X

(5)

Caso 2. B ´e hier´arquico em A, b = 2, m = 2 classes selecionadas ao acaso para cada tratamento. Cada n´ıvel j do fator B ocorre em apenas um n´ıvel i de A. No exemplo, j = 1, 2 (cada professor ensina em apenas uma escola; para cada escola i existem b = 2 professores).

Tabela 4. Fatores hier´arquicos.

Professor (B) Escola (A) 1 2 3 4 5 6

S˜ao Paulo X X

Curitiba X X

Salvador X X

(6)

Tabela 5. Representa¸cão gráfica - Fatores hierárquicos.

Professor (B)

Escola (i) 1 2

(i : 1) (i : 2)

Professor (j) 1 2 3 4

(j : 1) (j : 2) (j : 1) (j : 2)

Classe (k) 1 2 3 4 5 6 7 8

(k : 1) (k : 2) (k : 1) (k : 2) (k : 1) (k : 2) (k : 1) (k : 2)

Tabela 5. Representa¸cão gráfica - Fatores hierárquicos - Continua¸cão.

Professor (B)

Escola (i) 3

(i : 3)

Professor (j) 5 6

(j : 1) (j : 2)

Classe (k) 9 10 11 12

(k : 1) (k : 2) (k : 1) (k : 2)

(7)

Experimento balanceado: o mesmo número de n´ıveis de B é hierárquico a cada n´ıvel de A assim como o número de réplicas

´e a mesma para cada tratamento.

Modelo para dois fatores hierárquicos fixos - B é hierárquico em A

y_ijk: valor da variável resposta para a k-ésima unidade expe- rimental submetida ao j-ésimo n´ıvel do fator B hierárquico ao i-ésimo n´ıvel do fator A.

Vamos assumir que h´a m unidades experimentais para cada tratamento, isto ´e, k = 1, . . . , m.

(8)

Se A e B s˜ao fixos, um modelo apropriado ´e definido por:

y_ijk = µ + α_i + β_j(i) + e_ijk,

• µ é uma constante (média geral; parâmetro);

• α_i são constantes sujeitas à restri¸cão

P_a

i=1 α_i = 0, ou seja, α_a = −α₁ − α₂ − . . . − α_a−1.;

• β_j(i) são constantes sujeitas à restri¸cão

P_b

j=1 β_j(i) = 0, ou seja, β_b(i) = −β_1(i) − β_2(i) − . . . − β_b−1(i), para todo i;

• e_ijk ∼ N(0, σ²), indep.; i = 1, . . . , a; j = 1, . . . , b e k = 1, . . . , m.

(9)

Observar que

• µ_ij: valor médio populacional da v. resposta para o tratamento definido pelo i-ésimo n´ıvel do fator A e j-ésimo n´ıvel do fator B hierárquico ao i-ésimo n´ıvel do fator A;

µ_i.: valor m´edio populacional da v. resposta para o i-´esimo n´ıvel do fator A;

• α_i: efeito principal do i-´esimo n´ıvel do fator A; α_i = µ_i. − µ;

• β_j(i): efeito do j-ésimo n´ıvel do fator B hierárquico ao i-ésimo n´ıvel do fator A; β_j(i) = µ_ij − µ_i.;

• µ_ij = µ + α_i + β_j(i) = µ + (µ_i. − µ) + (µ_ij − µ_i.).

(10)

Consequˆencias do modelo

• E(y_ijk) = µ + α_i + β_j(i);

• var(y_ijk) = σ² (variˆancia constante);

• y_ijk ∼ N(µ + α_i + β_j(i), σ²), independentes.

Comentário. Não há necessidade do número de unidades experimentais por tratamento ser constante, nem do número de n´ıveis do fator B ser o mesmo para cada n´ıvel do fator A (ver Se¸cão 28.6 de Neter et al., 1996 ou Se¸cão 26.2 de Kutner et al., 2004).

(11)

Ajuste do modelo. Os estimadores dos parâmetros do modelo obtidos por máxima verossimilhan¸ca são iguais aos obtidos pelo método dos m´ınimos quadrados.

Parˆametro Estimador µ µˆ = ¯y_...

α_i αˆ_i = ¯y_i.. − y¯_...

β_j(i) βˆ_j_(i) = ¯y_ij. − y¯_i..

Assim, ˆy_ijk = ¯y_ij. e ˆe_ijk = y_ijk − y¯_ij.

(12)

Hip´oteses de interesse H₁ : α₁ = . . . = α_a = 0

(não existe efeito do fator A); A₁: pelo menos um dos α_i não é nulo.

A hip´otese H₁ ´e equivalente a H₁ : µ₁. = . . . = µ_a.

H₂ : β_1(i) = . . . = β_b(i) = 0, para todo i

(não existe efeito do fator B dentro do i-ésimo n´ıvel do fator A, para todo i); A₂: pelo menos um dos β_j(i) não é nulo.

A hip´otese H₂ ´e equivalente a

H₂: µ₁₁ = . . . = µ_1b; µ₂₁ = . . . = µ_2b; µ_a1 = . . . = µ_ab.

(13)

Somas de quadrados e graus de liberdade y_ijk − y¯_... = (¯y_i.. − ¯y_...) + (¯y_ij. − y¯_i..) + (y_ijk − y¯_ij.)

SQT =

a X

i=1 b X

j=1 m X

k=1

(y_ijk − ¯y_...)²

SQA =

a X

i=1 b X

j=1 m X

k=1

(¯y_i.. − y¯_...)²

= bm

a X

i=1

(¯y_i.. − y¯_...)²

(14)

SQB(A) =

a X

i=1 b X

j=1 m X

k=1

(¯y_ij. − y¯_i..)²

= m

a X

i=1 b X

j=1

(¯y_ij. − y¯_i..)²

SQR =

a X

i=1 b X

j=1 m X

k=1

(y_ijk − y¯_ij.)²

(15)

Podemos mostrar que

SQT = SQA + SQB(A) +SQR, onde,

SQT: mede a variabilidade das observa¸cões em rela¸cão à média geral, sem considerar os tratamentos;

SQA: mede a variabilidade das médias amostrais sob cada n´ıvel do fator A em rela¸cão à média geral;

SQB(A): mede a variabilidade entre as m´edias amostrais sob os n´ıveis do fator B dentro de cada n´ıvel do fator A, para todo n´ıvel de A;

(16)

Temos ainda que

SQB(A) =

a X

i=1

SQB(A_i), onde

SQB(A_i) = m

b X

j=1

(¯y_ij. − y¯_i..)².

SQB(A_i): mede a variabilidade entre as m´edias amostrais sob os n´ıveis do fator B dentro do i-´esimo n´ıvel do fator A, i = 1, . . . , a.

(17)

Tabela . N´umero de graus de liberdade associado a cada SQ.

SQ gl

SQA a-1

SQB(A) a(b-1) SQB(A₁) b-1

... ...

SQB(A_a) b-1

SQR ab(m-1)

SQT abm-1

(18)

Valores esperados dos quadrados m´edios

QM E(QM)

QMA=SQA/(a-1) σ² + mb

P

iα²_i a−1

QMB(A)=SQB(A)/(a(b-1)) σ² + m

P

i

P

j β²

j(i)

a(b−1)

QMB(A_i) = SQB(A_i)/(b − 1) σ² + m

P

j β²

j(i)

(b−1)

QMR σ²

(19)

Estat´ısticas e regras de decis˜ao para os testes de H₁ e de H₂

Para testar H₁ : α₁ = . . . = α_a = 0 contra A₁ : os α_i n˜ao s˜ao todos nulos temos

F₁^∗ = QM A QM R.

Para testar H₂ : β_1(i) = . . . = β_b(i) = 0, para todo i contra A₂: pelo menos um dos β_j_(i) n˜ao ´e nulo, temos

F₂^∗ = QM B(A) QM R .

As distribui¸c˜oes de F₁^∗ e de F₂^∗ sob H₁ e H₂, respectivamente, s˜ao

(20)

Rejeitamos H₁ ao n´ıvel de significˆancia α se F₁^∗ > F[1−α;a−1, ab(m−1)]. Rejeitamos H₂ ao n´ıvel de significˆancia α se

F₂^∗ > F[1−α;a(b−1), ab(m−1)].

Se H₂ ´e rejeitada, podemos verificar dentro de quais n´ıveis do fator A ocorre diferen¸ca entre os n´ıveis do fator B. Para isto, testamos isoladamente a hip´oteses:

H₂₁ : β₁₍₁₎ = . . . = β_b(1) = 0 ... ...

H_2a : β_1(a) = . . . = β_b(a) = 0

(21)

A estat´ıstica de teste de H_2i ´e dada por F_2i^∗ = QM B(A_i)

QM R .

Sob H_2i, F_2i^∗ ∼ F[b−1, ab(m−1)].

H_2i ´e rejeitada se, para um n´ıvel de significˆancia α, F_2i^∗ > F[1−α;b−1, ab(m−1)],

i = 1, . . . , a.

(22)

Exemplo. Escola e Professor

Tabela de ANOVA

FV SQ gl QM F^∗ P

Escola 156,5 2 78,25 78,25/7,00 = 11,2 0,009 Professor(Escola) 567,5 3 189,17 189,17/7,00 = 27,0 0,001

Res´ıduo 42,0 6 7,00

Total 766,0 11

Decomposi¸c˜ao da SQB(A)

FV SQ gl QM F^∗ P

Professor(S˜ao Paulo) 210,25 1 210,25 210,25/7,00 = 30,0 0,002 Professor(Curitiba) 132,25 1 132,25 132,25/7,00 = 18,9 0,005 Professor(Salvador) 225,00 1 225,00 225,00/7,00 = 32,1 0,001

(23)

An´alise dos efeitos dos fatores 1. Estima¸c˜ao de µ_i.

Estimador n˜ao viesado de µ_i., i = 1, . . . , a,:

µˆ_i. = ¯y_i... Variˆancia de ¯y_i..:

var(¯y_i..) = σ² bm.

Estimador não viesado dessa variância é obtido substituindo σ² por QM R:

var(¯ˆ y_i..) = QM R bm .

(24)

Um intervalo de confian¸ca para µ_i. com coeficiente de confian¸ca γ = 1 − α ´e constru´ıdo com base na distribui¸c˜ao t-Student:

y¯_i.. ∓ t_[1−^α

2;ab(m−1)]

q

var(¯ˆ y_i..)

Um contraste entre as m´edias µ_i., i = 1, . . . , a, ´e definido como L =

a X

i=1

c_iµ_i., com

a X

i=1

c_i = 0.

Um estimador n˜ao viesado de L ´e dado por Lˆ =

a X

i=1

c_iy¯_i...

(25)

Al´em disso,

var(ˆL) = var(

a X

i=1

c_i¯y_i..) = σ² bm

a X

i=1

c²_i e var(ˆˆ L) = QM R bm

a X

i=1

c²_i .

Uma combina¸cão linear entre as médias µ_i., i = 1, . . . , a, é definida como L = ^Pâ_i=1 c_iµ_i.. Um estimador não viesado de L é dado por Lˆ = ^Pâ_i=1c_i¯y_i... Além disso, var(ˆˆ L) = QM R/(bm) ^Pâ_i=1c²_i .

Um intervalo de confian¸ca para L (contraste ou combina¸c˜ao linear entre as m´edias µ_i.) com coeficiente de confian¸ca γ = 1−α

´e dado por

Lˆ ∓ t_[1−^α

2;ab(m−1)]

q

var(ˆˆ L)

.

(26)

Compara¸cões múltiplas pelos métodos de Tukey, Bonferroni ou Scheffé podem ser realizadas da forma usual utilizando um coeficiente de confian¸ca global igual a 1 − α.

Exemplo. Escola e Professor. Comparar as médias das notas sob as três escolas, duas a duas, usando o método de Tukey com um coeficiente de confian¸ca global igual a 95%.

D₁ = µ₂−µ₁, Dˆ₁ = 14,25−19,75 = −5,5. Sob cada escola temos bm = 4 observa¸c˜oes (m = 2 para cada professor). QMR = 7,0 e

var( ˆˆ D) = 2QM R

bm = 2 × 7,0

4 = 3,5.

Como 1 − α = 0,05, temos T = ^√¹

2q(1 − α; a;ab(m − 1)) =

√1

2q(0,95; 3; 6) = ^√¹

24,34 = 3,07, constante para todas as compara¸c˜oes.

(27)

O intervalo de confian¸ca para D₁ = µ₂ − µ₁ com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por

h−5,5 ∓ 3,07^p3,5ⁱ, ou seja, [−11,24; 0,241].

Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que não parece existir diferen¸ca entre µ₁ e µ₂. Assim, conclu´ımos que as médias das notas sob as escolas 1 e 2 não são diferentes.

D₂ = µ₃ − µ₁, Dˆ₂ = 11,0 − 19,75 = −8,75. O intervalo de confian¸ca para D₂ = µ₃ −µ₁ com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por

h−8,75 ∓ 3,07^p3,5ⁱ, ou seja, [−14,49;−3,009].

(28)

Como o valor 0 não pertence ao intervalo de confian¸ca obtido, podemos dizer que parece existir diferen¸ca entre µ₁ e µ₃. Assim, conclu´ımos que há evidências de que as médias das notas sob as escolas 1 e 3 são diferentes.

D₃ = µ₃ − µ₂, Dˆ₃ = 11,0 − 14,25 = −3,25. O intervalo de confian¸ca para D₃ = µ₃ −µ₂ com coeficiente de confian¸ca global 1 − α = 0,95 ´e dado por

h−3,25 ∓ 3,07^p3, 5ⁱ , ou seja, [−8,991; 2,491].

Como o valor 0 ∈ ao intervalo de confian¸ca obtido, podemos dizer que não parece existir diferen¸ca entre µ₂ e µ₃. Assim, conclu´ımos que não há evidências de que as médias das notas sob as escolas 2 e 3 sejam diferentes.

(29)

2. Estima¸c˜ao de µ_ij

Um intervalo de confian¸ca para µ_ij com coeficiente de confian¸ca 1 − α ´e dado por

[¯y_ij. ∓ t[1−α/2;ab(m−1)]

q

var(¯ˆ y_ij.)], sendo var(¯ˆ y_ij.) = QM R/m.

Para comparar as m´edias sob os n´ıveis do fator B, dentro de um n´ıvel do fator A, podemos estimar o contraste L = ^P^b_j=1 c_jµ_ij, sendo ^P^b_j=1 c_j = 0. O estimador de L tem a forma ˆL = ^P^b_j=1 c_jy¯_ij.

e o intervalo de confian¸ca para L, com coeficiente de confian¸ca 1 − α, ´e dado por

[ˆL ∓ t[1−α/2;ab(m−1)]

q

var(ˆˆ L)], sendo var(ˆˆ L) = ^{QM R} ^P^b c².

(30)

Para comparar as médias sob os n´ıveis do fator B, dentro de cada n´ıvel do fator A, o método mais indicado é o de Bonferroni, já que os métodos de Tukey e Scheffé são indicados para compara¸cões entre as ab médias.

Exemplo. Escola e Professor. Comparar as médias das notas sob os dois professores em cada escola, usando o método de Bon- ferroni com um coeficiente de confian¸ca global igual a 90%. Para as g = 3 compara¸cões, temos B = t[1−0,10/(2×3);6)] = t_[0,983;6] = 2,748. A estimativa da variância para cada compara¸cão é

var(ˆˆ L) = 7, 00

2 × 2 = 7,0.

Assim, B × ^qvar(ˆˆ L) = 2,748 × √

7,0 = 7, 27.

(31)

Logo,

L_k Lˆ_k Limites de confian¸ca

L₁ = µ₁₁ − µ₁₂ Lˆ₁ = ¯y_11. − y¯_12. = 27 − 12,5 [14,5 ∓ 7,27]

[7,2; 21,8]

L₂ = µ₂₁ − µ₂₂ Lˆ₂ = ¯y_21. − y¯_22. = 8,5 − 20,0 [−11,5 ∓ 7,27]

[−18,8;−4,2]

L₃ = µ₃₁ − µ₃₂ Lˆ₃ = ¯y_31. − y¯_32. = 18,5 − 3,5 [15,0 ∓ 7,27]

[7,7; 22,3]

O valor 0 n˜ao pertence a nenhum dos intervalos de confian¸ca.

Podemos concluir que existem evidˆencias de que as m´edias das

(32)

Para expressar o modelo de análise de variância como um modelo de regressão, vamos considerar para os α_i´s (a−1) variáveis indicadoras, que podem assumir os valores 1, -1 e 0. Para os β_j(i)´s vamos considerar, para cada i, (b − 1) variáveis indicadoras, que podem assumir os valores 1, -1 e 0.

(33)

Exemplo. Escola e Professor Modelo de an´alise de variˆancia

y_ijk = µ + α_i + β_j(i) + e_ijk, i = 1,2,3, j = 1,2, k = 1,2.

Suposi¸c˜ao: e_ijk ∼ N(0, σ²).

Restri¸c˜oes:

1. α₃ = −α₁ − −α₂;

2. β_2(i) = −β_1(i), para cada i.

(34)

Modelo de regress˜ao equivalente

a − 1 = 3 − 1 = 2 vari´aveis indicadoras para os efeitos do fator A;

b − 1 = 2 − 1 = 1 vari´avel indicadora para os efeitos do fator B, sob cada n´ıvel do fator A.

(35)

y_ijk = µ+α₁X_ijk1+α₂X_ijk2+β₁₍₁₎X_ijk3+β₁₍₂₎X_ijk4+β₁₍₃₎X_ijk5+e_ijk, com

X₁ =











1, se a observa¸cão está no n´ıvel 1 (São Paulo) do fator A;

−1, se a observa¸c˜ao est´a no n´ıvel 3 (Salvador) do fator A;

0, caso contr´ario.

X₂ =











1, se a observa¸c˜ao est´a no n´ıvel 2 (Curitiba) do fator A;

−1, se a observa¸c˜ao est´a no n´ıvel 3 (Salvador) do fator A;

0, caso contr´ario.

(36)

X₃ =











1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 1 (SP) do fator A;

−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 1 (SP) do fator A

X₄ =











1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 2 (Curitiba) do fator A;

−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 2 (Curitiba) do fator A

(37)

X₅ =











1, se a observa¸c˜ao est´a no n´ıvel 1 (Prof. 1) do fator B, para o n´ıvel 3 (Salvador) do fator A;

−1, se a observa¸c˜ao est´a no n´ıvel 2 (Prof. 2) do fator B, para o n´ıvel 1 (Salvador) do fator A

Temos:

(38)

i j k y X_ijk0 X_ijk1 X_ijk2 X_ijk3 X_ijk4 X_ijk5

1 1 1 25 1 1 0 1 0 0

1 1 2 29 1 1 0 1 0 0

1 2 1 14 1 1 0 -1 0 0

1 2 2 11 1 1 0 -1 0 0

2 1 1 11 1 0 1 0 1 0

2 1 2 6 1 0 1 0 1 0

2 2 1 22 1 0 1 0 -1 0

2 2 2 18 1 0 1 0 -1 0

3 1 1 17 1 -1 -1 0 0 1

3 1 2 20 1 -1 -1 0 0 1

3 2 1 5 1 -1 -1 0 0 -1

3 2 2 2 1 -1 -1 0 0 -1

O vetor de parˆametros ´e β^> = {µ, α₁, α₂, β₁₍₁₎, β₁₍₂₎, β₁₍₃₎}.

(39)

Coment´arios:

• Os testes de hipóteses são realizados utilizando-se testes F parciais, obtidos por meio do ajuste de um modelo de re- gressão completo e de modelos de regressão reduzidos apro- priados.

• Os testes desenvolvidos por meio de modelos de regressão são análogos aos obtidos, por exemplo, por meio da fun¸cão GLM do MINITAB ou de códigos do R.