ESTIMABILIDADE DE FUNÇÕES LINEARES DE B.
Mesmo que a matriz B não seja estimável, de forma única, certas funções lineares de B são estimáveis. Especialmente uma função linear não aleatória, como aquela definida por uma linha da matriz X de delineamento. Então,
B c′
onde c ≠ , é estimável se e somente se 0
( )( )
X′X X′X −c=cUma hipótese linear é dita testável se envolve somente funções estimáveis de B. SOMA DE QUADRADOS PARA HIPÓTESE
Do modelo
( )
( )
= ⊗ = + = I Y XB Y E XB Y Var E p nDaí tem-se:E
( )
YM =XBMe (M define uma combinação nas variáveis, = −0 1 1 1 1 1 M )
( )
YM =I⊗M′ M Var Considerando-se que SQ( )
T′Y =Y′T( )
T′T −T′Y tem-se que( )
[
T′ YM]
=M′Y′T( )
T′T −T′YM SQSeja, agora, a hipótese H0:C′BM=0
Uma vez que
BLUE
( )
C′B =C′Bˆ =C′( )
X′X −X′Y T′=C′( )
X′X −X′ Então,(
H0:C′BM=0)
=M′ Y′X( )
X′X −C[
C′( )
X′X −X′X( )
X′X −C]
−C′( )
X′X −X′Y M SQ B′ˆ Bˆ( )
X′X −(
H0:C′BM=0)
=M′Bˆ′C[
C′( )
X′X −C]
−C′BˆM SQExemplo:
Considere as seguintes amostras independentes com 2 variáveis.
3 . 2 . 1 . Pop Pop Pop 7 2 9 1 8 3 0 2 4 0 7 9 2 6 3 9 = = = = 82 81 72 71 62 61 52 51 42 41 32 31 22 21 12 11 32 31 22 21 12 11 2 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 0 0 1 1 7 2 9 1 8 3 0 2 4 0 7 9 2 6 3 9 Y e e e e e e e e e e e e e e e e B E X τ τ τ τ τ τ µ µ = 4 8 1 x = 2 1 2 x = 8 2 3 x = 5 4 x Para a 1a. variável: 3 . 2 . 1 . Pop Pop Pop − − − + − − − − − + = 0 1 1 1 1 1 2 1 2 2 2 3 3 4 4 4 4 4 4 4 4 4 4 4 2 1 3 2 0 9 6 9 = − + − + = 3 1 ) 2 ( 3 ) 3 ( 2 ) 4 ( 3 ˆ τ n 12 – 6 – 6 = 0
Os tamanhos amostrais são n1 = 3,
n2 = 2 e n3 = 3
Os pares de observação x j estão arranjados em colunas
j
x x x −x x j−xe
observação Média
res trat média obs SQ SQ SQ SQ = + + 216 = 128 + 78 + 10 média obs corrigida total SQ SQ SQ ( ) = − = 216 – 128 = 88 Para a 2a. variável: 3 . 2 . 1 . Pop Pop Pop − − − − + − − − − − + = 1 1 0 2 2 3 2 1 3 3 3 3 3 1 1 1 5 5 5 5 5 5 5 5 7 9 8 0 4 7 2 3 = + − + − = 3 1 ) 3 ( 3 ) 3 ( 2 ) 1 ( 3 ˆ τ n =0 res trat média obs SQ SQ SQ SQ = + + 272 = 200 + 48 + 24
para as 2 variáveis conjuntamente: produtos cruzados Média: 4(5) + 4(5) + ... + 4(5) = 8 × 4(5) = 160
Tratamento: 3 ×4(−1) + 2 × (−3)(−3) + 3 × (−2)(3) = −12
Resíduo: 1(−1) + (−2)( −2) + 1(3) + (−1)2 + ....+ 0(−1) = 1
Total: 9(3) + 6(2) + 9(7) + 0(4) + ... + 2(7) = 149
PRODUTO CRUZADO TOTALCORRIGIDO = PC TOTAL – PCMÉDIA
= 149 – 160 = −11
observação Média Efeito de
]QUADRO DA MANOVA Fonte de
Variação Matriz de soma de quadrados e produtos cruzados Graus de liberdade Tratramentos − − 48 12 12 78 B 3 – 1 = 2 g – 1 Resíduo 24 1 1 10 W 8 – 3 = 5 g n g e e − =1 Totalcorrigido − − 72 11 11 88 B+W 8 – 1 = 7 1 1 − = g e e n TESTE DE HIPÓTESE 0385 , 0 215 , 6 239 ) 11 ( ) 72 ( 88 ) 1 ( ) 24 ( 10 72 11 11 88 24 1 1 10 2 2 * = = − − − = − − = + = Λ W B W
Com p = 2 variáveis e g = 3 pop., um teste exato (assumindo normalidade e matrizes de covariâncias iguais 1 = 2 = 3 * exercício
de H0:ττττ1 =ττττ2 =ττττ3 =0
:
1
H pelo menos um τ ≠0 está disponível ESTATÍSTICA DO TESTE
(
)
(
g)
Fcalc g n = = − − − − = − − − Λ Λ − 19 , 8 1 3 1 3 8 0385 , 0 0385 , 0 1 1 1 1 * * ( )1;2(
1)
4;8(0,01) 7,01 2 − − − = F = F g n gComo Fcalc >F4;8;0,01 , rejeitamos H ao nível de 0,01 e concluímos que existe diferenças 0
de tratamentos. Dados: n1 = 3, n2 = 2 e n3 = 3 8 3 1 = = e e n
= 7 3 3 3 1 S − − = 8 4 4 2 2 S − − = 1 5 , 0 5 , 0 1 3 S = 4 8 1 x = 2 1 2 x = 8 2 3 x Podemos obter: = + + + + = 5 4 3 2 1 3 3 2 2 1 1 n n n x n x n nx x
(
−)
+(
−)
+(
−)
= + + = = 24 1 1 10 2 1 2 1 1 1 1 2 2 3 3 1 2 3 1 S n S n S S S S n W(
)(
)
+ − − ′ ′ − − = ′ − − = = 5 4 2 1 5 4 2 1 2 5 4 4 8 5 4 4 8 3 1 x x n B e g e e e x x − − = ′ − − + 48 12 12 78 5 4 8 2 5 4 8 2 3INTERVALOS DE CONFIANÇA SIMULTÂNEOS PARA EFEITO DE TRATAMENTOS
Seja τki o i-ésimo componente de τk. Desde que τk pop. é estimado por ττττˆk =X −k X,
i ki ki =x −x
ττττˆ e τˆki −τˆi =xki−x i, variável i=1, 2, …, p é a diferença entre duas médias amostrais independentes.
O intervalo de confiança baseado na estatística t para duas amostras é válido com um α apropriadamente modificado. Note que:
(
)
(
)
ii k i ki i ki Var n n Varτˆ −τˆ = X −X = 1 + 1 σonde: σii é o i-ésimo elemento da diagonal de . Mas a Var
(
Xki −X i)
é estimada peladivisão do correspondente elemento de W pelos seus graus de liberdade. Isto é
(
)
g n w n n r Va ii k − + = −X 1 1 X ˆ ki ionde: w - é o i-ésimo elemento da diagonal de W ii
g
n n
n
n= 1+ 2+...+
De resto, repartir a taxa de erro sobre as numerosas proposições de confiança.
Existem p-variáveis e
(
)
2 1 − g g pares de diferenças.Tal que cada t-intervalo para duas amostras empregará o valor crítico tn−g
(
α/2m)
, onde(
)
2 1
− = pg g
m é o número de proposições de confiança simultâneas. RESULTADO (6.5 pg. 253) Seja = = g k k n n 1 , para o modelo X j =µ +τ +e j = 1, 2, …, g j = 1, 2,…, n
com confiança de pelo menos
(
1−α)
i ki τ τ − pertence a
(
)
+ − − ± − − n n g n w g pg t x x k ii g n i ki α 1 1 1para todos componentes i = 1, 2, …, p e todas diferenças <k =1,...,g.
Exemplo:
(
)
− = − = − = 1 4 5 4 4 8 ˆ1 X1 X ττττ e(
−)
= − = −− = 3 3 5 4 2 1 ˆ2 X2 X ττττ= 24 1 1 10 W Assim,
( )
3 2 1 ˆ ˆ12 −τ22 =− − − = τ i = 2 n = 8 2 3 8 24 2 1 3 1 1 1 22 2 1 = − + = − + g n w n nDesde que p = 2 e g = 3, para proposições de confiança simultâneo de 95% temos
( )( )
3 2 4,032 2 05 , 0 5 = t (Ver Tabela 2) 0,0041 ≈ 0,005(
)
(
)
g n w n n t − + ± − ∈ − 22 2 1 5 22 12 22 12 1 1 0041 , 0 ˆ ˆ τ τ τ τ 2 032 , 4 2± × = 064 , 8 2± = (ou –6,064; 10,064)CONCLUSÃO: Não existe diferença entre os efeitos dos tratamentos 1 e 2 para a 2a. variável.
Outra forma seria por contrastes. Exercício. 32 12 τ τ − 32 22 τ τ −
[
]
[
]
[
2 3]
3 2 3 3 3 3 3 2 1 4 1 4 3 − − + − − − − + − − = B − − + + − − = 9 6 6 4 3 9 9 9 9 2 1 4 4 16 3 B − − = − − + + − − = 48 12 12 78 27 18 18 12 18 18 18 18 3 12 12 48 BANÁLISE DE VARIÂNCIA MULTIVARIADA PARA MODELO DE DUPLA ENTRADA DE EFEITOS FIXOS COM INTERAÇÃO:
Considerando um vetor resposta com p componentes
kr k k kr e X =µ+τ +β +γ + = = = n r b k g ,..., 2 , 1 ,..., 2 , 1 ,..., 2 , 1 em que: 0 = = = = = = g k g b k k 1 1 1 γ β τ Todos
(
p×1)
µµµµ : vetor de médias populacional geral, nesse caso.
kr
e : é um vetor aleatório Np
(
0,)
: é o vetor do efeito do nível do fator 1, definido como • − ;
•: é o vetor de médias populacional no nível do fator 1. :
k é o vetor de efeito do nível k do fator 2, definido como •k − ; k
• : é o vetor de médias populacional no nível k do fator 2. :
k é o vetor da interação entre o nível do fator 1 e o nível k do fator 2 definido como: ) ( k k k = − + + = k −
[
+( •− )+( •k − )]
= k − •− •k + :k é o vetor de médias populacionais das p-variáveis no nível do fator 1 combinado com o nível k do fator 2.
As respostas consistem de p medidas repetidas n vezes em cada uma das possíveis combinações dos níveis dos fatores 1 e 2.
Seguindo (*) Os vetores de observações x podem ser decompostos como kr
(
) (
k) (
k k) (
kr k)
kr x x x x x x x x x x x
x = + •− + • − + − •− • + + −
em que:
x - é o vetor das médias gerais de observações.
•
x - é o vetor de médias das observações no -ésimo nível do fator 1.
k •
x - é o vetor de médias das observações no k-ésimo nível do fator 2.
k
x - é o vetor de médias das observações no -ésimo nível do fator 1 e k-ésimo nível do
fator 2.
SOMAS DE QUADRADOS E PRODUTOS CRUZADOS E GRAUS DE LIBERDADE
(
−)(
−)
′ =(
−)(
−)
′ • = • = = = x x x x x x x x g e kr n r kr b k g e bn 1 1 1 1(
−)(
−)
′ + • = • x x x x k b k k gn 1(
− − +)(
− − +)
′ + • • = • • = x x x x x x x x k k b k k k g e n 1 1(
−)(
−)
′ + = = = kr k n r kr k g e b k x x x x 1 1 1(
1) (
1) (
1)(
1)
(
1)
1= − + − + − − + − − g b g b gb n gbnNOTA: A generalização do caso univariado para o multivariado consiste simplesmente em trocar um escalar por uma matriz
(
x •−x)(
x • −x)
′.MANOVA PARA COMPARAR FATORES E SUAS INTERAÇÕES Fonte de
variação Matriz de soma de quadrados e produtos cruzados (SQPC) liberdade Graus de
Fator 1 =
(
−)(
• −)
′ = • x x x x g Fat bn SQPC 1 1 . 1 − g Fator 2 =(
−)(
• −)
′ = x• x x k x b k k Fat gn SQPC 1 2 . 1 − b Interação = . INT SQPC(
− − +)(
− • − • +)
′ = • • = x x x x x x x x k k b k k k g n 1 1 ) 1 (g− (b−1) Resíduo(
−)(
−)
′ = = = kr k n r kr k b k g RES SQPC x x x x 1 1 1 .(
n−1)
gb TOTALCORRIGIDO(
−)(
−)
′ = = = x x x x kr n r kr b k g CORR SQPC 1 1 1 . 1 − gbn • o teste de verossimilhança requer p≤gb(
n−1)
para que a SQPCRES. seja positivadefinida (com probabilidade 1). TESTE DE HIPÓTESE
Um teste (o teste da razão de verosimilhança) de
0
= = =
= gb
H0 :γγγγ11 γγγγ12 ... γγγγ (não existe efeito de interação)
:
1
H pelo menos um γ k ≠0
é conduzido para rejeitarmos H0 para pequenos valores da razão
. . . * RES INT RES SQPC SQPC SQPC + = Λ
Para grandes amostras, a estatística Λ de Wilks, pode ser referida como um percentil da • qui-quadrado.
Rejeitamos: 0 = = = = gb H0 :γγγγ11 γγγγ12 ... γγγγ ao nível α se
(
n 1)
p 1(
g2 1)(
b 1)
ln( )
* χ( )( )2g 1 b 1p( )
α gb − − + − − − Λ > − − −NOTA: Ordinariamente, o teste para interação é realizado antes dos testes para os efeitos principais dos fatores.
- se existe efeito de interação, os efeitos principais dos fatores não têm uma clara interpretação.
- do ponto de vista prático, não é aconselhável proceder com os testes multivariados adicionais
- Neste caso, as análises da variância univariada do modelo de dupla entrada são freqüentemente conduzidos para ver se a interação aparece em algumas respostas e noutras não.
- Aquelas respostas sem interação podem ser interpretadas em termos dos efeitos aditivos dos fatores 1 e 2, contanto que os últimos efeitos existam.