aula8 1completa

(1)

ESTIMABILIDADE DE FUNÇÕES LINEARES DE B.

Mesmo que a matriz B não seja estimável, de forma única, certas funções lineares de B são estimáveis. Especialmente uma função linear não aleatória, como aquela definida por uma linha da matriz X de delineamento. Então,

B c′

onde c ≠ , é estimável se e somente se 0

( )( )

X′X X′X −c=c

Uma hipótese linear é dita testável se envolve somente funções estimáveis de B. SOMA DE QUADRADOS PARA HIPÓTESE

Do modelo

( )

= ⊗ = + = I Y XB Y E XB Y Var E p n

Daí tem-se:E

( )

YM =XBMe (M define uma combinação nas variáveis, = −

0 1 1 1 1 1 M )

( )

YM =I⊗M′ M Var Considerando-se que SQ

( )

T′Y =Y′T

( )

T′T −T′Y tem-se que

( )

[

T′ YM

]

=M′Y′T

( )

T′T −T′YM SQ

Seja, agora, a hipótese H₀:C′BM=0

Uma vez que

BLUE

( )

C′B =C′Bˆ =C′

( )

X′X −X′Y T′=C′

( )

X′X −X′ Então,

(

H₀:C′BM=0

)

=M′ Y′X

( )

X′X −C

[

C′

( )

X′X −X′X

( )

X′X −C

]

−C′

( )

X′X −X′Y M SQ B′ˆ Bˆ

( )

_X_′_X −

(2)

(

H₀:C′BM=0

)

=M′Bˆ′C

[

C′

( )

X′X −C

]

−C′BˆM SQ

Exemplo:

Considere as seguintes amostras independentes com 2 variáveis.

3 . 2 . 1 . Pop Pop Pop 7 2 9 1 8 3 0 2 4 0 7 9 2 6 3 9 = = = = 82 81 72 71 62 61 52 51 42 41 32 31 22 21 12 11 32 31 22 21 12 11 2 1 1 0 0 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 0 0 1 1 7 2 9 1 8 3 0 2 4 0 7 9 2 6 3 9 Y e e e e e e e e e e e e e e e e B E X τ τ τ τ τ τ µ µ = 4 8 1 x = 2 1 2 x = 8 2 3 x = 5 4 x Para a 1a. variável: 3 . 2 . 1 . Pop Pop Pop − − − + − − − − − + = 0 1 1 1 1 1 2 1 2 2 2 3 3 4 4 4 4 4 4 4 4 4 4 4 2 1 3 2 0 9 6 9 = − + − + = 3 1 ) 2 ( 3 ) 3 ( 2 ) 4 ( 3 ˆ τ n 12 – 6 – 6 = 0

Os tamanhos amostrais são n1 = 3,

n2 = 2 e n3 = 3

Os pares de observação x _j estão arranjados em colunas

j

x x x −x x j−xe

observação Média

(3)

res trat média obs SQ SQ SQ SQ = + + 216 = 128 + 78 + 10 média obs corrigida total SQ SQ SQ ₍ ₎ = − = 216 – 128 = 88 Para a 2a. variável: 3 . 2 . 1 . Pop Pop Pop − − − − + − − − − − + = 1 1 0 2 2 3 2 1 3 3 3 3 3 1 1 1 5 5 5 5 5 5 5 5 7 9 8 0 4 7 2 3 = + − + − = 3 1 ) 3 ( 3 ) 3 ( 2 ) 1 ( 3 ˆ τ n =0 res trat média obs SQ SQ SQ SQ = + + 272 = 200 + 48 + 24

para as 2 variáveis conjuntamente: produtos cruzados Média: 4(5) + 4(5) + ... + 4(5) = 8 × 4(5) = 160

Tratamento: 3 ×4(−1) + 2 × (−3)(−3) + 3 × (−2)(3) = −12

Resíduo: 1(−1) + (−2)( −2) + 1(3) + (−1)2 + ....+ 0(−1) = 1

Total: 9(3) + 6(2) + 9(7) + 0(4) + ... + 2(7) = 149

PRODUTO CRUZADO TOTALCORRIGIDO = PC TOTAL – PCMÉDIA

= 149 – 160 = −11

observação Média Efeito de

(4)

]QUADRO DA MANOVA Fonte de

Variação Matriz de soma de quadrados e produtos cruzados Graus de liberdade Tratramentos − − 48 12 12 78 B 3 – 1 = 2 g – 1 Resíduo 24 1 1 10 W 8 – 3 = 5 g _n _g e e − =1 Totalcorrigido − − 72 11 11 88 B+W 8 – 1 = 7 1 1 − = g e e n TESTE DE HIPÓTESE 0385 , 0 215 , 6 239 ) 11 ( ) 72 ( 88 ) 1 ( ) 24 ( 10 72 11 11 88 24 1 1 10 2 2 * ₌ ₌ − − − = − − = + = Λ W B W

Com p = 2 variáveis e g = 3 pop., um teste exato (assumindo normalidade e matrizes de covariâncias iguais ₁ = ₂ = ₃ * exercício

de H₀:ττττ₁ =ττττ₂ =ττττ₃ =0

:

1

H pelo menos um τ ≠0 está disponível ESTATÍSTICA DO TESTE

(

)

(

_g

)

Fcalc g n = = − − − − = − − − Λ Λ − 19 , 8 1 3 1 3 8 0385 , 0 0385 , 0 1 1 1 1 * * ( )1;2

(

1

)

4;8(0,01) 7,01 2 − − − = F = F _g _n _g

Como F_calc >F₄_;₈_;₀_,₀₁ , rejeitamos H ao nível de 0,01 e concluímos que existe diferenças ₀

de tratamentos. Dados: n1 = 3, n2 = 2 e n3 = 3 8 3 1 = = e e n

(5)

= 7 3 3 3 1 S − − = 8 4 4 2 2 S − − = 1 5 , 0 5 , 0 1 3 S = 4 8 1 x = 2 1 2 x = 8 2 3 x Podemos obter: = + + + + = 5 4 3 2 1 3 3 2 2 1 1 n n n x n x n nx x

(

−

)

+

(

−

)

+

(

−

)

= + + = = 24 1 1 10 2 1 2 1 1 1 1 2 2 3 3 1 2 3 1 S n S n S S S S n W

(

)(

)

+ − − ′ ′ − − = ′ − − = = 5 4 2 1 5 4 2 1 2 5 4 4 8 5 4 4 8 3 1 x x n B e g e e e x x − − = ′ − − + 48 12 12 78 5 4 8 2 5 4 8 2 3

INTERVALOS DE CONFIANÇA SIMULTÂNEOS PARA EFEITO DE TRATAMENTOS

Seja τ_ki o i-ésimo componente de τ_k. Desde que τ_k pop. é estimado por ττττˆ_k =X −_k X,

i ki ki =x −x

ττττˆ e τˆ_ki −τˆ_i =x_ki−x _i, variável i=1, 2, …, p é a diferença entre duas médias amostrais independentes.

O intervalo de confiança baseado na estatística t para duas amostras é válido com um α apropriadamente modificado. Note que:

(

)

(

)

ii k i ki i ki Var _n _n Varτˆ −τˆ = X −X = 1 + 1 σ

onde: σii é o i-ésimo elemento da diagonal de . Mas a Var

(

Xki −X i

)

é estimada pela

divisão do correspondente elemento de W pelos seus graus de liberdade. Isto é

(6)

(

)

g n w n n r Va ii k − + = −X 1 1 X ˆ _ki _i

onde: w - é o i-ésimo elemento da diagonal de W ii

g

n n

n

n= 1+ 2+...+

De resto, repartir a taxa de erro sobre as numerosas proposições de confiança.

Existem p-variáveis e

(

)

2 1 − g g pares de diferenças.

Tal que cada t-intervalo para duas amostras empregará o valor crítico t_n−_g

(

α/2m

)

, onde

(

)

2 1

− = pg g

m é o número de proposições de confiança simultâneas. RESULTADO (6.5 pg. 253) Seja = = g k k n n 1 , para o modelo X _j =µ +τ +e _j = 1, 2, …, g j = 1, 2,…, n

com confiança de pelo menos

(

1−α

)

i ki τ τ − pertence a

₍

₎

+ − − ± − ₋ n n g n w g pg t x x k ii g n i ki α ₁ 1 1

para todos componentes i = 1, 2, …, p e todas diferenças <k =1,...,g.

Exemplo:

(

)

− = − = − = 1 4 5 4 4 8 ˆ₁ X₁ X ττττ e

(

−

)

= − = ₋− = 3 3 5 4 2 1 ˆ₂ X₂ X ττττ

(7)

= 24 1 1 10 W Assim,

( )

3 2 1 ˆ ˆ₁₂ −τ₂₂ =− − − = τ i = 2 n = 8 2 3 8 24 2 1 3 1 1 1 ₂₂ 2 1 = − + = − + g n w n n

Desde que p = 2 e g = 3, para proposições de confiança simultâneo de 95% temos

( )( )

3 2 4,032 2 05 , 0 5 = t (Ver Tabela 2) 0,0041 ≈ 0,005

(

)

(

)

g n w n n t − + ± − ∈ − 22 2 1 5 22 12 22 12 1 1 0041 , 0 ˆ ˆ τ τ τ τ 2 032 , 4 2± × = 064 , 8 2± = (ou –6,064; 10,064)

CONCLUSÃO: Não existe diferença entre os efeitos dos tratamentos 1 e 2 para a 2a. variável.

Outra forma seria por contrastes. Exercício. 32 12 τ τ − 32 22 τ τ −

(8)

[

]

[

]

[

2 3

]

3 2 3 3 3 3 3 2 1 4 1 4 3 − − + − − − − + − − = B − − + + − − = 9 6 6 4 3 9 9 9 9 2 1 4 4 16 3 B − − = − − + + − − = 48 12 12 78 27 18 18 12 18 18 18 18 3 12 12 48 B

ANÁLISE DE VARIÂNCIA MULTIVARIADA PARA MODELO DE DUPLA ENTRADA DE EFEITOS FIXOS COM INTERAÇÃO:

Considerando um vetor resposta com p componentes

kr k k kr e X =µ+τ +β +γ + = = = n r b k g ,..., 2 , 1 ,..., 2 , 1 ,..., 2 , 1 em que: 0 = = = = = = g k g b k k 1 1 1 γ β τ Todos

(

p×1

)

µµµµ : vetor de médias populacional geral, nesse caso.

kr

e : é um vetor aleatório N_p

(

0,

)

: é o vetor do efeito do nível do fator 1, definido como _• − ;

•: é o vetor de médias populacional no nível do fator 1. :

k é o vetor de efeito do nível k do fator 2, definido como •k − ; k

• : é o vetor de médias populacional no nível k do fator 2. :

k é o vetor da interação entre o nível do fator 1 e o nível k do fator 2 definido como: ) ( _k k k = − + + = _k −

[

+( _•− )+( _•_k − )

]

= _k − _•− _•_k + :

k é o vetor de médias populacionais das p-variáveis no nível do fator 1 combinado com o nível k do fator 2.

As respostas consistem de p medidas repetidas n vezes em cada uma das possíveis combinações dos níveis dos fatores 1 e 2.

(9)

Seguindo (*) Os vetores de observações x podem ser decompostos como _kr

(

) (

k

) (

k k

) (

kr k

)

kr x x x x x x x x x x x

x = + _•− + _• − + − _•− _• + + −

em que:

x - é o vetor das médias gerais de observações.

•

x - é o vetor de médias das observações no -ésimo nível do fator 1.

k •

x - é o vetor de médias das observações no k-ésimo nível do fator 2.

k

x - é o vetor de médias das observações no -ésimo nível do fator 1 e k-ésimo nível do

fator 2.

SOMAS DE QUADRADOS E PRODUTOS CRUZADOS E GRAUS DE LIBERDADE

(

₋

)(

₋

)

′ ₌

(

₋

)(

₋

)

′ • = • = = = x x x x x x x x g e kr n r kr b k g e bn 1 1 1 1

(

−

)(

−

)

′ + _• = • x x x x k b k k gn 1

(

₋ ₋ ₊

)(

₋ ₋ ₊

)

′ + _• _• = • • = x x x x x x x x _k _k b k k k g e n 1 1

(

−

)(

−

)

′ + = = = kr k n r kr k g e b k x x x x 1 1 1

(

1

) (

1

) (

1

)(

1

)

(

1

)

1= − + − + − − + − − g b g b gb n gbn

NOTA: A generalização do caso univariado para o multivariado consiste simplesmente em trocar um escalar por uma matriz

(

x _•−x

)(

x _• −x

)

′.

(10)

MANOVA PARA COMPARAR FATORES E SUAS INTERAÇÕES Fonte de

variação Matriz de soma de quadrados e produtos cruzados (SQPC) liberdade Graus de

Fator 1 =

(

−

)(

_• −

)

′ = • x x x x g Fat bn SQPC 1 1 . 1 − g Fator 2 =

(

−

)(

_• −

)

′ = x• x x k x b k k Fat gn SQPC 1 2 . 1 − b Interação = . INT SQPC

(

− − +

)(

− _• − _• +

)

′ = • • = x x x x x x x x k k b k k k g n 1 1 ) 1 (g− (b−1) Resíduo

(

−

)(

−

)

′ = = = kr k n r kr k b k g RES SQPC x x x x 1 1 1 .

(

n−1

)

gb TOTALCORRIGIDO

(

−

)(

−

)

′ = = = x x x x kr n r kr b k g CORR SQPC 1 1 1 . 1 − gbn • o teste de verossimilhança requer p≤gb

(

n−1

)

para que a SQPCRES. seja positiva

definida (com probabilidade 1). TESTE DE HIPÓTESE

Um teste (o teste da razão de verosimilhança) de

0

= = =

= _gb

H0 :γγγγ11 γγγγ12 ... γγγγ (não existe efeito de interação)

:

1

H pelo menos um γ _k ≠0

é conduzido para rejeitarmos H0 para pequenos valores da razão

. . . * RES INT RES SQPC SQPC SQPC + = Λ

Para grandes amostras, a estatística _{Λ de Wilks, pode ser referida como um percentil da}• qui-quadrado.

(11)

Rejeitamos: 0 = = = = _gb H0 :γγγγ11 γγγγ12 ... γγγγ ao nível α se

(

n 1

)

p 1

(

g₂ 1

)(

b 1

)

ln

( )

* χ( )( )2g 1 b 1p

( )

α gb − − + − − − Λ > ₋ ₋ −

NOTA: Ordinariamente, o teste para interação é realizado antes dos testes para os efeitos principais dos fatores.

- se existe efeito de interação, os efeitos principais dos fatores não têm uma clara interpretação.

- do ponto de vista prático, não é aconselhável proceder com os testes multivariados adicionais

- Neste caso, as análises da variância univariada do modelo de dupla entrada são freqüentemente conduzidos para ver se a interação aparece em algumas respostas e noutras não.

- Aquelas respostas sem interação podem ser interpretadas em termos dos efeitos aditivos dos fatores 1 e 2, contanto que os últimos efeitos existam.