aula8AM

(1)

INTERVALOS SIMULTÂNEOS IDÉIA:

Encontrar intervalos para cada componente de µµµµ′=

[

µ1,µ2,...,µp

]

, individualmente, com nível de confiança simultâneo (conjunto).

OBS.:

1) Poderíamos pensar em fazer, para cada µ_i, os intervalos:

( ) s_n

t

x_i ± _n₋₁_,_α_/₂ ii

2) Mas, simultaneamente qual a probabilidade destes intervalos? Como são independentes, o nível de probabilidade conjunto é dado pelo produto dos níveis individuais de cada IC.

( )

1−α* p <

(

1−α

)

(

1

)

0,95 0,05 ( ) : * Correçãode Bonferroni p Ex −α = α_i =

( )

_*1/p 1

1− −α , apropriada para estatísticas de teste multivariado e hipóteses bilaterais.

Exercício 5.6

3) Considere vetores da forma =

[

]

′

×1 1 2 p p , ,..., e Xj ~Np

(

µµµµ,

)

então (i) E

[ ]

′X = ′µ (ii)

[ ]

( ) ( ) ( )1p _p _p p1 cov × × ×′ =

′X (Trata-se de uma variância!) (iii) ′X~N

(

′µ, ′

)

TEOREMA (Resultado 5.3) pg. 193

Seja X₁,X₂,...,X_n uma a.a. de uma Np

(

µµµµ,

)

com positiva definida. Então, simultaneamente para todo , o intervalo

(

)

(

−

)

( )

′

− ±

′X _np_nn _p1 Fp,n₋p α S

OBS.: Esse intervalo leva em consideração as var-cov de todas as variáveis presentes em X

contém ′ com probabilidade

(

1−α

)

.

Como é baseado na estatística T2, esse é o Intervalo de Confiança de Hotelling.

OBS.:

(2)

(

)

(

−

)

( )

− ± ₋ n S F p n n p p n p, 11 1 1 X α

fazemos analogamente para os outros componentes. Para µ , _i =

[

0,0,..., _i,0,0

]

com _i =1 2) Sem alterar o nível

(

1−α

)

podemos fazer também declarações de confiança para as

diferenças µi −µj tomamos =

[

0,..., i,..., j,...,0

]

,com i =1 e j =−1.

(

−

)

±

₍

p_n

(

n₋−_p

₎

)

F(pn−p)

( )

Sii − S_nij +Sjj

2 1

X

Xi j , α

Exercício: Fazer um programa para continuação do Exemplo 5.3

= 603 , 0 564 , 0 X = 0146 , 0 0117 , 0 0117 , 0 0144 , 0 S n = 40 p = 2

(i) =

[

1, 0

]

(Aqui, verificamos se a radiação média com porta fechada difere de 0) (ii) =

[

0, 1

]

(Idem para porta aberta)

(iii) =

[

1, −1

]

(Aqui, verificamos se há diferença entre as duas).

INFERÊNCIA PARA MÉDIA EM GRANDES AMOSTRAS pg. 199

Se n é suficientemente grande e n− p também podemos realizar testes e construir regiões de confiança independentemente da pressuposição de normalidade.

OBS.: Isso é forte! Significa que se n e (n-p) são grandes podemos relaxar a suposição de normalidade.

TEOREMA: (Resultado 5.4)

Seja X₁,X₂,...,X_n uma a.a. de uma população de média µµµµ e matriz var-cov positiva definida. Sendo n e n− p suficientemente grandes, temos que

(i) para testar H0:µ=µ0×H1:µ≠µ0 rejeitamos H se 0

T2=n

(

X−µ₀

) (

'S−1 X−µ₀

)

>χ_{( )}2

( )

α p

(Resultado 5.5)

(3)

( )

± n p S X ' ' χ2 α

• Faça o exercício 5.20 pg. 217 e considere 1) ' =

[

1 −1 0

]

2) ' =

[

1 0 −1

]

3) ' =

[

1/2 1/2 −1

]

Obs: 1) Para pequenas amostras usa-se a estatística F.

2) Para grandes amostras usa-se a estatística qui-quadrado.

ANÁLISE DA VARIÂNCIA MULTIVARIADA MANOVA

pg. 246

Introdução

O modelo linear multivariado é uma generalização do caso univariado. A obtenção dos estimadores e suas propriedades, as somas de quadrados, etc., obedecem a processos rigorosamente análogos ao caso univariado.

A diferença básica em relação ao caso univariado diz respeito aos testes das hipóteses e intervalos de confiança. Além de não existir um procedimento único para testes de hipóteses. Resultados discrepantes envolvendo os diferentes testes poderão ser obtidos, dependendo da situação. Também não existe um procedimento que possa ser considerado como melhor.

MODELO PARA COMPARAR g VETORES DE MÉDIAS DE POPULAÇÕES

1j p 1 p 1 p 1j pX e + τ + µ = = = n j g ,..., 2 , 1 ,..., 2 , 1

[

]

[

]

[

]

[

]

[

]

[

]

[

]

[

]

= gp g2 g1 gp g2 g1 g gp g2 g2 gp g2 g1 1p 12 11 1p 12 11 1 2p 22 12 1p 12 11 x ... x x x ... x x n ... ... ... x ... x x 2 x ... x x 1 x ... x x x ... x x n ... ... ... x ... x x 2 x ... x x 1 p nX

(4)

j

e - são vetores independentes Np

(

0,

)

(a independência é de uma pop. em relação a outra). Σ Σ Σ = gp gp φ φ φ φ φ φ ... ...

[

e11,...,e1p;e21,...,e2p;...;eg1,...,eg2

]

µµµµ - vetor de parâmetros (média geral)

τ - representa o efeito do -ésimo tratamento com τ =0

= g 1 n População 1: X11,X12,...,X1n₁ Pop. 2: X₂₁,X₂₂,...,X₂_n₂ Pop. g: X_g₁,X_g₂,...,X_gn_g

Para uma população genérica :

= jp j j j p x x x 2 1 1 X

Os erros para os componentes de X_j são correlacionados, mas a matriz de covariância é a mesma para todas populações. HOMOGENEIDADE.

Um vetor de observações pode ser decomposto como sugerido pelo modelo

(

x x

)

(

x x

)

x

x _j = + − + _j − (*)

(

multivariaobservaçãoda

)

médiageral,amostralµµµµˆ efeitoestimado,detratamentoτˆ j

resíduo

eˆ

A decomposição em (*) conduz ao análogo multivariado da soma de quadrados univariado. Primeiro notemos que para o produto cruzado

(

_x ₋_x

)(

_x ₋_x

)

′

j j

(5)

(

)

(

)

[

− + −

]

⋅

[

(

−

)

+

(

−

)

]

′ = x _j x x x x _j x x x

(

−

)(

−

) (

′ + −

)

(

−

)

′+ = x j x x j x xj x x x

(

−

)

(

−

)

′ +

(

−

)(

−

)

′ + x x x j x x x x x

A soma sobre j das duas expressões centrais produz a matriz nula porque

(

)

= = − n 1 j j 0 x x .

Assim, somando os produtos cruzados sobe e j temos:

(

)(

)

(

)(

)

(

)(

)

= = = = = ′ − − + ′ − − = ′ − − n 1 j j j g 1 g 1 n 1 j j j g 1 n x x x x x x x x x x x x

A soma de quadrados e produtos cruzados residual pode ser expressa como

(

)(

)

= = ′ − − = n 1 j j j g 1 W x x x x

(

n1−1

)

S1+

(

n2 −1

)

S2 +...+

(

ng −1

)

Sg =

onde S - matriz de covariâncias residual amostral para a -ésima amostra ou

(tratamento).

Quadro da MANOVA para comparar vetores de médias de populações

Fonte de Variação Matriz de soma de quadrados e

produtos cruzados (SQPC) Graus de Liberdade

Tratamento

₍

₎₍

₎

_′ − − = = x x x x g 1 n B g−1 Resíduo

₍

₎₍

₎

= = ′ − − = n 1 j j j g 1 W x x x x g n g 1 − =

Total (corrigido para a

média)

(

)(

)

= = ′ − − = + n 1 j j j g 1 W B x x x x g n 1 1 − =

Obs.: Os graus de liberdade correspondem ao caso univariado e as distribuições multivariadas teóricas envolvem a densidade de Wishart.

soma de quadrados e produtos cruzados total (corrigida) soma de quadrados e produtos cruzados de tratamentos (entre) soma de quadrados e produtos cruzados residual (dentro)

(6)

TESTE DE HIPÓTESE 0 = = = = _g

H0 :ττττ1 ττττ2 ... ττττ envolve a variância generalizada

Critério de Rejeição: Rejeitamos H se a razão de variâncias generalizadas ₀ _{Λ de Wilks é}*

muito pequena

(

)(

)

(

)(

)

= = = = ′ − − ′ − − = + = Λ _n 1 j j j g 1 n 1 j j j g 1 * W B W x x x x x x x x Exercícios: 6.16 e 6.17 pag. 275, 276

DISTRIBUIÇÕES EXATAS DO LAMBDA DE WILKS

No. de Variáveis No. de grupos Distribuição amostral para dados multinormal

1 = p (caso univariado) 2 ≥ g Λ Λ − − − − −1, n g g * * F ~ 1 1 g g n 2 = p g≥2 ( )g 1,2( n g 1) 2 * * F ~ 1 1 g 1 g n − − − Λ Λ − − − − 1 ≥ p g =2 Λ Λ − − − − − 1p n , p * * F ~ 1 p 1 p n 1 ≥ p g =3 ( ) Λ Λ − − − − − 2p n 2 , p 2 * * F ~ 1 p 2 p n

Bartlett mostrou que sob H verdadeira e ₀ n = grande n

(

)

(

)

+ + − − − = Λ + − − − W B W g p n g p n ln 2 1 ln 2 1 *

tem aproximadamente uma distribuição 2_{( )} 1

− g p χ

(7)

(

)

( )

α χ2 1 ln 2 1− + ₊ > − − − _p_g W B W g p n

é o

(

100α

)

−ésimo percentil superior da qui-dradrado com p

(

g−1

)

gl.

TESTE GENERALIZADO DE BARTLETT (Homogeneidade de Matrizes de Cov.) = = = ₂ _g 1 ... : 0 H (Homog.) : 0

H pelo menos uma i difere das demais (Heterog.)

(

)

= = − − − = g 1 combinada g 1 Ln 1 n Ln g n S S M

(

)

(

+

)(

−

)

− − + − = = = − g 1 g 1 2 1 n 1 n 1 1 g 1 p 6 1 p 3 p 2 1 C ( ) ( ) 2 1 1 2 1 1 _~ + − − p p g

MC χ (Note: p(p+1)/2 é a contagem de var-cov de )

onde

(

)

(

)

(

)

= − = − + + + − + + − + − = _g 1 g 2 1 g g 2 2 1 1 combinada g n W g n ... n n 1 n ... 1 n 1 n S S S S

ANÁLISE MULTIVARIADA DE DADOS EXPERIMENTAIS

Seja o modelo p n p 1 I n p X B E Y = + + n ⊗ = = )) ( vec ( Var I ) ( Var ) ( E Y Y XB Y onde:

Y - contém n observações aleatórias sobre p variáveis dependentes B - matriz de parâmetros desconhecidos

(8)

E - matriz de erros aleatórios tais que cada linha de E é um vetor normal p-variado com

vetor de média zero e matriz de covariância

p p .

- é assumida positiva definida.

X - matriz de delineamento, de zeros e uns. Posto (X) = r < I +1

A solução das equações normais X’XB=X’Y não é única. A solução de mínimos quadrados

é dada por:

( )

_{( )}

_X_X _X_Y B_ˆ g = ′ − ′

que depende de uma particular escolha da inversa generalizada. Como resultado, a matriz B

não é unicamente estimável. Quadro de dados estruturados

Tratamentos VAR1 VAR2 ... VARp

1 y ₁₁₁ 121 y 1 1J1 y 112 y 122 y 2 1J1 y ... ... ... p y₁₁ p y₁₂ p J y₁₁ 2 y ₂₁₁ 221 y 1 2J2 y 212 y 222 y 2 2J2 y ... ... ... p y₂₁ p y₂₂ p J y₂ ₂ ... ... ... I y _I₁₁ 21 I y 1 IJI y 12 I y 22 I y 2 IJI y ... ... ... p I y ₁ p I y ₂ p IJI y Observação genérica: yij_i i = 1, 2, ..., I (tratamentos)

ji = 1, 2, ..., Ji (no. de amostras no i-ésimo tratamento)

(9)

Seja

( )p×1i

ij

Y um vetor de observações no i-ésimo tratamento e ji-ésima amostra.

= = i i J j I i ,..., 2 , 1 ,..., 2 , 1 = p y y y 11 112 111 11 Y Assumindo que i ij i i ij e Y = + + + + + p p ip p i i p p i ij ~ N , 1 2 2 1 1 τ µ τ µ τ µ Y onde

- é a matriz de covariâncias de ji observações subamostrais. ip

τ - é o efeito do i-ésimo tratamento na -ésima variável.

O modelo fica:

(

yiji1,yiji2,...,yijip

)

=

(

µ+τi1,µ+τi2,...,µ +τip

)

+

(

εiji1,εiji2,...,εijip

)

= = i i J j I i ,..., 2 , 1 ,..., 2 , 1 Assim, µ τ₁ τ₂ τ_I p IJ I J J n p IP I I p p p I I n p IJ I J J n I I ′ ′ − − − − − − ′ ′ − − − ′ ′ + ⋅ − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − = ′ ′ − − − − − − ′ ′ − − − ′ ′ + + y y y y y y 1 2 21 1 11 2 1 2 22 21 1 12 11 2 1 1 1 1 2 21 1 11 2 1 2 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 τ τ τ τ τ τ τ τ τ µ µ µ

(10)

= = I i i J n 1 onde = i ij ε 1 2 1 p ij ij ij p i i i ε ε ε