INTERVALOS SIMULTÂNEOS IDÉIA:
Encontrar intervalos para cada componente de µµµµ′=
[
µ1,µ2,...,µp]
, individualmente, com nível de confiança simultâneo (conjunto).OBS.:
1) Poderíamos pensar em fazer, para cada µi, os intervalos:
( ) sn
t
xi ± n−1,α/2 ii
2) Mas, simultaneamente qual a probabilidade destes intervalos? Como são independentes, o nível de probabilidade conjunto é dado pelo produto dos níveis individuais de cada IC.
( )
1−α* p <(
1−α)
(
1)
0,95 0,05 ( ) : * Correçãode Bonferroni p Ex −α = αi =( )
*1/p 11− −α , apropriada para estatísticas de teste multivariado e hipóteses bilaterais.
Exercício 5.6
3) Considere vetores da forma =
[
]
′×1 1 2 p p , ,..., e Xj ~Np
(
µµµµ,)
então (i) E[ ]
′X = ′µ (ii)[ ]
( ) ( ) ( )1p p p p1 cov × × ×′ =′X (Trata-se de uma variância!) (iii) ′X~N
(
′µ, ′)
TEOREMA (Resultado 5.3) pg. 193
Seja X1,X2,...,Xn uma a.a. de uma Np
(
µµµµ,)
com positiva definida. Então, simultaneamente para todo , o intervalo(
)
(
−)
( )( )
′− ±
′X npnn p1 Fp,n−p α S
OBS.: Esse intervalo leva em consideração as var-cov de todas as variáveis presentes em X
contém ′ com probabilidade
(
1−α)
.Como é baseado na estatística T2, esse é o Intervalo de Confiança de Hotelling.
OBS.:
(
)
(
−)
( )( )
− ± − n S F p n n p p n p, 11 1 1 X αfazemos analogamente para os outros componentes. Para µ , i =
[
0,0,..., i,0,0]
com i =1 2) Sem alterar o nível(
1−α)
podemos fazer também declarações de confiança para asdiferenças µi −µj tomamos =
[
0,..., i,..., j,...,0]
,com i =1 e j =−1.(
−)
±(
pn(
n−−p)
)
F(pn−p)( )
Sii − Snij +Sjj2 1
X
Xi j , α
Exercício: Fazer um programa para continuação do Exemplo 5.3
= 603 , 0 564 , 0 X = 0146 , 0 0117 , 0 0117 , 0 0144 , 0 S n = 40 p = 2
(i) =
[
1, 0]
(Aqui, verificamos se a radiação média com porta fechada difere de 0) (ii) =[
0, 1]
(Idem para porta aberta)(iii) =
[
1, −1]
(Aqui, verificamos se há diferença entre as duas).INFERÊNCIA PARA MÉDIA EM GRANDES AMOSTRAS pg. 199
Se n é suficientemente grande e n− p também podemos realizar testes e construir regiões de confiança independentemente da pressuposição de normalidade.
OBS.: Isso é forte! Significa que se n e (n-p) são grandes podemos relaxar a suposição de normalidade.
TEOREMA: (Resultado 5.4)
Seja X1,X2,...,Xn uma a.a. de uma população de média µµµµ e matriz var-cov positiva definida. Sendo n e n− p suficientemente grandes, temos que
(i) para testar H0:µ=µ0×H1:µ≠µ0 rejeitamos H se 0
T2=n
(
X−µ0) (
'S−1 X−µ0)
>χ( )2( )
α p(Resultado 5.5)
( )
( )
± n p S X ' ' χ2 α• Faça o exercício 5.20 pg. 217 e considere 1) ' =
[
1 −1 0]
2) ' =
[
1 0 −1]
3) ' =
[
1/2 1/2 −1]
Obs: 1) Para pequenas amostras usa-se a estatística F.
2) Para grandes amostras usa-se a estatística qui-quadrado.
ANÁLISE DA VARIÂNCIA MULTIVARIADA MANOVA
pg. 246Introdução
O modelo linear multivariado é uma generalização do caso univariado. A obtenção dos estimadores e suas propriedades, as somas de quadrados, etc., obedecem a processos rigorosamente análogos ao caso univariado.
A diferença básica em relação ao caso univariado diz respeito aos testes das hipóteses e intervalos de confiança. Além de não existir um procedimento único para testes de hipóteses. Resultados discrepantes envolvendo os diferentes testes poderão ser obtidos, dependendo da situação. Também não existe um procedimento que possa ser considerado como melhor.
MODELO PARA COMPARAR g VETORES DE MÉDIAS DE POPULAÇÕES
1j p 1 p 1 p 1j pX e + τ + µ = = = n j g ,..., 2 , 1 ,..., 2 , 1
[
]
[
]
[
]
[
]
[
]
[
]
[
]
[
]
= gp g2 g1 gp g2 g1 g gp g2 g2 gp g2 g1 1p 12 11 1p 12 11 1 2p 22 12 1p 12 11 x ... x x x ... x x n ... ... ... x ... x x 2 x ... x x 1 x ... x x x ... x x n ... ... ... x ... x x 2 x ... x x 1 p nXj
e - são vetores independentes Np
(
0,)
(a independência é de uma pop. em relação a outra). Σ Σ Σ = gp gp φ φ φ φ φ φ ... ...[
e11,...,e1p;e21,...,e2p;...;eg1,...,eg2]
µµµµ - vetor de parâmetros (média geral)
τ - representa o efeito do -ésimo tratamento com τ =0
= g 1 n População 1: X11,X12,...,X1n1 Pop. 2: X21,X22,...,X2n2 Pop. g: Xg1,Xg2,...,Xgng
Para uma população genérica :
= jp j j j p x x x 2 1 1 X
Os erros para os componentes de Xj são correlacionados, mas a matriz de covariância é a mesma para todas populações. HOMOGENEIDADE.
Um vetor de observações pode ser decomposto como sugerido pelo modelo
(
x x)
(
x x)
x
x j = + − + j − (*)
(
multivariaobservaçãoda)
médiageral,amostralµµµµˆ efeitoestimado,detratamentoτˆ jresíduo
eˆ
A decomposição em (*) conduz ao análogo multivariado da soma de quadrados univariado. Primeiro notemos que para o produto cruzado
(
x −x)(
x −x)
′j j
(
)
(
)
[
− + −]
⋅[
(
−)
+(
−)
]
′ = x j x x x x j x x x(
−)(
−) (
′ + −)
(
−)
′+ = x j x x j x xj x x x(
−)
(
−)
′ +(
−)(
−)
′ + x x x j x x x x xA soma sobre j das duas expressões centrais produz a matriz nula porque
(
)
= = − n 1 j j 0 x x .
Assim, somando os produtos cruzados sobe e j temos:
(
)(
)
(
)(
)
(
)(
)
= = = = = ′ − − + ′ − − = ′ − − n 1 j j j g 1 g 1 n 1 j j j g 1 n x x x x x x x x x x x xA soma de quadrados e produtos cruzados residual pode ser expressa como
(
)(
)
= = ′ − − = n 1 j j j g 1 W x x x x(
n1−1)
S1+(
n2 −1)
S2 +...+(
ng −1)
Sg =onde S - matriz de covariâncias residual amostral para a -ésima amostra ou
(tratamento).
Quadro da MANOVA para comparar vetores de médias de populações
Fonte de Variação Matriz de soma de quadrados e
produtos cruzados (SQPC) Graus de Liberdade
Tratamento
(
)(
)
′ − − = = x x x x g 1 n B g−1 Resíduo(
)(
)
= = ′ − − = n 1 j j j g 1 W x x x x g n g 1 − =Total (corrigido para a
média)
(
)(
)
= = ′ − − = + n 1 j j j g 1 W B x x x x g n 1 1 − =Obs.: Os graus de liberdade correspondem ao caso univariado e as distribuições multivariadas teóricas envolvem a densidade de Wishart.
soma de quadrados e produtos cruzados total (corrigida) soma de quadrados e produtos cruzados de tratamentos (entre) soma de quadrados e produtos cruzados residual (dentro)
TESTE DE HIPÓTESE 0 = = = = g
H0 :ττττ1 ττττ2 ... ττττ envolve a variância generalizada
Critério de Rejeição: Rejeitamos H se a razão de variâncias generalizadas 0 Λ de Wilks é *
muito pequena
(
)(
)
(
)(
)
= = = = ′ − − ′ − − = + = Λ n 1 j j j g 1 n 1 j j j g 1 * W B W x x x x x x x x Exercícios: 6.16 e 6.17 pag. 275, 276DISTRIBUIÇÕES EXATAS DO LAMBDA DE WILKS
No. de Variáveis No. de grupos Distribuição amostral para dados multinormal
1 = p (caso univariado) 2 ≥ g Λ Λ − − − − −1, n g g * * F ~ 1 1 g g n 2 = p g≥2 ( )g 1,2( n g 1) 2 * * F ~ 1 1 g 1 g n − − − Λ Λ − − − − 1 ≥ p g =2 Λ Λ − − − − − 1p n , p * * F ~ 1 p 1 p n 1 ≥ p g =3 ( ) Λ Λ − − − − − 2p n 2 , p 2 * * F ~ 1 p 2 p n
Bartlett mostrou que sob H verdadeira e 0 n = grande n
(
)
(
)
+ + − − − = Λ + − − − W B W g p n g p n ln 2 1 ln 2 1 *tem aproximadamente uma distribuição 2( ) 1
− g p χ
(
)
( )( )
α χ2 1 ln 2 1− + + > − − − pg W B W g p né o
(
100α)
−ésimo percentil superior da qui-dradrado com p(
g−1)
gl.TESTE GENERALIZADO DE BARTLETT (Homogeneidade de Matrizes de Cov.) = = = 2 g 1 ... : 0 H (Homog.) : 0
H pelo menos uma i difere das demais (Heterog.)
(
)
= = − − − = g 1 combinada g 1 Ln 1 n Ln g n S S M(
)
(
+)(
−)
− − + − = = = − g 1 g 1 2 1 n 1 n 1 1 g 1 p 6 1 p 3 p 2 1 C ( ) ( ) 2 1 1 2 1 1 ~ + − − p p gMC χ (Note: p(p+1)/2 é a contagem de var-cov de )
onde
(
)
(
)
(
)
= − = − + + + − + + − + − = g 1 g 2 1 g g 2 2 1 1 combinada g n W g n ... n n 1 n ... 1 n 1 n S S S SANÁLISE MULTIVARIADA DE DADOS EXPERIMENTAIS
Seja o modelo p n p 1 I n p X B E Y = + + n ⊗ = = )) ( vec ( Var I ) ( Var ) ( E Y Y XB Y onde:
Y - contém n observações aleatórias sobre p variáveis dependentes B - matriz de parâmetros desconhecidos
E - matriz de erros aleatórios tais que cada linha de E é um vetor normal p-variado com
vetor de média zero e matriz de covariância
p p .
- é assumida positiva definida.
X - matriz de delineamento, de zeros e uns. Posto (X) = r < I +1
A solução das equações normais X’XB=X’Y não é única. A solução de mínimos quadrados
é dada por:
( )
( )
XX XY Bˆ g = ′ − ′que depende de uma particular escolha da inversa generalizada. Como resultado, a matriz B
não é unicamente estimável. Quadro de dados estruturados
Tratamentos VAR1 VAR2 ... VARp
1 y 111 121 y 1 1J1 y 112 y 122 y 2 1J1 y ... ... ... p y11 p y12 p J y11 2 y 211 221 y 1 2J2 y 212 y 222 y 2 2J2 y ... ... ... p y21 p y22 p J y2 2 ... ... ... I y I11 21 I y 1 IJI y 12 I y 22 I y 2 IJI y ... ... ... p I y 1 p I y 2 p IJI y Observação genérica: yiji i = 1, 2, ..., I (tratamentos)
ji = 1, 2, ..., Ji (no. de amostras no i-ésimo tratamento)
Seja
( )p×1i
ij
Y um vetor de observações no i-ésimo tratamento e ji-ésima amostra.
= = i i J j I i ,..., 2 , 1 ,..., 2 , 1 = p y y y 11 112 111 11 Y Assumindo que i ij i i ij e Y = + + + + + p p ip p i i p p i ij ~ N , 1 2 2 1 1 τ µ τ µ τ µ Y onde
- é a matriz de covariâncias de ji observações subamostrais. ip
τ - é o efeito do i-ésimo tratamento na -ésima variável.
O modelo fica:
(
yiji1,yiji2,...,yijip)
=(
µ+τi1,µ+τi2,...,µ +τip)
+(
εiji1,εiji2,...,εijip)
= = i i J j I i ,..., 2 , 1 ,..., 2 , 1 Assim, µ τ1 τ2 τI p IJ I J J n p IP I I p p p I I n p IJ I J J n I I ′ ′ − − − − − − ′ ′ − − − ′ ′ + ⋅ − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − − = ′ ′ − − − − − − ′ ′ − − − ′ ′ + + y y y y y y 1 2 21 1 11 2 1 2 22 21 1 12 11 2 1 1 1 1 2 21 1 11 2 1 2 1 1 0 0 1 1 0 0 1 0 1 0 1 0 1 0 1 0 0 1 1 0 0 1 1 τ τ τ τ τ τ τ τ τ µ µ µ= = I i i J n 1 onde = i ij ε 1 2 1 p ij ij ij p i i i ε ε ε