INSTITUTO DE INVESTIGAÇÃO E FORMAÇÃO AVANÇADA ÉVORA, FEVEREIRO DE 2013 ORIENTAÇÃO: Prof.ª Doutora Dulce Gamito Santinhos Pereira
CO-ORIENTAÇÃO: Prof. Doutor João Tiago Praça Nunes Mexia
Tese apresentada à Universidade de Évora para obtenção do Grau de Doutor em Matemática Especialidade: Matemática e Aplicações
Victor Ramos Tavares
ANÁLISE CONJUNTA DE REGRESSÕES
AJUSTAMENTO E ZONAGEM AGRÍCOLA
Contactos:
Universidade de Évora
Instituto de Investigação e Formação Avançada - IIFA
Palácio do Vimioso | Largo Marquês de Marialva, Apart. 94 7002-554 Évora | Portugal Tel: (+351) 266 706 581 Fax: (+351) 266 744 677 email: [email protected] ANÁL IS E CO NJ UNT A D E RE G RE S S Õ E S V ic tor R am os T av ar es
i
À Professora Doutora Dulce Gamito Santinhos Pereira e ao Professor Catedrático, Doutor João Praça Nunes Mexia, meus Orientadores, a quem reconheço pelo grande empenho na orientação durante a elaboração deste trabalho.
Ao IPAD, atualmente Instituto Camões pela conceção da Bolsa de Estudo
ii
A Análise conjunta de regressões, ACR, é uma técnica utitilizada para estudar a interação gentipo x ambiente baseada em regressões.
Nesta técnica ajusta-se uma regressão linear por cultivar. Nestas regressões a variável controlada é o índice ambiental que mede a produtividade dos vários ambientes. Nas culturas anuais, os ambientes compreendem aos pares (local, ano). Os valores dos índices ambientais e dos coeficientes das regressões são ajustados simultaneamente.
Até agora a ACR tem sido aplicada a uma única cultura de cada vez. Neste trabalho vamos procurar ultrapassar essa limitação através da modelação dos logaritmos dos índices ambientais tendo-se desenvolvido um modelo da forma:
n
J
n
i
l
v
z
i,j
j
j,
1
,...,
,
1
,...,
onde zi,jé o logaritmo do índice ambiental para o i-essimo ambiente na jessima
cultura ,
v
um valor médio geral ,l
i o efeito do iessimolocal e
j o efeito doessimo
j cultivar.
Ao utilizar esta modelação, os locais corresponderão a estações experimentais de forma a poder-se ter várias culturas no mesmo local. Ora, as estações experimentais são escolhidas por forma a serem representativas das regiões onde estão implantadas.
Assim, os índices ambientais correspondentes às várias estações experimentais e, consequentemente, às respetivas regiões, pudesse ser utilizados para agrupar regiões contíguas com índices semelhantes obtendo-se assim, um elemento interessante para a Zonagem agrícola no que diz respeito às culturas que se trabalha. Pode-se ainda procurar uma Zonagem para grupos de cultivares. Por exemplo, adiante trabalharemos com dados da cevada e trigo os quais são cereais.
iii
Joint Regression Analysis. Adjustment and Agricultural Zoning.
Joint Regression Analysis, JRA, is one of the techniques for the study of genotypeXenvironment interaction based on the use of regressions .In JRA a linear regression of the yields of each cultivar on a controlled variable, the environment index ,is adjusted .The index miss erasures the productivity of each environment .In yearly cultures the environments correspond to the pairs (location ,years) .These indexes and the correlation coefficients are adjusted simultaneously.
Up to now JRA has been applied to single crops .Now we try to overcome this restriction through modeling of the logarithms of the environmental indexes .We developed a model J J b i l v j j j i, = + +λ , =1,..., , =1,... τ
where τi,j is the logarithm of the environmental index for the i-th environment and
the j-th crop ,v is the general mean ,li is the effect of the i-th environment and λj is the effect of the j-th crop .
When applying this model the location will correspond to experimental situations in order to have several crops in the same locations .Now experimental stations are chosen
to be representative of the regions in which they are located .Then the l ,...,1 lb
can be used to group contiguous regions with similar location effects .We thus get an useful tool for Agricultural Zoning for the crops we used or, even, for the group to which those crops belong . For instance we worked with barley and wheat that are cereals.
iv j Número de cultivares b Número de blocos
j j
j j
~ , ~, Vetores dos coeficientes e coeficientes
ajustados para as regressões
t A Transposta da matriz A 1 A Matriz inversa de A
A Matriz inversa de Moore-Pemrose de A
s r
0 Matriz nula de ordem rs
n
I Matriz identidade de ordem n
X Matriz X
Y Matriz Y
B Matriz B
j i
p. Peso atribuído ao j-essimo cultivar no
i-essimo bloco
Acar Característica da matriz A
Norma euclidiana
Complemento ortogonal de
) (S
grad Gradiente da função S
Apr Probabilidade do acontecimento A
2 ,
g Distribuição Qui-quadrado central com g
graus de liberdade 2
0 ,
g
Distribuição Qui-quadrado central com g
graus de liberdade e parâmetro de não centralidade
zr sF , Distribuição F central com r es graus de
liberdade
zr, s,
F Distribuição F central com r es graus de
liberdade e parâmetro de não centralidade
zr, s,
F Quociente de dois qui quadrados
independentesr2
es2g r q
f1 ,, Valor crítico da distribuição Fao nível de
significância q comr e g graus de liberdade
g r q
f1 ,, Quantil de probabilidade 1q da
distribuição de quociente de dois qui-quadrados centrais e independentes com
g
r e graus de liberdade, 2 2
e g r
v
amplitude Studentizada, comr eg graus de liberdade
Var Variância
~ Distribui-se como
Produto de Kronecker
Soma direta ortogonal de matrizes
ln Logaritmo natural
r rs
D 1,..., Matriz diagonal ss cujos elementos da diagonal principal correspondem a r ,...,1 r
Hess Matriz Hessiana
,2
N Normal de valor médio e variância 2
Espaço paramétrico total
Matriz da covariância
dim Dimensão de um sub-espaço
AR Espaço imagem da matriz A
A
R Complemento ortogonal do espaço
imagem da matriz A
2
R Coeficiente de determinação
n
R Espaço Euclidiano de dimensão n
ANOVA Análise da variância
ACR Análise Conjunta de Regressões
D Demonstração X Variável aleatória x Vextor aleatório X Matriz aleatória X Xt Matriz cruzada
vi 45 66 69 69 79 80 80 81 Tabela 3b Regressões para a cultura do trigo
Tabela 4 Índices ambientais ajustados
Tabela 5 Coeficiente de correlação de SPEARMAN Tabela 6 Logarítmos dos indices ambientais e seus totais Tabela 7 Quadro resumo da ANOVA para a aplicação Tabela 1 valores de
Tabela 2 Quadro resumo da ANOVA Tabela 3a Regressões para a cultura da cevada
vii 35 60 70 70 71 71 72 72 73 73 74 75 75 76 76 77 77 78 78 79 Fig.1 Gráfico do contorno superior
Fig. 3 Regressões no local BR da cevada Fig. 2 Distribuição " t" central
Fig. 16 Regressões no local CHT do trigo Fig. 17 Regressões no local UHO do trigo Fig. 18 Regressões no local LED do trigo Fig. 19 Regressões no local LIP do trigo Fig. 20 Regressões no local VER do trigo Fig. 10 Regressões no local LIP da cevada Fig. 11 Regressões no local VER da cevada Fig. 12 Regressões no local BR do trigo Fig. 13 Regressões no local CAS do trigo Fig. 14 Regressões no local HE do trigo Fig. 15 Regressões no local HRA do trigo Fig. 4 Regressões no local CAS da cevada Fig. 5 Regressões no local HE da cevada Fig. 6 Regressões no local HRA da cevada Fig. 7 Regressões no local CHT da cevada Fig. 8 Regressões no local UHO da cevada Fig. 9 Regressões no local LED da cevada
viii
1Introdução... 1
2 Resultados preliminares ... 2
2.1 Matrizes ... 2
2.1.1Generalidades ... 2
2.1.2 Matrizes simétricas e de projeção ortogonal ... 3
2.1.3 Produto de Kronecker de matrizes ... 6
2.2 Estimadores dos mínimos quadrados ... 8
2.3 Vetores normais ... 9
2.3.1 Momentos e funções geradoras ... 9
2.3.2 Transformações lineares ... 15
2.3.3 Distribuições associadas ... 18
2.3.4 Teorema de Scheffé ... 24
2.3.5 Partição ortogonal ... 27
2.3.6 Cruzamento de fatores ... 29
3Análise Conjunta de Regressões – ACR ... 31
3.1 Aspetos preliminares ... 31 3.2 Contorno superior ... 35 3.3 Estabilidade ... 37 4. Índices Ambientais ... 47 4.1 Generalidades ... 47 4.2 Ajustamento ... 48 4.3 Inferência ... 53 4.4 Análise da variância ... 62 4.5 Zonagem agrícola ... 66 5 Aplicações ... 67 5.1Generalidades ... 67
5.2 Análise conjunta de regressões ... 67
5.3 Seleção do caso a tratar ... 80
5.4 Zonagem agrícola ... 81
6 Conclusão ... 82
1Introdução
A Análise Conjunta de Regressões, ACR, é ver Aastveit & Mejza (1999), uma das téc-nicas utilizadas no estudo da interação genótipo X ambiente. Entre essas téctéc-nicas a ACR baseia-se, como o seu nome indica, no ajustamento de regressões lineares, uma por cul-tivar (genótipo), do rendimento numa variável controlada, o índice ambiental. Este índi-ce mede a capacidade produtiva dos vários ambientes para os quais se têm resultados. No caso de culturas anuais esses ambientes são dados pelos pares (local, ano).
O objetivo central do nosso estudo incidirá sobre o índice ambiental. Procuraremos en-contrar medidas da capacidade produtiva que permitam considerar simultaneamente várias culturas, ultrapassando assim a utilização normal de se aplicar a ACR apenas na comparação de genótipos de uma única cultura.
No capítulo 2 apresentamos resultados preliminares relativos a:
Matrizes;
Estimadores dos mínimos quadrados;
Vetores normais que nos serão úteis.
Segue-se o capítulo 3 em que apresentamos os aspetos fundamentais da ACR de forma a fundamentar o estudo dos índices ambientais. Esse estudo é levado a efeito no
capítu-lo 4 apresentando-se um modecapítu-lo linear para os capítu-logaritmos dos índices ambientais de
forma
n
j
n
i
l
v
z
i i j j,
1
,...,
;
1
,...,
,
,onde vpode ser interpretado como um valor médio geral, licomo o efeito do i-essimo, ambiente, i1,...,n e jcomo o efeito da j-essima cultura, j1,...,n.
Veremos :
Quando um modelo destes se ajusta;
Caso se ajuste como realizar a inferência para o mesmo;
Aplicaremos os nossos resultados no capítulo 5 a dados fornecidos pelo Instituto Cen-tral de Melhoramento Vegetal da República Checa.
A aplicação será feita em duas fases:
Numa primeira fase utilizaremos os resultados da ACR clássica;
Na segunda fase utilizaremos o modelo logaritmo.
2 Resultados preliminares
2.1 Matrizes
2.1.1Generalidades
Restringir-nos-emos a matrizes reais, isto é, cujos elementos são números reais. Sendo
A
uma matriz de nm,ai,jserá o elemento deA
utilizado na i-esima linha e na j-esima coluna, i1,...,n;j1,...m, pondo-se A[ai, j]A norma euclidiana de
A
será
n i m j ai j A 1 1 2 , , se
a am
A 1 ... ter-se-á
m j aj A 1 2 2com v a norma euclidiana do vetor v
As matrizes quadradas terão tantas linhas quanto as colunas e se A[ai, j]for quadrada
n
n os a1,1...an,nsão os respetivos elementos principais. Se os únicos elementos não nu-los de
A
forem diagonais poremos
a ann
D
A 1,1... ,
s r r s A A A A A , 1 , , 1 1 , 1 ... ... em particular tem-se
r
r A A D A A A ,..., ... 0 0 ... 1 1 quando rs e as únicas sub -matrizes não nulas têm índices iguais, dizemos então que
A
é diagonal por blocos.2.1.2 Matrizes simétricas e de projeção ortogonal
Uma matriz quadrada M é simétrica se
M Mt
, isto é, com M [mi, j] , se tiver mi,j mj,i,i1,...,n;j1,...,n, quando M é nxn. Por outro
lado uma matriz quadrada P nxné ortogonal se
n T T I P P PP
onde In é a matriz identidade de ordem n
Uma matriz quadrada nxn Aé invertível se e só se existir uma matrizA1tal que
I A A A
A 1 1
Vê-se que A1 são quadradas nxn.Aliás uma matriz P nxné ortogonal se e sé se for invertível e se tiver
P1Pt
Observe-se, ver por exemplo Schott (1997) que sendo M simétrica, existe Pmatriz or-togonal tal que
r r
P DP
,onde D ...
r1 rn
é a matriz diagonal cujos elementos principais r ...1 rn são os valorespró-prios de M . Os vetores linha de Pserão os vetores próprios de Massociados aos valo-res próprios com os mesmos índices.
No que segue necessitaremos de alargar a noção de matriz inversa. Moore levantou a questão de dada uma matriz A , não necessariamente quadrada, existir uma matriz Atal que
A A A A AA AA A AA A A A AA t t,tendo Pemrose mostrado que A, a inversa de MOORE PEMROSE de A,existe sempree é única, ver Pollock (1979). Se Afor invertível ter-se-á A A1
Tendo-se em geral
t tA A
pelo que, se Afor simétrica, A será simétrica.
Se M for simétrica tendo-se
r r
P DP
M t 1...n
é fácil de verificar que
r r
P D P M t 1...n ,com 0 0 0, 1 j j j j j r se r r se r rPor outro lado dado um sub-espaço de Rno respetivo complemento ortogonal é formado por todos os vetores ortogonais a , dizendo-se que vRn é ortogonala se
z z
z
com z ez.Tem-se ainda,
Q z z z Q z,com Q
e Q
as matrizes de projeção ortogonal sobre e vendo-se que
Q I
Q n .
Mostra-se ver, Schott (1997) , que Qé matriz de projeção ortogonal, sobre o seu espaço
imagem R
Q,se e só se for simétrica e idempotente.De
r r
P DP
Q t 1...n
e de Qser idempotente tira-se rj 0 ou rj 1,j1,...,n, e, consequentemente,
.
Q
Q
Duas matrizes de projeção ortogonal são mutuamente ortogonais, Q1Q2se Q1Q2 0
logo se os vetores linha de Q1forem ortogonais aos vetores coluna de Q2. Como Q1 Qe 2
são simétricas os seus vetores linha são os seus vetores coluna. Ora os vetores de
Q1
RQ2
R são combinações lineares de vetores coluna deQ1
Q2 assim, se Q1Q2os vetores de R
Q1 serão ortogonais aos de R
Q2 pondo-se
Q1 R
Q2R .
Observe-se que se Q1Q2, então Q1Q2 é simétrica e idempotente, logo matriz de pro-jeção ortogonal já que
No que segue famílias de matrizes de projeção ortogonal mutuamente ortogonais de-sempenharão um papel importante já que os seus espaços imagens são mutuamente or-togonais, tendo-se
j m j m j j RQ Q R 1 1
onde indica uma soma direta ortogonal de sub-espaços. Então todo o vetor
m j j Q R z 1tem uma e uma só representação
m j j z z 1 com zR
Qj j1,...,m,e onde os vetores z ...1 zmmutuamente ortogonais.2.1.3 Produto de Kronecker de matrizes
Este produto de matrizes tem importantes aplicações em Estatística tendo sido estu-dado em detalhe, veja-se por exemplo Steeb (1991), Graham (1981) e Steeb &Hardy (2011).
Dadas a matrizes A[ai, j] do tipo mxn e B, temos
B a B a B a B a A n n m n , 1 , , 1 1 , 1 , , B
o produto não é comutativo mas é associativo, isto é,
B C
A B
C A B CA
e goza ainda da propriedade distributiva, tendo-se
AB
CD
ACADBCBD. Sendo um escalar tem-se
A B
AB
A
B e, se C1C2 e D1D2estiverem definidas, também se tem
C1D1
C2D2
C1C2
D2D2
.Vê-se ainda que
t t t B A B A ,logo se A e Bforem simétricas ABserá simétrica e que seU eVforem idempotentes
UV
UV
UU VV UVV
U é indempotente . Assim o produto de matrizes de projeção ortogonal dá matri-zes de projeção ortogonal.
Por outro lado
B A B B B A A A B A B A B A B A B B B A A A B A B A B A E como
AB
AB
AA BBe com AA e BB matrizes de projeção ortogonal, logo simétricas, vem
B A B A B A B A tDa mesma maneira vê-se que
AB AB
t
AB
AB
Estabelecemos assim a Proposição 1.2 Tem-se
B A B A2.2 Estimadores dos mínimos quadrados
Dado um vetor aleatório y com vetor médio
X
G
, é estimável se se tiver um estimador linear
Y M
*
centrado de . Ora o vetor médio de*é
* M M X ,
tendo pois de se ter para todo o ,
M X G o que se verifica se e só se MX G
,por outro lado a matriz
t t X X X X T é simétrica e idempotente sendo a matriz de projeção ortogonal sobre o espaço imagem
XR
,da matriz do modelo. Assim
XtX XtY
~
Y T X~ minimiza
~ 2 Y X S visto ter-se
2
2 2 2 ~ ~ ~ ~ X X Y X X Y X Yatendendo a YX~ e a X
~- serem ortogonais.A partir de~obtém-se para os vetores estimáveis os estimadores de mínimos quadrados
~G~.
2.3 Vetores normais
2.3.1 Momentos e funções geradoras
Nesta alínea basear-nos-emos na apresentação de Mexia (1995) onde se podem encon-trar as demonstrações dos resultados que agora se apresentam.
Dado um vetor aleatório
k x x X 1
cujos componentes têm valores médios 1,...,ko vetor médio E
X será k 1
Dada a linearidade do operador
E
é fácil verificar que
A
X
b
AE
X
b
Dada ainda uma matriz aleatória X [Xi, j] cujos elementos têm valores médios s j h i j i, 1,..., , 1,...,
ter-se-á a matriz média
X [ i, j]E
tendo-se
AX B
AE
X BE
já que com A[al,h] uma matriz mh e Buma matriz ms , se tem
r h s m s h h m r h m h h m r h r h s s h h h h b X a b X a b X a b X a B X A 1 , , , 1 1 , 1 , , 1 1 , 1 , , 1 1 , 1 1 , , 1 ,vindo
r h s m s h h m r h m h h m r h r h s s h h h h b a b a b a b a B X A E 1 , , , 1 1 , 1 , , 1 1 , 1 , , 1 1 , 1 1 , , 1
X B AE .Estabelecemos a expressão de E
AX B
para exemplificar a técnica seguida para obter este tipo de resultado.Analogamente tem-se
AX B
AE
X BE
Recordemos agora que dado o par
X ,Y
de variáveis aleatórias a respetiva covariância é
X E X Y EY
E
XY E X EYe se X e Yforem independentes, tem-se
XE X YEY
E
XE
X
E
YE
Y
0E
,visto o valor médio de produto de variâncias aleatórias independentes ser o produto dos valores médios, e
XE X
E X E X 0E
Estas expressões generalizam-se para pares de vetores aleatórios
X ,Y
sendo a respeti-va matriz de corespeti-variância cruzada
X Y
E
XE
X
YE
Y
, vendo-se que
t Y X X Y, , Caso X e Yforem independentes as suas componentes são independentes, vindo
rsY, X 0
,com r e sos números de componentes de X e Y.
Mostra-se ainda que
t B X Y A Y B X A , , caso X Y tem-se a matriz da covariância
X E
XE
X
XE
X
t
X,X
,vendo-se que
t t A X A A X X A X A X A X A ; ; Recordemos que para a variável aleatória Xse tem a função geradora de momentos
uX X u Eeque, se estiver definida num intervalo aberto contendo a origem é indefinidamente deri-vável na origem, tendo-se
X
u E r Xr
'
onde rindica a ordem da derivação. Observe-se que
au e e E e e E u X bu X au bu b aX u b aX Por outro lado se X1 e X2 forem independentes tem-se
1 2
2 1 2 1 uX uX X X u X X e e E e E u e, como E
euX1 e EeuX2 são independentes,tem-se
u
u e E e E u X X uX uX X X 2 1 2 1 2 1 , Por outro lado interessa-nos considerar ainda a função geradora de cumulantes
u X
uX
ln
obtendo-se, caso existam momentos de 2ª ordem, já queX
0 1
X Var X E X E X E X X X X X X X X X 2 2 2 2 ' '' '' ' ' ' 0 0 0 0 0 0 0 0 1 0 Estes resultados generalizam-se para os vetores aleatórios. A função geradora de mo-mentos de X será
u X X u E e t ,tendo-se
...
0 0 1 1 11 r X u j k j X k j j k u u X X E X caso X
u esteja definido num aberto contendo a origem. Vê-se ainda que, com
u X
u X ln se tem
X
j k E j X j 0, 1,..., ,onde jtemcomponentestodas nulas, salvo a j-essima que é 1. Assim
rad
0 u X u g X E ,onde grad indica o gradiente. Analogamente, dada a matriz hessiana
2 2 1 1 2 2 1 2 k X k X k X X X ess u u u u u u u u u u u H tem-se
0 u X ess u H X já que
u i k j k u u u u u u u u u u X l X i X l i X l i X ,..., 1 , ,..., 1 , 2 2 vindo
;
, 1,..., , 1,..., . 0 2 k j k i X X X E X E X X E u u u l i l i l i l i X Cov Por outro lado
A u e e E e e E u t X u b X a A b u b X A u b X A t t t t
t ,vindo
. u A u b u t X t b X A Tem-se ainda com X1 e X2 independentes
u
u e E e E e e E e E u X X X u X u X u X u X X u X X 2 1 2 t 1 t 2 t 1 t 2 1 t 2 1 vindo
u X
u X
u X X1 2 1 2 logo
2 1 2 1 2 1 2 1 X X X X X E X E X X Ecomo é fácil de se ver derivando a partir X X
u2 1
Supondo que X1 e X2são independentes, então 2 1 X X X terá, com 2 1 u u u
a função geradora de momentos
1 2
2 1 2 2 1 1 2 2 1 1 2 u u e E e E e e E e E e E u X X X u X u X u X u X t u X t u X t t t t c c 2.3.2 Transformações linearesIniciamos a nossa discussão dos vetores normais introduzindo resultados relativos a momentos e respetivas funções geradoras. Isto dado ao papel central que as funções geradoras de momentos têm na teoria dos vetores normais.
Um vetor aleatório Y com vetor médio e matriz da covariância Vé normal se tem função geradora de momentos
tu utVu e V u 2 1 ,
pondo-seY~
,V .Observa-se que V pode não ser invertível. Quando V é invertível, ver Mexia (1995), a densidade é
V e V y n n y V y t det 2 , 2 1 2 1,sendo n o número de componentes.
Estabeleçamos a Proposição 2.2 Caso Y~
,V tem-se
t
AVA b A b Y A ~ ,D: Começamos por observar que
t AVA b Y A b A b Y E A b Y A E ora,
t
u AVA u b A u u A V u A u A b t X b X A b b X AAVA
b
A
u
e
e
e
u
A
e
u
t t t t t t t,
2 1 2 1 t t
o que estabelece a tese. Corolário Se 2 , 2 1 , 2 2 , 1 1 , 1 2 1 2 1 , ~ V V V V Y Y Y tem-se
t t t t
A V A A V A A V A A V A A A Y A Y A1 1 2 2~ 11 22, 1 1,1 1 1 1,2 2 2 2,1 1 2 2,2 2Nota: Ao escrever a distribuição de Y está-se a indicar que Y tem vetor médio 2 1 Y com E
Yl ,l1,2, l e matriz de covariância 2 , 2 1 , 2 2 , 1 1 , 1 V V V V V ,onde V1,1
Y1,V1,2
Y1,Y2
,V2,1
Y2,Y1
e V2,2
Y2D: A tese resulta da proposição 2.2 e de
2 1 2 1 2 2 1 1 A A Y A Y A ,já que
1 1 2 2 2 1 2 1 A A A A ,e que
t t t t t t A V A A V A A V A A V A A A V V V V A A 1 1,1 1 1 1,2 2 2 2,1 1 2 2,2 2 2 1 2 , 2 1 , 2 2 , 1 1 , 1 2 1 ,atendendo-se a que
t t t A A A A 2 1 2 1Como vimos atrás, se Y1 e Y2 forem independentes tem-se
2
0Y1 , Y
Isto é a nulidade de Y
1 , Y2
é condição necessária de independência Y1 e Y2. No caso em que 2 1 Por outro lado temos ainda a Proposição 2.3 SeY1 e Y2forem independentes eY ~
,Vl ,l1,2 l l ,tem-se 2 1 2 1 2 1 0 0 , ~ V V Y Y Y D: com t 2 t 1 u u u tem-se
2 1 2 1 2 1 2 1 2 1 l t t l l t l l t l u V u u u V u u l Y Y Y e e u u u ,com V 2 1 2 1 0 0 V V ,o que estabelece a tese.
2.3.3 Distribuições associadas Suponhamos que n n n I Y Y Y ~ , 1 1
n i i Y Y 1 2 2,distribui-se como um qui-quadrado com ngraus de liberdade e parâmetro de não cen-tralidade, 2
n 1 i 2 i tendo-se
2 2 1 2 1 , n u u u e n u ,bem como
n
u
u u n u u n u 2 1 ln 2 2 1 2 2 2 1 ln 2 2 1 , ,logo 2 2 , Y n tem o valor médio e a variância
n n n n n n 2 '' 2 ' , 0 , , 0 ,Quando 0 o qui-quadrado diz-se central tendo-se
n n n n 2 0 0 2 , , Existem três pontos importantes a considerar. Suponhamos que se têm os qui-quadrados
independentes 2 , 2 ,1 2 2 1 v e v ,tem-se então
2 2 1 2 2 1 2 1 2 1 2 1 2 1 2 2 , 2 2 1 , 1 2 1 2 1 , n n u u n u u i l i i u n e u e n u i i n n Isto é, 22, 2 2 1 , 1 n e n distribuem-se como um 2 2 1 , 2 1 nn somando-se pois os graus
de liberdade e os parâmetros de não centralidade. Diz-se que há reprodutibilidade para graus de liberdade e parâmetros de não centralidade.
O segundo ponto é que
2 ,0
! 2 1 1 ! 2 1 0 0 2 2 2 2 1 2 j n u j e u j e u e n u j j j j n j n u
2 2 , 2 2 2 Daqui conclui-se que a distribuição G
n,
do 2 , n é dada por,
2 ,0
! 0 j n z G j e n G j j
2 , z 2 com G
m . ,0
a distribuição do qui-quadrado central com mgraus de liberdade. A densidade g
mz ,0
de m2é, ver Mexia (1995)
, z , z 2 z 0 , 2 2 1 0 0 ; 0 0 1 2 z e z m m g z m g m assim a densidade g
mz ,0
de 2 , m dada por
2 ,0
. ! 1 j m z g j e m g j j
2 , z 2 Diremos queG
mz ,
é dada por uma mistura com coeficientes 0,...! j j e j 2 2 das distribuiçõesG
z m2 j,0
. Observe-se que
z 2 ,0
;j 0,1... , z 2 2 2 z pr j m G z pr m G j m m tendo-se pois
0 2 2 2 0 2 2 , 0 , 2 z ! 2 ! 2 , z j j j m j j m j m G j e z pr j e z pr m G Pode admitir-se a existência duma variável indicatriz Ncom distribuição de POISSON com parâmetro 2 , logo tendo-se
, 0,1... ! j j e j N pr j 2 2 E, que quando
2 , ,m j N se distribui-se como m22j,0, j0,1... Sejam 2 , m e 2 g um par de quadrados independentes dos quais o segundo é um qui-quadrado central. Então
2 2 , g m m g f
tem, ver Mexia (1995) a distribuição Fcom m e ggraus de liberdade e parâmetro de
não centralidade , pondo-se f ~F
m,g,
. A distribuição Fdesempenha um papel central na teoria da estatística. No entanto a distribuição F
m, g,
de2 2 , g m T
é equivalente a anterior já que,
, , , , zm g g m F z g m T pr z f pr g m z Fe é mais manejável pelo que a utilizamos. Atendendo á distribuição do 2
,
m ser dada por uma mistura podemos agora escrever
T z
pr
N j
prT z n j
pr j
, 0 ,ora quando N j , 2 2 2 g j m T vindo
T zN j
F zm 2j,g,0
pr vindo
2 ,0
! 2 , , z 0 2 F zm j j e g m F j
bem como,
2 , , z , , 2 z 0 , , 2 ! 2 2 1 , , z 2 1 0 , , 2 ! 1 2 0 , , 2 ! 2 , , z 0 2 1 1 2 0 2 g m F g m F i m z F i e g m F g j m z F j e j m z F j e g m F i i j j j
Ora 2 , 2
m será a soma de dois qui-quadrados independentes 2 , m e 2 0 , g vindo 1 2 2 , 2 2 2 , g m g m pr ,e portanto,
, , 2 z , , 2 z 2 2 , 2 2 , 2 g m F z pr z pr g m F g m g m vindo
0 , , z g m FSuponhamos agora que se quer testar uma hipótese que pode ser escrita como
0 :
0
H contra as alternativas H1:0.
Se teremos uma estatística
, ,
~F zm g fpodemos substituí-la por
f g m T
já que, com "q"o valor crítico para um teste de nível qcom estatística f ,podemos pas-sar a utilizar o valor critico cq
g m
. Então a potência do teste com estatística T é
1 , , . c m g g m F cq g m T pr pot qvendo-se quePot
cresce com . Assim a probabilidade de se registar H0é sempre superior quando esta hipótese é falsa do que quando é verdadeira e o teste é estritamente não distorcidos.2.3.4 Teorema de Scheffé
Dado Z~
,V tem--se, ver Mexia (1995).
~ 2 2 c t z V z U com ccar
V.Assim se Z for independente de 2 2
~ g S , tem-se
, ,0
~ 0 g c z F c g F S U Sendo fp,c.go p-essimo quantil de F
zc, g,0
teremos
q f F pr g S f c z V z pr t t qcg qcg 1 , 1 , 1 Obtendo-se assim um elipsoide de confiança de nível1q para . Estabelecemos agora o
Teorema de Scheffé (1.2)
Indicando por
d
que se consideram todos os vetores com o mesmo número de
com-ponentes de tem-se q g S d V d f c Z d d pr d t cg q t t 1 , 1
D: Observa-se que quando d 0se tem a desigualdade trivial 00 pelo que nos basta considerar os d0. Cada um destes vetores é ortogonal a um par de planos paralelos tangentes ao elipsoide de confiança de nível 1qestando o ponto afim de entre esses planos se e só se, ver Scheffé (1959),
g S d V d f c z d dt t 1q,cg t
Para completar a demonstração basta-nos observar que um ponto está no interior de um elipsoide se e só se estiver entre todos os pares de planos paralelos tangentes ao elipsoi-de.
Observe-se que quando
Z d g S d V d f c 1q,r,g t t
a desigualdade correspondente a d não se pode verificar com
t
d
dizendo-se então que dt é significativamente diferente de ao nível q. Por outro lado o teorema de Scheffé dá-nos intervalos de confiança simultâneos
g S d V d f c Z d g S d V d f c Z d qrg t t t g r q t , , 1 , , 1 ; para os parâmetros
t d d tendo-se
d significativamente diferente de 0 ao nível q se e só se o intervalo de confiança para
d não contiver 0 .j i j i j i , 0 1 1 0 , tem-se
i,j ij;i j ,quando
i,j é significativamente diferente de 0 ao nível q ter-se-á, com probabili-dade do erro majorada por q,j i
Assim podemos, dado os intervalos de confiança serem simultâneo, com a probabilida-de probabilida-de estarmos certos não inferior a 1 q , afirmar que diferem todos os pares i;j tais que j i j i t j i g c q g S V f c 1 ,, , , Com n n n n v v v v V , 1 , , 1 1 , 1 tem-se j j j i i i j i t j i,V , v, 2v, v, .
2.3.5 Partição ortogonal Admitimos que Z
r In
2 , ~ é independente de ~ 02, 2 S tendo-se ainda uma partição
ortogonal j m j n R 1 com
m J Q car c m J Q R j j j j j ,..., 1 , dim ,..., 1 ,Seja Aj uma matriz cujos vetores linha constituem uma base ortonormada para
. ,..., 1 ,j m j . Tem-se então m J Q A A m J I A A j j t j j t j j ,..., 1 , ,..., 1 , e como m j Aj j , 1,..., tem-se ainda
I
j m Z A j g j j j ~ , , 1,..., ~ 2 independente de S,j1,...,m. Assim temos, ver Mexia (1995)
m j V j j g j j ~ , 1,..., ~ 2 , 2 2 ,com m J Vj 12 j 2, 1,...,
independente de S . Temos ainda, ver Mexia (1995) os 2 0 , 2 2 ~ ~ j g j j j V também independentes de S
teremos assim as
m j g g F S U g g T m j g g F S U g g F j j j j j j j j j ,..., 1 , 0 , , ~ ,..., 1 , , , ~ As estatísticas Fj,j1,...,m podem ser utilizadas para testar as hipóteses m
j H0,j:j 0, 1,...,
sendo 1q,g, o
1q
essimo quantil de F
gj, g,0
o mesmo será o valor crítico do testede nível qpara H0,j,j1,...,m. A potência deste teste
g g
F
f g g
j m Pot j j qg g j j j , , 1,..., 1 , 1, , cresce comj,j1,...,m já que
m j g g t F g g Pot j j j g g q j j j ,..., 1 , 0 , , , 1 ,0, pelo que os testes F para as H0,j,j1,...,mserão estritamente não distorcidos. Podemos no entanto testar, por dualidades hipóteses mais gerais. Assim
m j q g S f T pr g S f pr j j qgjg j qgjg 1 , 1...., ~ , , 1 , , 1 2
obtendo-se assim, para as jj1....,m, esferas de confiança de nível 1q. Ora quando
j
b não está aberto pela correspondente esfera de confiança temos
f t j m S b g S b F j qg g j j j j j j , 1...., ~ , , 1 2 ,logo se utilizarmos Fj
bj como estatística para testar
b b j mregeita-se esta hipótese. Como o nível de esfera de confiança é de 1qvê -se que obti-vemos, por dualidade, um teste de nível 1q.
2.3.6 Cruzamento de fatores
Interessa-nos considerar um caso como partição ortogonal. Suponhamos as componen-tes de Z correspondem às combinações de níveis de vários fatores, com a ...1 auníveis.
Então Z terá a j
i a
n1 componentes, e sendo os conjuntos de fatores os sub-conjuntos de u
1,...,u
cu estará associado o valor médio geral dos conjuntos de se c;
os efeitos dos níveis de único fator com índice em c se #
c 1; as interações entre os conjuntos de níveis de fatores em índices c se #
c 1.Podemos identificar os conjuntos de fatores com os respetivos índices
n c i j j c j 1
2 1, 1,...,2 Embora pudéssemos utilizar esses índices para ordenar as matrizes A temos, ver Fonse-ca et al (2003), as seguintes expressões
c X A
c A 2 l onde
l U c A l a c A A l l a l t a l l l , , 1 1 sendo l aU obtida retirando a primeira linha igual a t a l l a 1 1 duma matriz l a P ortogonal l l a a . Diremos que l a
P é matriz ortogonal estandartizada. Tem-se ainda
1
c l l a c A car c
,por exemplo podemos ter 2 1 2 1 2 U 6 1 6 2 6 1 2 1 0 2 1 3 U
Por outro lado o produto de matrizes ortogonais estandartizada dá matrizes ortogo-nais estandartizada. Assim Lpode ser obtido retirando a primeira linha a
2 2 2 8 P P P P Com 2 1 2 1 2 1 2 1 2 P
Se afor par, obtêm-se os vetores linha v ,...,1 va de Pa aplicando o processo de
ortonor-malização de Gram-Schimicht aos vetores 1 1a, 2,..., a1
a Recorde-se que
v
v
i a v v v v a v t i i i t i i l i i i i t i i l t a l l ,..., 3 , 1 1 1 1 2 2 1 1 1 1 1 2 2 2 1 2 2 1
Uma vez obtidas as matrizes A