Análise conjunta de regressões : ajustamento e zonagem agrícola

(1)

INSTITUTO DE INVESTIGAÇÃO E FORMAÇÃO AVANÇADA ÉVORA, FEVEREIRO DE 2013 ORIENTAÇÃO: Prof.ª Doutora Dulce Gamito Santinhos Pereira

CO-ORIENTAÇÃO: Prof. Doutor João Tiago Praça Nunes Mexia

Tese apresentada à Universidade de Évora para obtenção do Grau de Doutor em Matemática Especialidade: Matemática e Aplicações

Victor Ramos Tavares

ANÁLISE CONJUNTA DE REGRESSÕES

AJUSTAMENTO E ZONAGEM AGRÍCOLA

Contactos:

Universidade de Évora

Instituto de Investigação e Formação Avançada - IIFA

Palácio do Vimioso | Largo Marquês de Marialva, Apart. 94 7002-554 Évora | Portugal Tel: (+351) 266 706 581 Fax: (+351) 266 744 677 email: [email protected] ANÁL IS E CO NJ UNT A D E RE G RE S S Õ E S V ic tor R am os T av ar es

(2)

i

À Professora Doutora Dulce Gamito Santinhos Pereira e ao Professor Catedrático, Doutor João Praça Nunes Mexia, meus Orientadores, a quem reconheço pelo grande empenho na orientação durante a elaboração deste trabalho.

Ao IPAD, atualmente Instituto Camões pela conceção da Bolsa de Estudo

(3)

ii

A Análise conjunta de regressões, ACR, é uma técnica utitilizada para estudar a interação gentipo x ambiente baseada em regressões.

Nesta técnica ajusta-se uma regressão linear por cultivar. Nestas regressões a variável controlada é o índice ambiental que mede a produtividade dos vários ambientes. Nas culturas anuais, os ambientes compreendem aos pares (local, ano). Os valores dos índices ambientais e dos coeficientes das regressões são ajustados simultaneamente.

Até agora a ACR tem sido aplicada a uma única cultura de cada vez. Neste trabalho vamos procurar ultrapassar essa limitação através da modelação dos logaritmos dos índices ambientais tendo-se desenvolvido um modelo da forma:

n

J

n

i

l

v

z

_i_,_j





_j





_j

,



1 ,...,

,



1 ,...,

onde zi,jé o logaritmo do índice ambiental para o i-essimo ambiente na jessima

cultura ,

v

um valor médio geral ,

l

_i o efeito do iessimolocal e



j o efeito do

essimo

j cultivar.

Ao utilizar esta modelação, os locais corresponderão a estações experimentais de forma a poder-se ter várias culturas no mesmo local. Ora, as estações experimentais são escolhidas por forma a serem representativas das regiões onde estão implantadas.

Assim, os índices ambientais correspondentes às várias estações experimentais e, consequentemente, às respetivas regiões, pudesse ser utilizados para agrupar regiões contíguas com índices semelhantes obtendo-se assim, um elemento interessante para a Zonagem agrícola no que diz respeito às culturas que se trabalha. Pode-se ainda procurar uma Zonagem para grupos de cultivares. Por exemplo, adiante trabalharemos com dados da cevada e trigo os quais são cereais.

(4)

iii

Joint Regression Analysis. Adjustment and Agricultural Zoning.

Joint Regression Analysis, JRA, is one of the techniques for the study of genotypeXenvironment interaction based on the use of regressions .In JRA a linear regression of the yields of each cultivar on a controlled variable, the environment index ,is adjusted .The index miss erasures the productivity of each environment .In yearly cultures the environments correspond to the pairs (location ,years) .These indexes and the correlation coefficients are adjusted simultaneously.

Up to now JRA has been applied to single crops .Now we try to overcome this restriction through modeling of the logarithms of the environmental indexes .We developed a model J J b i l v j j j i, = + +λ , =1,..., , =1,... τ

where τi,j is the logarithm of the environmental index for the i-th environment and

the j-th crop ,v is the general mean ,l_i is the effect of the i-th environment and λ_j is the effect of the j-th crop .

When applying this model the location will correspond to experimental situations in order to have several crops in the same locations .Now experimental stations are chosen

to be representative of the regions in which they are located .Then the l ,...,1 l_b

can be used to group contiguous regions with similar location effects .We thus get an useful tool for Agricultural Zoning for the crops we used or, even, for the group to which those crops belong . For instance we worked with barley and wheat that are cereals.

(5)

iv j Número de cultivares b Número de blocos



j j







j j





~ , ~

, Vetores dos coeficientes e coeficientes

ajustados para as regressões

t A Transposta da matriz A 1  A Matriz inversa de A 

A Matriz inversa de Moore-Pemrose de A

s r

0 Matriz nula de ordem rs

n

I Matriz identidade de ordem n

X Matriz X

Y Matriz Y

B Matriz B

j i

p_. Peso atribuído ao j-essimo cultivar no

i-essimo bloco

 

A

car Característica da matriz A

Norma euclidiana 

 Complemento ortogonal de 

) (S

grad Gradiente da função S

 

A

pr Probabilidade do acontecimento A

2 ,

g Distribuição Qui-quadrado central com g

graus de liberdade 2

0 ,

g

 Distribuição Qui-quadrado central com g

graus de liberdade e parâmetro de não centralidade 

 

zr s

F , Distribuição F central com r es graus de

liberdade



zr, s,



F Distribuição F central com r es graus de

liberdade e parâmetro de não centralidade





zr, s,



F Quociente de dois qui quadrados

independentes_r2

 

 e_s2

g r q

f₁_ _,_, Valor crítico da distribuição Fao nível de

significância q comr e g graus de liberdade

g r q

f₁_ _,_, Quantil de probabilidade 1q da

distribuição de quociente de dois qui-quadrados centrais e independentes com

g

r e graus de liberdade, 2 2

e g r 

(6)

v

amplitude Studentizada, comr eg graus de liberdade

Var Variância

~ Distribui-se como

 Produto de Kronecker

 Soma direta ortogonal de matrizes

ln Logaritmo natural



r r_s



D ₁,..., Matriz diagonal ss cujos elementos da diagonal principal correspondem a r ,...,₁ r

Hess Matriz Hessiana



_,2



N Normal de valor médio  e variância 2

 Espaço paramétrico total

 Matriz da covariância

dim Dimensão de um sub-espaço

 

A

R Espaço imagem da matriz A

 



A

R Complemento ortogonal do espaço

imagem da matriz A

2

R Coeficiente de determinação

n

R Espaço Euclidiano de dimensão n

ANOVA Análise da variância

ACR Análise Conjunta de Regressões

D Demonstração X Variável aleatória x Vextor aleatório X Matriz aleatória X Xt Matriz cruzada

(7)

vi 45 66 69 69 79 80 80 81 Tabela 3b Regressões para a cultura do trigo

Tabela 4 Índices ambientais ajustados

Tabela 5 Coeficiente de correlação de SPEARMAN Tabela 6 Logarítmos dos indices ambientais e seus totais Tabela 7 Quadro resumo da ANOVA para a aplicação Tabela 1 valores de

Tabela 2 Quadro resumo da ANOVA Tabela 3a Regressões para a cultura da cevada

 





(8)

vii 35 60 70 70 71 71 72 72 73 73 74 75 75 76 76 77 77 78 78 79 Fig.1 Gráfico do contorno superior

Fig. 3 Regressões no local BR da cevada Fig. 2 Distribuição " t" central

Fig. 16 Regressões no local CHT do trigo Fig. 17 Regressões no local UHO do trigo Fig. 18 Regressões no local LED do trigo Fig. 19 Regressões no local LIP do trigo Fig. 20 Regressões no local VER do trigo Fig. 10 Regressões no local LIP da cevada Fig. 11 Regressões no local VER da cevada Fig. 12 Regressões no local BR do trigo Fig. 13 Regressões no local CAS do trigo Fig. 14 Regressões no local HE do trigo Fig. 15 Regressões no local HRA do trigo Fig. 4 Regressões no local CAS da cevada Fig. 5 Regressões no local HE da cevada Fig. 6 Regressões no local HRA da cevada Fig. 7 Regressões no local CHT da cevada Fig. 8 Regressões no local UHO da cevada Fig. 9 Regressões no local LED da cevada

(9)

viii

1Introdução... 1

2 Resultados preliminares ... 2

2.1 Matrizes ... 2

2.1.1Generalidades ... 2

2.1.2 Matrizes simétricas e de projeção ortogonal ... 3

2.1.3 Produto de Kronecker de matrizes ... 6

2.2 Estimadores dos mínimos quadrados ... 8

2.3 Vetores normais ... 9

2.3.1 Momentos e funções geradoras ... 9

2.3.2 Transformações lineares ... 15

2.3.3 Distribuições associadas ... 18

2.3.4 Teorema de Scheffé ... 24

2.3.5 Partição ortogonal ... 27

2.3.6 Cruzamento de fatores ... 29

3Análise Conjunta de Regressões – ACR ... 31

3.1 Aspetos preliminares ... 31 3.2 Contorno superior ... 35 3.3 Estabilidade ... 37 4. Índices Ambientais ... 47 4.1 Generalidades ... 47 4.2 Ajustamento ... 48 4.3 Inferência ... 53 4.4 Análise da variância ... 62 4.5 Zonagem agrícola ... 66 5 Aplicações ... 67 5.1Generalidades ... 67

5.2 Análise conjunta de regressões ... 67

5.3 Seleção do caso a tratar ... 80

5.4 Zonagem agrícola ... 81

6 Conclusão ... 82

(10)

1Introdução

A Análise Conjunta de Regressões, ACR, é ver Aastveit & Mejza (1999), uma das téc-nicas utilizadas no estudo da interação genótipo X ambiente. Entre essas téctéc-nicas a ACR baseia-se, como o seu nome indica, no ajustamento de regressões lineares, uma por cul-tivar (genótipo), do rendimento numa variável controlada, o índice ambiental. Este índi-ce mede a capacidade produtiva dos vários ambientes para os quais se têm resultados. No caso de culturas anuais esses ambientes são dados pelos pares (local, ano).

O objetivo central do nosso estudo incidirá sobre o índice ambiental. Procuraremos en-contrar medidas da capacidade produtiva que permitam considerar simultaneamente várias culturas, ultrapassando assim a utilização normal de se aplicar a ACR apenas na comparação de genótipos de uma única cultura.

No capítulo 2 apresentamos resultados preliminares relativos a:

 Matrizes;

 Estimadores dos mínimos quadrados;

 Vetores normais que nos serão úteis.

Segue-se o capítulo 3 em que apresentamos os aspetos fundamentais da ACR de forma a fundamentar o estudo dos índices ambientais. Esse estudo é levado a efeito no

capítu-lo 4 apresentando-se um modecapítu-lo linear para os capítu-logaritmos dos índices ambientais de

forma

n

j

n

i

l

v

z

_i _i _j j

,

1 ,...,

;

1 ,...,

,









,onde vpode ser interpretado como um valor médio geral, l_icomo o efeito do i-essimo, ambiente, i1,...,n e _jcomo o efeito da j-essima cultura, j1,...,n.

Veremos :

 Quando um modelo destes se ajusta;

 Caso se ajuste como realizar a inferência para o mesmo;

(11)

Aplicaremos os nossos resultados no capítulo 5 a dados fornecidos pelo Instituto Cen-tral de Melhoramento Vegetal da República Checa.

A aplicação será feita em duas fases:

 Numa primeira fase utilizaremos os resultados da ACR clássica;

 Na segunda fase utilizaremos o modelo logaritmo.

2 Resultados preliminares

2.1 Matrizes

2.1.1Generalidades

Restringir-nos-emos a matrizes reais, isto é, cujos elementos são números reais. Sendo

A

uma matriz de nm,a_i_,_jserá o elemento de

A

utilizado na i-esima linha e na j-esima coluna, i1,...,n;j1,...m, pondo-se A[ai, j]

A norma euclidiana de

A

será 

 

n_ _

i m j ai j A 1 1 2 , , se



a am



A ₁ ... ter-se-á



  m j aj A 1 2 2

com v a norma euclidiana do vetor v

As matrizes quadradas terão tantas linhas quanto as colunas e se A[ai, j]for quadrada

n

n os a₁_,₁...a_n_,_nsão os respetivos elementos principais. Se os únicos elementos não nu-los de

A

forem diagonais poremos



a ann



D

A ₁_,₁... _,

(12)

           s r r s A A A A A , 1 , , 1 1 , 1 ... ...   em particular tem-se



_r



r A A D A A A ,..., ... 0 0 ... 1 1              

quando rs e as únicas sub -matrizes não nulas têm índices iguais, dizemos então que

A

é diagonal por blocos.

2.1.2 Matrizes simétricas e de projeção ortogonal

Uma matriz quadrada M é simétrica se

M Mt 

, isto é, com M [mi, j] , se tiver mi,j mj,i,i1,...,n;j1,...,n, quando M é nxn. Por outro

lado uma matriz quadrada P nxné ortogonal se

n T T I P P PP  

onde I_n é a matriz identidade de ordem n

Uma matriz quadrada nxn Aé invertível se e só se existir uma matriz_A1_{tal que}

I A A A

A 1 1 

Vê-se que A1 são quadradas nxn.Aliás uma matriz P nxné ortogonal se e sé se for invertível e se tiver

P1Pt

Observe-se, ver por exemplo Schott (1997) que sendo M simétrica, existe Pmatriz or-togonal tal que



r r



P D

P

(13)

,onde D ...



r₁ r_n



é a matriz diagonal cujos elementos principais r ...₁ r_n_{são os valores}

pró-prios de M . Os vetores linha de Pserão os vetores próprios de Massociados aos valo-res próprios com os mesmos índices.

No que segue necessitaremos de alargar a noção de matriz inversa. Moore levantou a questão de dada uma matriz _A, não necessariamente quadrada, existir uma matriz Atal que

 

                      A A A A AA AA A AA A A A AA t t

,tendo Pemrose mostrado que A, a inversa de MOORE PEMROSE de A,existe sempree é única, ver Pollock (1979). Se Afor invertível ter-se-á _A __A1

Tendo-se em geral

   

t t

A A   

pelo que, se Afor simétrica, A será simétrica.

Se M for simétrica tendo-se



r r



P D

P

M  t ₁..._n

é fácil de verificar que



r r



P D P M t ₁..._n ,com            0 0 0, 1 j j j j j r se r r se r r

Por outro lado dado um sub-espaço  de Rno respetivo complemento ortogonal é formado por todos os vetores ortogonais a , dizendo-se que _v__Rn _{é ortogonal}_a __se

(14)



  

z z

z

com z_ ez_.Tem-se ainda,

 

           Q z z z Q z

,com Q

 

 e Q

 

 as matrizes de projeção ortogonal sobre  e vendo-se que

 

  

 



Q I

Q _n .

Mostra-se ver, Schott (1997) , que Qé matriz de projeção ortogonal, sobre o seu espaço

imagem R

 

Q,se e só se for simétrica e idempotente.

De



r r



P D

P

Q t ₁..._n

e de Qser idempotente tira-se r_j 0 ou r_j 1,j1,...,n, e, consequentemente,

.



Q

Q

Duas matrizes de projeção ortogonal são mutuamente ortogonais, Q₁Q₂se Q₁Q₂ 0

logo se os vetores linha de Q₁forem ortogonais aos vetores coluna de Q₂. Como Q₁ Qe ₂

são simétricas os seus vetores linha são os seus vetores coluna. Ora os vetores de

   

Q1



RQ2



R são combinações lineares de vetores coluna deQ₁

 

Q₂ assim, se Q₁Q₂os vetores de R

 

Q₁ serão ortogonais aos de R

 

Q₂ pondo-se

 

Q1 R

 

Q2

R  _.

Observe-se que se Q₁Q₂, então Q₁Q₂ é simétrica e idempotente, logo matriz de pro-jeção ortogonal já que

(15)

No que segue famílias de matrizes de projeção ortogonal mutuamente ortogonais de-sempenharão um papel importante já que os seus espaços imagens são mutuamente or-togonais, tendo-se

 

j m j m j j RQ Q R ₁ 1            



onde indica uma soma direta ortogonal de sub-espaços. Então todo o vetor

        



 m j j Q R z 1

tem uma e uma só representação



  m j j z z 1 com zR

 

Q_j j1,...,m,e onde os vetores z ...₁ z_mmutuamente ortogonais.

2.1.3 Produto de Kronecker de matrizes

Este produto de matrizes tem importantes aplicações em Estatística tendo sido estu-dado em detalhe, veja-se por exemplo Steeb (1991), Graham (1981) e Steeb &Hardy (2011).

Dadas a matrizes A[ai, j] do tipo mxn e B, temos

            B a B a B a B a A n n m n , 1 , , 1 1 , 1 , ,     B

o produto não é comutativo mas é associativo, isto é,



B C

 

A B



C A B C

A       

e goza ainda da propriedade distributiva, tendo-se



AB

 

 CD



ACADBCBD. Sendo  um escalar tem-se

 

A B



AB



A

 

B e, se C₁C₂ e D₁D₂estiverem definidas, também se tem



C₁D₁



C₂D₂

 

 C₁C₂

 

 D₂D₂



.

(16)

Vê-se ainda que





t t t B A B A  

,logo se A e Bforem simétricas ABserá simétrica e que seU eVforem idempotentes



UV



UV

    

 UU  VV UV

V

U é indempotente . Assim o produto  de matrizes de projeção ortogonal dá matri-zes de projeção ortogonal.

Por outro lado













 











 





                               B A B B B A A A B A B A B A B A B B B A A A B A B A B A E como



_A__B





_A__B

    

_ _A_A _ _B_B

e com AA e BB matrizes de projeção ortogonal, logo simétricas, vem









_ _ 



_



_





_ 



B A B A B A B A t

Da mesma maneira vê-se que











AB AB



t



AB





AB



Estabelecemos assim a Proposição 1.2 Tem-se



_



 _ _  B A B A

(17)

2.2 Estimadores dos mínimos quadrados

Dado um vetor aleatório y com vetor médio



 X



 G

, é estimável se se tiver um estimador linear

Y M

 *



centrado de . Ora o vetor médio de*é

 

  

 * M M X ,

tendo pois de se ter para todo o ,

  M X G  o que se verifica se e só se MX G

,por outro lado a matriz

 

t t X X X X T 

é simétrica e idempotente sendo a matriz de projeção ortogonal sobre o espaço imagem

 

X

R

 

,da matriz do modelo. Assim

 

XtX XtY



~

(18)

Y T X~ minimiza

 

_~ 2   Y X S   visto ter-se



 







2





2 2 2 ~ ~ ~ ~                 X X Y X X Y X Y

atendendo a YX~ e a X

 

~- serem ortogonais.

A partir de~obtém-se para os vetores estimáveis os estimadores de mínimos quadrados



~__G~_.

2.3 Vetores normais

2.3.1 Momentos e funções geradoras

Nesta alínea basear-nos-emos na apresentação de Mexia (1995) onde se podem encon-trar as demonstrações dos resultados que agora se apresentam.

Dado um vetor aleatório

           k x x X  1

cujos componentes têm valores médios ₁,...,_ko vetor médio E

 

X será

           k     1

Dada a linearidade do operador

E

é fácil verificar que



A

X

b



AE

 

X

b

(19)

Dada ainda uma matriz aleatória X [Xi, j] cujos elementos têm valores médios s j h i j i, 1,..., , 1,...,

 ter-se-á a matriz média

 

X [ _i_{, j}]

E  

tendo-se



AX B



AE

 

X B

E   

já que com A[al,h] uma matriz mh e Buma matriz ms , se tem

                     



    r h s m s h h m r h m h h m r h r h s s h h h h b X a b X a b X a b X a B X A 1 , , , 1 1 , 1 , , 1 1 , 1 , , 1 1 , 1 1 , , 1      ,vindo





                     



    r h s m s h h m r h m h h m r h r h s s h h h h b a b a b a b a B X A E 1 , , , 1 1 , 1 , , 1 1 , 1 , , 1 1 , 1 1 , , 1         

 

X B AE   .

Estabelecemos a expressão de E



AX B



para exemplificar a técnica seguida para obter este tipo de resultado.

Analogamente tem-se



AX B



AE

 

X B

E   

Recordemos agora que dado o par



X ,Y



de variáveis aleatórias a respetiva covariância é

 







 





X E X Y EY



E

     

XY E X EY

(20)

e se X e Yforem independentes, tem-se

 







 





XE X YEY



E



XE

 

X



E



YE

 

Y



0

E

,visto o valor médio de produto de variâncias aleatórias independentes ser o produto dos valores médios, e

 



XE X

    

E X E X 0

E

Estas expressões generalizam-se para pares de vetores aleatórios



X ,Y



sendo a respeti-va matriz de corespeti-variância cruzada



X Y



E





XE

 

X





YE

 

Y





 , vendo-se que



 



t Y X X Y,  , 

Caso X e Yforem independentes as suas componentes são independentes, vindo





 _r_s

Y, X 0

,com r e sos números de componentes de X e Y.

Mostra-se ainda que









t B X Y A Y B X A ,   , 

caso X  Y tem-se a matriz da covariância

 

X E





XE

 

X





XE

 

X



t







X,X



 ,vendo-se que

  







 

t t A X A A X X A X A X A X A ; ;       

Recordemos que para a variável aleatória Xse tem a função geradora de momentos

 

uX X u Ee

(21)

que, se estiver definida num intervalo aberto contendo a origem é indefinidamente deri-vável na origem, tendo-se

 

X

 

u E r _Xr

 

'

onde rindica a ordem da derivação. Observe-se que

 



 



 





 

au e e E e e E u X bu X au bu b aX u b aX       

Por outro lado se X₁ e X₂ forem independentes tem-se

 



 





1 2



2 1 2 1 uX uX X X u X X e e E e E u     

e, como _E

   

_euX1_e_E_euX2 _{são independentes,}_tem-se

 

   

 

u

 

u e E e E u X X uX uX X X 2 1 2 1 2 1 ,      

Por outro lado interessa-nos considerar ainda a função geradora de cumulantes

 

u _X

 

u

X 

 ln

obtendo-se, caso existam momentos de 2ª ordem, já que_X

 

0 1

 

_{ }

 

_{ }



 



 

                    X Var X E X E X E X X X X X X X X X 2 2 2 2 ' '' '' ' ' ' 0 0 0 0 0 0 0 0 1 0         

Estes resultados generalizam-se para os vetores aleatórios. A função geradora de mo-mentos de X será

(22)

 

u X X u E e t   ,tendo-se

 



...



 

0 0 1 1 11                                      r X u j k j X k j j k u u X X E X    

caso _X

 

u esteja definido num aberto contendo a origem. Vê-se ainda que, com

 

u _X

 

u X   ln se tem

 

X

 

j k E j X j  0, 1,...,  

,onde _jtemcomponentestodas nulas, salvo a j-essima que é 1. Assim

 





rad

 



_ _₀_ u X u g X E 

,onde grad indica o gradiente. Analogamente, dada a matriz hessiana

 





 

                             2 2 1 1 2 2 1 2 k X k X k X X X ess u u u u u u u u u u u H            tem-se

 





 



_₀  u X ess u H X  já que

(23)

 

u i k j k u u u u u u u u u u X l X i X l i X l i X ,..., 1 , ,..., 1 , 2 2                     vindo

 

_

_{    }



;



, 1,..., , 1,..., . 0 2 k j k i X X X E X E X X E u u u l i l i l i l i X                 Cov 

Por outro lado

 



 



 





 

A u e e E e e E u t X u b X a A b u b X A u b X A t t t t



     t ,vindo

 

. u A u b u t _X t b X A   _  

Tem-se ainda com X₁ e X₂ independentes

 



 







   

 

u

 

u e E e E e e E e E u X X X u X u X u X u X X u X X 2 1 2 t 1 t 2 t 1 t 2 1 t 2 1          vindo

 

u _X

 

u _X

 

u X X1 2  1  2  _   logo





   



    

            2 1 2 1 2 1 2 1 X X X X X E X E X X E

como é fácil de se ver derivando a partir _X _X

 

u

2 1

(24)

Supondo que X₁ e X₂são independentes, então        2 1 X X X terá, com        2 1 u u u

a função geradora de momentos

 







  

 

1 ₂

 

2 1 2 2 1 1 2 2 1 1 2 u u e E e E e e E e E e E u X X X u X u X u X u X t u X t u X t t t t c c                     2.3.2 Transformações lineares

Iniciamos a nossa discussão dos vetores normais introduzindo resultados relativos a momentos e respetivas funções geradoras. Isto dado ao papel central que as funções geradoras de momentos têm na teoria dos vetores normais.

Um vetor aleatório Y com vetor médio e matriz da covariância Vé normal se tem função geradora de momentos

 

tu utVu e V u 2 1 ,    





pondo-seY~

 

,V .

Observa-se que V pode não ser invertível. Quando V é invertível, ver Mexia (1995), a densidade é

(25)





   

 

V e V y n n y V y t det 2 , 2 1          2 1

,sendo n o número de componentes.

Estabeleçamos a Proposição 2.2 Caso Y~

 

,V tem-se



t



AVA b A b Y A  ~  ,

D: Começamos por observar que



  





            t AVA b Y A b A b Y E A b Y A E  ora,

 

     







t



u AVA u b A u u A V u A u A b t X b X A b b X A

AVA

b

A

u

e

u

A

e

u

t t t t t t t

,

2 1 2 1 t t





     





   

o que estabelece a tese. Corolário Se                                 2 , 2 1 , 2 2 , 1 1 , 1 2 1 2 1 , ~ V V V V Y Y Y   tem-se



t t t t



A V A A V A A V A A V A A A Y A Y A1 1 2 2~ 1₁ 2₂, 1 1,1 1 1 1,2 2 2 2,1 1 2 2,2 2

(26)

Nota: Ao escrever a distribuição de Y está-se a indicar que Y tem vetor médio          2 1   Y com E

 

Y_l ,l1,2, l  e matriz de covariância          2 , 2 1 , 2 2 , 1 1 , 1 V V V V V ,onde V₁_,₁

 

Y₁,V₁_,₂



Y₁,Y₂



,V₂_,₁



Y₂,Y₁



e V₂_,₂

 

Y₂

D: A tese resulta da proposição 2.2 e de





          2 1 2 1 2 2 1 1 _  A A Y A Y A ,já que





1 ₁ 2 ₂ 2 1 2 1 _    A A A A           ,e que





t t t t t t A V A A V A A V A A V A A A V V V V A A 1 1,1 1 1 1,2 2 2 2,1 1 2 2,2 2 2 1 2 , 2 1 , 2 2 , 1 1 , 1 2 1                      ,atendendo-se a que





         t t t A A A A 2 1 2 1

Como vimos atrás, se Y₁ e Y₂ forem independentes tem-se



₂



0

Y₁ , Y

Isto é a nulidade de Y



₁ , Y₂



é condição necessária de independência Y₁ e Y₂. No caso em que          2 1  

(27)

Por outro lado temos ainda a Proposição 2.3 SeY₁ e Y₂forem independentes eY ~

 

,V_l ,l1,2 l l  ,tem-se                               2 1 2 1 2 1 0 0 , ~ V V Y Y Y   D: com          t 2 t 1 u u u tem-se

 

2 1 2 1 2 1 2 1 2 1 l t t l l t l l t l u V u u u V u u l Y Y Y e e u u u             ,com V                        2 1 2 1 0 0 V V   

,o que estabelece a tese.

2.3.3 Distribuições associadas Suponhamos que                                 _n n n I Y Y Y ~ , 1 1    

(28)



  n i i Y Y 1 2 2

,distribui-se como um qui-quadrado com ngraus de liberdade e parâmetro de não cen-tralidade, 2    



  n 1 i 2 i tendo-se









2 2 1 2 1 , _n u u u e n u       ,bem como













n



u



u u n u u n u 2 1 ln 2 2 1 2 2 2 1 ln 2 2 1 ,               ,logo 2 2 , Y n 

 tem o valor médio e a variância

















          n n n n n n 2 '' 2 '           , 0 , , 0 ,

Quando  0 o qui-quadrado diz-se central tendo-se









      n n n n 2 0 0 2 , ,  

Existem três pontos importantes a considerar. Suponhamos que se têm os qui-quadrados

independentes 2 , 2 ,1 2 2 1   _v e _v ,tem-se então

(29)

 









 





2 2 1 2 2 1 2 1 2 1 2 1 2 1 2 2 , 2 2 1 , 1 2 1 2 1 , n n u u n u u i l i i u n e u e n u i i n n                         Isto é, 2₂, ₂ 2 1 , 1   _n e _n _{distribuem-se como um} 2 2 1 , 2 1    _ n

n somando-se pois os graus

de liberdade e os parâmetros de não centralidade. Diz-se que há reprodutibilidade para graus de liberdade e parâmetros de não centralidade.

O segundo ponto é que





 











2 ,0



! 2 1 1 ! 2 1 0 0 ₂ 2 2 2 1 2 j n u j e u j e u e n u j j j j n j n u                  



          2 2 , 2 2 2         

Daqui conclui-se que a distribuição G



n,



do 2 , _n é dada por,







2 ,0



! 0 j n z G j e n G j j        



   2 , z 2   

com G



m . ,0



a distribuição do qui-quadrado central com mgraus de liberdade. A densidade g



mz ,0



de m2é, ver Mexia (1995)









_{ }

, z , z 2 z                    0 , 2 2 1 0 0 ; 0 0 1 2 z e z m m g z m g m assim a densidade g



mz ,0



de 2 , m dada por

(30)







2 ,0



. ! 1 j m z g j e m g j j        



   2 , z 2   

Diremos queG



mz ,



é dada por uma mistura com coeficientes 0,...

!         j j e j 2 2   das distribuiçõesG



z m2 j,0



. Observe-se que











z 2 ,0







;j 0,1... , z 2 2 2            z pr j m G z pr m G j m m    tendo-se pois



















                         0 2 2 2 0 2 2 , 0 , 2 z ! 2 ! 2 , z j j j m j j m j m G j e z pr j e z pr m G        

Pode admitir-se a existência duma variável indicatriz Ncom distribuição de POISSON com parâmetro 2  , logo tendo-se





, 0,1... !           j j e j N pr j 2 2   E, que quando





2 , ,m j N se distribui-se como m22j,0, j0,1... Sejam 2 , _m e 2 g

 um par de quadrados independentes dos quais o segundo é um qui-quadrado central. Então

2 2 , g m m g f   _ 

(31)

tem, ver Mexia (1995) a distribuição Fcom m e ggraus de liberdade e parâmetro de

não centralidade , pondo-se f ~F



m,g,



. A distribuição Fdesempenha um papel central na teoria da estatística. No entanto a distribuição F



m, g,



de

2 2 , g m T   _ 

é equivalente a anterior já que,









_                   , , , , zm g g m F z g m T pr z f pr g m z F

e é mais manejável pelo que a utilizamos. Atendendo á distribuição do 2

,

m ser dada por uma mistura podemos agora escrever



T z



pr



N j

 

prT z n j



pr j     



  , 0 ,ora quando N  j , ₂ 2 2 g j m T   _  vindo



T zN j

 

F zm 2j,g,0



pr     vindo







2 ,0



! 2 , , z 0 2 _F _z_m _j j e g m F j        



       bem como,





_

_



















 



2 , , z , , 2 z 0 , , 2 ! 2 2 1 , , z 2 1 0 , , 2 ! 1 2 0 , , 2 ! 2 , , z 0 2 1 1 2 0 2               g m F g m F i m z F i e g m F g j m z F j e j m z F j e g m F i i j j j                                



         

(32)

Ora 2 , 2

_m_ será a soma de dois qui-quadrados independentes 2 , _m e 2 0 , g  vindo 1 2 2 , 2 2 2 , _           g m g m pr     _ _ ,e portanto,











       , , 2 z , , 2 z ₂ 2 , 2 2 , 2 g m F z pr z pr g m F g m g m                         vindo





0 , , z      g m F

Suponhamos agora que se quer testar uma hipótese que pode ser escrita como

0 :

0  

H contra as alternativas H₁:0.

Se teremos uma estatística



, ,



~F zm g f

podemos substituí-la por

f g m T 

já que, com "q"o valor crítico para um teste de nível qcom estatística f ,podemos pas-sar a utilizar o valor critico cq

g m

. Então a potência do teste com estatística T é

 

1 , , _.                  c m g g m F cq g m T pr pot q

(33)

vendo-se quePot

 

 cresce com . Assim a probabilidade de se registar H₀é sempre superior quando esta hipótese é falsa do que quando é verdadeira e o teste é estritamente não distorcidos.

2.3.4 Teorema de Scheffé

Dado Z~

 

,V tem--se, ver Mexia (1995).



 



_~ 2 2 c t z V z U      com ccar

 

V.

Assim se Z for independente de 2 2

~ _g S   , tem-se



, ,0



~ 0 g c z F c g F S U 

Sendo f_p_,_c_._go p-essimo quantil de F



zc, g,0



teremos



 







q f F pr g S f c z V z pr t t _q_cg _q_cg                    _ _ 1 , 1 , 1   

Obtendo-se assim um elipsoide de confiança de nível1q para . Estabelecemos agora o

Teorema de Scheffé (1.2)

Indicando por



d

que se consideram todos os vetores com o mesmo número de

com-ponentes de tem-se q g S d V d f c Z d d pr d t cg q t t _ _                   1_ , 1





(34)

D: Observa-se que quando d 0se tem a desigualdade trivial 00 pelo que nos basta considerar os d0. Cada um destes vetores é ortogonal a um par de planos paralelos tangentes ao elipsoide de confiança de nível 1qestando o ponto afim de entre esses planos se e só se, ver Scheffé (1959),

g S d V d f c z d dt t  ₁__q_,_cg t

Para completar a demonstração basta-nos observar que um ponto está no interior de um elipsoide se e só se estiver entre todos os pares de planos paralelos tangentes ao elipsoi-de.

Observe-se que quando

Z d g S d V d f c 1q,r,g t   t

a desigualdade correspondente a d não se pode verificar com



 t

d



dizendo-se então que dt é significativamente diferente de  ao nível q. Por outro lado o teorema de Scheffé dá-nos intervalos de confiança simultâneos

          _ _ g S d V d f c Z d g S d V d f c Z d qrg t t t g r q t , , 1 , , 1 ; para os parâmetros

 

  t d d 

tendo-se 

 

d significativamente diferente de _{ }0 ao nível q se e só se o intervalo de confiança para 

 

d não contiver _{ }0 .

(35)

j i j i j i                            , 0 1 1 0 ,       tem-se

 

i,j ij;i j 

,quando 

 

_i,_j é significativamente diferente de 0 ao nível q ter-se-á, com probabili-dade do erro majorada por q,

j i 

 

Assim podemos, dado os intervalos de confiança serem simultâneo, com a probabilida-de probabilida-de estarmos certos não inferior a 1 q , afirmar que diferem todos os pares _i;_j tais que j i j i t j i g c q g S V f c 1_ ,,  ,  ,   Com            n n n n v v v v V , 1 , , 1 1 , 1     tem-se j j j i i i j i t j i,V , v, 2v, v,  .

(36)

2.3.5 Partição ortogonal Admitimos que Z



r In



2 , ~ é independente de ~ 02, 2 

S tendo-se ainda uma partição

ortogonal j m j n R  _1 com

 

           m J Q car c m J Q R j j j j j ,..., 1 , dim ,..., 1 ,

Seja Aj uma matriz cujos vetores linha constituem uma base ortonormada para

. ,..., 1 ,j m j   . Tem-se então         m J Q A A m J I A A j j t j j t j j ,..., 1 , ,..., 1 , e como m j Aj j  , 1,...,  tem-se ainda



I



j m Z A j g j j j ~ , , 1,..., ~ _ _ 2 _ 

independente de S,j1,...,m. Assim temos, ver Mexia (1995)

m j V j j g j j ~ , 1,..., ~ 2 , 2 2      _  ,com m J V_j  1₂ _j 2, 1,...,  

independente de S . Temos ainda, ver Mexia (1995) os 2 0 , 2 2 ~ ~ j g j j j V      também independentes de S

(37)

teremos assim as









           m j g g F S U g g T m j g g F S U g g F j j j j j j j j j ,..., 1 , 0 , , ~ ,..., 1 , , , ~   

As estatísticas Fj,j1,...,m podem ser utilizadas para testar as hipóteses m

j H0,j:j 0, 1,...,

sendo 1q,g,_ o



1q



essimo quantil de F



gj, g,0



o mesmo será o valor crítico do teste

de nível qpara H0,j,j1,...,m. A potência deste teste



g g



F



f g g



j m Pot _j _j _q_g _g _j _j j , , 1,..., 1 ,   ₁__, _,   

cresce com_j,j1,...,m já que









m j g g t F g g Pot j j j g g q j j j ,..., 1 , 0 , , , 1 ,₀,         _    

pelo que os testes F para as H₀_,_j,j1,...,mserão estritamente não distorcidos. Podemos no entanto testar, por dualidades hipóteses mais gerais. Assim

m j q g S f T pr g S f pr j j qg_jg j qg_jg 1 , 1...., ~ , , 1 , , 1 2                   _ _  _ 

obtendo-se assim, para as _jj1....,m, esferas de confiança de nível 1q. Ora quando

j

b não está aberto pela correspondente esfera de confiança temos

 

f t j m S b g S b F j qg g j j j j j _j , 1...., ~ , , 1 2        _

,logo se utilizarmos Fj

 

bj como estatística para testar

 

b b j m

(38)

regeita-se esta hipótese. Como o nível de esfera de confiança é de 1qvê -se que obti-vemos, por dualidade, um teste de nível 1q.

2.3.6 Cruzamento de fatores

Interessa-nos considerar um caso como partição ortogonal. Suponhamos as componen-tes de Z correspondem às combinações de níveis de vários fatores, com a ...1 auníveis.

Então Z terá a _j

i a

n_₁ componentes, e sendo os conjuntos de fatores os sub-conjuntos de u



1,...,u



cu estará associado

 o valor médio geral dos conjuntos de se c;

 os efeitos dos níveis de único fator com índice em c se #

 

c 1;

 as interações entre os conjuntos de níveis de fatores em índices c se #

 

c 1.

Podemos identificar os conjuntos de fatores com os respetivos índices

 

n c i j j c j 1



2 1, 1,...,2  

Embora pudéssemos utilizar esses índices para ordenar as matrizes A temos, ver Fonse-ca et al (2003), as seguintes expressões

 

c X A

 

c A  2 _l onde

 

             l U c A l a c A A l l a l t a l l l , , 1 1 sendo l a

U obtida retirando a primeira linha igual a t a l l a 1 1 duma matriz l a P ortogonal l l a a  . Diremos que l a

P é matriz ortogonal estandartizada. Tem-se ainda

 





 







1



c l l a c A car c



(39)

,por exemplo podemos ter      _  2 1 2 1 2 U                6 1 6 2 6 1 2 1 0 2 1 3 U

Por outro lado o produto  de matrizes ortogonais estandartizada dá matrizes ortogo-nais estandartizada. Assim L_pode ser obtido retirando a primeira linha a

2 2 2 8 P P P P    Com               2 1 2 1 2 1 2 1 2 P

Se afor par, obtêm-se os vetores linha v ,...,1 va de Pa_{aplicando o processo de}

ortonor-malização de Gram-Schimicht aos vetores 1 1_a, ₂,..., _a_₁

a   Recorde-se que











v



