• Nenhum resultado encontrado

6 INTERPRETAÇÃO DE EXPERIMENTOS COM TRATAMENTOS QUANTITATIVOS

No documento ExperimentaoII - Lindolfo Storck (páginas 79-87)

6.1 - Introdução

Os tratamentos são denominados quantitativos quando podem ser ordenados segundo um critério quantitativo como, por exemplo: volumes, pesos, distâncias, temperaturas, umidades, índices, tempo, etc. São exemplos de experimentos com tratamentos quantitativos os que têm objetivos de:

a) Avaliar o efeito de 0, 2, 4, 6 e 8 t/ha de calcário para plantio de laranjeira;

b) Avaliar o comportamento da aplicação de diferentes doses de um inseticida (0, 10, 20 e 30g de i.a./litro de H2O) no controle de uma praga;

c) Determinar a melhor temperatura (ambiental, 20, 10, 5 e 0oC ) para quebra de dormência

das sementes de uma espécie.

Nestes casos, os tratamentos (variável independente) são fixados pelo pesquisador e, em geral, são relacionados entre si. Quando se têm tratamentos quantitativos deve-se usar a regressão e procurar uma equação que expresse matematicamente o comportamento dos tratamentos. Se Xi é o valor do tratamento i e Yij é a observação (resposta) ao efeito do

tratamento i na repetição j então, o problema é resolvido encontrando a função Y = "função de X" (exemplo:

=a+bX;

Y

= a+bX+cX2; etc.) que melhor explica a relação entre tratamento e

resposta observada (Y). A interpretação dos resultados é feita pela leitura da função e através de gráficos. Para ter um ponto de referência na interpretação de experimentos com tratamentos quantitativos, deve-se incluir, sempre que possível, a quantidade zero (testemunha) na relação dos tratamentos a serem avaliados.

Além das equações polinomiais de primeiro grau (Y=a+bX), segundo grau (Y=a+bX+cX2), terceiro grau (Y=a+bX+cX2+dX3), etc. e outras do tipo Y=a+b/X e

Y=a+b

X

+cX, todas denominadas de modelos lineares nos parâmetros, têm-se os modelos não-lineares nos parâmetros, tais como: o modelo de Mitscherlich { Y=A(1-10-c(X+b)) ou

Y=α+β∗γX }, exponencial de crescimento

{ Y = K * A }

BX

, etc. Sendo I o número de tratamentos quantitativos (níveis da variável independente X) do experimento ou de um dos fatores do experimento fatorial, deve-se ter no mínimo I=3 para aplicar a análise de regressão. Quando I=2, temos dois pontos e infinitas equações podem passar pelos dois pontos tornando impossível estudar a relação entre os tratamentos e seus efeitos. Neste caso, para concluir, testa-se a hipótese de igualdade das médias dos dois tratamentos e verifica-se qual dos dois tratamentos tem maior média.

Vamos considerar, neste texto, apenas as regressões polinomiais, para I≥≥≥≥3, com

Ajustar uma equação de regressão a um conjunto de dados pareados (Y;X) é obter as estimativas dos parâmetros do modelo mais adequado, de forma que os pontos observados (Yij; Xi) se encontrem o mais próximo possível da curva da função ajustada.

Considerando a observação Yij como sendo o valor obtido na unidade experimental (UE)

que recebeu o tratamento Xi na repetição j. O modelo, neste caso, será:

Y

ij

=b

o

+b X

1 i

+b X

2 2i

+ +...

b X

k ki

+ +δ

i

e

ij

em que: bo= constante ou valor esperado de Y se Xi=0; b1= coeficiente do primeiro grau

(linear) do modelo; b2= coeficiente do segundo grau (quadrático) do modelo; bk= coeficiente

de grau k; δδδδi= desvio da função com a média no ponto X, tomada como sendo de efeito

aleatório ( E(δi)=0 ; Σiδi≠0; e E(δi2)=σδ2 ), cuja variância é denominada de variância da falta de ajuste das médias ao modelo; e, eij =erro experimental referente à observação Yij , com todas

as pressuposições definidas anteriormente (Delineamentos IC, BA, QL). As estimativas dos parâmetros do modelo (bo, b1, b2 ... bk) podem assumir qualquer valor entre ± infinito,

resultando assim, nas mais variadas formas de relação entre as variáveis X (tratamento) e Y (efeito e tratamento).

Pode-se estudar tantos graus de regressão quantos forem os graus de liberdade dos tratamentos e para cada grau da regressão é atribuído um grau de liberdade. No caso de experimentos (ou fatores) com I=4 níveis, a equação de terceiro grau é a de maior grau possível e, neste caso, a variância dos desvios é nula.

Em geral, na área da pesquisa biológica trabalhamos com modelos iguais ou menores que o cúbico (terceiro grau) devido a dificuldade de interpretação e/ou explicação biológica do comportamento de fenômenos ajustados por modelos de maior grau. Tomamos, então, como modelo básico a parte que indica o primeiro, o segundo e o terceiro grau do modelo definido anteriormente, ou seja:

Y

ij

=b

o

+b X

1 i

+b X

2 2i

+b X

3 i3

+ +δ

i

e

ij

Necessita-se, a seguir, obter estimativas dos parâmetros para o modelo que melhor se ajuste aos dados observados. A estimação destes parâmetros é feita pelo método dos mínimos quadrados no qual, pode-se, em certas situações, usar os polinômios ortogonais.

6.2 - Método dos polinômios ortogonais

Este método é mais facilmente empregado nos casos em que os tratamentos são eqüidistantes e com número igual de repetições para cada tratamento. Nestes casos, pode-se usar os coeficientes dos polinômios ortogonais já deduzidos e apresentados em tabelas, os quais variam apenas em função do número de tratamentos. Um exemplo de uso de tratamento eqüidistante é o caso da avaliação do efeito de 0, 30, 60, 90, 120kg/ha de Nitrogênio para uma dada cultura.

Considerando o modelo definido anteriormente, para I tratamentos quantitativos e J repetições, a causa de variação "Tratamentos", com I-1 graus de liberdade, é "decomposta"

(subdividida) de acordo com a Tabela 6.1 – no caso de experimento no delineamento inteiramente casualizado. Cada grau de regressão apresenta a porção da SQTrat que aquele

grau explica além daquela explicada por graus anteriores já existente no modelo.

Tabela 6.1 Modelo de análise da variância com decomposição da soma de quadrados de tratamentos em regressões. CV GL SQ QM F(sob Ho) Tratamentos I-1 SQTr --- --- Regressão do 1o-grau (RL) 1 SQ RL QMRL QMRL/QME Regressão do 2o-grau (RQ) 1 SQ RQ QMRQ QMRQ/QME Regressão do 3o-grau (RC) 1 SQ RC QMRC QMRC/QME Desvios (D) I-4 SQD QMD QMD/QME Erro I (J-1) SQE QME

Os testes de hipóteses das regressões, indicados na Tabela 6.1, determinam qual o grau da equação a ser ajustada. Assim, o grau da equação a ser usado é o de maior grau significativo, não importando as significâncias dos graus que o antecedem.

De acordo com o modelo completo, as hipóteses que podem ser testadas são:

a) H0:b1=0 versus H1:b1≠≠≠≠0 (b1<0 ou b1>0); rejeita-se H0 se Fc= QMRL/QME > Fα(1;GLE) e conclui-

se que o efeito linear (positivo ou negativo) de X sobre Y é significativo em nível α de erro; b) H0:b2=0 versus H1:b2≠≠≠≠0 (b2<0 ou b2>0); rejeita-se H0 se Fc= QMRQ/QME > Fα(1;GLE) e conclui-

se que o efeito (positivo ou negativo) quadrático de X sobre Y é significativo em nível α de erro. Em outras palavras, o 2o grau ajustou uma porção significativa de variação a mais que

o 1o grau.

c) H0:b3=0 versus H1:b3≠≠≠≠0 (b3<0 ou b3>0); rejeita-se H0 se Fc = QMRC/QME > Fα(1;GLE) e conclui-

se que o efeito (positivo ou negativo) cúbico de X sobre Y é significativo em nível α de erro, ou seja, o 3o grau ajustou uma porção significativa de variação a mais daquela ajustada

pelos 1o e 2o graus.

d) H0:σσσσδδδδ2= 0 versus H1:σσσσδδδδ2≠≠≠≠0; rejeita-se H0 se Fc = QMD/QME > Fα(GLD;GLE) em nível α de erro, e

conclui-se que um efeito de grau superior ao terceiro é significativo e deveria ser incluído no modelo. No entanto, como modelos de grau superior ao terceiro são de pouca utilidade prática, apenas registra-se esta conclusão e adota-se a equação de maior grau significativo até o máximo a do 3o grau, para a interpretação dos resultados do experimento.

Na Tabela 6.2 estão representadas as diferentes possibilidades de rejeição das hipóteses e as respectivas equações a serem ajustadas.

As equações ajustadas são interpretadas dentro dos limites de variação da variável independente (X=tratamento) no experimento. Extrapolações sempre são perigosas. Quando possível, deve-se incluir, na escolha dos tratamentos, a quantidade zero na relação dos tratamentos para servir como ponto de referência (testemunha).

Nos casos em que a regressão de 1o grau for adequada, um novo experimento, com quantidades maiores ou menores, deve ser planejado e executado. Isto pode ser feito aumentando-se o número de tratamentos ou aumentando-se as diferenças entre os níveis dos mesmos. Com isto, poderá ser atingido um ponto (resposta) que corresponde ao mínimo ou ao máximo da curva; o que irá melhorar a interpretação e a conclusão do efeito de tratamentos (X) sobre a variável observada (Y). Pontos de mínimo ou de máximo somente têm sentido, para uma conclusão, quando estes se encontram dentro dos limites de variação dos tratamentos do experimento.

Tabela 6.2. Escolha da equação a ser ajustada em função dos testes de hipóteses. Casos Hipóteses adotadas → equação a ser ajustada

RL RQ RC 1 H1 H1 H1 → Y=b0+b1X+b2X2+b3X3 2 H0 H1 H1 → Y=b0+b1X+b2X2+b3X3 3 H0 H0 H1 → Y=b0+b1X+b2X2+b3X3 4 H1 H0 H1 → Y=b0+b1X+b2X2+b3X3 5 H1 H1 H0 → Y=b0+b1X+b2X2 6 H0 H1 H0 → Y=b0+b1X+b2X2 7 H1 H0 H0 → Y=b0+b1X

8 H0 H0 H0 → Nenhuma equação se ajusta

Para calcular as SQ da análise da variância e a equação de regressão, calculamos: Yi. =

Total (sobre todas as repetições ou níveis de outros fatores quando for o caso) do tratamento i (ou Xi), indiferente do delineamento; e chamamos Xi = quantidade do tratamento i. Estes

valores são colocados aos pares como é mostrado a seguir: Yi. Xi

Y1. X1

Y2. X2

... ... YI. XI

As somas de quadrados das regressões são obtidas por:

(

)

SQRL = iC Yi1 i J iCi 2 1 2 . ;

SQ

RQ

=(

i

C Y

i2 i

)

J

i

C

i 2 2 2

.

;

SQRC =

(

iC Yi3 i

)

J iCi 2 3 2 . ;

SQD = SQTrat. - SQRL - SQRQ - SQRC em que: J = número de parcelas usadas para obter Yi.

(número de repetições ou, se for fatorial, número de repetições multiplicado pelo número de níveis de outro fator); Ci1 , Ci2 e Ci3 são os coeficientes para interpolação dos polinômios

ortogonais, tais que ΣiCi1 =ΣiCi2 =ΣiCi3 =0 e ΣiCi1Ci2 =ΣiCi1Ci3 = iCi2Ci3 =0, o que caracteriza a

independência (ortogonalidade) entre os contrastes ou regressões. Estes valores são encontrados em tabelas (a seguir apresenta-se a relação dos Cij para 3, 4, 5, 6, 7 e 8

tratamentos); Ci1 são os coeficientes do primeiro grau (contraste linear), Ci2 são os coeficientes

cúbico), etc. em que K=ΣiCik2 (k=1,2,...) e M é um valor usado para o cálculo das estimativas

dos parâmetros da equação.

Para um melhor entendimento dos procedimentos de cálculos, consideramos um experimento com J=5 repetições, no delineamento inteiramente casualizado, e os totais de seis tratamentos e suas respectivas doses de adubo (X ) representados na Tabela 6.3. Nesta tabela também se encontram os coeficientes dos polinômios ortogonais (Ci1, Ci2 e Ci3 ) e as

somas dos produtos dos coeficientes com os totais de tratamentos. Com os elementos da tabela, pode-se calcular, facilmente, as somas de quadrados indicadas:

SQRL = (206)2 / (5 x 70) = 121,246;

SQRQ = (-196)2 / (5 x 84) = 91,467;

SQRC = (16)2 / (5 x 180) = 0,284; e sendo

SQTrat. = (1/5)(502 + 702 +...+ 802) - (4602) /(5 x 6) = 214,267

SQD = 214,267 - 121,246 - 91,467 - 0,284 = 1,269.

O quadro da análise da variância, com SQE =436,8, é representado na Tabela 6.4.

Verifica-se, nesta tabela, que foram rejeitadas as hipóteses H0:b1=0 e H0:b2=0 em nível de 5%

de erro, e não foram rejeitadas as hipóteses H0:b3=0 e H0:σσσσδδδδ2=0. Desta forma, a equação a ser

ajustada é a de 2o grau, ou seja

Y b=

o

+b X b X

1

+

2 2.

I = 3 I = 4 I = 5 i Ci1 Ci2 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 1 -1 1 1 -3 1 -1 1 -2 2 -1 2 0 -2 2 -1 -1 3 2 -1 -1 2 3 1 1 3 1 -1 -3 3 0 -2 0 4 3 1 1 4 1 -1 -2 5 2 2 1 K 2 6 20 4 20 10 14 10 M 1 3 2 1 10/3 1 1 5/6 I = 6 I = 7 I = 8 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 1 -5 5 -5 1 -3 5 -1 1 -7 7 -7 2 -3 -1 7 2 -2 0 1 2 -5 1 5 3 -1 -4 4 3 -1 -3 1 3 -3 -3 7 4 1 -4 -4 4 0 -4 0 4 -1 -5 3 5 3 -1 -7 5 1 -3 -1 5 1 -5 -3 6 5 5 5 6 2 0 -1 6 3 -3 -7 7 3 5 1 7 5 1 -5 8 7 7 7 K 70 84 180 28 84 6 168 168 264 M 2 3/2 5/3 1 1 1/6 2 1 2/3

Tabela 6.3 Esquema auxiliar para análise de regressão. I Xi Yi. Ci1 Ci2 Ci3 Ci1Yi. Ci2Yi. Ci3Yi. 1 0 50 -5 5 -5 -250 250 -250 2 20 70 -3 -1 7 -210 -70 490 3 40 85 -1 -4 4 -85 -340 340 4 60 87 1 -4 -4 87 -348 -348 5 80 88 3 -1 -7 264 -88 -616 6 100 80 5 5 5 400 400 400 Σi→ 300 460 0 0 0 206 -196 16 K 70 84 180 = = = M 2 3/2 5/3 ΣiCi1Yi. ΣiCi2Yi. ΣiCi3Yi.

Tabela 6.4 Análise de variância com decomposição dos tratamentos em regressões.

CV GL SQ QM F(sob H0) Tratamentos 5 214,267 - - - - - - 1o Grau 1 121,246 121,246 6,66* 2o Grau 1 91,467 91,467 5,02* 3o Grau 1 0,284 0,284 0,01ns Desvios 2 1,269 0,634 0,03ns Erro 24 436,800 18,200

* Fc>F5%(1;24)=4,26 → rejeitar H0; ns = não significativo.

O modelo geral para estimar uma equação quando se usa o método dos polinômios ortogonais, é:

Y

=Y..+B

1

M

1

P

1

+B

2

M

2

P

2

+...+B

k

M

k

P

k

+e

Para estimar uma equação, usa-se parte da equação geral, de acordo com o modelo determinado pelos testes de hipóteses das regressões. Considerando até o terceiro grau a determinação do grau da equação é feita segundo o esquema:

3 3 3 2 2 2 1 1 1

..

ˆ

Y

BM

P

B

M

P

B

M

P

Y

=

+

+

+

equação linear equação quadrática equação cúbica

em que:

Y..=

mˆ

= média geral do experimento;

B

1

=

i

C

i1

Y

i

./J

i

C

i21 ;

=

i

C

i

Y

i

J

i

C

i

B

2 2 2 2

./

;

B

=

i

C

i

Y

i

J

i

C

i 2 3 3 3

./

; (Observe as semelhanças de B1,

B2 e B3 com as SQRL, SQRQ e SQRC) ; M1 , M2 e M3 são obtidos das tabelas dos polinômios

ortogonais; P1 = x ; P2 = x2 - (I2-1)/12; P3 = x3 - x (3 I2 - 7)/20; I = número de tratamentos ou de níveis; x = variável padronizada =

(X

X)/h

; X = variável independente da equação estimada;

X

=média da variável que define os tratamentos = (ΣiXi)/I; h=Xi+1-Xi = diferença

No exemplo, como a equação significativa escolhida foi a do 2o grau, tomamos da equação geral a fração adequada, ou seja

Y Y B M P B M P=

..+

1 1 1

+

2 2 2 em que

Y

= 460/30 = 15,333; M1 = 2; M2 = 3/2; B1 = 206/(5 x 70) = 0,5886; B2 = (-196)/(5 x 84) = -0,4667; P1=x;

P

2

x

2

x

2 2

6

1

12

35 12

=

=

/

. Substituindo os termos (B1, B2, M1, M2, P1, P2) na equação

geral têm-se

Y=15 333 0 5886 2,

+(

,

)( )x+ −(

0 4667 3 2,

)(

/

)(x

2

−35 12/

)

,

,

,

,

Y=15 333 11772+

x−0 70005x

2

+2 042

,

,

,

Y b=

0

+b x b x

1

+

2 2

Y

=17 375 11772+

x−0 70005x

2

Se considerarmos que x =

(X X h−

)/

, em que h=20 e

X

= (0+20+40+60+80+100)/6 =50, então x =(X-50)/20 e, como uma equação estimada pode ser interpretada apenas dentro dos limites de variação de X avaliado no experimento, no exemplo, o X varia entre 0 e 100 então x pode variar entre -50/20 e +50/20.

Quando a equação está com a variável independente x na forma padronizada, as estimativas de b0, b1 e b2 são independentes, isto é, as suas covariâncias são nulas. Com isto,

( ) (

) ( ) ( ) ( ) ( )

( )

( )

V Y

=

V b

0

+b x b x

1

+

2 2

=

V b

+V b x V b x+

=V b

+x V b

+x V b

0 1 2 2 0 2 1 4 2

( )

V Y QME IJ x J C x J C i i i i = 1 + 2 + 1 2 4 2

2 e, estimativas por intervalo para o valor de Y para um dado valor de x =

(X X h−

)/

podem ser obtidos em nível 1-α de confiança, calculando os seus limites por

Y t±

(α 2/ )(GLE)

V Y( )

e, se fizer isto para todo o valor de x no intervalo estudado pode-se construir um gráfico com a faixa de confiança (Figura 6.1).

No exemplo, vamos obter uma estimativa por intervalo a 90% de confiança para X igual a 90. Neste caso, x = (90 - 50)/20 =2;

Y=17 375 11772 2,

+

,

( )−0 70005 2,

( )

2

=16 9292,

;

( )

, * * ,

V Y =18 2 301 +5 704 +5 8416 =1508 sendo o valor da tabela igual a

t

0 05 24, ( ) =

2 064,

então 16 9292 2 064 1508, ± , , →16 9292 2 5346, ± , →

P{14 3946,

≤ ≤Y

19 4638,

}=0 90,

Para uma melhor compreensão da equação, a mesma deve ser apresentada, em publicações, com a variável x despadronizada, isto é, substituir o termo x na equação por x =

(

X X h−

)

/ . Para o exemplo, tem-se:

, , , , , ,

Y=17 375 11772+ X20−50 −0 70005 X20−50 =10 0565 0 2338+ X−0 00175X

2

2 para X

pertencente ao intervalo entre 0 e 100.

Através do coeficiente de determinação (R2), obtém-se uma estimativa da qualidade do

ajustamento dos dados à equação, isto é, nos fornece a proporção de variação das médias dos tratamentos que é explicada pela equação. Este coeficiente é calculado por

R2=(SQ

R)/SQTrat. em que SQR=SQRL, para equações do 1o grau; SQR =SQRL+SQRQ, para

equações do 2o grau; SQ

R =SQRL+SQRQ+SQRC, para equações do 3o grau; etc.

Quando o número de tratamentos é pequeno e a equação ajustada tem poucos (ou nenhum) graus de liberdade para desvios do modelo, o coeficiente de determinação não faz muito sentido, pois é sempre próximo de um.

Para que os R2 se tornem comparáveis, para diferentes situações, convém calcular o R2

ajustado (R2aj.) em função do número I de tratamentos. Este ajustamento é obtido por:

[

]

R

R

p

I p

R

aj

2

.=

2

−1

1

2

em que p é o número de parâmetros da equação (p=2, para

equação do 1o grau; p=3, para equação do 2o grau; etc.). Excluindo o caso em que R2=1,

temos R2

aj.<R2. No exemplo, o coeficiente de determinação é calculado por

R2=(SQ

RL+SQRQ)/SQTrat. sendo R2=(121,246+91,467)/214,267 =0,992 e com o ajustamento

pelo número de tratamentos e parâmetros estimados para a equação temos que:

[

]

R

aj2

0 992

3 1

6 3

1 0 992

0 987

.=

,

,

,

=

ou seja, 98,7% da variação na resposta (Y) é explicada

pela variável X, através da equação.

Para melhor interpretar os resultados do experimento deve-se confeccionar um gráfico onde é desenhada a curva ajustada pela equação e discriminados os pontos observados, a equação estimada, o coeficiente de determinação e o ponto de máximo ou mínimo.

6.3 - Método geral

Quando os tratamentos não são eqüidistantes e/ou o número de repetições por tratamento não é o mesmo, o método dos polinômios ortogonais é dificultado, pois os coeficientes dos polinômios são diferentes. Assim, não se pode usar os coeficientes tabelados em função do número de tratamentos, e por isto, devem ser deduzidos. Nestes casos, é mais conveniente ajustar o modelo pelo método dos mínimos quadrados, usando diretamente os valores de Xi (valores dos tratamentos).

Supomos, novamente, o modelo básico como sendo

Y

ij

=b

0

+b X

1 i

+b X

2 i2

+b X

3 i3

+ +δ

i

e

ij e usando a notação matricial podemos escrever

Y X=

β ε+

em que Y é o vetor dos valores Yij observados na seqüência Y11, Y12 ...

Y

InI ; X é

a matriz das variáveis independentes ou matriz delineamento; β é o vetor dos parâmetros; e, ε

é o vetor dos erros que são independentes com distribuição normal de média zero e variância comum σ2. Discriminando, a forma matricial deste modelo, temos:

Y1 1 X1 X12 X13 b0 ε1 Y2 1 X2 X22 X23 b1 ε2 Y3 = 1 X3 X32 X33 b2 ε3 . . . . . . . . . . . . . . . b3 + . . . Yn 1 Xn Xn2 Xn3 εn em que

Y = [Y Y ...Y′

11 12 1n1

Y Y

21 22

...Y

2n2

...Y Y

I1 I2

...Y

InI

]

= trat.1 com = trat.2 com =trat.I com n1 repetições n2 repetições nI repetições

e n = ΣΣΣΣini ; o primeiro vetor da matriz X é constituído unidade por ser o coeficiente da

constante b0 do modelo; o segundo vetor da matriz X é constituído pelas variáveis

independentes (Xij = tratamento i na repetição j) respectivamente às observações Yij; o terceiro

vetor da matriz X é igual ao quadrado de X, isto é, Xij2 = Xij*Xij ; o quarto vetor da matriz X é

igual ao cubo de X, isto é, Xij3 =Xij*Xij*Xij; β é o vetor dos parâmetros do modelo, isto é β’ = [ b0

No documento ExperimentaoII - Lindolfo Storck (páginas 79-87)