6.1 - Introdução
Os tratamentos são denominados quantitativos quando podem ser ordenados segundo um critério quantitativo como, por exemplo: volumes, pesos, distâncias, temperaturas, umidades, índices, tempo, etc. São exemplos de experimentos com tratamentos quantitativos os que têm objetivos de:
a) Avaliar o efeito de 0, 2, 4, 6 e 8 t/ha de calcário para plantio de laranjeira;
b) Avaliar o comportamento da aplicação de diferentes doses de um inseticida (0, 10, 20 e 30g de i.a./litro de H2O) no controle de uma praga;
c) Determinar a melhor temperatura (ambiental, 20, 10, 5 e 0oC ) para quebra de dormência
das sementes de uma espécie.
Nestes casos, os tratamentos (variável independente) são fixados pelo pesquisador e, em geral, são relacionados entre si. Quando se têm tratamentos quantitativos deve-se usar a regressão e procurar uma equação que expresse matematicamente o comportamento dos tratamentos. Se Xi é o valor do tratamento i e Yij é a observação (resposta) ao efeito do
tratamento i na repetição j então, o problema é resolvido encontrando a função Y = "função de X" (exemplo:
Yˆ
=a+bX;Y
= a+bX+cX2; etc.) que melhor explica a relação entre tratamento eresposta observada (Y). A interpretação dos resultados é feita pela leitura da função e através de gráficos. Para ter um ponto de referência na interpretação de experimentos com tratamentos quantitativos, deve-se incluir, sempre que possível, a quantidade zero (testemunha) na relação dos tratamentos a serem avaliados.
Além das equações polinomiais de primeiro grau (Y=a+bX), segundo grau (Y=a+bX+cX2), terceiro grau (Y=a+bX+cX2+dX3), etc. e outras do tipo Y=a+b/X e
Y=a+b
X
+cX, todas denominadas de modelos lineares nos parâmetros, têm-se os modelos não-lineares nos parâmetros, tais como: o modelo de Mitscherlich { Y=A(1-10-c(X+b)) ouY=α+β∗γX }, exponencial de crescimento
{ Y = K * A }
BX, etc. Sendo I o número de tratamentos quantitativos (níveis da variável independente X) do experimento ou de um dos fatores do experimento fatorial, deve-se ter no mínimo I=3 para aplicar a análise de regressão. Quando I=2, temos dois pontos e infinitas equações podem passar pelos dois pontos tornando impossível estudar a relação entre os tratamentos e seus efeitos. Neste caso, para concluir, testa-se a hipótese de igualdade das médias dos dois tratamentos e verifica-se qual dos dois tratamentos tem maior média.
Vamos considerar, neste texto, apenas as regressões polinomiais, para I≥≥≥≥3, com
Ajustar uma equação de regressão a um conjunto de dados pareados (Y;X) é obter as estimativas dos parâmetros do modelo mais adequado, de forma que os pontos observados (Yij; Xi) se encontrem o mais próximo possível da curva da função ajustada.
Considerando a observação Yij como sendo o valor obtido na unidade experimental (UE)
que recebeu o tratamento Xi na repetição j. O modelo, neste caso, será:
Y
ij=b
o+b X
1 i+b X
2 2i+ +...
b X
k ki+ +δ
ie
ijem que: bo= constante ou valor esperado de Y se Xi=0; b1= coeficiente do primeiro grau
(linear) do modelo; b2= coeficiente do segundo grau (quadrático) do modelo; bk= coeficiente
de grau k; δδδδi= desvio da função com a média no ponto X, tomada como sendo de efeito
aleatório ( E(δi)=0 ; Σiδi≠0; e E(δi2)=σδ2 ), cuja variância é denominada de variância da falta de ajuste das médias ao modelo; e, eij =erro experimental referente à observação Yij , com todas
as pressuposições definidas anteriormente (Delineamentos IC, BA, QL). As estimativas dos parâmetros do modelo (bo, b1, b2 ... bk) podem assumir qualquer valor entre ± infinito,
resultando assim, nas mais variadas formas de relação entre as variáveis X (tratamento) e Y (efeito e tratamento).
Pode-se estudar tantos graus de regressão quantos forem os graus de liberdade dos tratamentos e para cada grau da regressão é atribuído um grau de liberdade. No caso de experimentos (ou fatores) com I=4 níveis, a equação de terceiro grau é a de maior grau possível e, neste caso, a variância dos desvios é nula.
Em geral, na área da pesquisa biológica trabalhamos com modelos iguais ou menores que o cúbico (terceiro grau) devido a dificuldade de interpretação e/ou explicação biológica do comportamento de fenômenos ajustados por modelos de maior grau. Tomamos, então, como modelo básico a parte que indica o primeiro, o segundo e o terceiro grau do modelo definido anteriormente, ou seja:
Y
ij=b
o+b X
1 i+b X
2 2i+b X
3 i3+ +δ
ie
ijNecessita-se, a seguir, obter estimativas dos parâmetros para o modelo que melhor se ajuste aos dados observados. A estimação destes parâmetros é feita pelo método dos mínimos quadrados no qual, pode-se, em certas situações, usar os polinômios ortogonais.
6.2 - Método dos polinômios ortogonais
Este método é mais facilmente empregado nos casos em que os tratamentos são eqüidistantes e com número igual de repetições para cada tratamento. Nestes casos, pode-se usar os coeficientes dos polinômios ortogonais já deduzidos e apresentados em tabelas, os quais variam apenas em função do número de tratamentos. Um exemplo de uso de tratamento eqüidistante é o caso da avaliação do efeito de 0, 30, 60, 90, 120kg/ha de Nitrogênio para uma dada cultura.
Considerando o modelo definido anteriormente, para I tratamentos quantitativos e J repetições, a causa de variação "Tratamentos", com I-1 graus de liberdade, é "decomposta"
(subdividida) de acordo com a Tabela 6.1 – no caso de experimento no delineamento inteiramente casualizado. Cada grau de regressão apresenta a porção da SQTrat que aquele
grau explica além daquela explicada por graus anteriores já existente no modelo.
Tabela 6.1 Modelo de análise da variância com decomposição da soma de quadrados de tratamentos em regressões. CV GL SQ QM F(sob Ho) Tratamentos I-1 SQTr --- --- Regressão do 1o-grau (RL) 1 SQ RL QMRL QMRL/QME Regressão do 2o-grau (RQ) 1 SQ RQ QMRQ QMRQ/QME Regressão do 3o-grau (RC) 1 SQ RC QMRC QMRC/QME Desvios (D) I-4 SQD QMD QMD/QME Erro I (J-1) SQE QME
Os testes de hipóteses das regressões, indicados na Tabela 6.1, determinam qual o grau da equação a ser ajustada. Assim, o grau da equação a ser usado é o de maior grau significativo, não importando as significâncias dos graus que o antecedem.
De acordo com o modelo completo, as hipóteses que podem ser testadas são:
a) H0:b1=0 versus H1:b1≠≠≠≠0 (b1<0 ou b1>0); rejeita-se H0 se Fc= QMRL/QME > Fα(1;GLE) e conclui-
se que o efeito linear (positivo ou negativo) de X sobre Y é significativo em nível α de erro; b) H0:b2=0 versus H1:b2≠≠≠≠0 (b2<0 ou b2>0); rejeita-se H0 se Fc= QMRQ/QME > Fα(1;GLE) e conclui-
se que o efeito (positivo ou negativo) quadrático de X sobre Y é significativo em nível α de erro. Em outras palavras, o 2o grau ajustou uma porção significativa de variação a mais que
o 1o grau.
c) H0:b3=0 versus H1:b3≠≠≠≠0 (b3<0 ou b3>0); rejeita-se H0 se Fc = QMRC/QME > Fα(1;GLE) e conclui-
se que o efeito (positivo ou negativo) cúbico de X sobre Y é significativo em nível α de erro, ou seja, o 3o grau ajustou uma porção significativa de variação a mais daquela ajustada
pelos 1o e 2o graus.
d) H0:σσσσδδδδ2= 0 versus H1:σσσσδδδδ2≠≠≠≠0; rejeita-se H0 se Fc = QMD/QME > Fα(GLD;GLE) em nível α de erro, e
conclui-se que um efeito de grau superior ao terceiro é significativo e deveria ser incluído no modelo. No entanto, como modelos de grau superior ao terceiro são de pouca utilidade prática, apenas registra-se esta conclusão e adota-se a equação de maior grau significativo até o máximo a do 3o grau, para a interpretação dos resultados do experimento.
Na Tabela 6.2 estão representadas as diferentes possibilidades de rejeição das hipóteses e as respectivas equações a serem ajustadas.
As equações ajustadas são interpretadas dentro dos limites de variação da variável independente (X=tratamento) no experimento. Extrapolações sempre são perigosas. Quando possível, deve-se incluir, na escolha dos tratamentos, a quantidade zero na relação dos tratamentos para servir como ponto de referência (testemunha).
Nos casos em que a regressão de 1o grau for adequada, um novo experimento, com quantidades maiores ou menores, deve ser planejado e executado. Isto pode ser feito aumentando-se o número de tratamentos ou aumentando-se as diferenças entre os níveis dos mesmos. Com isto, poderá ser atingido um ponto (resposta) que corresponde ao mínimo ou ao máximo da curva; o que irá melhorar a interpretação e a conclusão do efeito de tratamentos (X) sobre a variável observada (Y). Pontos de mínimo ou de máximo somente têm sentido, para uma conclusão, quando estes se encontram dentro dos limites de variação dos tratamentos do experimento.
Tabela 6.2. Escolha da equação a ser ajustada em função dos testes de hipóteses. Casos Hipóteses adotadas → equação a ser ajustada
RL RQ RC 1 H1 H1 H1 → Y=b0+b1X+b2X2+b3X3 2 H0 H1 H1 → Y=b0+b1X+b2X2+b3X3 3 H0 H0 H1 → Y=b0+b1X+b2X2+b3X3 4 H1 H0 H1 → Y=b0+b1X+b2X2+b3X3 5 H1 H1 H0 → Y=b0+b1X+b2X2 6 H0 H1 H0 → Y=b0+b1X+b2X2 7 H1 H0 H0 → Y=b0+b1X
8 H0 H0 H0 → Nenhuma equação se ajusta
Para calcular as SQ da análise da variância e a equação de regressão, calculamos: Yi. =
Total (sobre todas as repetições ou níveis de outros fatores quando for o caso) do tratamento i (ou Xi), indiferente do delineamento; e chamamos Xi = quantidade do tratamento i. Estes
valores são colocados aos pares como é mostrado a seguir: Yi. Xi
Y1. X1
Y2. X2
... ... YI. XI
As somas de quadrados das regressões são obtidas por:
(
)
SQRL = iC Yi1 i J iCi 2 1 2 . ;SQ
RQ=(
iC Y
i2 i)
J
iC
i 2 2 2.
;
SQRC =(
iC Yi3 i)
J iCi 2 3 2 . ;SQD = SQTrat. - SQRL - SQRQ - SQRC em que: J = número de parcelas usadas para obter Yi.
(número de repetições ou, se for fatorial, número de repetições multiplicado pelo número de níveis de outro fator); Ci1 , Ci2 e Ci3 são os coeficientes para interpolação dos polinômios
ortogonais, tais que ΣiCi1 =ΣiCi2 =ΣiCi3 =0 e ΣiCi1Ci2 =ΣiCi1Ci3 = iCi2Ci3 =0, o que caracteriza a
independência (ortogonalidade) entre os contrastes ou regressões. Estes valores são encontrados em tabelas (a seguir apresenta-se a relação dos Cij para 3, 4, 5, 6, 7 e 8
tratamentos); Ci1 são os coeficientes do primeiro grau (contraste linear), Ci2 são os coeficientes
cúbico), etc. em que K=ΣiCik2 (k=1,2,...) e M é um valor usado para o cálculo das estimativas
dos parâmetros da equação.
Para um melhor entendimento dos procedimentos de cálculos, consideramos um experimento com J=5 repetições, no delineamento inteiramente casualizado, e os totais de seis tratamentos e suas respectivas doses de adubo (X ) representados na Tabela 6.3. Nesta tabela também se encontram os coeficientes dos polinômios ortogonais (Ci1, Ci2 e Ci3 ) e as
somas dos produtos dos coeficientes com os totais de tratamentos. Com os elementos da tabela, pode-se calcular, facilmente, as somas de quadrados indicadas:
SQRL = (206)2 / (5 x 70) = 121,246;
SQRQ = (-196)2 / (5 x 84) = 91,467;
SQRC = (16)2 / (5 x 180) = 0,284; e sendo
SQTrat. = (1/5)(502 + 702 +...+ 802) - (4602) /(5 x 6) = 214,267
SQD = 214,267 - 121,246 - 91,467 - 0,284 = 1,269.
O quadro da análise da variância, com SQE =436,8, é representado na Tabela 6.4.
Verifica-se, nesta tabela, que foram rejeitadas as hipóteses H0:b1=0 e H0:b2=0 em nível de 5%
de erro, e não foram rejeitadas as hipóteses H0:b3=0 e H0:σσσσδδδδ2=0. Desta forma, a equação a ser
ajustada é a de 2o grau, ou seja
Y b=
o+b X b X
1+
2 2.I = 3 I = 4 I = 5 i Ci1 Ci2 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 1 -1 1 1 -3 1 -1 1 -2 2 -1 2 0 -2 2 -1 -1 3 2 -1 -1 2 3 1 1 3 1 -1 -3 3 0 -2 0 4 3 1 1 4 1 -1 -2 5 2 2 1 K 2 6 20 4 20 10 14 10 M 1 3 2 1 10/3 1 1 5/6 I = 6 I = 7 I = 8 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 i Ci1 Ci2 Ci3 1 -5 5 -5 1 -3 5 -1 1 -7 7 -7 2 -3 -1 7 2 -2 0 1 2 -5 1 5 3 -1 -4 4 3 -1 -3 1 3 -3 -3 7 4 1 -4 -4 4 0 -4 0 4 -1 -5 3 5 3 -1 -7 5 1 -3 -1 5 1 -5 -3 6 5 5 5 6 2 0 -1 6 3 -3 -7 7 3 5 1 7 5 1 -5 8 7 7 7 K 70 84 180 28 84 6 168 168 264 M 2 3/2 5/3 1 1 1/6 2 1 2/3
Tabela 6.3 Esquema auxiliar para análise de regressão. I Xi Yi. Ci1 Ci2 Ci3 Ci1Yi. Ci2Yi. Ci3Yi. 1 0 50 -5 5 -5 -250 250 -250 2 20 70 -3 -1 7 -210 -70 490 3 40 85 -1 -4 4 -85 -340 340 4 60 87 1 -4 -4 87 -348 -348 5 80 88 3 -1 -7 264 -88 -616 6 100 80 5 5 5 400 400 400 Σi→ 300 460 0 0 0 206 -196 16 K 70 84 180 = = = M 2 3/2 5/3 ΣiCi1Yi. ΣiCi2Yi. ΣiCi3Yi.
Tabela 6.4 Análise de variância com decomposição dos tratamentos em regressões.
CV GL SQ QM F(sob H0) Tratamentos 5 214,267 - - - - - - 1o Grau 1 121,246 121,246 6,66* 2o Grau 1 91,467 91,467 5,02* 3o Grau 1 0,284 0,284 0,01ns Desvios 2 1,269 0,634 0,03ns Erro 24 436,800 18,200
* Fc>F5%(1;24)=4,26 → rejeitar H0; ns = não significativo.
O modelo geral para estimar uma equação quando se usa o método dos polinômios ortogonais, é:
Y
=Y..+B
1M
1P
1+B
2M
2P
2+...+B
kM
kP
k+e
Para estimar uma equação, usa-se parte da equação geral, de acordo com o modelo determinado pelos testes de hipóteses das regressões. Considerando até o terceiro grau a determinação do grau da equação é feita segundo o esquema:
3 3 3 2 2 2 1 1 1
..
ˆ
Y
BM
P
B
M
P
B
M
P
Y
=
+
+
+
equação linear equação quadrática equação cúbicaem que:
Y..=
mˆ
= média geral do experimento;B
1=
iC
i1Y
i./J
iC
i21 ;=
iC
iY
iJ
iC
iB
2 2 2 2./
;B
=
iC
iY
iJ
iC
i 2 3 3 3./
; (Observe as semelhanças de B1,B2 e B3 com as SQRL, SQRQ e SQRC) ; M1 , M2 e M3 são obtidos das tabelas dos polinômios
ortogonais; P1 = x ; P2 = x2 - (I2-1)/12; P3 = x3 - x (3 I2 - 7)/20; I = número de tratamentos ou de níveis; x = variável padronizada =
(X
−
X)/h
; X = variável independente da equação estimada;X
=média da variável que define os tratamentos = (ΣiXi)/I; h=Xi+1-Xi = diferençaNo exemplo, como a equação significativa escolhida foi a do 2o grau, tomamos da equação geral a fração adequada, ou seja
Y Y B M P B M P=
..+
1 1 1+
2 2 2 em queY
= 460/30 = 15,333; M1 = 2; M2 = 3/2; B1 = 206/(5 x 70) = 0,5886; B2 = (-196)/(5 x 84) = -0,4667; P1=x;P
2x
2x
2 26
1
12
35 12
=
−
−
=
−
/
. Substituindo os termos (B1, B2, M1, M2, P1, P2) na equaçãogeral têm-se
Y=15 333 0 5886 2,
+(
,
)( )x+ −(
0 4667 3 2,
)(
/
)(x
2−35 12/
)
,
,
,
,
Y=15 333 11772+
x−0 70005x
2+2 042
,
,
,
Y b=
0+b x b x
1+
2 2Y
=17 375 11772+
x−0 70005x
2Se considerarmos que x =
(X X h−
)/
, em que h=20 eX
= (0+20+40+60+80+100)/6 =50, então x =(X-50)/20 e, como uma equação estimada pode ser interpretada apenas dentro dos limites de variação de X avaliado no experimento, no exemplo, o X varia entre 0 e 100 então x pode variar entre -50/20 e +50/20.Quando a equação está com a variável independente x na forma padronizada, as estimativas de b0, b1 e b2 são independentes, isto é, as suas covariâncias são nulas. Com isto,
( ) (
) ( ) ( ) ( ) ( )
( )
( )
V Y
=
V b
0+b x b x
1+
2 2=
V b
+V b x V b x+
=V b
+x V b
+x V b
0 1 2 2 0 2 1 4 2( )
V Y QME IJ x J C x J C i i i i = 1 + 2 + 1 2 4 22 e, estimativas por intervalo para o valor de Y para um dado valor de x =
(X X h−
)/
podem ser obtidos em nível 1-α de confiança, calculando os seus limites porY t±
(α 2/ )(GLE)V Y( )
e, se fizer isto para todo o valor de x no intervalo estudado pode-se construir um gráfico com a faixa de confiança (Figura 6.1).No exemplo, vamos obter uma estimativa por intervalo a 90% de confiança para X igual a 90. Neste caso, x = (90 - 50)/20 =2;
Y=17 375 11772 2,
+
,
( )−0 70005 2,
( )
2=16 9292,
;
( )
, * * ,V Y =18 2 301 +5 704 +5 8416 =1508 sendo o valor da tabela igual a
t
0 05 24, ( ) =2 064,
então 16 9292 2 064 1508, ± , , →16 9292 2 5346, ± , →P{14 3946,
≤ ≤Y
19 4638,
}=0 90,
Para uma melhor compreensão da equação, a mesma deve ser apresentada, em publicações, com a variável x despadronizada, isto é, substituir o termo x na equação por x =
(
X X h−)
/ . Para o exemplo, tem-se:, , , , , ,
Y=17 375 11772+ X20−50 −0 70005 X20−50 =10 0565 0 2338+ X−0 00175X
2
2 para X
pertencente ao intervalo entre 0 e 100.
Através do coeficiente de determinação (R2), obtém-se uma estimativa da qualidade do
ajustamento dos dados à equação, isto é, nos fornece a proporção de variação das médias dos tratamentos que é explicada pela equação. Este coeficiente é calculado por
R2=(SQ
R)/SQTrat. em que SQR=SQRL, para equações do 1o grau; SQR =SQRL+SQRQ, para
equações do 2o grau; SQ
R =SQRL+SQRQ+SQRC, para equações do 3o grau; etc.
Quando o número de tratamentos é pequeno e a equação ajustada tem poucos (ou nenhum) graus de liberdade para desvios do modelo, o coeficiente de determinação não faz muito sentido, pois é sempre próximo de um.
Para que os R2 se tornem comparáveis, para diferentes situações, convém calcular o R2
ajustado (R2aj.) em função do número I de tratamentos. Este ajustamento é obtido por:
[
]
R
R
p
I p
R
aj2
.=
2−
−1
1
2−
−
em que p é o número de parâmetros da equação (p=2, paraequação do 1o grau; p=3, para equação do 2o grau; etc.). Excluindo o caso em que R2=1,
temos R2
aj.<R2. No exemplo, o coeficiente de determinação é calculado por
R2=(SQ
RL+SQRQ)/SQTrat. sendo R2=(121,246+91,467)/214,267 =0,992 e com o ajustamento
pelo número de tratamentos e parâmetros estimados para a equação temos que:
[
]
R
aj20 992
3 1
6 3
1 0 992
0 987
.=
,
−
−
,
,
−
−
=
ou seja, 98,7% da variação na resposta (Y) é explicadapela variável X, através da equação.
Para melhor interpretar os resultados do experimento deve-se confeccionar um gráfico onde é desenhada a curva ajustada pela equação e discriminados os pontos observados, a equação estimada, o coeficiente de determinação e o ponto de máximo ou mínimo.
6.3 - Método geral
Quando os tratamentos não são eqüidistantes e/ou o número de repetições por tratamento não é o mesmo, o método dos polinômios ortogonais é dificultado, pois os coeficientes dos polinômios são diferentes. Assim, não se pode usar os coeficientes tabelados em função do número de tratamentos, e por isto, devem ser deduzidos. Nestes casos, é mais conveniente ajustar o modelo pelo método dos mínimos quadrados, usando diretamente os valores de Xi (valores dos tratamentos).
Supomos, novamente, o modelo básico como sendo
Y
ij=b
0+b X
1 i+b X
2 i2+b X
3 i3+ +δ
ie
ij e usando a notação matricial podemos escreverY X=
β ε+
em que Y é o vetor dos valores Yij observados na seqüência Y11, Y12 ...Y
InI ; X éa matriz das variáveis independentes ou matriz delineamento; β é o vetor dos parâmetros; e, ε
é o vetor dos erros que são independentes com distribuição normal de média zero e variância comum σ2. Discriminando, a forma matricial deste modelo, temos:
Y1 1 X1 X12 X13 b0 ε1 Y2 1 X2 X22 X23 b1 ε2 Y3 = 1 X3 X32 X33 b2 ε3 . . . . . . . . . . . . . . . b3 + . . . Yn 1 Xn Xn2 Xn3 εn em que
Y = [Y Y ...Y′
11 12 1n1Y Y
21 22...Y
2n2...Y Y
I1 I2...Y
InI]
= trat.1 com = trat.2 com =trat.I com n1 repetições n2 repetições nI repetições
e n = ΣΣΣΣini ; o primeiro vetor da matriz X é constituído unidade por ser o coeficiente da
constante b0 do modelo; o segundo vetor da matriz X é constituído pelas variáveis
independentes (Xij = tratamento i na repetição j) respectivamente às observações Yij; o terceiro
vetor da matriz X é igual ao quadrado de X, isto é, Xij2 = Xij*Xij ; o quarto vetor da matriz X é
igual ao cubo de X, isto é, Xij3 =Xij*Xij*Xij; β é o vetor dos parâmetros do modelo, isto é β’ = [ b0