• Nenhum resultado encontrado

ESTATÍSTICA EXPERIMENTAL:

N/A
N/A
Protected

Academic year: 2021

Share "ESTATÍSTICA EXPERIMENTAL:"

Copied!
320
0
0

Texto

(1)

ESTATÍSTICA EXPERIMENTAL:

ANÁLISE ESTATÍSTICA DE EXPERIMENTOS

Versão Preliminar

João Gilberto Corrêa da Silva

Universidade Federal de Pelotas Instituto de Física e Matemática

(2)
(3)

ESTATÍSTICA EXPERIMENTAL:

ANÁLISE ESTATÍSTICA DE EXPERIMENTOS

Versão Preliminar

João Gilberto Corrêa da Silva

(4)
(5)

Conteúdo

Capítulo Página

1. Delineamentos Experimentais Simples...

1

2. Discriminação da Variação Atribuível a Tratamentos ...

51

3. Derivações dos Delineamentos Simples ...

115

4. Experimentos Fatoriais ...

135

5. Delineamentos com Parcelas Divididas ...

185

6. Análise de Regressão e Correlação Linear Simples ...

213

7. Análise de Regressão Linear Múltipla ...

241

8. Pressuposições do Modelo Estatístico: Violações, Implicações,

Verificação e Remédios ... 269 Apêndice – Tabelas ... 301

(6)
(7)

1

Delineamentos Experimentais Simples

Conteúdo

1.1 Introdução ...1

1.2 Delineamento Completamente Casualizado ...3

1.2.1 Igual número de repetições dos tratamentos ...3

1.2.1.1 Introdução ...3

1.2.1.2 Estimação dos parâmetros por ponto ...4

1.2.1.3 Análise da variação ...8

1.2.1.4 Teste de hipótese ...10

1.2.2 Diferentes números de repetições dos tratamentos ...19

1.2.2.1 Introdução ...19

1.2.2.2 Estimação dos parâmetros por ponto ...20

1.2.2.3 Análise da variação ...20

1.3 Delineamento Blocos Casualizados ...23

1.3.1 Introdução ...23

1.3.2 Estimação dos parâmetros ...24

1.3.3 Análise da variação ...25

1.3.4 Teste de hipótese ...26

1.4 Delineamento Quadrado Latino ...30

1.4.1 Introdução ...30

1.4.2 Estimação dos parâmetros ...32

1.4.3 Análise da variação ...32

1.5 Precisão do experimento ...36

1.6 Mais de Uma Observação por Unidade Experimental ...38

1.6.1 Introdução ...38 1.6.2 Modelo estatístico ...38 1.6.3 Análise estatística ...39 1.7 Exercícios ...42 1.8 Exercícios de Revisão ...45

1.1

Introdução

Concluída a condução do experimento e estando disponíveis os seus resultados, deve ser procedida a análise estatística desses resultados para a derivação das inferências que constituem o objetivo do experimento.

Os procedimentos de análise estatística para a derivação dessas inferências devem basear-se no modelo estatístico que expresse a relação das variáveis respostas com as

(8)

características explanatórias e as características estranhas, que foi determinada pela estrutura do experimento. Em experimentos bem planejados, o modelo estatístico e esses correspondentes procedimentos de análise estatística são previstos no documento escrito do plano do experimento.

Nesse texto consideram-se procedimentos de análise estatística univariada, isto é, procedimentos apropriados para a análise estatística individual de variáveis respostas. Esses procedimentos de inferência são apropriados quando as variáveis respostas relevantes são de interesse individual e não apresentam estrutura de relação importante. Nessas circunstâncias as inferências relevantes para a consecução dos objetivos do experimento podem ser derivadas a partir das análises individuais dessas variáveis respostas.

Essa situação é muito frequente. De fato, em muitos experimentos, as variáveis respostas têm diferentes níveis de importância e as mais importantes, que devem ser submetidas à análise estatística, não apresentam relação estrutural relevante, de modo que podem ser consideradas individualmente. Deve ser observado, entretanto, que, mesmo nessa situação, procedimentos de análise estatística multivariada podem adicionar informações relevantes referentes à variação conjunta de variáveis respostas.

Usualmente, é conveniente que a aplicação de procedimentos de inferência estatística seja precedida de uma análise descritiva e exploratória dos resultados do experimento. Essa análise preliminar pode ser útil para: a) inspeção dos dados para a identificação de possíveis falhas e anomalias importantes; b) verificação de possíveis erros de especificação e de violações de pressuposições do modelo estatístico; e c) observação da coerência revelada pelos dados entre as expectativas, particularmente aquelas relacionadas com a hipótese científica, e a verificação empírica.

Os procedimentos de inferência estatística são de três tipos:

Estimação por ponto;

Estimação por intervalo - Intervalo de confiança;

Teste de hipótese.

O método de estimação por ponto de um parâmetro consiste em determinar para aproximação do valor desconhecido desse parâmetro um valor particular derivado a partir dos valores observados de uma amostra da população objetivo. Esse valor, que é uma função dos valores da amostra, é um estimador por ponto do parâmetro. O valor dessa função determinado a partir de uma amostra particular é uma estimativa por ponto desse parâmetro.

A estimativa determinada para um parâmetro é utilizada como se fosse o verdadeiro valor do parâmetro, sabendo o pesquisador que esse não é o caso. Então, é desejável que o estimador satisfaça algumas propriedades convenientes. As duas propriedades mais importantes são a não tendenciosidade e a variância mínima.

Um estimador de um parâmetro é não tendencioso se a média dos valores que ele determina para todas as amostras de tamanho n da população objetivo é o próprio valor do parâmetro. Ele é um estimador não tendencioso de variância mínima, também denominado

melhor estimador, se entre todos os estimadores não tendenciosos desse parâmetro ele é o de

menor variância. (Naturalmente, em geral, a consideração de todas as amostras de um dado tamanho n de uma população somente pode ser concebida abstratamente, particularmente para populações conceituais.)

O método de estimação por intervalo de um parâmetro consiste em determinar para aproximação do valor desconhecido desse parâmetro um intervalo derivado como função dos valores observados de uma amostra da população objetivo que contenha o parâmetro com uma dada probabilidade. Um intervalo determinado com a probabilidade 1-

α

de conter o valor de

(9)

um parâmetro é um intervalo de confiança para esse parâmetro com coeficiente de confiança 1-

α

.

O método de teste de hipótese referente a um conjunto de parâmetros é um processo de decisão entre duas hipóteses alternativas referentes a esse parâmetro com base nos valores observados de uma amostra; geralmente, uma hipótese que especifica uma forma de relação particular para esses parâmetros e uma hipótese que nega tal relação.

Esse Capítulo e o seguinte descrevem e ilustram a aplicação desses métodos de inferência para os delineamentos experimentais simples: completamente casualizados, blocos casualizados e quadrado latino, para a situação de um único fator experimental fixo e ausência de controle estatístico.

1.2

Delineamento Completamente Casualizado

1.2.1

Igual número de repetições dos tratamentos

1.2.1.1

Introdução

Considere-se um experimento unifatorial com delineamento completamente casualizado com t tratamentos e com um mesmo número r de repetições para todos os tratamentos. Denote-se por yij o valor observado da variável resposta na unidade experimental

correspondente à repetição j do tratamento i (i=1,2,...,t, j=1,2,...,r).

Postula que o valor observado yij da variável resposta tem a seguinte expressão:

yij = m + ti + eij, j=1,2,...,r; i=1,2,...,t,

onde m representa a média geral esperada, ti o efeito diferencial esperado do tratamento i e eij o

erro experimental. Em outras palavras, isso significa que m e ti representam, respectivamente, a

média geral e o efeito diferencial do tratamento i na população amostrada.

Supõe-se que os termos m e ti são constantes populacionais desconhecidas, ou seja,

parâmetros, e que o termo eij é uma realização de uma variável aleatória com distribuição

normal de média igual a zero e variância σ2, comum para todas as unidades experimentais. Supõe-se, ademais, que os erros experimentais de quaisquer duas unidades experimentais não são correlacionados, ou seja, que a correlação de eij e ei’j’ é nula para i≠i’ ou j≠j’. O

propósito do experimento é a derivação de inferências referentes aos parâmetros ti, ou m+ti.

Para a situação de modelo fixo, as inferências de interesse são: estimação por ponto e por intervalo, e testes de hipóteses.

Para a formulação de expressões correspondentes a conceitos importantes disponham-se os tr valores obdisponham-servados na amostra yij (i=1,2,...,t, j=1,2,...,r) em uma tabela com as

observações nas unidades experimentais de cada tratamento em uma mesma linha (Tabela

(10)

Tabela 1.1. Valores observados da variável resposta em um

experimento unifatorial com delineamento

completamente casualizado com t tratamentos e r repetições. Tratamento (i) Repetição (j) Soma yi. Média i y . 1 2 ... r 1 y11 y12 ... y1r y . 1 y . 1 2 y21 y22 ... y2r y . 2 y . 2 ... ... ... ... t yt1 yt2 ... ytr y . t y . t

O total e a média das observações de cada tratamento estão dispostos na penúltima e na última coluna da Tabela 1.1. A soma e a média das observações do tratamento i são denotadas, respectivamente, por y . e i y . i 1 (i=1,2,...,t), de modo que:

r i ij j 1 y. y = =

e i 1 i r y.= y..

O total geral e a média geral da amostra são denotados por y.. e y.., respectivamente:

t i i 1 y y . = =

.. e 1 y y.. n = . . .

onde n = tr é o total de unidades experimentais.

1.2.1.2

Estimação dos parâmetros por ponto

O método de estimação por ponto mais usual é o método dos quadrados mínimos.

Esse método de estimação consiste em determinar para estimadores dos parâmetros os correspondentes valores possíveis desses parâmetros que tornam mínima a soma dos quadrados dos erros eij = yij – m – ti correspondentes aos valores observados da variável resposta na

amostra, yij, i=1,2,...,t, j=1,2,...,r.

Assim, os estimadores de quadrados mínimos dos parâmetros m, t1,t2,...,tt são os

valores particulares m, t , t , ..., t ˆ ˆ ˆ1 2 ˆt 2 dos correspondentes conjuntos dos valores possíveis de m,t1,t2, ...,tt, respectivamente, que tornam mínima a função:

f(m,t1,t2,...,tt) = t r t r 2 2 ij ij i i 1 j 1 i 1 j 1 e (y m t ) = = = = = − −

∑∑

∑∑

.

A minimização dessa função quadrática dos parâmetros m e ti (i=1,2,...,t) pode ser

efetuada por sua derivação parcial em relação a cada um dos parâmetros e resolução do sistema de equações que resulta da anulação simultânea dessas derivadas parciais. Esse sistema de 1+t

1

Pontos no lugar de índices denotam soma dos valores da variável resposta em relação aos índices substituídos. A barra acima do símbolo da variável resposta denota média dos valores da variável resposta em relação aos índices substituídos por pontos.

2 Denotam-se os estimadores pelas mesmas letras utilizadas para simbolizar os correspondentes

(11)

equações a 1+t incógnitas (m,t1,t2, ...,tt) é indeterminado. Impondo a condição ˆt1+ + + = ˆt2 ... tˆt 0

para os estimadores ˆ ˆt , t ,..., t (análoga à condição t1 2 ˆt 1+t2+...+tt=0 imposta para aos

correspondentes parâmetros t1, t2,...,tt), obtém-se a seguinte solução única, que constitui o

conjunto dos estimadores de quadrados mínimos dos parâmetros: ˆ

m = y. .,

i i

ˆt

=

y

.

y

. ., i=1,2,...,t,

onde, conforme definido anteriormente, y.. é a média geral da amostra e yi. é a média dos

valores observados para o tratamento i.

Assim, o estimador da média da população amostrada é a média da amostra e o estimador do efeito diferencial de um tratamento é o desvio de sua média em relação à média da amostra.

Observe-se que:

i

ˆ

i i

ˆ

ˆ

m

= + =

m t

y

.,

de modo que yi. é o estimador da média populacional do i-ésimo tratamento.

O valor estimado (ou valor predito) pelo modelo postulado para a resposta na

unidade experimental correspondente à j-ésima repetição do tratamento i é definido como:

= + = i j i mˆ tˆ yˆ = mˆi = yi., i=1,2,...,t,

ou seja, a média observada do tratamento nessa unidade experimental.

Define-se como resíduo de uma unidade experimental o valor estimado do erro

experimental nessa unidade experimental determinado pela expressão do valor observado nessa unidade com os parâmetros substituídos pelos correspondentes estimadores:

ij ˆ ˆi ˆij

y = + + m t e = yˆij+ . eˆij

Então, o resíduo tem a seguinte expressão:

ij ij ˆi

ˆ ˆ

e = − − y m t = yij− yˆij = yij−yi..

O estimador de quadrados mínimos da variação atribuível ao erro experimental é a soma dos quadrados dos resíduos:

SQ Erro = t r t r 2 2 ij ij i i 1 j 1 i 1 j 1 ˆe (y y ) = = = = = −

∑∑

∑∑

. .

O estimador da variância atribuível ao erro experimental (variância casual) σ2 é, então:

2 1

t(r 1)

s SQ Erro

= ,

onde t(r-1) é o número de unidades de informação independentes (ou seja, não redundantes) referentes ao erro experimental, usualmente denominado número de graus de liberdade do

(12)

casual é o número de unidades experimentais menos o número de parâmetros linearmente independentes do modelo estatístico. Com o delineamento completamente casualizado apenas t dos t+1 parâmetros m, t1, t2,...,tt são linearmente independentes.

Exemplo 1.1. Considerem-se os resultados de um experimento que teve como

objetivo a comparação de seis cultivares de soja (denotadas por A, B, C, D, E e F), apresentados sobre o croqui do experimento, Figura 1.1.

C 46 A 64 E 39 C 48 B 53 D 56 F 46 C 43 F 50 B 51 F 65 C 35 A 59 D 45 D 45 F 59 E 59 B 55 A 50 E 53 E 53 A 63 D 42 B 69

Figura 1.1. Produção de grãos por parcela do experimento de

comparação de seis cultivares de soja do Exemplo 1.1,

registrada sobre o croqui do experimento.

Inicialmente, as observações são arranjadas em uma tabela apropriada para os cálculos (Tabela 1.2) organizada de modo semelhante à Tabela 1.1. (Observe-se que a ordem das

repetições de cada tratamento é irrelevante.)

Tabela 1.2. Resultados do experimento do Exemplo 1.1 dispostos

em uma tabela apropriada para a execução da análise estatística. Tratamento (i) Repetição (j) Soma . i y Média . i y tˆ i 1 2 3 4 1 - A 64 59 50 63 236 59 7 2 - B 53 51 55 69 228 57 5 3 - C 46 48 43 35 172 43 -9 4 - D 56 45 45 42 188 47 -5 5 - E 39 59 53 53 204 51 -1 6 - F 46 50 65 59 220 55 3 Total geral: y.. =1.248 0 Média geral: y.. =52

As somas e médias de tratamentos são facilmente calculadas e preenchidas nas colunas próprias da Tabela 1.2. O total geral e a média geral dos resultados do experimento

(13)

y1. = y11 + y12 + y13 + y14 = 64 + 59 + 50 + 63 = 236, donde: 1 i. 1 1 4 r y.= y = 236 =59, y.. = y1. + y2. + ... + y6. = 236 + 228 + ... + 220 = 1.248 e 1 1 24 tr y..= y. .= 1.248 =52.

As estimativas das médias esperadas dos tratamentos e da média esperada do experimento estão assim determinadas, já que mˆi=yi. e ˆm y= . .. As estimativas dos efeitos esperados dos tratamentos são, então, imediatamente determinadas e preenchidas na última coluna da tabela; por exemplo:

1 1

ˆt = y.−y.. = 59-52 = 7. A soma dessas estimativas é nula.

O valor estimado da variável resposta para a parcela correspondente à repetição 1 do tratamento 1 é:

11 ˆ ˆ1 1

ˆy = + =m t y . =59.

O resíduo para esta mesma parcela é, então:

11 11 1

ˆe = y −y.=64 59− =5.

Os valores estimados e os resíduos assim determinados para todas as parcelas do experimento são apresentados na Tabela 1.3, ao lado dos valores observados. Note-se que a

soma dos resíduos é nula para cada tratamento.

Tabela 1.3. Valores observados, valores estimados e resíduos das parcelas do

experimento do Exemplo 1.1.

Valor observado Valor estimado Resíduo

Trat. Repetição Trat. Repetição Trat. Repetição

1 2 3 4 1 2 3 4 1 2 3 4 1 64 59 50 63 1 59 59 59 59 1 5 0 -9 4 2 53 51 55 69 2 57 57 57 57 2 -4 -6 -2 12 3 46 48 43 35 3 43 43 43 43 3 3 5 0 -8 4 56 45 45 42 4 47 47 47 47 4 9 -2 -2 -5 5 39 59 53 53 5 51 51 51 51 5 -12 8 2 2 6 46 50 65 59 6 55 55 55 55 6 -9 -5 10 4

A estimativa da variação casual, ou seja, a soma dos quadrados dos resíduos é, então: SQ Erro = 52 +02 +(-9)2 +...+42 = 972;

donde se obtém a estimativa da variância casual:

2 1 1 18 6(4 1) s SQ Erro 972 54 − = = = .

(14)

1.2.1.3

Análise da variação

Os procedimentos para os testes de hipóteses referentes aos parâmetros do modelo são baseados na análise da variação. A análise da variação é o procedimento algébrico que

consiste em decompor a variação total das observações em componentes atribuíveis às fontes de variação sistemáticas no experimento (ou seja, fatores e variáveis estranhas controladas) e ao erro experimental. Tais componentes correspondem exatamente aos termos considerados na equação do modelo estatístico, excluída a média geral esperada do experimento. Assim, em experimento unifatorial com delineamento completamente casualizado, a variação total é decomposta em duas fontes: tratamento e erro. De fato, substituindo os parâmetros pelos respectivos estimadores na equação do modelo para a observação na parcela correspondente à j-ésima repetição do tratamento i, obtém-se:

ij i ij mˆ tˆ eˆ y = + + , donde: ij i ij mˆ tˆ eˆ y − = + , isto é, ij ˆi ˆij y −y.. = +t e = = (yi.−y ) (y.. + ij−y )i. .

Dessa forma, o desvio da observação em relação à média geral (desvio total da

observação) é a soma do efeito estimado do tratamento e do resíduo na parcela. Elevando ambos os membros ao quadrado, obtém-se:

2 2 2

ij i. ij i i ij i

(y −y ).. = (y −y ).. +(y −y ). +2(y .−y )(y. . −y ). .

Somando ambos os membros para todas as observações (isto é, para todos os valores dos índices), resulta: t r t t r 2 2 2 ij i ij i i 1 j 1 i 1 i 1 j 1 (y y ) r (y y ) (y y ) = = = = = − = − + −

∑∑

..

. ..

∑∑

. ,

já que a soma correspondente ao último termo é nula e:

t r r t t 2 2 2 i i i i 1 j 1 j 1 i 1 i 1 (y y ) (y y ) r (y y ) = = = = =   − = = −  

∑∑

. . .

∑ ∑

. ..

. .. .

A penúltima equação é a equação fundamental da análise da variação para o

delineamento completamente casualizado. Ela exprime a variação total dos valores observados da variável resposta como a soma da variação atribuível aos efeitos de tratamentos e da variação atribuível ao erro experimental. Seu primeiro membro é denominado soma de quadrados total e os dois termos do segundo membro, respectivamente, soma de quadrados de tratamento e soma de quadrados do erro.

Simbolicamente, essa equação pode ser expressa na forma: SQ Total = SQ Tratamento + SQ Erro.

Correspondentemente, os n-1 graus de liberdade referentes às n=tr observações do experimento são decompostos em t-1 graus de liberdade para os t tratamentos e tr-1-(t-1) = t(r-1) graus de liberdade para o erro:

(15)

A decomposição da variação total é usualmente apresentada em uma tabela,

denominada tabela da análise da variação, Tabela 1.4.

Tabela 1.4. Esquema da análise da variação para experimento

unifatorial completamente casualizado com igual número de repetições dos tratamentos.

Fonte de variação GL SQ Tratamento t-1 SQ Trat. = t 2 i i 1 r (y y ) = −

. .. Erro t(r-1) SQ Erro = t r 2 ij i i 1 j 1 (y y ) = = −

∑∑

. Total tr-1 SQ Total = t r 2 ij i 1 j 1 (y y ) = = −

∑∑

..

Os quocientes das somas de quadrados de tratamento e do erro pelos correspondentes graus de liberdade, nas respectivas linhas da tabela da análise da variação, são denominados

quadrados médios, indicados por:

QM Tratamento = SQ Tratamento/(t-1) e QM Erro = SQ Erro/t(r-1).

As expressões das somas de quadrados da Tabela 1.4 são denominadas fórmulas de

definição. Elas são úteis por darem idéia da origem das respectivas fontes de variação que

exprimem. Entretanto, para cálculo em calculadoras não programáveis, podem ser mais convenientes as seguintes expressões equivalentes, usualmente denominadas fórmulas de cálculo: SQ Total = t r 2 ij i 1 j 1 y C = = −

∑∑

, SQ Tratamento = t 2 i i 1 1 r

= y .−C,

onde o termo C, denominado termo de correção (para a média), tem a seguinte expressão:

2 t r 2 2 ij i 1 j 1 1 C y y tr y tr

1

tr

= =   =  = = 

∑ ∑

.. . ..

A SQ Erro pode ser obtida por diferença:

SQ Erro = SQ Total – SQ Tratamento.

Exemplo 1.1 (continuação). Para os dados do experimento do Exemplo 1.1 tem-se,

utilizando resultados nas Tabelas 1.2 e 1.3:

SQ Tratamento = 4[72 +52 +...+32 ] = 760, SQ Erro = 52 +02 +...+42 = 972 e

SQ Total = (64-52)2 +(59-52)2 +...+(59-52)2 = 1.732.

Esses resultados são apresentados em uma tabela de análise da variação, completada com os graus de liberdade e os quadrados médios, Tabela 1.5.

(16)

Tabela 1.5. Tabela da análise da variação para os dados de produção

de grãos do experimento do Exemplo 1.1.

Fonte de variação GL SQ QM

Tratamento 5 760 152

Erro 18 972 54

Total 23 1.732

Esses mesmos resultados podem ser obtidos pelas fórmulas de cálculo, a partir dos resultados na Tabela 1.2, como segue:

2 1 24 C = 1.248 =64.896, SQ Total = 642 +592 +...+592 - C = = 66.628 - 64.896 = 1.732, SQ Trat. = 4 1 (2362 +2282 +...+2202 ) - C = = 65.656 - 64.896 = 760,

SQ Erro = SQ Total – SQ Tratamento = = 1.732 - 760 = 972.

1.2.1.4

Teste de hipótese

O processo lógico para a derivação de inferências referentes aos efeitos dos tratamentos num experimento é a comparação de duas fontes de variação:

1) variação entre as unidades experimentais com diferentes tratamentos, atribuível ao erro experimental e aos efeitos dos tratamentos, se existentes, e

2) variação entre as unidades experimentais com um mesmo tratamento - atribuível exclusivamente ao erro experimental.

Se a primeira fonte de variação revela-se consideravelmente superior à segunda, de modo a não poder tal superioridade ser atribuível apenas às distintas formas de estimação do erro experimental, então, o experimento evidencia a existência de efeitos diferenciais reais de tratamentos.

A hipótese científica de um experimento é formulada positivamente, na forma genérica: “os efeitos dos tratamentos sobre a variável resposta diferem”. De modo geral, duas diferentes formas de estimar o erro experimental conduzirão a diferentes estimativas, mesmo na ausência de efeitos diferenciais de tratamentos. Por essa razão, o procedimento estatístico para o teste de uma hipótese científica consiste em iniciar com a formulação de uma versão negativa dessa hipótese, ou seja, com uma hipótese da forma: “os efeitos dos tratamentos não diferem”. Então, se a variação entre as unidades experimentais com diferentes tratamentos se revela consideravelmente superior à variação entre as unidades experimentais com um mesmo

(17)

tratamento, essa hipótese é rejeitada, concluindo-se pela existência de diferenças reais entre os efeitos de tratamentos.

A hipótese estatística compreende o conjunto de duas hipóteses - a hipótese de negação: “os efeitos dos tratamentos não diferem”, denominada hipótese de nulidade, e a

hipótese complementar, ou seja: “os efeitos dos tratamentos diferem”, denominada hipótese alternativa. Essas duas hipóteses são usualmente denotadas simbolicamente por H0 e HA,

respectivamente.

A hipótese estatística (ou seja, as hipóteses de nulidade e alternativa) referente à existência de efeitos diferenciais esperados dos tratamentos, pode ser simbolicamente formulada como segue:

H t i t H t para tratamento i A i 0 0 1 2 0 : , , ,..., : , = = ≠    algum

Dada a relação mi = m + ti, i=1,2,...t, e a condição imposta aos parâmetros t1+t2+...+tt=0, essa

hipótese estatística pode ser alternativamente expressa em termos das médias esperadas (populacionais) dos tratamentos, na forma:

   ′ = = = = i e i , s tratamento dos par um menos pelo para , m m : H m ... m m : H ' i i A t 2 1 0

Procedimento para o teste da hipótese referente aos efeitos dos tratamentos

O quadrado médio de uma fonte de variação é a variação atribuível a esta fonte

referente a uma unidade de informação independente provida pelo experimento, ou seja, é o quociente da correspondente soma de quadrados pelos respectivos graus de liberdade. Então, os quadrados médios correspondentes ao erro experimental e aos efeitos de tratamentos são, respectivamente,

QM Erro = SQ Erro ÷ GL Erro e

QM Tratamento = SQ Tratamento ÷ GL Tratamento.

Demonstra-se que o valor populacional estimado pelo QM Erro é a variância do erro experimental, ou variância casual, ou seja, que:

E(QM Erro) = σ2,

o que significa que o QM Erro é um estimador não tendencioso da variância casual σ2. Também pode ser demonstrado que:

E(QM Tratamento) = t 2 2 i i 1 r t 1− = t σ +

.

Isso significa que o QM Tratamento é um estimador tendencioso da variância casual σ2, com

viés não negativo

t 2 i i 1 r t 1−

= t

. O QM Tratamento será um estimador não tendencioso de σ2 se e

somente se t 0 t 1 i 2 i =

=

, ou seja, se e somente se ti=0, i=1,2,...,t, pois nesse caso, E(QM

Tratamento) = σ2. Esta condição corresponde à hipótese de nulidade H0.

Demonstra-se, também, que:

2

(r 1)QM Erro

V −

σ

(18)

tem distribuição qui-quadrado com t(r-1) graus de liberdade, denotada por χ2t(r1), e que, sob a hipótese de nulidade H0: 2 (t 1) QM Tratamento U − σ =

tem distribuição qui-quadrado com t-1 graus de liberdade, ou seja, 2 1 t −

χ . Ademais, QM Erro e QM Tratamento são estatisticamente independentes.

O quociente de duas variáveis aleatórias com distribuições qui-quadrado independentes é uma variável aleatória com distribuição F, ou seja: Se U e V são variáveis

aleatórias independentes com distribuições qui-quadrado com ν1 e ν2 graus de liberdade,

respectivamente, então, a variável aleatória F =

2 1 / V / U ν ν

tem distribuição F com ν1 e ν2 graus de

liberdade, o que é denotado por

2 1,

Fν ν .

Logo, no presente caso, a estatística:

F = 2 1 / V / U ν ν = = Erro QM Tratamento QM

tem distribuição Ft-1,t(r-1). A função densidade de probabilidade de uma variável aleatória F com

esta distribuição tem a representação gráfica da forma ilustrada na Figura 1.2. (Recorde-se que

a probabilidades da ocorrência de valores de uma variável aleatória em um intervalo correspondem à área sob a curva de sua função de densidade de probabilidade compreendida entre os extremos desse intervalo; a área total sob a curva é igual a 1, o que significa a certeza da ocorrência de algum valor da variável aleatória).

Figura 1.2. Representação gráfica da distribuição F.

Observe-se, entretanto, que, se a hipótese de nulidade H0 não é verdadeira, então, o

QM Tratamento superestima a variância do erro σ2. Nesse caso, a estatística:

F =

Erro QM

Tratamento QM

(19)

não tem distribuição F. Nessa situação; esta estatística tem distribuição F não central com

parâmetro de não centralidade

= σ t 1 i 2 2 i

/

t

r . Probabilidades de valores desta estatística F

não central situadas na cauda direita são superiores às probabilidades de valores da variável aleatória F na correspondente cauda. As representações gráficas das funções de densidade de probabilidade destas duas estatísticas são ilustradas na Figura 1.3.

Figura 1.3. Representação gráfica da distribuição da estatística F sob a hipótese H0

(distribuição F central - linha contínua) e da distribuição F sob a hipótese HA (distribuição F não central - linha tracejada).

O teste de hipótese é um processo de decisão sob incerteza. O pesquisador não sabe qual das duas hipóteses H0 e HA é a correta, exprimindo a verdadeira situação. Com base na

evidência provida pelo experimento, ele deve decidir em favor de H0 ou de HA. Uma das quatro

seguintes situações pode resultar desse processo de decisão: a hipótese H0 é a verdadeira

situação e o pesquisador decide em favor desta hipótese ou em favor da hipótese alternativa, ou a hipótese HA é verdadeira e o pesquisador decide em favor desta hipótese ou em favor da

hipótese de nulidade. Se a decisão do pesquisador coincidir com a verdadeira situação, a decisão será correta; caso contrário, a decisão será incorreta. Nessas circunstâncias, a decisão derivada poderá ser correta ou incorreta (o que o pesquisador jamais saberá!). Há duas possibilidades de decisão correta e duas possibilidades de decisão incorreta, conforme é mostrado na Tabela 1.6.

Tabela 1.6. Decisões alternativas que podem resultar do processo de

teste de uma hipótese estatística.

Verdadeira situação Decisão H0 HA H0 Correta Incorreta Erro tipo I HA Incorreta

(20)

O erro que corresponde à decisão incorreta de rejeitar a hipótese de nulidade quando ela exprime a situação real (ou seja, na presente circunstância, declarar a existência de diferenças entre os efeitos de tratamentos quando estes são iguais) é denominado erro tipo I. A

probabilidade desse erro em um teste de hipótese é denotada pela letra grega

α

. O outro erro de decisão, correspondente a aceitar a hipótese de nulidade quando a alternativa exprime a realidade (ou seja, no presente caso, declarar os efeitos de tratamentos iguais quando eles realmente diferem) é denominado erro tipo II; sua probabilidade é denotada pela letra grega

β

. Muito frequentemente, o pesquisador tem a expectativa da presença de efeitos reais de tratamentos e executa o experimento para comprovar essa expectativa objetivamente. Nessas circunstâncias, o pesquisador deseja que o teste de hipótese atribua probabilidade elevada de declarar a presença de efeitos diferenciais dos tratamentos se esses efeitos forem reais. Essa probabilidade, expressa por 1-

β

, é denominada potência do teste.

Seria desejável a fixação de ambas as probabilidades

α

e

β

em valores muito

pequenos, próximos de zero. Entretanto,

α

e

β

não podem ser ambos escolhidos

convenientemente pequenos. De fato, a diminuição de

α

implica no aumento de

β

e vice-versa. Então, muito frequentemente, o pesquisador fixa apenas

α

= Prob.(Erro tipo I) em um

valor convenientemente pequeno, mas não demasiadamente pequeno para que

β

= Prob.(Erro

tipo II) não resulte inconvenientemente alta. Um teste de hipótese nessas circunstâncias é denominado teste de significância; o valor

α

, arbitrariamente escolhido é denominado nível de significância do teste.

O argumento desse processo é o seguinte: Se a hipótese H0 é correta, a estatística F

tem a distribuição indicada em linha contínua na ilustração da Figura 1.3; caso contrário, a

distribuição da estatística F é da forma indicada em linha tracejada, com área sob a curva mais concentrada à direita. Então, se a hipótese H0 é correta, valores da estatística F em uma cauda

direita de pequena área são muito pouco prováveis; tais valores elevados de F são mais prováveis se a hipótese correta é a HA.

Assim, na ignorância da verdadeira situação (H0 ou HA?), uma regra de decisão

natural é a seguinte: Se o valor da estatística F determinado no experimento situa-se em uma área que corresponde uma probabilidade razoavelmente grande (seja 1-

α

,

α

pequeno) de sua ocorrência sob a hipótese de nulidade H0 se aceita esta hipótese; caso contrário, ou seja, se o

valor da estatística F é elevado, situando-se na área complementar à direita daquela, que corresponde a uma probabilidade de sua ocorrência sob H0 (ou seja,

α

) consideravelmente

(21)

Figura 1.4. Região de aceitação e região de rejeição da hipótese H0

do processo de decisão no teste de uma hipótese estatística.

O valor de F na fronteira dessas duas áreas, denotado por Fα, demarca duas regiões: (0, Fα): Região de aceitação de H0 e

(Fα,∞): Região de rejeição de H0.

Assim, o nível de significância

α

escolhido para um teste de hipótese estabelece como

região de rejeição da hipótese de nulidade H0 a cauda superior da distribuição F com área

α

.

A hipótese de nulidade será rejeitada se o valor da estatística F observado no experimento situar-se nessa região; caso contrário, ou seja, se o valor observado de F situar-se na região complementar, à esquerda daquela, denominada região de aceitação, a hipótese H0 será aceita.

Claro que com esse processo de decisão sob incerteza o pesquisador corre o risco inevitável de rejeitar a hipótese H0 em situações em que ela é verdadeira (risco ou erro tipo I)

com probabilidade

α

, assim como, também, o risco de aceitar a hipótese H0 quando a

alternativa HA é a verdadeira (risco ou erro tipo II), com probabilidade

β

.

As probabilidades desses dois erros de decisão devem ser estabelecidas a priori, ou seja, no plano do experimento. A escolha das probabilidades

α

e

β

deve ser feita para cada experimento, com base no julgamento da seriedade relativa dos dois tipos de erro e sabendo que a desejável diminuição de

α

implica no aumento de

β

e vice-versa.

Em um teste de significância, o pesquisador fixa a probabilidade

α

de erro tipo I (nível de significância do teste) em um valor convenientemente pequeno (mas não

demasiadamente pequeno que implique em valor indesejavelmente grande de

β

), não

determinando a probabilidade

β

de erro tipo II.

O nível de significância

α

= 0,05 tem sido tradicionalmente adotado, de modo generalizado. Essa escolha implica na admissibilidade da rejeição incorreta da hipótese de nulidade em 5% dos casos.

Observe-se que, em geral, a rejeição da hipótese de nulidade H0 é mais forte do que sua aceitação. De fato, a aceitação de H0 pode decorrer de: a) inexistência de diferenças de

(22)

efeitos de tratamentos, ou b) insuficiente sensibilidade (precisão) do experimento para revelar diferenças reais de efeitos de tratamentos.

Procedimento para o teste de significância

O teste de significância dos efeitos de tratamentos (ou da variação atribuível a tratamentos) pode ser efetuado com o auxílio de tabelas de pontos percentuais superiores da distribuição F, que apresentam os valores Fα que demarcam caudas superiores da distribuição F correspondentes a algumas probabilidades (áreas das caudas superiores), mais comumente 0,05, 0,01 e 0,001 (Tabela A1 do Apêndice).

Para efetuar o teste de significância com o auxílio dessas tabelas o pesquisador compara o valor da estatística F observado no experimento com o valor Fα tabelado para o nível de significância α escolhido. Se o valor observado de F é superior ao valor Fα da tabela, a hipótese de nulidade H0 é rejeitada, atribuindo-se tal fato a diferenças reais entre os efeitos dos

tratamentos. Diz-se, então, que "a variação atribuível aos efeitos de tratamentos foi significativa", ou que "os efeitos de tratamentos foram significativos". Caso contrário, ou seja, se o valor de F observado no experimento é inferior ao valor Fα da tabela, a hipótese H0 é

aceita, concluindo-se que a "a variação atribuível aos efeitos de tratamentos não foi significativa", ou que "os efeitos de tratamentos não foram significativos".

Naturalmente, a confiabilidade da rejeição da hipótese de nulidade será tanto maior quanto mais elevado for o valor da estatística F observado no experimento. Por isso, em um teste com nível de significância α, alguns textos recomendam a comparação do valor observado de F também com valores de referência da tabela que demarcam áreas superiores da distribuição F menores que α. Assim, na situação mais usual em que o nível de significância

(algumas vezes também denominado nível mínimo de significância) escolhido é

α

= 0,05, se

o valor observado Fo de F é maior que o valor de F que demarca a área superior 0,05, ou seja,

F0,05, o valor Fo também é comparado com F0,01 e F0,001. Então, a significância da variação

atribuível aos efeitos de tratamentos pode ser qualificada pela indicação da posição do valor observado Fo relativamente a esses valores F0,05, F0,01 e F0,001 da tabela, ou, equivalentemente,

pela indicação do nível de probabilidade alcançado pelo valor observado da estatística F, ou seja, pela indicação da grandeza da área superior P da distribuição F demarcada por Fo

relativamente a essas probabilidades 0,05, 0,01 e 0,001 (Figura 1.5).

Fo < F0,05 → P > 0,05: não significativa

F0,05 < Fo < F0,01 → P < 0,05: significativa

F0,01 < Fo < F0,001 → P < 0,01: muito significativa

Fo > F0,001 → P < 0,001: altamente significativa

Figura 1.5. Qualificação da significância dos efeitos atribuíveis a tratamentos, em testes

de significâncias efetuados com o uso de tabelas da distribuição F.

O resultado do teste de significância é muito frequentemente indicado na tabela da análise da variação pela colocação, ao lado do valor observado da estatística F, de um dos seguintes símbolos, na ordem das situações alternativas indicadas na Figura 1.5: - (ou ns), *,

** e ***. Alternativamente, pode-se preencher numa última coluna daquela tabela, encabeçada por “P” ou “Prob. > F”, o nível de probabilidade alcançado pelo valor observado da estatística F (>0,05, <0,05, <0,01 e <0,001, respectivamente).

(23)

As facilidades atuais de computação, propiciadas por equipamentos eletrônicos e programas ("pacotes") de análise estatística, permitem a determinação da probabilidade de valores de F superiores a um valor particular F' qualquer da distribuição F. Assim, resultados de análises estatísticas efetuadas com esses recursos informam a probabilidade de um valor de F superior ao valor da estatística F observado no experimento, denotada por Prob.>F, ou, mais simplesmente, por P.

Com esse recurso, a decisão do teste de significância é obtida pela comparação do valor Prob.>F determinado para o experimento com o nível de significância α previamente escolhido. Então, se “Prob.>F” <

α

, rejeita-se a hipótese H0; caso contrário, ou seja, se

“Prob.>F” >

α

, se aceita a hipótese H0 (Figura 1.6). Para esses dois resultados alternativos, a

conclusão do teste de significância é, respectivamente: "a variação atribuível a tratamentos foi significativa (P=...)", com a indicação do valor de Prob.>F entre parênteses, e "a variação atribuível a tratamentos não foi significativa (P >

α

)”.

Figura 1.6. Decisão em um teste de significância segundo a

grandeza relativa do valor “Prob. > F” e do nível de significância

α

.

A indicação de valores de Prob.>F em publicações técnico-científicas é muito útil por propiciar ao leitor condições para seu próprio julgamento referente à confiabilidade da rejeição ou aceitação da hipótese de nulidade.

É importante salientar que não há qualquer razão lógica para o uso generalizado e tradicional do valor

α

= 0,05 para nível de significância. Essa escolha implica na rejeição incorreta da hipótese de nulidade em 5% dos casos; ou seja, na rejeição incorreta da hipótese H0 em aproximadamente 5 de 100 repetições do experimento. Como a gravidade relativa dos

erros tipo I e tipo II varia segundo o experimento, é mais apropriado que o pesquisador estabeleça o nível de significância

α

(probabilidade do erro tipo I) e, por consequência, a probabilidade

β

do erro tipo II para cada experimento, segundo sua apreciação da seriedade relativa dos erros tipo I e tipo II para cada caso particular.

Exemplo 1.1 (continuação). Considere-se o teste de significância da variação

atribuível a cultivares para o experimento do Exemplo 1.1, com nível de significância α=0,05.

O valor observado da estatística F é: 152

54

F= =2,815.

1) Uso de valores de F disponíveis em tabelas: Compara-se esse valor observado F=2,815 da estatística F com os valores da estatística F providos pela Tabela A1 do Apêndice,

(24)

5;18 2, 77, P 0, 05 F (P) 4, 25, P 0, 01 6,81, P 0, 001 =   = =  =

Como o valor observado F=2,815 é superior ao valor F da tabela para P=0,05, ou seja, F5;18(0,05)=2,77, a hipótese de nulidade dos efeitos de cultivares é rejeitada. Entretanto, esse

valor observado de F é inferior ao F5;18(0,01) =4,25. Então, a conclusão do teste de

significância pode ser expressa, abreviadamente, pela sentença "a variação atribuível aos efeitos de cultivares foi significativa (P=0,05)”. Os resultados da análise da variação e do teste de significância da variação (global) atribuível a cultivares podem ser apresentados na tabela da análise da variação, Tabela 1.7.

Tabela 1.7. Resultados da análise da variação e do teste de

significância dos efeitos de tratamentos, para os dados do

Exemplo 1.1.

Fonte de variação GL SQ QM F

Tratamento 5 760 152 2,815 *

Erro 18 972 54

Total 23 1.732

2) Uso de valores “Prob.>F” providos por computação eletrônica. Compara-se o valor (Prob.>F) =0,0476 com o nível de significância

α

=0,05, pré-estabelecido. Como o valor (Prob.>F) =0,0476 é inferior a

α

=0,05, a hipótese de nulidade é rejeitada. A conclusão do teste de significância pode ser expressa, abreviadamente, pela sentença "a variação atribuível aos efeitos de cultivares foi significativa (P=0,0476)".

Note-se que, com o primeiro processo de decisão estrito, a hipótese de nulidade é rejeitada pela observação de um valor da estatística F levemente superior ao valor tabelado para P=0,05, e que um valor circunstancial levemente inferior ao valor tabelado (por exemplo, F=2,76) conduziria à aceitação da hipótese de nulidade. Esse processo rígido de decisão não é razoável. Essa é uma razão para a conveniência a adoção do segundo procedimento baseado em resultados providos pelo uso de computadores. O conhecimento da probabilidade da cauda superior limitada pelo valor observado da estatística F e sua indicação na expressão do resultado ou conclusão do teste de significância permite uma apreciação mais adequada do resultado do teste de significância do que a indicação simbólica por meio de asteriscos, baseada apenas em níveis de probabilidade discretos disponíveis em tabelas. No presente exemplo, o processamento da análise da variação e do teste de significância da variação atribuível a cultivares por computador produz os resultados resumidos na Tabela 1.8.

(25)

Tabela 1.8. Resumo da análise da variação e resultado do teste de

significância dos efeitos de cultivares processados por um "pacote" de análise estatística. Dados do Exemplo 1.1.

Fonte de variação GL SQ QM F Prob.>F

Tratamento 5 760 152 2,815 0,0476

Erro 18 972 54

Total 23 1.732

A Figura 1.7 mostra a relação entre os dois processos de teste de significância: a)

comparação do valor observado F da estatística F com o valor Fα desta estatística, que limita cauda de área

α

, e b) comparação da probabilidade de obter um valor da estatística F superior ao valor observado desta estatística, Prob.>F, com o nível de significância

α

.

Figura 1.7. A hipótese H0 é rejeitada porque, para o nível de significância

escolhido α=0,05, (F=2,815) > (Fα=2,77) ou,

equivalentemente, [(Prob.>F)=0,0476] < α.

1.2.2

Diferentes números de repetições dos tratamentos

1.2.2.1

Introdução

No delineamento completamente casualizado o número de repetições pode não ser o mesmo para todos os tratamentos. Números diferentes de repetições podem decorrer do próprio plano do experimento ou da decisão de desconsiderar os resultados de algumas unidades experimentais. A primeira situação pode resultar, por exemplo, de restrições do material experimental, que pode não ser suficiente para o número de repetições desejável para todos os tratamentos (a quantidade de semente disponível para algumas cultivares pode ser escassa, por exemplo), ou da necessidade ou conveniência de adotar números diferentes de repetições para dois ou mais grupos de tratamentos (em algumas circunstâncias, pode ser conveniente um número de repetições mais elevado para o tratamento testemunha, por exemplo). Por outro

(26)

lado, ocorrências fortuitas durante a execução do experimento (por exemplo, morte de plantas ou animais, prejuízo causado por agentes estranhos e falta de registro ou registro equivocado de medidas) podem originar fontes de variação estranhas que ficam confundidas com os efeitos de tratamentos. Nestas circunstâncias, pode ser mais conveniente desconsiderar a resposta nas unidades experimentais afetadas, originando-se o que se denomina parcela perdida. Nesse

caso, o procedimento de análise estatística resulta ligeiramente alterado.

Seja ri o número de repetições do i-ésimo tratamento (i=1,2,...,t). A equação do

modelo estatístico para a resposta observada na parcela correspondente à j-ésima repetição do tratamento i é, então,

yij = m + ti + eij, j=1,2,...,ri, i=1,2,...,t.

As pressuposições referentes aos termos dessa equação, para completar a especificação do modelo estatístico, são as mesmas listadas para a situação de igual número de repetições dos tratamentos. Entretanto, agora, é conveniente impor a seguinte restrição aos efeitos esperados dos tratamentos: r1 t1 +r2 t2 +...+rt tt =0.

1.2.2.2

Estimação dos parâmetros por ponto

Os estimadores de quadrados mínimos dos parâmetros têm expressões semelhantes às anteriores, com as adequadas alterações para levar em conta os diferentes números de repetições dos tratamentos:

ˆ m = y. . e ˆti = yi.−y. ., onde: 1 n y. . = y.., t i i 1 n r = =

, i r t ij i 1 j 1 y y = = =

∑∑

. . e i i i 1 r y = y . . , i r i ij j 1 y y = =

. .

1.2.2.3

Análise da variação

O esquema da análise da variação, com as fontes de variação e os correspondentes graus de liberdade e expressões de definição e de cálculo das somas de quadrados, é apresentado na Tabela 1.9.

(27)

Tabela 1.9. Esquema da análise da variação para experimento unifatorial

completamente casualizado com diferentes números de repetições.

Fonte de variação GL

SQ

Fórmula de definição Fórmula de cálculo 1

Tratamento t-1 t 2 i i i 1 r (y y ) = −

. . . i t 2 i i 1 1 y r C = −

. Erro

= − t 1 i i 1) r ( i r t 2 ij i i 1 j 1 (y y ) = = −

∑∑

. Por diferença Total n-1=

= − t 1 i i 1 r i r t 2 ij i 1 j 1 (y y ) = = −

∑∑

.. i r t 2 ij i 1 j 1 y C = = −

∑∑

1 t 2 2 i i 1 y 1 n C n y , onde: n r . = = ..= .. =

Exemplo 1.2. Considere-se um experimento que teve como objetivo a avaliação da

eficácia do uso do Triclabendazole para o controle da fascíola em bovinos de corte, aplicado em épocas estratégicas, no intervalo do desmame ao abate. O experimento constou dos seguintes tratamentos: 1-Triclabendazole quatro vezes ao ano, 2-Triclabendazole duas vezes ao ano, 3-Controle. O experimento foi conduzido com 32 animais, dos quais 12 foram atribuídos ao tratamento 1, 12 ao tratamento 2 e 8 ao tratamento 3. Os tratamentos foram aplicados aos animais individualmente a partir do desmame e os animais foram mantidos juntos, em um mesmo potreiro. Os dados de peso ao abate, em kg por animal, são apresentados na Tabela 1.10, que inclui as estimativas determinadas para os parâmetros do modelo estatístico.

(28)

Tabela 1.10. Resultados do experimento do Exemplo 1.2 - Peso ao abate, em kg/animal. Animal (j) Tratamento (i) 1 2 3 1 366 404 338 2 374 329 369 3 311 384 393 4 358 440 312 5 354 424 374 6 380 339 311 7 449 296 412 8 358 397 464 9 476 467 10 425 383 11 398 367 12 376 362 yi. 4.625 4.592 2.973 y.. = 12.190 . i i y mˆ = 385,42 382,67 371,63 =y.. =380,94 .. . i i y y tˆ = 4,48 1,73 -9,31

Como na situação de igual número de repetições dos tratamentos, as somas de quadrados podem ser determinadas por fórmulas de definição ou de cálculo. A determinação das somas de quadrados pelas fórmulas de cálculo é efetuada a seguir:

2 1 32 C = 12.190 =4.643.628,13, SQ Total = 3662 +3742 +...4642 – C = 4.711.960 - 4.643.628,12 = 68.331,88, SQ Tratamento = 1 12 (4.625 2 +4.5922) + 1 82.973 2 - C = = 3.539.757,42 + 1.104.841,12 - 4.643.628,12 = 970,42.

A análise da variação é completada na própria tabela da análise da variação (Tabela 1.11), de modo análogo ao caso em que o número de repetições é igual para todos os

(29)

Tabela 1.11. Análise da variação dos resultados do experimento do Tabela 1.2.

Fonte de variação GL SQ QM F Prob.>F

Tratamento 2 970,42 485,208 0,2089 0,8127

Erro 29 67.361,46 2.322,809

Total 31 68.331,88

1.3

Delineamento Blocos Casualizados

1.3.1

Introdução

Considere-se um experimento em blocos casualizados com t tratamentos e b blocos cujos resultados são dispostos na Tabela 1.12, de dupla-entrada, onde yij representa o valor

observado da variável resposta na unidade experimental com o tratamento i no bloco j.

Tabela 1.12. Resultados de um experimento unifatorial em blocos

casualizados dispostos em uma tabela de dupla-entrada.

Tratamento (i) Bloco (j) Soma i y. Média yi. 1 2 ... b 1 y11 y12 ... y1b y1. y1. 2 y21 y22 ... y2b y2. y2. ... ... ... ... T yt1 yt2 ... ytb yt. yt. Soma (y.j) y.1 y.2 ... y.b y. . Média y.j y.1 y.2 y.b y..

Nas duas últimas colunas e nas duas últimas filas da Tabela 1.12 estão as somas e

médias de tratamentos e blocos, respectivamente:

b i ij j 1 y y = =

. , t j ij i 1 y y = =

. , i i 1 b y. = y., j j 1 t y. = y.

e, ao pé das duas últimas colunas, estão o total geral e a média geral do experimento, respectivamente: t b i j i 1 j 1 y y y = = =

=

.. . . , 1 n y. . = y..,

(30)

1.3.2

Estimação dos parâmetros

A estimação dos parâmetros pode ser procedida pelo método dos quadrados mínimos. Esse método de estimação determina como estimadores dos parâmetros os correspondentes valores de m, t1 ,t2 ,..,tt , b1 ,b2 ,...,bb que tornam mínima a soma dos quadrados dos erros como

função dos parâmetros:

f(m, t1 ,t2 ,..,tt ,b1 ,b2 ,...,bb) =

∑∑

= = t 1 i b 1 j 2 ij e = =

∑∑

= = − − − t 1 i b 1 j 2 j i ij m t b ) y ( .

A minimização dessa função quadrática pode ser efetuada por sua derivação parcial em relação a cada um dos parâmetros e resolução do sistema de 1+t+b equações a 1+t+b incógnitas (média, t efeitos de tratamentos e b efeitos de blocos) que resulta da anulação simultânea das derivadas parciais. Esse sistema de equações é indeterminado. Uma solução única pode ser obtida pelo estabelecimento das condições tˆ1 +tˆ2 +...+tˆt =0 e

0 bˆ ... bˆ

1 + 2 + + b = , análogas àquelas impostas para os parâmetros. Essa solução constitui os

estimadores para os parâmetros: ˆ m = y. ., i i.

ˆt

=

y

y

. ., i=1,2,...t, e j j ˆb = y. −y. ., j=1,2,...b,

onde yi. é a média das observações para o tratamento i, y.j é a média para o bloco j e y.. é a média geral das observações do experimento. Dessa forma, o estimador do efeito de um tratamento é o desvio entre a média do tratamento e a média geral do experimento, e o estimador do efeito de um bloco é o desvio da média do bloco em relação à média geral.

O valor estimado (ou valor predito) para a resposta em uma unidade experimental é

definido como:

j i ij mˆ tˆ bˆ

yˆ = + + , i=1,2,...t, j=1,2,...b.

A resposta observada em uma unidade experimental pode ser expressa da seguinte forma, pela substituição dos parâmetros pelos respectivos estimadores na equação do modelo:

ij j i ij mˆ tˆ bˆ eˆ y = + + + , onde: j i ij ij y mˆ tˆ bˆ eˆ = − − − =yij −yˆij

é o desvio entre o valor observado e o valor estimado para a unidade experimental,

denominado resíduo da observação.

O estimador de quadrados mínimos da variância casual σ2 é:

t b 2 ij i 1 j 1 1 (t 1)(b 1) ˆ s e = = − − =

∑∑

=

(31)

t b 2 ij i j i 1 j 1 1 (t 1)(b 1)− − = = (y y y y ) =

∑∑

− − +. . . . .

onde (t-1)(b-1) é o correspondente número de graus de liberdade, isto é, número de observações menos número de parâmetros independentes no modelo estatístico que são estimados: tb-(t+b-1)=(t-1)(b-1).

1.3.3

Análise da variação

A partir da última expressão para a resposta observada sobre uma unidade experimental, obtém-se: ij ˆ ˆi ˆj ˆij y − = + + , m t b e ou seja: ij ˆi ˆj ˆij y −y.. = + + =t b e = (yi.−y ) (y.. + .j−y ) (y.. + ij− − +yi. y.j y ).. .

Dessa forma, o desvio total da resposta observada em uma unidade experimental é decomposto em três componentes: efeito estimado do tratamento, efeito estimado do bloco e resíduo referente à unidade experimental. Elevando os desvios totais ao quadrado e somando para todas as unidades experimentais, obtém-se a seguinte equação fundamental da análise da variação para o delineamento blocos casualizados:

2 2 2 2

ij i j ij i j

i j i j i j

(y −y ) = b (y −y ) + t (y −y ) + (y − − +y y y )

∑∑

. .

. ..

. ..

∑∑

. . .. ,

já que as somas de produtos dos termos do segundo membro da expressão do desvio total são nulas e que: 2 2 2 i i i i j j i i (y −y ) =  (y −y )  =b (y −y )  

∑∑

. . .

∑ ∑

. . .

. .. e 2 2 2 j j j i j i j j (y −y ) =  (y −y )  = t (y −y )    

∑∑

. ..

∑ ∑

. . .

. .. .

Assim, em um experimento em blocos casualizados, a soma de quadrados total, que exprime a variação total das observações do experimento, é decomposta em três componentes, correspondentes às três fontes de variação presentes neste delineamento: os dois primeiros exprimindo os efeitos de tratamentos e de blocos, designados, respectivamente, SQ Tratamento e SQ Bloco, e o último atribuível ao erro experimental, designado SQ Erro ou SQ Erro; ou seja:

SQ Total = SQ Tratamento + SQ Bloco + SQ Erro.

Correspondentemente, os tb-1 graus de liberdade referentes à variação total podem ser decompostos em t-1, b-1 e tb-1-(t-1)-(b-1) = (t-1)(b-1) graus de liberdade, correspondentes às variações atribuíveis a tratamento, bloco e erro, respectivamente:

tb-1 = t-1 + b-1 + (t-1)(b-1).

Essa decomposição da variação total e dos correspondentes graus de liberdade pode ser apresentada em uma tabela de análise da variação, Tabela 1.13.

(32)

Tabela 1.13. Esquema da análise da variação para experimento

unifatorial com delineamento blocos casualizados.

Fonte de variação GL SQ Bloco b-1 2 j j t

(y. −y ). . Tratamento t-1 i 2 i b

(y.y ). . Erro (t-1)(b-1) 2 ij i j i j (y -y − +y y )

∑∑

. . .. Total tb-1 2 ij i j (y y )

∑∑

. .

A tabela da análise da variação é completada com a determinação dos quadrados médios, obtidos pelo quociente das somas de quadrados pelos respectivos graus de liberdade:

QM Bloco = SQ Bloco/(b-1),

QM Tratamento = SQ Tratamento/(t-1) e QM Erro = SQ Erro/(t-1)(b-1).

As expressões das somas de quadrados da Tabela 1.13 são denominadas fórmulas de

definição. As seguintes expressões, denominadas fórmulas de cálculo, derivadas das fórmulas

de definição, são mais convenientes para cálculos com o recurso de calculadoras de bolso não programáveis: SQ Total = 2ij i j y C

∑∑

, SQ Bloco = 2j j 1 y C t

. − e SQ Tratamento = 2i i 1 y C b

.− , onde: 2 2 ij i j 1 1 C y y tb tb   =  = 

∑∑

...

A SQ Erro pode ser obtida por diferença, na própria tabela da análise da variação: SQ Erro = SQ Total - SQ Bloco - SQ Tratamento.

1.3.4

Teste de hipótese

A primeira hipótese de interesse é, geralmente, a hipótese de nulidade dos efeitos esperados de tratamentos (ou, equivalentemente, igualdade das médias esperadas de tratamentos):    ≠ = = tratamento um menos pelo para , 0 t : H t ,..., 2 , 1 i , 0 t : H i A i O

(33)

Pelo mesmo argumento desenvolvido para o delineamento completamente

casualizado, essa hipótese pode ser testada pela estatística QM Tratamento QM Erro

F= , que, sob a

hipótese de nulidade, tem distribuição F com t-1 e (t-1)(b-1) graus de liberdade.

A fonte de variação “bloco” corresponde à característica estranha controlada por controle local e constitui um fator de unidade ou fator de erro. Nessas circunstâncias, o efeito de bloco é aleatório. Se há um fator experimental associado parceiro desse fator de unidade, esses fatores resultam completamente confundidos, e tal fator experimental não é testável. Se não há um fator experimental associado a bloco, pode haver interesse no teste da seguinte hipótese referente à variância σb2 atribuível ao fator de unidade bloco:

    > σ = σ 0 : H 0 : H 2 b A 2 b O

O teste dessa hipótese informa sobre a eficácia do controle experimental propiciado pela

formação de blocos. Um teste dessa hipótese é provido pela estatística F QM Bloco

QM Erro

= que, sob a

hipótese HO:

2 b

σ =0, tem distribuição F com b-1 e (t-1)(b-1) graus de liberdade. A rejeição da hipótese de nulidade H0 é evidência da eficácia do controle local exercido pela formação de

blocos.

Exemplo 1.3. Considere-se um experimento que foi conduzido com o propósito de

comparar as seguintes cultivares de ervilha de porte baixo: 1-Única, 2-Profusion, 3-Roi des Fins Verts, 4-Early Harvest, 5-Annonay, 6-Fins des Gourmets, quanto à produção de grãos secos. Os resultados - produção de grãos secos em decagramas por parcela de 4m2 - estão registrados sobre o croqui do experimento, Figura 1.8.

Bloco 1 5 76 4 88 2 72 6 60 3 72 1 112 Bloco 2 3 44 2 43 6 39 1 87 4 84 5 33 Bloco 3 2 84 1 72 3 44 4 60 5 35 6 65 Bloco 4 5 34 4 64 1 69 2 49 6 48 3 42

Figura 1.8. Croqui do experimento de comparação de seis cultivares

de ervilha, Exemplo 1.3, com os dados de produção de

grãos secos, em dag/4m2.

Os resultados do experimento são dispostos em uma tabela de dupla-entrada, Tabela

(34)

Tabela 1.14. Resultados do experimento do Exemplo 1.3 dispostos em uma

tabela de dupla-entrada, com as estimativas das médias e dos efeitos de cultivares e blocos.

Cultivar Bloco Soma

i y. Média i y. = i tˆ i y.−y.. 1 2 3 4 1 112 87 72 69 340 85,0 23,5 2 72 43 84 49 248 62,0 0,5 3 72 44 44 42 202 50,5 -11,0 4 88 84 60 64 296 74,0 12,5 5 76 33 35 34 178 44,5 -17,0 6 60 39 65 48 212 53,0 - 8,5 Soma y.j 480 330 360 306 1.476= y.. Média y.j 80,0 55,0 60,0 51,0 61,5= y.. j j ˆb y= . y. . 18,5 -6,5 -1,5 -10,5

Observe-se que a soma das estimativas dos efeitos diferenciais de cultivares e a soma das estimativas dos efeitos diferenciais de blocos, respectivamente na última coluna e na última linha da Tabela 1.14, são ambas nulas, salvo erros de aproximação.

O valor estimado da resposta na unidade experimental com a variedade 1 no bloco 1 é:

11 ˆ ˆ1 ˆ1

y = + + = m t b

= 61,5 + 23,5 + 18,5 = 103,5. O resíduo da observação nessa mesma parcela é:

11 11 11

ˆ ˆ

e = y −y =

= 112 - 103,5 = 8,5.

Semelhantemente, podem ser obtidos os valores estimados e os resíduos para as demais parcelas do experimento, apresentados na Tabela 1.15, ao lado das respostas

observadas. Observe-se que a soma dos resíduos é nula, para cada tratamento e para cada bloco.

(35)

Tabela 1.15. Valores observados, valores estimados e resíduos das parcelas do

experimento do Exemplo 1.3.

Valor observado Valor estimado Resíduo

Cult. Bloco Cult. Bloco Cult. Bloco

1 2 3 4 1 2 3 4 1 2 3 4 1 112 87 72 69 1 103,5 78,5 83,5 74,5 1 8,5 8,5 -11,5 -5,5 2 72 43 84 49 2 80,5 55,5 60,5 51,5 2 -8,5 -12,5 23,5 -2,5 3 72 44 44 42 3 69,0 44,0 49,0 40,0 3 3,0 0,0 -5,0 2,0 4 88 84 60 64 4 92,5 67,5 72,5 63,5 4 -4,5 16,5 -12,5 0,5 5 76 33 35 34 5 63,0 38,0 43,0 34,0 5 13,0 -5,0 -8,0 0,0 6 60 39 65 48 6 71,5 46,5 51,5 42,5 6 -11,5 -7,5 13,5 5,5

A estimativa da variância casual σ2 é:

2 1 (t 1)(b 1) s − − = SQ Erro = = ) 1 4 )( 1 6 ( 1 − − (8,52 +8,52 +...+5,52) = 149,333.

Essa estimativa da variância é, mais usualmente, obtida pela análise da variação, efetuada a seguir.

As somas de quadrados podem ser determinadas pelas fórmulas de definição, usando resultados da Tabela 1.14 e da Tabela 1.15, como segue:

SQ Bloco = 6×[18,52 +(-6,5)2 +(-1,5)2+(-10,5)2] = 2.982, SQ Cultivar = 4×[23,52 +0,52 +...+(-8,5)2 ] = 4.764, SQ Erro = 8,52 +8,52 +...+5,52 = 2.240,

SQ Total = (112-61,5)2 +(87-61,5)2 +...+(48-61,5)2 = 9.986.

Alternativamente, essas somas de quadrados podem ser determinadas pelas fórmulas de cálculo: C = 1 24 1.476 2 = 90.774, SQ Total = 1122+872+...+482 - C = = 100.760 - 90.774 = 9.986, SQ Bloco = 1 6 (480 2 +3302+3602+3062) - C = = 93.756 - 90.774 = 2.982, SQ Cultivar = 1 4 (340 2 +2482+...+2122) - C = = 95.538 - 90.774 = 4.764,

Referências

Documentos relacionados

Maior das Forças Armadas e des- tinado a desenvolver e consoli- dar os conhecimentos necessários para o exercício das funções de direção e para planejamento da

Antes de sua decisão, amado Deus, rogo ao Senhor Antes de sua decisão, amado Deus, rogo ao Senhor para que vigie com carinho e cuidado aqueles que lá para que vigie com carinho

• Lista de argumentos tipados como uma função; • Resposta tipada declarada ou inferida;. • Captura de contexto no escopo onde foi declarado; • Modificar o contexto no escopo

Diante disso melhor se adequaria a definição sustentada por Eagleton (EAGLETON, 1997, pp. 26-27), que combate a noção que caracteriza a ideologia como mera representação falseada

Feitiço do Segredo: deposita um segredo numa pessoa de confiança, essa pessoa fica deposita um segredo numa pessoa de confiança, essa pessoa fica sendo o &#34;Fiel do sendo o

2.1.Constitui objeto do presente Edital a seleção de projetos advindos de iniciativas da Comunicação Popular e Comunitária do Estado de Pernambuco e que sejam propostos por

Podem treinar tropas (fornecidas pelo cliente) ou levá-las para combate. Geralmente, organizam-se de forma ad-hoc, que respondem a solicitações de Estados; 2)

- Remover as pastilhas usadas e retornar todo o parafuso de regulagem em seguida montar uma pastilha nova do lado da roda, empurrando com a mão a pinça no sentido do cilindro de