Análise de Variância
Júlio Osório
Comparação de mais de duas médias
•
No Capítulo anterior consideraram-se estudos onde se pretendiamcomparar duas médias(→teste t de Student para duas amostras):•
Em muitas situações, o investigador precisa comparar várias médias (mais de duas)• Comparar os efeitos de 5 doses de uma fitohormona sobre o crescimento em altura de plantas de buganvília:
• Comparar os teores de cafeína de 6 marcas de chá verde:
• Nestes casos, usa-se o método daAnálise de Variância(ANOVA).
µµµµ
µµµµ
1 20: =
H
µµµµ µµµµ µµµµ µµµµ
µµµµ
1 2 3 4 50: = = = =
H
µµµµ µµµµ µµµµ µµµµ µµµµ
µµµµ
1 2 3 4 5 60: = = = = =
H
Comparação de mais de duas médias
•
Numa primeira tentativa de encontrar resposta para o problema proposto, seriamos tentados a realizar todas as comparações possíveis das médias dos 5 tratamentos, tomadas duas a duas, pelo método clássico do t de Student:•
Todavia, este procedimento resulta não só moroso, como também muito pouco preciso.• Karl Pearson (1942) demonstrou que se adoptarmos à partida um nível de significância nominal α, a
probabilidade de se cometer o erro de tipo I quando se utilizam múltiplos testes t para encontrar diferenças entre todos os pares possíveis de um número k de médias é sempre superior a α, e tanto mais elevado quanto maior for k.
µµµµ
µµµµ µµµµ µµµµ µµµµ
µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ
µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ
µµµµ
5 0 4
5 0 3
4 0 3
5 0 2
4 0 2
3 0 2
5 0 1
4 0 1
3 0 1
2 0 1
:
:
; :
; :
; :
; :
:
; :
; :
; :
=
=
=
=
=
=
=
=
=
=
H
H H
H H
H
H H
H H
10 testes t de Student
para comparar 5
médias!
Comparação de mais de duas médias
•
Por exemplo, no nosso caso concreto, sepretendêssemos comparar as 5 médias adoptando um nível de significância nominal α=0.05, teríamos para o conjunto dos 10 testes t de Student um nível de significância real de 0.23!
Nível de significância nominal Número de médias a
comparar (k)
α α α
α=0.05 αααα=0.01 αα=0.001 αα
2 0.05 0.01 0.001
3 0.13 0.03 0.003
4 0.21 0.05 0.006
5 0.23 0.07 0.009
10 0.63 0.23 0.034
20 0.92 0.52 0.109
∞∞
∞∞ 1.00 1.00 1.000
Comparação de mais de duas médias
• Para se testarem hipóteses do tipo:
• utiliza-se o procedimento estatístico da Análise de Variância, que deve o seu nome e muito do seu desenvolvimento inicial a R.A. Fisher , e para o qual J.W. Tukey propôs o acrónimo de ANOVA (de “ AN alysis O f VA riance”).
iguais são s as todas
Nem i
k k
H H
´ :
...
:
1
1 2
0 1
µµµµ µµµµ µµµµ µµµµ
µµµµ
= = = − =ANOVA: Generalidades
O investigador controla uma ou mais de uma variáveis independentes
Essas variáveis chamam-se factores
Cada uma delas pode apresentar dois ou mais níveis O investigador observa/mede os efeitos na variável dependente
Resposta aos níveis da variável independente
Delineamento Experimental: é o plano (ou esquema)
utilizado para testar as hipóteses
ANOVA: Generalidades
Análise de Variância
Factor Único
ANOVA Unifactorial
Vários Factores
ANOVA Multifactorial
ANOVA: Premissas
A validade dos resultados da ANOVA pressupõe que os dados cumpram as seguintes condições:
Independência e aleatoriedade dos erros
(Seleccionam-se amostras aleatórias das populações).
As populações devem ter distribuição normal .
As populações devem ter variâncias iguais
(homogéneas).
ANOVA Unifactorial
Serve para testar a igualdade de duas ou mais ( k ) médias populacionais.
Variáveis:
Uma variável independente (um factor ) medida em escala nominal .
Uma variável independente medida em escala de intervalo ou de razão.
Dois ou mais ( k ) níveis ou modalidades no factor Utiliza-se para analizar os resultados dos delineamentos completamente casualizados.
ANOVA Unifactorial: Exemplo
Fez-se um estudo destinado a comparar o teor de cafeína de seis marcas comerciais de chá verde (Lipton, Tetley, Gorreana, Twinings, Delta e Ahmad).
Quatro pacotes de chá verde de cada uma das 6 marcas foram analisados para a quantificação da cafeína.
Questão: Há evidência para sustentar, ao nível de 5%,
que existem diferenças significativas entre os teores
médios de cafeína das seis marcas de chá verde?
ANOVA Unifactorial: Exemplo
136 139
139 145
137
4
142
140 137
140 141
136
3
140
140 139
139 143
140
2
139
137 138
141 147
135
1
141
Ahmad Delta
Twinings Gorreana
Tetley Lipton
Marca de chá verde Pacote
Teores de cafeína em seis marcas de chá verde
Só há um FACTOR (Variável Independente), que é a MARCA DE CHÁ VERDE.
O FACTOR único apresenta 6 NÍVEIS (as 6 marcas de chá), denominadas TRATAMENTOS.
A RESPOSTA (Variável Dependente) é o TEOR DE CAFEÍNA.
ANOVA Unifactorial: Hipóteses
H
0: µµµµ
1= µµµµ
2= µµµµ
3= ...
= µµµµ
k• As médias das k populações são iguais
• Não há efeito dos tratamentos
H
1: Nem todas µµµµ
j’s são iguais
• Pelo menos uma média é diferente das outras
• Há efeito dos tratamentos
• É incorrecto dizer µµµµ1≠≠≠≠ µµµµ2
≠≠≠≠...≠≠≠≠ µµµµk
X f(X)
µµµµ
1= µµµµ
2= µµµµ
3X f(X)
µµµµ
1= µµµµ
2µµµµ
3ANOVA Unifactorial: Cálculo
Compara dois tipos de variação para testar a igualdade das médias.
A comparação faz-se com base na razão de duas variâncias .
Se a variação devida aos tratamentos exceder a variação aleatória , conclui-se que as médias não são todas iguais.
As fracções de variação devidas ao efeito dos tratamentos e aos efeitos aleatórios ( erro experimental ) obtêm-se
“ decompondo ” a variação total dos dados .
ANOVA Unifactorial: Cálculo
Variação devida a tratamentos
Variação aleatória
(erro experimental)
Variação total
Soma dos quadrados do erro
Soma dos quadrados dentro dos grupos
Soma dos quadrados dos tratamentos
Soma dos quadrados entre os grupos
+
ANOVA Unifactorial: Cálculo
X
Grupo 1 Grupo 2 Grupo 3 Resposta, X
(((( )))) (((( )))) (((( )))) ((((
ij))))
22 21
2
11
X X X X X
X Total
SQD (((( Total )))) ==== (((( X
11−−−− X )))) ((((
2++++ X
21−−−− X ))))
2++++ K ++++ (((( X
ij−−−− X ))))
2SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−
X11
Desvios de todos os dados relativamente à média global do estudo
ANOVA Unifactorial: Cálculo
X
X
3 X
2 X
1Grupo 1 Grupo 2 Grupo 3 Resposta, X
(((( )))) (((( ))))
k((((
k))))
22 2
2 2 1
1
X X n X X n X X
n .) trat (
SQD ==== (((( −−−− )))) ++++ (((( −−−− )))) ++++ K ++++
k((((
k−−−− ))))
22 2
2 2 1
1
X X n X X n X X
n .) trat (
SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−
Desvios das médias dos tratamentos relativamente à média global do estudo
ANOVA Unifactorial: Cálculo
X
2 X
1 X
3Grupo 1 Grupo 2 Grupo 3 Resposta, X
(((( )))) (((( )))) ((((
kn k))))
22 1 21 2
1
11
X X X X X
X ) erro (
SQD ==== (((( −−−− )))) (((( ++++ −−−− )))) ++++ K ++++ ((((
kn−−−−
k))))
22 1 21 2
1
11
X X X X X
X ) erro (
SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−
Desvios dos dados de cada grupo relativamente à média do próprio grupo
ANOVA Unifactorial: Cálculo
Graus de Liberdade dos Tratamentos (k-1)
Graus de Liberdade do Erro (N-k) Graus de Liberdade
Totais (N-1)
k = nº de tratamentos (grupos)
n = nº de dados em cada grupo
N = nº total de dados no estudo = k.n
+
ANOVA Unifactorial: Cálculo
O critério do teste é o estatístico F , que é a razão de duas variâncias (ou Quadrados Médios, QM´s ), a dos tratamentos ( QM
Tratamentos) e a do erro ( QM
Erro):
−1
=
= k
SQD Gl
QM SQD Tratamentos
s Tratamento s Tratamento s
Tratamento
k N SQD Gl
QM SQD Erro
Erro Erro
Erro = = −
iberdade graus de l k
k- N com
QM F QM
Erro s Tratamento
amostra ,
−
=
:
1ANOVA Unifactorial: Cálculo
Teste F
αααα
Este teste é sempre unilateral!
F αααα
(k−−−−1,N k)−−−−0
Rejeitar H
0F Não rejeitar H
0Se H
0fôr verdadeira (µ
i’s todas iguais), então F=Qm
trat/QM
erro≈1.
Rejeitar H
0se F
amostrafôr elevado, isto é se:
Critério:
(
k N k)
F
Famostra≥ α −1 −
ANOVA Unifactorial: Cálculo
Origem da Variação
Graus de Liberdade
Soma dos Quadrados
Quadrado Médio (Variância)
F
Tratamentos k - 1 SQD
trat. QMtrat=SQDtrat/(k - 1)
QM
tratQM
erroErro N - k
QMerro=SQDerro/(N - k)
Total N - 1 SQD
Totaldos Desvios
SQDerro= SQDTotal-SQDtrat
———
Quadro ANOVA
ANOVA Unifactorial: Exemplo
76465 553
4 136 140 140 137 Ahmad
3351 553
559 576
548 Ti 562
468073 76455
78123 82964
75090 78966
Σxij2
24 4
4 4
4 4
ni
Totais 139
139 145
137 4 142
137 140
141 136
3 140
139 139
143 140
2 139
138 141
147 135
141 1
Delta Twinings
Gorreana Tetley
Lipton
Teores de cafeína em seis marcas de chá verde
ANOVA Unifactorial: Exemplo
Cálculo do Termo de Correcção (TC) e do Somatório dos Quadrados dos Desvios Total (SQDTOTAL)
375 , 467883 24
3351
2..
2
=
=
= N
TC T
23 1 24
625 , 179 375 , 467883 468063
6 2
1 4
1
=
−
=
=
−
=
−
=
∑ ∑
= =
GL SQD X
TOTAL
i j ij
TOTAL TC
ANOVA Unifactorial: Exemplo
Cálculo Somatório dos Quadrados dos Desvios dos Tratamentos (SQDTratamentos)
5 1 6
375 , 122 375 , 467883 4
... 553 4
548 4
5622 2 2
6
1 2
=
−
=
=
− + + +
=
=
−
=
∑
==
GL SQD
T n SQD
s Tratamento
s Tratamento
i
i i
i s
Tratamento TC
ANOVA Unifactorial: Exemplo
Cálculo Somatório dos Quadrados dos Desvios do Erro (SQDErro)
18 5 23
25 , 57 375 , 122 625 , 179
=
−
=
=
−
=
−
=
GL SQD
SQD SQD
SQD
Erro Erro
s Tratamento TOTAL
Erro
ANOVA Unifactorial: Exemplo
Cálculo do Quadrado Médio dos Tratamentos (QMTratamentos) e do Quadrado Médio do Erro (QMErro)
475 , 5 24
375 ,
122 =
=
=
GL
QM SQD
s Tratamento
s Tratamento s
Tratamento
181 , 18 3
25 ,
57 =
=
=
GL
QM SQD
Erro Erro Erro
ANOVA Unifactorial: Exemplo
Cálculo do valor amosstral de F (Famostra)
695 , 181 7 , 3
475 ,
24 =
=
= QM
F QM
Erro s Tratamento amostra
ANOVA Unifactorial: Exemplo
F
0
2,77H
0: µµµµ
1= µµµµ
2=…= µµµµ
6H
1: Nem todas µµµµ
i’s são iguais
αααα = 0,05
GL
1= 5 GL
2= 18
Valor Crítico:Estatístico F:
Decisão:
Rejeitar H
0a αααα = 0,05 αααα =0,05
Conclusão:
Há evidência para concluir que o teor médio de cafeína não é igual em todas as marcas de chá verde .
695 , 181 7 , 3
475 ,
24 =
=
=
QM
F QM
Erro s Tratamento amostra
ANOVA Unifactorial: Exemplo
Tabela do F de Snedecor
F0,05(5/18)
= 2,77
ANOVA Unifactorial: Exemplo
O cômputo da Análise de Variância costuma ser sistematizado e apresentado numa tabela, conhecida por Quadro ANOVA, onde se materializa a decomposição da Soma dos Quadrados dos Desvios Total e do Número Total de Graus de Liberdade.
Origem da variação
GL SQD QM Famostra Fαααα
α αα
α=0.05 αααα=0.01 αααα=0.001 Entre grupos
(Marcas de chá)
5 122,375 24,475 7,694(***) 2,77 4,25 6,81
Dentro dos grupos
(Erro)
18 57,250 3,181
TOTAL 23 179,625
Quadro ANOVA
ANOVA Unifactorial: Exemplo
Conclusões:
Há diferenças significativas entre as seis marcas de chá verde no que ao teor de cafeína diz respeito.
Para esclarecer quais as marcas que têm idêntico valor para o teor médio de cafeína e quais diferem a esse respeito, tem que se realizar testes pós-ANOVA para comparações múltiplas de médias .
Dentre os vários testes pós-ANOVA descritos na literatura , serão abordados aqui o Teste de Student- Neuman-Keuls (Teste S-N-K) e o Teste de Tukey .
ANOVA Unifactorial: Exemplo
Médias ordenadas por ordem crescente de grandeza
Tratamentos ⇒⇒⇒⇒ Tetley Delta Ahmad Twinings Lipton Gorreana Médias ⇒⇒⇒⇒ 137,00 138,25 138,25 139,75 140,50 144,00
Teste de Student-Newman- Keuls (S-N-K)
Comparação Diferença p q0.05(p,18) Erro-padrão AMSp Significância
Gorreana vs. Tetley 7,00 6 4,49 0,892 4,01 *
Gorrena vs. Delta 5,75 5 4,28 0,892 3,82 *
Gorreana vs. Ahmad 5,75 4 4,00 0,892 3,57 *
Gorreana vs. Twinings 4,25 3 3,61 0,892 3,25 *
Gorrena vs. Lipton 3,50 2 2,97 0,892 2,65 *
Lipton vs. Tetley 3,50 5 4,28 0,892 3,82 ns
Lipton vs. Delta 2,25 4 4,00 0,892 3,57 ns
Lipton vs. Ahmad 2,25 3 3,61 0,892 3,25 ns
Lipton vs. Twinings 0,75 2 2,97 0,892 2,65 ns
Twinings vs. Tetley 2,75 4 4,0 0,892 3,57 ns
Twinings vs. Delta 1,50 3 3,61 0,892 3,25 ns
Twinings vs. Ahmad 1,50 2 2,97 0,892 2,65 ns
Ahmad vs. Tetley 1,25 3 3,61 0,892 3,25 ns
Ahmad vs. Delta 0,00 2 2,97 0,892 2,65 ns
Delta vs. Tetley 1,25 2 2,97 0,892 2,65 ns
*= médias significativamente diferentes ao nível de 5%, porque a sua diferença excede a Amplitude Mínima Significativa (AMS).
ns= médias não significativamente diferentes ao nível de 5%, porque a sua diferença é inferior à Amplitude Mínima Significativa (AMS).
892 , 4 0 181 ,
3 =
=
= n
QMErro
ANOVA Unifactorial: Exemplo
Tabela dos Testes S-N-K e Tukey
Amplitudes Studentizadas para GLerro=18
e αααα=0,05
ANOVA Unifactorial: Exemplo
Apresentação do Resultado do Teste S-N-K
b 137,00
Tetley
b 138,25
Delta
b 138,25
Ahmad
b 139,75
Twinings
b 140,50
Lipton
a 144,00 Gorreana
Grupos de Significância Média
Marca de chá
Médias que partilham letras no grupo de significância não são significativamente diferentes!
ANOVA Unifactorial: Exemplo
Apresentação do Resultado do Teste S-N-K
Médias unidas por um mesmo traço não são significativamente diferentes!
Gorreana (144,00) Lipton
(140,50) Twinings
(139,25) Ahmad
(138,25) Delta
(138,25) Tetley
(137,00)
• Gorreana tem mais cafeína que todas as ouras marcas
• As outras marcas não diferem entre si
ANOVA Unifactorial: Exemplo
Médias ordenadas por ordem crescente de grandeza
Tratamentos ⇒⇒⇒⇒ Tetley Delta Ahmad Twinings Lipton Gorreana Médias ⇒⇒⇒⇒ 137,00 138,25 138,25 139,75 140,50 144,00
Teste de Tukey
Comparação Diferença p q0.05(p,18) Erro-padrão AMSp Significância Gorreana vs. Tetley 7,00 6 4,49 0,892 4,01 *
Gorrena vs. Delta 5,75 5 4,49 0,892 4,01 * Gorreana vs. Ahmad 5,75 4 4,49 0,892 4,01 * Gorreana vs. Twinings 4,25 3 4,49 0,892 4,01 * Gorrena vs. Lipton 3,50 2 4,49 0,892 4,01 ns
Lipton vs. Tetley 3,50 5 4,49 0,892 4,01 ns Lipton vs. Delta 2,25 4 4,49 0,892 4,01 ns Lipton vs. Ahmad 2,25 3 4,49 0,892 4,01 ns Lipton vs. Twinings 0,75 2 4,49 0,892 4,01 ns Twinings vs. Tetley 2,75 4 4,49 0,892 4,01 ns Twinings vs. Delta 1,50 3 4,49 0,892 4,01 ns Twinings vs. Ahmad 1,50 2 4,49 0,892 4,01 ns Ahmad vs. Tetley 1,25 3 4,49 0,892 4,01 ns Ahmad vs. Delta 0,00 2 4,49 0,892 4,01 ns Delta vs. Tetley 1,25 2 4,49 0,892 4,01 ns
*= médias significativamente diferentes ao nível de 5%, porque a sua diferença excede a Amplitude Mínima Significativa (AMS).
ns= médias não significativamente diferentes ao nível de 5%, porque a sua diferença é inferior à Amplitude Mínima Significativa (AMS).
ANOVA Unifactorial: Exemplo
Apresentação do Resultado do Teste de Tukey
b 137,00
Tetley
b 138,25
Delta
b 138,25
Ahmad
b 139,75
Twinings
a b 140,50
Lipton
a 144,00 Gorreana
Grupos de Significância Média
Marca de chá
Médias que partilham letras no grupo de significância não são significativamente diferentes!
ANOVA Unifactorial: Exemplo
Apresentação do Resultado do Teste de Tukey
Médias unidas por um mesmo traço não são significativamente diferentes!
Gorreana (144,00) Lipton
(140,50) Twinings
(139,25) Ahmad
(138,25) Delta
(138,25) Tetley
(137,00)
• Lipton ocupa uma posição charneira entre Gorreana e as restantes marcas.,
• O Teste de Tukey é mais
ANOVA Multifactorial
Há vários (dois ou mais ) factores ou variáveis independentes .
Cada um deles pode terdois ou mais níveis.
A análise estatística é uma ANOVA a vários critérios de classificação dos dados.
Como exemplo, considera-se o caso mais simples: o dos delineamentos factoriais duplos.
Poupam tempo e trabalho, e enriquecem a pesquisa:
Num só empreendimento experimental, obtém-se a informação que só se conseguiria realizando dois ensaios separados, um para cada factor individual.
Permitem controlar os efeitos de factores secundários que, introduzindo variação espúria nos resultados, dificultam a comparação dos efeitos do factor de interesse primordial.
Possibilitam a análise das interacções entre factores.
ANOVA Multifactorial: Cálculo
Variação devida ao factor A
Variação Total
Variação devida ao factor B
Variação devida à interacção de A com B
Variação aleatória (erro experimental)
+
+
+
ANOVA Multifactorial: Cálculo
Graus de liberdade do factor A (a-1)
Graus de liberdade totais (N-1)
Graus de liberdade dofactor B (b-1)
Graus de liberdade dainteracção de A com
B [(a-1)(b-1)]
Graus de liberdade do erro(N-ab)
+
+
+
Neste caso, há lugar aocálculo de três estatísticos F, um relativo ao factor A, outro aofactor Be outro para a interacção A x B:
Rejeitar a H0da igualdade dos efeitos dos níveis de A se:
iberdade graus de l ab
a- N com
QM F QM
Erro A A
amostra ,
−
= 1
iberdade graus de l ab
b- N com
QM F QM
Erro B B
amostra ,
−
= 1
( )( )
graus de liberdadeab N b com a
QM F QM
Erro AB AB
amostra
. ,
− −
−
=
1 1
Rejeitar a H0da igualdade dos efeitos dos níveis de B se:
(
a N ab)
F
FAamostra≥ α −1 −
Rejeitar a H0da inexistência de interacção se:
( )( )
− − −
≥ N ab
b F a
FABamostra 1. 1
α
(
b N ab)
F
FBamostra≥ α −1 −
ANOVA Multifactorial: Cálculo
ANOVA Multifactorial: Exemplo
No decurso de um estudo sobre os efeitos da solução de lavagem e do tipo de forno utilizado sobre a remoção térmica da pele dos amendoins, foram testados três tipos de solução de lavagem (cloreto de potássio, cloreto de sódioe água) e três tipos de forno (forno de convecção, forno de microondas e forno convencional).
Cada combinação solução-tipo de forno foi testada em três lotes de amendoim (três repetiçõesde cada “tratamento”), tendo-se registado como variável de resposta a percentagem de amendoins descascadosobservada em cada caso.
Questões:
Há evidência nos dados para se concluir, ao nível de 5%, que o efeito da solução de lavagem sobre a percentagem de amendoins descascados varia com o tipo de forno utilizado?
Que conclusões se podem tirar para os diversos tipos de solução e de forno?
ANOVA Multifactorial: Exemplo
612.1 220.6
148.9 242.6
Σ
583.1 260.3
120.9 201.9
Σ
1855.0 712.0
475.0 668.0
Total
659.8 231.1
205.2 223.5
Σ
72.7 76.9 81.5 73.5
64.3 67.4 71.9
77.7 73.9 H2O
75.0 76.6 69.0 49.6
45.4 53.9 81.4
77.9 NaCl 83.3
86.2 82.1 92.0 35.6
44.6 40.7 64.3
70.0 67.6 KCl
Convencional Microondas
Convecção
Total Forno
Solução de Lavagem
ANOVA Multifactorial: Exemplo
GL
ErroSQD
ErroGL
InteracçãoSQD
InteracçãoGL
SoluçãoSQD
SoluçãoGL
FornoSQD
FornoSQD
SubgruposDecomposição de SQD
Totale GL
TotalANOVA Multifactorial: Exemplo
Cálculo do Termo de Correcção (TC) e do Somatório dos Quadrados dos Desvios Total (SQDTOTAL)
37 , 127445 27
1855
2..
2
=
=
= N
TC T
26 1 27
85 , 5608 37 , 127445 22
, 133054
3
1 3 2
1 3
1
=
−
=
=
−
=
−
=
∑ ∑ ∑
= = =
GL SQD X
TOTAL
i j k
TOTAL ijk TC
ANOVA Multifactorial: Exemplo
Cálculo dos Somatórios dos Quadrados dos Desvios dos Subgrupos (SQDSubgrupos) e do Erro (SQDErro)
8 1 3 3
077 , 5319 37 , 127445 3
1 , 231 2 ...
9 , 120 2 9
, 201 2
1 1
2 .
=
−
=
= + −
+
= +
−
=
∑∑
x
n TC
GL SQD T
Subgrupos
a b ij Subgrupos
18 ) 1 3 .(
3 . 3 ) 1 .(
.
773 , 289 077 , 5319 85 , 5608
=
−
=
−
=
=
−
=
−
= n b
GL
aSQD SQD
SQD
Erro
Subgrupos Total
Erro
ANOVA Multifactorial: Exemplo
Cálculo dos Somatórios dos Quadrados dos Desvios dos Factores A (SQDA) e B (SQDB), e da respectiva Interacção (SQDAB)
2 1 3 1
630 , 3531 37 , 127445 3
. 3
0 , 712 2 0 , 475 2 0 , 668 2
1 .
2 . .
=
−
=
−
=
= + −
= +
−
=∑
b n TC a
GL SQD T
B
b j
B
4 ) 1 3 ).(
1 3 ( ) 1 ).(
1 (
144 , 1454 630 , 3531 303 , 333 077 , 5319
=
−
−
=
−
−
=
=
−
−
=
−
−
= b
GL a
SQD SQD
SQD SQD
AB
B A
Subgrupos AB
2 1 3 1
303 , 333 37 , 127445 3
. 3
8 , 659 2 1 , 612 2 1 , 583 2
1 .
2 ...
=
−
=
−
=
= + −
= +
−
=∑
a n TC b
GL SQD T
A a
i A
ANOVA Multifactorial: Exemplo
Quadro ANOVA
Origem da variação GL SQD QM Famostra
Fαααα
α αα
α=0.05 αααα=0.01 αααα=0.001 SUBGRUPOS 8 5319,077 664,885 41,30(***) 2,51 3,71 5,76
A (solução)
2 333,303 166,652 10,35(**) 3,56 6,01 10,39
B (forno)
2 3531,630 1765,815 109,69(***) 3,56 6,01 10,39
AxB (solução x forno)
4 1454,144 363,536 22,58(***) 2,93 4,58 7,46
ERRO 18 289,773 16,099
TOTAL 26 5608,850
ANOVA Multifactorial: Exemplo
Conclusões:
Tanto a solução de lavagem como o tipo de forno utilizado tiveram efeitos significativos sobre o rendimento do processo de remoção da casca dos amendoins.
Há evidência suficiente nos dados para se poder concluir a existência de uma interacção significativa destes dois factores.
A interacção significativa significa, neste caso, que a resposta da percentagem de amendoins descascados às soluções de lavagem testadas varia com o tipo de forno utilizado (ou que a resposta ao tipo de forno variou com a solução empregue na lavagem dos amendoins).
Uma maneira expedita de examinar a interacção consiste em fazer representações gráficas das médias dos subgrupos (eixo das ordenadas) em função dos níveis dos dois factores (⇒ Gráficos de Perfil da Resposta).
ANOVA Multifactorial: Perfil da Resposta
1. Se as linhas fossem sensivelmente paralelas, isso sugeriria a não existência de interacção. 2. Não o sendo visivelmente, podemos concluir que o padrão de resposta da % de descascados às soluções variou com o tipo de forno
⇒a interacção solução x forno é significativa.
ANOVA Multifactorial: Perfil da Resposta
1. Se as linhas fossem sensivelmente paralelas, isso sugeriria a não existência de interacção. 2. Não o sendo visivelmente, podemos concluir que o padrão de resposta da % de descascados ao tipo de forno variou com a solução de lavagem⇒a interacção solução x forno é significativa.
ANOVA Multifactorial: Perfil da Resposta
NaCl H2O KCl Convencional
KCl NaCl H2O Microondas
KCl H2O NaCl Convecção
Resultados do Teste de Tukey para Soluções Tipo de forno
Fazendo uma ANOVA a um critério em separado para os dados de cada tipo de forno, seguida do Teste de Tukey, podemos confirmar estes factos:
1. No forno de convecção, obtiveram-se melhores resultados com água e NaCl.
2. No forno de microondas, obtiveram-se melhores resultados com água.
3. No forno convencional, a água mostrou um desempenho intermédio entre KCl e NaCl.
BLOCOS COMPLETOS CASUALIZADOS
Júlio Osório
Blocos Completos Casualizados Exemplo
Efeitos de 4 dietas (A, B, C e D) sobre os acréscimos de peso em porquinhos-da-India.
5 animais/dieta em bom estado físico e com a mesma idade.
O ensaio em vivário, animais em gaiolas individuais situadas sobre bancadas.
Condições ambientais de luz, temperatura, humidade, ruído, etc. não eram homogéneas na estufa, e podem ter inflência sobre os acréscimos de peso dos animais.
Constituiídos 5 blocos de unidades experimentais, isto é, 5 grupos de porquinhos-da-India.
Cada bloco de animais consiste de 4 porquinhos-da-India, um para cada uma das 4 dietas.
As 4 gaiolas de cada bloco foram arrumadas em posições vizinhas sobre a bancada do laboratório, e distribuíram-se os 5 blocos pela bancada por forma a corresponderem tanto quanto possível a diferentes condicionalismos ambientais.
Considera-se que todos os membros de um mesmo bloco se encontram em idênticas condições, excepto no tocante, com é óbvio, à dieta alimentar.
A atribuição da dieta a cada um dos indivíduos de um bloco foi feita por um processo aleatório.
Blocos Completos Casualizados Características
Plano do ensaio e acréscimos de peso dos porquinhos-da-India ao fim do período de experiência.
B 3.3 C
2.0 A
1.4 D
1.0 B
2.7
C 2.5 A
1.2 D
1.1 B
2.9 A
1.5
D 1.5 B
3.0 B
2.1 C
2.2 D
1.3
A 1.4 D
1.3 C
2.4 A
1.4 C
2.1
Bloco 5 Bloco
4 Bloco
3 Bloco
2 Bloco
1
Blocos Completos Casualizados Utilização
Situações em que se suspeita ou se sabe à partida que certas unidades experimentais, “tratadas” de forma idêntica,
responderão de forma diferente aos tratamentos:
•
nos ensaios de campo, parcelas de terreno contíguas tendem a responder de forma mais semelhante que parcelas afastadas;•
os animais mais pesados de um grupo de animais com a mesma idade tendem a exibir uma taxa de acréscimo de peso distinta da dos animais mais leves;•
medições feitas no mesmo dia com um certo equipamento tendem a ser mais homogéneas que as feitas com o mesmo equipamento noutro dia;•
um lote de análises bioquímicas (envolvendo várias manipulações) tende a produzir resultados mais homogéneos quando é executado mesmo analista do quando o é por vários analistas.BCC: Exemplos de Factores que integram os Blocos
Sócio-demografia
Pessoa Idade
Género Densidade local
Árvore Idade
Distribuição do calor
Localização na estufa Fluxo de ar
Orientação do Sol Composição do solo Diferenças no declive
Parcela de Terreno Gradiente de humidade
Gradiente de fertilidade
Unidade Experimental Variável Perturbadora
BCC: Regras para a implementação dos Blocos
A fiabilidade da análise depende muito da forma como se constituem os Blocos:
• Com parcelas de terreno, os Blocos devem ficar perpendiculares ao gradientedo factor de perturbação que se quer controlar.
• Utilizam-se áreas de bordadura(isto é, de excusão) de tamanho apropriado para eliminar as interferências de parcelas vizinhas (isto é, para assegurar a
independência das respostas), tanto entre como dentro dos blocos.
O grande princípio é maximizar a homogeneidade dentro dos Blocos e, ao mesmo tempo, maximizar a
heterogeneidade entre os Blocos.
BCC: Exemplo incorrecto
Gradientede humidade
T2 T1 T5 T3 T4
T3 T4 T1 T2 T5 T1
T5 T2 T4 T3 T4
T2 T3 T5 T1
Efeitos dos tratamentos confundidos com efeitos da humidade!
BCC: Exemplo correcto
Gradientede humidade
T1 T3 T5 T4 T2
T4 T5 T1 T2 T3
T3 T2 T4 T5 T1
T5 T2 T3 T1 T4
O efeito do Bloco remove agora o efeito da humidade,
BCC: Vantagens e Desvantagens
Vantagens:
•
Permite controlar uma única fonte estranha de variação e remover o seu efeito da estimativa do erro experimental.•
Assegura maior flexibilidade no planeamento da experiência.•
Assegura maior flexibilidade na implementação e administração da experiência.Desvantagens:
•
Geralmente inadequado quando há um número elevado de tratamentos, devido a eventual impossibilidade de assegurar a homogeneidade dentro dos Blocos.•
Problemas sérios com a análise se existir de facto umainteracção entre o factor em Blocos e os tratamentos, e não se tenha previsto a replicação dentro dos Blocos (solução: usar replicação dentro dos blocos quando possível).
ANOVA em BCC: Cálculo
Variação devida ao factor Blocos
Variação aleatória (erro experimental)
+
Variação devida ao factor Tratamentos
+
Variação Total
Embora haja 2 factores (Blocos e Tratamentos),
não se pode calcular a interacção!
ANOVA em BCC: Cálculo
Graus de liberdade do erro(a-1). (b-1) Graus de liberdade de
Blocos(a-1) +
Graus de liberdade de Tratamentos(b-1)
+ Graus de liberdade
totais (ab-1)
ANOVA em BCC: Cálculo
1
1 2
−
=
−
= ∑ b
a TC
cos Blo
b .j cos
Blo
SQD T νννν
TC axbT..
= 2
1
1 1 2
−
=
−
= ∑ ∑ axb
TC
TOTAL
b a
TOTAL Yij
SQD νννν
s Tratamento cos
Blo Total
Erro SQD SQD SQD
SQD = − −
1
1 2
−
=
−
= ∑
a b TC
s Tratamento
a i. s Tratamento
SQD T νννν
ANOVA em BCC: Cálculo
Organizar os dados numa tabela Blocosx Tratamentos:
38.3 6.2 11.2 14.0 6.9 Ti.
8.7 1.5 2.5 3.3 1.4 5
7.5 1.3 2.0 3.0 1.2 4
7.0 1.1 2.4 2.1 1.4 3
7.5 1.0 2.2 2.9 1.4 2
7.6 1.3 2.1 2.7 1.5 1
D C B A Blocos
T.j Dietas
3 1 4
1535 5 8
2 6 2 11 0 14 9
6 2 2 2 2
=
−
=
= + −
+
= + ννννTratamentos
s
Tratamento . . . . TC .
SQD
3445 5 73
4 3
38 2 .
TC = x. =
19 1 5 4
3255 9 67 82
=
−
=
=
−
= x
. TC .
TOTAL TOTAL
SQD νννν
12 1 5 1 4
7790 0 1535 8 3930 0 3255 9
=
−
−
=
=
−
−
=
) ( x ) (
. . . .
Erro
SQDErro
νννν
12 1 5 1 4
7790 0 1535 8 3930 0 3255 9
=
−
−
=
=
−
−
=
) ( x ) (
. . . .
Erro
SQDErro
νννν
ANOVA em BCC: Cálculo
QUADRO ANOVA
9.3255 19 TOTAL
0.0649 0.7790 12 ERRO
10.8 5.95 3.49 41.9(***) 2.7178 8.1535 Tratamentos 3
(Dietas)
- - 3.26 1.51(ns) 0.0982 0.3930 4 Blocos
α αα α=0.001 α
αα α=0.01 α
αα α=0.05
Fαααα Famostra
QM SQD Origem da GL
variação
Decisão e Conclusão: Rejeitar H0. Conclui-se que existe uma diferença muito altamente significativa entre os ganhos médios de peso produzidos pelas 4 dietas ensaiadas.
BCC: Organização em Blocos e Controlo da Variação Espúria
•
O interesse principal do investigador é compararganhos médios de peso alcançados com as quatro dietas.•A variação que a heterogeneidade das condições ambientais introduz nos ganhos de peso representa uma fonte de variação estranha ao objectivo do ensaio (variação espúria).
•
A menos que o investigador a consiga controlar, esta variação tem potencial para sobrepôr-se à das dietas, mascarando as eventuais diferenças entre dietas.•Como consequência disto, há uma probabilidade elevada de se concluir (erroneamente) que não há diferença entre os efeitos das dietas, quando na realidade elas estão presentes no ensaio!
•Em teoria, comparações rigorosas só poderiam ser feitas se ele instalassem os animais sujeitos às quatro dietas num ambiente perfeitamente homogéneo.