• Nenhum resultado encontrado

Análise de Variância

N/A
N/A
Protected

Academic year: 2022

Share "Análise de Variância"

Copied!
35
0
0

Texto

(1)

Análise de Variância

Júlio Osório

Comparação de mais de duas médias

No Capítulo anterior consideraram-se estudos onde se pretendiamcomparar duas médias(→teste t de Student para duas amostras):

Em muitas situações, o investigador precisa comparar várias médias (mais de duas)

• Comparar os efeitos de 5 doses de uma fitohormona sobre o crescimento em altura de plantas de buganvília:

• Comparar os teores de cafeína de 6 marcas de chá verde:

• Nestes casos, usa-se o método daAnálise de Variância(ANOVA).

µµµµ

µµµµ

1 2

0: =

H

µµµµ µµµµ µµµµ µµµµ

µµµµ

1 2 3 4 5

0: = = = =

H

µµµµ µµµµ µµµµ µµµµ µµµµ

µµµµ

1 2 3 4 5 6

0: = = = = =

H

(2)

Comparação de mais de duas médias

Numa primeira tentativa de encontrar resposta para o problema proposto, seriamos tentados a realizar todas as comparações possíveis das médias dos 5 tratamentos, tomadas duas a duas, pelo método clássico do t de Student:

Todavia, este procedimento resulta não só moroso, como também muito pouco preciso.

• Karl Pearson (1942) demonstrou que se adoptarmos à partida um nível de significância nominal α, a

probabilidade de se cometer o erro de tipo I quando se utilizam múltiplos testes t para encontrar diferenças entre todos os pares possíveis de um número k de médias é sempre superior a α, e tanto mais elevado quanto maior for k.

µµµµ

µµµµ µµµµ µµµµ µµµµ

µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ

µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ µµµµ

µµµµ

5 0 4

5 0 3

4 0 3

5 0 2

4 0 2

3 0 2

5 0 1

4 0 1

3 0 1

2 0 1

:

:

; :

; :

; :

; :

:

; :

; :

; :

=

=

=

=

=

=

=

=

=

=

H

H H

H H

H

H H

H H

10 testes t de Student

para comparar 5

médias!

Comparação de mais de duas médias

Por exemplo, no nosso caso concreto, se

pretendêssemos comparar as 5 médias adoptando um nível de significância nominal α=0.05, teríamos para o conjunto dos 10 testes t de Student um nível de significância real de 0.23!

Nível de significância nominal Número de médias a

comparar (k)

α α α

α=0.05 αααα=0.01 αα=0.001 αα

2 0.05 0.01 0.001

3 0.13 0.03 0.003

4 0.21 0.05 0.006

5 0.23 0.07 0.009

10 0.63 0.23 0.034

20 0.92 0.52 0.109

1.00 1.00 1.000

(3)

Comparação de mais de duas médias

• Para se testarem hipóteses do tipo:

• utiliza-se o procedimento estatístico da Análise de Variância, que deve o seu nome e muito do seu desenvolvimento inicial a R.A. Fisher , e para o qual J.W. Tukey propôs o acrónimo de ANOVA (de “ AN alysis O f VA riance”).

iguais são s as todas

Nem i

k k

H H

´ :

...

:

1

1 2

0 1

µµµµ µµµµ µµµµ µµµµ

µµµµ

= = = =

ANOVA: Generalidades

O investigador controla uma ou mais de uma variáveis independentes

Essas variáveis chamam-se factores

Cada uma delas pode apresentar dois ou mais níveis O investigador observa/mede os efeitos na variável dependente

Resposta aos níveis da variável independente

Delineamento Experimental: é o plano (ou esquema)

utilizado para testar as hipóteses

(4)

ANOVA: Generalidades

Análise de Variância

Factor Único

ANOVA Unifactorial

Vários Factores

ANOVA Multifactorial

ANOVA: Premissas

A validade dos resultados da ANOVA pressupõe que os dados cumpram as seguintes condições:

Independência e aleatoriedade dos erros

(Seleccionam-se amostras aleatórias das populações).

As populações devem ter distribuição normal .

As populações devem ter variâncias iguais

(homogéneas).

(5)

ANOVA Unifactorial

Serve para testar a igualdade de duas ou mais ( k ) médias populacionais.

Variáveis:

Uma variável independente (um factor ) medida em escala nominal .

Uma variável independente medida em escala de intervalo ou de razão.

Dois ou mais ( k ) níveis ou modalidades no factor Utiliza-se para analizar os resultados dos delineamentos completamente casualizados.

ANOVA Unifactorial: Exemplo

Fez-se um estudo destinado a comparar o teor de cafeína de seis marcas comerciais de chá verde (Lipton, Tetley, Gorreana, Twinings, Delta e Ahmad).

Quatro pacotes de chá verde de cada uma das 6 marcas foram analisados para a quantificação da cafeína.

Questão: Há evidência para sustentar, ao nível de 5%,

que existem diferenças significativas entre os teores

médios de cafeína das seis marcas de chá verde?

(6)

ANOVA Unifactorial: Exemplo

136 139

139 145

137

4

142

140 137

140 141

136

3

140

140 139

139 143

140

2

139

137 138

141 147

135

1

141

Ahmad Delta

Twinings Gorreana

Tetley Lipton

Marca de chá verde Pacote

Teores de cafeína em seis marcas de chá verde

Só há um FACTOR (Variável Independente), que é a MARCA DE CHÁ VERDE.

O FACTOR único apresenta 6 NÍVEIS (as 6 marcas de chá), denominadas TRATAMENTOS.

A RESPOSTA (Variável Dependente) é o TEOR DE CAFEÍNA.

ANOVA Unifactorial: Hipóteses

H

0

: µµµµ

1

= µµµµ

2

= µµµµ

3

= ...

= µµµµ

k

• As médias das k populações são iguais

• Não há efeito dos tratamentos

H

1

: Nem todas µµµµ

j

’s são iguais

• Pelo menos uma média é diferente das outras

• Há efeito dos tratamentos

• É incorrecto dizer µµµµ1≠≠≠≠ µµµµ2

≠≠≠≠...≠≠≠≠ µµµµk

X f(X)

µµµµ

1

= µµµµ

2

= µµµµ

3

X f(X)

µµµµ

1

= µµµµ

2

µµµµ

3

(7)

ANOVA Unifactorial: Cálculo

Compara dois tipos de variação para testar a igualdade das médias.

A comparação faz-se com base na razão de duas variâncias .

Se a variação devida aos tratamentos exceder a variação aleatória , conclui-se que as médias não são todas iguais.

As fracções de variação devidas ao efeito dos tratamentos e aos efeitos aleatórios ( erro experimental ) obtêm-se

“ decompondo ” a variação total dos dados .

ANOVA Unifactorial: Cálculo

Variação devida a tratamentos

Variação aleatória

(erro experimental)

Variação total

Soma dos quadrados do erro

Soma dos quadrados dentro dos grupos

Soma dos quadrados dos tratamentos

Soma dos quadrados entre os grupos

+

(8)

ANOVA Unifactorial: Cálculo

 X

Grupo 1 Grupo 2 Grupo 3 Resposta, X

(((( )))) (((( )))) (((( )))) ((((

ij

))))

2

2 21

2

11

X X X X X

X Total

SQD (((( Total )))) ==== (((( X

11

−−−− X )))) ((((

2

++++ X

21

−−−− X ))))

2

++++ K ++++ (((( X

ij

−−−− X ))))

2

SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−

X11

Desvios de todos os dados relativamente à média global do estudo

ANOVA Unifactorial: Cálculo

 X

 X

3

 X

2

 X

1

Grupo 1 Grupo 2 Grupo 3 Resposta, X

(((( )))) (((( ))))

k

((((

k

))))

2

2 2

2 2 1

1

X X n X X n X X

n .) trat (

SQD ==== (((( −−−− )))) ++++ (((( −−−− )))) ++++ K ++++

k

((((

k

−−−− ))))

2

2 2

2 2 1

1

X X n X X n X X

n .) trat (

SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−

Desvios das médias dos tratamentos relativamente à média global do estudo

(9)

ANOVA Unifactorial: Cálculo

 X

2

 X

1

 X

3

Grupo 1 Grupo 2 Grupo 3 Resposta, X

(((( )))) (((( )))) ((((

kn k

))))

2

2 1 21 2

1

11

X X X X X

X ) erro (

SQD ==== (((( −−−− )))) (((( ++++ −−−− )))) ++++ K ++++ ((((

kn

−−−−

k

))))

2

2 1 21 2

1

11

X X X X X

X ) erro (

SQD ==== −−−− ++++ −−−− ++++ K ++++ −−−−

Desvios dos dados de cada grupo relativamente à média do próprio grupo

ANOVA Unifactorial: Cálculo

Graus de Liberdade dos Tratamentos (k-1)

Graus de Liberdade do Erro (N-k) Graus de Liberdade

Totais (N-1)

k = nº de tratamentos (grupos)

n = nº de dados em cada grupo

N = nº total de dados no estudo = k.n

+

(10)

ANOVA Unifactorial: Cálculo

O critério do teste é o estatístico F , que é a razão de duas variâncias (ou Quadrados Médios, QM´s ), a dos tratamentos ( QM

Tratamentos

) e a do erro ( QM

Erro

):

−1

=

= k

SQD Gl

QM SQD Tratamentos

s Tratamento s Tratamento s

Tratamento

k N SQD Gl

QM SQD Erro

Erro Erro

Erro = = −

iberdade graus de l k

k- N com

QM F QM

Erro s Tratamento

amostra ,

=

:

1

ANOVA Unifactorial: Cálculo

Teste F

αααα

Este teste é sempre unilateral!

F αααα

(k−−−−1,N k)−−−−

0

Rejeitar H

0

F Não rejeitar H

0

Se H

0

fôr verdadeira (µ

i

’s todas iguais), então F=Qm

trat

/QM

erro

≈1.

Rejeitar H

0

se F

amostra

fôr elevado, isto é se:

Critério:

(

k N k

)

F

Famostraα −1 −

(11)

ANOVA Unifactorial: Cálculo

Origem da Variação

Graus de Liberdade

Soma dos Quadrados

Quadrado Médio (Variância)

F

Tratamentos k - 1 SQD

trat. QMtrat=

SQDtrat/(k - 1)

QM

trat

QM

erro

Erro N - k

QMerro=

SQDerro/(N - k)

Total N - 1 SQD

Total

dos Desvios

SQDerro= SQDTotal-SQDtrat

———

Quadro ANOVA

ANOVA Unifactorial: Exemplo

76465 553

4 136 140 140 137 Ahmad

3351 553

559 576

548 Ti 562

468073 76455

78123 82964

75090 78966

Σxij2

24 4

4 4

4 4

ni

Totais 139

139 145

137 4 142

137 140

141 136

3 140

139 139

143 140

2 139

138 141

147 135

141 1

Delta Twinings

Gorreana Tetley

Lipton

Teores de cafeína em seis marcas de chá verde

(12)

ANOVA Unifactorial: Exemplo

Cálculo do Termo de Correcção (TC) e do Somatório dos Quadrados dos Desvios Total (SQDTOTAL)

375 , 467883 24

3351

2

..

2

=

=

= N

TC T

23 1 24

625 , 179 375 , 467883 468063

6 2

1 4

1

=

=

=

=

=

∑ ∑

= =

GL SQD X

TOTAL

i j ij

TOTAL TC

ANOVA Unifactorial: Exemplo

Cálculo Somatório dos Quadrados dos Desvios dos Tratamentos (SQDTratamentos)

5 1 6

375 , 122 375 , 467883 4

... 553 4

548 4

5622 2 2

6

1 2

=

=

=

− + + +

=

=

=

=

=

GL SQD

T n SQD

s Tratamento

s Tratamento

i

i i

i s

Tratamento TC

(13)

ANOVA Unifactorial: Exemplo

Cálculo Somatório dos Quadrados dos Desvios do Erro (SQDErro)

18 5 23

25 , 57 375 , 122 625 , 179

=

=

=

=

=

GL SQD

SQD SQD

SQD

Erro Erro

s Tratamento TOTAL

Erro

ANOVA Unifactorial: Exemplo

Cálculo do Quadrado Médio dos Tratamentos (QMTratamentos) e do Quadrado Médio do Erro (QMErro)

475 , 5 24

375 ,

122 =

=

=

GL

QM SQD

s Tratamento

s Tratamento s

Tratamento

181 , 18 3

25 ,

57 =

=

=

GL

QM SQD

Erro Erro Erro

(14)

ANOVA Unifactorial: Exemplo

Cálculo do valor amosstral de F (Famostra)

695 , 181 7 , 3

475 ,

24 =

=

= QM

F QM

Erro s Tratamento amostra

ANOVA Unifactorial: Exemplo

F

0

2,77

H

0

: µµµµ

1

= µµµµ

2

=…= µµµµ

6

H

1

: Nem todas µµµµ

i

’s são iguais

αααα = 0,05

GL

1

= 5 GL

2

= 18

Valor Crítico:

Estatístico F:

Decisão:

Rejeitar H

0

a αααα = 0,05 αααα =0,05

Conclusão:

Há evidência para concluir que o teor médio de cafeína não é igual em todas as marcas de chá verde .

695 , 181 7 , 3

475 ,

24 =

=

=

QM

F QM

Erro s Tratamento amostra

(15)

ANOVA Unifactorial: Exemplo

Tabela do F de Snedecor

F0,05(5/18)

= 2,77

ANOVA Unifactorial: Exemplo

O cômputo da Análise de Variância costuma ser sistematizado e apresentado numa tabela, conhecida por Quadro ANOVA, onde se materializa a decomposição da Soma dos Quadrados dos Desvios Total e do Número Total de Graus de Liberdade.

Origem da variação

GL SQD QM Famostra Fαααα

α αα

α=0.05 αααα=0.01 αααα=0.001 Entre grupos

(Marcas de chá)

5 122,375 24,475 7,694(***) 2,77 4,25 6,81

Dentro dos grupos

(Erro)

18 57,250 3,181

TOTAL 23 179,625

Quadro ANOVA

(16)

ANOVA Unifactorial: Exemplo

Conclusões:

Há diferenças significativas entre as seis marcas de chá verde no que ao teor de cafeína diz respeito.

Para esclarecer quais as marcas que têm idêntico valor para o teor médio de cafeína e quais diferem a esse respeito, tem que se realizar testes pós-ANOVA para comparações múltiplas de médias .

Dentre os vários testes pós-ANOVA descritos na literatura , serão abordados aqui o Teste de Student- Neuman-Keuls (Teste S-N-K) e o Teste de Tukey .

ANOVA Unifactorial: Exemplo

Médias ordenadas por ordem crescente de grandeza

Tratamentos ⇒ Tetley Delta Ahmad Twinings Lipton Gorreana Médias ⇒ 137,00 138,25 138,25 139,75 140,50 144,00

Teste de Student-Newman- Keuls (S-N-K)

Comparação Diferença p q0.05(p,18) Erro-padrão AMSp Significância

Gorreana vs. Tetley 7,00 6 4,49 0,892 4,01 *

Gorrena vs. Delta 5,75 5 4,28 0,892 3,82 *

Gorreana vs. Ahmad 5,75 4 4,00 0,892 3,57 *

Gorreana vs. Twinings 4,25 3 3,61 0,892 3,25 *

Gorrena vs. Lipton 3,50 2 2,97 0,892 2,65 *

Lipton vs. Tetley 3,50 5 4,28 0,892 3,82 ns

Lipton vs. Delta 2,25 4 4,00 0,892 3,57 ns

Lipton vs. Ahmad 2,25 3 3,61 0,892 3,25 ns

Lipton vs. Twinings 0,75 2 2,97 0,892 2,65 ns

Twinings vs. Tetley 2,75 4 4,0 0,892 3,57 ns

Twinings vs. Delta 1,50 3 3,61 0,892 3,25 ns

Twinings vs. Ahmad 1,50 2 2,97 0,892 2,65 ns

Ahmad vs. Tetley 1,25 3 3,61 0,892 3,25 ns

Ahmad vs. Delta 0,00 2 2,97 0,892 2,65 ns

Delta vs. Tetley 1,25 2 2,97 0,892 2,65 ns

*= médias significativamente diferentes ao nível de 5%, porque a sua diferença excede a Amplitude Mínima Significativa (AMS).

ns= médias não significativamente diferentes ao nível de 5%, porque a sua diferença é inferior à Amplitude Mínima Significativa (AMS).

892 , 4 0 181 ,

3 =

=

= n

QMErro

(17)

ANOVA Unifactorial: Exemplo

Tabela dos Testes S-N-K e Tukey

Amplitudes Studentizadas para GLerro=18

e αααα=0,05

ANOVA Unifactorial: Exemplo

Apresentação do Resultado do Teste S-N-K

b 137,00

Tetley

b 138,25

Delta

b 138,25

Ahmad

b 139,75

Twinings

b 140,50

Lipton

a 144,00 Gorreana

Grupos de Significância Média

Marca de chá

Médias que partilham letras no grupo de significância não são significativamente diferentes!

(18)

ANOVA Unifactorial: Exemplo

Apresentação do Resultado do Teste S-N-K

Médias unidas por um mesmo traço não são significativamente diferentes!

Gorreana (144,00) Lipton

(140,50) Twinings

(139,25) Ahmad

(138,25) Delta

(138,25) Tetley

(137,00)

• Gorreana tem mais cafeína que todas as ouras marcas

• As outras marcas não diferem entre si

ANOVA Unifactorial: Exemplo

Médias ordenadas por ordem crescente de grandeza

Tratamentos ⇒ Tetley Delta Ahmad Twinings Lipton Gorreana Médias ⇒ 137,00 138,25 138,25 139,75 140,50 144,00

Teste de Tukey

Comparação Diferença p q0.05(p,18) Erro-padrão AMSp Significância Gorreana vs. Tetley 7,00 6 4,49 0,892 4,01 *

Gorrena vs. Delta 5,75 5 4,49 0,892 4,01 * Gorreana vs. Ahmad 5,75 4 4,49 0,892 4,01 * Gorreana vs. Twinings 4,25 3 4,49 0,892 4,01 * Gorrena vs. Lipton 3,50 2 4,49 0,892 4,01 ns

Lipton vs. Tetley 3,50 5 4,49 0,892 4,01 ns Lipton vs. Delta 2,25 4 4,49 0,892 4,01 ns Lipton vs. Ahmad 2,25 3 4,49 0,892 4,01 ns Lipton vs. Twinings 0,75 2 4,49 0,892 4,01 ns Twinings vs. Tetley 2,75 4 4,49 0,892 4,01 ns Twinings vs. Delta 1,50 3 4,49 0,892 4,01 ns Twinings vs. Ahmad 1,50 2 4,49 0,892 4,01 ns Ahmad vs. Tetley 1,25 3 4,49 0,892 4,01 ns Ahmad vs. Delta 0,00 2 4,49 0,892 4,01 ns Delta vs. Tetley 1,25 2 4,49 0,892 4,01 ns

*= médias significativamente diferentes ao nível de 5%, porque a sua diferença excede a Amplitude Mínima Significativa (AMS).

ns= médias não significativamente diferentes ao nível de 5%, porque a sua diferença é inferior à Amplitude Mínima Significativa (AMS).

(19)

ANOVA Unifactorial: Exemplo

Apresentação do Resultado do Teste de Tukey

b 137,00

Tetley

b 138,25

Delta

b 138,25

Ahmad

b 139,75

Twinings

a b 140,50

Lipton

a 144,00 Gorreana

Grupos de Significância Média

Marca de chá

Médias que partilham letras no grupo de significância não são significativamente diferentes!

ANOVA Unifactorial: Exemplo

Apresentação do Resultado do Teste de Tukey

Médias unidas por um mesmo traço não são significativamente diferentes!

Gorreana (144,00) Lipton

(140,50) Twinings

(139,25) Ahmad

(138,25) Delta

(138,25) Tetley

(137,00)

• Lipton ocupa uma posição charneira entre Gorreana e as restantes marcas.,

• O Teste de Tukey é mais

(20)

ANOVA Multifactorial

Há vários (dois ou mais ) factores ou variáveis independentes .

Cada um deles pode terdois ou mais níveis.

A análise estatística é uma ANOVA a vários critérios de classificação dos dados.

Como exemplo, considera-se o caso mais simples: o dos delineamentos factoriais duplos.

Poupam tempo e trabalho, e enriquecem a pesquisa:

Num só empreendimento experimental, obtém-se a informação que só se conseguiria realizando dois ensaios separados, um para cada factor individual.

Permitem controlar os efeitos de factores secundários que, introduzindo variação espúria nos resultados, dificultam a comparação dos efeitos do factor de interesse primordial.

Possibilitam a análise das interacções entre factores.

ANOVA Multifactorial: Cálculo

Variação devida ao factor A

Variação Total

Variação devida ao factor B

Variação devida à interacção de A com B

Variação aleatória (erro experimental)

+

+

+

(21)

ANOVA Multifactorial: Cálculo

Graus de liberdade do factor A (a-1)

Graus de liberdade totais (N-1)

Graus de liberdade dofactor B (b-1)

Graus de liberdade dainteracção de A com

B [(a-1)(b-1)]

Graus de liberdade do erro(N-ab)

+

+

+

Neste caso, há lugar aocálculo de três estatísticos F, um relativo ao factor A, outro aofactor Be outro para a interacção A x B:

Rejeitar a H0da igualdade dos efeitos dos níveis de A se:

iberdade graus de l ab

a- N com

QM F QM

Erro A A

amostra ,

= 1

iberdade graus de l ab

b- N com

QM F QM

Erro B B

amostra ,

= 1

( )( )

graus de liberdade

ab N b com a

QM F QM

Erro AB AB

amostra

. ,

− −

=

1 1

Rejeitar a H0da igualdade dos efeitos dos níveis de B se:

(

a N ab

)

F

FAamostraα −1 −

Rejeitar a H0da inexistência de interacção se:

( )( )

 

 − − −

N ab

b F a

FABamostra 1. 1

α

(

b N ab

)

F

FBamostraα −1 −

ANOVA Multifactorial: Cálculo

(22)

ANOVA Multifactorial: Exemplo

No decurso de um estudo sobre os efeitos da solução de lavagem e do tipo de forno utilizado sobre a remoção térmica da pele dos amendoins, foram testados três tipos de solução de lavagem (cloreto de potássio, cloreto de sódioe água) e três tipos de forno (forno de convecção, forno de microondas e forno convencional).

Cada combinação solução-tipo de forno foi testada em três lotes de amendoim (três repetiçõesde cada “tratamento”), tendo-se registado como variável de resposta a percentagem de amendoins descascadosobservada em cada caso.

Questões:

Há evidência nos dados para se concluir, ao nível de 5%, que o efeito da solução de lavagem sobre a percentagem de amendoins descascados varia com o tipo de forno utilizado?

Que conclusões se podem tirar para os diversos tipos de solução e de forno?

ANOVA Multifactorial: Exemplo

612.1 220.6

148.9 242.6

Σ

583.1 260.3

120.9 201.9

Σ

1855.0 712.0

475.0 668.0

Total

659.8 231.1

205.2 223.5

Σ

72.7 76.9 81.5 73.5

64.3 67.4 71.9

77.7 73.9 H2O

75.0 76.6 69.0 49.6

45.4 53.9 81.4

77.9 NaCl 83.3

86.2 82.1 92.0 35.6

44.6 40.7 64.3

70.0 67.6 KCl

Convencional Microondas

Convecção

Total Forno

Solução de Lavagem

(23)

ANOVA Multifactorial: Exemplo

GL

Erro

SQD

Erro

GL

Interacção

SQD

Interacção

GL

Solução

SQD

Solução

GL

Forno

SQD

Forno

SQD

Subgrupos

Decomposição de SQD

Total

e GL

Total

ANOVA Multifactorial: Exemplo

Cálculo do Termo de Correcção (TC) e do Somatório dos Quadrados dos Desvios Total (SQDTOTAL)

37 , 127445 27

1855

2

..

2

=

=

= N

TC T

26 1 27

85 , 5608 37 , 127445 22

, 133054

3

1 3 2

1 3

1

=

=

=

=

=

∑ ∑ ∑

= = =

GL SQD X

TOTAL

i j k

TOTAL ijk TC

(24)

ANOVA Multifactorial: Exemplo

Cálculo dos Somatórios dos Quadrados dos Desvios dos Subgrupos (SQDSubgrupos) e do Erro (SQDErro)

8 1 3 3

077 , 5319 37 , 127445 3

1 , 231 2 ...

9 , 120 2 9

, 201 2

1 1

2 .

=

=

= + −

+

= +

=

∑∑

x

n TC

GL SQD T

Subgrupos

a b ij Subgrupos

18 ) 1 3 .(

3 . 3 ) 1 .(

.

773 , 289 077 , 5319 85 , 5608

=

=

=

=

=

= n b

GL

a

SQD SQD

SQD

Erro

Subgrupos Total

Erro

ANOVA Multifactorial: Exemplo

Cálculo dos Somatórios dos Quadrados dos Desvios dos Factores A (SQDA) e B (SQDB), e da respectiva Interacção (SQDAB)

2 1 3 1

630 , 3531 37 , 127445 3

. 3

0 , 712 2 0 , 475 2 0 , 668 2

1 .

2 . .

=

=

=

= +

= +

=

b n TC a

GL SQD T

B

b j

B

4 ) 1 3 ).(

1 3 ( ) 1 ).(

1 (

144 , 1454 630 , 3531 303 , 333 077 , 5319

=

=

=

=

=

= b

GL a

SQD SQD

SQD SQD

AB

B A

Subgrupos AB

2 1 3 1

303 , 333 37 , 127445 3

. 3

8 , 659 2 1 , 612 2 1 , 583 2

1 .

2 ...

=

=

=

= +

= +

=

a n TC b

GL SQD T

A a

i A

(25)

ANOVA Multifactorial: Exemplo

Quadro ANOVA

Origem da variação GL SQD QM Famostra

Fαααα

α αα

α=0.05 αααα=0.01 αααα=0.001 SUBGRUPOS 8 5319,077 664,885 41,30(***) 2,51 3,71 5,76

A (solução)

2 333,303 166,652 10,35(**) 3,56 6,01 10,39

B (forno)

2 3531,630 1765,815 109,69(***) 3,56 6,01 10,39

AxB (solução x forno)

4 1454,144 363,536 22,58(***) 2,93 4,58 7,46

ERRO 18 289,773 16,099

TOTAL 26 5608,850

ANOVA Multifactorial: Exemplo

Conclusões:

Tanto a solução de lavagem como o tipo de forno utilizado tiveram efeitos significativos sobre o rendimento do processo de remoção da casca dos amendoins.

Há evidência suficiente nos dados para se poder concluir a existência de uma interacção significativa destes dois factores.

A interacção significativa significa, neste caso, que a resposta da percentagem de amendoins descascados às soluções de lavagem testadas varia com o tipo de forno utilizado (ou que a resposta ao tipo de forno variou com a solução empregue na lavagem dos amendoins).

Uma maneira expedita de examinar a interacção consiste em fazer representações gráficas das médias dos subgrupos (eixo das ordenadas) em função dos níveis dos dois factores (⇒ Gráficos de Perfil da Resposta).

(26)

ANOVA Multifactorial: Perfil da Resposta

1. Se as linhas fossem sensivelmente paralelas, isso sugeriria a não existência de interacção. 2. Não o sendo visivelmente, podemos concluir que o padrão de resposta da % de descascados às soluções variou com o tipo de forno

⇒a interacção solução x forno é significativa.

ANOVA Multifactorial: Perfil da Resposta

1. Se as linhas fossem sensivelmente paralelas, isso sugeriria a não existência de interacção. 2. Não o sendo visivelmente, podemos concluir que o padrão de resposta da % de descascados ao tipo de forno variou com a solução de lavagema interacção solução x forno é significativa.

(27)

ANOVA Multifactorial: Perfil da Resposta

NaCl H2O KCl Convencional

KCl NaCl H2O Microondas

KCl H2O NaCl Convecção

Resultados do Teste de Tukey para Soluções Tipo de forno

Fazendo uma ANOVA a um critério em separado para os dados de cada tipo de forno, seguida do Teste de Tukey, podemos confirmar estes factos:

1. No forno de convecção, obtiveram-se melhores resultados com água e NaCl.

2. No forno de microondas, obtiveram-se melhores resultados com água.

3. No forno convencional, a água mostrou um desempenho intermédio entre KCl e NaCl.

(28)

BLOCOS COMPLETOS CASUALIZADOS

Júlio Osório

Blocos Completos Casualizados Exemplo

Efeitos de 4 dietas (A, B, C e D) sobre os acréscimos de peso em porquinhos-da-India.

5 animais/dieta em bom estado físico e com a mesma idade.

O ensaio em vivário, animais em gaiolas individuais situadas sobre bancadas.

Condições ambientais de luz, temperatura, humidade, ruído, etc. não eram homogéneas na estufa, e podem ter inflência sobre os acréscimos de peso dos animais.

Constituiídos 5 blocos de unidades experimentais, isto é, 5 grupos de porquinhos-da-India.

Cada bloco de animais consiste de 4 porquinhos-da-India, um para cada uma das 4 dietas.

As 4 gaiolas de cada bloco foram arrumadas em posições vizinhas sobre a bancada do laboratório, e distribuíram-se os 5 blocos pela bancada por forma a corresponderem tanto quanto possível a diferentes condicionalismos ambientais.

Considera-se que todos os membros de um mesmo bloco se encontram em idênticas condições, excepto no tocante, com é óbvio, à dieta alimentar.

A atribuição da dieta a cada um dos indivíduos de um bloco foi feita por um processo aleatório.

(29)

Blocos Completos Casualizados Características

Plano do ensaio e acréscimos de peso dos porquinhos-da-India ao fim do período de experiência.

B 3.3 C

2.0 A

1.4 D

1.0 B

2.7

C 2.5 A

1.2 D

1.1 B

2.9 A

1.5

D 1.5 B

3.0 B

2.1 C

2.2 D

1.3

A 1.4 D

1.3 C

2.4 A

1.4 C

2.1

Bloco 5 Bloco

4 Bloco

3 Bloco

2 Bloco

1

Blocos Completos Casualizados Utilização

Situações em que se suspeita ou se sabe à partida que certas unidades experimentais, “tratadas” de forma idêntica,

responderão de forma diferente aos tratamentos:

nos ensaios de campo, parcelas de terreno contíguas tendem a responder de forma mais semelhante que parcelas afastadas;

os animais mais pesados de um grupo de animais com a mesma idade tendem a exibir uma taxa de acréscimo de peso distinta da dos animais mais leves;

medições feitas no mesmo dia com um certo equipamento tendem a ser mais homogéneas que as feitas com o mesmo equipamento noutro dia;

um lote de análises bioquímicas (envolvendo várias manipulações) tende a produzir resultados mais homogéneos quando é executado mesmo analista do quando o é por vários analistas.

(30)

BCC: Exemplos de Factores que integram os Blocos

Sócio-demografia

Pessoa Idade

Género Densidade local

Árvore Idade

Distribuição do calor

Localização na estufa Fluxo de ar

Orientação do Sol Composição do solo Diferenças no declive

Parcela de Terreno Gradiente de humidade

Gradiente de fertilidade

Unidade Experimental Variável Perturbadora

BCC: Regras para a implementação dos Blocos

A fiabilidade da análise depende muito da forma como se constituem os Blocos:

• Com parcelas de terreno, os Blocos devem ficar perpendiculares ao gradientedo factor de perturbação que se quer controlar.

• Utilizam-se áreas de bordadura(isto é, de excusão) de tamanho apropriado para eliminar as interferências de parcelas vizinhas (isto é, para assegurar a

independência das respostas), tanto entre como dentro dos blocos.

O grande princípio é maximizar a homogeneidade dentro dos Blocos e, ao mesmo tempo, maximizar a

heterogeneidade entre os Blocos.

(31)

BCC: Exemplo incorrecto

Gradientede humidade

T2 T1 T5 T3 T4

T3 T4 T1 T2 T5 T1

T5 T2 T4 T3 T4

T2 T3 T5 T1

Efeitos dos tratamentos confundidos com efeitos da humidade!

BCC: Exemplo correcto

Gradientede humidade

T1 T3 T5 T4 T2

T4 T5 T1 T2 T3

T3 T2 T4 T5 T1

T5 T2 T3 T1 T4

O efeito do Bloco remove agora o efeito da humidade,

(32)

BCC: Vantagens e Desvantagens

Vantagens:

Permite controlar uma única fonte estranha de variação e remover o seu efeito da estimativa do erro experimental.

Assegura maior flexibilidade no planeamento da experiência.

Assegura maior flexibilidade na implementação e administração da experiência.

Desvantagens:

Geralmente inadequado quando há um número elevado de tratamentos, devido a eventual impossibilidade de assegurar a homogeneidade dentro dos Blocos.

Problemas sérios com a análise se existir de facto uma

interacção entre o factor em Blocos e os tratamentos, e não se tenha previsto a replicação dentro dos Blocos (solução: usar replicação dentro dos blocos quando possível).

ANOVA em BCC: Cálculo

Variação devida ao factor Blocos

Variação aleatória (erro experimental)

+

Variação devida ao factor Tratamentos

+

Variação Total

Embora haja 2 factores (Blocos e Tratamentos),

não se pode calcular a interacção!

(33)

ANOVA em BCC: Cálculo

Graus de liberdade do erro(a-1). (b-1) Graus de liberdade de

Blocos(a-1) +

Graus de liberdade de Tratamentos(b-1)

+ Graus de liberdade

totais (ab-1)

ANOVA em BCC: Cálculo

1

1 2

=

= b

a TC

cos Blo

b .j cos

Blo

SQD T νννν

TC axbT..

= 2

1

1 1 2

=

= ∑ ∑ axb

TC

TOTAL

b a

TOTAL Yij

SQD νννν

s Tratamento cos

Blo Total

Erro SQD SQD SQD

SQD = − −

1

1 2

=

=

a b TC

s Tratamento

a i. s Tratamento

SQD T νννν

(34)

ANOVA em BCC: Cálculo

Organizar os dados numa tabela Blocosx Tratamentos:

38.3 6.2 11.2 14.0 6.9 Ti.

8.7 1.5 2.5 3.3 1.4 5

7.5 1.3 2.0 3.0 1.2 4

7.0 1.1 2.4 2.1 1.4 3

7.5 1.0 2.2 2.9 1.4 2

7.6 1.3 2.1 2.7 1.5 1

D C B A Blocos

T.j Dietas

3 1 4

1535 5 8

2 6 2 11 0 14 9

6 2 2 2 2

=

=

= +

+

= + ννννTratamentos

s

Tratamento . . . . TC .

SQD

3445 5 73

4 3

38 2 .

TC = x. =

19 1 5 4

3255 9 67 82

=

=

=

= x

. TC .

TOTAL TOTAL

SQD νννν

12 1 5 1 4

7790 0 1535 8 3930 0 3255 9

=

=

=

=

) ( x ) (

. . . .

Erro

SQDErro

νννν

12 1 5 1 4

7790 0 1535 8 3930 0 3255 9

=

=

=

=

) ( x ) (

. . . .

Erro

SQDErro

νννν

ANOVA em BCC: Cálculo

QUADRO ANOVA

9.3255 19 TOTAL

0.0649 0.7790 12 ERRO

10.8 5.95 3.49 41.9(***) 2.7178 8.1535 Tratamentos 3

(Dietas)

- - 3.26 1.51(ns) 0.0982 0.3930 4 Blocos

α αα α=0.001 α

αα α=0.01 α

αα α=0.05

Fαααα Famostra

QM SQD Origem da GL

variação

Decisão e Conclusão: Rejeitar H0. Conclui-se que existe uma diferença muito altamente significativa entre os ganhos médios de peso produzidos pelas 4 dietas ensaiadas.

(35)

BCC: Organização em Blocos e Controlo da Variação Espúria

O interesse principal do investigador é compararganhos médios de peso alcançados com as quatro dietas.

•A variação que a heterogeneidade das condições ambientais introduz nos ganhos de peso representa uma fonte de variação estranha ao objectivo do ensaio (variação espúria).

A menos que o investigador a consiga controlar, esta variação tem potencial para sobrepôr-se à das dietas, mascarando as eventuais diferenças entre dietas.

•Como consequência disto, há uma probabilidade elevada de se concluir (erroneamente) que não há diferença entre os efeitos das dietas, quando na realidade elas estão presentes no ensaio!

•Em teoria, comparações rigorosas só poderiam ser feitas se ele instalassem os animais sujeitos às quatro dietas num ambiente perfeitamente homogéneo.

Referências

Documentos relacionados

Madlener Evelyn Sutter Birgit Marktl Anna Sutter Stefanie Fischer Tamara Fischer Sebastian Marktl Leah Hackhofer Matthias Nicolussi Christoph

Foram realizados quatro diferentes tratamentos para analisar o efeito que a variação da concentração da quitosana e argila sobre a análise do estudo da

Três hipóteses norteiam nossa proposta: (a) A mudança de estilo do falante não está condicionada aos elementos da situação de fala (formalidade ou audiência), mas ao uso de

Essa diversidade caracteriza-se pelo uso de variantes linguísticas, ou seja, “duas (ou mais) maneiras de se dizer a mesma coisa” (TARALLO, 2007, p. O modelo teórico que

Por todo exposto, considerando as dispensas ocorridas após 1994 e não havendo indícios de norma regulamentar ou consuetudinária pretérita, a manutenção da r. sentença

A análise dos componentes de variância revelou que a variação fenotípica foi um pouco mais elevada do que a variação genotípica para todas as características analisadas,

Esta situaç~o acaba favorecendo o debate sabre o carácter fisico da funç~o de onda quàntica,e uma soluç~o geral seria por e~emplo, de grande utilidade para a

Trata-se de um estudo prospectivo e quantitativo para a avaliação de um instrumento norteador para o desenvolvimento do cuidado farmacêutico domiciliar em Unidades de