• Nenhum resultado encontrado

Existem duas maneiras nas quais as hipóteses da ANOVA podem ser violadas. Primeiro, os dados podem consistir de medidas em uma escala ordinal ou nominal; neste caso métodos mais apropriados para dados ordinais e nominais são necessários. Segundo, os dados, embora medidos em escala contínua, podem não satisfazer pelo menos uma das três hipóteses requeridas pela análise de variância:

Como vimos anteriormente, as hipóteses da análise de variância são:  os termos dos erros são aleatóriamente, independentemente e

normalmente distribuídos ~ ( , 2 ) ij N 0

e

 a variância de diferentes amostras são homogêneas; variâncias e médias de diferentes amostras não são correlacionadas;

 os efeitos dos tratamentos são aditivos.

Nestes casos, duas opções se oferecem para analisar os dados. Uma é reduzir o intervalo dos dados para dados medidos em uma escala nominal ou ordinal apropiada e fazer uma análise para este tipo de dado. A outra

possibilidade é ver se os dados podem ser transformados para satisfazer as hipóteses da ANOVA. Se tal transformação é encontrada, os dados

transformados podem então serem analisados pelos métodos da ANOVA. A hipótese de variâncias iguais é essencial para a realização da análise de variância. Em muitos casos a transformação que torna as variâncias mais homogêneas, também tornam os dados mais próximos de uma distribuição normal.

Considere o exemplo, no qual os pesos, em pounds, de animais, em um DBC, foram observados. Os tratamentos estão em um esquema fatorial 3 x 2, três espécies de animais e dois grupos, um tratado com uma nova vitamina e outro contrôle, em 4 blocos

Bloco Tratamentos I II III IV mice contrôle 0.18 0.30 0.28 0.44 mice vitamina 0.32 0.40 0.42 0.46 galinha controle 2.0 3.0 1.8 2.8 galinha vitamina 2.5 3.3 2.5 3.3 ovelha controle 108.0 140.0 135.0 165.0 ovelha vitamina 127.0 153.0 148.0 176.0

O quadro da anova dos dados deste experimento mostra os seguintes resultados

Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 984 328 2.631 0.0881 . factor(fatorA) 2 108321 54161 434.507 5.28e-14 *** factor(fatorB) 1 142 142 1.140 0.3025 factor(fatorA):factor(fatorB) 2 250 125 1.004 0.3896 Residuals 15 1870 125 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

174

A alta significância entre as espécies (fatorA) não é surpreendente para o pesquisador. O que parece estranho é que não foi detectada diferença significativa devido a vitamina (fatorB), tendo em vista que todo animal em todas as replicações que receberam vitamina mostraram um peso maior do que o correspondente animal contrôle. Parece estranho também que não foi

encontrado evidências de interação entre os efeitos de vitamina e espécies, dado que a resposta aparente a vitamina é tão diferente nas diferentes

espécies. Tudo que podemos concluir é que mice, galinhas e ovelhas diferem em peso.

Vamos olhar estes dados com as supsições da anova em mente e ver o que podemos fazer se uma das suposições não é atendida.

O gráfico de resíduos vs valores preditos mostra claramente uma heterogeneidade de variâncias e o QQ-plot mostra um comportamento dos dados que não é muito convicente da distribuição normal. A menssagem

parece clara, entretanto, podemos ainda fazer testes para verificar o desvio dos pressupostos.

Teste de normalidade de normalidade de Shapiro-Wilk no R

# teste de normalidade

shapiro.test(pesotrat.av$res)

Saída fornecida pelo R:

Shapiro-Wilk normality test

data: pesotrat.av$res

W = 0.9536, p-value = 0.3236

Este teste mostra o teste é não significativo (p=0,3236), portanto não rejeitamos H0 :ij ~N(0,2) , ou seja, os resíduos e por conseguinte os dados deste experimento suportam a suposição de normalidade. Assim, a primeira suposição é prenchida.

Agora vamos examinar a suposição de homogeneidade das variâncias. Vamos aplicar o teste de Bartlett usando o R.

# teste da homogeneidade das variâncias dos tratamentos bartlett.test(peso~factor(trat))

Saída do teste de Bartlett no R:

Bartlett test of homogeneity of variances

data: peso by factor(trat)

Bartlett's K-squared = 81.8698, df = 5, p-value = 3.408e-16

O teste é significativo (p=3.408e-16), rejeitamos 2 6 2

1 0

H : ... , ou seja, as variâncias dos tratamentos não são homocedásticas (homogêneas).

Logo, a segunda suposição não é observada nos dados deste

experimento. Para tentar contornar o problema vamos usar a transformação Box-Cox, que consiste em transformar os dados de acordo com a expressão

sendo um parâmetro a ser estimado dos dados. Se a equação acima se reduz a

sendo ln é o logaritmo neperiano. Uma vez obtido o valor de encontramos os valores dos dados transformados conforme a equação acima e utilizamos estes dados transformados para efetuar as análises. A função boxcox() do pacote MASS calcula a verossimilhanca perfilhada deste parâmetro. Devemos escolher o valor que maximiza esta função. Nos comandos a seguir

começamos carregando o pacote MASS e depois obtemos o gráfico da verossimilhanca perfilhada no R:

# requerendo o pacote MASS require(MASS)

boxcox(peso ~ factor(trat),plotit = T)

Estes comandos fornecem o gráfico da verossimilhança perfilada

Como estamos interessados no máximo da função vamos dar um zoom no gráfico com o comando

  1 y y'     0 ) ln( ' y y  

176

# zoom no gráfico par maiores detalhes do valor do parâmetro boxcox(a_peso ~ racoes, lam = seq(1,2, 1/10))

O gráfico mostra que o valor que maximiza a função é aproximadamente 0,1. Assim, próximo passo é obter os dados transformados e depois fazer as analise utilizando estes novos dados.

# obtenção dos dados transformados lambda<-0.1

peso.trans <- (peso^(lambda) - 1)/lambda

# fazendo a análise de variância dos dados transformados peso.avtrans <- aov(peso.trans ~ factor(trat)

summary(peso.avtrans) plot(peso.avt)

O quadro da anova dos dados transformados mostra o seguinte quadro da anova

Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.85 0.28 18.244 2.88e-05 *** factor(fatorA) 2 237.35 118.68 7678.808 < 2e-16 *** factor(fatorB) 1 0.31 0.31 19.879 0.00046 *** factor(fatorA):factor(fatorB) 2 0.02 0.01 0.502 0.61518 Residuals 15 0.23 0.02 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Este quadro mostra um resultado mais satisfatório do que a análise dos dados sem transformação. Nesta análise, também é mostrado uma

significância do fator B (p=0,00046). Mesmo assim, o resultado do teste da significância da interação (p = 0,61518) permaneceu não significativo.

NOTA: No gráfico da verossimilhança perfilhada notamos que é mostrado um intervalo de confiança para  e que o valor 0 está contido neste intervalo. Isto indica que podemos utilizar a transformação logaritímica dos dados e os

resultados da anova serão bem próximos dos obtidos com a transformação com  0,1, préviamente adotada.

# quadro da anova dos dados transformados pesolog.av <-

aov(log(peso+1)~factor(bloco)+factor(fatorA)+factor(fatorB)+ factor(fatorA):factor(fatorB))

summary(pesolog.av)

Df Sum Sq Mean Sq F value Pr(>F) factor(bloco) 3 0.22 0.07 12.85 0.000201 *** factor(fatorA) 2 96.89 48.44 8573.72 < 2e-16 *** factor(fatorB) 1 0.07 0.07 12.11 0.003361 ** factor(fatorA):factor(fatorB) 2 0.00 0.00 0.41 0.670832 Residuals 15 0.08 0.01 --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Reparem que os resultados desta anova estão bem próximos dos resultados da anova dos dados originais.

Teste de normalidade de Shapiro-Wilk nos resíduos dos dados transformados

# teste da normalidade

shapiro.test(pesolog.av$res)

Shapiro-Wilk normality test data: pesofattrans.av$res W = 0.9803, p-value = 0.9014

Teste de da homogeneidade das variâncias dos tratamentos

# teste de bartlett

bartlett.test(log(peso+1)~factor(trat))

O resultado do teste de Bartlett para os dados transformados é

Bartlett test of homogeneity of variances data: log(peso + 1) by factor(trat)

Bartlett's K-squared = 5.5714, df = 5, p-value = 0.3502

Agora temos confiança de que a nova análise de variância é válida, dado que dados transformados satisfazem as duas suposições da análise de

variância. Com os dados originais a homogeneidade das variâncias não era atendida.

Documentos relacionados