• Nenhum resultado encontrado

Testes de hipótese são testes estatísticos capazes de aceitar ou rejeitar hipóteses pré- formuladas para um conjunto amostral, sendo possível, a partir daí, inferir seus resultados para a população de que a amostra é oriunda. Em cada teste, deve ser denido um nível de signicância α que indica a probabilidade de erro em rejeitar a hipótese pré-formulada sendo ela verdadeira, ou seja, o erro máximo que o teste pode assumir. Esta hipótese pré-formulada é chamada de hipótese nula e pode ser representada por H0, e a rejeição

de H0 gera uma hipótese alternativa representada por H1.

Como resultado de um teste de hipótese, pode-se obter a probabilidade de signicância ou nível descritivo do teste, também chamado de p-valor, que indica a probabilidade de erro ao rejeitar a hipótese nula, desta maneira, se o p-valor for menor que o nível de signicância estabelecido, pode-se rejeitar com segurança a hipótese nula [29,36].

Os testes de hipótese podem ser paramétricos ou não paramétricos. No desenvolvi- mento desta pesquisa, foram utilizados três testes de hipótese paramétricos: a Análise de Variância (ANOVA), o teste de Levene e o teste de Shapiro-Wilk, que são abordados a seguir.

4.7.1 Análise de Variância (ANOVA)

A ANOVA é um teste de hipótese paramétrico, que tem como objetivo vericar se as médias de diferentes níveis de um fator de tratamento possuem alguma diferença esta- tística entre si [10]. Para determinar sua estatística Fcalc, inicialmente deve-se calcular a

soma de quadrados total SQtot, a soma de quadrados dos tratamentos SQtrat e a soma de

quadrados do resíduo SQres, dadas, respectivamente, por

SQtot = k X i=1 m X j=1 (xij − x)2, (4.15) SQtrat = k X i=1 mi(xi− x)2, (4.16)

Capítulo 4. Teoria Estatística 41 de modo que 1 ≤ i ≤ k e 1 ≤ j ≤ m, em que k é o número de tratamentos e m é o número de repetições de cada tratamento, xij é a variável resposta medida na repetição

j do tratamento i, xi é a média aritmética do tratamento i, mi é o número de repetições

do tratamento i, e x é a média aritmética de todas as variáveis respostas obtidas [29,36]. Em seguida, deve-se determinar o quadrado médio dos tratamentos QMtrat e o qua-

drado médio do resíduo QMres, que são determinados através da razão entre suas respec-

tivas somas de quadrados e graus de liberdade. Cabe acrescentar que o grau de liberdade dos tratamentos é dado por

GLtrat = k − 1 (4.18)

e o grau de liberdade do resíduo por

GLres = k(m − 1). (4.19)

Por m, a estatística Fcalc é dada por

Fcalc =

QMtrat

QMres

. (4.20)

A hipótese nula deste teste é a armação de que os tratamentos possuem médias iguais estatisticamente [10]. Para vericá-la, deve-se comparar a estatística Fcalc com

uma estatística tabelada Ftab que depende do grau de liberdade dos tratamentos, do grau

de liberdade dos resíduos e do nível de signicância α do teste. Se Fcalc > Ftab deve-

se rejeitar a hipótese nula, concluindo que as médias dos tratamentos não são iguais estatisticamente, ou seja, pelo menos duas médias são diferentes estatisticamente entre si. A ANOVA também pode ser aplicada através do software MatLab, com o uso da função anova1 [35], que fornece o valor descritivo, ou p-valor, do teste.

Como já mencionado, a ANOVA é um teste de hipótese paramétrico, desta maneira, possui critérios para sua utilização, que são: os dados possuírem distribuição normal, terem homogeneidade de variâncias e as amostras serem independentes [10]. A indepen- dência pode ser vericada pelo pesquisador e, quanto aos outros critérios, podem ser utilizados dois testes de hipótese para vericação: o teste de Levene para vericar a ho- mogeneidade de variâncias e o teste de Shapiro-Wilk para vericar a normalidade das amostras.

Capítulo 4. Teoria Estatística 42

4.7.2 Teste de Levene

O teste de Levene visa constatar se diferentes tipos de tratamento possuem homoge- neidade de variâncias ou não [10]. Sua estatística é calculada por

Wc = N − k k − 1. Pk i=1ni(Zi− Z) 2 Pk i=1 Pnj j=1(Zij − Zi)2 , (4.21)

em que: ni é a dimensão de cada uma das k amostras, N é a dimensão da amostra global,

xij é a observação j da amostra i, xi é a média da amostra i, Zi é a média da amostra Zi

na amostra i, Z é a média de Zi na amostra global e Zij = |xij − xi| [10].

A estatística Wc deve ser comparada, então, com uma estatística tabelada que con-

sidera o nível de signicância α escolhido e outras características dos dados em questão, como, por exemplo, seus graus de liberdade. Se o valor calculado for menor que o tabelado, aceita-se a hipótese nula de que as variâncias são homogêneas.

Este teste pode ser implementado no software MatLab através da função levenes pre- sente na sua plataforma online [31]. Esta função apresenta como resposta o p-valor, que se for menor que o nível de signicância estabelecido indica que a hipótese nula, de que as variâncias possuem homogeneidade, deve ser rejeitada.

4.7.3 Teste de Shapiro-Wilk

Para analisar se um conjunto de dados possui distribuição normal ou não, há dois testes de hipótese mais utilizados: o de Kolmogorov-Smirnov e o de Shapiro-Wilk. Nesta pesquisa, foi utilizado o teste de Shapiro-Wilk, pois é o mais indicado para amostras pequenas (até 30 dados em cada amostra), visto que há 8 dados em cada uma das amostras analisadas neste estudo (cf. Seção 5.2.3) [10].

A estatística do teste de Shapiro-Wilk é dada por Wcal =

b2

Pn

i=1(Xi− x)2

, (4.22)

em que: n é o número de repetições (dados) de cada amostra, Xi são os valores das

variáveis dispostos em ordem crescente, x é a média das variáveis x, e b é dado por b =

n/2

X

i=1

an−i+1(Xn−i+1− Xi), (4.23)

em que: an−i+1 são as constantes geradas a partir da média, variância e covariância das

estatísticas de uma amostra de tamanho n de uma distribuição normal reduzida N(0, 1) [10].

Capítulo 4. Teoria Estatística 43 Para aceitar ou rejeitar a hipótese nula H0 que arma que os dados possuem dis-

tribuição normal, deve-se comparar o valor Wcal com o valor tabelado Wtab, sendo este

determinado a partir do nível de signicância desejado e do tamanho n da amostra. Se Wcal > Wtab aceita-se a hipótese nula, que arma que os dados têm distribuição normal.

Documentos relacionados