Diferentes testes para verificar normalidade de uma amostra aleat´oria

(1)

Diferentes testes para verificar

normalidade de uma amostra aleat´

oria

Fernando Lucambio

Departamento de Estat´ıstica Universidade Federal do Paran´a Curitiba/PR, 81531–990, Brasil

email: lucambio@ufpr.br

Maio de 2008

Mostraremos os testes para normalidade mais utilizados: teste Jarque-Beta, teste D’Agostino, teste χ2 _{de Pearson de bondade de ajuste, teste Shapiro-Wilk, teste Lilliefors, teste}

Anderson-Darling e teste de Cramer-von Mises. Este tema é extremamente importante e por isso existem muitas outras propostas de testes para verificar normalidade de amostras em diferentes contextos, uma excelente referência é Stephens (1986).

1 Teste Jarque-Beta

Proposto por Bera & Jarque (1980), baseia-se na diferen¸ca entre os coeficientes de skewness e kurtosis dos dados y1, y2, . . . , yn e `aqueles da distribui¸c˜ao assumida normal.

As hip´oteses nula e alternativa no teste Jarque-Bera s˜ao:

H0 :y1, y2, . . . , yn ∼N(µ, σ2) vs H1 : n˜aoH0

A estat´ıstica de teste ´e

JB=n

µ α2

3

6 +

(α4−3)2

24

¶ ,

onde

α3 =

Pn

i=1(yi−y)3

ns3 ,

α4 =

Pn

i=1(yi−y)4

ns4 ,

s2 =

Pn

i=1(yi−y)2

n ·

Aqui, y ´e a m´edia amostral e s2_, _α

3 e α4 o segundo, terceiro e quarto momentos centrais,

respectivamente. A estat´ıstica JB têm distribui¸cão assintótica χ2_{(2) sob a hipóteses nula.}

O teste de Jarque-Beta é conhecido por ter boas propriedades para verificar normalidade, é claro e simples de calcular e é muito utilizado no contexto de regressão em econometria. Uma limita¸cão é que somente pode ser utlizado na verifica¸cão de normalidade.

(2)

2 Teste D’Agostino-Pearson

Também conhecido como teste D foi proposto por D’Agostino (1970) e têm sido muito utilizado para verificar normalidade. Suponha quey1, y2, . . . , yné a amostra aleatória e quey(1), y(2), . . . , y(n)

´e a amostra ordenada, isto ´e, y(1) ≤y(2) ≤. . .≤y(n).

A estat´ıstica D de teste ´e

D= T

n2_s,

onde s é o desvio padrão amostral, o quel é calculado como a ra´ız quadrado positiva de s2

segundo definido no contexto do teste Jarque-Bera e

T =

n

X

i=1

µ

i₋ n+ 1

2

¶ y(i)·

Se a amostra ´e da distribui¸c˜ao normal, temos que

E_{D_}= (n−1)Γ(

n

2 − 1 2)

2√2nπΓ(n₂) ≈ 1

2√π ≈0.28209479,

o desvio padrão assintótico da estat´ıstica D é

s_{D_}=

s

12√3₋37 + 2π

24nπ ≈

0.02998598

√

n ·

Utiliza-se a estat´ıstica D padronizada como

D∗ ₌ D−E{D}

s_{D_} ,

a qual têm distribui¸cãonormal aproximada sob hipótese nula. No R a fun¸cãoNormalityTests no pacotefBasics fornece a estat´ıstica de teste D acima assim como o p-valor.

3 Teste

χ

2

de Pearson de bondade de ajuste

A estat´ıstica do teste Pearson ´e

P =

n

X

i=1

(Ci−Ei)2

Ei

,

onde Ci é o número de observa¸cões e Ei é o número de observa¸cões esperadas (sob a hipóteses

nula) na i-ésima classe. Estas classes são escolhidas de maneira sejam equiprováveis sob a hipóteses de normalidade.

O p-valor ´e calculado da distribui¸c˜ao χ2 _{com graus de liberdade iguais ao n´}_{umero de classes}

menos 3 ou ao número de classes menos 1 se decide-se pela corre¸cão ou não (a corre¸cão recomenda-se somente em pequenos tamanhos de amostras). Em ambos os casos este não é o correto valor do p-valor, ficando na maioria das vezes entre estes dois valores (Moore, 1986).

Este teste não é recomendado para testar normalidade devido às inferiores propriedades comparado aos otros testes dispon´ıveis. Em siatu¸cões práticas calcula-se o p-valor da distribui¸cão

χ2 _{com graus de liberdade iguais ao n´}_{umero de classes menos 3, devido `a estima¸c˜ao dos dois}

(3)

4 Teste Shapiro-Wilk

Proposto por Shapiro & Wilk (1965) utiliza a estat´ıstica

W =

¡Pn

i=1aiy(i)

¢2 Pn

i=1(yi−y)2

,

onde as constantes a1, a2, . . . , an s˜ao calculadas como a solu¸c˜ao de

(a1, a2, . . . , an) =

m⊤_V−1

(m⊤_V−1_V−1_m₎1/2,

sendom = (m1, m2, . . . , mn)⊤o vetor dos valores esperados das estat´ısticas de ´ordem da amostra

e V a matriz de covariancias dessas estat´ısticas. O p-valor deste teste é calculado exatamente para n = 3, em outras situa¸cões utilizam-se aproxima¸cões diferentes para 4 _≤ n _≤ 11 e para

n_≥12, (Shapiro & Francia, 1972).

No R as fun¸c˜oes shapiro.test no pacote stats fornece a estat´ıstica de teste acima assim como o p-valor e a fun¸c˜ao sfTestno pacote fBasics.

5 Teste Lilliefors

O teste Lilliefors, uma modifica¸cão do teste Kolmogorov-Smirnov, utiliza a estat´ıstica D de Kolmogorov-Smirnov que mede a diferen¸ca máxima absoluta entre a fun¸cão de distribui¸cão acumulada emp´ırica e teórica.

D= max_{D+, D−_}_,

onde D+ _{= max}

i=1,...,n{_ni −p(i)}, D− = maxi=1,...,n{p(i)− i−1_n }, e p(i) = Φ([x(i)−x]/s). Nesta

expressão, Φ é a fun¸cão de distribui¸cão acumulada normal padrão exandssão a média e desvio padrão amostrais.

O p-valor é calculado pela fórmula em Dallal & Wilkinson (1986), a qual é confia´vel quando o p-valor é menor do que 0.1. Se o p-valor Dallal-Wilkinson fornece um valor maior do que 0.1 o verdadeiro p-valor deve ser calculado da distribui¸cão da estat´ıstica de teste modificada

Z =D

µ

√

n₋0.01 + 0_√.85

n ¶

(Stephens, 1986), o p-valor é obtido então via simula¸cões e aproxima¸cões.

As fun¸c˜oes R ksnormTest no pacote fBasics e ks.test no pacote nortest calculam o teste Kolmogorov-Smirnov e as fun¸c˜oes lillieTest no pacote fBasics e lillie.test no pacote nortest cal-culam o test Lilliefors.

(4)

6 Teste Anderson-Darling

Proposto por Anderson & Darling (1952) é mais utilizado quando o tamanho da amostra não é superior a 25. Este teste é baseado na fun¸cão de distribui¸cão emp´ıica, a idéia é que dada a fun¸cão de distribui¸cão sob hipóteses nula, os dados podem ser transformados à distribui¸cão uniforme. Os dados transformados podem então serem testados para uniformidade.

A=₋n₋ 1 n

n

X

i=1

[2i₋1][ln(p(i)) + ln(1−p(n−i+1))],

ondep(i)= Φ([y(i)−y]/s) são os percentis ordenados da distribui¸cão normal padrão e Φ representa

a fun¸cão de distribui¸cão acumulada normal padrão. O p-valor é calculado da estat´ıstica modificada

Z =

µ

1.0 + 0.75

n +

2.25

n2

¶ A,

como 1 ₋e−13.436+101.14Z−223.73Z2

se Z < 0.2, 1₋ e−8.318+42.796Z−59.938Z2

se 0.2 _≤ Z < 0.34,

e0.9177−4.279Z−1.38Z2

se 0.34_≤Z <0.6 e e1.2937−5.709Z+0.0186Z2

se Z _≥0.6. No R as fun¸c˜oes ad.test

no pacotenortestfornece a estat´ıstica de teste acima assim como o p-valor e a fun¸c˜ao adTestno pacotefBasics.

7 Teste Cramer-von Mises

Este teste é também baseado na distribui¸cão acumulada, foi proposto por Darling (1957). A estat´ıstica de teste é

W = 1

12n +

n

X

i=1

µ p(i)−

2i₋1 2n

¶ ,

ondep(i)= Φ([x(i)−x]/s) são os percentis ordenados da distribui¸cão normal padrão e Φ representa

a fun¸cão de distribui¸cão acumulada normal padrão. O p-valor é calculado da estat´ıstica modificada

Z =

µ

1.0 + 1 2n

¶ W,

como 1₋e−13.953+775.5Z−12542.61Z2

se Z < 0.0275, 1₋e−5.903+179.546Z−1515.29Z2

se 0.0275 _≤ Z <

0.051, e0.886−31.62Z+10.897Z2

se 0.051 _≤ Z < 0.092 e e1.111−34.242Z+12.832Z2

se Z _≥ 0.092. No R as fun¸c˜oes cvm.testno pacote nortest fornece a estat´ıstica de teste acima assim como o p-valor e a fun¸c˜ao cvmTestno pacote fBasics.

Referˆ

encias

(5)

D’Agostino, R.B. (1970). Transformation to normality of the null distribution ofg1. Biometrika,

57(3), 679–681.

Dallal, G.E. & Wilkinson, L. (1986). An analytic approximation to the distribution of Lilliefors’s test for normality. The American Statistician, 40, 291–296.

Darling, D.A. (1957). The Kolmogorov-Smirnov, Cramer-von Mises Tests. Annals of Mathema-tical Statistics, 28(4 (Dec.)), 823–838.

Moore, D.S. (1986). Tests of the chi-squared type. D’Agostino, R.B. and Stevens, M.A., eds.: Goodness-of-Fit Techniques. New York: Marcel Dekker.

R Development Core Team (2006). R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0.

Shapiro, S.S. & Francia, R.S. (1972). An Approximate Analysis of Variance Test for Normality.

Journal of the American Statistical Association, 67, 215–216.

Shapiro, S.S. & Wilk, M. (1965). An analysis of variance test for normality (complete samples).

Biometrika, 52, 591–611.