• Nenhum resultado encontrado

Capítulo III. A Medida e as Técnicas Estatísticas

3.2 A Análise da Variância Multivariada

3.2.2 MANOVA não Paramétrica a um Fator

A revisão da bibliografia tem dado a conhecer o facto de a estatística não paramétrica ser utilizada em grande escala no caso univariado, mas não no caso multivariado (Pontes, 2005). Apesar de terem ocorrido tentativas isoladas, de alguns investigadores, nos anos setenta do século passado, só nos anos noventa se verificou algum desenvolvimento da investigação com testes paramétricos e não paramétricos no caso univariado, no que concerne à comparação e performance dos métodos, no entanto, no caso multivariado, pouco ou nada se investigou (Ittenbach, et al., 1993; Finch, 2005). No final dos anos noventa os testes não paramétricos multivariados começam a ser mais utilizados, sobretudo na investigação agrária, economia, psicologia e sociologia. Pontes e Corrente (2001) e Pontes (2005) referem a importância do uso de técnicas não

83

paramétricas pelo facto de estas não serem tão restritivas e não serem sensíveis à violação dos pressupostos da normalidade multivariada, simetria e homogeneidade das matrizes de variância-covariância.

Os autores consideram que a utilização destes métodos não exige que a distribuição da variável seja conhecida, uma vez que se baseiam na ordem das observações e não no seu valor. A base dos testes não paramétricos está na ordenação (ranks) dos dados e não

no seu valor intrínseco, e na aleatorização, onde se consideram todas as possíveis permutações (rearranjos) dos dados” (Pontes e Corrente, 2001, p. 180).

Pontes (2005) considera que a perda na troca do verdadeiro valor da observação pela sua ordem faz aumentar a eficiência e a compreensão dos dados. No caso de amostras de pequena dimensão, o teste de Kruskal-Wallis é mais potente do que a ANOVA e o teste U de Man-Whitney mais potente do que o t de Student para amostras independentes, mas, se estamos perante violação dos pressupostos dos testes paramétricos, e as amostras são de grande dimensão, a ANOVA e o t de Student apresentam valores elevados de potência (Marôco, 2010a).

As simulações descritas por Zimmerman (2000, 2005) demonstram que a probabilidade de erro de tipo I de testes paramétricos, como o t de Student para amostras emparelhadas, é enviesada por variâncias heterogéneas especialmente quando as dimensões das amostras são muito desiguais.

Ao longo dos anos, diversos investigadores têm sugerido que a probabilidade de erro de tipo I em alguns testes não paramétricos como é o caso do U de Mann-Whitney e do teste de Kruskal-Wallis não é influenciada pela heterogeneidade de variâncias. Porém, mais recentemente tem-se verificado que estes testes quando aplicados em amostras de menor dimensão podem apresentar uma probabilidade de erro de tipo I mais elevada, sem igualar, no entanto, a obtida no caso paramétrico. Os testes não paramétricos são normalmente associados à hipótese de igualdade de distribuições nos grupos de tratamento, em contraste com a hipótese de valores médios iguais, que é uma característica dos testes paramétricos. Ao referirem a utilização dos testes não paramétricos ou paramétricos, a maioria dos autores coloca em primeiro plano as potências dos testes, considerando que esta é superior nos testes paramétricos e por isso a probabilidade de rejeitar corretamente H0 é maior nestes testes do que nos não

84

paramétricos (Marôco, 2010a). Para o autor, os testes não paramétricos só devem ser usados quando não existe uma alternativa paramétrica, ou seja, quando não é possível homogeneizar a variância, ou normalizar a variável dependente, ou ainda quando a variável dependente é qualitativa.

Os métodos não paramétricos para delineamentos multivariados são aplicados às ordens das observações e, a partir das médias das ordens e das matrizes de covariâncias das ordens, é possível obter uma extensão multivariada da estatística de Kruskal-Wallis. Tal como nos testes paramétricos, para controlo do erro de tipo I deve começar-se por fazer uma análise multivariada e se esta mostrar efeitos significativos passa-se então à análise univariada. Isto porque numa fase inicial, quando se está a testar a igualdade de g distribuições em pvariáveis dependentes, pode-se ser facilmente induzido a fazer p testes de Kruskal-Wallis, mas este facto poderá levar ao aumento do erro de tipo I.

A MANOVA não paramétrica a um fator apresenta-se como uma alternativa à correspondente metodologia paramétrica. Como já foi referido, esta técnica é considerada como uma extensão multivariada do teste de Kruskal-Wallis univariado e apenas requer que as variáveis dependentes tenham distribuição de probabilidade contínua F

 

X1 , , F

 

Xg (Katz & McSweeney, 1980). A técnica é um procedimento de ordens em que os scores para cada uma das pvariáveis são classificados separadamente de 1 para n, com a ordem 1 para a menor observação e a ordem de n para a maior observação. Se determinadas observações estão empatadas, a cada uma destas observações é atribuída a média das ordens das observações. Após este procedimento existem p conjuntos de ordens, um conjunto para cada variável sob estudo.

Para testarmos a igualdade das distribuições em todas as variáveis e grupos usamos a MANOVA não paramétrica e as hipóteses: H0:F

 

X1 F

 

X2  F

 

Xg

vs. 1: , :

 

l

 

,

l

H l l F F

XX com l l, 

1, ,g

onde F X

 

l é a função de distribuição multivariada de Xl

Xl1,Xl2, ,Xlp

, com l1, , .g No caso do traço de Pillai aplicado às ordens, a estatística de teste é 2 1 2

1 ~ p g      V Σ VV (Marôco, 2010;

85

dos desvios dos primeiros

g1

grupos de médias das ordens dos respetivos valores esperados sob a validade de H0 e pode escrever-se como:

   1

 1

1 1 1 / 2, , g 1 / 2 , j j j g R n Rn           V j1, , ;p onde g1p1

1, 2, , p

     V V V V

e Σ é a matriz de variância-covariância do vetor aleatório v V. Os desvios relativos ao grupo g são inferidos dos anteriores

g1

grupos. Para

1 g l l n n  

, o vetor aleatórioV

é aproximadamente normal multivariado com matriz de covariâncias Σ de V, característica máxima p g

1 .

Sob H0, E

 

V0 tornando ,

2

 uma variável aleatória qui-quadrado central com p g

1

graus de liberdade. Valores elevados de 2 indicam que existem diferenças entre Ve o valor esperado para V sob a validade de

H0. Assim a hipótese nula é rejeitada, ao nível de significância  sempre que

 

2 2

1- ; p g-1

  (Katz & McSweeney, 1980, p. 284).

A metodologia utilizada por Katz e McSweeney (1980) é a estatística 2 que pode ser apresentada como 2

1

,

R

n TP

   onde n é a dimensão da amostra global e

R

TP é o traço de Pillai calculado a partir de ordens das observações (Marôco, 2010a; Zwick, 1985). Rejeita-se H ao nível de significância de 0  se 2 12;p g 1 ou se p-

value do teste for menor ou igual a 

pvalue

.

A outra metodologia multivariada é calculada a partir do Lambda de Wilks aplicado às ordens e é obtido por LWRWR / TR , em que as matrizes WR e TR são as matrizes derivadas de W e T sendo as observações substituídas pelas respetivas ordens. De acordo com a metodologia de “transformação de ordens”, o teste paramétrico é aplicado às ordens e a distribuição da estatística de teste LWR é aproximada à do Lambda de Wilks paramétrico. These testing procedure are known to

perform better than their classical counterparts especially when the data are from a heavy-tailed distribution (Nath & Pavur, 1985, p. 298).

Quando n  a distribuição de nl  1

pg

/ 2 ln LWR é aproximada à distribuição qui-quadrado com p g

1

graus de liberdade, em que ln LW é o logaritmo natural do lambda de Wilks. Os autores consideraram que X é substituído li

pela ordem correspondente. Desta forma cada Xli m é substituído pela ordem correspondente, Rli m , sendo Rli m a ordem referente ao i-ésimo sujeito, no l-ésimo grupo, em que l1, , ,g m1, ,p e i1, ,nl e 1Rli mn. A média das ordens por

86

grupo na i-ésima variável pode escrever-se como  ,

li m R l1, ,g e i1, ,nl e  

1 1 1 / 2 l li n g m l i R n n    



. O vetor da média das ordens Vj nas j1, ,p variáveis dependentes é definido em termos de desvio do primeiro grupo de médias das ordens e respetivos valores esperados e pode escrever-se como:  

 

1 1 / nl , m m jn

i Rli V com 1, , jp e i1, , ;nl onde

1 2 , , , p ll l l

V V V V , definindo-se a matriz de variância- covariância do vetor aleatório

V

como V

 

vij , ,i j1, 2, , .p

A estatística 2 pode ser calculada através do lambda

 

R de Wilks aplicado às ordens das observações e escreve-se como 2    

n 1

pg

/ 2 ln

LWR onde n é a dimensão da amostra global (Nath & Pavur, 1985; Todorov & Filzmoser, 2009, 2010; Van Aelst & Willems, 2011). Rejeita-se H ao nível de significância 0  se

 

2 2

1 ;p g 1

  ou se pvalue .

3.3 Referências Bibliográficas

Alwin, D.F., & Krosnick, J.A (1991). The reliability of survey attitude measurement: the influence of question and respondent attributes. Sociological Methods and Research, 20(1), 139-181.

Anastasi, A. (1990). Psychological Testing (6th ed.). New York: Macmillan Publishing Company.

Blair, R.C., & Higgins, J.J. (1985). Comparison of the power of the paired samples t test to that of the Wilcoxon's signed-ranks test under various population shapes. Psychological Bulletin, 97, 119-128.

Bollen, K.A. (1989). Structural Equations with Latent Variables. Series in Probability and Mathematical Statistics. New York: Wiley.

Carifio, J., & Perla, R. (2008). Resolving the 50-year debate around using and misusing Likert scales. Medical Education, 42, 1150-1152.

Carifio, J., & Perla, R. (2007). Ten Common Misunderstandings, Misconceptions, Persistent Myths and Urban Legends about Likert Response Formats and their Antidotes. Journal of Social Sciences, 3(3), 106-116.

Carifio, J. (1978). Measuring vocational preferences: ranking versus categorical rating procedures. Career Education Quarterly, 3(1), 34-66.

Carifio, J. (1976). Assigning students to career education programs by preference: scaling preference data for program assignments. Career Education Quarterly, 1(1), 7-26.

Cochran, W.G. (1947). Some consequences when the assumptions for the analysis of variance are not satisfied. Biometrics, 3(1), 22-38.

Cohen, J. (1962). The statistical power of abnormal-social psychological research: A review. Journal of Abnormal and Social Psychology, 65, 145-153.

Cohen, J. (1969). Statistical power analysis for the behavioral sciences. New York: Academic Press.

87

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). Hillsdale: Lawrence Erlbaum.

Dawes, J. (2008). Do data characteristics change according to the number of scale points used? An experiment using 5-point, 7-point and 10-point scales. International Journal of Market Research, 50(1), 61-77.

Finch, W.H. (2005). Comparison of the Performance on Nonparametric and Parametric MANOVA Test Statistics when Assumptions are Violated. Methodology, 1(1), 27-38.

Finch, W.H., & Davenport, T. (2009). Performance of Monte Carlo Permutation and Approximate Tests for Multivariate Means Comparisons with Small Sample Sizes when Parametric Assumptions are Violated. Methodology, 5(2), 60-70.

Gutman, L. (1950). The basis for Scalogram analysis. In S.A. Stouffer et al. Measurement and Prediction: The American Soldier, Vol. IV. New York: Wiley.

Green, P.E., & Rao, V.R. (1970). Rating Scales and Information Recovery: How Many Scales and Response Categories to Use? Journal of Marketing, 34, 33-39.

Hair Jr., J.F., Black, W.C., Babin, B.J., & Anderson, R.E. (2010). Multivariate data analysis (7th ed.). Upper Saddle River, NJ: Prentice Hall.

Harwell, M.R., Rubinstain, E.N., Hayes, W.S., & Olds, C.C. (1992). Summarizing Monte Carlo results in methodological research: The one and two-factor fixed effect ANOVA cases. Journal of Educational Statistics, 17(4), 315-339.

Hill, M.M., & Hill, A. (2009). Investigação por Questionário. Lisboa: Edições Sílabo Lda. Ittenbach, R.F., Chayer, D.E., Bruininks, R.H., Thrulow, M.L., & Beirne-Smith, M. (1993). Adjustment of young adults with mental retardation in community settings: Comparison of parametric and nonparametric statistical techniques. American Journal of Mental Retardation, 97, 607–615.

Jobson, J.D. (1992). Applied Multivariate Data Analysis. New York: Springer.

Jacoby, J., & Matell, M.S. (1971). Three-point Likert scales are good enough. Journal of Marketing Research, VIII, 495-500.

Johnson, D.E. (1998). Applied Multivariate Methods for Data Analysts. Pacific Grove, CA: Brooks/Cole Publishing.

Johnson, R.A., & Wichern, D.W. (2007). Applied Multivariate Statistical Analysis. New Jersey: Pearson Prentice Hall.

Jamieson, S. (2004). Likert scales: how to (ab)use them. Medical Education, 38, 1217-1218. Kahn, J. (2006). Factor Analysis in Counseling Psychology Research, Training, and Practice: Principles, Advances and Applications. The Counseling Psychologist, 34(5), 684-718.

Katz B.M., & McSweeney, M. (1980). A Multivariate Kruskal-Wallis Test with Post Hoc Procedures. Multivariate Behavioral Research, 15, 281-297.

Krosnick, J.A., & Fabrigar, L.R. (1997). Designing rating scales for effective measurement in surveys. In L.E. Lyberg, P. Biemer, M. Collins and E.D. Leeuw (eds.) Survey.

Krosnick, J.A., & Presser, S. (2010). Question and Questionnaire Design. In P.V. Marsden & J.D. Wright, Handbook of Survey Research. Emerald Group Publishing, Ltd. Bingley.

Lehmann, E.L. (1975). Nonparametrics, statistical methods based on ranks. San Francisco: Holden-Day.

Likert, R. (1932). A Technique for the Measurement of Attitudes. Archives of Psychology, 140, 55.

Lixe, L.M., Keselman, J.C., & Keselman, H.J. (1996). Consequences of assumption violations revisited: A quantitative review of alternatives to the one-way analysis of variance F test. Review of Educational Research, 66, 579-619.

88

Loureiro, L.M.J., & Gameiro, M.G.H. (2011). Interpretação crítica dos resultados estatísticos: para lá da significância estatística. Revista de Enfermagem Referência, 3, 151-162.

Lozano, L.M., García-Cueto, E., & Muñiz, J. (2008). Effect of the number of response categories on the reliability and validity of rating scales. European Journal of Research Methods for the Behavioral and Social Sciences, 4(2), 73-79.

Manly, B.F.J. (2005). Multivariate Statistical Methods (3rd Ed.). Boca Raton, Florida: Chapman &Hall/CRC.

Marôco, J. (2010a). Análise Estatística com SPSS. Pêro Pinheiro: Report Number, Lda.

Marôco, J. (2010b). Análise de Equações Estruturais: Fundamentos teóricos, Software & Aplicações. Pêro Pinheiro: ReportNumber.

Marôco, J. (2009). Avaliação das qualidades psicométricas de uma escala. Lisboa: ISPA-IUL. Manuscrito não publicado.

Marôco, J., & Bispo, R. (2003). Estatística aplicada às ciências sociais e humanas (1ª ed.). Lisboa: Climepsi Editores.

Montgomery, D.C. (2001). Design and Analysis of Experiments (5th ed.). New York: John Wiley & Sons, Inc.

Moors, G. (2007). Exploring the effect of a middle response category on response style in attitude measurement. Quality and Quantity, 42(6), 779-794.

Myers, J.L., & Well, A.D. (2003). Research Design and Statistical Analysis. London: Lawrence Erlbaum Associates.

Nath, R. (1982). Empirical investigation of an alternative to one-way multivariate analysis of variance (MANOVA), Technical Report. Memphis: Department of Management, Memphis State University.

Nath, R., & Pavur, R. (1985). A new statistic in the one-way multivariate analysis of variance. Computational Statistics and Data Analysis, 2, 297-315.

Newton, R.R., & Rudestam, K.E. (1999). Your Statistical Consultant. Answers to your Data Analysis Questions. Thousand Oaks, CA: Sage Publications.

Olson, C.L. (1974). Comparative robustness of six tests in multivariate analysis of variance. Journal of the American Statistical Association, 69, 894-908.

Pearson, E.S. (1930). A further development of tests of normality. Biometrika, 22, 239-249. Pearson, E.S. (1931). The analysis of variance in cases of non-normal variation. Biometrika, 23, 114-133.

Pell, G. (2005). Use and misuse of Likert Scales. Medical Education, 39, 970.

Pontes, A.C.F., & Corrente, J.E. (2001). Comparações múltiplas não paramétricas para o delineamento com factor de classificação simples. Revista de Matemática e Estatística, 19, 179- 197.

Pontes, A.C.F. (2005). Análise de Variância multivariada com utilização de testes não paramétricos e componentes principais baseados em matrizes de postos. Tese de Doutoramento. S. Paulo: Universidade de São Paulo, Escola Superior de Agricultura Luiz de Queiroz.

Presser, S., & Schuman H. (1980). The Measurement of a Middle Position in Attitude Surveys. Public Opinion Quarterly, 44(1), 70-85.

Puri, M.L., & Sen, P.K. (1974). Nonparametric methods in multivariate analysis. New York, John Wiley & Sons.

Puri, M.L., & Sen, P.K. (1969). Class of Rank Order Tests for a General Linear Hypothesis. Annals of Mathematical Statistics, 40(4), 1325-1343.

89

Ramsey, P.H., & Ramsey, P.P. (2013). Pairwise testing of group mean vectors in MANOVA with small samples. Journal of Statistical Computation and Simulation, 83(6), 1037-1057. Ramsey, P.H., Ramsey, P.P., Hachimine, P., & Andiloro, N. (2011). Robustness, Power and Interpretability of Pairwise Tests of Discriminant Functions in MANOVA. Journal of Modern Applied Statistical Methods, 10(2), 403-417.

R Development Core Team (2008). A Language and Environment for Statistical Computing, R Foundation for Statistical Computing, Vienna, Austria. (http://www.R-project.org).

Reffinetti, R. (1996). Demonstrating the consequences of violations of assumptions in analysis of variance. Teaching of Psychology, 23, 51-54.

Reis, E. (2001). Estatística Multivariada Aplicada (2ª ed.). Lisboa: Edições Sílabo.

Rencher, A.C. (2002). Methods of Multivariate Analysis (2nd ed.). New York: John Wiley & Sons.

Sahai, H., & Ageel, M.I. (2000). The Analysis of Variance. Boston: Birkhäuser.

Sharma, S. (1996). Applied Multivariate Techniques. New York: John Wiley and Sons.

Sheskin, D.J. (2007). Handbook of Parametric and Nonparametric Statistical Procedures (4th ed.). Boca Raton, Florida: Chapman &Hall/CRC.

Stevens, S.S. (1946). On the Theory of Scales of Measurement. Science, 103, 667-680.

Stevens, S.S. (1951). Mathematics, measurement, and psychophysics. In S.S. Stevens (ed.), Handbook of experimental psychology. New York: Wiley.

Tabachnick, B.G., & Fidell, L.S. (2007). Using multivariate statistics. New York: Pearson Education Inc.

Timm, N.H. (2002). Applied Multivariate Analysis. New York: Springer-Verlag.

Todorov, V., & Filzmoser, P. (2010). Robust statistic for the one-way MANOVA. Computational Statistic and Data Analysis, 54, 37-48.

Thurstone, L.L. (1928). Attitudes can be measured. American Journal of Sociology, 33, 529- 554.

Thurstone, L.L. (1954). The measurement of values. Psychological Review, 61, 47-58. Urdan, T.C. (2005). Statistics in Plain English. London: Laurence Erlbaum Associates. Stevens, S.S. (1946). On the Theory of Scales of Measurement. Science, 103, 667-680.

Van Aelst, S., & Willems, G. (2011). Robust and Efficient One-Way MANOVA Tests. Journal of the American Statistical Association, 106(494),706-718.

Worthington, R., & Whittaker, T. (2006). Scale Development Research: A Content Analysis and Recommendations for Best Practices. The Counseling Psychologist, 34(6), 806-838.

Zwick, R. (1985). Nonparametric One-Way Multivariate Analysis of Variance: A Computational Approach Based on the Pillai-Bartlett Trace. Psychological Bulletin, 47(1), 148- 152.

Zimmerman, D.W. (2000). Statistical significance levels of nonparametric tests biased by heterogeneous variances of treatment groups. Journal of General Psychology, 127, 354-364. Zimmerman, I.L., & Castilleja, N.F. (2005). The role of language scale for infant and preschool assessment. Mental Retardation and Developmental Disabilities, 11, 238-246.

90