Considerações Finais - Análise de Variáveis Não Diretamente Observáveis: Influência na Tomada

Capítulo VI. Análise de Variáveis Não Diretamente Observáveis: Influência na Tomada

6.4 Considerações Finais

As considerações finais que iremos apresentar reportam a importância a dar às variáveis e sua medida e à dimensão da amostra quando trabalhamos com variáveis que não são observáveis diretamente. Procuraremos também deixar algumas recomendações teóricas para serem usadas por jovens investigadores na área das ciências da saúde, especificamente na enfermagem, e nas ciências sociais. A análise dos aspetos teóricos e da investigação com variáveis não diretamente observáveis permite-nos dizer que as tomadas de decisão devem ser ponderadas no sentido de diminuir a margem de erro, seja ele de medida ou de análise de dados, pois a construção e aplicação de instrumentos compostos por estas variáveis é complexa e nem sempre compreendida.

Os estudos que seguem a teoria de Likert utilizam instrumentos cujas variáveis (itens) apresentam um número ímpar de classes de medida (cinco pontos) e a medida dos itens não é feita individualmente obtida pela soma das valorações dos mesmos (score), justificando a denominação de “escalas adicionadas” (summated scales). Esses

scores podem ser tratados estatisticamente como variáveis de tipo intervalar e, na sua

análise, pode ser equacionada a utilização de testes paramétricos ou não paramétricos. A discussão sobre o número de classes da variável (item) ser par (e.g., 4, 6) ou ímpar (e.g., 5, 7, 9) é considerada irrelevante. O mesmo não pode ser dito quanto se refere a sua classificação. Para que o formato de medida seja chamado de escala ou item de Likert, o seu número deve ser ímpar e o ponto central é um ponto neutro cujos extremos são opostos e simétricos (e.g., Discordo Completamente-1, Discordo-2, Nem discordo nem concordo-3, Concordo-4, Concordo completamente-5). O formato de medida que não cumprir este aspeto é chamado de tipo Likert, o que pode ser importante, sob o ponto de vista do rigor, quando se descreve a metodologia de um

124

trabalho de investigação. Relativamente às dimensões que compõem a escala, a sua heterogeneidade pode originar problemas de fiabilidade e de validade, pelo que as recomendações apontam para um mínimo de três itens por dimensão, sendo o ideal entre cinco e vinte itens. Quanto ao número de classes por item, seja ele, par ou ímpar, alguns autores valorizam os instrumentos cujas variáveis apresentam um maior número de classes (cinco ou mais) em detrimento dos que apresentam três ou quatro classes, pois consideram que, quanto maior for o número de classes, maiores as possibilidades de resposta dos participantes e melhor a qualidade da soma dos itens, o que vai refletir-se na sua sensibilidade e fiabilidade. Mas na área da saúde, possivelmente devido a questões de aplicação prática destes instrumentos, o formato com três e quatro classes é utilizado com frequência.

Relativamente ao tipo de testes estatísticos, verificámos que a frequente utilização de testes paramétricos, mesmo quando não se cumprem as condições de aplicação, deve-se ao facto de alguns investigadores considerarem que ambos os testes são sensíveis à violação dos pressupostos com este tipo de variáveis, mas os paramétricos são mais potentes do que os não paramétricos. Se a análise passa por técnicas usuais de análise estatística como a análise da regressão ou a análise fatorial exploratória devem manter-se no mínimo, cinco observações por variável (item) no modelo. Mas, se optarmos por uma análise de equações estruturais, em que os dados são as correlações (ou as variâncias-covariâncias) entre as variáveis manifestas, teremos que manter um número mínimo de dez a quinze observações por variável no modelo.

A evidência científica mostra que a dimensão da amostra influencia de forma determinante a análise de dados. Assim, ao reportar os resultados de uma investigação, em que foram usados testes de hipóteses, o investigador deve incluir, além do nível de significância, uma medida de dimensão de efeito, a potência do teste e, dependendo da análise efetuada, intervalos de confiança para as estimativas dos parâmetros. Como as amostras de pequena dimensão podem originar resultados estatisticamente não significativos em situações em que têm significância prática e as de grande dimensão podem, ao contrário, originar resultados estatisticamente significativos, mesmo que sem significância prática, importa por isso que estejam expressos os resultados referentes quer à significância estatística quer à significância prática. A presença de resultados opostos nestes dois tipos de significância pode dever-se à dimensão da amostra, ao erro de tipo I e à potência de teste. Assim, na fase de planeamento da investigação, os investigadores menos experientes devem ter em atenção, por um lado, a escolha e a

125

construção do instrumento (único ou com subescalas), o número de itens (variáveis) que o compõem e o formato de medida que lhe está associado. Por outro lado, devem estar atentos à dimensão da amostra (e.g., ter em atenção o número de observações por item) e decidir as técnicas estatísticas a utilizar com base nestes dois fatores. Importa realçar que na área das ciências da saúde e especificamente na disciplina de enfermagem deve haver uma atenção redobrada no que respeita à dimensão da amostra, sobretudo quando estamos perante amostras de pequena dimensão (doenças raras, etc.).

Algumas das dúvidas iniciais vão continuar por esclarecer, pois trabalhar com variáveis não diretamente observáveis é um problema real e ainda há muito trabalho a desenvolver para que mais recomendações possam emergir da pesquisa. Fica por isso a sugestão para que os profissionais de saúde e outros profissionais que usam este tipo de variáveis em investigação e na prática de cuidados se envolvam em projetos de investigação conjuntos. Isto possibilita, por um lado, que equipas multiprofissionais investiguem e discutam estas problemáticas sob diferentes pontos de vista e contribuam para o esclarecimento das dúvidas que ainda persistem e, por outro lado, que cada vez mais, os instrumentos usados nas práticas de cuidados sejam fundamentados na melhor evidência científica, pois só através do conhecimento que emerge da investigação e da sua apropriação pelos profissionais, se faz a otimização dos resultados em saúde e se favorecem as “boas práticas”.

6.6 Referências Bibliográficas

Agresti, A. (2002). Categorical Data Analysis. New Jersey: John Wiley & Sons, Inc. Anastasi, A. (1990). Psychological Testing. New York: Macmillan Publishing Company. Carifio, J., & Perla, R. (2008). Resolving the 50-year debate around using and misusing Likert scales. Medical Education, 42, 1150-1152.

Carifio, J., & Perla, R. (2007). Ten Common Misunderstandings, Misconceptions, Persistent Myths and Urban Legends about Likert Scales and Likert Response Formats and their Antidotes. Journal of Social Sciences, 3(3), 106-116.

Curado, M.A.S., Teles, J., & Marôco, J. (2013). Análisis estadístico de escalas ordinales. Aplicaciones en el Área de Salud infantil y Pediatría. Enfermería Global, 30, 446-457. http://www.um.es/eglobal.

Curado, M.A.S., Teles, J. & Marôco, J. (2014). Analysis of variables that are not directly observable: influence on decision-making during the research process. Revista da Escola de Enfermagem da Universidade de S. Paulo, 48, 1, 146-52.

Finch, W.H. (2005). Comparison of the Performance on Nonparametric and Parametric MANOVA Test Statistics when Assumptions are Violated. Methodology, 1(1), 27-38.

Gaito, J. (1980). Measurement Scales and Statistics: Resurgence of an Old Misconception. Psychological Bulletin, 87(3), 564-567.

126

Glass, G.V., Peckham, P.D., & Sanders, J.R. (1972). Consequences of failure to meet assumptions underlying the fixed effects analyses of variance and covariance. Review of Educational Research, 42, 237-88.

Gliem, J.A., & Gliem, R.R. (2003). Calculating, Interpreting, and Reporting Cronbach’s Alpha Reliability Coefficient for Likert-Type Scales. Paper presented at the Midwest Research-to- Practice Conference in Adult, Continuing, and Community Education, Columbus, OH.

Gutman, L. (1950). The basis for Scalogram analysis. In Stouffer et al. Measurement and Prediction. The American Soldier, Vol. IV. New York: Wiley.

Hill, M.M., & Hill, A. (2009). Investigação por Questionário. Lisboa: Edições Sílabo Lda. Jamieson, S. (2004). Likert scales: how to (ab)use them. Medical Education, 38, 1217-1218. Kahn, J. (2006). Factor Analysis in Counseling Psychology Research, Training, and Practice: Principles, Advances and Applications. The Counseling Psychologist, 34(5), 684-718.

Katz, B.M., & McSweeney, M. (1980). A Multivariate Kruskal-Wallis Test with Post Hoc Procedures. Multivariate Behavioral Research, 15, 281-297.

Knapp, T.R. (1990). Treating Ordinal Scales as Interval Scales: An Attempt to Resolve the Controversy. Nursing Research, 39(2), 121-123.

Knapp, T.R. (1993). Treating Ordinal Scales as Ordinal Scales. Nursing Research, 42, 184-186. Likert, R. (1932). A Technique for the Measurement of Attitudes. Archives of Psychology, 140, 1-50.

Lodge, M. (1981). Magnitude Scaling: Quantitative Measurement of Opinions. Beverly Hills: Sage.

Marôco, J. (2010a). Análise Estatística com o SPSS. Pêro Pinheiro: Report Number, Lda. Marôco, J. (2010b). Análise de Equações Estruturais. Fundamentos teóricos, Software e Aplicações. Pêro Pinheiro: Report Number, Lda.

Marôco, J. (2009). Avaliação das qualidades psicométricas de uma escala. Lisboa: Manuscripto, não publicado.

Marôco, J., & Garcia-Marques, T. (2006). Qual a fiabilidade do alfa de Cronbach? Questões antigas e soluções modernas? Laboratório de Psicologia, 4(1), 65-90.

Pasquali, L. (2009). Psychometrics. Revista da Escola de Enfermagem da USP, 43, 992-999. Pell, G. (2005). Use and misuse of Likert Scales. Medical Education, 39, 970.

Wang, S.-T., Yu, M.-L., Wang, C.-J., & Huang, C.-C. (1999). Bridging the Gap between the Pros and Cons in Treating Ordinal Scales as Interval Scales from an Analysis Point of View. Nursing Research, 48(4), 226-229.

Watty, A.D., & López, J.L. (1997). La importancia de medir. Veterinaria México, 28(1), 69-72. Stevens, S.S. (1946). On the Theory of Scales of Measurement. Science, 103, 667-680.

Thurstone, L.L.(1928). Attitudes can be measured. American Journal of Sociology, 33, 529-554. Urdan, T.C. (2005). Statistics in Plain English. London: Laurence Erlbaum Associates.

Wilson, F.C. (2009). Analysis of intensive outpatient neuro-rehabilitation outcomes using FIM+FAM (UK). Neurorehabilitation, 24, 377-382.

Worthington, R., & Whittaker, T. (2006). Scale Development Research: A Content Analysis and Recommendations for Best Practices. The Counseling Psychologist, 34(6), 806-838.

Zimmerman, D.W. (2000). Statistical significance levels of nonparametric tests biased by heterogeneous variances of treatment groups. Journal of General Psychology, 127, 354-364.

127

No documento A medida e as escalas de avaliação da saúde das populações neonatais e pediátricas : estudo de simulação de Monte Carlo com variáveis ordinais (páginas 144-148)