Mensuração e escalonamento - METODOLOGIA 1 Concepção da pesquisa

3. METODOLOGIA 1 Concepção da pesquisa

3.2 Mensuração e escalonamento

Segundo Aaker, Kumar e Day (2007), a mensuração e as escalas são ferramentas básicas utilizadas no método científico e são aplicadas praticamente em todas as situações da pesquisa de marketing. Neste sentido, a mensuração pode ser definida como o processo padronizado de atribuição de números ou outros símbolos a certas características de objetos de interesse, de acordo com algumas regras pré-especificadas.

A mensuração, geralmente, é feita com números, porque eles permitem uma análise estatística dos dados resultantes e facilitam a comunicação de regras e os

resultados de mensurações (AAKER; KUMAR; DAY, 2007; MALHOTRA, 2001). Existem duas características essenciais de um processo padronizado de mensuração: primeira, deve haver uma correspondência biunívoca entre os números e as características que estão sendo medidas; segunda, as regras para a atribuição de números devem ser padronizadas e aplicadas uniformemente.

O escalonamento pode ser considerado uma extensão da medição. Segundo Malhotra (2001), envolve a criação de um conjunto contínuo (continuum), no qual se localizam os objetos medidos. Para Aaker, Kumar e Day (2007), o escalonamento consiste no processo de adotar uma escala e criar um continuum no qual os indivíduos são identificados de acordo com a quantidade que possuem das características medidas. Ainda, segundo Hair et al. (2005a), o escalonamento é o meio pelo qual a mensuração é realizada, sendo possível medir a direção e a intensidade das respostas em relação aos conceitos que estão sendo analisados.

A fim de quantificar os comportamentos de interesse desta pesquisa, foram utilizadas escalas do tipo intervalar, ou seja, escalas nas quais os números empregados para classificar os indivíduos representam incrementos iguais do atributo que está sendo mensurado. Isso significa que as diferenças podem ser comparadas. Segundo Aaker, Kumar e Day (2007), as escalas intervalares têm propriedades muito interessantes, porque praticamente todas as operações estatísticas podem ser empregadas para analisar seus resultados, incluindo a soma e a subtração. Consequentemente, é possível calcular uma média aritmética para a mensuração com escalas intervalares.

Utilizou-se neste estudo uma escala de classificação amplamente empregada em pesquisas de marketing, conhecida como “escala Likert”, que, segundo Malhotra (2001) exige que os entrevistados indiquem um grau de concordância ou discordância em relação a cada uma de uma série de afirmações sobre objetos de estímulo. Tipicamente, cada item da escala tem cinco categorias de resposta, que vão de “Discordo totalmente” a “Concordo totalmente”. Aaker, Kumar e Day (2007) designam este tipo de escala de “escala somada”, porque as pontuações de cada um dos itens são somadas para produzir uma pontuação total final para o respondente.

Em algumas partes do questionário do modelo 3M foram utilizados outros tipos de resposta, embora eles também refletissem graus de concordância com as afirmativas e estivessem dispostos de forma intervalar em uma gradação de cinco pontos. Esses casos aconteceram quando os respondentes foram solicitados a marcar quão bem determinados adjetivos descreviam seu perfil (nessa situação, as respostas variavam entre “Muito mal” e “Muito bem”) e quando as perguntas mediam a frequência em que determinados comportamentos eram realizados (nesse caso as respostas variavam entre “Nunca” e “Quase sempre”/“Sempre”).

Em relação aos conceitos medidos, é importante dizer que foram utilizadas escalas multi-itens, ou seja, escalas com vários indicadores, visto que “geralmente é pouco realista tentar capturar toda a cena por meio de uma única questão de escala de atitudes” (AAKER; KUMAR; DAY, 2007). Netemeyer, Bearden e Sharma (2003, p. 5) lembram que há uma grande aceitação em torno do fato de que as medidas de construtos latentes (ou construtos não observáveis diretamente) requerem múltiplos itens ou afirmativas para que revelem mais apuradamente os níveis variáveis dos construtos.

Tratando-se especificamente das escalas utilizadas nesta pesquisa, ressalta-se que a maioria delas foi proveniente de estudos prévios do modelo 3M, do modelo dos cinco fatores e de características associadas ao consumo ecologicamente consciente pesquisadas em outros estudos. Neste sentido, considera-se a priori que essas escalas, que já foram testadas e validadas de antemão, meçam de forma mais precisa as características investigadas.

É importante lembrar que neste estudo também foram utilizadas algumas escalas elaboradas pelos próprios pesquisadores, uma vez que se fez a opção de criar indicadores supostamente mais bem adaptados para medir a preocupação com a natureza e o comportamento de consumo ecologicamente consciente em vez de utilizar escalas provenientes de outros estudos. Essa decisão tem implicações relevantes para a pesquisa, pois é imprescindível que essas escalas tenham boa qualidade; ou seja, que meçam de fato os construtos de interesse da investigação.

Feitas essas considerações, vale lembrar que existem critérios para avaliar a qualidade das escalas utilizadas. Os mais relevantes são: dimensionalidade,

confiabilidade, validade e possibilidade de generalização. É possível medir a coerência, a precisão e a relevância das escalas com base nos resultados obtidos nessas três características. A seguir, analisam-se as definições e implicações de cada uma dessas propriedades em relação à qualidade de uma escala.

Netemeyer, Bearden e Sharma (2003) explicam que a dimensionalidade de uma medida preocupa-se com a homogeneidade dos itens. Basicamente, uma medida considerada unidimensional tem propriedades estatísticas que demonstram que seus itens referem-se a um único construto ou fator. De outro lado, quando a medida é multidimensional, os itens supostamente relacionados a ela podem ser atribuídos a mais de uma dimensão ou fator.

Ainda segundo esses autores, a unidimensionalidade é considerada um pré- requisito para a confiabilidade e a validade, sendo também muito relevante para a técnica de modelagem de equações estruturais (a qual será utiliza na análise dos dados desta pesquisa), pois os itens podem ser somados por se referirem a um único construto. Ademais, inúmeros procedimentos têm sido empregados para checar a dimensionalidade de uma escala. As principais são as técnicas de análise fatorial exploratória e análise fatorial confirmatória.

A confiabilidade é uma medida da coerência das questões que se referem a determinado conceito e do grau em que resultados consistentes se mantêm em diferentes momentos de aplicação da escala. Para que um instrumento contendo escalas de múltiplos itens seja confiável, é necessário que as perguntas individuais (itens) de cada construto sejam correlacionadas (HAIR et al., 2005a) e que a escala produza resultados consistentes quando as medidas são tomadas repetidamente (MALHOTRA, 2001).

Segundo Malhotra (2001), a confiabilidade é avaliada determinando-se a proporção de erro sistemático ou constante em uma escala, devido a fatores mecânicos, como impressão ruim, excesso de itens no questionário, falta de clareza da escala, nas instruções ou nos próprios itens e planejamento deficiente. Basicamente, os processos de avaliação da confiabilidade incluem os métodos de teste-reteste, as formas alternativas e a consistência interna.

Na confiabilidade teste-reteste, os entrevistados recebem conjuntos idênticos de itens da escala, em duas ocasiões diferentes e sob condições tão próximas da equivalência quanto possível. O intervalo de tempo entre testes ou aplicações é, tipicamente, de duas a quatro semanas. O grau de semelhança entre duas medidas é determinado calculando-se um coeficiente de correlação. Quanto mais alto o coeficiente de correlação, maior a confiabilidade.

Na confiabilidade de formas alternativas, constroem-se duas formas equivalentes da escala. Os mesmos entrevistados são medidos em momentos diferentes, em geral, com intervalo de duas a quatro semanas. Os escores das formas alternativas são então correlacionados, para avaliar sua confiabilidade. Uma correlação baixa pode refletir tanto uma escala não confiável quanto formas não equivalentes.

A confiabilidade da consistência interna serve para avaliar a confiabilidade de uma escala somada, em que vários itens são somados para formar um escore total. Em uma escala deste tipo, cada item mede algum aspecto do construto medido por toda a escala, e os itens devem ser consistentes na indicação da característica. Esta medida enfoca a consistência interna do conjunto de itens que formam a escala e pode ser analisada pelo valor do coeficiente alfa, que varia de 0 a 1. Em geral, valores menores do que 0,6 indicam confiabilidade insatisfatória da consistência interna. Uma propriedade importante do coeficiente alfa é que seu valor tende a aumentar com o crescimento do número de itens da escala. Por isso, o coeficiente alfa pode ser artificialmente – e inadequadamente – inflacionado pela inclusão de vários itens redundantes da escala (MALHOTRA, 2001).

Obtidas evidências de unidimensionalidade e confiabilidade das escalas, passa a ser importante saber até que ponto os construtos medem o que deveriam medir; ou seja, qual é a sua validade. Segundo Netemeyer, Bearden e Sharma (2003), a validade de construto é vista como o quanto uma medida operacional realmente reflete o conceito investigado ou o tanto as variáveis operacionais usadas para observar covariância em e entre os construtos podem ser interpretadas em termos de construtos teóricos.

Para Malhotra (2001), a validade de uma escala pode ser definida como o âmbito em que as diferenças em escores observados da escala refletem as verdadeiras

diferenças entre objetos quanto à característica medida, e não um erro sistemático ou aleatório. Os erros aleatórios se referem a fatores transitórios que afetam o escore observado de maneiras diferentes cada vez que se faz a medida, tais como fatores transitórios pessoais, como saúde, emoções e fadiga, ou fatores situacionais, como a presença de outras pessoas, ruídos e distrações.

Existem vários indicadores para avaliar a validade de uma escala. Seguindo a análise de Malhotra (2001, p. 265 e 266), os principais são:

Validade do conteúdo – por vezes chamado validade nominal, consiste de uma avaliação subjetiva, mas sistemática da representatividade do conteúdo de uma escala para o trabalho de medição em questão.

Validade de critério – examina se a escala de medida funciona conforme o esperado em relação a outras variáveis selecionadas como critérios significativos.

Validade do construto – indica que construto ou característica a escala está medindo. Procura responder a questões teóricas quanto aos motivos pelos quais uma escala funciona e que deduções podem ser feitas em relação à teoria subjacente à escala.

Validade convergente – mede a extensão em que a escala se correlaciona positivamente com outras medidas do mesmo construto.

Validade discriminante – avalia até que ponto uma medida não se correlaciona com outros construtos, dos quais se supõe que ela difira.

Validade nomológica – determina o relacionamento entre construtos teóricos. Procura confirmar correlações significativas entre os construtos, conforme previsto por uma teoria.

(MALHOTRA, 2001). Para Aaker, Kumar e Day (2007), a capacidade de generalização refere-se à facilidade de utilização e interpretação de uma escala em diferentes situações. Esses autores salientam que, como no caso da confiabilidade e da validade, a capacidade de generalização para outros métodos de coleta de dados, para uma grande variedade de indivíduos ou de uma amostra de itens para um universo de itens, não é uma questão absoluta, mas relativa e gradual.

No documento Personalidade e consumo ecologicamente consciente (páginas 97-103)