Escalas como instrumentos de medição - Desenvolvimento e validação de escalas (método aplicado

3. Materiais e métodos

3.2. Desenvolvimento e validação de escalas (método aplicado ao estudo 3)

3.2.2. Escalas como instrumentos de medição

Medir requer o conhecimento prévio de um padrão específico que sirva como referência para comparação (Costa, 2011). Padrões específicos são obtidos por meio do

desenvolvimento de escalas de mensuração e escalas buscam atender critérios de credibilidade em processos de construção do conhecimento sobre a realidade (Churchill, 1979). Assim, tem-se que para medir algo é preciso haver uma escala adequada, crível, por oferecer resultados comparáveis a uma referência comumente aceita.

Em ciências humanas e sociais o estudo da medição de construtos abstratos, isto é, construtos residentes na mente das pessoas, é desenvolvida pela psicometria. A área psicométrica atua no desenvolvimento de instrumentos e procedimentos de mensuração (geralmente escalas em formato de questionário) e no desenvolvimento de abordagens teóricas de mensuração (como teoria de resposta ao item e teoria de traços latentes) (Andrich & Luo, 1993).

Para os fins desta pesquisa adotar-se-ão conceitos e definições de escalas psicométricas, seu desenvolvimento e validação oriundos de literatura especializada (Churchill, 1979; Costa, 2011; DeVellis, 2003), particularmente conceitos e definições sobre construtos, variáveis, itens, validade e confiabilidade de escalas.

Em teoria de medição, construtos são características variáveis e delimitadas de determinado objeto ou evento que permite classificação ou quantificação (Costa, 2011). Construtos observáveis podem ser acessados objetivamente, enquanto construtos latentes são acessados apenas por meio de manifestações observáveis associadas (Bollen, 2002). Principalmente quando se trata da operacionalização de escalas, itens e variáveis são termos que se equivalem e serão aqui adotados nesse sentido.

Enfatiza-se a mensuração multidimensional em pesquisas de natureza psicométrica, por meio do emprego de múltiplos itens para mensuração de um mesmo construto. Essa abordagem aumenta os níveis de credibilidade da escala ao moderar a ocorrência de erro, comum em qualquer medição (Costa, 2011). Ainda assim, há aplicações em que os benefícios de construtos multidimensionais não superam dificuldades de mensuração (p.ex: excessivo tempo de preenchimento das respostas; itens redundantes). Nesses casos, o uso de construtos unidimensionais é mais indicado (Martin & Jackson, 2008).

Construtos são classificados ainda quanto à sua natureza refletiva ou formativa. Construtos refletivos geram efeitos nos seus itens observáveis de mensuração, quando variam. Ou seja, os itens variam em função da variação sofrida pelo construto latente. Construtos formativos por outro lado, sofrem os efeitos da variação ocorrida nos itens de mensuração. A observação da natureza refletiva ou formativa dos construtos é

importante pois impacta diretamente a escolha de técnicas de análise de dados (Costa, 2011).

Escalas são reconhecidas como válidas quando efetivamente medem o que se propõem a medir, ou seja, o valor associado à manifestação do construto sob medição é o valor mais próximo possível do valor “verdadeiro” (DeVellis, 2003, p. 14; Churchill, 1979, p. 65). A capacidade de obter medições próximas ao que se quer medir é definida em função da aplicação e dos resultados obtidos com três conjuntos de procedimentos de validação de escalas: translação, critério e construto (Costa, 2011).

A primeira etapa de validação de escalas, por translação, se propõe a validar conceitualmente o(s) construto(s) que compõe(m) a escala do ponto de vista do seu conteúdo e forma. A validade de conteúdo avalia a relevância e representatividade dos itens selecionados para medir o construto; a validade de face avalia enunciados, apresentação e disposição dos itens na forma que serão apresentados aos respondentes. Em geral, a validação de translação é realizada junto a especialistas no tema e domínio de aplicação do construto (Costa, 2011).

A segunda etapa de validação, por critério, se propõe a validar empiricamente os resultados obtidos pela aplicação da escala quanto à sua capacidade de predição e covariação com outra escala previamente validada (Costa, 2011). Por extrapolar os objetivos desta pesquisa, este tipo de validação não será empregado.

A terceira etapa de validação, por construto, se propõe a validar empiricamente os resultados obtidos pela aplicação da escala quanto à coerência com as expectativas teóricas dos construtos envolvidos. Essa validação ocorre do ponto de vista de (a) convergência que os itens que medem o construto mantém entre si e com o construto (validade convergente), geralmente avaliada por meio de correlações estatísticas entre itens do construto; (b) divergência que os itens que medem o construto mantém entre si e outro construto no mesmo instrumento (validade discriminante), geralmente avaliada por múltiplos métodos para atenuar vieses relacionados à variância de método comum (Campbell & Fiske, 1959); e (c) estrutura que os itens e construtos mantém entre si e que explica causalidades (validade nomológica), geralmente avaliada por meio de técnicas estatísticas como análise fatorial confirmatória e modelagem de equações estruturais (Costa, 2011).

Escalas são reconhecidas como confiáveis quando os resultados que produzem são sistematicamente estáveis ao longo do tempo, ou seja, o valor associado à manifestação do construto sob medição é o mais próximo possível da realidade

(Churchill, 1979). Para construtos de natureza refletiva, a confiabilidade de escalas é tradicionalmente obtida por meio de indicadores de variação conjunta do construto e seus itens observáveis (p.ex: Split-half; Alpha de Cronbach) (Costa, 2011; DeVellis, 2003).

Há variadas estratégias para desenvolvimento de escalas (p.ex: Costa, 2011; DeVellis, 2003; Rossiter, 2002). Um modelo reconhecido como “clássico” é o de Churchill (1979) (Costa, 2011, p. 46). Há indícios de que este modelo tem sido constantemente citado em pesquisas envolvendo desenvolvimento de escalas no período de 2010 a 2014. Pesquisa com a string de busca “Churchill (1979) OR Churchill, 1979” AND “scale development” por meio do indexador de publicações Google Scholar retorna 2.730 publicações, o que ilustra que mesmo tendo sido publicado a mais de 30 anos, o modelo de Churchill (1979) permanece – em alguma medida – sendo referenciado. Modelos posteriores como o de DeVellis (2003) ou Costa (2011) são derivados e incluem aprimoramentos ao modelo de Churchill.

Críticas ao modelo de Churchill (1979) se concentram em torno de possíveis falhas decorrentes de aplicações estatísticas baseadas em correlações (Costa, 2011), estímulo à medição de construtos por múltiplos itens (Rossiter, 2002) e concentração em aspectos de avaliação quantitativa em detrimento de avaliações qualitativas (Smith, 1999). Portanto, por entender que o tipo de investigação que se pretende empreender nesta pesquisa específica demanda triangulação de dados de fontes distintas, optou-se pela adoção de modelo híbrido, em que indicadores estatísticos são considerados à luz de definições conceituais, e vice-versa.

O modelo de desenvolvimento de escalas aqui adotado é estruturado em quatro passos: (1) especificação do domínio do construto, que é realizado por meio de levantamento bibliográfico; (2) geração de amostra de itens, derivados da literatura revisada e complementados por meio de consulta a especialistas, entrevistas em profundidade etc; (3) coleta de dados com base nos itens gerados; e (4) purificação de itens e análise de confiabilidade, por meio de técnicas estatísticas como análise fatorial exploratória e Alpha de Cronbach.

Embora não seja parte do escopo desta pesquisa, o modelo clássico prevê ainda que esta última etapa citada pode vir a demandar retorno ao passo “1” e subsequentes, para aprimoramento dos itens, e que deve ser seguida de (5) nova coleta de dados com base nos itens purificados; (6) nova purificação de itens e análise de confiabilidade, por meio das mesmas técnicas estatísticas empregadas no passo “4”; (7) avaliação da

validade estatística, com procedimentos específicos para análise convergente e discriminante; e (8) desenvolvimento de normas para aplicação da escala e interpretação dos resultados (Churchill, 1979).

Considerando a crítica à relativa pouca importância dedicada aos aspectos qualitativos do desenvolvimento de escalas segundo o modelo de Churchill (1979) (ver Smith, 1999), propõe-se a substituição da técnica “entrevistas em profundidade”, prevista no passo “2” do modelo, por técnica comprovadamente menos sujeita a vieses de aplicação e, ao mesmo tempo, facilitadora de evocações sobre estruturas mentais em profundidade: Repertory grid (Kelly, 1955), complementada por grupos focais (López & Pascual, 2008) para geração adicional de itens de escalas. A associação entre entrevistas individuais e em grupo como estratégia de coleta e triangulação de dados encontra respaldo na literatura (Freitas & Oliveira, 2010; Parasuraman et al., 1985).

No documento Open Se quer que seja bem feito, faça em equipe: flow e desempenho em equipes de tecnologia da informação (páginas 59-63)