• Nenhum resultado encontrado

4 MÉTODO

4.3 Plano de análise de dados

4.3.3 Modelo estrutural

A última fase da análise de dados quantitativos busca proceder à finalização do chamado “modelo de dois passos” (ANDERSON e GERBIN, 1988; GARVER e MENTZER, 1999; HAIR et al, 1998) para operacionalização da modelagem de equações estruturais (SEM). Esta é uma técnica estatística que combina a lógica da análise fatorial confirmatória, da regressão múltipla e da path analysis em uma única prática (BERCKLER, 1990 apud HENLEY et al, 2006).

Modelos de equações estruturais são geralmente conhecidos como “modelos causais”. Estes buscam mostrar como e quanto cada uma das variáveis independentes está associada a mudanças no comportamento das variáveis dependentes ou constructos. A modelagem faz isso apenas tendo como base a força das relações entre as variáveis, sem estabelecer grupos de controle, e sem ter domínio de variáveis estranhas ao experimento, que são a maneira usual de estabelecer causa. Assim, é importante notar que um modelo estrutural não deve ser tentado antes que se compreenda que constructos são importantes para o fenômeno que se quer compreender, como os constructos se relacionam uns com os outros, e como se pode melhor mensurar cada um deles (MYERS e MULLET, 2003).

A força da abordagem de equações estruturais, diferentemente das demais técnicas multivariadas, se dá porque ela examina uma série de relações de dependência simultaneamente, fazendo com que os pesquisadores possam valer-se de uma única abordagem estatística para testar o escopo total das relações presumidas, sendo particularmente útil quando uma variável dependente torna-se uma variável independente em uma relação subsequente (HAIR et al, 1998; SHOOK et al, 2004 apud HENLEY et al, 2006).

Assim, o objetivo do SEM é “determinar o quão bem um modelo hipotetizado se ajusta aos dados observados” (HENLEY et al, 2006, p. 517), analisando mais especificadamente se a estrutura suposta é consistente com a matriz de covariância ou correlações dos dados amostrados. Assim, o objetivo da modelagem de equações estruturais é contabilizar as variâncias e covariâncias das variáveis observáveis através da relação entre variáveis observáveis com as variáveis latentes e da especificação de relações teóricas de interesse no nível das variáveis latentes (BAGOZZI e BAUMGARTNER, 1994). A modelagem de equações estruturais, entretanto, deve ter uma abordagem baseada na teoria, uma vez que a técnica deve ser quase que completamente especificada pelo pesquisador (HENLEY et al, 2006).

Há inúmeras discussões na literatura acerca do melhor método de estimação para diferentes tipos de dados em modelagem de equações estruturais. Jöreskog e Sörbom (1996) observaram em seus estudos que, mesmo em se tratando de dados altamente não-normais, o Maximum

Likelihood (ML) apresenta resultados satisfatórios e com poucas diferenças se comparado a

outros métodos como o WLS (generally weighted least-squares). Bagozzi e Baumgartner (1994) também confirmam que tanto o ML quanto o GLS (generalized least squares) são robustos quanto a violações de normalidade. Estudos realizados por Hau e Marsh (2004) com variáveis não-normais mostraram que o ML portou-se bem apesar da presença da não- normalidade multivariada. Mesmo em casos de amostras bastante pequenas e extrema não- normalidade, as soluções do método de estimação quase sempre convergiram para soluções completamente adequadas e resultaram em parâmetros de estimação não-enviesados.

Em função das considerações efetuadas, o método Maximum Likelihood (ML) foi o selecionado para a análise de dados na modelagem de equações estruturais, utilizando-se a matriz de covariância entre os itens da escala empregada. Esse é um método em que todos os parâmetros do modelo são calculados ao mesmo tempo. Se as estimativas dos parâmetros são assumidas como sendo valores referentes à população, são elas que maximizam a probabilidade de que os dados sejam ajustados a essa população. Assim, o método prevê para o modelo a chance de se observar o mesmo comportamento caso seja coletada outra amostra da mesma população (RAYKOV e MARCOULINDE, 2000).

Outro fator bastante discutido na literatura refere-se aos índices de ajustamento em modelagem de equações estruturais. Há inúmeras discussões acerca dos critérios de corte para

aceite do ajustamento do modelo. Posições mais rigorosas como a de Bagozzi (2005), seguindo os procedimentos de Hu e Bentler (1999), sugerem que um critério de corte adequado para um dado índice de ajustamento deveria resultar na minimização do erro Tipo I (a probabilidade de rejeitar a hipótese nula quando ela é verdadeira) e do erro Tipo II (a probabilidade de aceitar a hipótese nula quando ela é falsa). Para o autor, um valor de corte de 0,95 para o TLI ou NNFI e CFI seria adequado e um valor de corte de 0,06 para o RSMEA seria necessário antes que pudéssemos concluir que haveria um ajuste relativamente bom entre o modelo hipotetizado e os dados. Para Marsh et al (2004), por outro lado, pode não ser razoável ter mais de dois ou três itens por fator se os pesquisadores desejam atingir índices de ajustamento de 0,95, mas ao contrário isso é altamente desejável se os pesquisadores quiserem obter medidas com boa validade de constructo. Segundo os autores, os pesquisadores clamaram através do SEMNET (grupo de discussão na Internet sobre modelagem de equações estruturais) em não modificar os índices de ajustamento, uma vez que os atuais (>0,90) já seriam bastante difíceis de ser obtidos na prática com os melhores instrumentos de mensuração existentes.

Assim, um grande número de autores aceita e recomenda um valor de 0,90 como critério de corte para índices de ajustamento como Tucker-Lewis Index (TLI), Comparative Fit Index (CFI), Goodness-of-fit (GFI) e Adjusted Goodness-of-fit (AGFI). A explanação do papel de tais indicadores, assim como dos índices Qui-quadrado sobre Graus de Liberdade e Root

Mean Square Error of Aproximation (RMSEA), será feita a seguir. Essas medidas são as

mesmas utilizadas na fase anterior da CFA para a verificação do ajuste de cada constructo com seus indicadores individualmente. Uma vez que cada índice representa o ajuste do modelo por uma ótica diferente, Raykov e Marcoulides (2000) atentam para o fato de que nenhuma decisão acerca do modelo deve ser tomada tendo-se como base um único índice, não importando o quão favorável ou desfavorável o mesmo possa ser. O que importa é avaliação geral do ajuste dos índices, decidindo-se então pela validação ou não da dimensão analisada.

Qui-quadrado sobre Graus de Liberdade (χχχχ2/GL): o qui-quadrado acessa a magnitude da discrepância entre os dados da amostragem e a matriz de covariância ajustadas ao modelo proposto. Quanto menor o qui-quadrado, melhor o ajuste do modelo (JÖRESKOG e SÖRBOM, 1982). Como não há, entretanto, concordância acerca de um valor máximo para o índice, os graus de liberdade servem como padrão para indicar se o qui-quadrado é grande ou pequeno, servindo como balizadores do ajuste para que se possa avaliar o que é um valor

aceitável. Assim, esse deverá ser igual ou inferior a cinco, sendo que valores menores indicam um melhor ajuste do modelo (JÖRESKOG e SÖRBOM, 1982). O número de graus de liberdade em um teste de qui-quadrado é dado pela fórmula DF=1/2(p)(p+1)-t. Onde: p é o número de variáveis observáveis, 1/2(p)(p+1) é o número de covariâncias, e t é o número de parâmetros a serem estimados. Um valor de qui-quadrado não significante (p>0,05) com os graus de liberdade associados é tido como indicativo de um modelo satisfatório (HAIR et al, 1998; BAGOZZI et al, 1999). Entretanto, mesmo a não-significância estatística não garante que o modelo “correto” tenha sido identificado, mas apenas que este modelo proposto se ajusta às covariâncias e correlações observadas. Apesar de o qui-quadrado no método ML ser a estatística mais utilizada para verificar o ajuste do modelo, uma das limitações desse índice é que ele é sensível ao tamanho da amostra, sendo que para amostras grandes o incide rejeita qualquer modelo e para amostras muito pequenas pode falhar em não rejeitar um modelo com ajuste ruim (BAGOZZI, 2005; MARSH et al, 2004).

De acordo com Hair et al (1998) um valor alto de qui-quadrado relativo aos graus de liberdade significa que as matrizes observada e estimada diferem consideravelmente. Níveis estatisticamente significantes indicam a possibilidade de essas variações darem-se somente em função de variações na amostra. Segundo esses autores, o teste do qui-quadrado é considerado apropriado para amostras entre 100 e 200 casos, com os testes de significância ficando menos confiáveis com amostragens fora desse intervalo. Assim, os demais índices de ajustamento são geralmente utilizados para suplementar a interpretação do qui-quadrado.

Goodness-of-fit (GFI): é a medida da variância e covariância que o modelo proposto está apto a explicar (JÖRESKOG e SÖRBOM, 1982). Segundo Hair et al, (1998) representa o grau de ajustamento geral (os resíduos ao quadrado da predição em comparação com os dados atuais), mas não é ajustado para os graus de liberdade. Os índices GFI, AGFI e CFI variam de 0 a 1, com valores mais próximos de 1 indicando um melhor ajuste; entretanto, segundo esses autores, critérios de corte absolutos ainda não foram estabelecidos. O Adjusted Goodness-of-

fit (AGFI) é a medida do GFI ajustada pela relação dos graus de liberdade para o modelo

proposto aos graus de liberdade do modelo nulo (HAIR et al, 1998).

Non-normed fit Índex (NNFI) ou Tucker-Lewis Índex (TLI) representam diferentes denominações de um mesmo índice (HAIR et al, 1998), o qual expressa a não-centralidade pelos graus de liberdade. Mede a parcimônia do modelo, comparando os graus de liberdade

do modelo proposto com os graus de liberdade do modelo nulo (GARVER e MENTZER, 1999), ou seja, o índice considera a relativa parcimônia de modelos alternativos que raramente é afetada pelo tamanho da amostra (STEENKAMP e VAN TRIJIP, 1991). Valores acima de 0,9 são considerados adequados (HAIR et al, 1998). Entretanto, o TLI não está necessariamente restrito a valores entre 0 e 1 (BAGOZZI et al, 1999).

Comparative Fit Index (CFI): é uma medida comparativa entre o modelo proposto e o modelo nulo. O CFI é um índice baseado na comparação do ajuste de um modelo proposto com o modelo nulo em que todas as variáveis não são correlacionadas (e apenas as variâncias dos erros são estimadas). O CFI é normalizado na população e os valores variam entre 0 e 1, exceto quando χχχχ2<GL, sendo que neste caso a convenção é utilizar um qui-quadrado igual a 1. O CFI provê uma estimativa não-enviesada do valor correspondente na população, e, portanto, deveria ser independente do tamanho da amostra. Segundo Bagozzi et al (1999), o CFI comporta-se bem para amostras, variando entre 50 a 1.600 elementos e produzindo índices com pouca variabilidade e não-enviesados. Segundo os autores, uma regra de ouro é que valores iguais ou acima de 0,90 sugerem que um maior relaxamento dos parâmetros restritos não é garantido e pode levar ao ajuste perfeito.

Root Mean Square Error of Aproximation (RMSEA): é uma alternativa para o teste do modelo em que a hipótese nula de que o modelo se ajusta perfeitamente à matriz de covariância não é levada em consideração (testado utilizando-se os valores do qui-quadrado e grau de significância). Valores até 0,08 são considerados aceitáveis (HAIR et al, 1998). Uma vantagem do RMSEA como índice de ajustamento é que o ponto de estimação e o intervalo de confiança estão disponíveis. Assim, o RMSEA não está relacionado ao tamanho da amostra. O RMSEA indica a discrepância do modelo por graus de liberdade. O índice dá uma penalização a modelos complexos e um prêmio a modelos parcimoniosos (BAGOZZI, 2005).