• Nenhum resultado encontrado

Como já dito anteriormente, a estimação do modelo completo de SEM repousa nas re- lações estre a matriz de covariância Σ e os parâmetros estruturais Θ, como ficou evidenciado em (2.20).

Se o modelo sob estudo é correto e os parâmetros populacionais são conhecidos, temos que Σ = Σ(Θ), entretanto como não conhecemos Σ, utilizamos a matriz de covariância amostral S para estimarmos os parâmetros do modelo.

As funções de ajuste, F , que apresentaremos são baseadas em S e em Σ(Θ) e são denominadas funções de discrepância.

As funções de discrepância possuem as seguintes propriedades: • F é um escalar, para cada Θ fixado;

• F ≥ 0;

• F = 0 se e somente se Σ(Θ) = S; • F é contínua em Σ(Θ) e em S.

2.9.1

Máxima Verossimilhança

A função de ajuste mais utilizada em modelos SEM é a função baseada em máxima verossimilhança (ML, do inglês Maximum Likelihood), e que pedende da suposição de que os indicadores seguem uma distribuição normal multivariada.

Neste caso a função a ser minimizada é:

FM L = log |Σ(Θ)| + tr(SΣ−1(Θ)) − log |S| − (p + q). (2.23)

• Mesmo podendo serem viciados para pequenas amostras, os estimadores são assinto- ticamente não-viciados;

• São consistentes;

• São assintoticamente eficientes; • São assintoticamente normais; • São invariantes.

Como os estimadores são assintoticamente normais, quando o tamanho amostral aumenta é possível realizar testes de significância estatística para cada um dos parâmetros estimados. Além dos testes individuais, é possível realizar um teste para o ajuste global do modelo. A hipótese nula, H0, do teste é de que Σ = Σ(Θ) e sob esta hipótese temos que:

(n − 1)FM L ∼ χ2  1 2(p + q)(p + q + 1) − t  . (2.24)

Neste caso, se a hipótese nula não for rejeitada, temos evidências de que o modelo teve um bom ajuste.

É importante ressaltar que este teste deve ser utilizado com parcimônia; é necessário ter um tamanho amostral suficientemente grande e que as variáveis sejam normais1.

2.9.2

Mínimos Quadrados Generalizados

A estimação por mínimos quadrados generalizados (GLS, do inglês Generalized Least Square) tem por objetivo minimizar a diferença entre os valores observados em S e os correspondentes elementos preditos em Σ(Θ).

A função a ser minimizada é: FGLS =

1 2tr



[S − Σ(Θ)]W−1 2, (2.25)

sendo que W−1 é uma matriz de pesos para a matriz residual. Diversas matrizes de pesos

podem ser utilizadas, entretanto a mais usual é W−1 = S−1.

As estimativas obtidas pelo método GLS possuem as mesmas propriedades das esti- mativas obtidas pelo método ML e os testes individuais e de ajuste global, apresentados anteriormente, continuam válidos.

Sob a suposição de normalidade multivariada, tanto os estimadores de ML, quando os estimadores de GLS, são ótimos quando o tamanho amostral é grande (Bollen, 1989).

2.9.3

Mínimos Quadrados Não-Ponderados

A função de ajuste para o método de mínimos quadrados não-ponderados (ULS, do inglês Unweighted Least Square) é:

FU LS =

1 2tr



(S − Σ(Θ))2. (2.26)

Esta função minimiza a soma de quadrados de cada elemento da matriz residual (S − Σ(Θ)). Mesmo sendo a mais simples de todas as funções de discrepância, ela determina esti- madores consistentes de Θ e não exige a suposição de que as variáveis observadas seguem alguma distribuição em particular. Em contrapartida, ela não possui os estimadores assin- toticamente mais eficientes, não possui escala invariante e o teste χ2 não pode ser avaliado.

2.9.4

Suposição sobre a Distribuição dos Dados

Até agora nos limitamos a dizer que as variáveis observadas deveriam ser normalmente distribuídas para que os resultados das estimativas obtidas pelo método de ML e GLS fossem válidas; a partir de agora explicitaremos as consequências de se violar estas suposições.

No desenvolvimento da função FM L, a distribuição normal multivariada das variáveis

observadas é considerada como sendo verdadeira; quando essa suposição não é válida, mas os dados não possuem curtose excessiva, as funções FM L e FGLS ainda podem ser avaliadas.

Sob estas condições, os estimadores obtidos são consistentes e assintoticamente eficientes, além de ser possível realizar testes estatísticos para os parâmetros e para o ajuste global do modelo sob estudo.

Browne (1982, 1984) apresenta a Tabela 2.3, que sumariza todas as propriedades dos estimadores ML e GLS.

Tabela 2.3: Propriedades dos estimadores ML e GLS.

Distribuição das Propriedade dos Estimadores ML e GLS Var. observadas Consistência Ef. Assintótica aCov( bΘ) Teste χ2

Multinormal Sim Sim Correto Correto

Sem Curtose Sim Sim Correto Correto

Elíptica Sim Sim Incorreto Incorreto

“Arbitrária” Sim Não Incorreto Incorreto

Bollen(1989) afirma que quando o tamanho amostral cresce, as estimativas obtidas pelos métodos de ML, GLS e ULS convergem para o verdadeiro parâmetro populacional, mesmo que a distribuição dos dados não seja normal.

Desta forma podemos afirmar que os resultados numéricos das estimativas obtidas por qualquer um dos métodos de estimação possíveis para SEM serão aproximadamente iguais, o que acaba por produzir interpretações gerais similares. O que muda é que é necessário que

algumas suposições sejam feitas a fim de que a medida de ajuste global e os erros-padrão das estimativas dos parâmetros sejam assintoticamente corretas.

Em suma, temos que a não-normalidade dos dados não afeta a consistência dos esti- madores FM L, FGLS e FU LS, mas a curtose excessiva acaba por eliminar a eficiência as-

sintótica e invibializa os testes estatísticos para os parâmetros e para o ajuste global do modelo.

O leitor é encorajado a testar a normalidade e o nível de curtose dos dados a fim de garantir que as propriedades dos estimadores obtidos pelos métodos ML e GLS sejam válidas. Nos casos em que estas suposições não possam ser verificadas podemos testar algumas opções de correção. Uma opção é a transformação das variáveis não-normais. Outra al- ternativa é empregar reamostragem Bootstrap ou Jackknife e produzir testes estatísticos não-paramétricos. Entretanto é necessário avaliar o tempo gasto para que estes tipos de procedimentos sejam realizados.

Uma terceira forma é utilizar estimadores alternativos que permitam que os dados sejam não-normais, mas que mesmo assim sejam assintoticamente eficientes. Os métodos de mí- nimos quadrados ponderados (WLS, do inglês Weighted Least Square), mínimos quadrados ponderados diagonalmente (DWLS, do inglês Diagonal Weighted Least Square) e estimadores elípticos (E) são algumas das opções possíveis (Bollen, 1989).

2.9.5

Mínimos Quadrados Ponderados

As funções de discrepância em modelos de equações estruturais são casos particulares de uma função de discrepância global. Esta função pode ser escrita como:

F = (s − σ(θ))′W−1(s − σ(θ)) = k X g=1 g X h=1 k X i=1 i X j=1 wgh,ij(sgh− σgh)(sij − σij), (2.27) sendo que: • s′ = (s

11, . . . , skk) é um vetor com os elementos da matriz triangular inferior de S;

• σ(θ)′ = (σ

11, . . . , σkk) é um vetor de elementos correspondentes de Σ(Θ);

• wgh,ij são elementos de uma matriz de pesos positiva-definida W−1;

• u = 12k(k + 1).

Desta forma, a matriz W−1deve ser tal que seus elementos sejam estimativas consistentes

da covariância assintótica entre sgh e sij.

A covariância assintótica entre sgh e sij é:

sendo que σijgh é o momento de quarta ordem em torno da média.

Quando cada um dos elementos de W é uma estimativa de (2.28), temos que estamos estimando os parâmetros do modelo pelo método WLS. Este método também é comumente chamado de função de distribuição arbitrária ou estimador livre de distribuição.

Os elementos de (2.28) podem ser estimados por: bsijgh = 1 n n X t=1 (Zit− Zi)(Zjt − Zj)(Zgt− Zg)(Zht− Zh) (2.29) e bsij = 1 n n X t=1 (Zit− Zi)(Zjt− Zj), (2.30) sendo que:

• Z é a matriz de dados observados; • Z = n1Z

1 é o vetor de médias;

• n é o tamanho amostral.

A vantagem dos estimadores de WLS é que são feitas suposições mínimas sobre a dis- tribuição dos dados. Fornecendo uma matriz de pesos como a dada anteriormente, ele se transforma em um estimador eficiente que fornece uma matriz de covariâncias para as es- timativas de Θ e um teste χ2 de ajuste global do modelo. Já a desvantagem de se utilizar

este método está no tempo computacional necessário para inverter uma matriz quadrada e estimar o modelo.

Existem indícios de que o tamanho amostral necessário para a convergência das estimati- vas, obtidas neste método, é maior do que para FM L, FGLS e FU LS; não se tem muitas ideias

sobre as propriedades dos estimadores de FW LS quando o tamanho amostral é pequeno e não

é claro qual é o ganho de performance, utilizando FW LS em comparação às demais formas

de estimação, quando existem desvios moderados de normalidade (Bollen, 1989).

2.9.6

Mínimos Quadrados Ponderados Diagonalmente

Como dito anteriormente, o método WLS tem a desvantagem de se ter de inverter uma matriz que pode ser muito grande dependendo do número de variáveis observadas.

Uma forma alternativa é calcular somente as variâncias assintóticas dos coeficientes es- timados e utilizar a função (2.31), que é uma simplificação do modelo geral (2.27).

k X g=1 k X h=1 1 wgh (sgh− σgh)2, (2.31)

A função (2.31) corresponde a utilizar uma matriz de pesos diagonal W−1.

Este método é considerado um meio termo entre ULS e WLS e não é correto avaliar o teste χ2.

Tanto as estimativas obtidas através do método WLS, quanto as estimativas obtidas pelo método DWLS , são não-eficientes.

2.9.7

Estimadores Elípticos

A fórmula geral de uma densidade elíptica é:

c|V |−12h(z − µ)V−1(z − µ) , (2.32)

sendo que:

• c é uma constante;

• h é uma função não-negativa;

• z é um vetor de dados com média µ e matriz positiva-definida V .

As distribuições elípticas incluem uma vasta gama de distribuições, possuem coeficiente de assimetria 0, mas podem ter curtose diferente da curtose da distribuição normal multi- variada.

Neste caso a função a ser ajustada se resume a: FE = 1 2(c + 1) −1tr(S − Σ(Θ))V−12− c 1tr(S − Σ(Θ))V−1 2 , (2.33) sendo que:

• c é um parâmetro de curtose comum; • c1 = [4(c+1)2+2(p+q)k(k+1)]c ;

• V é uma matriz de pesos.

O parâmetro de curtose comum pode ser estimado por:

bc = b2,(p+q)(p + q)(p + q + 2)− (p + q)(p + q + 2), (2.34) sendo que b2,(p+q) = 1n Pni=1



(Zi.− Z)′S−1(Zj.− Z) 2

.

O parâmetro de curtose comum também pode ser estimado por: bc = 3(p + q)1

p+q

X

i=1

sendo que b2 são as estimativas de curtose univariadas.

Escolhendo V como um estimador consistente de Σ, obtemos um estimador assintotica- mente eficiente de Θ e (n − 1)FE possui distribuição assintoticamente χ2. A escolha mais

comuns de V é S (Bollen, 1989).

2.9.8

Covariâncias versus Correlações

Além de escolher qual método será utilizado para estimar os parâmetros do modelo de equações estruturais, é necessário determinar qual matriz de entrada será utilizada.

A matriz de covariâncias tem como vantagem fornecer comparações válidas entre dife- rentes populações, ou amostras, mas a interpretação dos coeficientes fica comprometida.

A matriz de correlações é mais indicada quando o objetivo do estudo é compreender as relações entre os constructos do modelo, mas não explicar a variância total de uma variável latente.

Todas as formas de estimação apresentadas nas seções anteriores permitem que qualquer matriz de entrada seja utilizada, entretanto deve-se ter cuidado na interpretação dos testes estatísticos quando se utiliza a matriz de correlação e quando as estimativas são obtidas pelos métodos ML ou GLS (Bollen, 1989).

As estimativas obtidas pelo método WLS também são válidas para a matriz de corre- lações, desde que a matriz de pesos reflita a covariância assintótica entre as correlações rgh

e rij.

A falta de dados pode ser um problema potencial na estimação das correlações ou co- variâncias na medida em que acabam por diminuir o tamanho amostral. Hair et al. (1998) afirma que os algoritmos EM introduzem o menor viés nos modelos estimados, mas que as opções pairwise ou listwise também têm bom resultado quando a proporção de dados faltantes não é grande.

Como referência de tamanho amostral, Hair et al. (1998) recomenda 200 ou mais ob- servações, com um aumento caso o modelo seja muito complexo, se existem suspeitas de má especificação do modelo, se os dados exigem características não-normais ou se algum procedimento alternativo, tal como WLS, for empregado.

Documentos relacionados