• Nenhum resultado encontrado

Condição I (CI): restrição dos escores de pertinência

Hipótese 3 (H3): as respostas são independentes para diferentes valores de , O que corresponde a indivíduos selecionados aleatoriamente de

2.3.2. Estimação: Consistência e Eficiência do Método GoM

Nesta seção mostraremos como os parâmetros do modelo GoM podem ser estimados usando o princípio de máxima verossimilhança. Este tema tem recebido alguma atenção dos usuários deste modelo, principalmente em relação à consistência e convergência dos estimadores, como em Caetano e Machado (2009).

Neste modelo há dois conjuntos de parâmetros a serem estimados: (i) os parâmetros dos itens ou variáveis (binárias), que são comuns a todos os indivíduos e (ii) os parâmetros dos sujeitos, os quais são específicos para cada indivíduo.

Como destacam Manton, Woodbury e Tolley (1994, p. 50), o número de parâmetros tende a aumentar conforme aumenta o número de observações, mantendo-se o número de itens fixos. No entanto, é prudente salientar que o número de distintos parâmetros é limitado pelos distintos padrões de respostas. Isto é, caso todos os padrões de respostas já tenham sido observados, a inclusão de mais um indivíduo que apresente o mesmo padrão de respostas já observado não levará ao crescimento da quantidade de parâmetros a serem estimados, uma vez que este “novo” indivíduo deverá apresentar o mesmo escore GoM ( ) dos demais indivíduos que apresentam o mesmo padrão de respostas.

O método de estimação apresentado em Manton, Woodbury e Tolley (1994) é uma maximização iterativa da função de verossimilhança conjunta restrita em relação aos dois conjuntos de parâmetros, incidentais e estruturais. A verossimilhança do modelo pode ser escrita como

( (2.3)

No entanto, as fórmulas apresentadas por estes autores (equações 3.32 e 3.33, p.68) não satisfazem as condições impostas ao modelo em relação aos valores de e .

Erosheva (2002) e Yang, Chiang, et al. (2008) apresentam, em versões diferentes, as soluções corretas a partir da “receita” apresentada por Manton, Woodbury e Tolley (1994, pp. 68-70).

A equação de atualização do escore de pertinência no processo de iteração é, portanto, dada por

onde e e são valores dos parâmetros das iterações

prévias.

De forma similar, a equação de atualização para os parâmetros das probabilidades de resposta dos perfis extremos é dada por

Há outras formas de estimação baseados na maximização da verossimilhança, porém, estes apresentam, assim como o método mostrado acima, soluções deficientes em relação à consistência das estimativas dos parâmetros e à identificação dos modelos como podemos observar em Erosheva (2002), Caetano & Machado (2009), Guedes, Caetano, et al. (2010) e Yang, Chiang, et al. (2008). Em outras palavras, há claramente a necessidade de um método de estimativa confiável que possa lidar com casos gerais e dimensões maiores (Erosheva, 2002). Assim, Erosheva (2002) propõe um método bayesiano de estimação baseado em MCMC (Monte Carlo Markov Chain), porém, em função de sua complexidade, da dimensão das bases de dados e os objetivos deste trabalho, optamos por adotar o procedimento de estimação livre de distribuição proposto pelos autores do modelo, o qual é amplamente utilizado.

No caso de estarmos em um contexto no qual o plano amostral causa a violação de qualquer uma das hipóteses do modelo GoM, a função de verossimilhança não é mais passível de fatoração e o processo de estimação deve ser alterado para ser possível lidar com a violação de alguma das hipóteses. Esta pode ser uma situação de difícil solução analítica, uma vez que, caso o plano amostral apresente, por exemplo, uma etapa de conglomeração de unidades primárias de amostragem (UPAs), é provável que haja correlação intraclasse dos parâmetros individuais. Esta correlação significa, sobretudo, que os indivíduos não são mais independentes, violando, portanto, a Hipótese 3.

73

Ao adotar a pessoa como unidade de análise, corremos o risco de desconsiderar uma provável correlação entre as pessoas do mesmo domicílio, mas decidimos investigar este efeito em trabalhos futuros. Além disso, o uso do domicílio como unidade de análise eliminaria este problema, no entanto, perderíamos considerável heterogeneidade individual; característica que preferimos manter na análise. Como os planos amostrais adotados nas amostras 2000 e 2010 do censo produzem resultados semelhante a uma amostra aleatória simples11 e dada a dimensão da amostra analisada, consideramos que a violação da Hipótese 3 seria aceitável12.

Cabe ressaltar, no entanto, que os pesos amostrais escalonados de cada indivíduo13 são considerados nas estimativas do modelo GoM conforme abaixo.

Os pesos escalonados são os pesos amostrais ajustados para que a sua soma seja igual ao tamanho da amostra de acordo com o seguinte procedimento

onde , é o peso amostral de cada indivíduo e o peso amostral escalonado (VIEIRA, 2009).

Para a consideração dos pesos amostrais escalonados na estimativa dos parâmetros GoM, ajustamos a estimativa das probabilidades de resposta dos perfis extremos, , conforme (2.4) e deixamos sem alteração a equação de estimação dos graus de pertinência, . Isto porque, enquanto a estimativa de é obtida

com base nos graus de pertinência e nas respostas de todos os indivíduos da amostra, a estimativa de considera somente o padrão de resposta do próprio indivíduo ponderado por . Assim, consideramos adequado ponderar somente

, uma vez que são essas probabilidades que consideram toda a distribuição dos

11 Como o desenho amostral dos dois censos é estratificado com seleção sistemática dos domicílios, Särndal, Swensson e Wretman (1992) mostram que a utilização de um estimador da variância apropriado para uma amostra aleatória simples superestima a variância gerando estimativas conservadoras.

12 Ver Bertolet (2008) e Bertolet (2009) para maiores detalhes sobre a consideração de planos amostrais que possam violar alguma hipótese do modelo GoM.

13 Nos microdados de cada censo, a cada unidade domiciliar da amostra está associado um peso ajustado que é repetido nos registros de cada pessoa moradora na unidade domiciliar. Este pesos são utilizados na ponderação dos indivíduos ao estimar o modelo GoM.

valores na amostra. Assim, equação de atualização para os parâmetros das probabilidades de resposta dos perfis extremos é dada por

(