Estima¸c˜ ao da dimensionalidade em modelos da TRI
Ronald Nojosa e M´arcia D’Elia Branco
Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica
mbranco@ime.usp.br
Salvador - CONBRATRI II - Dezembro de 2011
Introdu¸c˜ ao
Os modelos da TRI podem ser caracterizados por:
Tipo de vari´avel resposta: dicotˆomica ou politˆomica.
N´umero de parˆametros de itens: 1P, 2P ou 3P.
Diferentes fun¸c˜oes de liga¸c˜ao ou CCI: log´ıstica, normal ou assim´etrica.
Dimensionalidade do instrumento de medida ou do tra¸co latente: uni ou multidimensional.
As trˆes ´ultimas caracter´ısticas s˜ao suposi¸c˜oes impostas ao modelo que podem ser testadas estatisticamente com a ajuda de t´ecnicas diagn´osticos ou de sele¸c˜ao de modelos.
Introdu¸c˜ ao
Neste trabalho propomos o uso de um m´etodo bayesiano de sele¸c˜ao de modelos para determinar a dimensionalidade do instrumento de medida, ou equivalentemente, a dimens˜ao do vetor de tra¸cos latentes associado ao modelo TRI.
O modelo multidimensional considerado ´e o modelo probito (CCI normal).
A inferˆencia bayesiana ´e baseada em amostras de Monte Carlo com Cadeias de Markov.
O algoritmo utilizado ´e uma adapta¸c˜ao do RJMCMC proposto por Green (1995).
O modelo probito multidimensional
Respostas dicotˆomicas com CCI normal.
k a dimensionalidade do instrumento de medida.
θi = (θi1, . . . , θik)to vetor dos tra¸cos latentes associado ao i-´esimo indiv´ıduo,i= 1, . . . , N.
aj = (aj1, aj2, . . . , ajk)t ebj s˜ao parˆametros associados aos itens. Denoteηj = (atj, bj), j = 1, . . . , J.
aj esta relacionado com o parˆametro de discrimina¸c˜ao e bj com a dificuldade do item
Φ a fun¸c˜ao de distribui¸c˜ao acumulada da normal padr˜ao, em que
Φ(x) =
x
Z
−∞
(2π)−12exp
−z2 2
dz.
O modelo probito multidimensional
Yij |θi, ηj ∼Bernoulli(pij) em que
pij =P(Yij = 1|θi, ηj) = Φ(θitaj−bj) Com as seguintes suposi¸c˜oes de independˆencia:
(a) independˆencia entre as respostas de diferentes indiv´ıduos;
(b) independˆencia local, isto ´e, dado o vetor de tra¸cos latentes as respostas dos indiv´ıduos aos itens do teste s˜ao independentes.
A fun¸c˜ao de verossimilhan¸ca ´e dada por
N
Y
i=1 J
Y
j=1
Φ(θitaj−bj)yij
1−Φ(θitaj−bj)1−yij
Dificuldade e Discrimina¸c˜ ao multidimensionais
Parˆametro de Dificuldade:
DIF ICMj = bj
(Pk
l=1a2il)1/2. Parˆametro de Discrimina¸c˜ao:
DISCMj =
k
X
l=1
a2jl
!1/2 .
Inferˆ encia Bayesiana com dimens˜ ao fixada
Especifica¸c˜ao das distribui¸c˜oes`a prioripara os parˆametros do itens ηj´s e dos indiv´ıduosθi´s. Para ambos os casos
consideramos normais multivariadas.
A inferˆencia`a posteriori´e baseada em amostras MCMC, as quais nos permitem obter estimativas para todas as
quantidades desconhecidas.
Utilizamos a id´eia do m´etodo de dados aumentados (Tanner and Wong, 1987) com o amostrador de Gibbs (Gelfand and Smith, 1990). Usamos a sigla DAGS (Data Augmentation and Gibbs Sampling) para o nosso algoritmo.
Id´eia b´asica do DAGS: Um conjunto de vari´aveis auxiliares (n˜ao observadas) ´e considerado de modo a obtermos formas explicitas para as distribui¸c˜oes condicionais completas e permitir o uso do
Proposi¸c˜ao: O modelo de dados aumentados associado ao modelo probito multidimensional ´e dado por
P(yij, vij) =φ(vij |mij,1)I(yij, vij) comφ(.|µ, σ2) a f.d.p. da N(µ, σ2),mij =θitaj−bj e
I(yij, vij) =I(yij = 0)I(vij <0) +I(yij = 1)I(vij ≥0).
Vij ∼N(mij,1)s˜ao as vari´aveis auxiliares.
A fun¸c˜ao de verossimilhan¸ca aumentada resulta de um produto de normais truncadas.
N
Y
i=1 J
Y
j=1
φ(vij |mij,1)I(yij, vij).
As distribui¸c˜oes a priori consideradas s˜ao ηj ∼Nk+1(µη,Ση)
θi ∼Nk(µθ,Σθ) .
Resultando nas seguintes distribui¸c˜oes condicionais completas:
Para o vetor de tra¸cos latentes, obtemos um produto de normais multivariadas (dimens˜ao k);
Para o vetor de parˆametros dos itens, obtemos um produto de normais multivariadas (dimens˜ao k+1);
Para o vetor de vari´aveis auxiliares, obtemos um produto de normais truncadas unidimensionais.
Algoritmo 1
1 Adotar valores iniciais para (θ, η)
2 Simular independentemente vij da seguinte forma:
seyij = 0, simula da N(mij,1)I(vij <0);
seyij = 1, simula da N(mij,1)I(vij ≥0)
3 Simular valores do vetorθi a partir daNd(Hihi, Hi)
4 Simular valores do vetorηj a partir da Nd+1(Gjgj, Gj)
5 Repetir at´e que os crit´erios de convergˆencia sejam atingidos.
em queHi = (Σ−1θ +AtA)−1, hi= Σ−1θ µθ+Atvi+Atb Gj = (Σ−1η +XtX)−1 e gj = Σ−1η µη+Xtvj
comA uma matriz J×k e X a matrix N×(d+ 1)cuja i-´esima linha ´e(−1, θi).
Inferˆ encia Bayesiana com dimens˜ ao desconhecida
Considere kdesconhecido e portanto, um novo parˆametro a ser estimado.
Note que n˜ao podemos proceder de forma usual para estimar a distribui¸c˜ao a posteriori conjunta pois a quantidade de parˆametros a ser estimado depende do valor dek.
Cada valor de kdefine um modelo diferente.
O algoritmo RJMCMC permite simular de cadeias de Markov
”‘saltando”’ entre espa¸cos de estados de diferentes dimens˜oes.
O algoritmo RJMCMC dado por Green (1995) esta associado com o algoritmo de Carlin e Chib (1995) apresentado no contexto de sele¸c˜ao de modelos.
Sele¸c˜ ao de modelos usando MCMC
Considere os seguintes poss´ıveis modelos: M1, M2, . . . , MK. Para cada um dos modelos temos um vetor de parˆametros denotado por ηk de dimens˜aodk,l= 1, . . . , K.
Superparˆametro: η= (η1, η2, . . . , ηK).
Quantidades a serem estimadas: η eM (associada ao modelo).
Id´eia: Constuir uma CM para simular da distribui¸c˜ao `a posteriori de(η, M). A partir das amostras de MC da distribui¸c˜ao `a posteriorimarginal de M, calcular as probabilidade de M =k,k= 1, . . . , K.Escolher o modelo com maior probabilidade`a posteriori.
Sele¸c˜ ao de modelos em TRI: Nojosa (2010) - IME - USP .
Nosso algoritmo ´e baseado nos trabalhos de Lopes e West (2004) e na vers˜ao metropolizada do algoritmo de Carlin e Chib (1995).
Id´eia b´asica dos algoritmos de Metr´opolis:
fixa um valor inicial para o parˆametro;
simula um valor candidato de uma distribui¸c˜ao proposta q(.);
calcula uma probabilidade de aceita¸c˜aor;
simulau∼U nif(0,1).Seu < r aceita o valor simulado e move a cadeia para esse valor, se o valor n˜ao ´e aceito permanece no mesmo lugar.
Repete o processo at´e a convergˆencia.
Sele¸c˜ ao de modelos em TRI: Nojosa (2010) - IME - USP .
Algoritmo 2
1 Escolher um valor inicial para k, usar o Algoritmo 1 para obter valores iniciais para (θk, ηk).
2 Selecionar um valor candidato k∗ para ”‘saltar”’ a partir de uma distribui¸c˜ao p(k∗ |k) .
3 Condicionado a k∗, simular valores de ηk∗ a partir de uma proposta qk∗(ηk∗).
4 Calcular a probabilidade de aceita¸c˜ao
r =min
1,L(k∗, ηk∗)π(ηk∗ |k∗)π(k∗)qk(ηk)p(k|k∗) L(k, ηk)π(ηk|k)π(k)qk∗(η∗k)p(k∗ |k)
5 Se o ”‘salto”’ para o modelo k∗ for aceito, usamosp passos do algoritmo 1 para gerar novos valores dos parˆametros.
π(ηk|k) e π(k) s˜ao distribui¸c˜oes`a priori.
A distribui¸c˜ao proposta qk(ηk) considerada foi um produto de normais, com parˆametros estabelecidos a partir do uso do algoritmo 1.
A verossimilhan¸ca considerada na probabilidade de aceita¸c˜ao L(k, ηk)´e a marginal, obtida pela integra¸c˜ao em rela¸c˜ao ao tra¸co latente θ. Essa foi obtida aproximadamente como uso de m´etodos num´ericos de quadratura Gaussiana.
o uso da verossimilhan¸ca marginal ´e baseado em argumentos dado em Lord(1980): dimensionalidade ´e uma propriedade dos itens.
Estudo de simula¸c˜ ao
Foram considerados trˆes modelos: unidimensional, bidimensional e tridimensional, respectivamente,M1, M2, M3.
N´umero de itens =40 e Numero de respondentes= 1000.
N´umero de r´eplicas: 10
Tabela: Estimativas das probabilidades`a posteriori
Modelo gerado k=1 k=2 k=3
k=1 0.9628 0.0365 0.0007 k=2 0.0000 0.9884 0.0116 k=3 0.0000 0.0001 0.9999 Todos as r´eplicas indicaram o modelo correto.
Compara¸c˜ ao com outros crit´ erios de sele¸c˜ ao
Tabela: Sele¸c˜ao de modelo segundo crit´erios bayesianos Crit´erio modelo gerado k=1 k=2 k=3
EAIC k=1 10 0 0
k=2 0 10 0
k=3 0 0 10
EBIC k=1 10 0 0
k=2 10 0 0
k=3 10 0 0
DIC k=1 0 0 10
k=2 0 0 10
k=3 0 0 10
Compara¸c˜ ao com outros crit´ erios de sele¸c˜ ao
Tabela: Sele¸c˜ao de modelo segundo crit´erios cl´assicos Crit´erio modelo gerado k=1 k=2 k=3
∆G2 k=1 0 5 0
k=2 0 0 0
k=3 0 0 0
∆G2c k=1 0 10 0
k=2 0 9 0
Wilson et. al. (1991) k=3 0 0 0
ID= ∆Gg.l2c k=1 8 2 0
k=2 0 10 0
Laros et. al. (2000) k=3 0 0 1
Aplica¸c˜ ao ENEM
Objetivo: Analisar a dimensionalidade da prova do ENEM.
A prova objetiva do ENEM-2007 era constitu´ıda de 63 itens. As ordens das quest˜oes ou op¸c˜oes de respostas s˜ao alteradas formando 4 provas distintas: amarela, branca, rosa e verde.
Na nossa an´alise utilizamos uma amostra de 1500 indiv´ıduos selecionados aleatoriamente entre os indiv´ıduos submetidos a prova amarela.
Tabela: Estat´ısticas descritivas dos escores - prova amarela -.
Min q1 Md q3 Max
Popula¸c˜ao 0.0 25.0 32.4 40.0 63.0 Amostra 6.0 25.0 32.4 40.0 62.0
Aplica¸c˜ ao ENEM: conclus˜ oes
O modelo indicado foi o unidimensional com probabilidade 0.9998.
A conclus˜ao foi a mesma para os crit´erios EAIC, EBIC e ID.
Os crit´erios DIC e∆G2c indicaram o modelo tridimensional, e o crit´erio∆G2 uma dimens˜ao maior que trˆes.
A prova do ENEM ´e usualmente citada como uma exemplo de teste multidimensional. No entanto, isso n˜ao foi confirmado pela nossa an´alise.
A partir de 2009 o ENEM foi reformulado. Uma proposta interessante de trabalho ´e aplicar a metodologia para avaliar a dimensionalidade do novo ENEM.
Aplica¸c˜ ao ENEM: estimativas dos parˆ ametros
Tabela: Estimativas do modelo unidimensional - prova amarela
Parˆametro Min q1 Md q3 Max M´edia
Dificuldade -1.80 -0.85 -0.02 0.68 24.91 0.65 Discrimina¸c˜ao 0.04 0.45 0.56 0.72 1.07 0.57 Dificuldade(2) -1.80 -0.87 -0.05 0.65 5.91 0.26 Discrimina¸c˜ao(2) 0.11 0.45 0.57 0.73 1.07 0.58 Proficiˆencia -2.29 -0.65 -0.11 0.57 3.20 0.00
(2) sem o valor discrepante do item 51
Coment´ arios
O algoritmo tamb´em foi utilizado considerando tra¸cos latentes assim´etricos. Um estudo de simula¸c˜ao indicou que mesmo nessa situa¸c˜ao o algoritmo consegue identificar bem a dimens˜ao.
O algoritmo proposto ´e uma boa alternativa para solu¸c˜ao do problema de determina¸c˜ao da dimensionalidade.
O estudo de simula¸c˜ao indica que o EAIC tamb´em ´e uma alternativa para identifica¸c˜ao da dimensionalidade.
Sob a perspectiva cl´assica, o ID (Laros et. al., 2000) apresentou o melhor resultado para k <3.
Trabalhos Futuros
Os resultados sugerem um questionamento sobre a
dimensionalidade do ENEM. Trabalhos futuros neste dire¸c˜ao devem ser considerados.
O programa foi desenvolvido em C++ e o gerenciamento do processo foi destinado ao R. O programa deve ser otimizado para possibilitar o uso de banco de dados maiores e estima¸c˜ao de dimens˜oes maiores que trˆes.
Outros modelos multidimensionais deveriam ser considerados.
Referˆ encias principais
Nojosa, R. (2010). Inferˆencia bayesiana em modelos
multidimensionais da resposta ao item. Tese de doutorado - IME- USP.
Green, P. (1995). Reversible jump Markov chain Monte Carlo computation and Bayesian model determination.
Biometrika,82, 711-732.
Carlin, B.P. and Chib, S.(1995). Bayesian model choice via Markov chain Monte Carlo methods. JRSS- B, 57, 473-484.
Gamerman, D. and Lopes, H. (2006). Markov Chain Monte Carlo. Chapman and Hall/CRC.
Referˆ encias
Fox (2010). Bayesian Item Response Modeling. Springer.
Gelfand and Smith (1990). Sampling-based approaches to calculing marginal densities. JASA, 85, 398-409.
Laros, J.A., Pasquali, L. e Rodrigues, M. M. (2000). An´alise de unidimensionalidade das provas do SAEB. CPAE, Instituto de Psicologia-UnB.
Lopes, H. and West, M. (2004). Bayesian model assesment in factor analysis. Statistica Science, 14, 41-67.
Tanner, M. and Wong, W.(1987). The calculation of posterior distributions by data augmentation. JASA, 82, 528-550.