Teoria de Resposta ao Item: uma
abordagem generalizada das Curvas
Caracter´ısticas dos Itens
por
Vera L´
ucia Filgueira dos Santos
DME - IM - UFRJ
2009
Teoria de Resposta ao Item: uma
abordagem generalizada das Curvas
Caracter´ısticas dos Itens
Vera L´
ucia Filgueira dos Santos
Disserta¸c˜ao submetida ao Corpo Docente do Instituto de Matem´atica - Departamento
de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte
dos requisitos necess´arios `a obten¸c˜ao do grau de Mestre em Estat´ıstica.
Aprovada por:
Prof. Dani Gamerman PhD - IM - UFRJ - Orientador.
Prof. Tufi Machado Soares PhD - CAEd - UFJF - Co-orientador.
Prof. Fernando Antˆonio da Silva Moura
PhD - IM - UFRJ.
Prof. Joaquim Jos´e Soares Neto
PhD - CESPE - UnB.
Caio Lucidius Naberezny Azevedo Dr. Sc. - IME - USP (Suplente).
Rio de Janeiro, RJ - Brasil 2009
FICHA CATALOGR ´AFICA
Santos, Vera L´ucia Filgueira dos.
Teoria de Resposta ao Item: uma abordagem generalizada
das Curvas Caracter´ısticas dos Itens / Vera L´ucia Filgueira dos
Santos. – Rio de Janeiro: UFRJ/ IM - DME, 2009. xv, 87p.: il..; 31cm
Orientadores: Dani Gamerman e Tufi Machado Soares
Disserta¸c˜ao (mestrado) - Universidade Federal do Rio de Janeiro,
IM, DME, Programa de P´os-Gradua¸c˜ao em Estat´ıstica, 2009.
Referˆencias bibliogr´aficas: f. 85-87
1. Teoria de Resposta ao Item. 2. Estima¸c˜ao Bayesiana via
MCMC. 3. Assimetria. - Mestrado. I. Gamerman, Dani. II. Universidade Federal do Rio de Janeiro. III. T´ıtulo.
`
A minha querida e amada fam´ılia, pelo apoio incondicional,
mesmo estando a mais de 1.000km de distˆancia.
Ao Andr´e, por ser t˜ao compreensivo e amoroso.
“(...) Nunca deixe que lhe digam que n˜ao vale a pena acreditar no sonho que se tem, ou
que os seus planos nunca v˜ao dar certo, ou que vocˆe nunca vai ser algu´em. (...)”
Renato Russo
“Pedi, e dar-se-vos-´a; buscai, e encontrareis; batei, e abrir-se-vos-´a. Porque, aquele que
pede, recebe; e, o que busca, encontra; e, ao que bate, abrir-se-lhe-´a. E qual de entre v´os
´
e o homem que, pedindo-lhe p˜ao o seu filho, lhe dar´a uma pedra? E, pedindo-lhe peixe,
lhe dar´a uma serpente? Se v´os, pois, sendo maus, sabeis dar boas coisas aos vossos
filhos, quanto mais vosso Pai, que est´a nos c´eus, dar´a bens aos que lhe pedirem?”
Agradecimentos
Sou grata...
A Deus, pela sa´ude, for¸ca, coragem e persistˆencia a mim dadas, e pelo consolo nos
mo-mentos de saudade. `
A minha querida fam´ılia, pelo amor, pelo exemplo e pelos princ´ıpios que s˜ao parte da
minha essˆencia.
Ao meu Andr´e, por fazer os meus dias t˜ao mais alegres e me mostrar que nem s´o de
trabalho vive o ser humano. `
As minhas irm˜as de cora¸c˜ao e companheiras de rep´ublica, por todos os momentos de
descontra¸c˜ao e pela amizade verdadeira.
Aos meus amigos do DME, por serem a minha fam´ılia carioca e pelas tantas conversas
no hor´ario do almo¸co (seja para falar de casamento ou de inferˆencia Bayesiana).
Ao meu orientador Dani e ao meu co-orientador Tufi, por todos os ensinamentos passados
e pela oportunidade de trabalhar no tema dessa disserta¸c˜ao.
Aos professores Fernando e Neto, e ao Caio, por aceitarem fazer parte da minha banca. Novamente ao professor Neto, que desde o come¸co abriu muitas portas para o meu cresci-mento profissional.
`
A este programa de p´os-gradua¸c˜ao, pelo voto de confian¸ca.
Aos meus professores da UnB, que foram os primeiros a me incentivar. Ao CAEd - UFJF por ter cedido, gentilmente, os dados aqui tratados. Ao CNPq, por ter financiado este estudo.
Resumo
A Teoria de Resposta ao Item (TRI) para respostas dicotˆomicas considera, em geral,
um conjunto de J itens aplicados a I indiv´ıduos. Os modelos sim´etricos mais
utiliza-dos para descrever a probabilidade de resposta correta a tais itens, tamb´em conhecidos
como Curvas Caracter´ısticas dos Itens (CCI), s˜ao as distribui¸c˜oes Normal e Log´ıstica.
Esses modelos levam em conta os parˆametros dos itens (a discrimina¸c˜ao, a dificuldade
e a probabilidade de acerto ao acaso) e a habilidade ou tra¸co latente dos indiv´ıduos
para caracterizar tais probabilidades. Generaliza¸c˜oes desses modelos tˆem sido
encon-tradas na literatura, como por exemplo em Baz´an (2005) e em Samejima (2000). Ambas
generaliza¸c˜oes consideram que a probabilidade de acerto ao acaso ´e nula (modelo de dois
parˆametros) e incorporam um parˆametro de assimetria aos itens.
O objetivo aqui ´e apresentar o que foi proposto em ambos trabalhos, mas permitindo
que o parˆametro de acerto casual seja diferente de zero. Al´em disso, estudaremos formas
de detec¸c˜ao de assimetria atrav´es da especifica¸c˜ao de distribui¸c˜oes a priori apropriadas
para este fim. Estudos ser˜ao feitos considerando a generaliza¸c˜ao feita `a partir do que
´
e apresentado por Samejima (2000) utilizando metodologia Bayesiana e implementando
via m´etodos MCMC. Todos os estudos ser˜ao primeiramente `a luz de dados simulados e
em seguida considerando dados reais.
Palavras Chaves: Teoria de Resposta ao Item, Estima¸c˜ao Bayesiana via MCMC,
Abstract
The Item Response Theory (IRT) for dichotomous response considers, in general, a set of J items applied at I individuals. The symmetrical models often used to describe the probability of correct response to these items, also called Item Curve Characteristic (ICC), are the Normal and Logistic distributions. These models take into consideration the items parameters (the discrimination, the difficulty and the guessing parameter) and the ability of individuals to characterize these probabilities. Generalizations of these
models are found on literature, for example at Baz´an (2005) and Samejima (2000). Both
generalizations consider that the guessing parameter is null (two parameter model) and introduce a asymmetry parameter into items.
The objective here is to present what was proposed in both works, but allowing the guessing parameter to be different of zero. Also, we will study ways of asymmetry de-tecting through appropriate priors specification. Studies will be made considering the generalization from the Samejima (2000), using Bayesian methodology and implementing via MCMC methods. All studies first will be with simulated data, and later, with real data.
Sum´
ario
1 Introdu¸c˜ao 1
1.1 Teoria de Resposta ao Item . . . 2
1.2 Descri¸c˜ao dos dados reais . . . 5
1.3 An´alise dos dados reais via TRI convencional . . . 6
1.4 Sum´ario da disserta¸c˜ao . . . 10
1.5 Apˆendice . . . 10
2 Distribui¸c˜oes assim´etricas na TRI 12 2.1 Fam´ılia TRI log´ıstica assim´etrica . . . 13
2.2 Fam´ılia TRI normal assim´etrica . . . 14
2.3 Modelo proposto . . . 16
2.4 Inferˆencia Bayesiana . . . 17
2.5 M´etodo MCMC para fazer inferˆencia na TRI . . . 19
2.6 Avalia¸c˜ao de convergˆencia e an´alise de ajuste . . . 23
2.7 Apˆendice . . . 25
2.7.1 Express˜oes quando a CCI ´e dada por (1.1) - modelos sim´etricos de trˆes parˆametros . . . 25
2.7.2 Express˜oes quando a CCI ´e dada por (2.6) - modelos assim´etricos de trˆes parˆametros propostos . . . 26
3 Estudos simulados com modelos assim´etricos 28 3.1 Escolha das distribui¸c˜oes a priori . . . 29
3.3 Resultados do estudo simulado com o modelo de dois parˆametros assim´etrico 36
3.4 Apˆendice . . . 39
4 An´alise dos dados reais com modelos assim´etricos 41 4.1 Resultados do estudo com o modelo assim´etrico de trˆes parˆametros . . . 41
4.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 44
4.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 47
4.4 Apˆendice . . . 48
5 Distribui¸c˜oes assim´etricas na TRI com detec¸c˜ao de assimetria 51 5.1 Modelo proposto . . . 51
5.2 Inferˆencia Bayesiana . . . 52
5.3 M´etodo MCMC para fazer inferˆencia na TRI . . . 53
5.4 Apˆendice . . . 55
6 Estudos simulados com modelos assim´etricos incluindo detec¸c˜ao de as-simetria 57 6.1 Compara¸c˜ao entre os m´etodos de amostragem . . . 59
6.2 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-sim´etrico de trˆes parˆametros . . . 63
6.3 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-sim´etrico de dois parˆametros . . . 66
6.4 Apˆendice . . . 69
7 An´alise dos dados reais com modelos assim´etricos incluindo detec¸c˜ao de assimetria 74 7.1 Resultados do estudo com o modelo assim´etrico de trˆes parˆametros . . . 75
7.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 78
7.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 81
8 Conclus˜oes e trabalhos futuros 82
Lista de Tabelas
1.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres . 8
2.1 Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao
dos parˆametros . . . 22
3.1 Resultados das medidas utilizadas para a escolha das distribui¸c˜oes a priori
- Cen´ario 1 versus Cen´ario 2 . . . 31
4.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres
considerando o modelo assim´etrico de trˆes parˆametros . . . 43
4.2 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres
considerando o modelo assim´etrico de dois parˆametros . . . 46
6.1 M´edia a posteriori dos parˆametros π para alguns itens com diferentes
ta-manhos de amostra para os dois algoritmos . . . 61
7.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres
considerando o modelo assim´etrico de trˆes parˆametros via algoritmo 2 . . 78
7.2 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres
Lista de Figuras
1.1 CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2 . . . 4
1.2 Propor¸c˜ao de acerto dos itens do projeto Geres . . . 6
1.3 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
projeto Geres e respectivos intervalos de credibilidade de 95% . . . 7
1.4 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do
projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada . . . 9
2.1 CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d . . . 14
3.1 Valores reais versus estimados dos parˆametros dos itens considerando os
cen´arios 1 e 2. O ponto representa o cen´ario 1 e o “x”, o cen´ario 2 . . . 32
3.2 Trajet´oria da log-posteriori das 2 cadeias geradas . . . 34
3.3 Valores reais e estimativas dos parˆametros dos itens com seus respectivos
intervalos de credibilidade de 95%. O ponto representa o valor estimado e
a linha horizontal dentro do intervalo, o valor real . . . 35
3.4 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de
da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e
valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos 35
3.5 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de dois parˆametros . . . 37
3.6 Valores reais e estimativas dos parˆametros dos itens com seus respectivos
intervalos de credibilidade de 95% considerando o modelo assim´etrico de
dois parˆametros. O ponto representa o valor estimado e a linha horizontal
3.7 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de
da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e
valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos,
considerando o modelo assim´etrico de dois parˆametros . . . 38
4.1 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de trˆes parˆametros para os dados do projeto Geres . . . 42
4.2 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
projeto Geres e respectivos intervalos de credibilidade de 95% considerando
o modelo assim´etrico de trˆes parˆametros . . . 43
4.3 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes
do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada
considerando o modelo assim´etrico de trˆes parˆametros . . . 44
4.4 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de dois parˆametros para os dados do projeto Geres . . . 45
4.5 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
projeto Geres e respectivos intervalos de credibilidade de 95% considerando
o modelo assim´etrico de dois parˆametros . . . 46
4.6 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes
do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada
considerando o modelo assim´etrico de dois parˆametros . . . 47
6.1 Densidades das distribui¸c˜oes Beta(0.01, 0.01) e Beta(2, 2) . . . 58
6.2 Valores reais e estimativas dos parˆametros dos itens com seus respectivos
intervalos de credibilidade de 95% considerando os algoritmos 1 e 2. O ponto representa o valor estimado e a linha horizontal dentro do intervalo,
o valor real . . . 60
6.3 Estimativas pontuais (m´edias a posteriori) dos π para os dois algoritmos.
O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 60
6.4 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
6.5 Valores reais e estimativas dos parˆametros dos itens com seus respectivos intervalos de credibilidade de 95% obtidos via algoritmo 2. O ponto rep-resenta o valor estimado e a linha horizontal dentro do intervalo, o valor
real . . . 64
6.6 Estimativas pontuais (m´edias a posteriori) dos π para o algoritmo
escol-hido. O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos 65
6.7 Histograma das proficiˆencias estimadas sobre a curva da densidade da
dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,
con-siderando o modelo asim´etrico de trˆes parˆametros e o algoritmo 2 . . . . 65
6.8 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de dois parˆametros via algoritmo 2 . . . 67
6.9 Valores reais e estimativas dos parˆametros dos itens com seus respectivos
intervalos de credibilidade de 95% e m´edia a posteriori dos parˆametros π
via algoritmo 2. No gr´afico de a, b e d, o ponto representa o valor estimado
e a linha horizontal dentro do intervalo, o valor real. No gr´afico dos π’s,
o ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 67
6.10 Histograma das proficiˆencias estimadas sobre a curva da densidade da
dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,
con-siderando o modelo assim´etrico de trˆes parˆametros e o algoritmo 2 . . . 68
7.1 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de trˆes parˆametros para os dados do projeto Geres, via
algo-ritmo 2 . . . 75
7.2 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
projeto Geres e respectivos intervalos de credibilidade de 95% considerando
o modelo assim´etrico de trˆes parˆametros via algoritmo 2 . . . 76
7.3 Estimativas pontuais (m´edias a posteriori) dos π . . . 76
7.4 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes
do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada
7.5 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo
assim´etrico de dois parˆametros para os dados do projeto Geres, via
algo-ritmo 2 . . . 78
7.6 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
projeto Geres e respectivos intervalos de credibilidade de 95% considerando
o modelo assim´etrico de dois parˆametros via algoritmo 2, e m´edia a
pos-teriori dos parˆametros π . . . 79
7.7 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes
do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada
Cap´ıtulo 1
Introdu¸
c˜
ao
A psicometria ´e um conjunto de t´ecnicas cujo objetivo ´e mensurar as habilidades
cognitivas dos indiv´ıduos expressas por meio do comportamento humano, sendo uma das
principais t´ecnicas a Teoria de Resposta ao Item (TRI) que, embora utilizada em diversas
´
areas, destaca-se especialmente em processos de avalia¸c˜ao educacional em larga escala.
A TRI ´e usada para analisar dados provenientes de respostas a itens presentes em
instrumentos avaliativos de desempenho, question´arios, entre outros, e sugere formas
de representar a probabilidade de um indiv´ıduo dar uma determinada resposta a um
item levando em conta os seus tra¸cos latentes, proficiˆencias ou habilidades e algumas
caracter´ısticas do item. Tradicionalmente, essa rela¸c˜ao ´e modelada atrav´es de fun¸c˜oes de
liga¸c˜ao sim´etricas, tais como as liga¸c˜oes probito e logito. Tal rela¸c˜ao ´e conhecida como
Curva Caracter´ıstica do Item (CCI).
Mas `a medida que a aplica¸c˜ao da TRI cresce, surgem algumas quest˜oes que devem ser
levadas em conta para o aprimoramento da t´ecnica. Uma dessas quest˜oes ´e se as fun¸c˜oes
de liga¸c˜ao sim´etricas utilizadas para a CCI s˜ao adequadas. Como indicado por Samejima
(1997), CCI’s assim´etricas podem ser mais apropriadas para modelar comportamento
humano. Sendo assim, o objetivo desse trabalho ´e apresentar o que foi proposto por
Samejima (2000) e por Baz´an (2005) e algumas generaliza¸c˜oes, de modo a permitir formas
mais gerais para a CCI.
A seguir, uma breve revis˜ao acerca da Teoria de Resposta ao Item ´e apresentada.
descrito. Na se¸c˜ao seguinte, esse conjunto de dados ser´a analisado via TRI convencional.
E finalmente, na se¸c˜ao 1.4, um sum´ario do trabalho ´e apresentado.
1.1
Teoria de Resposta ao Item
Segundo Baker (1992), os trabalhos de Lawlel (1943) e Lord (1952) s˜ao o marco inicial
dos estudos relacionados `a Teoria de Resposta ao Item. Essa prop˜oe modelos param´etricos
para representar a probabilidade pij(η) de um indiv´ıduo i responder corretamente a um
item j como fun¸c˜ao de parˆametros η, que contemplam parˆametros do item (a saber:
discrimina¸c˜ao, dificuldade e acerto casual) e habilidade ou proficiˆencia do indiv´ıduo i, ui,
i = 1, . . . , I e j = 1, . . . , J .
Esses modelos, por sua vez, dependem da natureza dos itens, isto ´e, se eles s˜ao
dicotˆomicos (corrigidos como certo ou errado) ou n˜ao dicotˆomicos (itens de resposta
livre ou itens de m´ultipla escolha avaliados de forma graduada), da quantidade de tra¸cos
latentes ou habilidades que est˜ao sendo medidas (apenas uma ou mais de uma) e do
n´umero de popula¸c˜oes envolvidas (apenas uma ou mais de uma). Aqui, ser˜ao considerados
apenas aqueles que tratam os itens de forma dicotˆomica, que avaliam apenas um tra¸co
latente (os chamados modelos unidimensionais) e em uma ´unica popula¸c˜ao. Al´em disso,
sup˜oe-se que as respostas oriundas de indiv´ıduos diferentes s˜ao independentes e que os
itens s˜ao respondidos de forma independente por cada indiv´ıduo, fixada sua habilidade
(suposi¸c˜ao conhecida como Independˆencia Local).
Dentro dessa classe, um modelo bastante utilizado ´e conhecido como modelo de trˆes
parˆametros pois envolve a discrimina¸c˜ao, a dificuldade e o acerto casual do item, al´em
da proficiˆencia do indiv´ıduo.
A express˜ao geral para a probabilidade de resposta correta ´e dada por
pij(η) = P (Yij = 1|η) = cj+ (1 − cj)F (∆ij), (1.1)
onde Yij ´e o indicador de acerto do item j pelo indiv´ıduo i, η = {β, u}, β = {a, b, c}
correspondendo aos parˆametros de discrimina¸c˜ao, de dificuldade e de acerto ao acaso,
fun¸c˜ao de distribui¸c˜ao acumulada qualquer, e ∆ij = aj(ui − bj) ´e uma fun¸c˜ao linear de
ui, com ui sendo o valor correspondente `a vari´avel latente Ui, que descreve a habilidade
do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .
Em Baker (1992) encontram-se os casos mais comuns para a distribui¸c˜ao F (.), que
s˜ao F (.) = Φ(.) ou F (.) = Ψ(.), onde Φ(.) ´e a fun¸c˜ao de distribui¸c˜ao acumulada (fda) de
uma distribui¸c˜ao normal padr˜ao, e Ψ ´e a fda de uma distribui¸c˜ao log´ıstica padr˜ao, que ´e
definida como Ψ(t) = 1+exp{−t}1 , t ∈ R. O primeiro caso ´e conhecido como modelo normal
de trˆes parˆametros, e quando F (.) = Ψ(.), tem-se o modelo log´ıstico de trˆes parˆametros.
Em geral, D, que representa um fator de escala, ´e igual a 1. Uma rela¸c˜ao importante
entre as fda log´ıstica e normal ´e dada por
|Ψ(D∆ij) − Φ(∆ij)| < 0.01, −∞ < ui < ∞,
onde D deve ser igual a 1.702 para que a rela¸c˜ao acima permita aproximar o modelo
normal pelo log´ıstico (Baker, 1992).
No contexto de modelos lineares generalizados, a representa¸c˜ao dada em (1.1) utiliza
uma fun¸c˜ao de liga¸c˜ao F−1, sendo Φ−1 conhecida como fun¸c˜ao de liga¸c˜ao probito e Ψ−1
como a fun¸c˜ao de liga¸c˜ao logito.
Outros modelos podem ser obtidos a partir dos que foram apresentados. Por exemplo,
se se assume que o parˆametro relacionado ao acerto casual ´e nulo em todos os itens,
obt´em-se o modelo conhecido como modelo de dois parˆametros; j´a quando o valor do
parˆametro de discrimina¸c˜ao aj ´e o mesmo para todos os itens, al´em dos parˆametros cj
nulos ∀j, o modelo de um parˆametro ´e obtido.
No que diz respeito `a interpreta¸c˜ao de cada um dos parˆametros dos itens, essa pode
ser feita com o aux´ılio da figura 1.1. Ela ilustra o fato que os modelos descritos at´e aqui
levam em conta que indiv´ıduos com maior habilidade possuem maior probabilidade de
acertar o item e que esta rela¸c˜ao ´e n˜ao linear, tendo a forma de “S”. O parˆametro b ´e
medido na mesma unidade da habilidade u e quanto maior o valor de b, mais dif´ıcil ser´a o
item. Ele pode ser visto como a habilidade necess´aria para que a probabilidade de acerto
do item j seja (1 + cj)/2.
proba-Figura 1.1: CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2
bilidade de um aluno com baixa habilidade responder corretamente o item, ou seja, lim
ui→−∞
pij(η) = cj. Assim, o parˆametro c pode ser visto como a ass´ıntota inferior da CCI.
Se um item de m´ultipla escolha ´e constru´ıdo de tal forma que as alternativas incorretas
(distratores) funcionem muito bem, ou seja, se os distratores cumprem o seu papel de
trazer informa¸c˜ao ao avaliador a respeito da manifesta¸c˜ao do racioc´ınio do aluno quando
busca a solu¸c˜ao para a tarefa imposta pelo item, mas sem chamar mais aten¸c˜ao do que
a resposta correta, provavelmente o parˆametro c estar´a em torno do inverso do n´umero
de alternativas. Todavia, na pr´atica, observam-se valores desde pr´oximos de zero at´e
pr´oximos a 0.5, raramente ultrapassando esse valor.
J´a o parˆametro a ´e proporcional `a derivada da tangente da curva no ponto de
in-flex˜ao. Dessa forma, itens com a negativo n˜ao s˜ao esperados sob esses modelos, uma
vez que indicariam que a probabilidade de responder corretamente o item diminui com
o aumento da habilidade. Baixos valores de a indicam que a quest˜ao tem pouco poder
de discrimina¸c˜ao (alunos com habilidades bastante diferentes tˆem aproximadamente a
mesma probabilidade de responder corretamente o item). Segundo Baker (2001),
con-siderando a representa¸c˜ao com o modelo logito, itens cujos parˆametros de discrimina¸c˜ao
est˜ao entre 0.01 e 0.34 s˜ao classificados como itens de discrimina¸c˜ao muito baixa ; entre
0.35 e 0.64, de baixa discrimina¸c˜ao; entre 0.65 e 1.34, de discrimina¸c˜ao moderada; entre
1.35 e 1.69, de discrimina¸c˜ao alta, e maior que 1.70, de discrimina¸c˜ao muito alta. Para
valores pelo fator de escala D = 1.702.
Um ponto importante a ser mencionado ´e que o modelo (1.1) ´e n˜ao identific´avel, pois
qualquer transforma¸c˜ao do tipo u∗ = (ku + γ), b∗ = (kb + γ) e a∗ = ak, para k > 0
e γ ∈ R, n˜ao altera a probabilidade representada pelo modelo. E uma das maneiras
mais comuns para tornar o modelo identific´avel ´e fixar uma distribui¸c˜ao a priori pr´opria
para as proficiˆencias. Em geral adota-se a distribui¸c˜ao normal padronizada, o que ´e feito
nesta disserta¸c˜ao, definindo dessa forma a escala com m´edia 0 e desvio-padr˜ao 1 para as
habilidades.
1.2
Descri¸
c˜
ao dos dados reais
O conjunto de dados reais que ser´a utilizado ao longo desta disserta¸c˜ao ´e do Projeto
Geres, que ´e um projeto de pesquisa que focaliza a aprendizagem nas primeiras fases
do Ensino Fundamental, levando em conta os fatores escolares e s´ocio-familiares que
incidem sobre o desempenho escolar, al´em de outras dimens˜oes, como a auto-estima e a
motiva¸c˜ao, que podem afetar o desenvolvimento dos alunos.
Durante um per´ıodo de quatro anos, de 2005 a 2008, aproximadamente 27000 alunos de cinco cidades brasileiras, de uma amostra de 309 escolas estaduais, municipais e
pri-vadas, foram testados todo ano em L´ıngua Portuguesa e Matem´atica, enquanto os
profes-sores, diretores de escola, pais e os pr´oprios alunos foram entrevistados para determinar
os impactos na aprendizagem dos fatores escolares e familiares. Os fatores incorporados
a esta pesquisa foram escolhidos mediante uma revis˜ao extensa da literatura nacional e
internacional, com um interesse especial para aquelas caracter´ısticas indicadas como de
relevˆancia no contexto brasileiro, sobretudo os recursos da escola, a organiza¸c˜ao e gest˜ao
da escola, o clima acadˆemico, a forma¸c˜ao e sal´ario do professor e a pedagogia de sala de
aula. A escolha destes fatores tamb´em se deve ao interesse dos pesquisadores em oferecer
subs´ıdios pr´aticos para a formula¸c˜ao de pol´ıticas voltadas para a melhoria da qualidade
e da equidade da educa¸c˜ao no Brasil1.
1Texto adaptado do site http://www.geres.ufmg.br/paginas/?s=geres&p=oquee.php, acessado em 09
Os dados utilizados consistem em um teste de L´ıngua Portuguesa com 24 itens e
que foram respondidos por 6749 alunos do 3o ano do Ensino Fundamental das cidades
Rio de Janeiro, Salvador, Belo Horizonte, Campinas e Campo Grande em 2006, e que
foram cedidos pelo CAEd (Centro de Pol´ıticas P´ublicas e Avalia¸c˜ao da Educa¸c˜ao), da
Universidade Federal de Juiz de Fora. Entre esse conjunto de alunos, foram considerados
apenas aqueles que n˜ao apresentavam dados faltantes, ou seja, que responderam a todos
os itens, o que reduziu a amostra para 6320. Os itens eram de m´ultipla escolha com
quatro alternativas, entre as quais uma delas estava correta.
1.3
An´
alise dos dados reais via TRI convencional
A figura 1.2 apresenta as propor¸c˜oes de acerto de cada um dos itens do teste.
Observa-se que o item menos acertado foi o item 7, cujo percentual de acerto foi de
aproximada-mente 30.71%; por outro lado, as quest˜oes mais acertadas foram a 1 e a 3, com percentuais
de acerto de 97.78% e 97.83% respectivamente. Vinte itens foram acertados por mais de 50% dos participantes. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Proporção de acerto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0
Figura 1.2: Propor¸c˜ao de acerto dos itens do projeto Geres
Quanto aos alunos, 96 deles acertaram todas as quest˜oes da prova, enquanto apenas
1 aluno acertou uma ´unica quest˜ao. O escore bruto m´edio foi 16.81 e desvio-padr˜ao 3.88.
A metodologia apresentada nas se¸c˜oes 2.4 e 2.5 foi utilizada para se fazer inferˆencia
sobre o modelo de trˆes parˆametros (1.1) tal que F (.) = Ψ(.), ou seja, considerando-se a
fun¸c˜ao de liga¸c˜ao logito. Os hiperparˆametros de cada uma das prioris s˜ao
µaj = 0, σ
2
aj = 0.5, µbj = 0, σ
2
bj = 1, αcj = 5, βcj = 17, ∀ j = 1, . . . , 24,
e distribui¸c˜ao normal padronizada para as proficiˆencias. Al´em disso, considerou-se o fator
de escala D igual a 1, ou seja, os parˆametros est˜ao sendo obtidos na escala do modelo
logito. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0 1 2 3 4 Item Parâmetro a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 −4 −2 0 2 4 Item Parâmetro b 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 −4 −2 0 2 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Parâmetro c 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0
Figura 1.3: Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do
pro-jeto Geres e respectivos intervalos de credibilidade de 95%
As estimativas dos parˆametros dos itens e seus respectivos intervalos de credibilidade
de 95% est˜ao apresentados na figura 1.3. Considerando a classifica¸c˜ao apresentada na
se¸c˜ao anterior a respeito dos parˆametros de discrimina¸c˜ao, percebe-se que um item ´e
clas-sificado como de baixa discrimina¸c˜ao, onze apresentaram discrimina¸c˜ao moderada, oito
discrimina¸c˜ao alta, e quatro discrimina¸c˜ao muito alta. Os itens que apresentaram maior
variˆancia a posteriori nesse parˆametro foram o 21, o 23 e o 24. Quanto aos parˆametros de
valores no parˆametro b. Esse fato concorda com o que foi comentado anteriormente, visto
que o percentual de acerto dessas quest˜oes foi bastante elevado. Por outro lado, os itens
7, 23 e 24 foram os itens mais dif´ıceis do teste. A quest˜ao cujo parˆametro b apresentou
maior intervalo de credibilidade foi a de n´umero 6. Em rela¸c˜ao ao parˆametro de acerto
ao acaso, a figura indica que o item 6 apresentou a maior estimativa pontual para esse
parˆametro, enquanto os de n´umero 7, 10 e 17 s˜ao os que obtiveram as menores. Entre
esses quatro itens, apenas o intervalo do item 6 contempla o valor 0.25, que ´e o valor no
qual se espera que esse parˆametro esteja quando um item tem 4 alternativas e assumindo
que os seus distratores funcionam bem.
Com rela¸c˜ao `as proficiˆencias dos alunos, foram obtidas estimativas pontuais e
inter-valares para apenas dois deles, apresentadas na tabela 1.1. Posteriormente, ser´a
expli-cado o motivo pelo qual n˜ao ´e poss´ıvel obter ambas estimativas para todos os indiv´ıduos.
Observa-se que os dois alunos apresentaram proficiˆencias estimadas abaixo da m´edia 0,
embora seus respectivos intervalos contemplem esse valor.
Tabela 1.1: Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de
credibili-dade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres
Aluno M´edia a posteriori Intervalo de Credibilidade de 95%
3387 −0.530 (−1.377 , 0.293)
4158 −0.122 (−1.061 , 0.757)
A figura 1.4 apresenta o histograma das proficiˆencias estimadas sobre a densidade
da distribui¸c˜ao normal padronizada. Aparentemente, a distribui¸c˜ao utilizada para as
proficiˆencias ´e adequada, j´a que o histograma se aproxima bastante da curva dessa
den-sidade.
Foram obtidas ainda as propor¸c˜oes de acerto dos itens do teste, levando em conta
o escore dos alunos. Tais propor¸c˜oes est˜ao dispostas nos gr´aficos que se encontram no
apˆendice do cap´ıtulo. Observando tais gr´aficos, nota-se que, empiricamente, as curvas
de alguns itens se distanciam do formato de “S” que se espera de uma CCI, como por exemplo, dos itens 6 e 7. Nestes casos, a maneira como a probabilidade de resposta
Proficiência Densidade −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 0.5
Figura 1.4: Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do
projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada
correta se aproxima de zero ´e diferente de como se aproxima de um, sendo que, para o
item 6, as propor¸c˜oes de acerto daqueles indiv´ıduos com escores baixos j´a s˜ao bastante
elevadas, enquanto que para o item 7, as propor¸c˜oes de acerto s´o tendem a aumentar
a partir do escore 14. Estes comportamentos poderiam levar `a alguns questionamentos:
uma CCI sim´etrica ´e, de fato, conveniente? Ser´a que uma CCI assim´etrica n˜ao poderia
ajustar melhor os dados?
Sob essa perspectiva, os resultados obtidos podem n˜ao ser ´uteis para fazer inferˆencia,
uma vez que, devido a poss´ıvel assimetria, as estimativas das proficiˆencias e dos parˆametros
dos itens n˜ao seriam confi´aveis. Sendo assim, o objetivo principal desta disserta¸c˜ao ´e
pro-por modelos que permitam um parˆametro de assimetria para cada item e,
consequente-mente, formas mais gerais para as CCI’s, e que sejam capazes de estimar conjuntamente
1.4
Sum´
ario da disserta¸
c˜
ao
Neste cap´ıtulo, foi feita uma revis˜ao acerca dos modelos mais usuais da TRI e
apre-sentado o objetivo principal desta disserta¸c˜ao. No cap´ıtulo 2, as propostas feitas por
Samejima (2000) e Baz´an (2005) que resultam em CCI’s mais gerais s˜ao brevemente
des-critas; al´em disso, o modelo proposto ´e apresentado, bem como a metodologia utilizada
para se fazer inferˆencia Bayesiana. Algumas medidas que ser˜ao utilizadas para avalia¸c˜ao
do ajuste dos modelos tamb´em s˜ao apresentadas nesse cap´ıtulo.
No cap´ıtulo 3, s˜ao feitos estudos simulados com modelos assim´etricos, incluindo o
caso geral proposto e o caso em que o parˆametro c ´e igual a zero, bem como algumas
an´alises com diferentes conjuntos de prioris e avalia¸c˜ao de convergˆencia.
No cap´ıtulo 4, o conjunto de dados do projeto Geres ´e analisado utilizando os modelos
assim´etricos estudados no cap´ıtulo 3.
J´a no cap´ıtulo 5, um modelo da TRI que incorpora a detec¸c˜ao de assimetria ´e proposto,
onde o processo para se fazer inferˆencia Bayesiana tamb´em ´e descrito. Estudos simulados
utilizando esse modelo est˜ao no cap´ıtulo 6.
No cap´ıtulo 7, os dados do projeto Geres s˜ao novamente analisados, mas agora via
modelos abordados no cap´ıtulo 5.
Por fim, no cap´ıtulo 8, est˜ao as conclus˜oes e propostas para trabalhos futuros.
1.5
Apˆ
endice
Cap´ıtulo 2
Distribui¸
c˜
oes assim´
etricas na TRI
Os modelos da TRI apresentados no cap´ıtulo 1 consideram fun¸c˜oes de liga¸c˜ao sim´
etri-cas (logito e probito) que, consequentemente, provˆem CCI’s sim´etricas para descrever as
probabilidades de resposta aos itens. Mas como enfatizam Chen et al. (1999), essas
fun¸c˜oes de liga¸c˜ao sim´etricas nem sempre fornecem bons ajustes, especialmente quando
a probabilidade de uma dada resposta se aproxima de 0 de forma diferente de como se
aproxima de 1. A ado¸c˜ao de uma fun¸c˜ao de liga¸c˜ao sim´etrica levaria a vi´es nas estimativas
m´edias das respostas.
Sendo assim, as propostas feitas por Samejima (2000) e Baz´an (2005) est˜ao
apresen-tadas a seguir. Tais propostas resultam em CCI’s assim´etricas e s˜ao conhecidas como
fam´ılia log´ıstica de expoente positivo (FLEP) e fam´ılia TRI normal assim´etrica
(TRI-NA), respectivamente. Na se¸c˜ao 2.3 o modelo proposto ser´a descrito, e
posterior-mente, a metodologia para se fazer inferˆencia por meio de uma abordagem Bayesiana. Na
se¸c˜ao 2.5 apresentam-se os m´etodos MCMC, e as express˜oes matem´aticas utilizadas para
a implementa¸c˜ao desses m´etodos encontram-se no apˆendice do cap´ıtulo. Neste cap´ıtulo, o
parˆametro de assimetria de todos os itens, e em todos os modelos, ´e estimado e, por meio
da avalia¸c˜ao da sua estimativa intervalar, se conclui quais deles possuem comportamento
2.1
Fam´ılia TRI log´ıstica assim´
etrica
A fam´ılia de modelos proposta por Samejima (2000), chamada fam´ılia log´ıstica
de expoente positivo (FLEP), provˆem CCI’s assim´etricas e inclui o modelo log´ıstico
sim´etrico de dois parˆametros (aquele que leva em conta a discrimina¸c˜ao e a dificuldade
do item, al´em da proficiˆencia do indiv´ıduo) como um caso particular. Uma das raz˜oes
apresentadas para o uso dessa fam´ılia ´e que ela pode ser mais apropriada para modelar
comportamento humano.
No caso de se ter o modelo log´ıstico de dois parˆametros, a CCI ´e dada por
pij(η) = Ψ(D∆ij), (2.1)
para i = 1, . . . , I e j = 1, . . . , J , η = {a, b, u} e todos os demais termos conforme definidos
no cap´ıtulo 1. Segundo o que j´a foi dito, D ´e um fator de escala que ser´a 1.702 quando
se desejar aproximar o modelo normal pelo log´ıstico; caso contr´ario, D = 1.
A fam´ılia proposta por Samejima (2000) descreve a probabilidade de um indiv´ıduo i responder corretamente a um item j como
pij(η) = [Ψ(D∆ij)]dj, (2.2)
para i = 1, . . . , I, j = 1, . . . , J , com η = {a, b, d, u} e dj > 0 sendo o parˆametro de
assimetria associado ao j-´esimo item. Quando dj = 1, (2.2) equivale ao modelo log´ıstico
de dois parˆametros.
O parˆametro dj se relaciona `a complexidade do item j. Um item ´e dito complexo
se requer muitos passos para ser resolvido. Espera-se que a probabilidade de resolver um
item complexo diminua quando o n´umero de passos ou etapas aumenta, dada a
habili-dade do indiv´ıduo. Samejima (2000) argumenta que, levando em conta a complexihabili-dade dos itens, pode ser mais apropriado assumir que a probabilidade de resposta tem um
comportamento assim´etrico.
A figura 2.1 mostra algumas CCI’s considerando a equa¸c˜ao (2.2) com os parˆametros de
dificuldade e discrimina¸c˜ao fixos, e diferentes valores para o parˆametro d. Esse parˆametro
bem como penalizar itens f´aceis e que n˜ao foram resolvidos corretamente (0 < d < 1). O
modelo sim´etrico pode ser considerado como a transi¸c˜ao entre esses dois princ´ıpios.
−6 −4 −2 0 2 4 6 0.0 0.2 0.4 0.6 0.8 1.0 ui Pij (( ηη )) d = 0.3 d = 0.5 d = 0.8 d = 1 d = 1.5 d = 2 d = 3
Figura 2.1: CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d
2.2
Fam´ılia TRI normal assim´
etrica
Diferente de Samejima (2000), a proposta feita em Baz´an (2005) n˜ao ´e derivada
da teoria psicol´ogica. A nova fam´ılia de modelos introduzida, chamada fam´ılia TRI
normal assim´etrica (TRI-NA), ´e uma extens˜ao do modelo probito de dois parˆametros
e considera: a) uma fun¸c˜ao de liga¸c˜ao normal assim´etrica na modelagem da probabilidade
de resposta correta pij(η), e/ou b) a distribui¸c˜ao das proficiˆencias dos indiv´ıduos sendo
normal assim´etrica.
Para descrever essa fam´ılia faz-se necess´ario mencionar a defini¸c˜ao de uma distribui¸c˜ao
as-sim´etrica com parˆametro de loca¸c˜ao µ, parˆametro de escala σ2 e parˆametro de assimetria d se sua densidade puder ser escrita como
fX(x) = φSN(x; µ, σ2, d) = 2 σφ x − µ σ Φ dx − µ σ , (2.3)
com a nota¸c˜ao X ∼ SN (µ, σ2, d), onde φ(.) e Φ(.) s˜ao, respectivamente, a densidade e a
fun¸c˜ao de distribui¸c˜ao acumulada de uma distribui¸c˜ao normal padr˜ao (SN significa skew
normal ). J´a a fun¸c˜ao de distribui¸c˜ao acumulada dessa vari´avel X ´e dada por
ΦSN(x; µ, σ2, d) = 2Φ2 x 0 ; µ 0 , σ2 −δ −δ 1 , (2.4)
onde Φ2(µ, Σ, d) denota a fun¸c˜ao de distribui¸c˜ao acumulada de uma distribui¸c˜ao normal
bivariada com vetor m´edia µ, matriz de variˆancia Σ e coeficiente de correla¸c˜ao −δ, onde
δ = (1+dd2)1/2. No caso de se supor X com distribui¸c˜ao normal padr˜ao assim´etrica (µ = 0
e σ2 = 1), a nota¸c˜ao ser´a da forma X ∼ SN (d).
Ent˜ao, se uma fun¸c˜ao de liga¸c˜ao normal padr˜ao assim´etrica for considerada na
mo-delagem da probabilidade de resposta correta aos itens, a CCI resultante ser´a
pij(η) = ΦSN(∆ij; dj) (2.5)
onde η = {a, b, d, u}, ∆ij = aj(ui − bj) e dj o parˆametro de assimetria associado ao
item j, para i = 1, . . . , I e j = 1, . . . , J . Quando dj = 0, a equa¸c˜ao (2.5) se resume ao
modelo probito de dois parˆametros. dj pode ser visto como um parˆametro de penaliza¸c˜ao:
quando dj > 0, a probabilidade de resposta correta ´e penalizada para baixos valores da
habilidade; j´a quando dj < 0, a probabilidade de resposta correta ao item j ´e penalizada
para altos valores da habilidade.
Por outro lado, pode-se assumir que a proficiˆencia dos indiv´ıduos tem uma distribui¸c˜ao
normal assim´etrica, isto ´e, ui ∼ SN (µu, σu2, d), ∀ i. Uma justificativa apresentada por
Baz´an (2005) para considerar essa distribui¸c˜ao assim´etrica para as proficiˆencias ´e que
uma distribui¸c˜ao normal sim´etrica ´e muito restritiva para modelar conduta humana.
Dessa forma, a combina¸c˜ao destes dois pontos resulta no caso mais geral proposto por
Baz´an (2005): um modelo obtido a partir de uma fun¸c˜ao de liga¸c˜ao normal assim´etrica em
2.3
Modelo proposto
Levando em conta os modelos assim´etricos apresentados, uma generaliza¸c˜ao poss´ıvel
seria incorporar o parˆametro de acerto casual a tais modelos; e essa ´e uma das propostas
deste trabalho.
De forma geral, seja F (∆ij; dj) a fun¸c˜ao de liga¸c˜ao assim´etrica que descreve
deter-minada CCI, tal que F (∆ij; dj) = [Ψ(D∆ij)]
dj
no caso de se considerar a abordagem
feita por Samejima (2000), e F (∆ij; dj) = ΦSN(∆ij; dj) quando se considera a fun¸c˜ao de
liga¸c˜ao normal assim´etrica. Dessa forma, incorporando o parˆametro de acerto ao acaso,
o modelo proposto ser´a da forma
pij(η) = cj + (1 − cj)F (∆ij; dj), (2.6)
para η = {a, b, c, d, u} e todos os parˆametros conforme j´a descritos, ou seja, Yij ´e o
indi-cador de acerto do item j pelo indiv´ıduo i, ∆ij = aj(ui− bj), βj = (aj, bj, cj)0
correspon-dendo aos parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso respectivamente, dj
o parˆametro de assimetria do item j e ui sendo o valor correspondente `a vari´avel latente
Ui, que descreve a habilidade do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .
Sob essa proposta, uma abordagem Bayesiana ser´a feita considerando a fun¸c˜ao de
liga¸c˜ao log´ıstica, ou seja, fazendo F (∆ij; dj) = [Ψ(D∆ij)]dj e D = 1. Um estudo simulado
ser´a realizado no cap´ıtulo 3 com o objetivo de estudar as propriedades desse modelo; uma
aplica¸c˜ao ao conjunto de dados do projeto Geres descrito ser´a feita no cap´ıtulo 4.
O enfoque Bayesiano ´e adotado para que seja poss´ıvel incorporar informa¸c˜oes a priori
aos parˆametros do modelo. Al´em disso, ele resolve um problema presente na estima¸c˜ao
dos parˆametros quando isso ´e feito por m´axima verossimilhan¸ca, conforme citado em
Andrade et al. (2000). Tal problema ocorre quando algum item ´e respondido correta ou
incorretamente por todos os indiv´ıduos, ou quando um indiv´ıduo responde correta ou
incorretamente a todas as quest˜oes.
Em Bolfarine e Baz´an (2008), uma abordagem Bayesiana com o modelo assim´etrico
2.4
Inferˆ
encia Bayesiana
Nesta se¸c˜ao o processo para se fazer inferˆencia sobre o modelo (2.6) ´e apresentado.
Os parˆametros do modelo s˜ao η = {β, d, u}, onde β = {a, b, c} se refere aos parˆametros
de discrimina¸c˜ao, dificuldade e acerto ao acaso dos itens, respectivamente, o vetor d
diz respeito aos parˆametros de assimetria associados aos itens e o vetor u se refere
`
as proficiˆencias dos indiv´ıduos. No caso de se desejar fazer inferˆencia sobre o modelo
de trˆes parˆametros sim´etrico (1.1), basta considerar os parˆametros de assimetria fixos
e conhecidos (dj = 1 no caso em que F (.) = Ψ(.) e dj = 0 quando F (.) = Φ(.),
∀ j = 1, . . . , J), e no caso de se querer estudar o modelo log´ıstico assim´etrico de dois
parˆametros, dado pela express˜ao (2.2), basta fazer cj = 0, ∀ j = 1, . . . , J .
Para a realiza¸c˜ao de inferˆencia Bayesiana, ´e necess´ario mencionar alguns elementos
fundamentais, a saber: a fun¸c˜ao de verossimilhan¸ca, que ´e a fun¸c˜ao que descreve
proba-bilisticamente os dados observados; a distribui¸c˜ao a priori para os parˆametros do modelo,
que expressa a informa¸c˜ao inicial que se tem a respeito desses parˆametros antes de se
observar os dados; e a distribui¸c˜ao a posteriori, que sumariza a informa¸c˜ao sobre os
parˆametros, levando em conta os dados observados. Esses elementos est˜ao detalhados a
seguir. • Verossimilhan¸ca l(η; Y ) ∝ I Y i=1 J Y j=1 [pij(η)]yij[1 − pij(η)]1−yij ∝ I Y i=1 J Y j=1 {cj+ (1 − cj)F (∆ij; dj)}yij{1 − [cj+ (1 − cj)F (∆ij; dj)]}1−yij (2.7)
• Distribui¸c˜oes a priori
Assume-se que os parˆametros s˜ao independentes a priori, o que significa que a
priori conjunta ´e dada por
p(η) = p(β)p(d)p(u)
Para cada componente de η, assume-se as seguintes distribui¸c˜oes:
X aj ∼ LN (µaj, σ
2
aj), bj ∼ N (µbj, σ
2
bj), cj ∼ Beta(αcj, βcj), onde LN (., .)
repre-senta uma distribui¸c˜ao log − normal e N (., .) a distribui¸c˜ao normal,
∀ j = 1, . . . , J;
X dj ∼ LN (µdj, σ
2
dj) caso a fun¸c˜ao de liga¸c˜ao seja a log´ıstica; ou dj ter
qual-quer distribui¸c˜ao definida em R no caso de se considerar a fun¸c˜ao de liga¸c˜ao
normal assim´etrica, ∀ j = 1, . . . , J . Por exemplo, Baz´an (2005) utiliza uma
distribui¸c˜ao t-Student com parˆametro de loca¸c˜ao µ = 0, parˆametro de escala
σ2 = 0.5 e graus de liberdade ν = 2.
X ui ∼ N (0, 1) ∀ i = 1, . . . , I, de modo a resolver o problema de n˜
ao-identifi-cabilidade do modelo.
• Distribui¸c˜ao a posteriori conjunta
A distribui¸c˜ao a posteriori conjunta, que ser´a utilizada para obter as estimativas
de todos os parˆametros do modelo, ´e apresentada a seguir e foi obtida pela aplica¸c˜ao
do Teorema de Bayes: p(η|Y ) ∝ l(η; Y ) " I Y i=1 p(ui) # " J Y j=1 p(aj)p(bj)p(cj) # " J Y j=1 p(dj) # . (2.9)
Em geral ´e dif´ıcil obter a constante de normaliza¸c˜ao de (2.9), o que significa n˜ao
ser poss´ıvel encontrar uma forma anal´ıtica fechada para a distribui¸c˜ao a posteriori.
Sendo assim, alguns m´etodos baseados em simula¸c˜ao poderiam ser utilizados para
aproximar essa distribui¸c˜ao. Aqui ser´a considerado o MCMC (Markov Chain Monte
Carlo), que ´e descrito na se¸c˜ao seguinte.
No caso de se considerar a fun¸c˜ao perda quadr´atica, as estimativas de cada um
dos parˆametros ser˜ao as respectivas m´edias a posteriori. E essa fun¸c˜ao perda ser´a
2.5
M´
etodo MCMC para fazer inferˆ
encia na TRI
As inferˆencias acerca dos parˆametros dos modelos da TRI ser˜ao feitas a partir de
amostras geradas da distribui¸c˜ao a posteriori conjunta de tais parˆametros. A id´eia
b´asica do MCMC (Markov Chain Monte Carlo) ´e gerar amostras dessa distribui¸c˜ao a
partir de distribui¸c˜oes que constituam uma cadeia de Markov. Tais distribui¸c˜oes s˜ao as
distribui¸c˜oes de transi¸c˜ao da cadeia que devem ser adequadamente escolhidas de forma
que a cadeia convirja para uma distribui¸c˜ao estacion´aria que seja a pr´opria distribui¸c˜ao de
interesse (Gon¸calves, 2006). Ap´os atingir a convergˆencia, isto ´e, descartar os valores
esta-belecidos pelo burn-in, pode-se considerar que os valores simulados formam uma amostra
da distribui¸c˜ao a posteriori conjunta, e poder˜ao ser utilizados para se fazer inferˆencia.
Existem alguns m´etodos para se construir tais cadeias, entre eles o Gibbs
Sam-pling (Geman e Geman, 1984), e que s˜ao casos especiais de uma estrutura geral
desen-volvida por Metropolis et al. (1953) e Hastings (1970), que ´e conhecido como algoritmo
Metropolis-Hastings (MH).
No caso do Gibbs Sampling, originado do processamento de imagens, o m´etodo
con-siste em tomar as distribui¸c˜oes condicionais completas dos parˆametros como as
dis-tribui¸c˜oes de transi¸c˜ao da cadeia de Markov. Assumindo que a distribui¸c˜ao de interesse
´
e dada por π(θ) (que no caso ´e a pr´opria distribui¸c˜ao a posteriori), onde θ = (θ1, . . . , θL)0
e cada componente desse vetor podendo ser um escalar, um vetor ou uma matriz, a
dis-tribui¸c˜ao condicional completa do parˆametro θl´e dada por πl(θl) = π(θl|θ−l), l = 1, . . . , L,
onde θ−l ´e o vetor θ sem a l-´esima componente. Assim, a implementa¸c˜ao desse algoritmo
pode ser feita da seguinte maneira:
1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais
θ(0) = (θ(0)
1 , . . . , θ
(0) L )
0.
valores: θ1(k) ∼ π(θ1|θ (k−1) 2 , . . . , θ (k−1) L ) θ2(k) ∼ π(θ2|θ (k) 1 , θ (k−1) 3 , . . . , θ (k−1) L ) .. . θL(k) ∼ π(θL|θ (k) 1 , . . . , θ (k) L−1)
3. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia
seja alcan¸cada (considerando o burn-in).
No caso de as distribui¸c˜oes condicionais completas n˜ao serem conhecidas, o algoritmo
de Metropolis-Hastings pode ser utilizado. Assim como no Gibbs Sampling, suponha que
se deseja amostrar de uma distribui¸c˜ao de interesse π atrav´es de cadeias de Markov, que
no caso ´e a distribui¸c˜ao a posteriori, e seja q(θ, φ) uma distribui¸c˜ao de transi¸c˜ao arbitr´aria
da qual se saiba gerar, baseado numa probabilidade α(θ, φ) tal que p(θ, φ) = q(θ, φ)α(θ, φ) se θ 6= φ.
Ent˜ao q(θ, φ) define uma densidade p(θ, .) para todo valor poss´ıvel do parˆametro
dife-rente de θ. Consequentemente, existe uma probabilidade positiva de a cadeia permanecer em θ, dada por
p(θ, θ) = 1 − Z
q(θ, φ)α(θ, φ)dφ.
Dessa forma, baseado em Hastings (1970), a express˜ao mais comumente citada para
a probabilidade de aceita¸c˜ao, ou seja, a probabilidade da cadeia se mover de θ para φ, ´e
α(θ, φ) = min 1,π(φ)q(φ, θ) π(θ)q(θ, φ) . (2.10)
Em termos pr´aticos, o algoritmo consiste nos seguintes passos:
1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais
θ(0).
3. Calcule a probabilidade de aceita¸c˜ao do movimento α(θ(k−1), φ) dada por (2.10) e gere z ∼ U (0, 1).
4. Se z ≤ α, aceite o novo valor e fa¸ca θ(k) = φ. Caso contr´ario, se z > α, θ(k) = θ(k−1)
e a cadeia n˜ao se move.
5. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia
seja alcan¸cada (considerando o burn-in).
No caso dos modelos da TRI, apenas algumas distribui¸c˜oes condicionais completas
s˜ao conhecidas. Sendo assim, um m´etodo proposto por Muller (1991) ser´a utilizado e
´
e conhecido como Gibbs Sampling com passos de Metropolis, onde se adota o algoritmo
Gibbs Sampling, mas as componentes que n˜ao podem ser diretamente amostradas de sua
condicional completa s˜ao amostradas da sua proposta q e aceitas com probabilidade dada
pela express˜ao (2.10).
Sendo assim, a implementa¸c˜ao desses m´etodos para os modelos at´e aqui descritos
pode ser feita como se segue. Para a estima¸c˜ao dos parˆametros do modelo, foi feita a
seguinte divis˜ao:
({u1}, . . . , {uI}, {a1, b1, c1}, . . . , {aJ, bJ, cJ}, {d1}, . . . , {dJ}),
ou seja, os valores dos parˆametros a, b e c s˜ao aceitos (ou rejeitados) conjuntamente,
en-quanto as proficiˆencias e os parˆametros de assimetria dos itens s˜ao aceitos (ou rejeitados)
separadamente.
Assim, os passos para a implementa¸c˜ao do algoritmo s˜ao:
1. Inicialize o contador de itera¸c˜oes k = 1.
2. Gere, ∀i = 1, . . . , I, um novo valor u(k)i da densidade qi(u(k−1), u(k)) que ´e aceito
com probabilidade αi(u(k)).
3. Gere, ∀j = 1, . . . , J , um novo valor βj(k) da densidade qj(β(k−1), β(k)) que ´e aceito
com probabilidade αj(β(k)), βj = (aj, bj, cj)0.
4. Gere, ∀j = 1, . . . , J , um novo valor d(k)j da densidade qj(d(k−1), d(k)) que ´e aceito
com probabilidade αj(d(k)).
5. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia
Cabe mencionar que, embora o parˆametro d seja amostrado, os resultados relacionados
a esse parˆametro ser˜ao apresentados na escala logar´ıtmica. Para isso, ou seja, para obter
amostras do ln de d, basta tomar o logaritmo dos valores amostrados.
Ser˜ao consideradas duas cadeias partindo de pontos iniciais diferentes, conforme a
tabela 2.1:
Tabela 2.1: Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao
dos parˆametros
Cadeias Parˆametros
a(0)j b(0)j c(0)j d(0)j u(0)i
Cadeia 1 1, ∀j 0, ∀j 0.2, ∀j 1, ∀j ebi = √ei−¯e
var(e)
Cadeia 2 1.5, ∀j 1, ∀j 0.4, ∀j 2, ∀j 0, ∀i
onde ebi ´e o escore bruto padronizado do indiv´ıduo i, com ei =
PJ j=1yij, i = 1, . . . , I, ¯ e =hPI i=1ei i I e var(e) =hPI i=1(ei− ¯e)2 i (I − 1). ´
E importante considerar mais de uma cadeia para avaliar corretamente a convergˆencia
dos parˆametros do modelo. As an´alises da se¸c˜ao 1.3 foram feitas a partir da gera¸c˜ao de
uma amostra de tamanho 50 mil para cada uma das cadeias, com burn-in de 45 mil,
o que significa que as estimativas de cada parˆametro foram obtidas levando em conta
uma amostra de tamanho 10 mil. Para todas as demais an´alises, foram geradas amostras
de tamanho 190 mil, com burn-in de 10 mil e espa¸camento entre os pontos amostrados (thin) de 90, resultando que para cada cadeia o tamanho efetivo da amostra foi de 2 mil,
e que as an´alises foram realizadas com base em 4 mil observa¸c˜oes.
No caso dos modelos sim´etricos de trˆes parˆametros, ou seja, no caso de n˜ao se
con-siderar os parˆametros de assimetria dos itens, o algoritmo pode ser implementado
des-considerando o passo 4, que gera um novo valor para cada parˆametro dj. Os mesmos
valores iniciais apresentados na tabela 2.1 s˜ao utilizados para os parˆametros β e u. Em
se tratando do modelo de dois parˆametros assim´etrico, basta considerar βj = (aj, bj)0 e
seguir os passos descritos, fazendo cj = 0, ∀ j = 1, . . . , J .
As express˜oes das distribui¸c˜oes usadas para gerar as propostas, e das probabilidades
quando se utiliza os modelos sim´etricos de trˆes parˆametros para modelar a probabilidade
de resposta aos itens, quanto aquelas que consideram os modelos assim´etricos como
CCI. As express˜oes para o modelo assim´etrico de dois parˆametros podem ser facilmente
visualizadas fazendo βj = (aj, bj)0 no modelo assim´etrico de trˆes parˆametros.
2.6
Avalia¸
c˜
ao de convergˆ
encia e an´
alise de ajuste
Ap´os a implementa¸c˜ao dos algoritmos, ´e necess´ario avaliar a convergˆencia das
esti-mativas dos parˆametros. Para isso, Gelfand e Smith (1990) sugerem alguns diagn´osticos
informais baseados em t´ecnicas gr´aficas. Ap´os n itera¸c˜oes em M cadeias paralelas, pode
ser feito, para cada itera¸c˜ao, um histograma de uma fun¸c˜ao dos parˆametros considerando
as M cadeias. A convergˆencia ´e aceita se os histogramas n˜ao podem ser diferenciados
(Gamerman, 1997). Neste trabalho, a fun¸c˜ao a ser considerada para avalia¸c˜ao da
con-vergˆencia ser´a o logaritmo da distribui¸c˜ao a posteriori.
Al´em dessa avalia¸c˜ao gr´afica, a estat´ıstica de Gelman e Rubin (1992) ser´a considerada
como um indicativo de convergˆencia. Tal estat´ıstica se baseia na id´eia de que as trajet´orias
de cadeias com diferentes valores iniciais deve ser a mesma ap´os a convergˆencia. Supondo
M cadeias paralelas, cada uma com tamanho efetivo n, e uma fun¸c˜ao real ψ = f (θ),
tem-se M trajet´orias {ψ(1)m , ψ(2)m , . . . , ψm(n)}, com m = 1, . . . , M para ψ. As variˆancias S entre
as cadeias e W dentro das cadeias s˜ao dadas por
S = n M − 1 M X m=1 ( ¯ψm− ¯ψ)2 e W = 1 M (n − 1) M X m=1 n X k=1 (ψm(k)− ¯ψm)2,
onde ¯ψm ´e a m´edia das observa¸c˜oes da cadeia m e ¯ψ ´e a m´edia dessas m´edias.
Sob a hip´otese de convergˆencia, todos esses M n valores s˜ao amostrados da distribui¸c˜ao
a posteriori conjunta e σ2
ψ, a variˆancia de ψ, pode ser estimada de maneira consistente
por W , S e a m´edia ponderada:
ˆ σψ2 = 1 − 1 n W + 1 n S.
A estat´ıstica de Gelman e Rubin ser´a dada por
ˆ R = s ˆ σ2 ψ W,
que ser´a sempre maior que 1. A convergˆencia pode ser avaliada pela proximidade de ˆR
a 1; Gelman (1996) sugere aceitar a convergˆencia se ˆR for menor que 1.2.
Caso a convergˆencia seja alcan¸cada, ´e poss´ıvel fazer inferˆencia sobre os parˆametros
em quest˜ao. Para avaliar o ajuste do modelo, algumas medidas ser˜ao obtidas. Para
especific´a-las, denote h = a, b, c, d, u como sendo qualquer um dos parˆametros e Nh = I
quando h = u e Nh = J caso contr´ario, ou seja, Nh corresponde ao n´umero de parˆametros
h a serem estimados. Sendo assim, pode-se escrever cada uma das medidas utilizadas como:
• Erro quadr´atico m´edio: EQMh =
PNh t=1(ˆht−ht)2 Nh , com ˆht = P2 l=1ˆhtl 2 a m´edia a
poste-riori do parˆametro ht nas 2 cadeias, t = 1, . . . , Nh, e ht o parˆametro gerado.
• Erro absoluto m´edio: EM Ah =
PNh
t=1|ˆht−ht|
Nh .
• Coeficiente de correla¸c˜ao de Pearson entre o vetor dos parˆametros estimados, com
componentes ˆht, e o vetor dos parˆametros gerados, com componentes ht,
t = 1, . . . , Nh, denotado por ρ(ˆh, h).
• Pseudo Fator de Bayes: Uma vers˜ao modificada do Fator de Bayes pode ser
uti-lizada como medida de compara¸c˜ao entre modelos (Sahu, 2002). Alguns
proble-mas que ocorrem com o c´alculo do Fator de Bayes n˜ao aparecem nessa vers˜ao
modificada. Denotando y(r) como o conjunto das observa¸c˜oes (respostas) com a
r-´esima componente deletada, define-se a ordenada preditiva condicional (OP C)
como p(yr|y(r)) = R p(yr|η, y(r))p(η|y(r))dη. Assim, o pseudo fator de Bayes (P sF B)
para comparar dois modelos, M1 e M2, ´e definido como a raz˜ao de suas OP C’s,
P sF B(M1, M2) = IJ Y r=1 p(yr|y(r), M1) p(yr|y(r), M2)
. Uma proposta para estimar o numerador
e/ou denominador do P sF B ´e ˆp(yij|y(r)) = B1
B X b=1 1 pyij ij (1 − pij)1−yij !−1 , com pij
calculado considerando as estimativas `a posteriori dos parˆametros sob o modelo
adotado, e B o tamanho da amostra. Note que o P sF B est´a fundamentado nas
distribui¸c˜oes preditivas obtidas para dados futuros. Quanto maior o P sF B, maior
tabela de classifica¸c˜ao considerando o fator de Bayes para decidir qu˜ao forte ´e a
evidˆencia de um modelo sobre o outro, e que vale tamb´em para o P sF B.
O software escolhido para implementa¸c˜ao dos algoritmos foi o OxMetrics41, enquanto
as medidas de ajuste e os gr´aficos foram gerados no R 2.
2.7
Apˆ
endice
A seguir encontram-se as express˜oes necess´arias `a implementa¸c˜ao do algoritmo MCMC,
tais como as distribui¸c˜oes propostas e as probabilidades de aceita¸c˜ao referidas na se¸c˜ao
2.5, usadas para gerar amostras de (2.9). Ser˜ao apresentadas tanto aquelas que foram
utilizadas quando se adotou o modelo (1.1) como CCI, quanto aquelas que foram uti-lizadas quando o modelo considerado para a modelar a probabilidade de resposta aos itens era dado por (2.6).
2.7.1
Express˜
oes quando a CCI ´
e dada por (1.1) - modelos
sim´
etricos de trˆ
es parˆ
ametros
• Proficiˆencias
Para a proficiˆencia de cada indiv´ıduo, a distribui¸c˜ao de transi¸c˜ao da cadeia ´e dada
por u(k)i ∼ Nu(k−1)i , (0.2)2 , o que resulta em qi u(k−1), u(k) = fN u(k)i ; u(k−1)i , (0.2)2 .
A probabilidade de aceitar o valor gerado ´e dada por
αi u(k) = min n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj) p (ui).
• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso
Para os parˆametros de discrimina¸c˜ao, dificuldade e acerto casual, as distribui¸c˜oes
propostas s˜ao:
1http://www.oxmetrics.net
a(k)j ∼ LNln(a(k−1)j ) − 0.052
2 , (0.05)
2;
b(k)j ∼ Nb(k−1)j , (0.2)2;
c(k)j ∼ Umax(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05).
Dessa forma, fazendo βj(k)=a(k)j , b(k)j , c(k)j , tem-se que
qj β(k−1), β(k) = fLN a(k)j ; ln(a(k−1)j ), (0.05)2f N b(k)j ; b(k−1)j , (0.2)2 fU c(k)j ; max(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05).
J´a a probabilidade de aceitar o novo vetor gerado βj(k) ´e da seguinte forma:
αj β(k) = min n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , onde pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj) p (aj) p (bj) p (cj).
2.7.2
Express˜
oes quando a CCI ´
e dada por (2.6) - modelos
as-sim´
etricos de trˆ
es parˆ
ametros propostos
• Proficiˆencias
No caso de se considerar o modelo assim´etrico de trˆes parˆametros como CCI, a
dis-tribui¸c˜ao de transi¸c˜ao da habilidade de cada indiv´ıduo ser´a u(k)i ∼ Nu(k−1)i , (0.2)2
, o
que resulta em qi u(k−1), u(k) = fN
u(k)i ; u(k−1)i , (0.2)2.
Quanto `a probabilidade de aceita¸c˜ao, essa ser´a αi u(k) = min
n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj, dj) p (ui).
• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso
Para os parˆametros a, b e c, os novos valores da cadeia ser˜ao gerados a partir das
seguintes distribui¸c˜oes:
a(k)j ∼ LNln(a(k−1)j ) − 0.0522, (0.05)2 ; b(k)j ∼ Nb(k−1)j , (0.2)2; c(k)j ∼ Umax(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05) .
Fazendo βj(k)=a(k)j , b(k)j , c(k)j , resulta que qj β(k−1), β(k) = fLN a(k)j ; ln(a(k−1)j ), (0.05)2f N b(k)j ; b(k−1)j , (0.2)2 fU c(k)j ; max(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05),
cuja probabilidade de aceita¸c˜ao de βj(k) ´e αj β(k) = min
n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , com pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (aj) p (bj) p (cj).
• Parˆametro de assimetria
No caso de se considerar a fun¸c˜ao de liga¸c˜ao log´ıstica, o que implica que o parˆametro
de assimetria s´o assume valores positivos, a distribui¸c˜ao proposta ser´a
d(k)j ∼ LNln(d(k−1)j ) − 0.0522, (0.05)2 , de forma que qj d(k−1), d(k) = fLN d(k)j ; ln(d(k−1)j ) − 0.0522, (0.05)2.
A probabilidade de mover a cadeia para esse novo valor gerado ´e dada por
αj d(k) = min n 1, pj(d(k)|.)qj(d(k),d(k−1)) pj(d(k−1)|.)qj(d(k−1),d(k)) o , para pj(d|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (dj).
Para o caso de se considerar a fun¸c˜ao de liga¸c˜ao normal, implicando que d ∈ R,
ou equivalentemente que δ ∈ [−1, 1] devido `a rela¸c˜ao δ = (1+dd2)1/2, uma distribui¸c˜ao
conveniente pode ser escolhida como proposta tanto utilizando a parametriza¸c˜ao com d
Cap´ıtulo 3
Estudos simulados com modelos
assim´
etricos
Neste cap´ıtulo ser˜ao feitos estudos simulados com o modelo (2.6) fazendo
F (∆ij; dj) = [Ψ(∆ij)]
dj
, bem como com o modelo (2.2), a fim de verificar quais as suas
caracter´ısticas. An´alises que envolvem escolhas de prioris tamb´em ser˜ao realizadas, com
o objetivo de averiguar quais resultam em melhores estimativas para os parˆametros.
Para relembrar, o modelo estudado de trˆes parˆametros descreve a probabilidade de
resposta correta ao item considerando a fun¸c˜ao de liga¸c˜ao log´ıstica assim´etrica, ou seja,
pij(η) = cj+ (1 − cj) [Ψ(∆ij)]dj, (3.1)
para i = 1, . . . , I e j = 1, . . . , J , η = {β, d, u}.
Para os estudos com esse modelo, foi obtido, a partir dele, um conjunto de dados
com 30 itens e 3000 indiv´ıduos. Os parˆametros de discrimina¸c˜ao foram gerados a partir
de uma distribui¸c˜ao LN (−0.1, 0.25), o que faz com que 99% dos valores estejam entre
0.202 e 4.055; os parˆametros de dificuldade e as proficiˆencias dos indiv´ıduos a partir de
uma distribui¸c˜ao normal padronizada, os parˆametros c a partir de uma Beta(5, 17) e,
para os parˆametros de assimetria, foram fixados alguns valores tal que existissem itens
com assimetria positiva, negativa e itens sim´etricos. Assim, dj = 0.2 para j = 1, . . . , 10,
dj = 1 para j = 11, . . . , 20 e dj = 4 para j = 21, . . . , 30. Nos estudos simulados com o
em 0. Para os demais parˆametros, as distribui¸c˜oes consideradas para a gera¸c˜ao dos dados foram as mesmas.
No que diz respeito `as distribui¸c˜oes a priori, na se¸c˜ao a seguir ´e feito um estudo
com-parativo entre dois conjuntos de prioris, a fim de escolher qual deles se ajusta melhor ao
connjunto dos dados, levando em conta as medidas descritas na se¸c˜ao 2.6, e considerando
como CCI o modelo assim´etrico de trˆes parˆametros. Sup˜oe-se que o conjunto de prioris
escolhido para esse caso tamb´em seja o que melhor se ajusta quando se considerar o
modelo com dois parˆametros, visto que a priori atribu´ıda para o parˆametro c ´e bastante
informativa.
Posteriormente, nas se¸c˜oes 3.2 e 3.3, encontram-se os resultados do estudo simulado
com os modelos assim´etricos de trˆes e dois parˆametros, respectivamente, levando em
conta as prioris escolhidas.
3.1
Escolha das distribui¸
c˜
oes a priori
Ser´a feita an´alise considerando dois conjuntos de distribui¸c˜oes a priori com o objetivo
de verificar qual resulta em melhor aproxima¸c˜ao para os parˆametros do modelo. A
diferen¸ca entre esses conjuntos est´a na especifica¸c˜ao dos hiperparˆametros da distribui¸c˜ao
dos parˆametros dj, conforme cen´arios abaixo:
Cen´ario 1: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−0.8, 1.6)
∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I;
Cen´ario 2: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−1, 2)
∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I.
A distribui¸c˜ao para os parˆametros de discrimina¸c˜ao, LN (0, 0.5) tem m´edia 1.284,
moda 0.607, mediana 1 e desvio-padr˜ao 1.034, o que significa que 99% dos seus valores
est˜ao concentrados entre 0.120 e 8.342. Acredita-se que essa priori seja conveniente j´a
que se espera que os valores verdadeiros desses parˆametros estejam entre 0 e 4 (Pasquali,
2003). Quanto aos parˆametros de dificuldade, sendo a distribui¸c˜ao a priori uma normal