• Nenhum resultado encontrado

Teoria de Resposta ao Item: Uma Abordagem Generalizada das Curvas Características dos Itens

N/A
N/A
Protected

Academic year: 2021

Share "Teoria de Resposta ao Item: Uma Abordagem Generalizada das Curvas Características dos Itens"

Copied!
102
0
0

Texto

(1)

Teoria de Resposta ao Item: uma

abordagem generalizada das Curvas

Caracter´ısticas dos Itens

por

Vera L´

ucia Filgueira dos Santos

DME - IM - UFRJ

2009

(2)

Teoria de Resposta ao Item: uma

abordagem generalizada das Curvas

Caracter´ısticas dos Itens

Vera L´

ucia Filgueira dos Santos

Disserta¸c˜ao submetida ao Corpo Docente do Instituto de Matem´atica - Departamento

de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte

dos requisitos necess´arios `a obten¸c˜ao do grau de Mestre em Estat´ıstica.

Aprovada por:

Prof. Dani Gamerman PhD - IM - UFRJ - Orientador.

Prof. Tufi Machado Soares PhD - CAEd - UFJF - Co-orientador.

Prof. Fernando Antˆonio da Silva Moura

PhD - IM - UFRJ.

Prof. Joaquim Jos´e Soares Neto

PhD - CESPE - UnB.

Caio Lucidius Naberezny Azevedo Dr. Sc. - IME - USP (Suplente).

Rio de Janeiro, RJ - Brasil 2009

(3)

FICHA CATALOGR ´AFICA

Santos, Vera L´ucia Filgueira dos.

Teoria de Resposta ao Item: uma abordagem generalizada

das Curvas Caracter´ısticas dos Itens / Vera L´ucia Filgueira dos

Santos. – Rio de Janeiro: UFRJ/ IM - DME, 2009. xv, 87p.: il..; 31cm

Orientadores: Dani Gamerman e Tufi Machado Soares

Disserta¸c˜ao (mestrado) - Universidade Federal do Rio de Janeiro,

IM, DME, Programa de P´os-Gradua¸c˜ao em Estat´ıstica, 2009.

Referˆencias bibliogr´aficas: f. 85-87

1. Teoria de Resposta ao Item. 2. Estima¸c˜ao Bayesiana via

MCMC. 3. Assimetria. - Mestrado. I. Gamerman, Dani. II. Universidade Federal do Rio de Janeiro. III. T´ıtulo.

(4)

`

A minha querida e amada fam´ılia, pelo apoio incondicional,

mesmo estando a mais de 1.000km de distˆancia.

Ao Andr´e, por ser t˜ao compreensivo e amoroso.

(5)

“(...) Nunca deixe que lhe digam que n˜ao vale a pena acreditar no sonho que se tem, ou

que os seus planos nunca v˜ao dar certo, ou que vocˆe nunca vai ser algu´em. (...)”

Renato Russo

“Pedi, e dar-se-vos-´a; buscai, e encontrareis; batei, e abrir-se-vos-´a. Porque, aquele que

pede, recebe; e, o que busca, encontra; e, ao que bate, abrir-se-lhe-´a. E qual de entre v´os

´

e o homem que, pedindo-lhe p˜ao o seu filho, lhe dar´a uma pedra? E, pedindo-lhe peixe,

lhe dar´a uma serpente? Se v´os, pois, sendo maus, sabeis dar boas coisas aos vossos

filhos, quanto mais vosso Pai, que est´a nos c´eus, dar´a bens aos que lhe pedirem?”

(6)

Agradecimentos

Sou grata...

A Deus, pela sa´ude, for¸ca, coragem e persistˆencia a mim dadas, e pelo consolo nos

mo-mentos de saudade. `

A minha querida fam´ılia, pelo amor, pelo exemplo e pelos princ´ıpios que s˜ao parte da

minha essˆencia.

Ao meu Andr´e, por fazer os meus dias t˜ao mais alegres e me mostrar que nem s´o de

trabalho vive o ser humano. `

As minhas irm˜as de cora¸c˜ao e companheiras de rep´ublica, por todos os momentos de

descontra¸c˜ao e pela amizade verdadeira.

Aos meus amigos do DME, por serem a minha fam´ılia carioca e pelas tantas conversas

no hor´ario do almo¸co (seja para falar de casamento ou de inferˆencia Bayesiana).

Ao meu orientador Dani e ao meu co-orientador Tufi, por todos os ensinamentos passados

e pela oportunidade de trabalhar no tema dessa disserta¸c˜ao.

Aos professores Fernando e Neto, e ao Caio, por aceitarem fazer parte da minha banca. Novamente ao professor Neto, que desde o come¸co abriu muitas portas para o meu cresci-mento profissional.

`

A este programa de p´os-gradua¸c˜ao, pelo voto de confian¸ca.

Aos meus professores da UnB, que foram os primeiros a me incentivar. Ao CAEd - UFJF por ter cedido, gentilmente, os dados aqui tratados. Ao CNPq, por ter financiado este estudo.

(7)

Resumo

A Teoria de Resposta ao Item (TRI) para respostas dicotˆomicas considera, em geral,

um conjunto de J itens aplicados a I indiv´ıduos. Os modelos sim´etricos mais

utiliza-dos para descrever a probabilidade de resposta correta a tais itens, tamb´em conhecidos

como Curvas Caracter´ısticas dos Itens (CCI), s˜ao as distribui¸c˜oes Normal e Log´ıstica.

Esses modelos levam em conta os parˆametros dos itens (a discrimina¸c˜ao, a dificuldade

e a probabilidade de acerto ao acaso) e a habilidade ou tra¸co latente dos indiv´ıduos

para caracterizar tais probabilidades. Generaliza¸c˜oes desses modelos tˆem sido

encon-tradas na literatura, como por exemplo em Baz´an (2005) e em Samejima (2000). Ambas

generaliza¸c˜oes consideram que a probabilidade de acerto ao acaso ´e nula (modelo de dois

parˆametros) e incorporam um parˆametro de assimetria aos itens.

O objetivo aqui ´e apresentar o que foi proposto em ambos trabalhos, mas permitindo

que o parˆametro de acerto casual seja diferente de zero. Al´em disso, estudaremos formas

de detec¸c˜ao de assimetria atrav´es da especifica¸c˜ao de distribui¸c˜oes a priori apropriadas

para este fim. Estudos ser˜ao feitos considerando a generaliza¸c˜ao feita `a partir do que

´

e apresentado por Samejima (2000) utilizando metodologia Bayesiana e implementando

via m´etodos MCMC. Todos os estudos ser˜ao primeiramente `a luz de dados simulados e

em seguida considerando dados reais.

Palavras Chaves: Teoria de Resposta ao Item, Estima¸c˜ao Bayesiana via MCMC,

(8)

Abstract

The Item Response Theory (IRT) for dichotomous response considers, in general, a set of J items applied at I individuals. The symmetrical models often used to describe the probability of correct response to these items, also called Item Curve Characteristic (ICC), are the Normal and Logistic distributions. These models take into consideration the items parameters (the discrimination, the difficulty and the guessing parameter) and the ability of individuals to characterize these probabilities. Generalizations of these

models are found on literature, for example at Baz´an (2005) and Samejima (2000). Both

generalizations consider that the guessing parameter is null (two parameter model) and introduce a asymmetry parameter into items.

The objective here is to present what was proposed in both works, but allowing the guessing parameter to be different of zero. Also, we will study ways of asymmetry de-tecting through appropriate priors specification. Studies will be made considering the generalization from the Samejima (2000), using Bayesian methodology and implementing via MCMC methods. All studies first will be with simulated data, and later, with real data.

(9)

Sum´

ario

1 Introdu¸c˜ao 1

1.1 Teoria de Resposta ao Item . . . 2

1.2 Descri¸c˜ao dos dados reais . . . 5

1.3 An´alise dos dados reais via TRI convencional . . . 6

1.4 Sum´ario da disserta¸c˜ao . . . 10

1.5 Apˆendice . . . 10

2 Distribui¸c˜oes assim´etricas na TRI 12 2.1 Fam´ılia TRI log´ıstica assim´etrica . . . 13

2.2 Fam´ılia TRI normal assim´etrica . . . 14

2.3 Modelo proposto . . . 16

2.4 Inferˆencia Bayesiana . . . 17

2.5 M´etodo MCMC para fazer inferˆencia na TRI . . . 19

2.6 Avalia¸c˜ao de convergˆencia e an´alise de ajuste . . . 23

2.7 Apˆendice . . . 25

2.7.1 Express˜oes quando a CCI ´e dada por (1.1) - modelos sim´etricos de trˆes parˆametros . . . 25

2.7.2 Express˜oes quando a CCI ´e dada por (2.6) - modelos assim´etricos de trˆes parˆametros propostos . . . 26

3 Estudos simulados com modelos assim´etricos 28 3.1 Escolha das distribui¸c˜oes a priori . . . 29

(10)

3.3 Resultados do estudo simulado com o modelo de dois parˆametros assim´etrico 36

3.4 Apˆendice . . . 39

4 An´alise dos dados reais com modelos assim´etricos 41 4.1 Resultados do estudo com o modelo assim´etrico de trˆes parˆametros . . . 41

4.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 44

4.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 47

4.4 Apˆendice . . . 48

5 Distribui¸c˜oes assim´etricas na TRI com detec¸c˜ao de assimetria 51 5.1 Modelo proposto . . . 51

5.2 Inferˆencia Bayesiana . . . 52

5.3 M´etodo MCMC para fazer inferˆencia na TRI . . . 53

5.4 Apˆendice . . . 55

6 Estudos simulados com modelos assim´etricos incluindo detec¸c˜ao de as-simetria 57 6.1 Compara¸c˜ao entre os m´etodos de amostragem . . . 59

6.2 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-sim´etrico de trˆes parˆametros . . . 63

6.3 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-sim´etrico de dois parˆametros . . . 66

6.4 Apˆendice . . . 69

7 An´alise dos dados reais com modelos assim´etricos incluindo detec¸c˜ao de assimetria 74 7.1 Resultados do estudo com o modelo assim´etrico de trˆes parˆametros . . . 75

7.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 78

7.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 81

8 Conclus˜oes e trabalhos futuros 82

(11)

Lista de Tabelas

1.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres . 8

2.1 Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao

dos parˆametros . . . 22

3.1 Resultados das medidas utilizadas para a escolha das distribui¸c˜oes a priori

- Cen´ario 1 versus Cen´ario 2 . . . 31

4.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

considerando o modelo assim´etrico de trˆes parˆametros . . . 43

4.2 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

considerando o modelo assim´etrico de dois parˆametros . . . 46

6.1 M´edia a posteriori dos parˆametros π para alguns itens com diferentes

ta-manhos de amostra para os dois algoritmos . . . 61

7.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

considerando o modelo assim´etrico de trˆes parˆametros via algoritmo 2 . . 78

7.2 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

(12)

Lista de Figuras

1.1 CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2 . . . 4

1.2 Propor¸c˜ao de acerto dos itens do projeto Geres . . . 6

1.3 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% . . . 7

1.4 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do

projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada . . . 9

2.1 CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d . . . 14

3.1 Valores reais versus estimados dos parˆametros dos itens considerando os

cen´arios 1 e 2. O ponto representa o cen´ario 1 e o “x”, o cen´ario 2 . . . 32

3.2 Trajet´oria da log-posteriori das 2 cadeias geradas . . . 34

3.3 Valores reais e estimativas dos parˆametros dos itens com seus respectivos

intervalos de credibilidade de 95%. O ponto representa o valor estimado e

a linha horizontal dentro do intervalo, o valor real . . . 35

3.4 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de

da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e

valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos 35

3.5 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de dois parˆametros . . . 37

3.6 Valores reais e estimativas dos parˆametros dos itens com seus respectivos

intervalos de credibilidade de 95% considerando o modelo assim´etrico de

dois parˆametros. O ponto representa o valor estimado e a linha horizontal

(13)

3.7 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de

da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e

valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos,

considerando o modelo assim´etrico de dois parˆametros . . . 38

4.1 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de trˆes parˆametros para os dados do projeto Geres . . . 42

4.2 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% considerando

o modelo assim´etrico de trˆes parˆametros . . . 43

4.3 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes

do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

considerando o modelo assim´etrico de trˆes parˆametros . . . 44

4.4 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de dois parˆametros para os dados do projeto Geres . . . 45

4.5 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% considerando

o modelo assim´etrico de dois parˆametros . . . 46

4.6 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes

do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

considerando o modelo assim´etrico de dois parˆametros . . . 47

6.1 Densidades das distribui¸c˜oes Beta(0.01, 0.01) e Beta(2, 2) . . . 58

6.2 Valores reais e estimativas dos parˆametros dos itens com seus respectivos

intervalos de credibilidade de 95% considerando os algoritmos 1 e 2. O ponto representa o valor estimado e a linha horizontal dentro do intervalo,

o valor real . . . 60

6.3 Estimativas pontuais (m´edias a posteriori) dos π para os dois algoritmos.

O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 60

6.4 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

(14)

6.5 Valores reais e estimativas dos parˆametros dos itens com seus respectivos intervalos de credibilidade de 95% obtidos via algoritmo 2. O ponto rep-resenta o valor estimado e a linha horizontal dentro do intervalo, o valor

real . . . 64

6.6 Estimativas pontuais (m´edias a posteriori) dos π para o algoritmo

escol-hido. O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos 65

6.7 Histograma das proficiˆencias estimadas sobre a curva da densidade da

dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,

con-siderando o modelo asim´etrico de trˆes parˆametros e o algoritmo 2 . . . . 65

6.8 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de dois parˆametros via algoritmo 2 . . . 67

6.9 Valores reais e estimativas dos parˆametros dos itens com seus respectivos

intervalos de credibilidade de 95% e m´edia a posteriori dos parˆametros π

via algoritmo 2. No gr´afico de a, b e d, o ponto representa o valor estimado

e a linha horizontal dentro do intervalo, o valor real. No gr´afico dos π’s,

o ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 67

6.10 Histograma das proficiˆencias estimadas sobre a curva da densidade da

dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,

con-siderando o modelo assim´etrico de trˆes parˆametros e o algoritmo 2 . . . 68

7.1 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de trˆes parˆametros para os dados do projeto Geres, via

algo-ritmo 2 . . . 75

7.2 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% considerando

o modelo assim´etrico de trˆes parˆametros via algoritmo 2 . . . 76

7.3 Estimativas pontuais (m´edias a posteriori) dos π . . . 76

7.4 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes

do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

(15)

7.5 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de dois parˆametros para os dados do projeto Geres, via

algo-ritmo 2 . . . 78

7.6 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% considerando

o modelo assim´etrico de dois parˆametros via algoritmo 2, e m´edia a

pos-teriori dos parˆametros π . . . 79

7.7 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes

do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

(16)

Cap´ıtulo 1

Introdu¸

ao

A psicometria ´e um conjunto de t´ecnicas cujo objetivo ´e mensurar as habilidades

cognitivas dos indiv´ıduos expressas por meio do comportamento humano, sendo uma das

principais t´ecnicas a Teoria de Resposta ao Item (TRI) que, embora utilizada em diversas

´

areas, destaca-se especialmente em processos de avalia¸c˜ao educacional em larga escala.

A TRI ´e usada para analisar dados provenientes de respostas a itens presentes em

instrumentos avaliativos de desempenho, question´arios, entre outros, e sugere formas

de representar a probabilidade de um indiv´ıduo dar uma determinada resposta a um

item levando em conta os seus tra¸cos latentes, proficiˆencias ou habilidades e algumas

caracter´ısticas do item. Tradicionalmente, essa rela¸c˜ao ´e modelada atrav´es de fun¸c˜oes de

liga¸c˜ao sim´etricas, tais como as liga¸c˜oes probito e logito. Tal rela¸c˜ao ´e conhecida como

Curva Caracter´ıstica do Item (CCI).

Mas `a medida que a aplica¸c˜ao da TRI cresce, surgem algumas quest˜oes que devem ser

levadas em conta para o aprimoramento da t´ecnica. Uma dessas quest˜oes ´e se as fun¸c˜oes

de liga¸c˜ao sim´etricas utilizadas para a CCI s˜ao adequadas. Como indicado por Samejima

(1997), CCI’s assim´etricas podem ser mais apropriadas para modelar comportamento

humano. Sendo assim, o objetivo desse trabalho ´e apresentar o que foi proposto por

Samejima (2000) e por Baz´an (2005) e algumas generaliza¸c˜oes, de modo a permitir formas

mais gerais para a CCI.

A seguir, uma breve revis˜ao acerca da Teoria de Resposta ao Item ´e apresentada.

(17)

descrito. Na se¸c˜ao seguinte, esse conjunto de dados ser´a analisado via TRI convencional.

E finalmente, na se¸c˜ao 1.4, um sum´ario do trabalho ´e apresentado.

1.1

Teoria de Resposta ao Item

Segundo Baker (1992), os trabalhos de Lawlel (1943) e Lord (1952) s˜ao o marco inicial

dos estudos relacionados `a Teoria de Resposta ao Item. Essa prop˜oe modelos param´etricos

para representar a probabilidade pij(η) de um indiv´ıduo i responder corretamente a um

item j como fun¸c˜ao de parˆametros η, que contemplam parˆametros do item (a saber:

discrimina¸c˜ao, dificuldade e acerto casual) e habilidade ou proficiˆencia do indiv´ıduo i, ui,

i = 1, . . . , I e j = 1, . . . , J .

Esses modelos, por sua vez, dependem da natureza dos itens, isto ´e, se eles s˜ao

dicotˆomicos (corrigidos como certo ou errado) ou n˜ao dicotˆomicos (itens de resposta

livre ou itens de m´ultipla escolha avaliados de forma graduada), da quantidade de tra¸cos

latentes ou habilidades que est˜ao sendo medidas (apenas uma ou mais de uma) e do

n´umero de popula¸c˜oes envolvidas (apenas uma ou mais de uma). Aqui, ser˜ao considerados

apenas aqueles que tratam os itens de forma dicotˆomica, que avaliam apenas um tra¸co

latente (os chamados modelos unidimensionais) e em uma ´unica popula¸c˜ao. Al´em disso,

sup˜oe-se que as respostas oriundas de indiv´ıduos diferentes s˜ao independentes e que os

itens s˜ao respondidos de forma independente por cada indiv´ıduo, fixada sua habilidade

(suposi¸c˜ao conhecida como Independˆencia Local).

Dentro dessa classe, um modelo bastante utilizado ´e conhecido como modelo de trˆes

parˆametros pois envolve a discrimina¸c˜ao, a dificuldade e o acerto casual do item, al´em

da proficiˆencia do indiv´ıduo.

A express˜ao geral para a probabilidade de resposta correta ´e dada por

pij(η) = P (Yij = 1|η) = cj+ (1 − cj)F (∆ij), (1.1)

onde Yij ´e o indicador de acerto do item j pelo indiv´ıduo i, η = {β, u}, β = {a, b, c}

correspondendo aos parˆametros de discrimina¸c˜ao, de dificuldade e de acerto ao acaso,

(18)

fun¸c˜ao de distribui¸c˜ao acumulada qualquer, e ∆ij = aj(ui − bj) ´e uma fun¸c˜ao linear de

ui, com ui sendo o valor correspondente `a vari´avel latente Ui, que descreve a habilidade

do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .

Em Baker (1992) encontram-se os casos mais comuns para a distribui¸c˜ao F (.), que

s˜ao F (.) = Φ(.) ou F (.) = Ψ(.), onde Φ(.) ´e a fun¸c˜ao de distribui¸c˜ao acumulada (fda) de

uma distribui¸c˜ao normal padr˜ao, e Ψ ´e a fda de uma distribui¸c˜ao log´ıstica padr˜ao, que ´e

definida como Ψ(t) = 1+exp{−t}1 , t ∈ R. O primeiro caso ´e conhecido como modelo normal

de trˆes parˆametros, e quando F (.) = Ψ(.), tem-se o modelo log´ıstico de trˆes parˆametros.

Em geral, D, que representa um fator de escala, ´e igual a 1. Uma rela¸c˜ao importante

entre as fda log´ıstica e normal ´e dada por

|Ψ(D∆ij) − Φ(∆ij)| < 0.01, −∞ < ui < ∞,

onde D deve ser igual a 1.702 para que a rela¸c˜ao acima permita aproximar o modelo

normal pelo log´ıstico (Baker, 1992).

No contexto de modelos lineares generalizados, a representa¸c˜ao dada em (1.1) utiliza

uma fun¸c˜ao de liga¸c˜ao F−1, sendo Φ−1 conhecida como fun¸c˜ao de liga¸c˜ao probito e Ψ−1

como a fun¸c˜ao de liga¸c˜ao logito.

Outros modelos podem ser obtidos a partir dos que foram apresentados. Por exemplo,

se se assume que o parˆametro relacionado ao acerto casual ´e nulo em todos os itens,

obt´em-se o modelo conhecido como modelo de dois parˆametros; j´a quando o valor do

parˆametro de discrimina¸c˜ao aj ´e o mesmo para todos os itens, al´em dos parˆametros cj

nulos ∀j, o modelo de um parˆametro ´e obtido.

No que diz respeito `a interpreta¸c˜ao de cada um dos parˆametros dos itens, essa pode

ser feita com o aux´ılio da figura 1.1. Ela ilustra o fato que os modelos descritos at´e aqui

levam em conta que indiv´ıduos com maior habilidade possuem maior probabilidade de

acertar o item e que esta rela¸c˜ao ´e n˜ao linear, tendo a forma de “S”. O parˆametro b ´e

medido na mesma unidade da habilidade u e quanto maior o valor de b, mais dif´ıcil ser´a o

item. Ele pode ser visto como a habilidade necess´aria para que a probabilidade de acerto

do item j seja (1 + cj)/2.

(19)

proba-Figura 1.1: CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2

bilidade de um aluno com baixa habilidade responder corretamente o item, ou seja, lim

ui→−∞

pij(η) = cj. Assim, o parˆametro c pode ser visto como a ass´ıntota inferior da CCI.

Se um item de m´ultipla escolha ´e constru´ıdo de tal forma que as alternativas incorretas

(distratores) funcionem muito bem, ou seja, se os distratores cumprem o seu papel de

trazer informa¸c˜ao ao avaliador a respeito da manifesta¸c˜ao do racioc´ınio do aluno quando

busca a solu¸c˜ao para a tarefa imposta pelo item, mas sem chamar mais aten¸c˜ao do que

a resposta correta, provavelmente o parˆametro c estar´a em torno do inverso do n´umero

de alternativas. Todavia, na pr´atica, observam-se valores desde pr´oximos de zero at´e

pr´oximos a 0.5, raramente ultrapassando esse valor.

J´a o parˆametro a ´e proporcional `a derivada da tangente da curva no ponto de

in-flex˜ao. Dessa forma, itens com a negativo n˜ao s˜ao esperados sob esses modelos, uma

vez que indicariam que a probabilidade de responder corretamente o item diminui com

o aumento da habilidade. Baixos valores de a indicam que a quest˜ao tem pouco poder

de discrimina¸c˜ao (alunos com habilidades bastante diferentes tˆem aproximadamente a

mesma probabilidade de responder corretamente o item). Segundo Baker (2001),

con-siderando a representa¸c˜ao com o modelo logito, itens cujos parˆametros de discrimina¸c˜ao

est˜ao entre 0.01 e 0.34 s˜ao classificados como itens de discrimina¸c˜ao muito baixa ; entre

0.35 e 0.64, de baixa discrimina¸c˜ao; entre 0.65 e 1.34, de discrimina¸c˜ao moderada; entre

1.35 e 1.69, de discrimina¸c˜ao alta, e maior que 1.70, de discrimina¸c˜ao muito alta. Para

(20)

valores pelo fator de escala D = 1.702.

Um ponto importante a ser mencionado ´e que o modelo (1.1) ´e n˜ao identific´avel, pois

qualquer transforma¸c˜ao do tipo u∗ = (ku + γ), b∗ = (kb + γ) e a∗ = ak, para k > 0

e γ ∈ R, n˜ao altera a probabilidade representada pelo modelo. E uma das maneiras

mais comuns para tornar o modelo identific´avel ´e fixar uma distribui¸c˜ao a priori pr´opria

para as proficiˆencias. Em geral adota-se a distribui¸c˜ao normal padronizada, o que ´e feito

nesta disserta¸c˜ao, definindo dessa forma a escala com m´edia 0 e desvio-padr˜ao 1 para as

habilidades.

1.2

Descri¸

ao dos dados reais

O conjunto de dados reais que ser´a utilizado ao longo desta disserta¸c˜ao ´e do Projeto

Geres, que ´e um projeto de pesquisa que focaliza a aprendizagem nas primeiras fases

do Ensino Fundamental, levando em conta os fatores escolares e s´ocio-familiares que

incidem sobre o desempenho escolar, al´em de outras dimens˜oes, como a auto-estima e a

motiva¸c˜ao, que podem afetar o desenvolvimento dos alunos.

Durante um per´ıodo de quatro anos, de 2005 a 2008, aproximadamente 27000 alunos de cinco cidades brasileiras, de uma amostra de 309 escolas estaduais, municipais e

pri-vadas, foram testados todo ano em L´ıngua Portuguesa e Matem´atica, enquanto os

profes-sores, diretores de escola, pais e os pr´oprios alunos foram entrevistados para determinar

os impactos na aprendizagem dos fatores escolares e familiares. Os fatores incorporados

a esta pesquisa foram escolhidos mediante uma revis˜ao extensa da literatura nacional e

internacional, com um interesse especial para aquelas caracter´ısticas indicadas como de

relevˆancia no contexto brasileiro, sobretudo os recursos da escola, a organiza¸c˜ao e gest˜ao

da escola, o clima acadˆemico, a forma¸c˜ao e sal´ario do professor e a pedagogia de sala de

aula. A escolha destes fatores tamb´em se deve ao interesse dos pesquisadores em oferecer

subs´ıdios pr´aticos para a formula¸c˜ao de pol´ıticas voltadas para a melhoria da qualidade

e da equidade da educa¸c˜ao no Brasil1.

1Texto adaptado do site http://www.geres.ufmg.br/paginas/?s=geres&p=oquee.php, acessado em 09

(21)

Os dados utilizados consistem em um teste de L´ıngua Portuguesa com 24 itens e

que foram respondidos por 6749 alunos do 3o ano do Ensino Fundamental das cidades

Rio de Janeiro, Salvador, Belo Horizonte, Campinas e Campo Grande em 2006, e que

foram cedidos pelo CAEd (Centro de Pol´ıticas P´ublicas e Avalia¸c˜ao da Educa¸c˜ao), da

Universidade Federal de Juiz de Fora. Entre esse conjunto de alunos, foram considerados

apenas aqueles que n˜ao apresentavam dados faltantes, ou seja, que responderam a todos

os itens, o que reduziu a amostra para 6320. Os itens eram de m´ultipla escolha com

quatro alternativas, entre as quais uma delas estava correta.

1.3

An´

alise dos dados reais via TRI convencional

A figura 1.2 apresenta as propor¸c˜oes de acerto de cada um dos itens do teste.

Observa-se que o item menos acertado foi o item 7, cujo percentual de acerto foi de

aproximada-mente 30.71%; por outro lado, as quest˜oes mais acertadas foram a 1 e a 3, com percentuais

de acerto de 97.78% e 97.83% respectivamente. Vinte itens foram acertados por mais de 50% dos participantes. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Proporção de acerto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0

Figura 1.2: Propor¸c˜ao de acerto dos itens do projeto Geres

Quanto aos alunos, 96 deles acertaram todas as quest˜oes da prova, enquanto apenas

1 aluno acertou uma ´unica quest˜ao. O escore bruto m´edio foi 16.81 e desvio-padr˜ao 3.88.

(22)

A metodologia apresentada nas se¸c˜oes 2.4 e 2.5 foi utilizada para se fazer inferˆencia

sobre o modelo de trˆes parˆametros (1.1) tal que F (.) = Ψ(.), ou seja, considerando-se a

fun¸c˜ao de liga¸c˜ao logito. Os hiperparˆametros de cada uma das prioris s˜ao

µaj = 0, σ

2

aj = 0.5, µbj = 0, σ

2

bj = 1, αcj = 5, βcj = 17, ∀ j = 1, . . . , 24,

e distribui¸c˜ao normal padronizada para as proficiˆencias. Al´em disso, considerou-se o fator

de escala D igual a 1, ou seja, os parˆametros est˜ao sendo obtidos na escala do modelo

logito. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0 1 2 3 4 Item Parâmetro a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 −4 −2 0 2 4 Item Parâmetro b 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 −4 −2 0 2 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Parâmetro c 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0

Figura 1.3: Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

pro-jeto Geres e respectivos intervalos de credibilidade de 95%

As estimativas dos parˆametros dos itens e seus respectivos intervalos de credibilidade

de 95% est˜ao apresentados na figura 1.3. Considerando a classifica¸c˜ao apresentada na

se¸c˜ao anterior a respeito dos parˆametros de discrimina¸c˜ao, percebe-se que um item ´e

clas-sificado como de baixa discrimina¸c˜ao, onze apresentaram discrimina¸c˜ao moderada, oito

discrimina¸c˜ao alta, e quatro discrimina¸c˜ao muito alta. Os itens que apresentaram maior

variˆancia a posteriori nesse parˆametro foram o 21, o 23 e o 24. Quanto aos parˆametros de

(23)

valores no parˆametro b. Esse fato concorda com o que foi comentado anteriormente, visto

que o percentual de acerto dessas quest˜oes foi bastante elevado. Por outro lado, os itens

7, 23 e 24 foram os itens mais dif´ıceis do teste. A quest˜ao cujo parˆametro b apresentou

maior intervalo de credibilidade foi a de n´umero 6. Em rela¸c˜ao ao parˆametro de acerto

ao acaso, a figura indica que o item 6 apresentou a maior estimativa pontual para esse

parˆametro, enquanto os de n´umero 7, 10 e 17 s˜ao os que obtiveram as menores. Entre

esses quatro itens, apenas o intervalo do item 6 contempla o valor 0.25, que ´e o valor no

qual se espera que esse parˆametro esteja quando um item tem 4 alternativas e assumindo

que os seus distratores funcionam bem.

Com rela¸c˜ao `as proficiˆencias dos alunos, foram obtidas estimativas pontuais e

inter-valares para apenas dois deles, apresentadas na tabela 1.1. Posteriormente, ser´a

expli-cado o motivo pelo qual n˜ao ´e poss´ıvel obter ambas estimativas para todos os indiv´ıduos.

Observa-se que os dois alunos apresentaram proficiˆencias estimadas abaixo da m´edia 0,

embora seus respectivos intervalos contemplem esse valor.

Tabela 1.1: Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credibili-dade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

Aluno M´edia a posteriori Intervalo de Credibilidade de 95%

3387 −0.530 (−1.377 , 0.293)

4158 −0.122 (−1.061 , 0.757)

A figura 1.4 apresenta o histograma das proficiˆencias estimadas sobre a densidade

da distribui¸c˜ao normal padronizada. Aparentemente, a distribui¸c˜ao utilizada para as

proficiˆencias ´e adequada, j´a que o histograma se aproxima bastante da curva dessa

den-sidade.

Foram obtidas ainda as propor¸c˜oes de acerto dos itens do teste, levando em conta

o escore dos alunos. Tais propor¸c˜oes est˜ao dispostas nos gr´aficos que se encontram no

apˆendice do cap´ıtulo. Observando tais gr´aficos, nota-se que, empiricamente, as curvas

de alguns itens se distanciam do formato de “S” que se espera de uma CCI, como por exemplo, dos itens 6 e 7. Nestes casos, a maneira como a probabilidade de resposta

(24)

Proficiência Densidade −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 0.5

Figura 1.4: Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do

projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

correta se aproxima de zero ´e diferente de como se aproxima de um, sendo que, para o

item 6, as propor¸c˜oes de acerto daqueles indiv´ıduos com escores baixos j´a s˜ao bastante

elevadas, enquanto que para o item 7, as propor¸c˜oes de acerto s´o tendem a aumentar

a partir do escore 14. Estes comportamentos poderiam levar `a alguns questionamentos:

uma CCI sim´etrica ´e, de fato, conveniente? Ser´a que uma CCI assim´etrica n˜ao poderia

ajustar melhor os dados?

Sob essa perspectiva, os resultados obtidos podem n˜ao ser ´uteis para fazer inferˆencia,

uma vez que, devido a poss´ıvel assimetria, as estimativas das proficiˆencias e dos parˆametros

dos itens n˜ao seriam confi´aveis. Sendo assim, o objetivo principal desta disserta¸c˜ao ´e

pro-por modelos que permitam um parˆametro de assimetria para cada item e,

consequente-mente, formas mais gerais para as CCI’s, e que sejam capazes de estimar conjuntamente

(25)

1.4

Sum´

ario da disserta¸

ao

Neste cap´ıtulo, foi feita uma revis˜ao acerca dos modelos mais usuais da TRI e

apre-sentado o objetivo principal desta disserta¸c˜ao. No cap´ıtulo 2, as propostas feitas por

Samejima (2000) e Baz´an (2005) que resultam em CCI’s mais gerais s˜ao brevemente

des-critas; al´em disso, o modelo proposto ´e apresentado, bem como a metodologia utilizada

para se fazer inferˆencia Bayesiana. Algumas medidas que ser˜ao utilizadas para avalia¸c˜ao

do ajuste dos modelos tamb´em s˜ao apresentadas nesse cap´ıtulo.

No cap´ıtulo 3, s˜ao feitos estudos simulados com modelos assim´etricos, incluindo o

caso geral proposto e o caso em que o parˆametro c ´e igual a zero, bem como algumas

an´alises com diferentes conjuntos de prioris e avalia¸c˜ao de convergˆencia.

No cap´ıtulo 4, o conjunto de dados do projeto Geres ´e analisado utilizando os modelos

assim´etricos estudados no cap´ıtulo 3.

J´a no cap´ıtulo 5, um modelo da TRI que incorpora a detec¸c˜ao de assimetria ´e proposto,

onde o processo para se fazer inferˆencia Bayesiana tamb´em ´e descrito. Estudos simulados

utilizando esse modelo est˜ao no cap´ıtulo 6.

No cap´ıtulo 7, os dados do projeto Geres s˜ao novamente analisados, mas agora via

modelos abordados no cap´ıtulo 5.

Por fim, no cap´ıtulo 8, est˜ao as conclus˜oes e propostas para trabalhos futuros.

1.5

Apˆ

endice

(26)
(27)

Cap´ıtulo 2

Distribui¸

oes assim´

etricas na TRI

Os modelos da TRI apresentados no cap´ıtulo 1 consideram fun¸c˜oes de liga¸c˜ao sim´

etri-cas (logito e probito) que, consequentemente, provˆem CCI’s sim´etricas para descrever as

probabilidades de resposta aos itens. Mas como enfatizam Chen et al. (1999), essas

fun¸c˜oes de liga¸c˜ao sim´etricas nem sempre fornecem bons ajustes, especialmente quando

a probabilidade de uma dada resposta se aproxima de 0 de forma diferente de como se

aproxima de 1. A ado¸c˜ao de uma fun¸c˜ao de liga¸c˜ao sim´etrica levaria a vi´es nas estimativas

m´edias das respostas.

Sendo assim, as propostas feitas por Samejima (2000) e Baz´an (2005) est˜ao

apresen-tadas a seguir. Tais propostas resultam em CCI’s assim´etricas e s˜ao conhecidas como

fam´ılia log´ıstica de expoente positivo (FLEP) e fam´ılia TRI normal assim´etrica

(TRI-NA), respectivamente. Na se¸c˜ao 2.3 o modelo proposto ser´a descrito, e

posterior-mente, a metodologia para se fazer inferˆencia por meio de uma abordagem Bayesiana. Na

se¸c˜ao 2.5 apresentam-se os m´etodos MCMC, e as express˜oes matem´aticas utilizadas para

a implementa¸c˜ao desses m´etodos encontram-se no apˆendice do cap´ıtulo. Neste cap´ıtulo, o

parˆametro de assimetria de todos os itens, e em todos os modelos, ´e estimado e, por meio

da avalia¸c˜ao da sua estimativa intervalar, se conclui quais deles possuem comportamento

(28)

2.1

Fam´ılia TRI log´ıstica assim´

etrica

A fam´ılia de modelos proposta por Samejima (2000), chamada fam´ılia log´ıstica

de expoente positivo (FLEP), provˆem CCI’s assim´etricas e inclui o modelo log´ıstico

sim´etrico de dois parˆametros (aquele que leva em conta a discrimina¸c˜ao e a dificuldade

do item, al´em da proficiˆencia do indiv´ıduo) como um caso particular. Uma das raz˜oes

apresentadas para o uso dessa fam´ılia ´e que ela pode ser mais apropriada para modelar

comportamento humano.

No caso de se ter o modelo log´ıstico de dois parˆametros, a CCI ´e dada por

pij(η) = Ψ(D∆ij), (2.1)

para i = 1, . . . , I e j = 1, . . . , J , η = {a, b, u} e todos os demais termos conforme definidos

no cap´ıtulo 1. Segundo o que j´a foi dito, D ´e um fator de escala que ser´a 1.702 quando

se desejar aproximar o modelo normal pelo log´ıstico; caso contr´ario, D = 1.

A fam´ılia proposta por Samejima (2000) descreve a probabilidade de um indiv´ıduo i responder corretamente a um item j como

pij(η) = [Ψ(D∆ij)]dj, (2.2)

para i = 1, . . . , I, j = 1, . . . , J , com η = {a, b, d, u} e dj > 0 sendo o parˆametro de

assimetria associado ao j-´esimo item. Quando dj = 1, (2.2) equivale ao modelo log´ıstico

de dois parˆametros.

O parˆametro dj se relaciona `a complexidade do item j. Um item ´e dito complexo

se requer muitos passos para ser resolvido. Espera-se que a probabilidade de resolver um

item complexo diminua quando o n´umero de passos ou etapas aumenta, dada a

habili-dade do indiv´ıduo. Samejima (2000) argumenta que, levando em conta a complexihabili-dade dos itens, pode ser mais apropriado assumir que a probabilidade de resposta tem um

comportamento assim´etrico.

A figura 2.1 mostra algumas CCI’s considerando a equa¸c˜ao (2.2) com os parˆametros de

dificuldade e discrimina¸c˜ao fixos, e diferentes valores para o parˆametro d. Esse parˆametro

(29)

bem como penalizar itens f´aceis e que n˜ao foram resolvidos corretamente (0 < d < 1). O

modelo sim´etrico pode ser considerado como a transi¸c˜ao entre esses dois princ´ıpios.

−6 −4 −2 0 2 4 6 0.0 0.2 0.4 0.6 0.8 1.0 ui Pij (( ηη )) d = 0.3 d = 0.5 d = 0.8 d = 1 d = 1.5 d = 2 d = 3

Figura 2.1: CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d

2.2

Fam´ılia TRI normal assim´

etrica

Diferente de Samejima (2000), a proposta feita em Baz´an (2005) n˜ao ´e derivada

da teoria psicol´ogica. A nova fam´ılia de modelos introduzida, chamada fam´ılia TRI

normal assim´etrica (TRI-NA), ´e uma extens˜ao do modelo probito de dois parˆametros

e considera: a) uma fun¸c˜ao de liga¸c˜ao normal assim´etrica na modelagem da probabilidade

de resposta correta pij(η), e/ou b) a distribui¸c˜ao das proficiˆencias dos indiv´ıduos sendo

normal assim´etrica.

Para descrever essa fam´ılia faz-se necess´ario mencionar a defini¸c˜ao de uma distribui¸c˜ao

(30)

as-sim´etrica com parˆametro de loca¸c˜ao µ, parˆametro de escala σ2 e parˆametro de assimetria d se sua densidade puder ser escrita como

fX(x) = φSN(x; µ, σ2, d) = 2 σφ  x − µ σ  Φ  dx − µ σ  , (2.3)

com a nota¸c˜ao X ∼ SN (µ, σ2, d), onde φ(.) e Φ(.) s˜ao, respectivamente, a densidade e a

fun¸c˜ao de distribui¸c˜ao acumulada de uma distribui¸c˜ao normal padr˜ao (SN significa skew

normal ). J´a a fun¸c˜ao de distribui¸c˜ao acumulada dessa vari´avel X ´e dada por

ΦSN(x; µ, σ2, d) = 2Φ2     x 0  ;   µ 0  ,   σ2 −δ −δ 1    , (2.4)

onde Φ2(µ, Σ, d) denota a fun¸c˜ao de distribui¸c˜ao acumulada de uma distribui¸c˜ao normal

bivariada com vetor m´edia µ, matriz de variˆancia Σ e coeficiente de correla¸c˜ao −δ, onde

δ = (1+dd2)1/2. No caso de se supor X com distribui¸c˜ao normal padr˜ao assim´etrica (µ = 0

e σ2 = 1), a nota¸c˜ao ser´a da forma X ∼ SN (d).

Ent˜ao, se uma fun¸c˜ao de liga¸c˜ao normal padr˜ao assim´etrica for considerada na

mo-delagem da probabilidade de resposta correta aos itens, a CCI resultante ser´a

pij(η) = ΦSN(∆ij; dj) (2.5)

onde η = {a, b, d, u}, ∆ij = aj(ui − bj) e dj o parˆametro de assimetria associado ao

item j, para i = 1, . . . , I e j = 1, . . . , J . Quando dj = 0, a equa¸c˜ao (2.5) se resume ao

modelo probito de dois parˆametros. dj pode ser visto como um parˆametro de penaliza¸c˜ao:

quando dj > 0, a probabilidade de resposta correta ´e penalizada para baixos valores da

habilidade; j´a quando dj < 0, a probabilidade de resposta correta ao item j ´e penalizada

para altos valores da habilidade.

Por outro lado, pode-se assumir que a proficiˆencia dos indiv´ıduos tem uma distribui¸c˜ao

normal assim´etrica, isto ´e, ui ∼ SN (µu, σu2, d), ∀ i. Uma justificativa apresentada por

Baz´an (2005) para considerar essa distribui¸c˜ao assim´etrica para as proficiˆencias ´e que

uma distribui¸c˜ao normal sim´etrica ´e muito restritiva para modelar conduta humana.

Dessa forma, a combina¸c˜ao destes dois pontos resulta no caso mais geral proposto por

Baz´an (2005): um modelo obtido a partir de uma fun¸c˜ao de liga¸c˜ao normal assim´etrica em

(31)

2.3

Modelo proposto

Levando em conta os modelos assim´etricos apresentados, uma generaliza¸c˜ao poss´ıvel

seria incorporar o parˆametro de acerto casual a tais modelos; e essa ´e uma das propostas

deste trabalho.

De forma geral, seja F (∆ij; dj) a fun¸c˜ao de liga¸c˜ao assim´etrica que descreve

deter-minada CCI, tal que F (∆ij; dj) = [Ψ(D∆ij)]

dj

no caso de se considerar a abordagem

feita por Samejima (2000), e F (∆ij; dj) = ΦSN(∆ij; dj) quando se considera a fun¸c˜ao de

liga¸c˜ao normal assim´etrica. Dessa forma, incorporando o parˆametro de acerto ao acaso,

o modelo proposto ser´a da forma

pij(η) = cj + (1 − cj)F (∆ij; dj), (2.6)

para η = {a, b, c, d, u} e todos os parˆametros conforme j´a descritos, ou seja, Yij ´e o

indi-cador de acerto do item j pelo indiv´ıduo i, ∆ij = aj(ui− bj), βj = (aj, bj, cj)0

correspon-dendo aos parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso respectivamente, dj

o parˆametro de assimetria do item j e ui sendo o valor correspondente `a vari´avel latente

Ui, que descreve a habilidade do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .

Sob essa proposta, uma abordagem Bayesiana ser´a feita considerando a fun¸c˜ao de

liga¸c˜ao log´ıstica, ou seja, fazendo F (∆ij; dj) = [Ψ(D∆ij)]dj e D = 1. Um estudo simulado

ser´a realizado no cap´ıtulo 3 com o objetivo de estudar as propriedades desse modelo; uma

aplica¸c˜ao ao conjunto de dados do projeto Geres descrito ser´a feita no cap´ıtulo 4.

O enfoque Bayesiano ´e adotado para que seja poss´ıvel incorporar informa¸c˜oes a priori

aos parˆametros do modelo. Al´em disso, ele resolve um problema presente na estima¸c˜ao

dos parˆametros quando isso ´e feito por m´axima verossimilhan¸ca, conforme citado em

Andrade et al. (2000). Tal problema ocorre quando algum item ´e respondido correta ou

incorretamente por todos os indiv´ıduos, ou quando um indiv´ıduo responde correta ou

incorretamente a todas as quest˜oes.

Em Bolfarine e Baz´an (2008), uma abordagem Bayesiana com o modelo assim´etrico

(32)

2.4

Inferˆ

encia Bayesiana

Nesta se¸c˜ao o processo para se fazer inferˆencia sobre o modelo (2.6) ´e apresentado.

Os parˆametros do modelo s˜ao η = {β, d, u}, onde β = {a, b, c} se refere aos parˆametros

de discrimina¸c˜ao, dificuldade e acerto ao acaso dos itens, respectivamente, o vetor d

diz respeito aos parˆametros de assimetria associados aos itens e o vetor u se refere

`

as proficiˆencias dos indiv´ıduos. No caso de se desejar fazer inferˆencia sobre o modelo

de trˆes parˆametros sim´etrico (1.1), basta considerar os parˆametros de assimetria fixos

e conhecidos (dj = 1 no caso em que F (.) = Ψ(.) e dj = 0 quando F (.) = Φ(.),

∀ j = 1, . . . , J), e no caso de se querer estudar o modelo log´ıstico assim´etrico de dois

parˆametros, dado pela express˜ao (2.2), basta fazer cj = 0, ∀ j = 1, . . . , J .

Para a realiza¸c˜ao de inferˆencia Bayesiana, ´e necess´ario mencionar alguns elementos

fundamentais, a saber: a fun¸c˜ao de verossimilhan¸ca, que ´e a fun¸c˜ao que descreve

proba-bilisticamente os dados observados; a distribui¸c˜ao a priori para os parˆametros do modelo,

que expressa a informa¸c˜ao inicial que se tem a respeito desses parˆametros antes de se

observar os dados; e a distribui¸c˜ao a posteriori, que sumariza a informa¸c˜ao sobre os

parˆametros, levando em conta os dados observados. Esses elementos est˜ao detalhados a

seguir. • Verossimilhan¸ca l(η; Y ) ∝ I Y i=1 J Y j=1 [pij(η)]yij[1 − pij(η)]1−yij ∝ I Y i=1 J Y j=1 {cj+ (1 − cj)F (∆ij; dj)}yij{1 − [cj+ (1 − cj)F (∆ij; dj)]}1−yij (2.7)

• Distribui¸c˜oes a priori

Assume-se que os parˆametros s˜ao independentes a priori, o que significa que a

priori conjunta ´e dada por

p(η) = p(β)p(d)p(u)

(33)

Para cada componente de η, assume-se as seguintes distribui¸c˜oes:

X aj ∼ LN (µaj, σ

2

aj), bj ∼ N (µbj, σ

2

bj), cj ∼ Beta(αcj, βcj), onde LN (., .)

repre-senta uma distribui¸c˜ao log − normal e N (., .) a distribui¸c˜ao normal,

∀ j = 1, . . . , J;

X dj ∼ LN (µdj, σ

2

dj) caso a fun¸c˜ao de liga¸c˜ao seja a log´ıstica; ou dj ter

qual-quer distribui¸c˜ao definida em R no caso de se considerar a fun¸c˜ao de liga¸c˜ao

normal assim´etrica, ∀ j = 1, . . . , J . Por exemplo, Baz´an (2005) utiliza uma

distribui¸c˜ao t-Student com parˆametro de loca¸c˜ao µ = 0, parˆametro de escala

σ2 = 0.5 e graus de liberdade ν = 2.

X ui ∼ N (0, 1) ∀ i = 1, . . . , I, de modo a resolver o problema de n˜

ao-identifi-cabilidade do modelo.

• Distribui¸c˜ao a posteriori conjunta

A distribui¸c˜ao a posteriori conjunta, que ser´a utilizada para obter as estimativas

de todos os parˆametros do modelo, ´e apresentada a seguir e foi obtida pela aplica¸c˜ao

do Teorema de Bayes: p(η|Y ) ∝ l(η; Y ) " I Y i=1 p(ui) # " J Y j=1 p(aj)p(bj)p(cj) # " J Y j=1 p(dj) # . (2.9)

Em geral ´e dif´ıcil obter a constante de normaliza¸c˜ao de (2.9), o que significa n˜ao

ser poss´ıvel encontrar uma forma anal´ıtica fechada para a distribui¸c˜ao a posteriori.

Sendo assim, alguns m´etodos baseados em simula¸c˜ao poderiam ser utilizados para

aproximar essa distribui¸c˜ao. Aqui ser´a considerado o MCMC (Markov Chain Monte

Carlo), que ´e descrito na se¸c˜ao seguinte.

No caso de se considerar a fun¸c˜ao perda quadr´atica, as estimativas de cada um

dos parˆametros ser˜ao as respectivas m´edias a posteriori. E essa fun¸c˜ao perda ser´a

(34)

2.5

etodo MCMC para fazer inferˆ

encia na TRI

As inferˆencias acerca dos parˆametros dos modelos da TRI ser˜ao feitas a partir de

amostras geradas da distribui¸c˜ao a posteriori conjunta de tais parˆametros. A id´eia

b´asica do MCMC (Markov Chain Monte Carlo) ´e gerar amostras dessa distribui¸c˜ao a

partir de distribui¸c˜oes que constituam uma cadeia de Markov. Tais distribui¸c˜oes s˜ao as

distribui¸c˜oes de transi¸c˜ao da cadeia que devem ser adequadamente escolhidas de forma

que a cadeia convirja para uma distribui¸c˜ao estacion´aria que seja a pr´opria distribui¸c˜ao de

interesse (Gon¸calves, 2006). Ap´os atingir a convergˆencia, isto ´e, descartar os valores

esta-belecidos pelo burn-in, pode-se considerar que os valores simulados formam uma amostra

da distribui¸c˜ao a posteriori conjunta, e poder˜ao ser utilizados para se fazer inferˆencia.

Existem alguns m´etodos para se construir tais cadeias, entre eles o Gibbs

Sam-pling (Geman e Geman, 1984), e que s˜ao casos especiais de uma estrutura geral

desen-volvida por Metropolis et al. (1953) e Hastings (1970), que ´e conhecido como algoritmo

Metropolis-Hastings (MH).

No caso do Gibbs Sampling, originado do processamento de imagens, o m´etodo

con-siste em tomar as distribui¸c˜oes condicionais completas dos parˆametros como as

dis-tribui¸c˜oes de transi¸c˜ao da cadeia de Markov. Assumindo que a distribui¸c˜ao de interesse

´

e dada por π(θ) (que no caso ´e a pr´opria distribui¸c˜ao a posteriori), onde θ = (θ1, . . . , θL)0

e cada componente desse vetor podendo ser um escalar, um vetor ou uma matriz, a

dis-tribui¸c˜ao condicional completa do parˆametro θl´e dada por πl(θl) = π(θl|θ−l), l = 1, . . . , L,

onde θ−l ´e o vetor θ sem a l-´esima componente. Assim, a implementa¸c˜ao desse algoritmo

pode ser feita da seguinte maneira:

1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais

θ(0) = (θ(0)

1 , . . . , θ

(0) L )

0.

(35)

valores: θ1(k) ∼ π(θ1|θ (k−1) 2 , . . . , θ (k−1) L ) θ2(k) ∼ π(θ2|θ (k) 1 , θ (k−1) 3 , . . . , θ (k−1) L ) .. . θL(k) ∼ π(θL|θ (k) 1 , . . . , θ (k) L−1)

3. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia

seja alcan¸cada (considerando o burn-in).

No caso de as distribui¸c˜oes condicionais completas n˜ao serem conhecidas, o algoritmo

de Metropolis-Hastings pode ser utilizado. Assim como no Gibbs Sampling, suponha que

se deseja amostrar de uma distribui¸c˜ao de interesse π atrav´es de cadeias de Markov, que

no caso ´e a distribui¸c˜ao a posteriori, e seja q(θ, φ) uma distribui¸c˜ao de transi¸c˜ao arbitr´aria

da qual se saiba gerar, baseado numa probabilidade α(θ, φ) tal que p(θ, φ) = q(θ, φ)α(θ, φ) se θ 6= φ.

Ent˜ao q(θ, φ) define uma densidade p(θ, .) para todo valor poss´ıvel do parˆametro

dife-rente de θ. Consequentemente, existe uma probabilidade positiva de a cadeia permanecer em θ, dada por

p(θ, θ) = 1 − Z

q(θ, φ)α(θ, φ)dφ.

Dessa forma, baseado em Hastings (1970), a express˜ao mais comumente citada para

a probabilidade de aceita¸c˜ao, ou seja, a probabilidade da cadeia se mover de θ para φ, ´e

α(θ, φ) = min  1,π(φ)q(φ, θ) π(θ)q(θ, φ)  . (2.10)

Em termos pr´aticos, o algoritmo consiste nos seguintes passos:

1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais

θ(0).

(36)

3. Calcule a probabilidade de aceita¸c˜ao do movimento α(θ(k−1), φ) dada por (2.10) e gere z ∼ U (0, 1).

4. Se z ≤ α, aceite o novo valor e fa¸ca θ(k) = φ. Caso contr´ario, se z > α, θ(k) = θ(k−1)

e a cadeia n˜ao se move.

5. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia

seja alcan¸cada (considerando o burn-in).

No caso dos modelos da TRI, apenas algumas distribui¸c˜oes condicionais completas

s˜ao conhecidas. Sendo assim, um m´etodo proposto por Muller (1991) ser´a utilizado e

´

e conhecido como Gibbs Sampling com passos de Metropolis, onde se adota o algoritmo

Gibbs Sampling, mas as componentes que n˜ao podem ser diretamente amostradas de sua

condicional completa s˜ao amostradas da sua proposta q e aceitas com probabilidade dada

pela express˜ao (2.10).

Sendo assim, a implementa¸c˜ao desses m´etodos para os modelos at´e aqui descritos

pode ser feita como se segue. Para a estima¸c˜ao dos parˆametros do modelo, foi feita a

seguinte divis˜ao:

({u1}, . . . , {uI}, {a1, b1, c1}, . . . , {aJ, bJ, cJ}, {d1}, . . . , {dJ}),

ou seja, os valores dos parˆametros a, b e c s˜ao aceitos (ou rejeitados) conjuntamente,

en-quanto as proficiˆencias e os parˆametros de assimetria dos itens s˜ao aceitos (ou rejeitados)

separadamente.

Assim, os passos para a implementa¸c˜ao do algoritmo s˜ao:

1. Inicialize o contador de itera¸c˜oes k = 1.

2. Gere, ∀i = 1, . . . , I, um novo valor u(k)i da densidade qi(u(k−1), u(k)) que ´e aceito

com probabilidade αi(u(k)).

3. Gere, ∀j = 1, . . . , J , um novo valor βj(k) da densidade qj(β(k−1), β(k)) que ´e aceito

com probabilidade αj(β(k)), βj = (aj, bj, cj)0.

4. Gere, ∀j = 1, . . . , J , um novo valor d(k)j da densidade qj(d(k−1), d(k)) que ´e aceito

com probabilidade αj(d(k)).

5. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia

(37)

Cabe mencionar que, embora o parˆametro d seja amostrado, os resultados relacionados

a esse parˆametro ser˜ao apresentados na escala logar´ıtmica. Para isso, ou seja, para obter

amostras do ln de d, basta tomar o logaritmo dos valores amostrados.

Ser˜ao consideradas duas cadeias partindo de pontos iniciais diferentes, conforme a

tabela 2.1:

Tabela 2.1: Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao

dos parˆametros

Cadeias Parˆametros

a(0)j b(0)j c(0)j d(0)j u(0)i

Cadeia 1 1, ∀j 0, ∀j 0.2, ∀j 1, ∀j ebi = √ei−¯e

var(e)

Cadeia 2 1.5, ∀j 1, ∀j 0.4, ∀j 2, ∀j 0, ∀i

onde ebi ´e o escore bruto padronizado do indiv´ıduo i, com ei =

PJ j=1yij, i = 1, . . . , I, ¯ e =hPI i=1ei i I e var(e) =hPI i=1(ei− ¯e)2 i (I − 1). ´

E importante considerar mais de uma cadeia para avaliar corretamente a convergˆencia

dos parˆametros do modelo. As an´alises da se¸c˜ao 1.3 foram feitas a partir da gera¸c˜ao de

uma amostra de tamanho 50 mil para cada uma das cadeias, com burn-in de 45 mil,

o que significa que as estimativas de cada parˆametro foram obtidas levando em conta

uma amostra de tamanho 10 mil. Para todas as demais an´alises, foram geradas amostras

de tamanho 190 mil, com burn-in de 10 mil e espa¸camento entre os pontos amostrados (thin) de 90, resultando que para cada cadeia o tamanho efetivo da amostra foi de 2 mil,

e que as an´alises foram realizadas com base em 4 mil observa¸c˜oes.

No caso dos modelos sim´etricos de trˆes parˆametros, ou seja, no caso de n˜ao se

con-siderar os parˆametros de assimetria dos itens, o algoritmo pode ser implementado

des-considerando o passo 4, que gera um novo valor para cada parˆametro dj. Os mesmos

valores iniciais apresentados na tabela 2.1 s˜ao utilizados para os parˆametros β e u. Em

se tratando do modelo de dois parˆametros assim´etrico, basta considerar βj = (aj, bj)0 e

seguir os passos descritos, fazendo cj = 0, ∀ j = 1, . . . , J .

As express˜oes das distribui¸c˜oes usadas para gerar as propostas, e das probabilidades

(38)

quando se utiliza os modelos sim´etricos de trˆes parˆametros para modelar a probabilidade

de resposta aos itens, quanto aquelas que consideram os modelos assim´etricos como

CCI. As express˜oes para o modelo assim´etrico de dois parˆametros podem ser facilmente

visualizadas fazendo βj = (aj, bj)0 no modelo assim´etrico de trˆes parˆametros.

2.6

Avalia¸

ao de convergˆ

encia e an´

alise de ajuste

Ap´os a implementa¸c˜ao dos algoritmos, ´e necess´ario avaliar a convergˆencia das

esti-mativas dos parˆametros. Para isso, Gelfand e Smith (1990) sugerem alguns diagn´osticos

informais baseados em t´ecnicas gr´aficas. Ap´os n itera¸c˜oes em M cadeias paralelas, pode

ser feito, para cada itera¸c˜ao, um histograma de uma fun¸c˜ao dos parˆametros considerando

as M cadeias. A convergˆencia ´e aceita se os histogramas n˜ao podem ser diferenciados

(Gamerman, 1997). Neste trabalho, a fun¸c˜ao a ser considerada para avalia¸c˜ao da

con-vergˆencia ser´a o logaritmo da distribui¸c˜ao a posteriori.

Al´em dessa avalia¸c˜ao gr´afica, a estat´ıstica de Gelman e Rubin (1992) ser´a considerada

como um indicativo de convergˆencia. Tal estat´ıstica se baseia na id´eia de que as trajet´orias

de cadeias com diferentes valores iniciais deve ser a mesma ap´os a convergˆencia. Supondo

M cadeias paralelas, cada uma com tamanho efetivo n, e uma fun¸c˜ao real ψ = f (θ),

tem-se M trajet´orias {ψ(1)m , ψ(2)m , . . . , ψm(n)}, com m = 1, . . . , M para ψ. As variˆancias S entre

as cadeias e W dentro das cadeias s˜ao dadas por

S = n M − 1 M X m=1 ( ¯ψm− ¯ψ)2 e W = 1 M (n − 1) M X m=1 n X k=1 (ψm(k)− ¯ψm)2,

onde ¯ψm ´e a m´edia das observa¸c˜oes da cadeia m e ¯ψ ´e a m´edia dessas m´edias.

Sob a hip´otese de convergˆencia, todos esses M n valores s˜ao amostrados da distribui¸c˜ao

a posteriori conjunta e σ2

ψ, a variˆancia de ψ, pode ser estimada de maneira consistente

por W , S e a m´edia ponderada:

ˆ σψ2 =  1 − 1 n  W + 1 n  S.

A estat´ıstica de Gelman e Rubin ser´a dada por

ˆ R = s ˆ σ2 ψ W,

(39)

que ser´a sempre maior que 1. A convergˆencia pode ser avaliada pela proximidade de ˆR

a 1; Gelman (1996) sugere aceitar a convergˆencia se ˆR for menor que 1.2.

Caso a convergˆencia seja alcan¸cada, ´e poss´ıvel fazer inferˆencia sobre os parˆametros

em quest˜ao. Para avaliar o ajuste do modelo, algumas medidas ser˜ao obtidas. Para

especific´a-las, denote h = a, b, c, d, u como sendo qualquer um dos parˆametros e Nh = I

quando h = u e Nh = J caso contr´ario, ou seja, Nh corresponde ao n´umero de parˆametros

h a serem estimados. Sendo assim, pode-se escrever cada uma das medidas utilizadas como:

• Erro quadr´atico m´edio: EQMh =

PNh t=1(ˆht−ht)2 Nh , com ˆht = P2 l=1ˆhtl 2 a m´edia a

poste-riori do parˆametro ht nas 2 cadeias, t = 1, . . . , Nh, e ht o parˆametro gerado.

• Erro absoluto m´edio: EM Ah =

PNh

t=1|ˆht−ht|

Nh .

• Coeficiente de correla¸c˜ao de Pearson entre o vetor dos parˆametros estimados, com

componentes ˆht, e o vetor dos parˆametros gerados, com componentes ht,

t = 1, . . . , Nh, denotado por ρ(ˆh, h).

• Pseudo Fator de Bayes: Uma vers˜ao modificada do Fator de Bayes pode ser

uti-lizada como medida de compara¸c˜ao entre modelos (Sahu, 2002). Alguns

proble-mas que ocorrem com o c´alculo do Fator de Bayes n˜ao aparecem nessa vers˜ao

modificada. Denotando y(r) como o conjunto das observa¸c˜oes (respostas) com a

r-´esima componente deletada, define-se a ordenada preditiva condicional (OP C)

como p(yr|y(r)) = R p(yr|η, y(r))p(η|y(r))dη. Assim, o pseudo fator de Bayes (P sF B)

para comparar dois modelos, M1 e M2, ´e definido como a raz˜ao de suas OP C’s,

P sF B(M1, M2) = IJ Y r=1 p(yr|y(r), M1) p(yr|y(r), M2)

. Uma proposta para estimar o numerador

e/ou denominador do P sF B ´e ˆp(yij|y(r)) = B1

B X b=1 1 pyij ij (1 − pij)1−yij !−1 , com pij

calculado considerando as estimativas `a posteriori dos parˆametros sob o modelo

adotado, e B o tamanho da amostra. Note que o P sF B est´a fundamentado nas

distribui¸c˜oes preditivas obtidas para dados futuros. Quanto maior o P sF B, maior

(40)

tabela de classifica¸c˜ao considerando o fator de Bayes para decidir qu˜ao forte ´e a

evidˆencia de um modelo sobre o outro, e que vale tamb´em para o P sF B.

O software escolhido para implementa¸c˜ao dos algoritmos foi o OxMetrics41, enquanto

as medidas de ajuste e os gr´aficos foram gerados no R 2.

2.7

Apˆ

endice

A seguir encontram-se as express˜oes necess´arias `a implementa¸c˜ao do algoritmo MCMC,

tais como as distribui¸c˜oes propostas e as probabilidades de aceita¸c˜ao referidas na se¸c˜ao

2.5, usadas para gerar amostras de (2.9). Ser˜ao apresentadas tanto aquelas que foram

utilizadas quando se adotou o modelo (1.1) como CCI, quanto aquelas que foram uti-lizadas quando o modelo considerado para a modelar a probabilidade de resposta aos itens era dado por (2.6).

2.7.1

Express˜

oes quando a CCI ´

e dada por (1.1) - modelos

sim´

etricos de trˆ

es parˆ

ametros

• Proficiˆencias

Para a proficiˆencia de cada indiv´ıduo, a distribui¸c˜ao de transi¸c˜ao da cadeia ´e dada

por u(k)i ∼ Nu(k−1)i , (0.2)2  , o que resulta em qi u(k−1), u(k) = fN  u(k)i ; u(k−1)i , (0.2)2  .

A probabilidade de aceitar o valor gerado ´e dada por

αi u(k) = min n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj) p (ui).

• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso

Para os parˆametros de discrimina¸c˜ao, dificuldade e acerto casual, as distribui¸c˜oes

propostas s˜ao:

1http://www.oxmetrics.net

(41)

a(k)j ∼ LNln(a(k−1)j ) − 0.052

2 , (0.05)

2;

b(k)j ∼ Nb(k−1)j , (0.2)2;

c(k)j ∼ Umax(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05).

Dessa forma, fazendo βj(k)=a(k)j , b(k)j , c(k)j , tem-se que

qj β(k−1), β(k) = fLN  a(k)j ; ln(a(k−1)j ), (0.05)2f N  b(k)j ; b(k−1)j , (0.2)2 fU  c(k)j ; max(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05).

J´a a probabilidade de aceitar o novo vetor gerado βj(k) ´e da seguinte forma:

αj β(k) = min n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , onde pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj) p (aj) p (bj) p (cj).

2.7.2

Express˜

oes quando a CCI ´

e dada por (2.6) - modelos

as-sim´

etricos de trˆ

es parˆ

ametros propostos

• Proficiˆencias

No caso de se considerar o modelo assim´etrico de trˆes parˆametros como CCI, a

dis-tribui¸c˜ao de transi¸c˜ao da habilidade de cada indiv´ıduo ser´a u(k)i ∼ Nu(k−1)i , (0.2)2

 , o

que resulta em qi u(k−1), u(k) = fN



u(k)i ; u(k−1)i , (0.2)2.

Quanto `a probabilidade de aceita¸c˜ao, essa ser´a αi u(k) = min

n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj, dj) p (ui).

• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso

Para os parˆametros a, b e c, os novos valores da cadeia ser˜ao gerados a partir das

seguintes distribui¸c˜oes:

a(k)j ∼ LNln(a(k−1)j ) − 0.0522, (0.05)2  ; b(k)j ∼ Nb(k−1)j , (0.2)2; c(k)j ∼ Umax(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05)  .

(42)

Fazendo βj(k)=a(k)j , b(k)j , c(k)j , resulta que qj β(k−1), β(k) = fLN  a(k)j ; ln(a(k−1)j ), (0.05)2f N  b(k)j ; b(k−1)j , (0.2)2 fU  c(k)j ; max(0, c(k−1)j − 0.05), min(1, c(k−1)j + 0.05),

cuja probabilidade de aceita¸c˜ao de βj(k) ´e αj β(k) = min

n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , com pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (aj) p (bj) p (cj).

• Parˆametro de assimetria

No caso de se considerar a fun¸c˜ao de liga¸c˜ao log´ıstica, o que implica que o parˆametro

de assimetria s´o assume valores positivos, a distribui¸c˜ao proposta ser´a

d(k)j ∼ LNln(d(k−1)j ) − 0.0522, (0.05)2  , de forma que qj d(k−1), d(k) = fLN  d(k)j ; ln(d(k−1)j ) − 0.0522, (0.05)2.

A probabilidade de mover a cadeia para esse novo valor gerado ´e dada por

αj d(k) = min n 1, pj(d(k)|.)qj(d(k),d(k−1)) pj(d(k−1)|.)qj(d(k−1),d(k)) o , para pj(d|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (dj).

Para o caso de se considerar a fun¸c˜ao de liga¸c˜ao normal, implicando que d ∈ R,

ou equivalentemente que δ ∈ [−1, 1] devido `a rela¸c˜ao δ = (1+dd2)1/2, uma distribui¸c˜ao

conveniente pode ser escolhida como proposta tanto utilizando a parametriza¸c˜ao com d

(43)

Cap´ıtulo 3

Estudos simulados com modelos

assim´

etricos

Neste cap´ıtulo ser˜ao feitos estudos simulados com o modelo (2.6) fazendo

F (∆ij; dj) = [Ψ(∆ij)]

dj

, bem como com o modelo (2.2), a fim de verificar quais as suas

caracter´ısticas. An´alises que envolvem escolhas de prioris tamb´em ser˜ao realizadas, com

o objetivo de averiguar quais resultam em melhores estimativas para os parˆametros.

Para relembrar, o modelo estudado de trˆes parˆametros descreve a probabilidade de

resposta correta ao item considerando a fun¸c˜ao de liga¸c˜ao log´ıstica assim´etrica, ou seja,

pij(η) = cj+ (1 − cj) [Ψ(∆ij)]dj, (3.1)

para i = 1, . . . , I e j = 1, . . . , J , η = {β, d, u}.

Para os estudos com esse modelo, foi obtido, a partir dele, um conjunto de dados

com 30 itens e 3000 indiv´ıduos. Os parˆametros de discrimina¸c˜ao foram gerados a partir

de uma distribui¸c˜ao LN (−0.1, 0.25), o que faz com que 99% dos valores estejam entre

0.202 e 4.055; os parˆametros de dificuldade e as proficiˆencias dos indiv´ıduos a partir de

uma distribui¸c˜ao normal padronizada, os parˆametros c a partir de uma Beta(5, 17) e,

para os parˆametros de assimetria, foram fixados alguns valores tal que existissem itens

com assimetria positiva, negativa e itens sim´etricos. Assim, dj = 0.2 para j = 1, . . . , 10,

dj = 1 para j = 11, . . . , 20 e dj = 4 para j = 21, . . . , 30. Nos estudos simulados com o

(44)

em 0. Para os demais parˆametros, as distribui¸c˜oes consideradas para a gera¸c˜ao dos dados foram as mesmas.

No que diz respeito `as distribui¸c˜oes a priori, na se¸c˜ao a seguir ´e feito um estudo

com-parativo entre dois conjuntos de prioris, a fim de escolher qual deles se ajusta melhor ao

connjunto dos dados, levando em conta as medidas descritas na se¸c˜ao 2.6, e considerando

como CCI o modelo assim´etrico de trˆes parˆametros. Sup˜oe-se que o conjunto de prioris

escolhido para esse caso tamb´em seja o que melhor se ajusta quando se considerar o

modelo com dois parˆametros, visto que a priori atribu´ıda para o parˆametro c ´e bastante

informativa.

Posteriormente, nas se¸c˜oes 3.2 e 3.3, encontram-se os resultados do estudo simulado

com os modelos assim´etricos de trˆes e dois parˆametros, respectivamente, levando em

conta as prioris escolhidas.

3.1

Escolha das distribui¸

oes a priori

Ser´a feita an´alise considerando dois conjuntos de distribui¸c˜oes a priori com o objetivo

de verificar qual resulta em melhor aproxima¸c˜ao para os parˆametros do modelo. A

diferen¸ca entre esses conjuntos est´a na especifica¸c˜ao dos hiperparˆametros da distribui¸c˜ao

dos parˆametros dj, conforme cen´arios abaixo:

Cen´ario 1: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−0.8, 1.6)

∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I;

Cen´ario 2: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−1, 2)

∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I.

A distribui¸c˜ao para os parˆametros de discrimina¸c˜ao, LN (0, 0.5) tem m´edia 1.284,

moda 0.607, mediana 1 e desvio-padr˜ao 1.034, o que significa que 99% dos seus valores

est˜ao concentrados entre 0.120 e 8.342. Acredita-se que essa priori seja conveniente j´a

que se espera que os valores verdadeiros desses parˆametros estejam entre 0 e 4 (Pasquali,

2003). Quanto aos parˆametros de dificuldade, sendo a distribui¸c˜ao a priori uma normal

Referências

Documentos relacionados

MARIA ISABEL SOUSA DA SILVA Centro Hospitalar e Universitário de Coimbra MARIA JACINTA PIRES BARREIROS GONÇALVES. MARIA JOANA

Quadros em sua mensagem ao Congresso Nacional em 15 de março de 1961, na qual procurou definir as linhas da política exterior do Brasil e deixou claro que a

III - ocupação de bolsa parcial do ProUni e de utilização de financiamento do FIES para mesmo curso e mesma IES, se a soma do percentual da bolsa e do financiamento resultar em

Algumas vezes negócios relacionados a Propriedade Intelectual são questionados judicialmente em função de que a utilização de um método de avaliação ser muito subjetivo. Se

O último ensaio consistiu em regular as tomadas para os seus valores mínimos (0.9 para T4 e 0.95 para T5), mas registaram- se valores ligeiramente superiores para as

Nesse conceito, reconhece-se a diversidade de conhecimentos e habilidades entre os membros da equipe, que se complementam e enriquecem o trabalho como um todo, contribuindo

Neste estudo consideramos o modelo LWcr sob os trˆ es esquemas de ativa¸ c˜ ao (primeira, ´ ultima e aleat´ oria) com a distribui¸ c˜ ao Weibull com parˆ ametros a = 2 e b = 5 para

Neste subcapítulo serão apresentados apenas alguns exemplos de palas que foram estudadas conforme os meses do ano e a necessidade de sombrear no verão (de junho a setembro), bem