Teoria de Resposta ao Item: Uma Abordagem Generalizada das Curvas Características dos Itens

(1)

Teoria de Resposta ao Item: uma

abordagem generalizada das Curvas

Caracter´ısticas dos Itens

por

Vera L´

ucia Filgueira dos Santos

DME - IM - UFRJ

2009

(2)

Teoria de Resposta ao Item: uma

abordagem generalizada das Curvas

Caracter´ısticas dos Itens

Vera L´

ucia Filgueira dos Santos

Disserta¸c˜ao submetida ao Corpo Docente do Instituto de Matem´atica - Departamento

de M´etodos Estat´ısticos da Universidade Federal do Rio de Janeiro - UFRJ, como parte

dos requisitos necessários à obten¸cão do grau de Mestre em Estat´ıstica.

Aprovada por:

Prof. Dani Gamerman PhD - IM - UFRJ - Orientador.

Prof. Tufi Machado Soares PhD - CAEd - UFJF - Co-orientador.

Prof. Fernando Antˆonio da Silva Moura

PhD - IM - UFRJ.

Prof. Joaquim Jos´e Soares Neto

PhD - CESPE - UnB.

Caio Lucidius Naberezny Azevedo Dr. Sc. - IME - USP (Suplente).

Rio de Janeiro, RJ - Brasil 2009

(3)

FICHA CATALOGR ´AFICA

Santos, Vera L´ucia Filgueira dos.

Teoria de Resposta ao Item: uma abordagem generalizada

das Curvas Caracter´ısticas dos Itens / Vera L´ucia Filgueira dos

Santos. – Rio de Janeiro: UFRJ/ IM - DME, 2009. xv, 87p.: il..; 31cm

Orientadores: Dani Gamerman e Tufi Machado Soares

Disserta¸c˜ao (mestrado) - Universidade Federal do Rio de Janeiro,

IM, DME, Programa de P´os-Gradua¸c˜ao em Estat´ıstica, 2009.

Referˆencias bibliogr´aficas: f. 85-87

1. Teoria de Resposta ao Item. 2. Estima¸c˜ao Bayesiana via

MCMC. 3. Assimetria. - Mestrado. I. Gamerman, Dani. II. Universidade Federal do Rio de Janeiro. III. T´ıtulo.

(4)

`

A minha querida e amada fam´ılia, pelo apoio incondicional,

mesmo estando a mais de 1.000km de distˆancia.

Ao Andr´e, por ser t˜ao compreensivo e amoroso.

(5)

“(...) Nunca deixe que lhe digam que n˜ao vale a pena acreditar no sonho que se tem, ou

que os seus planos nunca vão dar certo, ou que você nunca vai ser alguém. (...)”

Renato Russo

“Pedi, e dar-se-vos-´a; buscai, e encontrareis; batei, e abrir-se-vos-´a. Porque, aquele que

pede, recebe; e, o que busca, encontra; e, ao que bate, abrir-se-lhe-´a. E qual de entre v´os

´

e o homem que, pedindo-lhe p˜ao o seu filho, lhe dar´a uma pedra? E, pedindo-lhe peixe,

lhe dar´a uma serpente? Se v´os, pois, sendo maus, sabeis dar boas coisas aos vossos

filhos, quanto mais vosso Pai, que está nos céus, dará bens aos que lhe pedirem?”

(6)

Agradecimentos

Sou grata...

A Deus, pela sa´ude, for¸ca, coragem e persistˆencia a mim dadas, e pelo consolo nos

mo-mentos de saudade. `

A minha querida fam´ılia, pelo amor, pelo exemplo e pelos princ´ıpios que s˜ao parte da

minha essˆencia.

Ao meu André, por fazer os meus dias tão mais alegres e me mostrar que nem só de

trabalho vive o ser humano. `

As minhas irmãs de cora¸cão e companheiras de república, por todos os momentos de

descontra¸c˜ao e pela amizade verdadeira.

Aos meus amigos do DME, por serem a minha fam´ılia carioca e pelas tantas conversas

no hor´ario do almo¸co (seja para falar de casamento ou de inferˆencia Bayesiana).

Ao meu orientador Dani e ao meu co-orientador Tufi, por todos os ensinamentos passados

e pela oportunidade de trabalhar no tema dessa disserta¸c˜ao.

Aos professores Fernando e Neto, e ao Caio, por aceitarem fazer parte da minha banca. Novamente ao professor Neto, que desde o come¸co abriu muitas portas para o meu cresci-mento profissional.

`

A este programa de p´os-gradua¸c˜ao, pelo voto de confian¸ca.

Aos meus professores da UnB, que foram os primeiros a me incentivar. Ao CAEd - UFJF por ter cedido, gentilmente, os dados aqui tratados. Ao CNPq, por ter financiado este estudo.

(7)

Resumo

A Teoria de Resposta ao Item (TRI) para respostas dicotˆomicas considera, em geral,

um conjunto de J itens aplicados a I indiv´ıduos. Os modelos sim´etricos mais

utiliza-dos para descrever a probabilidade de resposta correta a tais itens, tamb´em conhecidos

como Curvas Caracter´ısticas dos Itens (CCI), s˜ao as distribui¸c˜oes Normal e Log´ıstica.

Esses modelos levam em conta os parˆametros dos itens (a discrimina¸c˜ao, a dificuldade

e a probabilidade de acerto ao acaso) e a habilidade ou tra¸co latente dos indiv´ıduos

para caracterizar tais probabilidades. Generaliza¸c˜oes desses modelos tˆem sido

encon-tradas na literatura, como por exemplo em Baz´an (2005) e em Samejima (2000). Ambas

generaliza¸c˜oes consideram que a probabilidade de acerto ao acaso ´e nula (modelo de dois

parˆametros) e incorporam um parˆametro de assimetria aos itens.

O objetivo aqui ´e apresentar o que foi proposto em ambos trabalhos, mas permitindo

que o parˆametro de acerto casual seja diferente de zero. Al´em disso, estudaremos formas

de deteçcão de assimetria através da especifica¸cão de distribui¸cões a priori apropriadas

para este fim. Estudos serão feitos considerando a generaliza¸cão feita à partir do que

´

e apresentado por Samejima (2000) utilizando metodologia Bayesiana e implementando

via métodos MCMC. Todos os estudos serão primeiramente à luz de dados simulados e

em seguida considerando dados reais.

Palavras Chaves: Teoria de Resposta ao Item, Estima¸c˜ao Bayesiana via MCMC,

(8)

Abstract

The Item Response Theory (IRT) for dichotomous response considers, in general, a set of J items applied at I individuals. The symmetrical models often used to describe the probability of correct response to these items, also called Item Curve Characteristic (ICC), are the Normal and Logistic distributions. These models take into consideration the items parameters (the discrimination, the difficulty and the guessing parameter) and the ability of individuals to characterize these probabilities. Generalizations of these

models are found on literature, for example at Baz´an (2005) and Samejima (2000). Both

generalizations consider that the guessing parameter is null (two parameter model) and introduce a asymmetry parameter into items.

The objective here is to present what was proposed in both works, but allowing the guessing parameter to be different of zero. Also, we will study ways of asymmetry de-tecting through appropriate priors specification. Studies will be made considering the generalization from the Samejima (2000), using Bayesian methodology and implementing via MCMC methods. All studies first will be with simulated data, and later, with real data.

(9)

Sum´

ario

1 Introdu¸c˜ao 1

1.1 Teoria de Resposta ao Item . . . 2

1.2 Descri¸c˜ao dos dados reais . . . 5

1.3 An´alise dos dados reais via TRI convencional . . . 6

1.4 Sum´ario da disserta¸c˜ao . . . 10

1.5 Apˆendice . . . 10

2 Distribui¸cões assimétricas na TRI 12 2.1 Fam´ılia TRI log´ıstica assimétrica . . . 13

2.2 Fam´ılia TRI normal assim´etrica . . . 14

2.3 Modelo proposto . . . 16

2.4 Inferˆencia Bayesiana . . . 17

2.5 M´etodo MCMC para fazer inferˆencia na TRI . . . 19

2.6 Avalia¸cão de convergência e análise de ajuste . . . 23

2.7.1 Expressões quando a CCI é dada por (1.1) - modelos simétricos de três parâmetros . . . 25

2.7.2 Expressões quando a CCI é dada por (2.6) - modelos assimétricos de três parâmetros propostos . . . 26

3 Estudos simulados com modelos assim´etricos 28 3.1 Escolha das distribui¸c˜oes a priori . . . 29

(10)

3.3 Resultados do estudo simulado com o modelo de dois parˆametros assim´etrico 36

4 Análise dos dados reais com modelos assimétricos 41 4.1 Resultados do estudo com o modelo assimétrico de três parâmetros . . . 41

4.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 44

4.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 47

5 Distribui¸cões assimétricas na TRI com deteçcão de assimetria 51 5.1 Modelo proposto . . . 51

5.2 Inferˆencia Bayesiana . . . 52

5.3 M´etodo MCMC para fazer inferˆencia na TRI . . . 53

6 Estudos simulados com modelos assimétricos incluindo deteçcão de as-simetria 57 6.1 Compara¸cão entre os métodos de amostragem . . . 59

6.2 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-simétrico de três parâmetros . . . 63

6.3 Resultados do estudo simulado com o algoritmo escolhido e o modelo as-sim´etrico de dois parˆametros . . . 66

7 Análise dos dados reais com modelos assimétricos incluindo deteçcão de assimetria 74 7.1 Resultados do estudo com o modelo assimétrico de três parâmetros . . . 75

7.2 Resultados do estudo com o modelo assim´etrico de dois parˆametros . . . 78

7.3 Compara¸c˜ao entre os modelos ajustados aos dados do projeto Geres . . . 81

8 Conclus˜oes e trabalhos futuros 82

(11)

Lista de Tabelas

1.1 Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres . 8

2.1 Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao

dos parˆametros . . . 22

3.1 Resultados das medidas utilizadas para a escolha das distribui¸c˜oes a priori

- Cen´ario 1 versus Cen´ario 2 . . . 31

credi-bilidade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

considerando o modelo assimétrico de três parâmetros . . . 43

considerando o modelo assim´etrico de dois parˆametros . . . 46

6.1 M´edia a posteriori dos parˆametros π para alguns itens com diferentes

ta-manhos de amostra para os dois algoritmos . . . 61

considerando o modelo assimétrico de três parâmetros via algoritmo 2 . . 78

(12)

Lista de Figuras

1.1 CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2 . . . 4

1.2 Propor¸c˜ao de acerto dos itens do projeto Geres . . . 6

1.3 Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

projeto Geres e respectivos intervalos de credibilidade de 95% . . . 7

1.4 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do

projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada . . . 9

2.1 CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d . . . 14

3.1 Valores reais versus estimados dos parˆametros dos itens considerando os

cenários 1 e 2. O ponto representa o cenário 1 e o “x”, o cenário 2 . . . 32

3.2 Trajet´oria da log-posteriori das 2 cadeias geradas . . . 34

3.3 Valores reais e estimativas dos parˆametros dos itens com seus respectivos

intervalos de credibilidade de 95%. O ponto representa o valor estimado e

a linha horizontal dentro do intervalo, o valor real . . . 35

3.4 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de

da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e

valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos 35

3.5 Trajet´oria da log-posteriori das 2 cadeias geradas considerando o modelo

assim´etrico de dois parˆametros . . . 37

intervalos de credibilidade de 95% considerando o modelo assim´etrico de

dois parˆametros. O ponto representa o valor estimado e a linha horizontal

(13)

3.7 Histograma das proficiˆencias estimadas dos indiv´ıduos do conjunto de

da-dos simulada-dos sobre a densidade da distribui¸c˜ao normal padronizada, e

valores reais versus estimados das proficiˆencias desses mesmos indiv´ıduos,

assimétrico de três parâmetros para os dados do projeto Geres . . . 42

projeto Geres e respectivos intervalos de credibilidade de 95% considerando

o modelo assimétrico de três parâmetros . . . 43

4.3 Histograma das proficiˆencias estimadas para os indiv´ıduos participantes

do projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

considerando o modelo assimétrico de três parâmetros . . . 44

assim´etrico de dois parˆametros para os dados do projeto Geres . . . 45

o modelo assim´etrico de dois parˆametros . . . 46

6.1 Densidades das distribui¸c˜oes Beta(0.01, 0.01) e Beta(2, 2) . . . 58

intervalos de credibilidade de 95% considerando os algoritmos 1 e 2. O ponto representa o valor estimado e a linha horizontal dentro do intervalo,

o valor real . . . 60

6.3 Estimativas pontuais (m´edias a posteriori) dos π para os dois algoritmos.

O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 60

(14)

6.5 Valores reais e estimativas dos parˆametros dos itens com seus respectivos intervalos de credibilidade de 95% obtidos via algoritmo 2. O ponto rep-resenta o valor estimado e a linha horizontal dentro do intervalo, o valor

real . . . 64

6.6 Estimativas pontuais (m´edias a posteriori) dos π para o algoritmo

escol-hido. O ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos 65

6.7 Histograma das proficiˆencias estimadas sobre a curva da densidade da

dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,

con-siderando o modelo asimétrico de três parâmetros e o algoritmo 2 . . . . 65

assim´etrico de dois parˆametros via algoritmo 2 . . . 67

intervalos de credibilidade de 95% e m´edia a posteriori dos parˆametros π

via algoritmo 2. No gr´afico de a, b e d, o ponto representa o valor estimado

e a linha horizontal dentro do intervalo, o valor real. No gr´afico dos π’s,

o ponto representa os itens assim´etricos, e o “x”, os itens sim´etricos . . 67

6.10 Histograma das proficiˆencias estimadas sobre a curva da densidade da

dis-tribui¸c˜ao normal padronizada e proficiˆencias geradas e estimadas,

con-siderando o modelo assimétrico de três parâmetros e o algoritmo 2 . . . 68

assimétrico de três parâmetros para os dados do projeto Geres, via

algo-ritmo 2 . . . 75

o modelo assimétrico de três parâmetros via algoritmo 2 . . . 76

7.3 Estimativas pontuais (m´edias a posteriori) dos π . . . 76

(15)

assim´etrico de dois parˆametros para os dados do projeto Geres, via

algo-ritmo 2 . . . 78

o modelo assimétrico de dois parâmetros via algoritmo 2, e média a

pos-teriori dos parˆametros π . . . 79

(16)

Cap´ıtulo 1

Introdu¸

c˜

ao

A psicometria é um conjunto de técnicas cujo objetivo é mensurar as habilidades

cognitivas dos indiv´ıduos expressas por meio do comportamento humano, sendo uma das

principais t´ecnicas a Teoria de Resposta ao Item (TRI) que, embora utilizada em diversas

´

areas, destaca-se especialmente em processos de avalia¸c˜ao educacional em larga escala.

A TRI ´e usada para analisar dados provenientes de respostas a itens presentes em

instrumentos avaliativos de desempenho, question´arios, entre outros, e sugere formas

de representar a probabilidade de um indiv´ıduo dar uma determinada resposta a um

item levando em conta os seus tra¸cos latentes, proficiˆencias ou habilidades e algumas

caracter´ısticas do item. Tradicionalmente, essa rela¸cão é modelada através de fun¸cões de

liga¸cão simétricas, tais como as liga¸cões probito e logito. Tal rela¸cão é conhecida como

Curva Caracter´ıstica do Item (CCI).

Mas à medida que a aplica¸cão da TRI cresce, surgem algumas questões que devem ser

levadas em conta para o aprimoramento da técnica. Uma dessas questões é se as fun¸cões

de liga¸cão simétricas utilizadas para a CCI são adequadas. Como indicado por Samejima

(1997), CCI’s assim´etricas podem ser mais apropriadas para modelar comportamento

humano. Sendo assim, o objetivo desse trabalho ´e apresentar o que foi proposto por

Samejima (2000) e por Baz´an (2005) e algumas generaliza¸c˜oes, de modo a permitir formas

mais gerais para a CCI.

A seguir, uma breve revis˜ao acerca da Teoria de Resposta ao Item ´e apresentada.

(17)

descrito. Na se¸c˜ao seguinte, esse conjunto de dados ser´a analisado via TRI convencional.

E finalmente, na se¸cão 1.4, um sumário do trabalho é apresentado.

1.1 Teoria de Resposta ao Item

Segundo Baker (1992), os trabalhos de Lawlel (1943) e Lord (1952) s˜ao o marco inicial

dos estudos relacionados à Teoria de Resposta ao Item. Essa propõe modelos paramétricos

para representar a probabilidade pij(η) de um indiv´ıduo i responder corretamente a um

item j como fun¸cão de parâmetros η, que contemplam parâmetros do item (a saber:

discrimina¸c˜ao, dificuldade e acerto casual) e habilidade ou proficiˆencia do indiv´ıduo i, ui,

i = 1, . . . , I e j = 1, . . . , J .

Esses modelos, por sua vez, dependem da natureza dos itens, isto ´e, se eles s˜ao

dicotômicos (corrigidos como certo ou errado) ou não dicotômicos (itens de resposta

livre ou itens de m´ultipla escolha avaliados de forma graduada), da quantidade de tra¸cos

latentes ou habilidades que est˜ao sendo medidas (apenas uma ou mais de uma) e do

número de popula¸cões envolvidas (apenas uma ou mais de uma). Aqui, serão considerados

apenas aqueles que tratam os itens de forma dicotˆomica, que avaliam apenas um tra¸co

latente (os chamados modelos unidimensionais) e em uma única popula¸cão. Além disso,

sup˜oe-se que as respostas oriundas de indiv´ıduos diferentes s˜ao independentes e que os

itens s˜ao respondidos de forma independente por cada indiv´ıduo, fixada sua habilidade

(suposi¸c˜ao conhecida como Independˆencia Local).

Dentro dessa classe, um modelo bastante utilizado ´e conhecido como modelo de trˆes

parâmetros pois envolve a discrimina¸cão, a dificuldade e o acerto casual do item, além

da proficiˆencia do indiv´ıduo.

A express˜ao geral para a probabilidade de resposta correta ´e dada por

pij(η) = P (Yij = 1|η) = cj+ (1 − cj)F (∆ij), (1.1)

onde Yij ´e o indicador de acerto do item j pelo indiv´ıduo i, η = {β, u}, β = {a, b, c}

correspondendo aos parˆametros de discrimina¸c˜ao, de dificuldade e de acerto ao acaso,

(18)

fun¸cão de distribui¸cão acumulada qualquer, e ∆ij = aj(ui − bj) é uma fun¸cão linear de

ui, com ui sendo o valor correspondente `a vari´avel latente Ui, que descreve a habilidade

do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .

Em Baker (1992) encontram-se os casos mais comuns para a distribui¸c˜ao F (.), que

são F (.) = Φ(.) ou F (.) = Ψ(.), onde Φ(.) é a fun¸cão de distribui¸cão acumulada (fda) de

uma distribui¸cão normal padrão, e Ψ é a fda de uma distribui¸cão log´ıstica padrão, que é

definida como Ψ(t) = _1+exp{−t}1 _{, t ∈ R. O primeiro caso ´e conhecido como modelo normal}

de três parâmetros, e quando F (.) = Ψ(.), tem-se o modelo log´ıstico de três parâmetros.

Em geral, D, que representa um fator de escala, ´e igual a 1. Uma rela¸c˜ao importante

entre as fda log´ıstica e normal ´e dada por

|Ψ(D∆ij) − Φ(∆ij)| < 0.01, −∞ < ui < ∞,

onde D deve ser igual a 1.702 para que a rela¸c˜ao acima permita aproximar o modelo

normal pelo log´ıstico (Baker, 1992).

No contexto de modelos lineares generalizados, a representa¸c˜ao dada em (1.1) utiliza

uma fun¸cão de liga¸cão F−1, sendo Φ−1 conhecida como fun¸cão de liga¸cão probito e Ψ−1

como a fun¸c˜ao de liga¸c˜ao logito.

Outros modelos podem ser obtidos a partir dos que foram apresentados. Por exemplo,

se se assume que o parˆametro relacionado ao acerto casual ´e nulo em todos os itens,

obtém-se o modelo conhecido como modelo de dois parâmetros; já quando o valor do

parâmetro de discrimina¸cão aj é o mesmo para todos os itens, além dos parâmetros cj

nulos ∀j, o modelo de um parˆametro ´e obtido.

No que diz respeito à interpreta¸cão de cada um dos parâmetros dos itens, essa pode

ser feita com o aux´ılio da figura 1.1. Ela ilustra o fato que os modelos descritos at´e aqui

levam em conta que indiv´ıduos com maior habilidade possuem maior probabilidade de

acertar o item e que esta rela¸cão é não linear, tendo a forma de “S”. O parâmetro b é

medido na mesma unidade da habilidade u e quanto maior o valor de b, mais dif´ıcil ser´a o

item. Ele pode ser visto como a habilidade necess´aria para que a probabilidade de acerto

do item j seja (1 + cj)/2.

(19)

proba-Figura 1.1: CCI com parˆametros aj = 1.3, bj = 1.2 e cj = 0.2

bilidade de um aluno com baixa habilidade responder corretamente o item, ou seja, lim

ui→−∞

pij(η) = cj. Assim, o parˆametro c pode ser visto como a ass´ıntota inferior da CCI.

Se um item de m´ultipla escolha ´e constru´ıdo de tal forma que as alternativas incorretas

(distratores) funcionem muito bem, ou seja, se os distratores cumprem o seu papel de

trazer informa¸c˜ao ao avaliador a respeito da manifesta¸c˜ao do racioc´ınio do aluno quando

busca a solu¸c˜ao para a tarefa imposta pelo item, mas sem chamar mais aten¸c˜ao do que

a resposta correta, provavelmente o parâmetro c estará em torno do inverso do número

de alternativas. Todavia, na prática, observam-se valores desde próximos de zero até

pr´oximos a 0.5, raramente ultrapassando esse valor.

Já o parâmetro a é proporcional à derivada da tangente da curva no ponto de

in-flexão. Dessa forma, itens com a negativo não são esperados sob esses modelos, uma

vez que indicariam que a probabilidade de responder corretamente o item diminui com

o aumento da habilidade. Baixos valores de a indicam que a quest˜ao tem pouco poder

de discrimina¸c˜ao (alunos com habilidades bastante diferentes tˆem aproximadamente a

mesma probabilidade de responder corretamente o item). Segundo Baker (2001),

con-siderando a representa¸cão com o modelo logito, itens cujos parâmetros de discrimina¸cão

estão entre 0.01 e 0.34 são classificados como itens de discrimina¸cão muito baixa ; entre

0.35 e 0.64, de baixa discrimina¸c˜ao; entre 0.65 e 1.34, de discrimina¸c˜ao moderada; entre

1.35 e 1.69, de discrimina¸c˜ao alta, e maior que 1.70, de discrimina¸c˜ao muito alta. Para

(20)

valores pelo fator de escala D = 1.702.

Um ponto importante a ser mencionado é que o modelo (1.1) é não identificável, pois

qualquer transforma¸c˜ao do tipo u∗ = (ku + γ), b∗ = (kb + γ) e a∗ = a_k, para k > 0

e γ ∈ R, n˜ao altera a probabilidade representada pelo modelo. E uma das maneiras

mais comuns para tornar o modelo identificável é fixar uma distribui¸cão a priori própria

para as proficiências. Em geral adota-se a distribui¸cão normal padronizada, o que é feito

nesta disserta¸cão, definindo dessa forma a escala com média 0 e desvio-padrão 1 para as

habilidades.

1.2 Descri¸

c˜

ao dos dados reais

O conjunto de dados reais que será utilizado ao longo desta disserta¸cão é do Projeto

Geres, que ´e um projeto de pesquisa que focaliza a aprendizagem nas primeiras fases

do Ensino Fundamental, levando em conta os fatores escolares e s´ocio-familiares que

incidem sobre o desempenho escolar, al´em de outras dimens˜oes, como a auto-estima e a

motiva¸c˜ao, que podem afetar o desenvolvimento dos alunos.

Durante um per´ıodo de quatro anos, de 2005 a 2008, aproximadamente 27000 alunos de cinco cidades brasileiras, de uma amostra de 309 escolas estaduais, municipais e

pri-vadas, foram testados todo ano em L´ıngua Portuguesa e Matem´atica, enquanto os

profes-sores, diretores de escola, pais e os pr´oprios alunos foram entrevistados para determinar

os impactos na aprendizagem dos fatores escolares e familiares. Os fatores incorporados

a esta pesquisa foram escolhidos mediante uma revis˜ao extensa da literatura nacional e

internacional, com um interesse especial para aquelas caracter´ısticas indicadas como de

relevância no contexto brasileiro, sobretudo os recursos da escola, a organiza¸cão e gestão

da escola, o clima acadêmico, a forma¸cão e salário do professor e a pedagogia de sala de

aula. A escolha destes fatores tamb´em se deve ao interesse dos pesquisadores em oferecer

subs´ıdios pr´aticos para a formula¸c˜ao de pol´ıticas voltadas para a melhoria da qualidade

e da equidade da educa¸c˜ao no Brasil1_.

1_{Texto adaptado do site http://www.geres.ufmg.br/paginas/?s=geres&p=oquee.php, acessado em 09}

(21)

Os dados utilizados consistem em um teste de L´ıngua Portuguesa com 24 itens e

que foram respondidos por 6749 alunos do 3o _{ano do Ensino Fundamental das cidades}

Rio de Janeiro, Salvador, Belo Horizonte, Campinas e Campo Grande em 2006, e que

foram cedidos pelo CAEd (Centro de Pol´ıticas Públicas e Avalia¸cão da Educa¸cão), da

Universidade Federal de Juiz de Fora. Entre esse conjunto de alunos, foram considerados

apenas aqueles que n˜ao apresentavam dados faltantes, ou seja, que responderam a todos

os itens, o que reduziu a amostra para 6320. Os itens eram de m´ultipla escolha com

quatro alternativas, entre as quais uma delas estava correta.

1.3 An´

alise dos dados reais via TRI convencional

A figura 1.2 apresenta as propor¸c˜oes de acerto de cada um dos itens do teste.

Observa-se que o item menos acertado foi o item 7, cujo percentual de acerto foi de

aproximada-mente 30.71%; por outro lado, as quest˜oes mais acertadas foram a 1 e a 3, com percentuais

de acerto de 97.78% e 97.83% respectivamente. Vinte itens foram acertados por mais de 50% dos participantes. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Proporção de acerto 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0

Figura 1.2: Propor¸c˜ao de acerto dos itens do projeto Geres

Quanto aos alunos, 96 deles acertaram todas as quest˜oes da prova, enquanto apenas

1 aluno acertou uma única questão. O escore bruto médio foi 16.81 e desvio-padrão 3.88.

(22)

A metodologia apresentada nas se¸c˜oes 2.4 e 2.5 foi utilizada para se fazer inferˆencia

sobre o modelo de trˆes parˆametros (1.1) tal que F (.) = Ψ(.), ou seja, considerando-se a

fun¸cão de liga¸cão logito. Os hiperparâmetros de cada uma das prioris são

µaj = 0, σ

2

aj = 0.5, µbj = 0, σ

2

bj = 1, αcj = 5, βcj = 17, ∀ j = 1, . . . , 24,

e distribui¸cão normal padronizada para as proficiências. Além disso, considerou-se o fator

de escala D igual a 1, ou seja, os parˆametros est˜ao sendo obtidos na escala do modelo

logito. ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0 1 2 3 4 Item Parâmetro a 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0 1 2 3 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 −4 −2 0 2 4 Item Parâmetro b 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 −4 −2 0 2 4 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● 5 10 15 20 0.0 0.2 0.4 0.6 0.8 1.0 Item Parâmetro c 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 0.0 0.2 0.4 0.6 0.8 1.0

Figura 1.3: Estimativas pontuais (m´edias a posteriori) dos parˆametros dos itens do

pro-jeto Geres e respectivos intervalos de credibilidade de 95%

As estimativas dos parˆametros dos itens e seus respectivos intervalos de credibilidade

de 95% est˜ao apresentados na figura 1.3. Considerando a classifica¸c˜ao apresentada na

se¸cão anterior a respeito dos parâmetros de discrimina¸cão, percebe-se que um item é

clas-sificado como de baixa discrimina¸c˜ao, onze apresentaram discrimina¸c˜ao moderada, oito

discrimina¸c˜ao alta, e quatro discrimina¸c˜ao muito alta. Os itens que apresentaram maior

variância a posteriori nesse parâmetro foram o 21, o 23 e o 24. Quanto aos parâmetros de

(23)

valores no parˆametro b. Esse fato concorda com o que foi comentado anteriormente, visto

que o percentual de acerto dessas quest˜oes foi bastante elevado. Por outro lado, os itens

7, 23 e 24 foram os itens mais dif´ıceis do teste. A quest˜ao cujo parˆametro b apresentou

maior intervalo de credibilidade foi a de número 6. Em rela¸cão ao parâmetro de acerto

ao acaso, a figura indica que o item 6 apresentou a maior estimativa pontual para esse

parâmetro, enquanto os de número 7, 10 e 17 são os que obtiveram as menores. Entre

esses quatro itens, apenas o intervalo do item 6 contempla o valor 0.25, que ´e o valor no

qual se espera que esse parˆametro esteja quando um item tem 4 alternativas e assumindo

que os seus distratores funcionam bem.

Com rela¸cão às proficiências dos alunos, foram obtidas estimativas pontuais e

inter-valares para apenas dois deles, apresentadas na tabela 1.1. Posteriormente, ser´a

expli-cado o motivo pelo qual n˜ao ´e poss´ıvel obter ambas estimativas para todos os indiv´ıduos.

Observa-se que os dois alunos apresentaram proficiˆencias estimadas abaixo da m´edia 0,

embora seus respectivos intervalos contemplem esse valor.

Tabela 1.1: Estimativas pontual (m´edia a posteriori) e intervalar (intervalo de

credibili-dade de 95%) para duas proficiˆencias de indiv´ıduos do projeto Geres

Aluno M´edia a posteriori Intervalo de Credibilidade de 95%

3387 −0.530 (−1.377 , 0.293)

4158 −0.122 (−1.061 , 0.757)

A figura 1.4 apresenta o histograma das proficiˆencias estimadas sobre a densidade

da distribui¸c˜ao normal padronizada. Aparentemente, a distribui¸c˜ao utilizada para as

proficiências é adequada, já que o histograma se aproxima bastante da curva dessa

den-sidade.

Foram obtidas ainda as propor¸c˜oes de acerto dos itens do teste, levando em conta

o escore dos alunos. Tais propor¸cões estão dispostas nos gráficos que se encontram no

apˆendice do cap´ıtulo. Observando tais gr´aficos, nota-se que, empiricamente, as curvas

de alguns itens se distanciam do formato de “S” que se espera de uma CCI, como por exemplo, dos itens 6 e 7. Nestes casos, a maneira como a probabilidade de resposta

(24)

Proficiência Densidade −3 −2 −1 0 1 2 3 0.0 0.1 0.2 0.3 0.4 0.5

Figura 1.4: Histograma das proficiˆencias estimadas para os indiv´ıduos participantes do

projeto Geres sobre a densidade da distribui¸c˜ao normal padronizada

correta se aproxima de zero ´e diferente de como se aproxima de um, sendo que, para o

item 6, as propor¸cões de acerto daqueles indiv´ıduos com escores baixos já são bastante

elevadas, enquanto que para o item 7, as propor¸c˜oes de acerto s´o tendem a aumentar

a partir do escore 14. Estes comportamentos poderiam levar `a alguns questionamentos:

uma CCI simétrica é, de fato, conveniente? Será que uma CCI assimétrica não poderia

ajustar melhor os dados?

Sob essa perspectiva, os resultados obtidos podem não ser úteis para fazer inferência,

uma vez que, devido a poss´ıvel assimetria, as estimativas das proficiˆencias e dos parˆametros

dos itens não seriam confiáveis. Sendo assim, o objetivo principal desta disserta¸cão é

pro-por modelos que permitam um parˆametro de assimetria para cada item e,

consequente-mente, formas mais gerais para as CCI’s, e que sejam capazes de estimar conjuntamente

(25)

1.4 Sum´

ario da disserta¸

c˜

ao

Neste cap´ıtulo, foi feita uma revis˜ao acerca dos modelos mais usuais da TRI e

apre-sentado o objetivo principal desta disserta¸c˜ao. No cap´ıtulo 2, as propostas feitas por

Samejima (2000) e Baz´an (2005) que resultam em CCI’s mais gerais s˜ao brevemente

des-critas; al´em disso, o modelo proposto ´e apresentado, bem como a metodologia utilizada

para se fazer inferência Bayesiana. Algumas medidas que serão utilizadas para avalia¸cão

do ajuste dos modelos tamb´em s˜ao apresentadas nesse cap´ıtulo.

No cap´ıtulo 3, s˜ao feitos estudos simulados com modelos assim´etricos, incluindo o

caso geral proposto e o caso em que o parˆametro c ´e igual a zero, bem como algumas

análises com diferentes conjuntos de prioris e avalia¸cão de convergência.

No cap´ıtulo 4, o conjunto de dados do projeto Geres ´e analisado utilizando os modelos

assim´etricos estudados no cap´ıtulo 3.

Já no cap´ıtulo 5, um modelo da TRI que incorpora a deteçcão de assimetria é proposto,

onde o processo para se fazer inferência Bayesiana também é descrito. Estudos simulados

utilizando esse modelo est˜ao no cap´ıtulo 6.

No cap´ıtulo 7, os dados do projeto Geres s˜ao novamente analisados, mas agora via

modelos abordados no cap´ıtulo 5.

Por fim, no cap´ıtulo 8, est˜ao as conclus˜oes e propostas para trabalhos futuros.

1.5 Apˆ

endice

(26)

(27)

Cap´ıtulo 2

Distribui¸

c˜

oes assim´

etricas na TRI

Os modelos da TRI apresentados no cap´ıtulo 1 consideram fun¸c˜oes de liga¸c˜ao sim´

etri-cas (logito e probito) que, consequentemente, provˆem CCI’s sim´etricas para descrever as

probabilidades de resposta aos itens. Mas como enfatizam Chen et al. (1999), essas

fun¸cões de liga¸cão simétricas nem sempre fornecem bons ajustes, especialmente quando

a probabilidade de uma dada resposta se aproxima de 0 de forma diferente de como se

aproxima de 1. A ado¸cão de uma fun¸cão de liga¸cão simétrica levaria a viés nas estimativas

m´edias das respostas.

Sendo assim, as propostas feitas por Samejima (2000) e Baz´an (2005) est˜ao

apresen-tadas a seguir. Tais propostas resultam em CCI’s assim´etricas e s˜ao conhecidas como

fam´ılia log´ıstica de expoente positivo (FLEP) e fam´ılia TRI normal assim´etrica

(TRI-NA), respectivamente. Na se¸c˜ao 2.3 o modelo proposto ser´a descrito, e

posterior-mente, a metodologia para se fazer inferˆencia por meio de uma abordagem Bayesiana. Na

se¸cão 2.5 apresentam-se os métodos MCMC, e as expressões matemáticas utilizadas para

a implementa¸cão desses métodos encontram-se no apêndice do cap´ıtulo. Neste cap´ıtulo, o

parˆametro de assimetria de todos os itens, e em todos os modelos, ´e estimado e, por meio

da avalia¸c˜ao da sua estimativa intervalar, se conclui quais deles possuem comportamento

(28)

2.1 Fam´ılia TRI log´ıstica assim´

etrica

A fam´ılia de modelos proposta por Samejima (2000), chamada fam´ılia log´ıstica

de expoente positivo (FLEP), provˆem CCI’s assim´etricas e inclui o modelo log´ıstico

simétrico de dois parâmetros (aquele que leva em conta a discrimina¸cão e a dificuldade

do item, além da proficiência do indiv´ıduo) como um caso particular. Uma das razões

apresentadas para o uso dessa fam´ılia ´e que ela pode ser mais apropriada para modelar

comportamento humano.

No caso de se ter o modelo log´ıstico de dois parˆametros, a CCI ´e dada por

pij(η) = Ψ(D∆ij), (2.1)

para i = 1, . . . , I e j = 1, . . . , J , η = {a, b, u} e todos os demais termos conforme definidos

no cap´ıtulo 1. Segundo o que já foi dito, D é um fator de escala que será 1.702 quando

se desejar aproximar o modelo normal pelo log´ıstico; caso contr´ario, D = 1.

A fam´ılia proposta por Samejima (2000) descreve a probabilidade de um indiv´ıduo i responder corretamente a um item j como

pij(η) = [Ψ(D∆ij)]dj, (2.2)

para i = 1, . . . , I, j = 1, . . . , J , com η = {a, b, d, u} e dj > 0 sendo o parˆametro de

assimetria associado ao j-´esimo item. Quando dj = 1, (2.2) equivale ao modelo log´ıstico

de dois parˆametros.

O parâmetro dj se relaciona à complexidade do item j. Um item é dito complexo

se requer muitos passos para ser resolvido. Espera-se que a probabilidade de resolver um

item complexo diminua quando o n´umero de passos ou etapas aumenta, dada a

habili-dade do indiv´ıduo. Samejima (2000) argumenta que, levando em conta a complexihabili-dade dos itens, pode ser mais apropriado assumir que a probabilidade de resposta tem um

comportamento assim´etrico.

A figura 2.1 mostra algumas CCI’s considerando a equa¸c˜ao (2.2) com os parˆametros de

dificuldade e discrimina¸cão fixos, e diferentes valores para o parâmetro d. Esse parâmetro

(29)

bem como penalizar itens f´aceis e que n˜ao foram resolvidos corretamente (0 < d < 1). O

modelo sim´etrico pode ser considerado como a transi¸c˜ao entre esses dois princ´ıpios.

−6 −4 −2 0 2 4 6 0.0 0.2 0.4 0.6 0.8 1.0 ui Pij (( ηη )) d = 0.3 d = 0.5 d = 0.8 d = 1 d = 1.5 d = 2 d = 3

Figura 2.1: CCI’s com parˆametros a = 1, b = 0 e diferentes valores para d

2.2 Fam´ılia TRI normal assim´

etrica

Diferente de Samejima (2000), a proposta feita em Bazán (2005) não é derivada

da teoria psicol´ogica. A nova fam´ılia de modelos introduzida, chamada fam´ılia TRI

normal assimétrica (TRI-NA), é uma extensão do modelo probito de dois parâmetros

e considera: a) uma fun¸cão de liga¸cão normal assimétrica na modelagem da probabilidade

de resposta correta pij(η), e/ou b) a distribui¸c˜ao das proficiˆencias dos indiv´ıduos sendo

normal assim´etrica.

Para descrever essa fam´ılia faz-se necessário mencionar a defini¸cão de uma distribui¸cão

(30)

as-simétrica com parâmetro de loca¸cão µ, parâmetro de escala σ2 e parâmetro de assimetria d se sua densidade puder ser escrita como

fX(x) = φSN(x; µ, σ2, d) = 2 σφ x − µ σ Φ dx − µ σ , (2.3)

com a nota¸c˜ao X ∼ SN (µ, σ2, d), onde φ(.) e Φ(.) s˜ao, respectivamente, a densidade e a

fun¸cão de distribui¸cão acumulada de uma distribui¸cão normal padrão (SN significa skew

normal ). Já a fun¸cão de distribui¸cão acumulada dessa variável X é dada por

ΦSN(x; µ, σ2, d) = 2Φ2     x 0  ;   µ 0  ,   σ2 _−δ −δ 1    , (2.4)

onde Φ2(µ, Σ, d) denota a fun¸cão de distribui¸cão acumulada de uma distribui¸cão normal

bivariada com vetor média µ, matriz de variância Σ e coeficiente de correla¸cão −δ, onde

δ = _(1+dd2₎1/2. No caso de se supor X com distribui¸cão normal padrão assimétrica (µ = 0

e σ2 _{= 1), a nota¸c˜}_{ao ser´}_{a da forma X ∼ SN (d).}

Então, se uma fun¸cão de liga¸cão normal padrão assimétrica for considerada na

mo-delagem da probabilidade de resposta correta aos itens, a CCI resultante ser´a

pij(η) = ΦSN(∆ij; dj) (2.5)

onde η = {a, b, d, u}, ∆ij = aj(ui − bj) e dj o parˆametro de assimetria associado ao

item j, para i = 1, . . . , I e j = 1, . . . , J . Quando dj = 0, a equa¸c˜ao (2.5) se resume ao

modelo probito de dois parâmetros. dj pode ser visto como um parâmetro de penaliza¸cão:

quando dj > 0, a probabilidade de resposta correta ´e penalizada para baixos valores da

habilidade; j´a quando dj < 0, a probabilidade de resposta correta ao item j ´e penalizada

para altos valores da habilidade.

Por outro lado, pode-se assumir que a proficiˆencia dos indiv´ıduos tem uma distribui¸c˜ao

normal assim´etrica, isto ´e, ui ∼ SN (µu, σu2, d), ∀ i. Uma justificativa apresentada por

Bazán (2005) para considerar essa distribui¸cão assimétrica para as proficiências é que

uma distribui¸cão normal simétrica é muito restritiva para modelar conduta humana.

Dessa forma, a combina¸c˜ao destes dois pontos resulta no caso mais geral proposto por

Bazán (2005): um modelo obtido a partir de uma fun¸cão de liga¸cão normal assimétrica em

(31)

2.3 Modelo proposto

Levando em conta os modelos assim´etricos apresentados, uma generaliza¸c˜ao poss´ıvel

seria incorporar o parˆametro de acerto casual a tais modelos; e essa ´e uma das propostas

deste trabalho.

De forma geral, seja F (∆ij; dj) a fun¸cão de liga¸cão assimétrica que descreve

deter-minada CCI, tal que F (∆ij; dj) = [Ψ(D∆ij)]

dj

no caso de se considerar a abordagem

feita por Samejima (2000), e F (∆ij; dj) = ΦSN(∆ij; dj) quando se considera a fun¸c˜ao de

liga¸cão normal assimétrica. Dessa forma, incorporando o parâmetro de acerto ao acaso,

o modelo proposto ser´a da forma

pij(η) = cj + (1 − cj)F (∆ij; dj), (2.6)

para η = {a, b, c, d, u} e todos os parâmetros conforme já descritos, ou seja, Yij é o

indi-cador de acerto do item j pelo indiv´ıduo i, ∆ij = aj(ui− bj), βj = (aj, bj, cj)0

correspon-dendo aos parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso respectivamente, dj

o parâmetro de assimetria do item j e ui sendo o valor correspondente à variável latente

Ui, que descreve a habilidade do indiv´ıduo i, para i = 1, . . . , I e j = 1, . . . , J .

Sob essa proposta, uma abordagem Bayesiana ser´a feita considerando a fun¸c˜ao de

liga¸c˜ao log´ıstica, ou seja, fazendo F (∆ij; dj) = [Ψ(D∆ij)]dj e D = 1. Um estudo simulado

ser´a realizado no cap´ıtulo 3 com o objetivo de estudar as propriedades desse modelo; uma

aplica¸c˜ao ao conjunto de dados do projeto Geres descrito ser´a feita no cap´ıtulo 4.

O enfoque Bayesiano ´e adotado para que seja poss´ıvel incorporar informa¸c˜oes a priori

aos parâmetros do modelo. Além disso, ele resolve um problema presente na estima¸cão

dos parâmetros quando isso é feito por máxima verossimilhan¸ca, conforme citado em

Andrade et al. (2000). Tal problema ocorre quando algum item ´e respondido correta ou

incorretamente por todos os indiv´ıduos, ou quando um indiv´ıduo responde correta ou

incorretamente a todas as quest˜oes.

Em Bolfarine e Baz´an (2008), uma abordagem Bayesiana com o modelo assim´etrico

(32)

2.4 Inferˆ

encia Bayesiana

Nesta se¸cão o processo para se fazer inferência sobre o modelo (2.6) é apresentado.

Os parâmetros do modelo são η = {β, d, u}, onde β = {a, b, c} se refere aos parâmetros

de discrimina¸c˜ao, dificuldade e acerto ao acaso dos itens, respectivamente, o vetor d

diz respeito aos parˆametros de assimetria associados aos itens e o vetor u se refere

`

as proficiˆencias dos indiv´ıduos. No caso de se desejar fazer inferˆencia sobre o modelo

de três parâmetros simétrico (1.1), basta considerar os parâmetros de assimetria fixos

e conhecidos (dj = 1 no caso em que F (.) = Ψ(.) e dj = 0 quando F (.) = Φ(.),

∀ j = 1, . . . , J), e no caso de se querer estudar o modelo log´ıstico assim´etrico de dois

parˆametros, dado pela express˜ao (2.2), basta fazer cj = 0, ∀ j = 1, . . . , J .

Para a realiza¸cão de inferência Bayesiana, é necessário mencionar alguns elementos

fundamentais, a saber: a fun¸cão de verossimilhan¸ca, que é a fun¸cão que descreve

proba-bilisticamente os dados observados; a distribui¸c˜ao a priori para os parˆametros do modelo,

que expressa a informa¸c˜ao inicial que se tem a respeito desses parˆametros antes de se

observar os dados; e a distribui¸c˜ao a posteriori, que sumariza a informa¸c˜ao sobre os

parˆametros, levando em conta os dados observados. Esses elementos est˜ao detalhados a

seguir. • Verossimilhan¸ca l(η; Y ) ∝ I Y i=1 J Y j=1 [pij(η)]yij[1 − pij(η)]1−yij ∝ I Y i=1 J Y j=1 {c_j+ (1 − cj)F (∆ij; dj)}yij{1 − [cj+ (1 − cj)F (∆ij; dj)]}1−yij (2.7)

• Distribui¸c˜oes a priori

Assume-se que os parˆametros s˜ao independentes a priori, o que significa que a

priori conjunta ´e dada por

p(η) = p(β)p(d)p(u)

(33)

Para cada componente de η, assume-se as seguintes distribui¸c˜oes:

X aj ∼ LN (µaj, σ

2

aj), bj ∼ N (µbj, σ

2

bj), cj ∼ Beta(αcj, βcj), onde LN (., .)

repre-senta uma distribui¸c˜ao log − normal e N (., .) a distribui¸c˜ao normal,

∀ j = 1, . . . , J;

X dj ∼ LN (µdj, σ

2

dj) caso a fun¸c˜ao de liga¸c˜ao seja a log´ıstica; ou dj ter

qual-quer distribui¸c˜_{ao definida em R no caso de se considerar a fun¸c˜ao de liga¸c˜ao}

normal assim´etrica, ∀ j = 1, . . . , J . Por exemplo, Baz´an (2005) utiliza uma

distribui¸cão t-Student com parâmetro de loca¸cão µ = 0, parâmetro de escala

σ2 = 0.5 e graus de liberdade ν = 2.

X ui ∼ N (0, 1) ∀ i = 1, . . . , I, de modo a resolver o problema de n˜

ao-identifi-cabilidade do modelo.

• Distribui¸c˜ao a posteriori conjunta

A distribui¸c˜ao a posteriori conjunta, que ser´a utilizada para obter as estimativas

de todos os parâmetros do modelo, é apresentada a seguir e foi obtida pela aplica¸cão

do Teorema de Bayes: p(η|Y ) ∝ l(η; Y ) " _I Y i=1 p(ui) # " _J Y j=1 p(aj)p(bj)p(cj) # " _J Y j=1 p(dj) # . (2.9)

Em geral é dif´ıcil obter a constante de normaliza¸cão de (2.9), o que significa não

ser poss´ıvel encontrar uma forma anal´ıtica fechada para a distribui¸c˜ao a posteriori.

Sendo assim, alguns m´etodos baseados em simula¸c˜ao poderiam ser utilizados para

aproximar essa distribui¸c˜ao. Aqui ser´a considerado o MCMC (Markov Chain Monte

Carlo), que ´e descrito na se¸c˜ao seguinte.

No caso de se considerar a fun¸c˜ao perda quadr´atica, as estimativas de cada um

dos parâmetros serão as respectivas médias a posteriori. E essa fun¸cão perda será

(34)

2.5 M´

etodo MCMC para fazer inferˆ

encia na TRI

As inferências acerca dos parâmetros dos modelos da TRI serão feitas a partir de

amostras geradas da distribui¸cão a posteriori conjunta de tais parâmetros. A idéia

básica do MCMC (Markov Chain Monte Carlo) é gerar amostras dessa distribui¸cão a

partir de distribui¸cões que constituam uma cadeia de Markov. Tais distribui¸cões são as

distribui¸c˜oes de transi¸c˜ao da cadeia que devem ser adequadamente escolhidas de forma

que a cadeia convirja para uma distribui¸cão estacionária que seja a própria distribui¸cão de

interesse (Gon¸calves, 2006). Após atingir a convergência, isto é, descartar os valores

esta-belecidos pelo burn-in, pode-se considerar que os valores simulados formam uma amostra

da distribui¸cão a posteriori conjunta, e poderão ser utilizados para se fazer inferência.

Existem alguns m´etodos para se construir tais cadeias, entre eles o Gibbs

Sam-pling (Geman e Geman, 1984), e que s˜ao casos especiais de uma estrutura geral

desen-volvida por Metropolis et al. (1953) e Hastings (1970), que ´e conhecido como algoritmo

Metropolis-Hastings (MH).

No caso do Gibbs Sampling, originado do processamento de imagens, o m´etodo

con-siste em tomar as distribui¸c˜oes condicionais completas dos parˆametros como as

dis-tribui¸cões de transi¸cão da cadeia de Markov. Assumindo que a distribui¸cão de interesse

´

e dada por π(θ) (que no caso é a própria distribui¸cão a posteriori), onde θ = (θ1, . . . , θL)0

e cada componente desse vetor podendo ser um escalar, um vetor ou uma matriz, a

dis-tribui¸cão condicional completa do parâmetro θlé dada por πl(θl) = π(θl|θ−l), l = 1, . . . , L,

onde θ−l é o vetor θ sem a l-ésima componente. Assim, a implementa¸cão desse algoritmo

pode ser feita da seguinte maneira:

1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais

θ(0) _{= (θ}(0)

1 , . . . , θ

(0) L )

0_.

(35)

valores: θ₁(k) ∼ π(θ1|θ (k−1) 2 , . . . , θ (k−1) L ) θ₂(k) ∼ π(θ2|θ (k) 1 , θ (k−1) 3 , . . . , θ (k−1) L ) .. . θ_L(k) ∼ π(θL|θ (k) 1 , . . . , θ (k) L−1)

3. Incremente o contador de k para k + 1 e retorne ao passo 2 at´e que a convergˆencia

seja alcan¸cada (considerando o burn-in).

No caso de as distribui¸c˜oes condicionais completas n˜ao serem conhecidas, o algoritmo

de Metropolis-Hastings pode ser utilizado. Assim como no Gibbs Sampling, suponha que

se deseja amostrar de uma distribui¸c˜ao de interesse π atrav´es de cadeias de Markov, que

no caso é a distribui¸cão a posteriori, e seja q(θ, φ) uma distribui¸cão de transi¸cão arbitrária

da qual se saiba gerar, baseado numa probabilidade α(θ, φ) tal que p(θ, φ) = q(θ, φ)α(θ, φ) se θ 6= φ.

Ent˜ao q(θ, φ) define uma densidade p(θ, .) para todo valor poss´ıvel do parˆametro

dife-rente de θ. Consequentemente, existe uma probabilidade positiva de a cadeia permanecer em θ, dada por

p(θ, θ) = 1 − Z

q(θ, φ)α(θ, φ)dφ.

Dessa forma, baseado em Hastings (1970), a express˜ao mais comumente citada para

a probabilidade de aceita¸c˜ao, ou seja, a probabilidade da cadeia se mover de θ para φ, ´e

α(θ, φ) = min 1,π(φ)q(φ, θ) π(θ)q(θ, φ) . (2.10)

Em termos pr´aticos, o algoritmo consiste nos seguintes passos:

1. Inicialize o contador de itera¸c˜oes k = 1 e o conjunto arbitr´ario de valores iniciais

θ(0)_.

(36)

3. Calcule a probabilidade de aceita¸c˜ao do movimento α(θ(k−1), φ) dada por (2.10) e gere z ∼ U (0, 1).

4. Se z ≤ α, aceite o novo valor e fa¸ca θ(k) = φ. Caso contr´ario, se z > α, θ(k) = θ(k−1)

e a cadeia n˜ao se move.

seja alcan¸cada (considerando o burn-in).

No caso dos modelos da TRI, apenas algumas distribui¸c˜oes condicionais completas

são conhecidas. Sendo assim, um método proposto por Muller (1991) será utilizado e

´

e conhecido como Gibbs Sampling com passos de Metropolis, onde se adota o algoritmo

Gibbs Sampling, mas as componentes que n˜ao podem ser diretamente amostradas de sua

condicional completa s˜ao amostradas da sua proposta q e aceitas com probabilidade dada

pela express˜ao (2.10).

Sendo assim, a implementa¸cão desses métodos para os modelos até aqui descritos

pode ser feita como se segue. Para a estima¸c˜ao dos parˆametros do modelo, foi feita a

seguinte divis˜ao:

({u1}, . . . , {uI}, {a1, b1, c1}, . . . , {aJ, bJ, cJ}, {d1}, . . . , {dJ}),

ou seja, os valores dos parˆametros a, b e c s˜ao aceitos (ou rejeitados) conjuntamente,

en-quanto as proficiências e os parâmetros de assimetria dos itens são aceitos (ou rejeitados)

separadamente.

Assim, os passos para a implementa¸c˜ao do algoritmo s˜ao:

1. Inicialize o contador de itera¸c˜oes k = 1.

2. Gere, ∀i = 1, . . . , I, um novo valor u(k)_i da densidade qi(u(k−1), u(k)) que ´e aceito

com probabilidade αi(u(k)).

3. Gere, ∀j = 1, . . . , J , um novo valor β_j(k) da densidade qj(β(k−1), β(k)) que ´e aceito

com probabilidade αj(β(k)), βj = (aj, bj, cj)0.

4. Gere, ∀j = 1, . . . , J , um novo valor d(k)_j da densidade qj(d(k−1), d(k)) que ´e aceito

com probabilidade αj(d(k)).

(37)

Cabe mencionar que, embora o parˆametro d seja amostrado, os resultados relacionados

a esse parˆametro ser˜ao apresentados na escala logar´ıtmica. Para isso, ou seja, para obter

amostras do ln de d, basta tomar o logaritmo dos valores amostrados.

Ser˜ao consideradas duas cadeias partindo de pontos iniciais diferentes, conforme a

tabela 2.1:

Tabela 2.1: Valores iniciais para cada uma das duas cadeias utilizadas para a estima¸c˜ao

dos parˆametros

Cadeias Parˆametros

a(0)_j b(0)_j c(0)_j d(0)_j u(0)_i

Cadeia 1 1, ∀j 0, ∀j 0.2, ∀j 1, ∀j ebi = √ei−¯e

var(e)

Cadeia 2 1.5, ∀j 1, ∀j 0.4, ∀j 2, ∀j 0, ∀i

onde ebi ´e o escore bruto padronizado do indiv´ıduo i, com ei =

PJ j=1yij, i = 1, . . . , I, ¯ e =hPI i=1ei i I e var(e) =hPI i=1(ei− ¯e)2 i (I − 1). ´

E importante considerar mais de uma cadeia para avaliar corretamente a convergˆencia

dos parâmetros do modelo. As análises da se¸cão 1.3 foram feitas a partir da gera¸cão de

uma amostra de tamanho 50 mil para cada uma das cadeias, com burn-in de 45 mil,

o que significa que as estimativas de cada parˆametro foram obtidas levando em conta

uma amostra de tamanho 10 mil. Para todas as demais an´alises, foram geradas amostras

de tamanho 190 mil, com burn-in de 10 mil e espa¸camento entre os pontos amostrados (thin) de 90, resultando que para cada cadeia o tamanho efetivo da amostra foi de 2 mil,

e que as an´alises foram realizadas com base em 4 mil observa¸c˜oes.

No caso dos modelos simétricos de três parâmetros, ou seja, no caso de não se

con-siderar os parˆametros de assimetria dos itens, o algoritmo pode ser implementado

des-considerando o passo 4, que gera um novo valor para cada parˆametro dj. Os mesmos

valores iniciais apresentados na tabela 2.1 s˜ao utilizados para os parˆametros β e u. Em

se tratando do modelo de dois parˆametros assim´etrico, basta considerar βj = (aj, bj)0 e

seguir os passos descritos, fazendo cj = 0, ∀ j = 1, . . . , J .

As express˜oes das distribui¸c˜oes usadas para gerar as propostas, e das probabilidades

(38)

quando se utiliza os modelos simétricos de três parâmetros para modelar a probabilidade

de resposta aos itens, quanto aquelas que consideram os modelos assim´etricos como

CCI. As expressões para o modelo assimétrico de dois parâmetros podem ser facilmente

visualizadas fazendo βj = (aj, bj)0 no modelo assimétrico de três parâmetros.

2.6 Avalia¸

c˜

ao de convergˆ

encia e an´

alise de ajuste

Após a implementa¸cão dos algoritmos, é necessário avaliar a convergência das

esti-mativas dos parˆametros. Para isso, Gelfand e Smith (1990) sugerem alguns diagn´osticos

informais baseados em técnicas gráficas. Após n itera¸cões em M cadeias paralelas, pode

ser feito, para cada itera¸cão, um histograma de uma fun¸cão dos parâmetros considerando

as M cadeias. A convergência é aceita se os histogramas não podem ser diferenciados

(Gamerman, 1997). Neste trabalho, a fun¸c˜ao a ser considerada para avalia¸c˜ao da

con-vergência será o logaritmo da distribui¸cão a posteriori.

Além dessa avalia¸cão gráfica, a estat´ıstica de Gelman e Rubin (1992) será considerada

como um indicativo de convergência. Tal estat´ıstica se baseia na idéia de que as trajetórias

de cadeias com diferentes valores iniciais deve ser a mesma ap´os a convergˆencia. Supondo

M cadeias paralelas, cada uma com tamanho efetivo n, e uma fun¸c˜ao real ψ = f (θ),

tem-se M trajet´orias {ψ(1)m , ψ(2)m , . . . , ψm(n)}, com m = 1, . . . , M para ψ. As variˆancias S entre

as cadeias e W dentro das cadeias s˜ao dadas por

S = n M − 1 M X m=1 ( ¯ψm− ¯ψ)2 e W = 1 M (n − 1) M X m=1 n X k=1 (ψ_m(k)− ¯ψm)2,

onde ¯ψm é a média das observa¸cões da cadeia m e ¯ψ é a média dessas médias.

Sob a hipótese de convergência, todos esses M n valores são amostrados da distribui¸cão

a posteriori conjunta e σ2

ψ, a variˆancia de ψ, pode ser estimada de maneira consistente

por W , S e a m´edia ponderada:

ˆ σ_ψ2 = 1 − 1 n W + 1 n S.

A estat´ıstica de Gelman e Rubin ser´a dada por

ˆ R = s ˆ σ2 ψ W,

(39)

que ser´a sempre maior que 1. A convergˆencia pode ser avaliada pela proximidade de ˆR

a 1; Gelman (1996) sugere aceitar a convergˆencia se ˆR for menor que 1.2.

Caso a convergência seja alcan¸cada, é poss´ıvel fazer inferência sobre os parâmetros

em quest˜ao. Para avaliar o ajuste do modelo, algumas medidas ser˜ao obtidas. Para

especific´a-las, denote h = a, b, c, d, u como sendo qualquer um dos parˆametros e Nh = I

quando h = u e Nh = J caso contrário, ou seja, Nh corresponde ao número de parâmetros

h a serem estimados. Sendo assim, pode-se escrever cada uma das medidas utilizadas como:

• Erro quadr´atico m´edio: EQMh =

PNh t=1(ˆht−ht)2 Nh , com ˆht = P2 l=1ˆhtl 2 a m´edia a

poste-riori do parˆametro ht nas 2 cadeias, t = 1, . . . , Nh, e ht o parˆametro gerado.

• Erro absoluto m´edio: EM Ah =

PNh

t=1|ˆht−ht|

Nh .

• Coeficiente de correla¸c˜ao de Pearson entre o vetor dos parˆametros estimados, com

componentes ˆht, e o vetor dos parˆametros gerados, com componentes ht,

t = 1, . . . , Nh, denotado por ρ(ˆh, h).

• Pseudo Fator de Bayes: Uma vers˜ao modificada do Fator de Bayes pode ser

uti-lizada como medida de compara¸c˜ao entre modelos (Sahu, 2002). Alguns

proble-mas que ocorrem com o cálculo do Fator de Bayes não aparecem nessa versão

modificada. Denotando y(r) como o conjunto das observa¸c˜oes (respostas) com a

r-´esima componente deletada, define-se a ordenada preditiva condicional (OP C)

como p(yr|y(r)) = R p(yr|η, y(r))p(η|y(r))dη. Assim, o pseudo fator de Bayes (P sF B)

para comparar dois modelos, M1 e M2, ´e definido como a raz˜ao de suas OP C’s,

P sF B(M1, M2) = IJ Y r=1 p(yr|y(r), M1) p(yr|y(r), M2)

. Uma proposta para estimar o numerador

e/ou denominador do P sF B ´e ˆp(yij|y(r)) = _B1

B X b=1 1 pyij ij (1 − pij)1−yij !−1 , com pij

calculado considerando as estimativas `a posteriori dos parˆametros sob o modelo

adotado, e B o tamanho da amostra. Note que o P sF B est´a fundamentado nas

distribui¸c˜oes preditivas obtidas para dados futuros. Quanto maior o P sF B, maior

(40)

tabela de classifica¸cão considerando o fator de Bayes para decidir quão forte é a

evidˆencia de um modelo sobre o outro, e que vale tamb´em para o P sF B.

O software escolhido para implementa¸c˜ao dos algoritmos foi o OxMetrics41, enquanto

as medidas de ajuste e os gr´aficos foram gerados no R 2_.

2.7 Apˆ

endice

A seguir encontram-se as expressões necessárias à implementa¸cão do algoritmo MCMC,

tais como as distribui¸cões propostas e as probabilidades de aceita¸cão referidas na se¸cão

2.5, usadas para gerar amostras de (2.9). Ser˜ao apresentadas tanto aquelas que foram

utilizadas quando se adotou o modelo (1.1) como CCI, quanto aquelas que foram uti-lizadas quando o modelo considerado para a modelar a probabilidade de resposta aos itens era dado por (2.6).

2.7.1 Express˜

oes quando a CCI ´

e dada por (1.1) - modelos

sim´

etricos de trˆ

es parˆ

ametros

• Proficiˆencias

Para a proficiência de cada indiv´ıduo, a distribui¸cão de transi¸cão da cadeia é dada

por u(k)_i ∼ Nu(k−1)_i , (0.2)2 , o que resulta em qi u(k−1), u(k) = fN u(k)_i ; u(k−1)_i , (0.2)2 .

A probabilidade de aceitar o valor gerado ´e dada por

αi u(k) = min n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj) p (ui).

• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso

Para os parâmetros de discrimina¸cão, dificuldade e acerto casual, as distribui¸cões

propostas s˜ao:

1_{http://www.oxmetrics.net}

(41)

a(k)_j ∼ LNln(a(k−1)_j ) − 0.052

2 , (0.05)

2_;

b(k)_j ∼ Nb(k−1)_j , (0.2)2_;

c(k)_j ∼ Umax(0, c(k−1)_j − 0.05), min(1, c(k−1)_j + 0.05).

Dessa forma, fazendo β_j(k)=a(k)_j , b(k)_j , c(k)_j , tem-se que

qj β(k−1), β(k) = fLN a(k)_j ; ln(a(k−1)_j ), (0.05)2_f N b(k)_j ; b(k−1)_j , (0.2)2 fU c(k)_j ; max(0, c(k−1)_j − 0.05), min(1, c(k−1)_j + 0.05).

J´a a probabilidade de aceitar o novo vetor gerado β_j(k) ´e da seguinte forma:

αj β(k) = min n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , onde pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj) p (aj) p (bj) p (cj).

2.7.2 Express˜

oes quando a CCI ´

e dada por (2.6) - modelos

as-sim´

etricos de trˆ

es parˆ

ametros propostos

• Proficiˆencias

No caso de se considerar o modelo assimétrico de três parâmetros como CCI, a

dis-tribui¸cão de transi¸cão da habilidade de cada indiv´ıduo será u(k)_i ∼ Nu(k−1)_i , (0.2)2

, o

que resulta em qi u(k−1), u(k) = fN

u(k)_i ; u(k−1)_i , (0.2)2_.

Quanto à probabilidade de aceita¸cão, essa será αi u(k) = min

n 1, pi(u(k)|.)qi(u(k),u(k−1)) pi(u(k−1)|.)qi(u(k−1),u(k)) o , onde pi(u|.) ∝ J Y j=1 P (Yij|ui, aj, bj, cj, dj) p (ui).

• Parˆametros de discrimina¸c˜ao, dificuldade e acerto ao acaso

Para os parˆametros a, b e c, os novos valores da cadeia ser˜ao gerados a partir das

seguintes distribui¸c˜oes:

a(k)_j ∼ LNln(a(k−1)_j ) − 0.05₂2, (0.05)2 ; b(k)_j ∼ Nb(k−1)_j , (0.2)2_; c(k)_j ∼ Umax(0, c(k−1)_j − 0.05), min(1, c(k−1)_j + 0.05) .

(42)

Fazendo β_j(k)=a(k)_j , b(k)_j , c(k)_j , resulta que qj β(k−1), β(k) = fLN a(k)_j ; ln(a(k−1)_j ), (0.05)2_f N b(k)_j ; b(k−1)_j , (0.2)2 fU c(k)_j ; max(0, c(k−1)_j − 0.05), min(1, c(k−1)_j + 0.05),

cuja probabilidade de aceita¸c˜ao de β_j(k) ´e αj β(k) = min

n 1, pj(β(k)|.)qj(β(k),β(k−1)) pj(β(k−1)|.)qj(β(k−1),β(k)) o , com pj(β|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (aj) p (bj) p (cj).

• Parˆametro de assimetria

No caso de se considerar a fun¸cão de liga¸cão log´ıstica, o que implica que o parâmetro

de assimetria só assume valores positivos, a distribui¸cão proposta será

d(k)_j ∼ LNln(d(k−1)_j ) − 0.05₂2, (0.05)2 , de forma que qj d(k−1), d(k) = fLN d(k)_j ; ln(d(k−1)_j ) − 0.05₂2, (0.05)2_.

A probabilidade de mover a cadeia para esse novo valor gerado ´e dada por

αj d(k) = min n 1, pj(d(k)|.)qj(d(k),d(k−1)) pj(d(k−1)|.)qj(d(k−1),d(k)) o , para pj(d|.) ∝ I Y i=1 P (Yij|ui, aj, bj, cj, dj) p (dj).

Para o caso de se considerar a fun¸c˜ao de liga¸c˜_{ao normal, implicando que d ∈ R,}

ou equivalentemente que δ ∈ [−1, 1] devido à rela¸cão δ = _(1+dd2₎1/2, uma distribui¸cão

conveniente pode ser escolhida como proposta tanto utilizando a parametriza¸c˜ao com d

(43)

Cap´ıtulo 3

Estudos simulados com modelos

assim´

etricos

Neste cap´ıtulo ser˜ao feitos estudos simulados com o modelo (2.6) fazendo

F (∆ij; dj) = [Ψ(∆ij)]

dj

, bem como com o modelo (2.2), a fim de verificar quais as suas

caracter´ısticas. Análises que envolvem escolhas de prioris também serão realizadas, com

o objetivo de averiguar quais resultam em melhores estimativas para os parˆametros.

Para relembrar, o modelo estudado de trˆes parˆametros descreve a probabilidade de

resposta correta ao item considerando a fun¸cão de liga¸cão log´ıstica assimétrica, ou seja,

pij(η) = cj+ (1 − cj) [Ψ(∆ij)]dj, (3.1)

para i = 1, . . . , I e j = 1, . . . , J , η = {β, d, u}.

Para os estudos com esse modelo, foi obtido, a partir dele, um conjunto de dados

com 30 itens e 3000 indiv´ıduos. Os parˆametros de discrimina¸c˜ao foram gerados a partir

de uma distribui¸c˜ao LN (−0.1, 0.25), o que faz com que 99% dos valores estejam entre

0.202 e 4.055; os parˆametros de dificuldade e as proficiˆencias dos indiv´ıduos a partir de

uma distribui¸c˜ao normal padronizada, os parˆametros c a partir de uma Beta(5, 17) e,

para os parˆametros de assimetria, foram fixados alguns valores tal que existissem itens

com assimetria positiva, negativa e itens sim´etricos. Assim, dj = 0.2 para j = 1, . . . , 10,

dj = 1 para j = 11, . . . , 20 e dj = 4 para j = 21, . . . , 30. Nos estudos simulados com o

(44)

em 0. Para os demais parâmetros, as distribui¸cões consideradas para a gera¸cão dos dados foram as mesmas.

No que diz respeito às distribui¸cões a priori, na se¸cão a seguir é feito um estudo

com-parativo entre dois conjuntos de prioris, a fim de escolher qual deles se ajusta melhor ao

connjunto dos dados, levando em conta as medidas descritas na se¸c˜ao 2.6, e considerando

como CCI o modelo assimétrico de três parâmetros. Supõe-se que o conjunto de prioris

escolhido para esse caso tamb´em seja o que melhor se ajusta quando se considerar o

modelo com dois parâmetros, visto que a priori atribu´ıda para o parâmetro c é bastante

informativa.

Posteriormente, nas se¸c˜oes 3.2 e 3.3, encontram-se os resultados do estudo simulado

com os modelos assimétricos de três e dois parâmetros, respectivamente, levando em

conta as prioris escolhidas.

3.1 Escolha das distribui¸

c˜

oes a priori

Será feita análise considerando dois conjuntos de distribui¸cões a priori com o objetivo

de verificar qual resulta em melhor aproxima¸c˜ao para os parˆametros do modelo. A

diferen¸ca entre esses conjuntos está na especifica¸cão dos hiperparâmetros da distribui¸cão

dos parˆametros dj, conforme cen´arios abaixo:

Cen´ario 1: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−0.8, 1.6)

∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I;

Cen´ario 2: aj ∼ LN (0, 0.5), bj ∼ N (0, 1), cj ∼ Beta(5, 17), dj ∼ LN (−1, 2)

∀ j = 1, . . . , J, e ui ∼ N (0, 1) ∀ i = 1, . . . , I.

A distribui¸cão para os parâmetros de discrimina¸cão, LN (0, 0.5) tem média 1.284,

moda 0.607, mediana 1 e desvio-padr˜ao 1.034, o que significa que 99% dos seus valores

est˜ao concentrados entre 0.120 e 8.342. Acredita-se que essa priori seja conveniente j´a

que se espera que os valores verdadeiros desses parˆametros estejam entre 0 e 4 (Pasquali,

2003). Quanto aos parˆametros de dificuldade, sendo a distribui¸c˜ao a priori uma normal