• Nenhum resultado encontrado

Modelos para dados dicotˆomicos.

N/A
N/A
Protected

Academic year: 2022

Share "Modelos para dados dicotˆomicos."

Copied!
25
0
0

Texto

(1)

Modelagem e Inferˆencia Bayesiana em Dados da Resposta ao Item

M´arcia D’Elia Branco - mbranco@ime.usp.br -

Universidade de S˜ao Paulo Instituto de Matem´atica e Estat´ıstica

http://www.ime.usp.br/ mbranco

Semin´ario - agosto de 2011 -

(2)

I. Introdu¸c˜ao

1. Motiva¸c˜ao e Hist´oria

Teoria dos Tra¸cos Latentes em Psicometria.

Teoria Cl´assica ×Teoria Moderna dos Testes . Centrar a an´alise nos itens e n˜ao no escore do teste.

Possibilidade de comparar resultados de diferentes testes e diferentes popula¸c˜oes.

Frederic Lord (1952, 1953 e 1968). Artigos na Psychometrika, Educational and Psychological Measurement e livro com Novick .

Georg Rasch (1952-53, 1960 e 1961) - An´alise de dados no Instituto Militar da Dinamarca e artigos.

(3)

2. Caracter´ısticas dos Dados.

Instrumento de avalia¸c˜ao (Teste) composto deI Itens.

Uma amostra de N indiv´ıduos (sujeitos) responde ao Teste.

Os dados formam uma matrixN ×I cujas componentes Yji podem ser dicotˆomicas (zeros e uns) ou politˆomica

(1,2,3, . . . , k).

Objetivo: modelar as probabilidades de acertos aos itens como fun¸c˜ao de quantidades (parˆametros) associadas aos itens e quantidades (parˆametros ou vari´aveis latentes) associadas aos indiv´ıduos.

Interesses: (1) avaliar o instrumento de medi¸c˜ao (Teste) e (2) avaliar as habilidades dos indiv´ıduos.

(4)

3. Aplica¸c˜oes.

Avalia¸c˜oes Educacionais no Brasil (INEP): SAEB, ENEM, ENADE, Prova Brasil.

Avalia¸c˜oes Educacionais Internacional: Pisa.

4. Recursos Computacionais

BILOG-MG e MULTILOG - http://www.ssicentral.com/irt Pacote no R: EstatR.exe -

http://www.inf.ufsc.br/dandrade/AvaliacaoEducacional Pacote no R -ltm - Latent Trait Models

BUGS (Win ou Open) -

http://www.mrc-bsu.cam.ac.uk/bugs/winbugs

(5)

Modelos para dados dicotˆomicos.

1. Modelo de Rasch (1PL) Yjij ∼Bernoulli(pji) com

pji = 1

1 +ejβi)

0.00.20.40.60.81.0

p0

b=0 b=1 b=2

(6)

Modelos para dados dicotˆomicos.

2. Modelo log´ıstico de trˆes parˆametros (3PL).

P(Yji = 1) =ci+ (1−ci) 1 1 +eαijβi) α1, . . . , αI s˜ao os parˆametros de discrimina¸c˜ao dos itens.

β1, . . . , βI s˜ao os parˆametros de dificuldade dos itens.

θ1, . . . , θN s˜ao os parˆametros de habilidades ou proficiˆencia.

c1, . . . , cI s˜ao os parˆametros de acerto ao acaso dos itens(entre zero e um).

βi representa a habilidade necess´aria para uma probabilidade de acerto aoi-´esimo item igual a(1 +c)/2.

O parˆametro α´e a derivada da tangente da curva no ponto de inflex˜ao.

(7)

Curva Caracter´ıstica do Item - CCI -

−4 −2 0 2 4

0.20.40.60.8

CCI 3PL com b=1, a=1 e c= 0.2

habilidades

prob. acerto

(8)

CCI

−4 −2 0 2 4

0.00.20.40.60.81.0

CCI 2PL com b=0 (a=0.5, 1 e 2)

habilidades

prob. acerto

(9)

CCI

−4 −2 0 2 4

0.20.40.60.81.0

CCI 3PL com b=0 e a=1 (c=0.1, 0.2 e 0.3)

habilidades

prob. acerto

(10)

Modelos para dados dicotˆomicos.

3. Modelo probito (ogiva normal) de trˆes parˆametros (3PN)

P(Yji= 1) =ci+ (1−ci)Φ(αij−βi))

Esse modelo pode ser muito bem aproximado pelo 3PL como d= 1.7

P(Yji= 1) =ci+ 1−ci 1 +eijβi)

Φ´e a fun¸c˜ao de distribui¸c˜ao acumulada da normal padr˜ao.

(11)

Modelos para dados dicotˆomicos.

4. Modelo probito assim´etrico (ogiva skew-normal) de trˆes parˆametros (3PSN).

P(Yji= 1) =ci+ (1−ciSNij−βi);δi) ΦSN ´e a f.d.a. da normal assim´etrica padr˜ao.

O novo conjunto de parˆametrosδ1, . . . , δI est˜ao associados a assimetria da CCI.

Esses quantidades est˜ao associadas aos itens e s˜ao denominados parˆametros de penaliza¸c˜ao.

B´azan, Branco and Bolfarine (2006). Bayesian Analysis.

(12)

-4 -2 0 2 4

0.00.20.40.60.81.0

latent variable

probability of correct response

ICCs with negative asimmetry

d= -0.9

d= -0.7

d= -0.5

d=0

-4 -2 0 2 4

0.00.20.40.60.81.0

latent variable

probability of correct response

ICCs with positive asimmetry

d= 0 d= 0.5

d= 0.7 d= 0.9

(13)

A distribui¸c˜ao de probabilidades normal assim´etrica

Fun¸c˜ao densidade de probabilidade

f(z) = 2φ(z)Φ(δz) δ= λ

1+λ ∈[−1,1].

Ent˜ao,X=ψ+τ Z ∼SN(ψ, τ, λ).

E[Z] =δq

2 π

V[Z] = 1− 2πδ2 δ = 0→Z∼N(0,1)

δ >0(δ <0)assimetria positiva (negativa) unimodal

(14)

Estima¸c˜ao dos Parˆametros: M´axima Verossimilhan¸ca.

A fun¸c˜ao de verossimilhan¸ca p(Y|θ, η) =

I

Y

i=1 J

Y

j=1

[pij]Yij[1−pij]1−Yij

em quepij =f(θ, η).

Independˆencia entre indiv´ıduos.

Independˆencia condicional entre os itens (dado θ).

η = (α, β, c) vetor de parˆametros associados aos itens.

Total de parˆametros do modelo 3I+J . Falta de identificabilidade.

Assumindo θj ∼N(0,1), utiliza-se o m´etodo de verossimilhan¸ca marginal.

(15)

Estima¸c˜ao dos Parˆametros: Inferˆencia Bayesiana

Especifica¸c˜ao de distribui¸c˜oes a priori para η.

A suposi¸c˜aoθj ∼N(0,1)´e considerada tamb´em uma distribui¸c˜ao a priori.

Obten¸c˜ao da distribui¸c˜ao a posteriori para todas as quantidades desconhecidas.

Utiliza-se m´etodos MCMC para obter as distribui¸c˜oes a posteriori marginais aproximadas.

Um algoritmo de dados aumentados combinado com amostrador de Gibbs ´e considerado.

Possibilidade do uso do aplicativo bayesiano WinBUGS.

(16)

Exemplo 1: Fox, J-P (2010). Bayesian Item Response Modeling. Springer.

Teste de matem´atica aplicado a N=200 estudantes com I=5 itens.

Modelos ajustado 2PN com o uso do programa WinBUGS.

(17)

Exemplo 1: Estima¸c˜ao dos parˆametros dos itens

(18)

Exemplo 1: Algumas distribui¸c˜oes a posteriori.

(19)

Exemplo 2: Teste de Matem´atica no Peru

Teste aplicado a 974 estudantes da quarta s´erie prim´aria de escolas publicas da ´area rural no Peru. O teste contˆem 18 itens, cada item categorizado como correto(1) ou incorreto(0).

Estat´ısticas descritivas dos escores:

M´edia=8.27 Mediana=8 desvio padr˜ao=4.20 assimetria=-0.075 curtose= -0.836 .

Distribui¸c˜oes a priori (modelo de 2PSN):

ai ∼N(1; 0.5)I(0; ), bi ∼N(0; 2) eδi∼U(1,1) i= 1, . . . ,18.

θj ∼N(0,1)ouθj ∼SN(0,1, γ) j = 1, . . . ,974.

(20)

Exemplo 2: Medidas de compara¸c˜ao de modelos.

Tabela: Comparing the PN, SPN and SPSN models using different criteria for Math data

Criterion PN SPN PSN SPSN

Number of parameters 1010 1028 1013 1049 Deviance of the posterior means 16865 15139 16861 15168

Posterior expected deviance 16012 14096 15999 15994 ρD effective number of parameters 853 1042 862 -826

DIC 17718 16181 17723 14341

Expected AIC 18885 17195 18887 17266

Expected BIC 26734 25184 26760 25418

SSR posterior mean 17570 12800 17550 12470

(21)

Aplica¸c˜ao: Teste de Matem´atica

Conclus˜oes:

Utilizando diversos crit´erios de compara¸c˜ao de modelos optamos pelo modelo 2SPN.

A m´edia a posteriori de δ14 foi igual a 0.324 indicando assimetria positiva para este item.

A CCI do item 14 possui uma taxa de crescimento maior no inicio e menor no final.

O item 14 discrimina melhor os indiv´ıduos com habilidades baixas, do que os indiv´ıduos com altas habilidades. Portanto,

”‘penaliza”’ indiv´ıduos com altas habilidades.

(22)

Modelos que consideram a limita¸c˜ao de tempo.

Goegebeuret al (2008) prop˜oe o modelo

pij =ci+ (1−ci)G(mij), (1) com

G(mij) =F(mij)Pij, λj), Pij, λj) =minn

1, rij, λj)o

, (2)

e

rij, λj) =h 1− i

k−ηj

iλj

. (3)

(23)

Modelos que consideram a limita¸c˜ao de tempo.

Os dois novos parˆametrosηj ∈[0,1]e λj >0 est˜ao associados aos indiv´ıduos.

ηj representa a tolerance towards speededness(tolerˆancia a press˜ao do tempo).

λj representa apropensity to guessing under speededness.

Goegebeur, et al (2008) prop˜oe estimar os parˆametros via m´axima verossimilhan¸ca marginal

Baz´an, Valdivieso e Branco (2011) prop˜oe o uso da metodologia bayesiana.

(24)

Modelos multidimensionais.

Nojosa (2010) prop˜oe uma an´alise bayesiana com uso de algoritmos MCMC para estimar a dimens˜ao do vetor de habilidades.

E realizado um estudo de simula¸c˜ao para verificar adequa¸c˜ao´ da t´ecnica para recuperar os paˆametros do modelo.

A metodologia ´e aplicada a dados do ENEM, concluindo pela unidimensionalidade da prova.

(25)

Referˆencias

Andrade, Tavares e Valle(2000). Teoria da Resposta ao Item:

Conceitos e Aplica¸c˜oes. ABE.

Jorge Luiz B´azan Guzman (2005) - Tese de doutorado - IME-USP.

Baz´an, Branco e Bolfarine (2010). Extensions of the skew normal ogiva item response model. Submetido.

Baz´an, Branco e Bolfarine (2006). A skew item response model. Bayesian Analysis.

Goegebeur, De Boeck , Wollack e Cohen (2008). A Speeded Item Response Model with Gradual Process Change,

Psychometrika.

Ronald Nojosa(2010). Inferˆencia bayesiana em modelos multidimensionais de resposta ao item. Tese - IME-USP.

Referências

Documentos relacionados

Capa do livro Anayde Beiriz, Paixão e Morte na Revolução de 30 Anayde Beiriz diplomada professora Pôster do filme Parahyba, Mulher Macho Divulgação de relançamento do livro

Com o intuito de aperfeic¸oar a realizac¸˜ao da pesquisa O/D, o objetivo do presente trabalho ´e criar um aplicativo para que os usu´arios do transporte p´ublico informem sua origem

A proposta desta pesquisa objetivou desenvolver o estudante para realizar a percepção sobre o estudo da complexidade do corpo humano, onde o educando teve oportunidade

O trabalho tem como objetivo elucidar a importância do brincar para as crianças, do contato delas com a natureza, de sua ação de ocupar espaços públicos na cidade, como praças e

Neste capítulo, será apresentada a Gestão Pública no município de Telêmaco Borba e a Instituição Privada de Ensino, onde será descrito como ocorre à relação entre

O mercado no coração da Baixa está em vias de classifica ção como Imóvel de Interesse Público. Está a

Local de realização da avaliação: Centro de Aperfeiçoamento dos Profissionais da Educação - EAPE , endereço : SGAS 907 - Brasília/DF. Estamos à disposição

No sentido de reverter tal situação, a realização deste trabalho elaborado na disciplina de Prática enquanto Componente Curricular V (PeCC V), buscou proporcionar as