Universidade Federal de Pernambuco
Centro de Inform´
atica
Teoria de Resposta ao Item como classifica¸
c˜
ao do desempenho
dos alunos nos trˆ
es primeiros anos do ensino fundamental em
escolas municipais do estado de Pernambuco
Trabalho de Conclus˜
ao de Curso de Gradua¸c˜
ao
por
Bruno Jos´
e das Chagas Cavalcanti
Orientador: Prof. Ricardo Massa
Bruno Jos´e das Chagas Cavalcanti
Teoria de Resposta ao Item como classifica¸c˜ao do desempenho dos alunos nos trˆes primeiros anos do ensino fundamental em escolas municipais do
estado de Pernambuco
Trabalho apresentado ao Programa de Gradua¸c˜ao em Ciˆencia da Computa¸c˜ao do Centro de Inform´atica da Universidade Federal de Pernambuco como requisito parcial para obten¸c˜ao do grau de Bacharel em Ciˆencia da Computa¸c˜ao.
Orientador: Prof. Ricardo Massa
Recife 2019
Agradecimentos
Primeiramente a Deus que permitiu que tudo isso acontecesse, ao longo de minha vida, e n˜ao somente nestes anos como universit´ario, mas que em todos os momentos foi o maior mestre do qual tive oportunidade de conhecer.
Agrade¸co minha m˜ae Eliene, hero´ına que me deu apoio, incentivo nas horas dif´ıceis, de desˆanimo e cansa¸co.
Ao meu pai que, apesar de todas as dificuldades, me fortaleceu em momentos im-portantes.
Ao meu avˆo, que desde muito cedo me acostumei a vˆe-lo como uma fortaleza e agora enfrenta um grave problema de sa´ude, sinto por ele um amor que levarei pelo resto da minha vida.
Ao meu orientador, Prof. Ricardo Massa, pela orienta¸c˜ao, dedica¸c˜ao e paciˆencia durante todo processo de escrita deste trabalho.
A toda equipe da Viitra Inova¸c˜oes que me desafiou a fazer este trabalho t˜ao impor-tante para ajudar os educadores das escolas p´ublicas.
Meus agradecimentos aos meus amigos desbravadores do pastel, Isaac e Wellington, companheiros de trabalhos e irm˜aos na amizade que fizeram parte da minha forma¸c˜ao e que v˜ao continuar presentes em minha vida com certeza.
Agrade¸co ainda aos meus amigos do grupo UFPE da Alegria que ao longo desta etapa me fizeram ser uma pessoa mais feliz.
Qualquer tecnologia suficientemente avan¸cada ´e indistingu´ıvel de magia.
RESUMO
A Teoria da Resposta ao Item (TRI) ´e um conjunto de modelos matem´aticos que tentam representar as chance de um indiv´ıduo dar uma determinada resposta a um item em fun¸c˜ao dos parˆametros do item e tra¸co latente do respondente. O objetivo deste trabalho ´e aplicar a TRI nos exames realizados no 1o, 2o e 3o ano fundamental em escolas municipais
do estado de Pernambuco. A finalidade n˜ao ´e avaliar a qualidade das avalia¸c˜oes em si, mas que conclus˜oes a respeito das habilidades dos alunos podem ser obtidas a partir das proficiˆencias encontradas, assim como tamb´em a constru¸c˜ao de um painel anal´ıtico para exibi¸c˜ao dos resultados. Com este trabalho, espera-se que os educadores de Pernambuco tenham mais informa¸c˜oes a respeito do desempenho dos estudantes e consigam realizar redirecionamentos de a¸c˜oes pedag´ogicas para trabalhar conte´udos ou habilidades em que os alunos apresentem maiores dificuldades.
ABSTRACT
Item Response Theory (IRT) is a set of mathematical models that attempt to represent an individual’s chances of give a certain answer to an item based on the item’s parameters and the respondent’s latent trait. The aim of this paper is to apply the IRT in the exams performed on the 1st, 2nd and 3rd basic year of some Pernambuco schools. The purpose is not to judge the quality of the tests, but what conclusions about student skills can be drawn from the proficiency found, as well as the construction of an analytical dashboard for displaying the results. With this undergraduate thesis, it is expected that educators of Pernambuco state have more information about student performance and can redirect pedagogical actions to improve the classes or students skills.
LISTA DE FIGURAS
Figura 1 Curva Caracter´ıstica do Item . . . 16
Figura 2 Etapas da Pesquisa . . . 22
Figura 3 Curvas caracter´ıstica dos itens . . . 29
Figura 4 Curvas de informa¸c˜ao dos itens . . . 30
Figura 5 Curvas de informa¸c˜ao da avalia¸c˜ao . . . 30
Figura 6 Estima¸c˜ao da densidade das habilidades . . . 31
Figura 7 Dispers˜ao do resultado das estimativas . . . 32
Figura 8 Percentual de alunos em cada faixa de Proficiˆencia . . . 35
Figura 9 Exibi¸c˜ao da mediana das habilidades e classifica¸c˜ao das quest˜oes no Analytics EDU . . . 38
Figura 10 Gr´afico de classifica¸c˜ao dos estudantes nos n´ıveis da escala ANA . . . 39
Figura 11 Compara¸c˜ao da habilidade mediana dos estudantes de uma turma . . . 39
LISTA DE TABELAS
Tabela 1 Modelo da folha resposta dos alunos . . . 21
Tabela 2 Modelo dicotomizado de respostas dos alunos . . . 24
Tabela 3 Classifica¸c˜ao das quest˜oes de acordo com sua dificuldade . . . 34
LISTA DE ALGORITMOS E RESULTADOS
4.1 Sa´ıda da fun¸c˜ao descript() . . . 27
4.2 Fun¸c˜oes tpm() e coef.tpm() . . . 28
4.3 Sa´ıda da fun¸c˜ao coef.tpm() . . . 28
LISTA DE SIGLAS
TRI Teoria de Resposta ao Item
ML3 Modelo Log´ıstico de 3 Parˆametros CCI Curva Caracter´ıstica do Item CII Curva de Informa¸c˜ao do Item ENEM Exame Nacional do Ensino M´edio ANA Avalia¸c˜ao Nacional de Alfabetiza¸c˜ao SAEB Sistema de Avalia¸c˜ao da Educa¸c˜ao B´asica MDE Minera¸c˜ao de Dados Educacionais
SUM ´ARIO
1 INTRODUC¸ ˜AO . . . 12
2 TEORIA DA RESPOSTA AO ITEM: PRINCIPAIS CONCEITOS 14 2.1 O modelo log´ıstico de 3 parˆametros . . . 15
2.2 Estima¸c˜ao . . . 17 3 METODOLOGIA DE PESQUISA . . . 20 3.1 Vis˜ao Geral . . . 20 3.2 Popula¸c˜ao da pesquisa . . . 20 3.3 Objetivos . . . 21 3.4 Aplica¸c˜ao da metodologia . . . 22 3.4.1 Defini¸c˜ao e planejamento . . . 23 3.4.2 Desenvolvimento . . . 23 3.4.3 O ambiente R . . . 24
3.4.4 Exibi¸c˜ao dos resultados . . . 25
4 DESENVOLVIMENTO . . . 27
4.1 Implementa¸c˜ao do ML3. . . 27
4.2 Classifica¸c˜ao das habilidades . . . 31
4.3 Mudan¸ca de escala . . . 32
4.3.1 Interpreta¸c˜ao da escala da proficiˆencia . . . 33
5 EXIBIC¸ ˜AO DOS RESULTADOS . . . 36
5.1 Sobre o Analytics EDU . . . 36
5.2 Importa¸c˜ao e estrutura da base de dados . . . 37
5.3 Visualiza¸c˜oes definidas . . . 37
5.3.1 Habilidade mediana . . . 37
5.3.2 Classifica¸c˜ao das quest˜oes . . . 38
5.3.3 Classifica¸c˜ao dos estudantes . . . 38
5.3.4 Compara¸c˜ao das habilidades . . . 39
6 CONSIDERAC¸ ˜OES FINAIS . . . 41 6.1 Trabalhos futuros . . . 41
12 1 INTRODUC¸ ˜AO
A educa¸c˜ao brasileira vem sendo posta em debate. Nesse cen´ario, surgiu a neces-sidade de se utilizar modelos de avalia¸c˜ao que medissem as caracter´ısticas individuais dos alunos que n˜ao podem ser observadas diretamente como, por exemplo, a proficiˆencia em determinado conte´udo [1].
Dentre os modelos de avalia¸c˜ao, destaca-se a Teoria de Resposta ao Item - TRI, difundida nos anos 50 por Frederic Lord1. A TRI ´e proveniente da psicometria, uma ´area
que une a psicologia e estat´ıstica e tem como objetivo a cria¸c˜ao de instrumentos para medida de conhecimento do indiv´ıduo e aluno.
O princ´ıpio b´asico da TRI ´e o de que a probabilidade de acerto de um item depende do n´ıvel de dom´ınio do aluno em um determinado assunto. Portanto, ´e esperado que ele acerte os itens cujo grau de dificuldade seja menor ou igual ao seu dom´ınio, e erre aqueles com um grau maior.
No Brasil, a TRI ´e conhecida por ser adotada em 1995 pelo SAEB (Sistema de Ava-lia¸c˜ao da Educa¸c˜ao B´asica), em 2013 pelo ANA (Avalia¸c˜ao Nacional de Alfabetiza¸c˜ao) e em 2009 ENEM (Exame Nacional do Ensino M´edio), possibilitando tirar conclus˜oes mais interessantes e fundamentadas sobre o desempenho dos estudantes brasileiros, com-parando os resultados ano a ano [2].
O presente trabalho prop˜oe-se apresentar a aplica¸c˜ao da Teoria de Resposta ao Item, com a linguagem de programa¸c˜ao R, para classificar o n´ıvel de desempenho dos alunos nas avalia¸c˜oes realizadas nos trˆes primeiros anos do ensino fundamental em escolas municipais do estado de Pernambuco.
Em seguida ser´a montado um painel anal´ıtico para representar as classifica¸c˜oes obtidas. O dashboard estar´a dispon´ıvel para consulta na plataforma Analytics Edu, uma plataforma de an´alise de desempenho educacional, e poder´a ser acessado por todos edu-cadores que possuem alguma rela¸c˜ao com as escolas que forneceram os dados utilizadas neste trabalho.
Para atingir o objetivo deste trabalho, far-se-´a primeiro uma pesquisa bibliogr´afica. Em seguida, ser´a aplicado a Teoria de Resposta ao Item nos dados. Posteriormente, ser´a
1Frederic M. Lord (1912 - 2000), nascido em Hanover foi um psicometrista. Ele foi fonte de grande
parte da pesquisa sobre a teoria de resposta ao item, incluindo dois livros importantes: Mental Test Scores (1968, com Melvin Novick, e dois cap´ıtulos de Allen Birnbaum), e Applications of Item Response Theory to Practical Testing Problems (1980).
13
feita a classifica¸c˜ao das quest˜oes, em seus n´ıveis de dificuldade, de acordo com a escala de proficiˆencia adotada pelo ANA, assim como tamb´em a classifica¸c˜ao dos alunos em cada um desses n´ıveis. Ap´os a classifica¸c˜ao, ser´a realizado uma an´alise dos resultados obtidos e por fim, ser´a montado um conjunto de visualiza¸c˜oes no Analytics EDU para exibi¸c˜ao dos resultados.
14
2 TEORIA DA RESPOSTA AO ITEM: PRINCIPAIS CONCEITOS
A TRI ´e definida como a representa¸c˜ao de modelos matem´aticos que tentam re-tratar as chances de um indiv´ıduo dar uma determinada resposta a um item em fun¸c˜ao dos parˆametros do item e da habilidade do respondente. [1].
Os modelos definidos para itens dicotomizados (corrigidos como certo ou errado) s˜ao os mais utilizados atualmente e se dividem basicamente em trˆes tipos, que se diferen-ciam pela quantidade de parˆametros utilizados para descrever o item. Eles s˜ao conhecidos como modelos de 1, 2 e 3 parˆametros. O modelo de 1 parˆametro, por vezes, tamb´em ´e conhecido como modelo Rasch. Os parˆametros considerados s˜ao, respectivamente:
i. discrimina¸c˜ao (a) - consiste na capacidade de um item discriminar os estudantes que tˆem a proficiˆencia requisitada daqueles quem n˜ao a tˆem;
ii. dificuldade (b) - ´e representada na mesma escala do n´ıvel de habilidade e trata-se da habilidade m´ınima que o respondente precisa ter para acertar o item;
iii. acerto ao acaso (c) - tamb´em conhecido como “chute”, indica a probabilidade de que algu´em que n˜ao tenha nenhum dom´ınio do conte´udo abordado, acerte o item.
Esses modelos da TRI procuram medir as vari´aveis de habilidade (θ) ou proficiˆencia do respondente, que s˜ao os tra¸cos latentes, utilizando a aferi¸c˜ao das vari´aveis observ´aveis (respostas aos itens). Portanto, a TRI estabelece uma rela¸c˜ao entre a habilidade do respondente e os parˆametros do item com a probabilidade de acerto no item, de tal forma que, quanto maior a proficiˆencia do indiv´ıduo, maior ´e a sua probabilidade de responder corretamente o item [2].
O modelo log´ıstico de 3 parˆametros (ML3) geralmente apresenta o melhor ajuste (goodness-of-fit ) aos dados dicotˆomicos de testes de m´ultipla escolha, enquanto que o modelo de 2 parˆametros deve ser usado quando o parˆametro de escolha ao acaso n˜ao faz muito sentido como, por exemplo, num question´ario de exame cl´ınico. J´a o modelo de 1 parˆametro pressup˜oe que todos os itens possuem igual discrimina¸c˜ao e o interesse reside apenas na estimativa da dificuldade [3].
Muitos autores afirmam que o modelo de 1 parˆametro possui estat´ıstica o suficiente para medir o tra¸co latente (lei da parcimˆonia), utilizando apenas a dificuldade do item e a habilidade do respondente. Por´em o modelo de 3 parˆametros oferece a possibilidade
15
de medir o acerto ao acaso dos itens, sendo mais flex´ıvel que os outros modelos log´ısticos e possuindo o melhor ajuste nos dados. Quanto maior o n´umero de parˆametros, menor ser´a a probabilidade de vieses em suas estimativas como resultados de mal ajuste. Por´em, amostras reduzidas podem levar a inacur´acia dos parˆametros. Lord (1983) assume que uma quantidade pequena de dados podem justificar a utiliza¸c˜ao do modelo de 1 parˆametro [3].
Como no Brasil o modelo mais utilizado ´e o de 3 parˆametros [2] e, devido ao fato de que avalia¸c˜oes utilizadas neste trabalho s˜ao de m´ultipla escolha, com itens corrigidos como certo ou errado, assim tamb´em como o alto n´umero de dados dispon´ıveis para aplica¸c˜ao deste modelo, esse trabalho aplicar´a a abordagem das principais caracter´ısticas do ML3, para medir a proficiˆencia dos respondentes.
2.1 O modelo log´ıstico de 3 parˆametros
De acordo com Andrade, D. F. e Tavares Valle (2000), o modelo log´ıstico de 3 parˆametros ´e dado por:
P (Uij = 1|Θj) = ci+ (1 − ci)
1
1 + e−Dai(Θj−bi),
com i = 1, 2, ..., l, e j = 1,2, ..., n, onde:
Uij ´e uma vari´avel dicotˆomica que assume os valores 1, quando o indiv´ıduo
j responde corretamente o item i, ou 0 quando o indiv´ıduo j n˜ao responde corretamente ao item i.
Θj representa a habilidade (tra¸co latente) do j-´esimo indiv´ıduo.
P (Uij) ´e a probabilidade de um indiv´ıduo j com habilidade j responder
corre-tamente o item i e ´e chamada de Fun¸c˜ao de Resposta do Item – FRI.
bi ´e o parˆametro de dificuldade (ou de posi¸c˜ao) do item i, medido na mesma
16
ai ´e o parˆametro de discrimina¸c˜ao (ou de inclina¸c˜ao) do item i, com valor
proporcional `a inclina¸c˜ao da Curva Caracter´ıstica do Item — CCI no ponto bi.
ci ´e o parˆametro do item que representa a probabilidade de indiv´ıduos com
baixa habilidade responderem corretamente o item i (muitas vezes referido como a probabilidade de acerto casual).
D ´e um fator de escala, constante e igual a 1. Utiliza-se o valor 1,7 quando deseja-se que a fun¸c˜ao log´ıstica forne¸ca resultados semelhantes ao da fun¸c˜ao ogiva normal.
Na interpreta¸c˜ao do modelo log´ıstico de 3 parˆametros, temos P (Uij = 1|Θj) como
a propor¸c˜ao de respostas corretas para o item i dentre todos os indiv´ıduos da popula¸c˜ao com habilidade Θj [4].
A rela¸c˜ao existente entre os parˆametros do modelo e a propor¸c˜ao de respostas corretas ao item i dentre todos os indiv´ıduos da popula¸c˜ao com habilidade Θj ´e chamada
de Curva Caracter´ıstica do Item - CCI.
Figura 1: Curva Caracter´ıstica do Item
Podemos interpretar a partir do gr´afico da CCI que respondentes com maior tra¸co latente possuem maior probabilidade de acertar o item e que esta rela¸c˜ao n˜ao ´e linear pois o gr´afico tem formato de “S”com deslocamento e inclina¸c˜ao definidos pelos parˆametros do item [1].
17
A escala de habilidade ´e arbitr´aria, n˜ao importando sua magnitude e sim a rela¸c˜ao de ordem existente entre seus pontos. O parˆametro b ´e medido na mesma escala que a unidade de habilidade, enquanto que o parˆametro c n˜ao depende de escala alguma, por se tratar de uma probabilidade, assumindo valores entre 0 e 1 [1].
O parˆametro c ´e conhecido como probabilidade de acerto casual, correspondendo `
a probabilidade de um aluno com um baixo tra¸co latente (habilidade) responder correta-mente um determinado item. Os modelos que n˜ao usam o parˆametro c s˜ao chamados de Modelos Log´ısticos de 2 parˆametros ou Modelo Rasch [4].
Podemos pensar no parˆametro b como o n´ıvel m´ınimo de habilidade necess´aria para determinado respondente ter uma alta probabilidade de acertar um item. Essa probabilidade alta de acerto no ML3 ser´a igual a 1+c2 , onde c ´e o parˆametro de acerto ao acaso. Se desconsideramos o acerto ao acaso (c = 0), a dificuldade do item fica definida como a habilidade m´ınima que um respondente precisa para ter a probabilidade de 50% de acertar o item [2].
O parˆametro a ´e encontrado no ponto de inflex˜ao da curva, tendo uma valor pro-porcional a sua inclina¸c˜ao. Espera-se que o parˆametro a seja sempre positivo pois, caso contr´ario, a CCI indicaria que, quanto maior a proficiˆencia de um indiv´ıduo, menor a sua probabilidade de responder corretamente o item. Valores baixos para esse parˆametro indicam que um item tem pouco poder de discrimina¸c˜ao, implicando em alunos com ha-bilidade bastante distintas possu´ırem a mesma probaha-bilidade de responder corretamente o item. Valores muito altos indicam itens com curvas caracter´ısticas muito “ingrimes”, discriminando os alunos basicamente em dois grupos: os que possuem habilidade abaixo do parˆametro b e os que possuem habilidade superior ao parˆametro b [1].
2.2 Estima¸c˜ao
Uma das etapas mais importantes da TRI ´e a estima¸c˜ao dos parˆametros do item e tra¸co latente. Como j´a foi visto, a probabilidade de um respondente acertar um item depende somente da sua habilidade e dos parˆametros que caracterizam o item. Em geral, apenas as respostas dos indiv´ıduos ao teste s˜ao conhecidas [1].
Existem v´arios m´etodos para se realizar a estima¸c˜ao desses parˆametros. Os mais utilizados s˜ao o M´etodo da M´axima Verossimilhan¸ca e os M´etodos Bayesianos. Na es-tima¸c˜ao dos parˆametros do item, conhecida na TRI como calibra¸c˜ao, ´e usual a aplica¸c˜ao de
18
algoritmos de M´axima Verossimilhan¸ca Marginal, enquanto que na estima¸c˜ao dos tra¸cos latentes ´e aplicado o M´etodo Bayesiano. A aplica¸c˜ao desses m´etodos requer a utiliza¸c˜ao de ferramentas matem´aticas e algoritmos bastantes complexos, que necessita de um alto recurso computacional a depender do tamanho da base a ser analisada [4].
Na estima¸c˜ao em que apenas as respostas s˜ao conhecidas, os parˆametros de todos os itens est˜ao na mesma escala. ´E poss´ıvel colocar outros itens na mesma escala que os itens originais a partir de planejamento e outras testagens. Pode-se ent˜ao construir um banco de dados de itens na mesma escala.
De acordo com Hambleton (1994) [5], a proficiˆencia de um aluno ´e a mesma inde-pendente do subconjunto de itens utilizado, por´em suas estimativas variam por causa do erro de medida, sendo algumas estimativas melhores que outras devido ao uso de itens mais ou menos apropriados nos testes para ele.
´
E cada vez maior a necessidade de estimar a proficiˆencia dos alunos. Com isso, ´e necess´ario construir bancos de dados de itens cada vez melhores, com estrat´egias de manuten¸c˜ao e substitui¸c˜ao de itens, de constru¸c˜ao de crit´erios para sele¸c˜ao de testes adequados a uma popula¸c˜ao e de desenvolvimento de plataformas de testes adaptativos no computador [6].
A equa¸c˜ao de m´axima verossimilhan¸ca para o modelo de 3 parˆametros ´e dada por:
m X j=1 ajΨ(Daj(Θ − bj)) = m X j=1 ωj(Θ) D uj, onde ωj(Θ) = DajΨ(Daj(Θ − bj) − log(cj)) = Daj 1 + cje−Daj(Θ−bj)
No modelo de 3 parˆametros, dado um conjunto de itens, o estimador de m´axima verossimilhan¸ca da proficiˆencia depende dos 3 parˆametros do itens ajustados atrav´es da fun¸c˜ao “peso”ωj(Θ) [6].
A fun¸c˜ao peso cresce com o aumento do parˆametro de discrimina¸c˜ao, aumentando a estimativa de proficiˆencia. Essa mesma fun¸c˜ao decresce com o aumento dos parˆametros b e c diminuindo a estimativa de proficiˆencia [6].
O acerto ao acaso poder´a ser penalizado no ML3. Nesse modelo, ´e melhor os alunos acertar os itens f´aceis que os mais dif´ıceis. O acerto apenas de itens considerados dif´ıceis
19
aumentar´a a probabilidade de uma baixa proficiˆencia.
Alguns programas computacionais para calculo da TRI s˜ao bastante conhecidos, como: BILOG [7], BILOG MG [8], PARSCALE [9], MULTILOG [10].
20
3 METODOLOGIA DE PESQUISA
Esse cap´ıtulo tem como objetivo descrever a metodologia utilizada no trabalho. Ser´a apresentada respectivamente uma vis˜ao geral da metodologia, informa¸c˜oes sobre a popula¸c˜ao da pesquisa, objetivos do trabalho e uma descri¸c˜ao detalhada da aplica¸c˜ao da metodologia.
3.1 Vis˜ao Geral
Foi utilizado o m´etodo de pesquisa descritiva com a finalidade de classificar o desempenho dos alunos atrav´es de um estudo sobre os principais conceitos da Teoria de Resposta ao Item, partindo de uma revis˜ao bibliogr´afica composta de artigos, monografias, teses e s´ıtios eletrˆonicos sobre a TRI.
Os principais autores que contribu´ıram para este trabalho foram Leonardo da Silva Gomes, Dalton Francisco de Andrade, Heliton Ribeiro Tavares e Raquel da Cunha Valle. Entretanto, ´e importante salientar que o corpus de autores tende a aumentar na medida em que a leitura vier sendo desenvolvida.
O estudo ter´a car´ater essencialmente quantitativo, mensurando, atrav´es da coleta e processamento estat´ıstico dos dados, o n´ıvel de proficiˆencia dos estudantes.
3.2 Popula¸c˜ao da pesquisa
Algumas escolas municipais do estado de Pernambuco realizam 4 testes de acom-panhamento de aprendizagem ao longo do ano escolar. As quest˜oes nesses exames s˜ao referentes as disciplinas de l´ıngua portuguesa e matem´atica.
O gabarito com respostas dos alunos s˜ao processados e agrupados em planilhas no formato como mostra a tabela abaixo. Essas planilhas s˜ao processadas para an´alises do desempenho dos estudantes com o objetivo de auxiliar o redirecionamento das a¸c˜oes pedag´ogicas junto aos professores e escolas.
21 C´odigo do Aluno Q1 Q2 Q4 Q5 ... C´odigo do aluno 1 A B A D ... C´odigo do aluno 2 A D B D ... C´odigo do aluno 3 A B D A ... ... ... ... ... ... ... Tabela 1: Modelo da folha resposta dos alunos
S˜ao realizadas an´alises de desempenho por munic´ıpio, escola, turma e estudante de acordo com as disciplinas e eixo tem´aticos abordados por elas. Essas an´alises est˜ao dispon´ıveis na plataforma Analytics Edu (analyticsedu.com.br) e podem ser acessadas pelos diretores, coordenadores, professores ou pelos pr´oprios alunos analisados.
Para este trabalho, os dados considerados foram as respostas de 16.067 estudantes nas avalia¸c˜oes de l´ıngua portuguesa e matem´atica do 1o, 2o e 3o ano fundamental. Esses
n´umeros s˜ao muito substanciais para a pesquisa da TRI e, portanto, permitem a estimativa de parˆametros de itens com um alto n´ıvel de precis˜ao.
3.3 Objetivos
Os objetivos desse trabalho foram divididos em objetivos gerais e espec´ıficos:
1. Objetivos gerais
(a) Classificar o n´ıvel de desempenho dos alunos nas avalia¸c˜oes realizadas nos trˆes primeiros anos do ensino fundamental em escolas municipais de Pernambuco atrav´es da Teoria de Resposta ao Item.
(b) Construir um painel anal´ıtico para representar as classifica¸c˜oes obtidas atrav´es da aplica¸c˜ao da Teoria de Resposta ao Item.
2. Objetivos espec´ıficos
(a) Conceituar Teoria de Resposta ao Item.
(b) Aplicar a Teoria de Resposta ao Item na popula¸c˜ao definida para este trabalho. (c) Definir visualiza¸c˜oes para representar o desempenho dos alunos.
22
(d) Disponibilizar as visualiza¸c˜oes definidas para todos os educadores relacionados aos dados utilizados neste trabalho.
3.4 Aplica¸c˜ao da metodologia
A metodologia de pesquisa aplicada nesse trabalho foi dividida em trˆes partes para melhor visualiza¸c˜ao:
• Parte 1 - Defini¸c˜ao e planejamento: – Escolha do tema
– Revis˜ao da literatura – Defini¸c˜ao da metologia
• Parte 2 - Desenvolvimento: – Coleta dos dados – Tratamento dos dados – Implementa¸c˜ao da TRI – An´alise dos resultados
• Parte 3 - Exibi¸c˜ao dos resultados: – Importa¸c˜ao dos resultados obtidos – Defini¸c˜ao das visualiza¸c˜oes
– Constru¸c˜ao do painel anal´ıtico
A figura abaixo mostra o fluxo que a metodologia desse trabalho segue:
23
3.4.1 Defini¸c˜ao e planejamento
Na primeira parte, a escolha do tema foi a primeira etapa a ser discutida e pensada. O tema foi escolhido no in´ıcio do per´ıodo em parceria com o orientador do trabalho, conseguindo satisfazer o gosto pessoal e agregando valor para trabalhos futuros, pois ´e um tema que vem ganhando espa¸co na ´area de educa¸c˜ao. Na revis˜ao bibliogr´afica foram realizadas pesquisas, an´alises e estudos sobre a Teoria de Resposta ao Item e da sua literatura, para maior aprofundamento e entendimento. As pesquisas abrangeram artigos, monografias, teses e s´ıtios eletrˆonicos, com o objetivo de criar uma base de dados rica e s´olida para o desenvolvimento do trabalho.
3.4.2 Desenvolvimento
Na segunda parte, coletou-se os dados fornecidos pelas escolas atrav´es do banco de dados da plataforma Analytics Edu. Esses dados foram agrupados nas seguintes catego-rias:
1. Respostas dos alunos no 1o ano em matem´atica;
2. Respostas dos alunos no 1o ano em l´ıngua portuguesa;
3. Respostas dos alunos no 2o ano em matem´atica;
4. Respostas dos alunos no 2o ano em l´ıngua portuguesa; 5. Resposta dos alunos no 3o ano em matem´atica;
6. Resposta dos alunos no 3o ano em l´ıngua portuguesa.
O primeiro tratamento aplicado nos dados foi desconsiderar respostas que tivessem campos vazios. Como alguns alunos acabam n˜ao preenchendo a alternativa completamente e com nitidez, a m´aquina de escanear o gabarito n˜ao consegue identificar a resposta escolhida. Considerar essas respostas n˜ao preenchidas como incorretas poderia enviesar a estimativa de parˆametros da TRI. Ap´os este tratamento a base perdeu 12,9% dos dados originais.
Para aplicar o modelo de 3 parˆametros da TRI, fez-se necess´ario tamb´em dico-tomizar os dados. O processo de dicotomitiza¸c˜ao consiste em transformar o valor das
24
respostas em dois grupos de vari´aveis: aqueles que respondem corretamente e aqueles que erram o item. As respostas foram ent˜ao mapeadas para 1, em caso de acerto do item e 0, caso contr´ario.
O processo de dicotomitiza¸c˜ao foi feito atrav´es da cria¸c˜ao de um script utilizando Ruby como linguagem de programa¸c˜ao. Ruby ´e uma linguagem de programa¸c˜ao inter-pretada e de tipagem dinˆamica. Ela funciona com uma infinidade de plataformas como o Windows, Mac Os e v´arias vers˜oes do UNIX. Para realizar o download do Ruby, basta acessar a p´agina de download da linguagem e seguir o tutorial de instala¸c˜ao. Essa lingua-gem foi escolhida devido ao fato de que todo o backend da plataforma do Analytics Edu ´e constru´ıdo no framework Ruby on Rails.
O script constru´ıdo recebe como entrada como entrada o conjunto de respostas do qual se deseja realizar o processo de dicotomitiza¸c˜ao e a disciplina da avalia¸c˜ao realizada pelos respondentes. O retorno do algoritmo ser´a as respostas dicotomizadas associadas ao c´odigo do aluno.
Em seguida, planilhas CSV foram geradas, para cada uma das categorias definidas, com as respostas dicotomizadas como mostra a tabela a seguir. Essas planilhas foram usadas nas fun¸c˜oes de aplica¸c˜ao do modelo log´ıstico de 3 parˆametros.
C´odigo do Aluno Q1 Q2 Q4 Q5 ... Cod. Aluno 1 1 1 1 1 ... Cod. Aluno 2 1 0 0 1 ... Cod. Aluno 3 1 1 0 0 ... ... ... ... ... ... ... Tabela 2: Modelo dicotomizado de respostas dos alunos
Para o processo de implementa¸c˜ao do modelo de 3 parˆametros da TRI, adotou-se R como linguagem de programa¸c˜ao e o RStudio como IDE de desenvolvimento.
3.4.3 O ambiente R
R ´e uma linguagem de programa¸c˜ao estat´ıstica que vem passando por diversas evolu¸c˜oes e se tornando linguagem com amplos objetivos. Podemos entender R tamb´em como um conjunto de pacotes e ferramentas estat´ısticas, munido de fun¸c˜oes que facilitam
25
sua utiliza¸c˜ao, desde a cria¸c˜ao de simples rotinas at´e an´alises de dados complexos, com visualiza¸c˜oes bem acabadas [11].
Para fazer o download do R, ´e necess´ario escolher um espelho CRAN para que seja feito o download da vers˜ao mais atual. Os espelhos CRAN s˜ao servidores distribu´ıdos em diversos pa´ıses que armazenam o software R. Assim, permite-se que o usu´ario defina o servidor mais pr´oximo de sua localiza¸c˜ao, reduzindo o tempo de tr´afego.
O RStudio ´e um ambiente de desenvolvimento integrado (IDE) para o R e est´a dispon´ıvel em duas edi¸c˜oes: RStudio Desktop e RStudio Server. O RStudio possui um apelo visual muito maior que o R usual, e tamb´em busca melhorar a experiˆencia do usu´ario com o ambiente R [11].
Para realizar a instala¸c˜ao do RStudio, basta acessar a p´agina principal da ferra-menta e realizar o download de acordo com a vers˜ao do seu sistema operacional e licen¸ca de uso.
O R foi escolhido porque possui milhares de pacotes dispon´ıveis para an´alises es-tat´ısticas. Muitos desses pacotes s˜ao agrupados por ´area comum. Esses agrupamentos s˜ao conhecidos como Tasks Views e est˜ao dispon´ıveis para consulta no site do R. H´a um conjunto de pacotes organizados da ´area de Psicometria chamado Psychometrics que pode ser acessado em http://cran-r.c3sl.ufpr.br/web/views/Psychometrics.html. [12]
Um dos pacotes desse conjunto de Psychometrics ´e o ltm - Latent Trait Models, que ser´a utilizado fortemente nesse trabalho. O ltm ´e proposto para a an´alise de dados dicotˆomicos e polinˆomicos multivariantes, utilizando modelos de caracter´ısticas latentes sob a abordagem da Teoria de Resposta ao Item. O pacote inclu´ı o modelo Rasch assim como tamb´em os modelos de 2 e 3 parˆametros.
A popula¸c˜ao escolhida para demonstrar a aplica¸c˜ao da TRI neste trabalho foram os alunos do 1o ano e suas respectivas respostas em matem´atica. ´E importante ressaltar
que o TRI (ML3) foi aplicado para todos os alunos, nas turmas do 1o, 2o e 3o ano, em ambas as disciplinas de l´ıngua portuguesa e matem´atica. Maiores detalhes sobre o ltm e fun¸c˜oes utilizadas para implementa¸c˜ao do ML3 ser˜ao explorados no pr´oximo Cap´ıtulo.
3.4.4 Exibi¸c˜ao dos resultados
Na terceira e ´ultima parte realizou-se o processo de importa¸c˜ao dos resultados obtidos com a implementa¸c˜ao da TRI para a plataforma do Analytics Edu. Foi definido
26
quais conjuntos de visualiza¸c˜oes seriam mais interessantes para serem exibidos aos os educadores relacionados com os dados analisados e, por fim, construiu-se o painel anal´ıtico para representar essas visualiza¸c˜oes.
27
4 DESENVOLVIMENTO
Neste cap´ıtulo ser´a mostrado o desenvolvimento da implementa¸c˜ao do modelo log´ıstico de 3 parˆametros da TRI. Como demonstra¸c˜ao, ser˜ao exibidos os resultados da classifica¸c˜ao de desempenho dos alunos do 1o em matem´atica.
4.1 Implementa¸c˜ao do ML3
O pacote ltm ´e um dos mais completos dentro do R para uso com TRI. Ele provˆe uma estrutura flex´ıvel para an´alises da Teoria de Resposta ao Item para dados dicotˆomicos e polinˆomicos utilizando a abordagem de M´axima Verossimilhan¸ca Marginal [13]. Como passo inicial, uma an´alise descritiva pode ser feita aplicando a fun¸c˜ao descript() aos dados dicotomizados dos alunos do 1o ano e suas respostas em matem´atica:
1 > l i b r a r y( ltm )
2 > d e s c r i p t ( r e s p o n s e s_m a t h )
1 D e s c r i p t i v e s t a t i s t i c s for the ’ r e s p o n s e s _ m a t h ’ data - set 2 3 S a m p l e : 4 10 i t e m s and 4 2 0 4 s a m p l e u n i t s ; 0 m i s s i n g v a l u e s 5 6 P r o p o r t i o n s for e a c h l e v e l of r e s p o n s e : 7 0 1 l o g i t 8 Q1 0 . 0 8 4 0 0 . 9 1 6 0 2 . 3 8 9 6 9 Q2 0 . 1 1 4 7 0 . 8 8 5 3 2 . 0 4 4 1 10 Q3 0 . 2 8 2 1 0 . 7 1 7 9 0 . 9 3 4 0 11 Q4 0 . 4 7 2 2 0 . 5 2 7 8 0 . 1 1 1 4 12 Q5 0 . 4 2 8 9 0 . 5 7 1 1 0 . 2 8 6 4 13 Q6 0 . 3 0 2 8 0 . 6 9 7 2 0 . 8 3 4 0 14 Q7 0 . 1 7 3 9 0 . 8 2 6 1 1 . 5 5 8 4 15 Q8 0 . 3 7 3 9 0 . 6 2 6 1 0 . 5 1 5 4 16 Q9 0 . 0 4 7 6 0 . 9 5 2 4 2 . 9 9 6 7 17 Q10 0 . 3 2 4 7 0 . 6 7 5 3 0 . 7 3 2 3 18 19 F r e q u e n c i e s of t o t a l s c o r e s : 20 0 1 2 3 4 5 6 7 8 9 10 21 F r e q 2 11 61 120 220 357 508 610 852 832 631
4.1: Sa´ıda da fun¸c˜ao descript()
Como podemos observar pelo resultado da fun¸c˜ao descript(), a quest˜ao 9 (linha 16) obteve um maior n´umero de acertos, enquanto que a quest˜ao 4 (linha 11) foi a mais errada pelos estudantes. A maior propor¸c˜ao de frequˆencia do escore total fica entre 8 ou 9 acertos, correspondendo a cerca de 40% das respostas.
28
A fun¸c˜ao que permite a estima¸c˜ao de parˆametros no modelo de 3 parˆametros da TRI ´e conhecida como tpm. O IRT.param = true define que os parˆametros sejam estimados atrav´es da aproxima¸c˜ao marginal de m´axima verossimilhan¸ca.
1 > ML3 < - tpm ( r e s p o n s e s_math , IRT . p a r a m = T R U E ) 2 > c o e f. tpm ( ML3 )
4.2: Fun¸c˜oes tpm() e coef.tpm() ´
E poss´ıvel extrair os parˆametros estimados do modelo com a fun¸c˜ao coef.tpm() como mostra a sa´ıda abaixo. Com ampla margem, a quest˜ao 4 (linha 5) teve o maior parˆametro de dificuldade e tamb´em a maior chance de acerto ao acaso (colunas Diffclt e Dscrmn respectivamente). A quest˜ao 8 (linha 9) apresenta a maior capacidade para discriminar alunos com habilidades distintas (coluna Dscrmn).
1 G u s s n g D f f c l t D s c r m n 2 Q1 0 . 0 0 0 4 2 3 4 0 7 4 - 2 . 2 4 9 6 7 0 7 7 1 . 3 6 5 0 8 3 3 Q2 0 . 0 0 0 1 0 8 0 0 3 3 - 1 . 9 6 6 4 5 3 8 5 1 . 3 4 1 7 2 5 4 Q3 0 . 1 1 7 1 9 7 2 4 5 5 - 0 . 8 4 4 9 6 3 6 8 1 . 1 0 7 6 0 1 5 Q4 0 . 3 6 2 5 9 6 7 3 7 3 1 . 1 0 0 0 1 8 1 0 1 . 2 2 2 4 6 2 6 Q5 0 . 1 1 1 2 9 7 4 6 5 2 - 0 . 0 6 0 7 0 5 0 9 1 . 5 3 0 7 4 6 7 Q6 0 . 3 4 6 4 1 3 7 7 0 9 - 0 . 1 2 2 5 8 8 7 4 1 . 7 7 3 2 0 6 8 Q7 0 . 0 0 0 1 0 1 4 6 7 1 - 1 . 3 4 3 9 9 3 9 9 1 . 6 7 9 1 9 4 9 Q8 0 . 3 6 0 0 2 1 3 8 9 7 0 . 2 6 6 1 5 9 0 4 2 . 4 0 5 5 8 8 10 Q9 0 . 0 0 0 1 2 2 1 2 4 0 - 2 . 3 1 2 6 2 6 8 9 1 . 8 9 3 5 8 9 11 Q10 0 . 1 6 0 6 8 1 9 3 7 1 - 0 . 4 0 1 4 1 4 8 9 1 . 6 9 8 5 8 8
4.3: Sa´ıda da fun¸c˜ao coef.tpm()
Podemos observar melhor o resultado da estima¸c˜ao dos parˆametros na Figura 2. A partir da imagem vemos que os itens 4, 6 e 8 possuem intercepta¸c˜oes em y bem maiores que zero, portanto, mesmo em n´ıveis de habilidades muito baixo, h´a alguma chance dos respondentes acertarem esse itens (acerto ao acaso). Os itens 1 e 9 (preto) s˜ao os mais f´aceis, possuindo uma boa chance de acerto mesmo para indiv´ıduos com tra¸co latente muito baixo (Θ < −2).
29
Figura 3: Curvas caracter´ıstica dos itens
A Curva de Informa¸c˜ao do Item - CII (Figura 3) demonstra que alguns itens fornece mais informa¸c˜oes sobre a capacidade latente para diferentes n´ıveis de habilidade. Quanto maior a discrimina¸c˜ao de um item, mais informa¸c˜oes ele traz a respeito sobre os n´ıveis de habilidade em torno do ponto em que h´a 50% de chances de acertar o item (o ponto mais ´ıngreme da CCI).
Por exemplo, o item 1 (preto) claramente fornece mais informa¸c˜oes em baixos n´ıveis de habilidade (em torno de Θ = −2) e quase nenhuma informa¸c˜ao sobre altos n´ıveis de habilidade porque o item j´a ´e muito f´acil para esses participantes. Por outro lado, o item 3 (verde), que tem uma baixa discrimina¸c˜ao, n˜ao fornece muitas informa¸c˜oes no geral, mas consegue abranger uma ampla variedade de n´ıveis de habilidade.
30
Figura 4: Curvas de informa¸c˜ao dos itens
A CII para todo o exame de matem´atica ´e a soma de todas as CII individuais mostradas na Figura 3. Idealmente ´e prefer´ıvel um teste que ofere¸ca cobertura razo´avel para uma ampla gama de n´ıveis de habilidades. Caso contr´ario, o exame ´e bom apenas para identificar uma gama limitada de n´ıveis de tra¸cos latentes. A Figura 4 demonstra que o teste provˆe informa¸c˜ao abrangente para variados tipos de habilidade, por´em, n˜ao fornece muita informa¸c˜ao para respondentes com alto grau de habilidade por n˜ao apresentar quest˜oes de dificuldade alta o suficiente.
31
A estimativa de cada tra¸co latente ´e feita pela fun¸c˜ao factor.scores(). Na curva da estimativa das habilidade (Figura 5) podemos notar que os escores est˜ao bem estimados, com m´edia 0 e 1 aproximadamente de desvio padr˜ao. Isso significa que nossas estimativas de habilidades est˜ao padronizadas com o ML3.
Figura 6: Estima¸c˜ao da densidade das habilidades
4.2 Classifica¸c˜ao das habilidades
O parˆametro de habilidade para cada pessoa pode ser estimado de diferentes ma-neiras, sendo o M´etodo Bayesiano e M´etodo a Posteriori os mais conhecidos. Ambos est˜ao presentes no pacote ltm e sua correla¸c˜ao extremamente alta entre as estimativas indicam que os m´etodos levam `as mesmas conclus˜oes para o presente conjunto de dados. Para mais detalhes sobre o processo de c´alculo de convergˆencia de ambos os m´etodos, consultar a referˆencia RIZOPOULOS, Dimitris (2006) [13].
No algoritmo abaixo, podemos calcular as estimativas de habilidades atrav´es da fun¸c˜ao factor.scores(), passando como argumento o modelo log´ıstico, o m´etodo de estima¸c˜ao e as respostas dos alunos. Na linha 1 o parˆametro “EB”indica que a estimativa dever´a ser feita atrav´es do M´etodo Bayesiano e o parˆametro “EAP”na linha 6 atrav´es do M´etodo a Posteriori. A correla¸c˜ao entre os resultados das estimativas pelos dois m´etodos ´e feita atrav´es da fun¸c˜ao cor() na linha 9.
32 2 r e s p . p a t t e r n s = r e s p o n s e s_m a t h ) 3 > p r i o r i < - f a c t o r. s c o r e s ( ML3 , m e t h o d = " EAP ", 4 r e s p . p a t t e r n s = r e s p o n s e s_m a t h ) 5 6 > e s t i m a t i v e s < - d a t a.f r a m e( EB = b a y e s i a n o$s c o r e . dat$z1 , 7 EAP = p r i o r i$s c o r e . dat$z1 ) 8 9 > cor( e s t i m a t i v e s )
4.4: Estimativa das habilidades dos respondentes
O resultado da correla¸c˜ao das estimativas foi de 99%. Al´em disso, podemos plotar o gr´afico de dispers˜ao das estimativas como mostra a Figura 6. O relacionamento ´e linear e podemos observar apenas em alguns pontos randˆomicos do gr´afico uma acentuada queda do resultado da estima¸c˜ao tanto para o M´etodo Bayesiano como a Priori.
Figura 7: Dispers˜ao do resultado das estimativas
4.3 Mudan¸ca de escala
Como dito anteriormente, a escala de uma habilidade pode ser definida com valores no intervalo de −∞ a +∞. Por esse motivo, ´e necess´ario escolher uma origem, represen-tada pelo valor m´edio das proficiˆencias dos indiv´ıduos que responderam os itens e uma
33
unidade de medida, representada pelo desvio-padr˜ao das habilidades dos respondentes do exame.
A Avalia¸c˜ao Nacional de Alfabetiza¸c˜ao - ANA, que tem como objetivo avaliar os estudantes matriculados no Ciclo de Alfabetiza¸c˜ao da rede p´ublica de ensino, apresenta seus resultados de desempenho numa escala que possui m´edia de proficiˆencia 500 e 100 de desvio padr˜ao. Nessa escala, os estudantes s˜ao distribu´ıdos, de acordo com seu desem-penho, em 4 n´ıveis de proficiˆencia, gerando informa¸c˜oes sobre os graus de alfabetiza¸c˜ao em l´ıngua portuguesa e matem´atica [14].
J´a o pacote ltm utiliza uma escala com m´edia igual a 0 e desvio-padr˜ao 1. Inde-pendente da escala adotada os resultados encontrados ser˜ao os mesmos. Por exemplo, um respondente com habilidade 2 na escala do pacote ltm corresponde a uma habilidade de 700 no ANA, pois ambos representam 2 devios-padr˜ao acima da m´edia [2].
Uma f´ormula para fazer a mudan¸ca de escala da habilidade de um indiv´ıduo ´e:
x = y − 500 100 ,
onde x representa a proficiˆencia na escala (0, 1) e y representa a proficiˆencia na escala (500, 100).
Atrav´es da f´ormula acima, podemos converter nossas estimativas de habilidades e dificuldade das quest˜oes para o padr˜ao utilizado pelo ANA e classificar nossos itens de acordo com os 4 n´ıveis de interpreta¸c˜ao adotados pelo exame. Quanto maior for o n´ıvel de uma quest˜ao, maior ser´a a habilidade necess´aria para que um aluno possua uma alta probabilidade de acert´a-la.
4.3.1 Interpreta¸c˜ao da escala da proficiˆencia
A interpreta¸c˜ao pedag´ogica dos 4 n´ıveis depende dos descritores com qual as quest˜oes est˜ao associadas. No campo da educa¸c˜ao, denomina-se descritor o detalhamento de uma competˆencia ou das habilidades que a comp˜oem. Tomando o termo ‘leitura’ como um exemplo de competˆencia, podemos dizer que ela engloba um conjunto de descritores como, por exemplo, identificar elementos e partes de diferentes gˆeneros textuais, escrever palavras, emitir opini˜ao sobre uma situa¸c˜ao, diferenciar versos e estrofes, etc. A Tabela 3 apresenta as classifica¸c˜oes das quest˜oes no teste avaliado, e seus respectivos descritores,
34
de acordo com a escala de proficiˆencia definida pelo ANA em matem´atica. N´ıvel Quest˜oes e descritores associados
N´ıvel 1
(At´e 424 pontos)
Q1 - Identificar a localiza¸c˜ao e/ou deslocamentos de objetos e/ou pessoas com base em pontos de referˆencia.
Q2 - Comparar grandezas (comprimento, massa e capacidade)
com ou sem medi¸c˜ao.
Q3 - Reconhecer eventos prov´aveis, improv´aveis ou imposs´ıveis.
Q7 - Ler dados representados em tabelas ou em gr´aficos de coluna simples.
Q9 - Identificar a localiza¸c˜ao e/ou deslocamentos de objetos e/ou pessoas com base em pontos de referˆencia.
N´ıvel 2
(Entre 425 e 524)
Q5 - Determinar elementos ausentes em uma sequˆencia; Q6 - Identificar e utilizar unidades de medida de tempo para resolver situa¸c˜oes relacionadas a per´ıodos do dia, dias da semana ou meses do ano.
Q8 - Quantificar elementos de uma cole¸c˜ao por meio de estimativa, contagem um a um pareamento e
agrupamento.
Q10 - Ler, escrever e comparar n´umeros naturais. N´ıvel 3 (Entre 525 e 574 pontos) N˜ao consta N´ıvel 4 (maior que 574)
Q4 - Comparar e ordenar n´umeros naturais, utilizando caracter´ısticas do sistema de numera¸c˜ao decimal. Tabela 3: Classifica¸c˜ao das quest˜oes de acordo com sua dificuldade
35
cada um dos n´ıveis de dificuldade dos itens descritos na tabela acima. Interpreta-se que os alunos possuem capacidade de responder as quest˜oes de dificuldade igual ou menor que sua faixa de habilidade.
Figura 8: Percentual de alunos em cada faixa de Proficiˆencia
O gr´afico da Figura 7 mostra que 17% dos alunos possuem habilidades suficientes apenas para responder quest˜oes classificadas no primeiro n´ıvel de dificuldade. A maioria dos estudantes (41,2%) possuem habilidades para responder quest˜oes do segundo n´ıvel da escala, enquanto que 20% dos respondentes demonstram ter habilidades para responder quest˜oes com N´ıvel 3 de dificuldade, ainda que as mesmas n˜ao tenham sido abordadas. Cerca de 22% dos respondentes possuem uma alta probabilidade pontuar no descritor relacionado a comparar e ordenar n´umeros naturais utilizando caracter´ısticas do sistema de numera¸c˜ao decimal.
36
5 EXIBIC¸ ˜AO DOS RESULTADOS
O foco deste cap´ıtulo ser´a na constru¸c˜ao de uma base para exibi¸c˜ao dos resultados que foram extra´ıdos a partir da aplica¸c˜ao da TRI nos dados dos respondentes. Para isso, ser´a repetido todo o processo realizado no Cap´ıtulo 3 com as popula¸c˜oes do 1o, 2o e 3o
ano em l´ıngua portuguesa e do 2o e 3o ano em matem´atica. A arquitetura do Analytics EDU ser´a aproveitada, sendo necess´ario uma reestrutura¸c˜ao no banco de dados, cria¸c˜ao de queries de consultas ao banco, novas rotas e defini¸c˜ao das fun¸c˜oes que exibir˜ao os resultado no frontend.
5.1 Sobre o Analytics EDU
Com o surgimento de tecnologias de apoio ao processo de ensino e aprendizagem, um grande volume de dados pode ser gerado a partir da intera¸c˜ao de estudantes com as avalia¸c˜oes escolares [15]. Nesse contexto, emergiram, no campo da Ciˆencia dos Dados Educacionais, a Minera¸c˜ao de Dados Educacionais - MDE e Learning Analytics - LA. O MDE busca tratar e processar os dados, enquanto que o LA tem como prop´osito a an´alise dos dados para compreens˜ao e otimiza¸c˜ao do processo de aprendizado [16].
Nesse cen´ario, o Analytics EDU se apresenta como uma plataforma de visualiza¸c˜ao dos dados educacionais, buscando fornecer representa¸c˜oes visuais de v´arios indicadores, ajudando os gestores educacionais com insights sobre os processos de aprendizagem, di-ficuldades e comportamento de cada estudante. A plataforma cont´em indicadores de 80 escolas, 726 turmas e 16.067 alunos.
A aplica¸c˜ao possui uma interface que divide todas as informa¸c˜oes em uma s´erie de componentes gr´aficos, cujo os filtros principais s˜ao relativos ao bimestre, munic´ıpio, turma, escola e aluno. Dentro de cada se¸c˜ao principal, ´e poss´ıvel ainda filtrar os indicadores por disciplina e ano escolar. Alguns exemplos de indicadores s˜ao: frequˆencia dos estudantes nas avalia¸c˜oes realizadas, compara¸c˜ao do desempenho nas disciplinas, eixos tem´aticos abordados, distribui¸c˜ao de acertos por quest˜ao, etc.
37
5.2 Importa¸c˜ao e estrutura da base de dados
O primeiro passo para a utiliza¸c˜ao dos dados da TRI no Analytics EDU foi exporta-los para CSV, em seguida realizou-se uma reestrutura¸c˜ao na base de estudantes para armazenar os resultados da estima¸c˜ao de habilidades como mostra a Tabela 4. Por fim, foi criado um script para importa¸c˜ao desses parˆametros j´a normalizados pela escala (500, 100). O mesmo procedimento foi realizado para importa¸c˜ao da estima¸c˜ao de dificuldade das quest˜oes.
Campo Tipo
Cod. N´umero
Nome Texto
Cod. cidade N´umero
Cod. escola N´umero
Cod. turma N´umero
Habilidade em matem´atica N´umero Habilidade em l´ıngua portuguesa N´umero
Campo Tipo Quest˜ao Texto Dificuldade N´umero Disciplina Texto N´ıvel Texto
Tabela 4: Estrutura da base de dados dos estudantes e quest˜oes
5.3 Visualiza¸c˜oes definidas
Foi definido ent˜ao quais seriam as visualiza¸c˜oes necess´arias para exibi¸c˜ao dos re-sultados no Analytics EDU em cada filtro principal. Elas poder˜ao ser acessadas por todos os diretores, gestores, coordenadores e professores relacionados as escolas municipais que forneceram dados para este trabalho.
Para cada visualiza¸c˜ao definida foram criadas rotas parametrizadas, queries de consulta ao banco e fun¸c˜oes de processamento dos dados no backend.
5.3.1 Habilidade mediana
A mediana foi um indicador escolhido para analisar a tendˆencia central das distri-bui¸c˜oes num´ericas das habilidades. A vantagem da mediana em rela¸c˜ao a m´edia ´e que a mediana pode dar uma ideia melhor de um valor t´ıpico porque n˜ao ´e t˜ao distorcida por valores de proficiˆencia extremamente altos ou baixos. Como desvantagem, temos o fato
38
de que, por precisar realizar ordena¸c˜ao dos elementos analisados, o custo computacional ´e maior do que a m´edia aritm´etica.
A habilidade mediana ´e o primeiro indicador da se¸c˜ao sobre TRI e ´e exibida nos filtros de cidade, escola e turma em um espa¸co como mostra a Figura 8.
5.3.2 Classifica¸c˜ao das quest˜oes
Em seguida, ´e exibido a classifica¸c˜ao das quest˜oes em seus respectivos n´ıveis uti-lizando a escala ANA para as disciplinas de matem´atica e l´ıngua portuguesa. Baseado na mediana da turma, o educador poder´a entender em quais descritores os alunos est˜ao atingindo um bom desempenho.
A tabela de classifica¸c˜ao das quest˜oes tamb´em ´e exibida nos filtros de cidade, escola e turma. Assim como ´e definido na ANA, a classifica¸c˜ao das quest˜oes possui escala diferente dependendo da disciplina selecionada no filtro secund´ario.
Figura 9: Exibi¸c˜ao da mediana das habilidades e classifica¸c˜ao das quest˜oes no Analytics EDU
5.3.3 Classifica¸c˜ao dos estudantes
O ´ultimo indicador comum aos 3 primeiros filtros principais ´e um gr´afico de dis-pers˜ao dos alunos nos n´ıveis de proficiˆencia definidos pela escala ANA. Essa visualiza¸c˜ao ´e importante porque define a porcentagem dos alunos que possuem capacidade de responder quest˜oes em cada uma das faixas de habilidade de definidas.
Nesse indicador ´e poss´ıvel selecionar n´ıveis de escala a serem desconsideradas na distribui¸c˜ao dos estudantes. Ao clicar na escala “Acima de 574”, por exemplo, a popula¸c˜ao
39
dos estudantes nesse n´ıvel seria desconsiderada e a distribui¸c˜ao se daria apenas entre os 3 primeiros n´ıveis (“Entre 525 e 574”, “Entre 425 e 524”e “Menor que 425”).
Figura 10: Gr´afico de classifica¸c˜ao dos estudantes nos n´ıveis da escala ANA
5.3.4 Compara¸c˜ao das habilidades
As se¸c˜oes de escola e turma cont´em informa¸c˜oes a respeito da compara¸c˜ao de suas habilidades medianas em rela¸c˜ao ao munic´ıpio e em rela¸c˜ao ao munic´ıpio e escola no caso da se¸c˜ao turma. Por exemplo, a turma da Figura 10 possui uma habilidade mediana 15,79% superior em compara¸c˜ao com a habilidade de todos os estudantes de sua escola e 50,88% superior em compara¸c˜ao com a habilidade de todos os alunos da rede municipal.
Figura 11: Compara¸c˜ao da habilidade mediana dos estudantes de uma turma
5.3.5 Visualiza¸c˜ao na se¸c˜ao do estudante
Para a se¸c˜ao de estudante pensou-se em uma visualiza¸c˜ao que permitisse destacar sua habilidade na avalia¸c˜ao realizada e uma compara¸c˜ao do seu desempenho em outros contextos. A habilidade do aluno fica destacada em um card e no texto em seguida ´e descrito a compara¸c˜ao da sua habilidade com toda a rede municipal, sua escola e turma.
40
Figura 12: Visualiza¸c˜ao da TRI na se¸c˜ao de estudantes
O estudante mostrado na Figura 11 possui uma habilidade estimada em 479.93 em matem´atica. Com essa habilidade o aluno posiciona-se a frente de 37,02% de todos os estudantes da rede municipal, 10.53% a frente de todos os estudantes de sua escola e 16.67% a frente de todos os estudantes da sua turma.
41
6 CONSIDERAC¸ ˜OES FINAIS
O estudo da Teoria de Resposta ao Item mostrou-se de grande importˆancia por apresentar novas formas de avaliar o conhecimento em rela¸c˜ao a Teoria Cl´assica dos Testes, cujo o desempenho dos respondentes ´e definido simplesmente pela soma do n´umero de quest˜oes acertadas e quest˜oes com diferentes n´ıveis de dificuldade podem ter diferentes valores pr´e-estabelecidos, ou pesos [2].
´
E importante destacar que os professores, conhecendo melhor os principais concei-tos da TRI, podem elaborar testes educacionais mais v´alidos, proporcionando tamb´em um retorno sobre as principais habilidades adquiridas e quais habilidades devem ser melhor trabalhadas.
No entanto, como assinala Valle et al. (2000), a TRI ainda est´a em cont´ınuo apri-moramento. Ap´os ser adotada como m´etodo de avalia¸c˜ao pelo Exame Nacional do Ensino M´edio e pelo Sistema de Avalia¸c˜ao da Educa¸c˜ao Brasileira, do qual a Avalia¸c˜ao Nacional de Alfabetiza¸c˜ao faz parte, os modelos estat´ısticos baseados na Teoria da Resposta ao Item estimularam o interesse de muitos pesquisadores e professores que trabalham com processos de avalia¸c˜ao em larga escala.
A an´alise do desempenho dos alunos em escolas municipais de Pernambuco atrav´es da TRI permitiu, na pr´atica, acompanhar como os resultados de um processo de avalia¸c˜ao do ensino fundamental pode contribuir para melhor prepararmos os estudantes. Com esses resultados dispon´ıveis para todos os educadores atrav´es de um painel anal´ıtico, ´e poss´ıvel compor um plano de a¸c˜ao para trabalhar conte´udos ou habilidades que os alunos mais apresentam dificuldades, melhorando a qualidade das aulas e realizando uma melhor forma¸c˜ao para os sujeitos envolvidos no processo de ensino e aprendizagem.
6.1 Trabalhos futuros
Para aprimorar os planos de a¸c˜oes pedag´ogicas, ´e interessante ser criado no Analy-tics EDU uma se¸c˜ao para avaliar as quest˜oes abordadas nas provas nos aspectos de difi-culdade, discrimina¸c˜ao e chance de acerto ao acaso. Tamb´em ´e poss´ıvel parametrizar as escalas adotadas para classificar os itens, ampliando as interpreta¸c˜oes dos desempenhos em outros contextos como, por exemplo, na escala adotada pelo SAEB no 5o ano ou em alguma outra escala definida pelos educadores que melhor se ajuste aos dados.
42
REFERˆENCIAS
[1] ANDRADE, D. F. de; TAVARES, H. R.; VALLE, R. da C. Teoria da Resposta ao Item: Conceitos e Aplica¸c˜oes. [S.l.]: Sinape, 2000.
[2] GOMES, L. da S. A TEORIA DE RESPOSTA AO ITEM NA AVALIAC¸ ˜AO EM LARGA ESCALA: um estudo sobre o Exame Nacional de Acesso do Mestrado Pro-fissional em Matem´atica em Rede Nacional – PROFMAT 2012. 290 p. Disserta¸c˜ao (Mestrado) — Instituto Nacional de Matem´atica Pura e Aplicada, Rio de Janeiro, 2014.
[3] LINDEN, W. J. van der. Handbook of Item Response Theory. [S.l.]: CRC Press, 2016. [4] ANDRADE, D. F. de; ARA´uJO, E. A. C. de; BORTOLOTTI, S. L. V. Teoria da
Resposta ao Item. Revista Escola de Enfermagem USP, Out 2009.
[5] HAMBLETON, R. . Item response theory: A broad psychometric framework for me-asurement advances. Psicothema, 1994.
[6] KLEIN, R. Alguns aspectos da Teoria de Resposta ao Item relativos `a estima¸c˜ao das proficiˆencias. 2013.
[7] RJ, B. R. M. BILOG 3: Item Analysis and Test Scoring with Binary Logistic Models. Chicago: Scientific Software, 1990.
[8] MF MURAKI E, M. R. B. R. Z. BILOG-MG: Multiple-Group IRT Analysis and Test Maintenance for Binary Items. Chicago: Scientific Software, 1996.
[9] E, B. R. M. PARSCALE : IRT Based Test Scoring and Item Analysis for Graded Open-Ended Exercises and Performance Tasks. Chicago: Scientific Software, 1997. [10] D., T. MULTILOG user’s guide: Multiple categorical item analysis and test scoring
using item response theory. Chicago: Scientific Software, 1991.
[11] OLIVEIRA, P. F. de; GUERRA, S.; MCDONNELL, R. Ciˆencia de Dados com R -Introdu¸c˜ao. [S.l.]: IBPAD, 2018.
43
[12] ANJOS, A. dos; ANDRADE, D. F. de. Teoria da Resposta ao Item com uso do R. 290 p. Disserta¸c˜ao (Mestrado), Jo˜ao Pessoa, PB, 2012.
[13] RIZOPOULOS, D. ltm: An R Package for Latent Variable Modeling and Item Res-ponse Theory Analyses. Journal of Statistical Software, Nov 2006.
[14] MEC, M. da E. RELAT ´ORIO SAEB/ANA 2016: panorama do Brasil e dos Estados. Instituto Nacional de Estudos e Pesquisas Educacionais An´ısio Teixeira., 2018.
[15] COSTA, E. et al. Minera¸c˜ao de Dados Educacionais: Conceitos, T´ecnicas, Ferra-mentas e Aplica¸c˜oes. Jornada de Atualiza¸c˜ao em Inform´atica na Educa¸c˜ao - JAIE, 2012.
[16] VAZ, J. C. et al. Proposta de adequa¸c˜ao da arquitetura do AVA Openredu para suporte a t´ecnicas de an´alise quantitativa de dados educacionais. 22nd Journey of Sci-entific Initiation - 50th Anniversary of Pedagogy of the Oppressed., 2018.