Evaluating Textual Cohesion: Challenges to Essays Assessment

(1)

V. 16 Nº 1, julho, 2018____________________________________________________________

Avaliação da Coesão Textual: Desafios para Automatizar a

Correção de Redações

Thiago Gaglietti de Cˆandido1_{, Carine Geltrudes Webber}1

1_{Area do Conhecimento de Ciˆencias Exatas e Engenharias}_´

Universidade de Caxias do Sul (UCS)

{tgcandido,cgwebber}@ucs.br

Resumo. Avaliar uma redação é uma tarefa complexa e de grande responsabili-dade. Métodos automáticos podem auxiliar no processo avaliativo de redações. O presente artigo propõe um software de análise e avaliação da coesão textual. O método empregado se vale do mecanismo de coesão lexical como elemento principal da análise. Foram realizados experimentos com o software e com-parados com as avaliações de dois especialistas humanos. Os resultados con-vergentes do software com especialistas foram observados em70% dos casos. Considera-se que tais resultados iniciais são promissores para o desenvolvi-mento de um software para avaliação automática de redações.

Palavras-chave: Avaliação textual automática, Computação e Lingu´ıstica, Coesão Textual

Evaluating Textual Cohesion: Challenges to Essays

Assessment

Abstract. Evaluating an essay is a complex task. Automatic methods can assist in the evaluative process. The present article proposes a software of analysis and evaluation of the text cohesion. The employed method uses the mechanism of lexical cohesion as main element of the analysis. Experiments with software were accomplished and compared with the evaluations of two human specia-lists. The convergent results of software with specialists were observed in 70 % of the cases. It is considered that such initial results are promising for the development of a software for automatic essay evaluation.

Keywords: Automatic Text Evaluation, Computational Linguistics, Textual Cohesion

1. Introduc¸˜ao

A avaliação de uma redação é uma tarefa complexa, dada sua subjetividade. Mesmo quando efetuada por especialistas, a avaliação pode resultar em diferentes pontuações por um-a banca avaliadora, o que causa problemas quando se trata de trabalhos acadêmicos ou de redações de vestibulares. Para tratar desse problema é poss´ıvel empregar a tecnologia para auxiliar no processo avaliativo de redações.

A área de Análise Discursiva Automática (ADA) compreende técnicas para auto-matizar pela via computacional tarefas como a avaliação de redações, atividade apenas realizada por especialistas, objeto principal de estudo da subárea de Automated Essay Scoring (AES)[McKEE et al. 2001]. Ao avaliar uma mesma redação, dois peritos po-dem obter resultados diferentes, atestando que existem obstáculos no processo efetuado

(2)

V. 16 Nº 1, julho, 2018____________________________________________________________

Figura 1. Compatibilidade dos resultados atribu´ıdos pelas bancas avaliadoras nas redac¸˜oes do ENEM dos anos de 2012, 2013 e 2014 [PEREIRA 2014, PEREIRA 2013, GEI 2015]

Enem 2012 Enem 2013 Enem 2014

0 20 40 60 80 Percentual total de av aliac ¸

ões Avaliações Conflitantes

Avaliac¸˜oes Compat´ıveis

Fonte: Elaborada pelo autor

por humanos. Pode-se observar isso analisando dados da correção de redações de provas de vestibular do ENEM - Exame Nacional do Ensino Médio. Na Figura 1, apresenta-se o percentual de compatibilidade entre as notas atribu´ıdas por avaliadores nos exames de 2012, 2013 e 2014. Nota-se que no ano de 2012 houve avaliações conflitantes em 20% das redações. Nos anos subsequentes de 2013 e 2014 houve considerável aumento de avaliações conflitantes, passando para mais de 40% do total das redações em cada ano.Estes casos apenas refletem os desafios da padronização da avaliação textual.

A dificuldade para obter um consenso de notas entre avaliadores é ocasionada pelo extenso conjunto de metodologias poss´ıveis para a realização da análise textual, muitas das quais são mutuamente contraditórias e incompat´ıveis [McKEE et al. 2001]. Também deve-se levar em consideração o fator subjetivo da análise textual, que pode ser justificado pelas diferentes trajetórias acadêmicas dos avaliadores.

Ao avaliar redações acadêmicas, podemos elencar três fatores determinantes à pontuação final: a coerência, a coesão e a aderência do conteúdo da redação ao tema proposto [NOBRE 2011]. O presente artigo possui como foco a análise e a avaliação da coesão textual, inserida no n´ıvel lingu´ıstico da semântica, que trata do significado do que é escrito [HASAN and HALLIDAY 1976].

O objetivo principal deste trabalho foi a implementação de uma ferramenta que realize a análise e a avaliação automática da coesão textual através de técnicas baseadas na Teoria do Foco [SIDNER 1979], na Teoria da Centragem [GROSZ et al. 1995] e no método utilizado por Nobre (2011) no sistema Avaliador Automático de Redação – AVAR. O artigo está estruturado da seguinte forma: trabalhos correlatos são apresentados na Seção 2. A Seção 3 apresenta uma revisão bibliográfica, descreve a Teoria do Foco e a Teoria da Centragem (3.2) e explana o cálculo do ´ındice coesivo. Na Seção 4, aborda-se o processo de análiaborda-se e avaliação da coesão textual em um texto disaborda-sertativo, e os experimentos realizados. Na Seção 5, apresenta-se os resultados dos experimentos. Por fim, conclui-se com observações finais e trabalhos futuros.

(3)

V. 16 Nº 1, julho, 2018____________________________________________________________

2. Trabalhos Correlatos

Identificou-se dois sistemas avaliadores automáticos dispon´ıveis para a l´ıngua portu-guesa. O primeiro a ser descrito é o sistema Avaliador Automático de Redação – AVAR [NOBRE 2011]. Ele implementa a avaliação e a valoração da coesão, coerência e adequação ao tema de uma redação de vestibular. O AVAR utiliza técnicas de Inte-ligência Artificial(IA), a partir da captação de elementos relevantes para o processo de atribuição de nota à redação, por meio do Sistema de Inferência Fuzzy (SIF) para valorar cada quesito com base na Teoria de Conjuntos Fuzzy e na Lógica Fuzzy. Os resultados prelimiares descritos equipararam-se aos dos especialistas, contudo trata-se de um projeto em desenvolvimento.

Pardo apresenta outro sistema denominado DiZer – an Automatic Discourse Analyzer for Brazilian Portuguese[PARDO et al. 2004]. Trata-se de um analisador dis-cursivo automático para a l´ıngua portuguesa brasileira, que segue como teoria discursiva a Rhetorical Structure Theory (RST). Os resultados obtidos por meio do software foram considerados satisfatórios para textos cient´ıficos [PARDO et al. 2004]. Contudo, o soft-ware não está dispon´ıvel para uso.

O analisador CORP: Coreference Resolution for Portuguese concebido por Fon-seca et al. (2017), é um software dispon´ıvel para uso de forma combinada a outros. Esse analisador realiza a resolução de correferências em l´ıngua portuguesa e possui como objeto principal a resolução das correferências pertencentes às categorias de entidades nomeadas de Pessoa, Local e Organização.

Durante o processo de análise textual, o CORP realiza a tokenização, cria chunks (grupos de palavras encontradas com frequência juntos em um idioma) a partir dos to-kens(palavras) reconhecidos, e efetua a classificação sintática e a atribuição de rótulos semânticos [FONSECA et al. 2017]. Como sa´ıda, além desses elementos, apresenta as cadeias de sintagmas nominais e as menções únicas no texto analisado. A ferramenta é de uso gratuito para trabalhos acadêmicos.

Para a l´ıngua inglesa, pode-se citar o Intelligent Essay Assessor (IEA). Trata-se de um conjunto de funcionalidades para avaliar a qualidade do conteúdo da redação [FOLTZ et al. 1999]. O IEA utiliza uma abordagem matemática por meio do método Latent Semantic Analysis (LSA), que é empregado para extrair e representar a semântica contextual das palavras mediante cálculos estat´ısticos aplicados em uma grande coleção de textos [LANDAUER and DUMAIS 1997].

Também para a l´ıngua inglesa, o Criterion Online Essay Evaluation Service é um sistema on-line que realiza a avaliação automática de redações, por meio de duas aplicações complementares: o sistema de avaliação E-rater R

que identifica e analisa ele-mentos relacionados a proficiência da escrita; e uma su´ıte de programas que detectam erros de gramática e utilização de mecanismos lingu´ısticos chamado de Critique Writing Analysis Tools[BURSTEIN et al. 2003].

Levando em consideração a quantidade de ferramentas dispon´ıveis para a realização de análises discursivas automáticas em outros idiomas, pode-se observar que o número de softwares existentes para a l´ıngua português brasileiro é limi-tada [FONSECA et al. 2017]. Não foram encontradas ferramentas dispon´ıveis para a avaliação de textos da l´ıngua portuguesa, apenas algoritmos .

(4)

V. 16 Nº 1, julho, 2018____________________________________________________________

3. Compreendendo os Elementos da An´alise Coesiva

Dentre as várias maneiras de analisar um texto, pode-se verificar sua apreensibilidade, frequência de palavras, facilidade de leitura, coesão e coerência. Tratar a coesão de um texto de forma automática é um desafio para a área de Processamento de Linguagem Natural(PLN). Elementos lingu´ısticos são utilizados por técnicas computacionais para realizar a avaliação de uma redação. Nessa seção, apresenta-se as principais técnicas, teorias e os elementos para a realização da análise coesiva.

3.1. Coes˜ao

A coesão aborda as articulações gramaticais entre as palavras, orações e frases para ga-rantir uma boa sequenciação de eventos, ou seja, é aspecto fundamental do discurso, por tratar-se da ideia de ordem entre seus elementos [CRYSTAL 2011]. Halliday e Hasan (1976) definem coesão como um conceito semântico que se refere às relações de sen-tido existentes no interior do texto e que o definem como um texto. Os mesmos autores propõem a distinção dos mecanismos coesivos em cinco categorias. Cada categoria deve respeitar o modo como os itens lexicais e gramaticais relacionam-se com o texto e no texto. As categorias são: referência, substituição, elipse, conjunção e coesão lexical.

Como exemplo, a primeira categoria citada é a referência, um dos principais me-canismos para evitar repetições desnecessárias. Para elucidação das categorias, utiliza-se um exemplo de Perez (2016):

“As crianças foram passear no parque. Elas foram acompanhadas de seus pais.” Na segunda frase, “elas” refere-se a “as crianças”. Já neste segundo exemplo, observa-se a repetição do sujeito:

“As crianc¸as foram passear no parque. As crianc¸as foram acompanhadas de seus pais.”

Embora as duas versões estejam corretas, a primeira forma utiliza uma anáfora pronominal (ela) para retomar o elemento referente. O conceito de anáfora é essencial para o entendimento do mecanismo da coesão lexical. Pode-se definir anáfora como uma unidade lingu´ıstica que tem sua interpretação definida por uma entidade previamente ex-pressada, chamada de antecedente [CRYSTAL 2011].

3.2. Teoria do Foco e Teoria da Centragem

As teorias explicadas nessa seção foram utilizadas para realizar a análise do grau de coesão entre as unidades textuais das redações avaliadas.

A Teoria do Foco (TF) tem como objetivo a análise de elementos anafóricos [SIDNER 1979]. O algoritmo da TF tem como função reduzir o conjunto de poss´ıveis antecedentes introduzidos no universo do receptor durante a interpretação de novas frases proferidas em um dado contexto e propor um caminho mais eficiente para percorrer este universo, já reduzido, em busca de um antecedente [NOBRE and PELLEGRINO 2010]

A Teoria da Centragem (TC) tem como proposta medir como a coesão do discurso é influenciada pela compatibilidade entre os centros de atenção e a escolha das expressões de referenciação [GROSZ et al. 1995]. O centro de atenção é utilizado para designar o objeto mais relevante do discurso. Essa teoria é uma proposta diretamente relacionada com a Grosz and Sidner Discourse Theory (GSDT) [GROSZ and SIDNER 1986].

(5)

V. 16 Nº 1, julho, 2018____________________________________________________________

O foco é a entidade que o emissor toma como centro de sua atenção em determi-nado ponto do texto [NOBRE 2011]. Para a resolução de anáforas, dois centros de atenção são definidos: o Foco do Ator (FA) e o Foco do Discurso (FD), os quais são determinados pelo agente e pelo tema de cada frase, utilizando a informação temática [GRUBER 1976], a informação gramatical (sujeito, objeto direto, objeto indireto, etc.) e a informação sobre quais são as entidades mais salientes da fase anterior, ou seja, o Foco Local (FL).

Seguindo a abordagem utilizada por Nobre (2010), a classificação de Foco Expl´ıcito(FE) e Foco Impl´ıcito (FI) é feita da seguinte maneira:

a) FE: É a lista de entidades explicitamente contidas em cada frase do texto. São ele-mentos anafóricos e sintagmas nominais existentes na sentença [SIDNER 1979]; e

b) FI: É a lista de rótulos semânticos das entidades em FE. No caso de um nome próprio, o rótulo semântico será um identificador único para o termo.

As poss´ıveis leituras do relacionamento em uma frase F entre o FE e FI s˜ao [NOBRE and PELLEGRINO 2010]:

a) se existe um elemento E de F Ei em F Ei+1 (E ∈ F Ei+1) e tamb´em existe um

elemento I de F Ii em F Ii+1 (I ∈ F Ii+1), ent˜ao as frases Fi e Fi+1 est˜ao em

processo de elaborac¸˜ao, visto que compartilham as mesmas entidades;

b) se existe um elemento E de F Ei em F Ei+1 (E ∈ F Ei+1), mas n˜ao existe um

elemento I de F Ii em F Ii+1, ent˜ao as frases Fi e Fi+1(I /∈ F Ii+1) est˜ao num

processo de manutenção de tópico, visto que compartilham elementos expl´ıcitos; c) se não existe um elemento E de F Ei em F Ei+1 (E /∈ F Ei+1), mas existe um

elemento I de F Ii em F Ii+1 (I ∈ F Ii+1), ent˜ao as frases Fi e Fi+1 est˜ao num

processo de mudança de tópico, pois compartilham entidades semânticas; e d) se não existe elemento E de F Ei em F Ei+1 (E /∈ F Ei+1), nem um elemento

I de F Ii em F Ii+1 (I /∈ F Ii+1), ent˜ao as frases Fi e Fi+1 est˜ao num

pro-cesso de mudança de assunto, pois não compartilham entidades expl´ıcitas e nem semânticas.

Por meio dessas teorias, algoritmos de avaliação da coesão local e global foram elaborados [NOBRE 2011]. O uso desses algoritmos possibilita a realização do cálculo do Índice Coesivo, que determina a força coesiva do texto por meio das relações cons-titu´ıdas entre suas frases e parágrafos [NOBRE 2011]. Índice Coesivo (IC) é definido pela Equação 1: IC = ( Ps−1 i=1P SFi,i+1 s − 1 + Pp−1 i=1 Pp−1 j=1P SPi,i+j Pp−1 j=1j )/2 (1)

Onde s representa o total de sentenc¸as, p o total de par´agrafos, P SFi,i+1a nota da

relação entre as frases adjacentes, P SPi,i+j a nota da relação entre parágrafos adjacentes,

(6)

V. 16 Nº 1, julho, 2018____________________________________________________________

Tabela 1. Relação de FE e FI para o estabelecimento de coesão, sendo E um elemento de F Ei e I um elemento de F Ii

E ∈ F Ei+1 Pontuação E /∈ F Ei+1 Pontuação

I ∈ F Ii+1 Elaboração 1 Mudança de tópico 0,5

I /∈ F Ii+1 Manutenção do tópico 0,75 Mudança de assunto 0,0

Fonte: [NOBRE and PELLEGRINO 2010]

4. M´etodo da Pesquisa

A análise realizada pelo software AAACT – Avaliador e Analisador Automático de Coesão Textualproduz uma pontuação de 0, 0 a 2, 0 pontos que valora o n´ıvel coesivo de uma redação considerando o mecanismo de coesão lexical. O processo de análise de ocorre em duas fases: a fase de obtenção de informações e a fase de aplicação das teorias. Na primeira fase o software utiliza recursos externos para a obtenção de informações e, na segunda fase, implementa os algoritmos que realizam a análise e a avaliação da coesão.

Na fase de obtenção de informações é realizada uma análise utilizando o CORP: Coreference Resolution for Portuguese concebido por Fonseca et al. (2017). Ainda, utilizou-se a base Tep2 [MAZIERO et al. 2008] para obter sinônimos do núcleo dos sin-tagmas nominais.

Na segunda fase, as teorias elencadas são aplicadas utilizando o conhecimento obtido na fase de análise. A TF e a TC foram utilizadas para identificar o grau de coesão entre as unidades do texto e, a partir da obtenção desses dados, é aplicado o cálculo do IC para obter o ´ındice coesivo da redação. O resultado do ´ındice coesivo é utilizado como pontuação da coesão textual.

A análise e a avaliação da coesão textual é realizada por uma aplicação Java, disponibilizada em um servidor e acess´ıvel por meio de métodos HTTP, que implementa a lógica do analisador e realiza a interação com o analisador CORP e a base Tep2. Para submeter redações e visualizar os resultados da análise criou-se uma página web com HTML, CSS e JavaScript, além das bibliotecas D3.js e Angular.js.

Como exemplo, possui-se o discurso D contendo as frases F1e F2para demonstrar

o processo de análise e avaliação.

F1 = “O Brasil passa por um momento dif´ıcil devido aos (2)

escˆandalos pol´ıticos.” (3)

F2 = “O pa´ıs sente os ef eitos disso na economia.” (4)

Logo, o discurso pode ser representado por D = {F 1, F 2}. Para cada Fi de D,

calculam-se os conjuntos F Eie F Ii, ou seja, o conjunto de elementos do Foco Expl´ıcito

e o conjunto de elementos do Foco Impl´ıcito. Realiza-se esse processo por meio do analisador CORP [FONSECA et al. 2017]. Para F1, obtˆem-se os seguintes conjuntos:

F E1 = {“O Brasil”, “um momento dif´ıcil”, “a os escˆandalos pol´ıticos”} (5)

(7)

V. 16 Nº 1, julho, 2018____________________________________________________________

E para F2, os conjuntos s˜ao os seguintes:

F E2 = {“O pa´ıs”, “os ef eitos de isso”, “isso”, “a economia”} (7)

F I2 = {“OU T RO”, “OU T RO”, “ORGAN IZAC¸ ˜AO|LOCAL”, (8)

“COM U N ICAC¸ ˜AO|P REDIC”} (9)

Durante a definição dos conjuntos, buscam-se sinônimos do núcleo de cada elemento de foco expl´ıcito, utilizando como fonte a base de sinônimos Tep2 [MAZIERO et al. 2008]. Por exemplo, como sinônimos de um elemento E, obtém-se o conjunto Syne. Com E = “O pa´ıs”, obtém-se SynE = {“nação”, “território”}.

Com os conjuntos definidos, aplicam-se as teorias para avaliar o grau de coesão textual. Utiliza-se os Algoritmos de Coesão Local e Global para a análise. A partir do Algoritmo de Coesão Local, o primeiro passo é obter a intersecção, entre sentenças adjacentes, dos elementos de foco expl´ıcito RF E1,2. O analisador CORP identifica que o

sintagma “O pa´ıs” é um hiperônimo do sintagma “O Brasil”, e assim obtém-se:

RF E1,2 = {“O Brasil”, “O pa´ıs”} (10)

Continua-se removendo os elementos de foco impl´ıcito dos conjuntos F I1 e F I2

equivalentes aos elementos pertencentes a RF E1,2 . Após isso, calcula-se a intersecção

dos conjuntos F I1e F I2 que resulta no conjunto RF I1,2. Para a realização desse cálculo

foi feita uma adaptac¸˜ao devido as capacidades do analisador CORP.

Como a análise semântica do analisador em questão possui foco nas categorias de Pessoa, Organização e Local, as categorias desconhecidas são rotuladas com a etiqueta ”OUTRO”. Pelo fato de que a análise do foco impl´ıcito é realizada utilizando o rótulo semântico, essa análise se demonstrou imprecisa quando se compara elementos que pos-suem a etiqueta semântica ”OUTRO”. Nesse caso, o sistema realiza a comparação por meio dos sinônimos dos elementos, para obter maior precisão.

No exemplo proposto, a partir da intersecção dos de F I1 e F I2 obtém-se o

con-junto RF I1,2 = {}. O conjunto ´e vazio pois nenhum par de elementos possui o mesmo

rótulo semântico, e dentre os pares que possuem o rótulo ”OUTRO”, não foram encontra-dos sinônimos equivalentes. Após isso possui-se os conjuntos necessários para identificar a relação do estabelecimento de coesão, utilizando a Tabela 1, e para realizar o cálculo do Índice Coesivo (IC). Para realizar o cálculo do IC, aplica-se a Equação 1 e é feita a proporção para o resultado enquadrar-se nos valores da Tabela 2. A avaliação da coesão obtém nesse caso uma pontuação de 1, 5. Conclui-se que o discurso D utiliza, sem refi-namento, os mecanismos coesivos para o desenvolvimento do texto.

Nesse exemplo não aplicamos o Algoritmo de Coesão Global pois o discurso D possui apenas um parágrafo. O Algoritmo de Coesão Global é semelhante ao Algoritmo de Coesão Local, e possui como principal diferença a análise entre os parágrafos ser reali-zada utilizando adjacência máxima, ou seja, compara-se os elementos de foco expl´ıcitos, impl´ıcitos e seus sinônimos de um parágrafo com todos os outros parágrafos do discurso.

(8)

V. 16 Nº 1, julho, 2018____________________________________________________________

Tabela 2. Relacionamento entre classe e nota atribu´ıda por banca

Classes Formas de utilizac¸˜ao de elos coesivos Nota

1 Utiliza recursos coesivos da l´ıngua que afetam a coerência. 0,0 - 0,4 2 Utiliza recursos coesivos que não afetam a coerência. 0,5 - 0,8 3 Utiliza, ainda que com alguns problemas, recursos coesivos. 0,9 - 1,2 4 Utiliza recursos da l´ıngua sem demonstrar refinamento. 1,3 - 1,6 5 Utiliza com proficiência os recursos coesivos da l´ıngua. 1,7 - 2,0

Fonte: [NOBRE and PELLEGRINO 2010]

5. Experimento e An´alise dos Resultados

Para a realização do experimento foram coletadas trinta e cinco redações de alunos em uma disciplina do curso de engenharia de uma instituição de ensino. Após as redações serem avaliadas pela ferramenta, os valores obtidos por meio do cálculo do IC foram comparados a pontuação atribu´ıda pela banca avaliadora, que contava com dois membros especialistas graduados no curso de Licenciatura em Letras. Com a finalidade de ob-ter resultados padronizados, os peritos utilizaram a Tabela 2 como critério de avaliação.

´

E importante destacar que a avaliação foi realizada levando em consideração apenas a coesão textual.

A compatibilidade das notas atribu´ıdas pelos especialistas é apresentada na Figura 2, totalizando um percentual de 51, 42%. Ao remover-se as redações que obtiveram uma diferença de pontuação superior a 0, 4 pontos (consideradas avaliações divergentes entre especialistas), os avaliadores apresentaram uma divergência média de resultados de 0, 16 pontos.

Figura 2. Pontuac¸˜ao atribu´ıda por avaliadores

0 5 10 15 20 25 30 35 0 0.5 1 1.5 2 Redação Pontuac ¸ão Avaliador 1 Avaliador 2

Fonte: Elaborada pelo autor

Aplicando a avaliação automática pelo AAACT nas redações em que os avaliado-res alcançaram pontuações convergentes, ou seja, nos textos em que a discrepância entre as notas foi menor que 0, 4 pontos. Dentro desse conjunto de redações, a ferramenta con-vergiu com os dois especialistas em 50% das análises (assumindo o mesmo limite de 0, 4 pontos para convergência). Ela ainda convergiu parcialmente com um especialistas em dois casos. Nos seis casos restantes, conclui-se que houve divergência.

(9)

V. 16 Nº 1, julho, 2018____________________________________________________________

Figura 3. Resultados das avaliações que obtiveram compatibilidade entre os especialistas, e a pontuação do AAACT para essas avaliações

0 2 4 6 8 10 12 14 16 0 0.5 1 1.5 Redação Pontuac ¸ão Avaliador 1 Avaliador 2 AAACT

6. Conclus˜ao

O presente trabalho dedicou-se à implementação de um analisador e avaliador de coesão textual. As principais teorias utilizadas baseiam-se no algoritmo apresentado por Nobre (2011) e foram obtidas por meio da Teoria do Foco [SIDNER 1979] e a Teoria da Centra-gem[GROSZ et al. 1995]. A metodologia para pontuação coesão é baseada no sistema Avaliador Automático de Redação – AVAR[NOBRE 2011].

A avaliação automática obteve uma compatibilidade global de 70, 00% com as notas dadas pelos avaliadores nas redações que apresentaram diferença de até 0, 4 pontos entre os avaliadores. Considera-se um resultado satisfatório, dado que o sistema realiza a avaliação apenas utilizando um dos cinco mecanismos coesivos.

Ao se limitar à comparação considerando o mecanismo da coesão lexical, o AA-ACT obteve em média uma discrepância de 0, 23 pontos em relação aos avaliadores, o que reforça a possibilidade de utilizar o método proposto, com algumas melhorias, como parte da realização de um avaliador de redações automático que é capaz de analisar textos de forma regular e imparcial. Concluiu-se também que avaliações de redações irregula-res realizadas por especialistas podem apirregula-resentar um alto ´ındice de divergência, fato que motiva a criação de um avaliador automático para redações.

Para trabalhos futuros, tem-se como prioridade a integração de um analisador mor-fossintático para obter os referentes das anáforas que utilizam outros mecanismos coesi-vos, como o da referência e da substituição, assim complementando a entrada de dados para a aplicação dos métodos de análise de coesão textual e obtendo maior compatibi-lidade com avaliadores humanos. Também tem-se em vista a integração desse trabalho com outros relacionados a AES, para a realização de um sistema de avaliação de redações automático.

Referˆencias

BURSTEIN, J., CHODOROW, M., and LEACOCK, C. (2003). Criterionsm online essay evaluation: An application for automated evaluation of student essays. In IAAI, pages 3–10.

CRYSTAL, D. (2011). Dictionary of linguistics and phonetics, volume 30. John Wiley & Sons.

(10)

V. 16 Nº 1, julho, 2018____________________________________________________________

FOLTZ, P. W., LAHAM, D., and LANDAUER, T. K. (1999). The intelligent essay asses-sor: Applications to educational technology. Interactive Multimedia Electronic Jour-nal of Computer-Enhanced Learning, 1(2):939–944.

FONSECA, E., SESTI, V., ANTONITSCH, A., VANIN, A., and VIEIRA, R. (2017). Corp: Uma abordagem baseada em regras e conhecimento semântico para a resoluçao de correferências. Linguamática, 9(1):3–18.

GEI, A. (2015). Em 2014 mais de 200 mil redac¸˜oes do enem foram canceladas por fuga ao tema. Dispon´ıvel em: <http://universitario.net/enem/em-2014-mais-de-200-mil-redacoes-do-enem-foram-canceladas-por-fuga-ao-tema/>. Acesso em: 21 jun. 2017. GROSZ, B. J. and SIDNER, C. L. (1986). Attention, intentions, and the structure of

discourse. Computational linguistics, 12(3):175–204.

GROSZ, B. J., WEINSTEIN, S., and JOSHI, A. K. (1995). Centering: A framework for modeling the local coherence of discourse. Computational linguistics, 21(2):203–225. GRUBER, J. (1976). Lexical structures in syntax and semantics, volume 25.

North-Holland.

HASAN, R. and HALLIDAY, M. A. (1976). Cohesion in English. Longman London. LANDAUER, T. K. and DUMAIS, S. T. (1997). A solution to plato’s problem: The latent

semantic analysis theory of acquisition, induction, and representation of knowledge. Psychological review, 104(2):211.

MAZIERO, E. G., PARDO, T. A., DI FELIPPO, A., and DIAS-DA-SILVA, B. C. (2008). A base de dados lexical e a interface web do tep 2.0: thesaurus eletrˆonico para o portuguˆes do brasil. In Companion Proceedings of the XIV Brazilian Symposium on Multimedia and the Web, pages 390–392. ACM.

McKEE, A. et al. (2001). A beginner’s guide to textual analysis. Metro Magazine: Media & Education Magazine, (127/128):138.

NOBRE, J. C. S. (2011). Modelo Computacional para Valoração e Avaliação de Redações Baseado em Lógica Fuzzy. PhD thesis, Área de Informática - Instituto Tec-nológico de Aeronáutica, São José dos Campos.

NOBRE, J. C. S. and PELLEGRINO, S. R. M. (2010). Anac: um analisador automático de coesão textual em redação. In Anais do Simpósio Brasileiro de Informática na Educação, volume 1.

PARDO, T. A. S., NUNES, M. d. G. V., and RINO, L. H. M. (2004). Dizer: An automa-tic discourse analyzer for brazilian portuguese. In Brazilian Symposium on Artificial Intelligence, pages 224–234. Springer.

PEREIRA, C. D. P. (2013). Dados sobre a correção da redação do enem 2012. Dis-pon´ıvel em: <https://www.infoenem.com.br/dados-sobre-a-correcao-da-redacao-do-enem-2012/>. Acesso em: 21 jun. 2017.

PEREIRA, C. D. P. (2014). Dados da correção da redação do enem 2013. Dispon´ıvel em: <https://www.infoenem.com.br/dados-da-correcao-da-redacao-do-enem-2013/>. Acesso em: 21 jun. 2017.

SIDNER, C. L. (1979). Towards a computational theory of definite anaphora comprehen-sion in english discourse. Technical report, Massachusetts Inst of Tech Cambridge Artificial Intelligence lab.