• Nenhum resultado encontrado

7.2 A SIMPLIFICAÇÃO TEXTUAL (ST) E A LINGUÍSTICA COMPUTACIONAL/PLN

7.2.3 A Simplificação Textual (ST) no PorSimples

Conforme já citado, o PorSimples é um projeto de Simplificação Textual desenvolvido para o português brasileiro pelo NILC (Núcleo Interinstitucional de Linguística Computacional) da USP São Carlos. O projeto PorSimples (Simplificação Textual do Português para Inclusão e Acessibilidade Digital) propõe o desenvolvimento de uma tecnologia para facilitar o acesso à informação dos analfabetos funcionais (AF) e, potencialmente, de pessoas com outras deficiências cognitivas, como afasia e dislexia (NILC, c2010). O Projeto desenvolveu um editor de textos chamado Simplifica. O Simplifica é uma ferramenta que auxilia autores de conteúdo a redigir textos simplificados, que possam ser entendidos por um número maior de leitores. O sistema trabalha com dois tipos de simplificação, a simplificação sintática (dividindo orações longas ou alterando a estrutura sintática da oração) e a simplificação léxica (destacando palavras complexas ou pouco comuns e oferecendo sinônimos). Como podemos ver nas figuras a seguir.

Figura 37: Os tipos de simplificação do Simplifica: léxica e sintática

Fonte: NILC (c2010, documento on-line).

A simplificação léxica é realizada com base em dicionários de sinônimos da Linguateca e do NILC, bem como por dois dicionários de palavras simples criados pelo Projeto PorSimples, como vemos na Figura 38. Enquanto a simplificação sintática segue uma gramática e o usuário pode escolher quais aspectos gramaticais simplificar, além de optar pelo grau de simplificação de acordo com o nível de escolaridade do leitor.

Figura 38: A simplificação léxica no Simplifica

Fonte: NILC (c2010, documento on-line).

Figura 39: A simplificação sintática no Simplifica

Fonte: NILC (c2010, documento on-line).

Da mesma forma que com o Simplext, realizei testes na ferramenta com um texto técnico-científico sobre a temática da Doença de Parkinson, extraído da Wikipedia Brasil, e outro jornalístico, extraído do site de notícias UOL. O intuito era verificar se a ferramenta é capaz de produzir um texto simplificado em nível lexical e sintático e se haveria diferença quando o texto inserido é técnico ou não técnico.

PRIMEIRO TEXTO – SOBRE A DOENÇA DE PARKINSON

A doença de Parkinson (DP) é uma perturbação degenerativa crônica do sistema nervoso central que afeta principalmente a coordenação motora.Os sintomas vão-se manifestando de forma lenta e gradual ao longo do tempo. Na fase inicial da doença, os sintomas mais óbvios são tremores, rigidez, lentidão de movimentos e dificuldade em caminhar. Podem também ocorrer problemas de raciocínio e comportamentais. Nos estádios avançados da doença é comum a presença de demência. Cerca de 30% das pessoas manifestam depressão e ansiedade. Entre outros possíveis sintomas estão problemas sensoriais, emocionais e perturbações do sono. O conjunto dos principais sintomas em nível motor denominam-se "Parkinsonismo", ou síndrome de Parkinson.

Fonte: Doença de Parkinson (2018, documento on-line).

Como se pode ver na Figura 40, a ferramenta marca as opções de palavras complexas e fornece opções de sinônimos de acordo com seus dicionários. O sistema, porém, não consegue detectar termos compostos, como “sistema nervoso central” e “coordenação motora”, “problemas sensoriais”, para citar alguns exemplos. Além disso, em uma análise não automática, acredito que outros termos e palavras poderiam ser trabalhados em vistas à simplificação, como “principalmente”, “perturbações” e “rigidez”. Contudo, esta não é a principal dificuldade do Simplifica. A restrição maior está no fato de que a ferramenta propôs opções de alteração/simplificação somente para pouquíssimos dos termos e palavras marcados. E mesmo quando propõe sinônimos, eles não são opções para substituição, como podemos ver com o termo “emocionais” e cujas opções fornecidas pela ferramenta foram “coração”, “emocionante” e “impressionante”. Em outra situação, com o termo “depressão”, o Simplifica teve um desempenho ainda pior na tarefa de apresentar candidatos à simplificação. Os sinônimos apresentados em nada tiveram a ver com o distúrbio ‘depressão’, tendo sido apresentados “sinônimos” como “rã”, “original”, “empresa”, etc. (Figura 41). No quesito simplificação sintática, o Simplifica não foi capaz de apresentar nenhum resultado para este texto, como mostrado na Figura 42.

Figura 40: Editor do Simplifica com simplificação lexical e sintática

Fonte: NILC (c2010, documento on-line).

Figura 41: Editor do Simplifica com opções de sinônimos para o termo ‘depressão’

Figura 42: O editor do Simplifica não conseguiu realizar a simplificação sintática

Fonte: NILC (c2010, documento on-line).

Em outro cenário, com um texto jornalístico não técnico, o Simplifica teve um desempenho melhor, mas não o suficiente para que se possa afirmar que ele de fato é capaz de simplificar, sozinho, automaticamente, um texto. Na parte lexical, a ferramenta conseguiu atribuir sinônimos a um maior número de palavras e dentro do contexto esperado, como podemos ver na Figura 43. Contudo, ainda assim, não foi capaz de sugerir substituições para palavras que não eram extremamente técnicas ou de muito baixa frequência, como no caso de “envelhecimento”, como mostra a Figura 44. A simplificação sintática, no entanto, retornou um resultado, mas que, de fato, não alterou o texto em nada, como mostra a Figura 45.

TEXTO 2 – NOTÍCIA DE JORNAL

Demanda por moradia cai, mas ainda deve superar 1 milhão ao ano até 2024, aponta estudo

O Brasil terá uma demanda superior a 1 milhão de novos domicílios por ano nos próximos seis anos, até 2024 --essa necessidade vem caindo, mas o desafio no país ainda é gigante. O dado consta no estudo "Demanda Futura por moradia”, desenvolvido pela UFF (Universidade Federal Fluminense), em parceria com a Secretaria Nacional de Habitação.

O estudo faz uma estimativa levando em consideração a curva de crescimento populacional e de novas habitações nos últimos anos, o envelhecimento da população e a dinâmica de formação das famílias --que vêm encolhendo ao longo do

tempo. A grande tendência que deve se acentuar é a moradia com cada vez menos moradores.

Fonte: Madeiro (2018, documento on-line).

Figura 43: Editor Simplifica com os candidatos a sinônimos para ‘Habitação’

Fonte: NILC (c2010, documento on-line).

Figura 44: Editor Simplifica sem candidatos a sinônimos para ‘envelhecimento

Figura 45: Editor Simplifica com o resultado da simplificação sintática, que, na prática, não realizou

nenhuma alteração

Fonte: NILC (c2010, documento on-line)

CONSIDERAÇÕES DA AUTORA

Acredito que as iniciativas de se criar ferramentas que simplifiquem textos automaticamente - ou que apenas auxiliem o redator indicando prováveis itens complexos - são extremamente relevantes. Afinal, esses sistemas tendem a contribuir para democratizar ainda mais o acesso ao conhecimento, principalmente sobre aquele que já está disponível on- line, uma vez que nem todos os leitores poderão contar com profissionais da simplificação ou com versões simplificadas dos textos já disponíveis. Contudo, como foi verificado por breves testes realizados com o Simplext e com o PorSimples, muito ainda é preciso ser feito para que essas ferramentas funcionem bem e produzam resultados efetivos.

Apesar de eu não compreender, a fundo, os mecanismos computacionais dessas ferramentas, do ponto de vista linguístico, parece-me que elas são ainda mais complexas que um tradutor automático, uma vez que as ferramentas de tradução automática contam com extensos corpora que lhes alimentam com os contextos de uso das palavras em tradução. Isso, no curto e médio prazos, dificilmente ocorrerá em uma ferramenta automática de simplificação, uma vez que não existem (ainda) corpora simplificados, com o texto original e o adaptado, exceto pelo da Wikipedia e Simple Wikipedia, suficientemente representativos. Alguns corpora foram criados exclusivamente para alimentar essas ferramentas de simplificação, ficando limitados em termos de extensão e representatividade.

Nesse contexto, parecer-me-ia mais proveitoso se essas ferramentas fossem criadas por áreas de conhecimento e por área temática. Projetar uma ferramenta de simplificação para textos exclusivamente médicos, por exemplo, pode ser um caminho para se ter uma ferramenta mais precisa. Há ainda muito a se avançar nesse sentido, mas, com os investimentos e a visibilidade necessários, as ferramentas de simplificação podem ganhar espaço.

Vale salientar que essas ferramentas podem ser grandes aliadas em sala de aula, especialmente em um ambiente multilíngue como as disciplinas de Terminologia, bem como nas disciplinas de Tradução com diferentes línguas de trabalho, uma vez que temos acesso a sistemas que trabalham como idiomas distintos, como espanhol, inglês e português. Além disso, com o avanço das tecnologias, a utilização de ferramentas computacionais em sala de aula costuma despertar o interesse dos alunos para as temáticas sendo trabalhadas, como pude comprovar durante o nosso projeto de pesquisa apoiado pela SEAD/UFRGS de Ensino a Distância já mencionado nesta dissertação.