\
UNIVERSIDADE DE SAD PAULO INSTITUTO DE FTslCA DE SAD CARLOS
DEPARTAMENTO DE FTslCA E CIENCIA DOS MATERIAlS
Ferramentas para Auxil iar a Escrita de Artigos Cientificos
em Ingl~s como Lingua Estrangeira
II
~
I ~~
f"J
UNIV~RSIDADE
~
I.
W-~_.)_~_
D E S A O P A U L O
~ In stitu to de Ffsica d e S io C arlos Av. Dr. Carlos Botelho,CEP 13560-250 - Silo Carlos - SP1465
Brasil
C:\WINWORD\WLA\OFDEFD.DOC Fone (0162) 72-6222
Fax (0162) 72-2218
MEMBROS DA COMISSAO JULGADORA DA TESE DE DOUTORADO DE
SANDRAMARllA ALillSXO
APRESENTADA AO INSTITUTO DE FlSICA DE SAO CARLOS,
UNIVERSIDADE DE SAO PAULO, EM 31/08/1995.
~~~:b~~:~~;
__
~~~_~':~:~_a
Jr.
Prof. Dr. Luiz Nunes de Oliveira
__G0_~_~ r{l~__
t-: ~
(~~::_~_~~
Profa. Dra. Ariadne M.Brito R.Carvalho
0~/~
---~-~~~--~~_----l---Profa. f5ra. Clarisse Sieckenius de Souza
/ LJ/
.
{/ //l'Q
--- --- - ----~ - - - -
A g ra d e c im e n to s
Sao inumeros os agradecimentos ao Prof. Dr. Osvaldo N. O. Jr., cuja orienta<;ao,
encorajamento e cren<;a em mim ajudaram na realiza<;ao deste trabalho. Sem
duvida, os efeitos de sua energia e disposi<;aopara 0trabalho nunca cessarao de
produzir frutos.
As amigas: Gra<;a N., Rosely S., Renata, Grac;a P., Carolina, Cristina, Solange,
Agma e Roseli F. foram urn grande apoio dentro e fora da USP. Agrade<;o
especialmente a Agma e Renata pela ajuda na editorac;ao final da tese, e aos
professores Homero Schiabel e Niura Fontana pelas discussoes sabre 0 processo
e tecnicas de escrita. Obrigada a todas as secretiuias do Departamento de
Computa<;ao do ICMSC - 0 suporte tecnico e a amizade foram muito
gratificantes.
Agradecimentos especiais a Prof. Donia Scott pela orientac;ao durante 0 estagio
no Inform ation T echnology R esearch Institute, B righton U niversity. Seu
conhecimento e sabedoria tornaram aquele periodo decisivo para minha
forma<;ao. Agradecimentos tambem saD especiais a amiga e pesquisadora Cecile
Paris, pelo carinho em explicar tantas coisas e pelas tantas duvidas que
desapareceram depois das longas discussoes.
A
Lucia, obrigada por ter sido uma voz amiga durante 0 estagio. A todos osamigos contemporaneos de doutorado: Carmo, Sandra, Rosangela, Roseli,
Jacques e David, muito obrigada pelas boas conversas, que tornaram este
periodo menos tensa. Obrigada ao aluno Roberto pel a ajuda na implementac;ao
da interface e filtros para 0 ambiente.
Urn muito obrigada vai para a pesquisadora Karen Kukieh, pela gentileza impar
em responder as minhas duvidas. Sua abordagem pragmatica na resoluc;ao de
problemas da area de Linguistiea Computaeional mareara para sempre meu
estilo de trabalho. Que eu possa ter pelo menos urn poueo de sua sensibilidade e
visao quando estiver orientando estudantes - Jl,lany thanks Karenl
Foram vahosas as discussoes com 0 Prof. Stan Matwin, da U niversity of O ttaw a
e com 0Prof. Luis Torgo da Universidade do Porto.
Agrade<;o a meus pais e irmaos pela constante alegria da eompanhia e pelo apoio e am or ineondieionais.
Finalmente, urn obrigada com urn grande abrac;o a minha melhor produc;ao:
Esta tese trata do problema da escrita de artigos cientificos em ingles como lingua
estrangeira. Do ponto de vista teorico, foram investigados metodos e tecnicas de
duas areas da Inteligencia Artificial - Linguistica Computacional e Raciocinio
Baseado em Casos -, em busca de soluc:;6espara a construc:;ao de ferramentas de
software que diminuissem os problemas de interferencia da l1ngua materna e de
falta de coesao e coerencia nos textos escritos por estudantes da area de fisica
experimental, principalmente. Do ponto de vista pratico, foram desenvolvidas
duas ferramentas de auxilio a escrita. Uma primeira, chamada Ferramenta de
Referencia, foi implementada utilizando-se 0 metodo de analise de corpus para a
gerac:;ao de urna Base de Express6es que contem as colocac:;6esdo tipo
express6es-padrao, comurnente encontradas em textos cientificos de artigos e livros de
subareas de fisica e informatica. 0 acesso as colocac:;6espode ser feito de tres
maneiras: atraves de componentes e subcomponentes da estrutura esquematica
de artigos da area de pesquisa experimental, atraves de palavras-chave
pertencentes a este genero, e pelos padr6es retOricos mais comuns que este genero
utiliza. Uma ferramenta de aquisic:;ao de conhecimento esta acoplada a
Ferramenta de Referencia, permitindo extensibilidade, facil personalizac:;ao, e
transporte (portability) para novos dominios. Testes com alunos de pos-graduac:;ao
em urn curso de Escrita Cientifica no IFQSC·USP comprovaram a eficacia da
ferramenta, urna vez que seu uso auxiliou na superac:;ao do bloqueio inicial em se
produzir urn primeiro rascunho de texto, e forneceu input adequado para a escrita
de textos coesos. Como observou-se, tambem, que esta ferramenta sO e adequada
para usuarios com boa recepc:;ao da lingua inglesa e alguma experiencia em
escrita cientifica, urna nova ferramenta foi implementada para urna classe de
usuarios que possuem problemas mais severos quanto a coesao e interferencia da
lingua materna. Ela foi denominada Ferramenta de Suporte, e para sua
implementac:;ao utilizou-se, alem do metodo de analise de corpus, a abordagem
baseada em casos para modelar as fases da escrita. A analise de corpus nesta
segunda ferramenta foi mais detalhada, ficando assim restrita a Sec:;ao
IntrodutOria de Artigos Experimentais. Esta analise identificou trinta estrategias
retOricas encontradas em artigos cientificos, geralmente realizadas por tres ou
quatro mensagens (denominac:;ao para os tipos diferentes de informac:;6es)
tomadas de urn conjunto de quarenta e cinco tipos. A base de casos da
implementac:;ao atual da ferramenta conta com cinquenta e quatro instancias de
introdu<;Oes autenticas das revistas P hysical R eview L etters e T hin Solid F ilm s,
urn nillnero ainda pequeno que deve ser aurnentado para que urna avaliac:;ao
quantitativa do metodo de busca seja realizada. Uma ferramenta para auxiliar 0
engenheiro de conhecimento na aquisic:;ao de novos casos e varios filtros para
automatizar 0 processo de edic:;ao dos casos foram implementados, tornando 0
processo de gerac:;ao de novos casos semi-automatico. Os trabaIhos futuros com
relac:;ao a esta segunda ferramenta devem tratar principalmente do acrescimo de
casos na base, da avaliac:;ao da precisao e revocac:;ao da busca, e de testes com
usuanos, que, com certeza, contribuirao para 0 aperfeic:;oamento de ferramentas
This thesis considers the problem of writing scientific papers in English as a foreign language. From the theoretical point of view, techniques from two areas of Artificial
Intelligence, namely Computational Linguistics and Case-based Reasoning, were
investigated in the search for possible solutions to minimize mother tongue
interference and lack of cohesion and coherence in student" texts, especially in experimental physics. Two writing tools were then developed. The first one, named
Reference Version, employed corpus analysis for creating a sentences base
containing collocations frequently used in scientific writing. Such collocations could be accessed in one of three ways: according to the components and subcomponents of
the schematic structure of a scientific paper, by searching keywords and
communicative goals. An acquisition mode was also implemented so that the tool can be customized easily thus allowing portability to other domains and possible extensions within a given domain. Experiments in a technical writing course at
IFQSC-USP for graduate student" have demonstrated the efficacy of the tool. It was
particularly useful in helping students to overcome the initial block in the
preparation of a first draft and also in providing contextualized linguistic input for producing a cohesive text. It was also observed that this first tool was only helpful
for students possessing reasonable reception of the English language and some
experience in scientific writing. A new, more sophisticated tool was then proposed and implemented. It is named Support Version and utilizes corpus analysis and the case-based approach as a framework for modeling the different stages of the writing process. Because a more detailed analysis had to be performed, the tool was
restricted to the Introductory Section of papers on experimental physics. In this
analysis 30 rhetorical strategies were identified which were generally realized
linguistically using 3 or 4 rhetorical messages from a set of 45 types of message. The
implemented cases base has 54 introductions from the Physical Review Letters and Thin Solid Films journals, which has been shown to be a far too small number for
reasonable recall and precision figures to be obtained. A scheme has been
incorporated into the tool for adaptations to be made in the cases recovered, by
making use of revision rules. In future the tool may be extended in a
straightforward way to other parts of a scientific paper or to other areas of research
with a semi-automatic edition process of new cases that has been built into the
Publica~oes
R e s u lta n te s d e s te T ra b a lh o
• Oliveira, Jr. O.N.; (Caldeira), Aluisio S.M. and Fontana, N. C husaum s: A W riting T ool R esource for N on-N ative U sers of E nglish. In: Computer Science: Research and Applications. R Baeza-Yates and U. Manber (eds.), Plenum Press, N.Y. pp. 63·72, 1992.
• Aluisio, S.M. and Oliveira, Jr. O.N. A C ase-B ased A pproach for D eveloping W riting T ools A im ed at N on-native E nglish U sers. A ser publicado em Lecture Notes In Computer Science (Springer-Verlag), como Proceedings da International Conference on Case-Based Reasoning, 1995,
• Fontana. N.: (Caldeira), Aluisio, S.M.; De Oliveira, M.C.F. and Oliveira Jr., O.N. C om puter A ssisted W riting A plications to E nglish as a F oreign L anguage, CALL, Volume 6 (2), p.
145-161, 1993.
• (Caldeira). Aluisio.s.M.: De Oliveira, M.C.F.; Fontana, N.; Nacamatsu, C.O. and Oliveira ,Ir., O.N. W riting tools for non-native users of E nglish. Proceedings of the XVIII Latinamerican Informatics Conference, Spain, p. 224-231, 1992.
• De Oliveira, M.C.F.; (Caldeira), Aluisio, S.M.; Masiero, P.C. & Oliveira Jr., O.N. A
D iscussion on H um an-C om puter Interfaces for W riting Support T ools. In Proceedings of the XII International Conference of the Chilean Computer Science Society, Santiago, Chile, pp. 223-233, 1992.
• Oliveira. Jr. O.N.; (Caldeira), Aluisio S.M. and Fontana, N. C husaum s: A W riting T ool R esource for N on-N ative U sers of E nglish, In Proceedings of the XI International Conference of The Chilean Computer Science Society, pp. 59-70. 1991.
• (Caldeira). Aluisio. S.M.; Oliveira Jr.. O.N. Proposta de urn Ambiente para Auxiliar na
Produyao de Textos Cientificos em Ingles. In: Proceedings do Congresso Nacional de
Informatica. 24. 1991.
• Aluisio, S.M. and Oliveira Jr. O.N. D eveloping C orpus-B ased W riting T ools A im ed at N on-native U sers of E nglish. A ser publicado nos Proceedings of The Eighth Annual Conference on Writing and Computers. 1995.
• Garcia Neto, A; De Oliveira, M.C.F.: Fortes, RP.M.; (Caldeira) Aluisio, S.M. and Oliveira Jr. O.N. A Softw are A rchitecture for a C om puter-A ided W riting E nvironm ent. In: Proceedings
of the 5th HCI International, p. 204, 1993. "
• (Caldeira). Aluisio. S.M.; Nunes, M.G.V. A D iscourse Schem a-B ased C om posing T ool. In: Proceedings of the 5th HCI International. p. 199. 1993.
• (Caldeira), Aluisio, S.M.; Nunes, M.G.V. A D iscourse Schem a-B ased C om posing T ool. In: Proceedings of The 6th Conference on Computers and Writing, 1993.
2 COMPUTADORES E ESCRITA. ...•••.•...•.•...•...••...•.•••..••...•••••••.•.•... 7
2.1 MODELOS COGNITIVOS DO PROCESSO DE ESCRIT A 9
2.1.10 M odelo de B ruce, C ollins, R ubin e G entner [B ruce-78]. 10
2.1.20 M odelo de F low er e H ayes [H ayes-80} 11
2.1.3 A lgum as C onclusoes Sobre 0 P rocesso de E scrita 12
2.2 FERRAMENTAS E AMBIENfES PARA A ESCRITA 14
2.2.1 W E : U m A m biente A 1ultim odal para a E scrita 19
2.2.2 JV riter'sA ssistant: M ovim ento F aci! entre as V isoes de um 22
T exto 22
2.2.3 A m bientes que R eutilizam T extos 24
2.3 ESCRITA EM INGLES COMO LiNGUA ESTRANGEIRA 25
2.3.1 A lguns E rros C om etidos por E studantes B rasileiros na 26
E scrita em Ingles 26
2.3.2 U m R ecurso de A juda T ecnica para a E scrita em Ingles 28
2.4 0 AMBIENfE AMADEUS 30
2.4.1 A F erram enta de R eferencia 31
2.5 SUMARIO 37
ANALISE DE CORPUS: INTRODU<;OES DE ARTIGOS CIENTiFICOS ...•.•••... 40
3.1 ESTRUTURAS ESQUEMATICAS PARA INTRODU<;:OES 43
3.1.1 M odelo C A R S (C reate a R esearch Space) 43
3.1.2 M odelo de W eissberg e B ucker 44
3.1.3 C om entarios sobre os A fodelos 46
3.2 A ANALISE DE UM CORPUS DE INTRODU<;:OES 47
3.2.1 A Sele(:iio do C orpus 49
3.2.2 O bjetivos e M etodologia 50
3.3 RESULT ADOS DA ANALISE 51
3.3.10 E squem a D etalhado para Introdu(:oes 51
3.3.2 P adroes de O rganiza(:iio T extual para Introdu(:iio 53
3.3.3 E strategias R etoricas 61
3.3.4 E struturas R etoricas das Introdu(:oes do C orpus 63
3.4 SUMARIO 66
PRINCIPIOS DA ABORDAGEM BASEADA EM CAS OS APLICADA A FERRAMENTAS PARA A
ESCRIT A •....•...•.••.••....••...•....•...•..•.••••••••..•...•.•••...•...••.••.• 68 4.1 PRINCiPIO DA PRE-COMPILA<;:Ao DO CONHECIMENTO DO GENERO 71
4.1.1 R epresenta(:oes do C onteudo de um T exto 72
4.1.2 F orm alism os para R epresenta~iio da E strutura do D iscurso 80
4.1.3 Sum ario dos T rabalhos e Sistem as D iscutidos 95
4.2 PRINCiPIO DA REUTILIZA<;:Ao DE MATERIAL LINGrnSTICO NAo FACTUAL 97
4.2.1 T ipos de D icionarios 98
4.2.2 Sistem as que U tilizam D icionarios de P adroes 99
4.3 PRINCiPIO DA UTILIZA<;:Ao DE 'fExros AurtNTICOS E ADAPT A<;:OES INTERATIV AS 104 4.3.1 F undam entos do R aciocinio A nalogicolB aseado em C asos 104 4.3.2 A A rquitetura B asica de Sistem as B aseados em C asos 107
5 UMA ARQUITETURA GENERICA PARA SUPORTE
A
ESCRITA. ....•...•.•...••...•....•..•.•.•.•...1105.1A ARQUITETtJRA PARA FERRAMENT AS DE Auxiuo AORGANIZA~Ao TE;"''TUAL 111
5.2UM METODO PARA A IMPLEMENT A<;Ao DE FERRAMENT AS DE SUPORTEAESCRITA 113
5.3JUSTIFICATIVAS E LIMITA<;OES DO MODELO PROPOSTO 117
5.4 SuMARIo 119
60 MODELO COMPUTACIONAL: A FERRAMENTA PARA A ESCRITA DE INTRODUCOES120
6.1 A FERRAMENTA DE SUPORTE 121
6.2RECURSOS 124
6.2.1 B ase de C asos 124
6.2.2 U m a R ede C onceitual de E strategias e M ensagens 127
6.2.3 R egras e M edidas de Sim i laridade 136
6.2.4 R evisoes: A daptafoes para as E strategias R etoricas 145
6.2.5 Interface: .•Y V iew toolkit e N etscape brow ser 148
6.3PROCEssos E EXEMPLOS DE INTERA~OES 150
6.3.1 C oleta de Inform afoes e R ecuperafiio de C asos 151
6.3.2 Sim ulafoes das A daptafoes Interativas 155
6.4 SuJvwuo 161
7 CON CL usA 0 ...•... 163
7.1 CONTRIBUI~OES 165
7.1.1 C ontribuifoes para F erram entas de A uxilio
a
E scrita 165 7.1.2 C ontribuifoes para a E strutura E squem atica de Introdufoes 1667.1.3 C ontribuifoes para a A bordagem B aseada em C asos 166
7.2LIMITA~OES 166
7.3TRABALHOS FtTfUROS , 167
7.3.1 C riafiio de um N ilcleo B asico de C onhecim ento L inguistico 168
7.3.2 A m pliafiio do E scopo da F erram enta de Suporte 168
7. 3. 3A va/iafiio da F erram enta de Suporte 169
7.3.4 C onstrufiio e A va/iafiio da F erram enta T utorial , , 170
A - AS MENSAGENS RETORICAS, SEUS ELEMENTOS SEMANTIC OS E SUA EXPRESsAo LIN Guis TI CA ...•...•...•...•...•...• 171
Al CONTEXruALIZA~Ao 173
A2 REVISAo DALlTERAnJRA 187
A 3NECESSIDADE DE MAIS INVESTIGA~Ao/GAPs 194
A4 PROPOSITO DA PESQUISA , 199
A5 METODOLOGIA 202
A6 PRINCIPAlS RESULTADOS 204
A 7VALOR DA PEsQUISA 204
A 8 ESTRUnJRA DO ARTlGO "",.""" ,.",."", , ", , """ 205
B - AS ESTRA TEGIAS RETORICAS ..•..•...•..•...•...•...•....•...•.. 206
B. 1CONTEXTUALIZA<;Ao ", """"", ', ,.. ,' '"'''''''''''''''''' ,.. ,.. , 207
B .3 NECESSIDADE DE M AIS INVESTIG AG Ao/G AP 2 1 1
B .4 PRoPO SITO DA PESQ UISA 2 1 2
B . 5M ETO DO LO G IA 2 1 4
B .6 PR!NcIP A1S RESULTADO S 2 1 5
B .7 VALO R DA PESQ UISA 2 1 6
in d ic e d e F ig u ra s
FIGURA 2.1: Amilise Do Processo Da Escrita [Bruce-78] 10
FIGURA 2.2: Diagrarna De Blocos Do Modelo Para A Escrita [Hayes-80] II FIGURA 2.3: Tela Do Correct Grammar Mostrando 0 Resumo Da Estatistica Para Urn Dado Texto 15 FIGURA 2.4: Tela Do Correct Grammar Corrigindo A Grarnatica 15
FIGURA 2.5: Sele9iioDe Regras De Estilo No Grammatik 16
FIGURA 2.6: Corre~ao De Jargao No Grarnrnatik 17
FIGURA 2.7: Exernplo De UrnO utline Gerado Pelo Microsoft Word 6.0 18 FIGURA 2.8A: Modos Rede, Arvore E Edi~ao Do Ambiente Para A Escrita We 20
FIGURA 2.8B: Ambiente We Com Seu Modo Texto Ativado 21
FIGURA 2.9: AAA Com Seus Varios Modos 22
FIGURA 2.10: A Visao De Rede No Ambiente Writer's Assistant 23 FIGURA 2.11: MOduloDe Ajuda Linguistica Do Ambiente Amadeus E Suas Duas Ferrarnentas
Desenvolvidas (Hachurado) 31
FIGURA 2.12: A Arquitetura Da Ferrarnenta De Referencia 31
FIGURA 2.13: Cornposi~ao De Artigos 33
FIGURA 2.14: Personaliza~ao Da Ferrarnenta 34
FIGURA 2.15: Trechos Dos Textos Escritos Por Estudantes Brasileiros 35 FIGURA 3.1: Modelo Para A Estrutura De Introdu~Oes[Swales-90] 44 FIGURA 3.2: Modelo Para A Estrutura De Introdu~oes [Weissberg-90] 45 FIGURA 3.3: Cornponentes E Estrategias Do Esquema Detalhado Para Introdu~Oes 52 FIGURA 4.1: Proposi~OesNumeradas Segundo A Ordern De Aparecirnento De Seus Predicados No Te;\.1073 FIGURA 4.2: Mensagern Semantica (Exernplo Tornado De [Srnadja-91)) 75 FIGURA 4.3: Exernplo Sirnplificado Das Entradas Do Lexico Frasal 76 FIGURA 4.4: Predicados Ret6ricos Utilizados Em Textplan [Maybury-91] 78
FIGURA 4.5: Defini~ao Da Rela~ao Evidencia [Mann-87] 79
FIGURA 4.6: Regras De Estrutura~ao Do Conteudo Sernantico [Cawsey-93] 81 FIGURA 4.7: Regras Para Amllise De Narra~Oes(Exernplo Tornado De [Brown-83]) 84 FIGURA 4.8: Modelo De Toulmirn Para A Estrutura De Urn Argumento (Exernplo Tornado De
[Rankin-93]: Outras DiscussOes Aparecern Em [Maybury-91]). 85 FIGURA 4.9: Agregado Da Rela~ao Antitese Expandido Para Refletir 0 Modelo De Argumenta9iio De
Toulrnin [Rankin-93] 86
FIGURA 4.10: Estrutura Esquernatica De Urn Artigo Cientifico [Kintsch-78: Weissberg-78: Trirnble-85:
Weissberg-90: Swales-90] 88
FIGURA 4.11: EstcigiosDe Urna Gsp Tipica Para Textos Bibliograficos [Teich-94] 90 FIGURA 4.12: Esquemas De Predicados Ret6ricos Para Defini~OesDe ~etos [Mckeown-85] 91
FIGURA 4.14: Operador Persuadir-Por-Motival;ao [Maybury-91] 93 FIGURA 4.15: Parte Da Hierarquia De Metas Comunicativas [Hovy-92] 94
FIGURA 4.16: Sumario Dos Trabalhos E Sistemas Revisados 96
FIGURA 4.17: Exempl0 De Uma Mensagem Utilizada Em Ana [Kukick-83] 99 FIGURA 4.18: Exemplo De Uma Entrada Do Lexico Frasal [Kukich-83] 99 FIGURA 4.19: Entrada Para "The Dow Jones Average Of 30 Industrial Stocks" [Smadja-91] 102
FIGURA 4.20: Entrada Para "Advancers" 103
FIGURA 4.21: Arquitetura Basica De Urn Sistema Baseado Em Casos [Hammond-90] 108 FIGURA 5.1: A Arquitetura Generica Para Ferramentas De Suporte 112 FIGURA 6.1: Arquitetura Da Ferramenta De Suporte De Introdw;oes 124
FIGURA 6.2: Uma Das Introdul;oes Da Base De Casos 125
FIGURA 6.3: Estrutura Ret6rica Representada Em Prolog 126
FIGURA 6.4A: Relal;ao Is_A Entre Subclasse (Estrategia Especifica A Urn Componente) E Classe
(Estrategia Generica) 128
FIGURA 6.4B: Relal;oes Is_A Entre Mernbros (Mensagens) E Classe (Estrategia Definic;ao) 129
FIGURA 6.5: Partes De Uma Estrategia 130
FIGURA 6.6 Parte Da Rede Conceitual De Estrategias E Mensagens 132 FIGURA 6.7: Urna Requisic;aoCornpletarnente Contida Em Urn Caso (Hachurado) 138 FIGURA 6.8: Urna Requisic;aoParcialrnente Contida Em Urn Caso (Hachurado) 139 FIGURA 6.9: Tela Inicial Do Ambiente Amadeus Para Acesso
As
Duas Ferrarnentas De Escrita 149FIGURA 6.10: Tela Com As Instruc;oesDe Uso Do Netscape 150
FIGURA 6.11: Coleta De Informac;oesSobre A Estrutura De Urna Introduc;ao 151 FIGURA 6.12: Tela Do Netscape Com Os Tres Casos Recuperados 152
FIGURA 6.13: Visualizac;aoDo Prirneiro Caso Da Lista 153
FIGURA 6.14: Visualizal;ao Do Segundo Caso Da Lista 154
FIGURA 6.15: Visualizac;aoDo Terceiro Caso Da Lista 155
FIGURA 6.16: Mudanc;aDe Material Linguistico 157
FIGURA 6.17: Trocar Por Mensagem Similar 158
FIGURA 6.18: Remoc;aoDe Mensagens 159
FIGURA 6.19 Urn Dos Casos Recuperados Da Remoc;aoDe Mensagens 160
FIGURA 6.20: InserC;aoDe Mensagens 161
T ABELA 2.1: Ferramentas E Ambientes Para A Escrita
TABELA 2.2: Exemplos De Erros Cometidos Por Estudantes Brasileiros
T ABELA 3.1: Equivalencia Entre as Modelos De [Swales-90] E [Weissberg-90]
TABELA 3.2: Estruturas Ret6ricas Dos Artigos Da Revista Thin Solid Films
T ABELA 3.3: Estruturas Ret6ricas Dos Artigos Da Physical Review Letters
T ABELA 6.1: Representa9ao Prolog Para As Rela90es E Caraeteristicas De Conceitos
T ABELA 6.2 Subtipos Das Mensagens De "Declarar Proeminencia Do T6pico/ Area"
T ABELA 6.3 As Quatro Popula90es De Casos Similares Recuperados
T ABELA A1: Expressao Linguistica Do Componente G a p
2-l 27
-l8
M
65
130
13-l
l-l3
Capitulo
1
roblemas com a escrita podem afetar 0 desempenho de profissionais de
maneira marcante, principalmente no caso de cientistas e academicos que
precisam escrever com proficiencia e desembaraco nao apenas na lingua
materna, mas tambem em uma ou malS linguas estrangeirHs,
principalmente 0 ingles. Varias ferramentas de software [Cherry-82; Smith-86;
Sharples-89; Writing tools-91; Reference Software-92] tern sido criadas para auxiliar
no processo de escrita, muitas das quais ja estao disponiveis comercialmente. Como
ilustrado na revisao da literatura sobre ferramentas de auxilio
a
escrita (Capitulo 2),a grande maioria delas e dedicada ao pos-processamento do texto atraves de analises
estatisticas, visando corrigi-Io tanto do ponto de vista da correcao gramatical, como cia
clareza, estilo, e concisao das ideias apresentadas. Apesar de serem extremamente
uteis para usuarios com dificuldades linguisticas, estas ferramentas sao limitadas
quanto
a
escrita numa lingua estrangeira, pois proporcionam somente mecanismos decorrecao e acabamento do texto, sendo que muitas vezes 0 usuario nao e capaz de
gerar urn texto passivel de ser apenas m elhorado.
Estudos mostraram que algumas das deficiencias de alunos brasileiros
realizando cursos de pos-graduacao no exterior estao relacionadas ao mau usa ou
omissao de express5es mais ou menos convencionais que desempenham func5es
especificas do texto academico [Fontana-91; Fontana-93]. Vma solucao pratica para
este problema consiste na utilizacao de express5es aprendidas com a pratica adquirida
na leitura de artigos - acreditamos ser esta estrategia largamente difundida entre
estrangeiros que precisam escrever em ingles. Ou seja, numa situacao de duvida, 0
escritor recorre a textos escritos por pessoas de reconhecida competencia. Para
otimizar 0 usa desta estrategia, foi feita uma compilacao de express5es e orac5es
extraidas de artigos e livros cientificos [Oliveira-91]. Vma verificacao surpreendente
foi que urn numero relativamente pequeno de express5es e orac5es pode ser suficientE~
para cobrir uma grande proporcao das expressOes e orac5es usadas numa certa area
do conhecimento. Isto ocorre porque as express5es e orac5es sao empregadas de
maneira sistematica, quando se descrevem tabelas, figuras, procedimentos
experimentais, ou quando se comparam resultados. Anteviu-se, a partir desta
constatacao, a possibilidade de se criar ferramentas de software que utilizem esta
Concebeu-se, portanto, urn ambiente de auxilio a escrita chamado AMADEUS
(AMiable Article Development for User Support), cujo modulo linguistico contaria
com tres tipos de ferramenta de auxilio: Ferramenta de Referencia, Ferramenta de
Suporte e Ferramenta Tutorial. Eventualmente, outras ferramentas, inclusive
comerciais - como os corretores ortograficos e gramaticais - poderao ser incluidas no
ambiente. A figura abaixo apresenta 0 Modulo de Ajuda Linguistica do ambiente
AMADEUS, no qual as duas ferramentas implementadas estao inseridas. A
Ferramenta de Ensinorrutorial sera futuramente desenvolvida.
Fe rra m e n ta d e R e fe re n c ia
F e rra m e n ta d e S u p o rte
F e rra m e n ta d e E n s in o fT u to ria l
A Ferramenta de Referencia, relatada no Capitulo 2, foi projetada e
implementada apos uma revisao das ferramentas de auxilio a escrita discutidas na
literatura. Esta ferramenta fornece ao usuario uma grande variedade de express6es
para que ele possa (a) ter urn "input" linguistico adequado as suas necessidades, (b)
adaptar as express6es que julgar apropriadas ao seu texto e (c) reproduzir formulas ou
express6es fixas quando estiver escrevendo sobre determinados aspectos do seu
trabalho. A ferramenta foi testada em urn curso de escrita tecnica para alunos de
pos-graduacao do Instituto de Fisica de Sao Carlos, e os resultados principais tambem san apresentados no Capitulo 2.
Embora a Ferramenta de Referencia seja util pois ajuda a superar 0
problema do bloqueio inicial com relacao a escrita, e, para alguns usuarios ajude a produzir bons textos, para outros parece faltar algum tipo de ajuda para solucionar
problemas textuais de ordenacao dos componentes do artigo e de escolha do melhor
padrao de oracao que e adequado para 0 texto sendo construido. Nesta tese,
argumentamos sobre a necessidade de uma analise de corpus de artigos cientificos
lexico a ser utilizado em ferramentas de auxilio
a
escrita.E
importante diferenciar a analise de corpus que foi utilizada neste trabalho da tradic;ao probabilistica da area deprocessamento de linguagem natural denominada, atualmente, de corpu.s-based
natural language processingl • A analise de corpus esteve restrita
a
sec;ao introdutoriade artigos experimentais por ter sido bastante detalhada - os textos das introduc;5es
foram analisados em nivel de orac;5es. 0 dominio de aplicac;ao (ou area de pesquisa)
escolhido foi 0 da Fisica. Esta analise, que e descrita no Capitulo 3, resultou em urn
modelo detalhado para definir a estrutura esquematica de introduc;5es de artigos de
pesquisa experimental.
A intenc;ao de se realizar uma analise bastante detalhada foi a de se verificar
o grau de riqueza das express5es linguisticas que as mensa gens de cada componente
da estrutura apresentam. E tambem de levantar as varias estrategias que formam a
estrutura dos paragrafos de urn artigo cientifico. 0 resultado desta analise forneceu
subsidios para a escolha dos recursos com putacionais necessarios para a construc;ao da
Ferramenta de Suporte. A caracteristica principal que se exigiu desta ferramenta foi
que ela ajudasse urn nao nativo escrever, com certa fluencia2, artigos deste genero,
superando, assim, alguns dos problemas da Ferramenta de ReferEmcia.
Uma justificativa de ordem pratica para a busca de variac;5es e que uma
ferramenta de suporte
a
escrita nao pode limitar seus usuarios a produzir urn padraofixo para as estrategias e para as orac;5es, dado que as varias introduc;5es publicadas
permitem flexibilidade enquanto se mantem representativas do genera.
1 0 processamento probabili.'ltico da linguagem natural tenta construir sistemas sem qualquer conhecimento linguistico baseando-se na correla<;ao entre as ora<;oes fomecidas ao sistema e as probabilidades de suas ocorrencias computadas tomando-se como base imensos corpora de textos. Algumas descri<;oes de sistemas baseados em modelos estocasticos do ingles sao encontradas em rSmadja-91].
2Neste trabalho. vamos utilizar fluencia como 0 resultado da aphca<;ao efetiva de varias
No contexto descrito acima, urn dos propositos desta tese foi implementar
uma abordagem para a constru<;ao de ferramentas para a escrita baseada em casos e
revisoes, ou seja, adaptac;oes interativas. Casos codificam 0 conhecimento estatico da
estrutura e conteudo de artigos cientificos. Revisoes implementam 0 conhecimento
dimlmico, aquele que gera modificac;oes que pretendem tomar urn caso selecionado
pela ferramenta 0 mais proximo possivel da descric;ao das caracteristicas desejadas
para 0 artigo do usuario.
A abordagem utilizada esta baseada na teoria de Raciocinio Baseado em
Casos (RBC) [Hammond-90; Kolodner-92], mas difere dela pois 0 novo caso gerado
atraves da interac;ao nao e incorporado ao sistema. Esta simplificac;ao tern sew"
beneficios nesta nossa tarefa (suporte
a
escrita) tornando a implementac;ao maissimples, uma vez que uma grande dificuldade do RBC esta no aprendizado (isto
e,
incorporar como novo conhecimento os novos casos aprendidos). Alem isso, a
abordagem proposta se justifica pois as ferramentas projetadas atraves dela nao sao
destinadas para gerar automaticamente urn artigo que seja coerente, coeso e
adequado ao proposito e publico alvo. A ferramenta so deve fornecer suporte a escrita
de urn texto inicial que, muito provavelmente, deve ser novamente revisado. A decisao
final sobre a qualidade do texto esta nas maos do usuario. Neste ponto, uma
ferramenta de suporte difere da abordagem de criticas para ferramentas, ou seja, dos
sistemas baseados em critic as [Fischer-91; Silverman-92; Rankin-93]. Critic as sao
sistemas que trabalham em cooperac;ao com humanos para resolver algum problema,
sendo que 0 papel destes sistemas e apresentar uma opiniao/critica, nao
necessariamente negativa, sobre 0 produto ou ac;ao gerada pelo humano que esta
interagindo. Estas diferenc;as entre as duas abordagens de interac;ao usuario-sistema
sao comentadas no Capitulo 5.
A metodologia utilizada pode ser dividida em 3 fases. A primeira fase
compreende a analise de corpus de introduc;oes para levantar 0 conhecimento lexico,
sintatico e retorico necessario para representar 0 conhecimento estatico do sistema
(casos) e verificar as revisoes possiveis e restric;oes de aplicac;oes para elas (Capitulo
3). A analise de corpus foi realizada em cinquenta e quatro artigos de Fisica
experimental sendo que 0 unico criterio empregado na selecao das introduc;oes foi 0
fato dos autores serem nativos do Ingles. Nao se pode garantir que todos os textos
tenham uma boa qualidade, mesmo tendo sido escritos por nativos e sido publicados
seria incluida a variavel de urn julgamento subjetivo, e a amostra poderia estar
viciada, ja que seria dada prioridade aos estilos prediletos do(s) inspetor(es). De
qualquer forma, sendo tornado urn grande numero de introdu<;6es para fazer parte da base de casos, possiveis flutua<;6es na qualidade dos textos sao minimizadas.
A segunda fase, implementa<;ao da ferramenta (Capitulo 6), materializa 0
modelo para a constru<;ao de ferramentas para a escrita proposto pela abordagem
(Capitulo 5). Uma vasta revisao da literatura foi realizada para justificar as escolhas
para a representa<;ao do conhecimento a ser utilizada nos varios m6dulos de recursos
do modelo. Esta revisao
e
apresentada no Capitulo 4. A interface da ferramenta e urnponto critico para 0 sucesso do modelo, pois ela torna disponivel para 0 usuario todo 0
conhecimento do sistema nesta tarefa intensiva que e a da escrita. Desta forma, a
interface e considerada tambem como urn dos recursos no modelo proposto.
Finalmente, 0 modelo subjacente e a ferramenta devem ser criticados. As
limita<;6es do modelo relacionadas a tarefas de auxilio
a
escrita nao suportadas saocomentadas no Capitulo 5. Esta tese, entretanto, nao cobre a avalia<;ao da
Ferramenta de Suporte com usuarios reais, pois a fase de adapta<;6es da ferramenta
esta somente projetada e testes deste tipo requerem instrumentaliza<;ao da
ferramenta para guardar as a<;6esrealizadas e /o u tecnicas de psicologia experimental
para manter 0 registro da intera<;ao para posterior analise. Alem disso, 0 produto da
escrita (textos) deve tambem ser avaliado. Esta ultima fase exige trabalho intenso e
Capitulo 2
urante a ultima decada, foram desenvolvidas varias ferramentas de software para a escrita. Muito mais sofisticadas que os primeiros editores
e formatadores de textos que datam dos primeiros ambientes
computacionais, essas ferramentas podem ser classificadas de acordo com
diferentes criterios. Por exemplo, com relac;ao ao grupo de usuarios a que sao
destinadas (escritores academicos, editores, secretarias, estudantes); com relac;ao ao
uso (para melhorar varios aspectos de urn texto, para escrever urn texto que segue
uma especificac;ao, para aprender como se escreve urn tipo de texto); com relac;ao
a
tarefa a que sao destinadas (auxilio
a
escrita ou ensino da escrita); ao tipo de textos aque servem (comerciais, academicos, instrucionais) ou a qual estagio do processo da
escrita sao adequadas. Esta ultima faceta e geralmente adotada como base para a
classificac;ao, uma vez que a escrita
e
uma tarefa sobre a qual atuamsimultaneamente varios tipos de restric;oes, que diferem de acordo com tres grandes
fases: de gerac;ao e organizac;ao de ideias, de transformac;ao das ideias em trechos de
texto continuos e de acabamento, ou seja, de polimento levando a urn texto
melhorado. A classificac;ao segundo 0 estagio do processo de escrita resulta em tres
classes de ferramentas:
• Ferramentas de Pre-processamento do texto, que fornecem ajuda para a fase
de gerac;ao de ideias e compreendem os editores graficos de redes de notas, os
editores graficos de estrutura em forma de arvore e os outliners textuais que
permitem expandir ou esconder os diferentes niveis de organizac;ao de urn texto;
• Ambientes para a Escrita, que compreendem urn conjunto de ferramentas
destinadas a dar suporte a uma grande parte do processo de escrita (geralmente,
da fase de gerac;ao e agrupamento de ideias ate a composic;ao de urn texto
continuo), ou a todo 0 processo. Combinam, geralmente, urn editor grafico para as
notas/ideias, urn editor de estruturas e urn editor de textos em urn unico ambiente;
e
• Ferramentas para Pos-processamento do texto, que sao destinadas a
melhorar a qualidade do texto e compreendem ferramentas para checagem de
estilo, corretores ortograficos e gramaticais, ferramentas estatisticas e corretores
Os ambientes estao, geralmente, baseados em urn modelo cognitivo do
processo de escrita, sendo 0 modelo de Flower e Hayes [Hayes-80] 0 mais utilizado.
Varios outros pesquisadores, por exemplo [Kintsch-78; Matsuhashi-81; Meyer-75;
Collins-80 e Bruce-78], estudaram os processos cognitivos dp. escritores P.
influenciaram fortemente 0 projeto de ferramentas para a escrita, e tambem
colaboraram para urn maior entendimento dos processos mentais envolvidos na
escrita.
N a pr6xima sec;ao apresentamos dois estudos e seus modelos do processo de
escrita: os estudos de Bruce et alli. [Bruce-78] em busca de uma teoria mais
abrangente da escrita1; e 0 modelo formal de Flower e Hayes [Hayes-80]. Na Sec;ao 2.2
comentamos alguns ambientes e ferramentas para a escrita descritos na literatura.
Apresentamos a seguir (Sec;ao 2.3) alguns problemas de nao nativos escrevendo em
ingles que motivaram 0 projeto da Ferramenta de Referencia (R eference T ool), que {~
apresentada na sequencia (Sec;ao 2.4). Esta ferramenta serviu para confirmar a
utilidade da estrategia de escrita baseada em textos reutilizaveis para auxiliar a
escrita em uma lingua estrangeira. A analise dos problemas de escrita que ela nao
consegue minimizar nos levou a projetar a Ferramenta de Suporte (Support T ool). 0
projeto desta ultima ferramenta exigiu urn estudo mais aprofundado da ret6rica de
artigos cientificos. Este estudo e apresentado no Capitulo 3, sendo os Capitulo 4, 5 e (;
responsaveis por apresentar os principios da abordagem adotada para 0 projeto de
ferramentas de suporte, 0 seu modelo generico, e os detalhes da implementac;ao dE~
uma ferramenta prot6tipo, respectivamente.
2 .1 M o d e lo s C o g n itiv o s
d o P ro c e s s o d e E s c rita
Os estudos sabre os modelos cognitivos do processo de escrita fornecem
explicac;oes para os problemas do bloqueio inicial do escritor diante de uma folha em branco ou de uma tela vazia; mostram as razoes para a diferenc;a de desempenho na escrita entre escritores experientes e iniciantes; e fornecem uma descric;ao sistematica
dos processos cognitivos e das estrategias utilizadas por escritores para gerenciar
2 .1 .1 0 M o d e lo d e B ru c e , C o llin s , R u b in e G e n tn e r [B ru c e -7 8 ]
o
trabalho de Bruce et alii. [Bruce-78], explora 0 processo de escrita a partirde varias perspectivas. A primeira perspectiva concebe a escrita como urn ato
comunicativo no qual 0 leitor/audi€mcia tern urn papel importante; a segunda coloca a
escrita no contexto de uma taxonomia de atos comunicativos e analisa as diferencas entre ler e conversar, ou dar aulas, etc.; escrever uma estoria ou urn artigo. A terceira
e de especial interesse para 0 projeto de ambientes para a escrita, pois descreve a
escrita como urn processo que pode ser decomposto em dois grandes subprocessos:
geracao e manipulacao de ideias, e producao de texto para os diferentes niveIs
estruturais (texto, paragrafo, oracao e palavra).
Embora os processos que criam ideias e estruturas possam ocorrer
simultaneamente e interativamnte, os autores os colocam como passos separados de
urn procedimento para facilitar 0 entendimento destes processos. Assim, tal
procedimento deve criar urn texto que satisfaz restricoes vindas de tres fontes: da
estru tu ra (quais sao as boas form as para oracoes, para os paragrafos e para 0 texto
como urn to do), do co n teu d o (quais ideias devem ser utilizadas e como elas estao
relacionadas) e p ro p o sito (quais sao os objetivos a que se destina a escrita equal 0
modelo de usuario). A analise do processo pelo qual urn trecho de texto e construido
e
mostrada esquematicamente na Figura 2.1.
l
Restricoes de Conteudo
J
l
Restriyoes deProposito Descobrir IdeiasproduZir-{
Ideias . "
Mampular Idelas
Produzir
Estrutura Panigrafos
Orayoes
Palavras
Os autores consideram a producao de ideias e producao de texto como
sequencia linear de palavras, 0 resultado da prodw;ao de ideias e urn conjunto de
ideias com viuias rela<;oes entre si. Alem disso, agrupar os dois pode trazer as
restri<;oes impostas
a
manipula<;ao de texto para urn estagio em que as ideias aindanao estao prontas. Nesse caso, dois resultados podern acontecer: 0 escritor gastar
tempo polindo urn texto que poden} eventualmente ser descartado e, talvez pior, pode
ser que 0 esfor<;o em polir 0 texto fa<;a com que 0 escritor se esque<;a do conteudo e
proposito.
2 .1 .2 0 M o d e lo d e F lo w e r e H a y e s [H a y e s -8 0 l
Flower e Hayes [Hayes-80] tambern analisaram 0 processo de escrita a partir
de varias perspectivas. Descrevern que 0 processo de escrita e (a) dirigido por
objetivos - autores iniciarn com urn proposito geral que se refina em subrnetas; (b)
destinado a satisfazer varias restri<;oes: 0 texto final deve integrar 0 conhecimento
sobre 0 assunto, estar gramaticalrnente correto e ser destinado a urn dado proposito; e
(c) urn processo que continuamente transforma a informa<;ao de uma representa<;ao
if
outra, partindo geralmente de trechos de informa<;oes, cita<;oes e notas, ate alcan<;ar
urn texto continuo e revisado.
0
diagrama de blocos do modelo e mostrado na Figura2.2.
AMBIENTE DA TAREFA
Tarefa cia Escrita Texto
Topico
Audiencia Produzido
Proposito
P anejamento Tradu~o Revisao
Memoria do Escritor
~Organiza~O
I
Conhecimento do Topico
~
HGera9ao
I
--IConhecimento da Audiencia
~Criar Metas
I
EditarEsquemas de Textos
I
I
I
MONITORo
diagrama mostra tres gran des componentes: 0 ambiente da tarefa, quecompreende fatores externos ao escritor; a memoria do escritor; e 0 monitor, 0proprio
escritor dirigindo seus processos cognitivos. 0 monitor dirige tres tipos de processos:
planejamento, tradu<;ao e revisao. 0 p la n eja m en to consiste das suboperac6es para
recuperar informac6es para a tarefa da escrita (geracao); para organizar as
informac6es mais apropriadas (organizacao); e criacao de metas para guiar a escrita
(criar metas). A tradu~ao toma informac6es da memoria e as transform a em orac6es
coerentes. Por ultimo, 0 processo de rev isa o melhora a qualidade do texto escrito
atraves de leitura e edicao. As tres operac6es, entretanto, nao ocorrem ciclicamente na
ordem planejar - traduzir - revisar, e sim respeitando uma hierarquia em que as
operac6es de edicao e geracao, tendo mais alta prioridade, podem interromper outros
processos. Dessa forma, 0 processo de traducao pode ser interrompido para a operacao
de revisao ou geracao de novas ideias.
2 .1 .3 A lg u m a s C o n c lu s o e s S o b re 0 P ro c e s s o d e E s c rita
As conclus6es dos dois estudos sobre 0processo de escrita sao, geralmente, as
mesmas:
• que tentar satisfazer todas as restric;6es impostas
a
escrita ao mesmo tempo podegerar urn bloqueio mental;
• que os escritores experientes conseguem urn desempenho maior na escrita, pois
dominam as estrategias especificas de cada fase e ignoram as restric6es de outras
fases quando se concentram em uma particular;
• que a escrita pode ser melhor descrita como urn processo ciclico que alterna a
geracao e organizacao de ideias (planejam ento), transformac;ao de notas/ideias em
texto continuo (tradur;do) e leitura e edicao de rascunhos (revisdo) que novarnente
alimenta 0 ciclo, pois novas ideias aparecem, pIanos sao reescritos e 0 rascunho
revisado, com as operac6es de edicao e geracao tendo rnais alta prioridade; e
• que escritores experientes desenvolvern uma estrutura de metas rnais elaborada
que os iniciantes. Por exemplo, se a meta inicial e publicar urn artigo em urna
revista, 0escritor pode gerar uma subrneta para a revisao da literatura enfatizando
a necessidade de urn estudo particular e uma sub submeta que aponta as falhas de
Existem, entretanto, algumas criticas com rela<;ao aos modelos,
principalmente ao mais conhecido deles, 0 modelo de Flower e Hayes [Hayes·80]. Elas
sao apresentadas abaixo.
Smith e Lansman [Smith·88] consideram 0 metodo de grava<;ao da
verbaliza<;ao dos processos mentais ( th in k - a lo u d p r o to c o f) , utilizado para a
explicita<;ao das atividades mentais de escritores, sujeito a certas deficiencias. 0
problema e que nem sempre escritores tern consciencia dos processos e estrategias de
escrita que eles utilizaram e, tambem, pedir que urn escritor fa Ie de seus pensamentos
na tarefa de escrita pode mudar 0 proprio processo. Entretanto, [Smith·88] admite
que a analise desses protocolos ajudou a entender como escritores trabalham. A critica
mais severa, todavia, foi com rela<;ao
it
verifica<;ao do modelo formal. Flower e Hayestestaram 0 modelo com apenas urn unico sujeito. Para estudar as estrategias
cognitivas de escritores, e tambem para refinar 0 ambiente WE tomando-se como base
resultados empiricos, 0 T extL ab na Universidade da Carolina do Norte, encabe<;ado
por J. Smith, desenvolveu ferramentas para analise de protocolo automatizadas
[Smith-91; Walker-91]. Estas ferramentas automatizadas procuram superar as
deficiencias dos metodos tradicionais para analise do processo de escrita, dentre os
quais 0 utilizado por Flower e Hayes.
Sharples e Pemberton [Sharples-88] comentam a falta de especifica<;ao com
rela<;ao
it
natureza das representa<;5es do texto em cada estagio de sua constru<;ao elembram que 0 modelo de Flower e Hayes nao leva em considera<;ao as caracteristicas
dos tipos diferentes de meios de escrita (papel, computador, notas, etc.) e como estes
meios afetam a pratica da escrita. Para superar essas duas falhas, apresentam urn
modelo estendido que considera as tecnicas para gerar as varias representa<;5es do
texto durante 0 processo de escrita e indicam as rela<;5es entre as tecnicas e 0 meio
utilizado para a escrita.
Os modelos dos processos de escrita tambem nao incluem a situa<;ao de urn
escritor escrevendo em uma lingua nao nativa. Entretanto, eles ajudam a
compreender 0 processo geral de escrita e a pressupor quais as necessidades extras
desse tipo de escritor. Embora 0 ingles seja uma lingua internacional para a
comunica<;ao de trabalhos cientificos, ela nao e a lingua nativa nem a segunda lingua
essa situa<;ao especifica, isto e, a da escrita de artigos cientificos em ingles como uma
lingua estrangeira:
• existe a situa<;ao na qual urn escritor, embora sendo proficiente ou
quase-proficiente no mgles, sofre influencias de sua lingua materna; e
• a estrutura linguistica do ingles de artigos cientificos e bastante convencional e
nao compartilhar destas conven<;oes pode dificultar a publica<;ao de trabalhos de
pesqmsa.
2 .2 F e rra m e n ta s e A m b ie n te s p a ra a E s c rita
As ferramentas para p6s-processamento de texto sao as mais investigadas e
disseminadas. Comumente sao destinadas
a
lingua inglesa, sendo que varias delasestao disponiveis comercialmente em processadores de texto como e 0 caso do
Grammatik [Reference Software-92] e Correct Grammar [Writing Tools-91]. Ja para a
plataforma Unix, temos 0 Writer's Workbench [Cherry-82; MacDonald-82], urn
conjunto de ferramentas que segue a filosofia "picll-and-choose" desse sistema
operacional. Existe tambem a versao do Grammatik para 0 frances, e esta sendo
implementado para 0 portugues 0 corretor gramatical de urn pacote de ferramentas
que inclui estatisticas sobre 0 texto (incluindo grau de legibilidade), regras para
corre<;ao de estilo e de erros mecanicos. Este pacote de ferramentas faz parte de urn
projeto conjunto entre empresa (ltautec/Philco) e universidade (USP-Campus Sao
Carlos) e foi incorporado ao processador de texto Redator Windows.
Outros exemplos de ferramentas de p6s-processamento encontram-se listados
na Tabela 1.1 que aparece no fim desta se<;ao. Estas ferramentas ofere cern
informa<;oes estatisticas como0 numero e tarnanho medio de paragrafos, senten<;as e
palavras do texto, e estatisticas que avaliam 0 grau de legibilidade do texto (Figura
2.3). Ofere cern, tambem, regras para corrigir a ortografia; a gramatica (Figura 2.4);
para adequar 0 estilo do texto a urn certo padrao geral (texto comercial, cientifico,
jornalistico), ou a urn padrao especiflco de uma companhia ou editora como faz 0
Readability Summary 15 paragraphs .••8 sentences 121 words 1118 syllables average averaqe average average
3.2 sentences each 15.0 words each
5.2 letters each 1.55 syllables per word
0 passive sentences
o
"of total0 long sentences
o
"of total0 misspelled words 100 " correct
0 other errors corrected 100 " correct
0 sentences hard to read 100 " correct
Flesch Readinq Ease score Grade level required
" U.S. adults who understand Flesch-Kincaid grade level Gunning Fog index
60.4 Easy 9.0
89 8.6 9.9
Figura 2.3: Tela do Correct Grammar mostrando 0 resumo da estatistica para urn
dado texto
Correct Grammar - C:\CORRGRAM\TOUR.CGD .•. •
Readability ~tyle .Qptions Help
Subject Verb Agreement
Consider 'That' instead of 'Those' and consider 'shipment' instead of 'shipments'. or consider 'drip' instead of 'drips' and consider 'meh' instead of 'melts'.
Tutorial
1st person singular I am I like
2nd person singular you are you like
3rd person singularhe/she/it is he/she/it likes
1 st person plural we are 2nd person plural you are
we like you like
situation in our hands.
I I • I all the time. The two shipments you sent us
some time ago has not yet arrived. we have waited for there delivery since January. 1991. At this point in time. we are getting impatient about the service we receive from your company.
A<; regras de estilo sao utilizadas para verificar 0 usa de voz passiva, jargao,
ora<;oes longas, expressoes redundantes, variedade das expressoes iniciais das ora<;oes
e outras. Geralmente a interface dessas ferramentas permite ao uSUllrio selecionar
quais regras devem ou nao ser aplicadas
a
revisao do texto.E
essa combina<;ao deregras que recebe 0 nome de estilo. 0 Grammatik possui dez estilos pre-definidos, 0
Correct Grammar nove, sendo que 0 usuario pode criar novos estilos atraves de novas
combina<;oes de regras. As Figuras 2.5 e 2.6 mostram, respectivamente, a interface do
Grammatik para a sele<;ao das regras de estilo e 0 funcionamento de uma checagem.
Tanto 0 Correct Grammar como0 Grammatik apresentam help on line que permite ao
usuario esclarecer duvidas, principalmente para erros em que 0 program a nao
apresenta sugestoes para a corre<;ao.
••••• Grammatilc 5
file Edit Checking Preferences Statistics Help
Writing Style Settings
Rule Classes: @
l$.if.I~j
[8J
Abbreviation[8J
Archaic[8J
Cliche[8J
Coloquial[8J
Commonly Confusedo
Custom Rule Class 1o
Custom Rule Class 2o
Custom Rule Class 3[8J
End of Sentence Prepoution[8J
Foreign[8J
Formalisms[8J
Gender Specific[8J
JargonWriting style: Report
o
Grammar0
Mechanical[8J
long Sentence[gJ
0 Y8fstated[gI Paragraph Problem
[gJ
Passive Voice[gJ
Peioratiye[gIQuestionable Usage
[gIRedundant
[gJ
Second-PersOl'l Address[gJ
Sentence Variety[gJ
Split InfinitiYe[gJ
Trademark[gJ
Vague Adverb[gIWordy
I
CancellI
H~1
~ Consecutive nouns ~ Pasuye sentences (of last 10)
~ Consecutive prepositional phrases ~ Spell numbers below or equal to
~ long sentence length
@]
Words allowed in split infinitiveEmbora as ferramentas de pos-processamento possam ser utilizadas para
ajudar escritores nativos e nao nativos de uma lingua, e sao uteisl.em varios aspectos, elas nao resolvem uma dificuldade comum a muitos escritores nao nativos: a produ<;ao
do primeiro rascunho. Na Se<;ao 2.3 veremos nossa primeira abordagem para esse
••••• Grammatik 5 - C:\GMKW\TOUR.DOC
Eile .Edit Stop ~hecking E!references Help
Clinton, Kentucky 02145.
•
Dear Ms. Gregg:.
•
Thank you for giving Joan and Be the opportunity to submit the attached proposal. It is always a pleasure doing business with Ted .•
•
Quallty and excellence are reflected in every office facility that we design. Already this year we have won three awards. We pride ourselves on our ability to deliver well-engineered designs within budget
constraints. We have yet to Biss a deadline in our Bany years of operation, our ten-year anniversary was celebrated last year. We are
faBiliar with your staff's needs we worked with you two years ago on the cafeteria project.
Check: due lo lhe lectthal
Advice: This long phrase can usuaD, be replaced with 'because'.
I I __
a-
I
[.lUMMi-I
I
Ignore. f t r t . I ~ .1
'---Replace J
RmeplecelNe&l )
I
fk~(~~;'!!!e=
I
Das ferramentas de pre-processamento, os outliners textuais tambem esUio
disponiveis em varios processadores de texto e, embora simples, sao poderosas
ferramentas que ajudam urn escritor a encontrar rela<;6es hierarquicas coerentes
entre os topicos discutidos em urn texto. A Figura 2.7 mostra a estrutura, em tres
niveis de refinamento, gerada para este capitulo pelo outline do Microsoft Word 6.0.
Capitulo 2 - Computadores e Escrita
2.1MODELOS COGNITIVOS DO PROCESSO DE ESCRIT A
2.1.1 0 M odelo de B ruce, C ollins, R ubin e G entner [B ruce-78]
2.1.20 M odelo de F low er e H ayes [H ayes-80]
2.1.3A lgum as C onclusoes Sobre 0P rocesso de E scri ta
2.2FERRAMENT AS E AMBIENTES PARA A ESCRIT A
2.2.1 W E : U m A m biente M ultim odal para a E scrita
2.2.2 W riter's A ssistant: A fovim ento F acil entre as V isoes de um
T exto
2.2.3A m bientes que R eutilizam T extos
2.3 ESCRIT A EM INGLES COMO LiNGUA ESTRANGEIRA
2.3.1 A lguns E rros C om etidos por E studantes B rasileiros na
E scrita em Ingles
2.3.2 U m R ecurso de A juda T ecnica para a E scrita em Ingles
2.4 0 AMBIENfE AMADEUS
2.4.1 A F erram enta de R eferencia
2.5 SUMARIO
Os ambientes, entretanto, san mais completos, pois fornecem urn conjunto de
ferramentas integradas que gerenciam 0processo de escrita de urn documento desde a
fase de gerac;ao e organizac;ao de ideias ate a transformac;ao destas ideias em urn texto continuo. Sao graficamente orientados, ja que as ideias sendo geradas san de natureza
diversa de urn texto continuo, sendo melhor representadas como uma rede de notas.
Posteriormente, essa rede pode ser linearizada tomando-se como base tanto as
relac;6es entre os nos como a qual parte da estrutura do texto estao associadas (cf.
[Sharples-94] para uma comparac;ao de algoritmos de linearizac;ao de uma rede de nos
padrao hipertexto). as ambientes mais discutidos na literatura san 0 WE [Smith-8G;
Smith-88], 0 Writer's Assistant [Sharples-89; Sharples-90; Sharples·94] e SEPIA
[Streitz-90]. as dois primeiros san apresentados abaixo. Na Sec;ao 2.2.3, comentamos
ambientes que reutilizam textos, uma das caracteristicas tambem utilizadas na
A s decisoes de projeto de WE enfatizaram a construcao de urn ambiente que
simulasse os processos cognitivos utilizados por escritores. WE tern como base 0
modelo para a escrita de Flower e Hayes [Hayes-80]. A primeira decisao de projeto foi
fazer urn sistema dividido em quatro modos de operacoes, sendo que cada modo
somente permite as funcoes apropriadas ao modo cognitivo associado. Isto diminui a
sobrecarga cognitiva que teria urn usuario tentando satisfazer todas as restricoes da
escrita ao mesmo tempo.
Os quatro modos sao representados por quatro janelas diferentes e sao
rotulados como: rede, arvore, editor e texto, correspondendo ao modo exploratorio de ideias, organizacional, de escrita e edicao do modelo de Flower e Hayes. A Figura 2.8a
mostra uma parte de uma rede de ideias, a sua organizacao hierarquica no modo
arvore e urn no da arvore sendo editado. Nessa figura, 0 usuario ainda nao ativou 0
modo texto e dessa forma ele se encontra vazio. as usuarios podem se movimentar na arvore, operacao esta que carrega os rotulos e blocos de texto associados com os varios nos para dentro de tres areas da janela do modo texto. Rolando a tela de dois nos
adjacentes, uma para 0 fim e outra para 0 comeco, permite ao usuario verificar a
W riting (n.""'.,.e •• ptYW 8
Iw••.•.
ap.c~""'.nt ANa.
I:Y'UM
.
2 M.re" 'ge~
N[TWOIIK MODE: N.t a IVlew Conuol 1Ol.p1.Y/Print TEXT MODE IVI.w COntrol IDlsplay,Pm,
,.;~~
I
I:Guid.N •••• 'or
I
I
Ott.nlutlon
I
I
Writ ••••I
ftr.ctl ••
•..•...
__
..._..
~
TilE! MOD!: Tre.a
IVlew Control 100,pl.y/Prtnt
~ I'" ow io
=
~~1
I""!--·1
••• JllaMiftg I
Co••••t •••
.••••,.arcn ~ t •••• I EDIT MODE Eelltor IVle. Conerol Iolsp,.y/Pnnt
'""
rfx •••••.··101 E"'tor MocMI, ShOwn in the ~wer "tht qua.ant ot Plgun i.pro ••• ., a Itanda" u .•t ••••tor tor •• "ancdng tl'1&concept ,..,,..,.nuCl
1fSl·•••·1onI by • ftOde ••.•to pnI,e. Thu,_ It ,uppons eM c09ftid.e P"VC." ot
IIngui.tic .neodlnt). Tne wn ••.•• Cllat. ,roClUet, ot cou"., Is • ~Ioc" ot
Fognlti¥·ltf'VanI ••• u.e that I, a,toe"te. wit" a pa"icula, ••••. Th. unde"yin, lylte.
niles a,.. tMS. tor a •••• ., '..-ne. ot cftaract." _WId •• intO wOrds,
~ri"'" ~
..
""-', pa,a9,a""" etc. In fUt•.•.••• ten,kIn, 0' W E, the ,yne ••• '""'..",on ••••ton tor oeMr tinct, of .ata, ,ue" a ••. aphle', ,ound. and
lilt •••• .IClIIO.
!=OVnltlv. I-•• 10 ••••t_ ••• r/Sy •••• tII•••
..,Ilcatlo ~ .xt
~
I tII... I
A divisao em modo rede e arvore permite que, em urn prlmeiro momento, se
consiga flexibilidade e liberdade na geracao de i(U~ias. No modo arvore, algumas
restric6es nas relac6es entre ideias sac colocadas para se garantir coerencia. Embora
separados, os dois modos estao relacionados e
e
permitido mover nos e estruturas darede para 0 modo arvore. No modo editor, os nos sao editados gerando pequenas notas
de textos para as ideias. No modo texto, 0 usuario atravessa a arvore e 0 conteudo dos
nos vai sendo mostrado na janela de edicao. A ideia
e
fornecer ajuda para que 0escritor cheque se existe coerencia entre dois nos adjacentes. Nesse ultimo modo, as
operac6es normais de edicao tambem sao permitidas. Veremos no Writer's Assistant
uma opcao automatizada desse processo de linearizacao de nos.
o
ambiente WE foi utilizado para construir urn prototipo para 0 ambienteSEPIA (Structured Elicitation and Processing of Ideas for Authoring), urn sistema de
[Schuler-90] estende 0 conceito de modos do ambiente WE oferecendo modos de escrita
especiais que podem ser usados para criar urn hiperdocumento. AAA fornece cinco
atividades do processo de escrita de textos argumentativos em diferentes modos de
operal;ao: modo argumental;ao, retorico, arvore, texto e edil;ao. Os modos
argumental;ao e retorico substituem 0 modo rede de WE. Estes dois novos modos
propiciam a crial;ao de redes especializadas com nos do tipo topicos (issues), posil;oes
(positions), argumentos (argum ents) e fatos (facts) e ligal;oes do tipo
serve(issueA ,issueB ), substitui(issueA , issueB ) , suporta(positionA ,argum entB ), e outros.
W riting Envlron",.nt e"'Pty W 8 Iwon. Spac:.
t-
Int ••••••• I:)"..:·'" 2M a r1 :h ,eeeNETW O RK M O DE: N e t & Ivl •• Control IOlspl.y/Print TEXT MOOr Ivla.Cont"" IO bpl&y/Pr1nt
~u."'u••
I
T,.._
..
·
T,... -.oaa, w tW cl\.pp.an k\ th. ~w.,.teft quadrant 0' Figun 6.I
O~.nI.ulonI I
WritingI
p ro v id e , a n e n ftro n n M ln tt ••••.• d to th e o rg a n 'za tio n a l M G C le .
I~GUld'lin •• tor
1
Erractive •...__.._-_
..;]
Editor·
Editor M O H , snow n W tithe tow er l'itn tquadrant at Figure Ii, provide ••. standard text .dltot' tor exp& ncU"g tlM concept "'pre,.nud by •. nod. Into pra.L Thus, It .up,oru the cogN t". process ot •••.••• nlc arc"'" The Interwtedla'& product, at course, Is •. block 0' text that Is associated w tth •. panicular node. The uncIar1ying .yn ••"".t .,.. tho •• tor •. ""ar sequence ., charact.n dhrIdaa iruo wonI~
hs, p& r••.• ph., ate. anIY t •••.•axten"', of W f, the 'Y lte. wUJ
...
-
....•
.,-
.""Text
1ftot
I
·
Text M oO ti, ,hO w n 6ft t •.•• upper len quadrant 0' figure, 6 and 10.loun." ray" •• -.
L__
pro¥kI., an.~t tor editing u •• docu-.nt.
:J
fuid_'I~
·nnlnv~gnh:l¥.
~.s••rc"'1 -rritlnt I E O fT M O O f S ltu a tto n & l A n a ly s is 'V la . C o n tru l ~ISPI.Y/Print
~
fPltuulon I IjCognltl •••I
"""''''1
ritlnt Io;:;;;;;u dltlnt ~ Con.tOne
pgnltlva
xp •.• "lo •• 'w•••.
---,
..
!Sy"••dI•••. Iftpllculo1- •••
~
I dlt ••.
A Figura 2.9 mostra urn screendum p da interface do AAA, no qual 0 modo
,. A I". •.•eN t U ft"'_ .,. 1~ , •••1 M " I" .•••.• 1 1 I\1
••••••• II ...,. ••••• 'D\I.t •••••• 1M •••• t "t •• ".. •••••••
• • • • • • • • •., • • N d f t • • •,'-• • •nu'" .• ...,.f " " •.••
.H N l.,.', ••••••••••• .,..._ ••....".
• ()tir.-n.,.it ••••• ..., •• _ .r ,c••• r-. ,••,.•.
CIlil.- •••••••••• .,.fttfl' .,. ••••••. Ilea. ••••. "" •••.
&'INC IlN M " \" " " •• ,," I'" ~ •••••••• " I t ti'
,"" •••••••••.. AI•••••••••••••• , ••_ illIII~ ••••"' •
••.•••• •••, " ••• "'" C M l-. tY t*tt. '" III"" """"' .•.'" ftM
'" •••.•••••.•••••• .-eetI ••••• 1 ., tllJIthI.
-...c •..
2 .2 .2 W rite r's A s s is ta n t: M o v im e n to F a c il e n tre a s V is o e s d e u m
T e x to
o
Writer's Assistante
urn sistema prot6tipo que combina urn organizador de ideias, urn editor de estruturas e urn editor de textos, permitindo que facilmente semova de uma ferramenta a outra. Cada ferramenta consiste em urn modo de operacao
que fornece uma determinada visao do documento: visao de rede, visao de estrutura e
visao linear, respectivamente.
o
escritor pode editar notas e ligar seus r6tulos para formar uma rede de2.10. Nesta figura, uma parte da rede e ligada ao corpo do documento e outra ao fim
do documento. 0 algoritmo linearizador automaticamente lineariza a rede, seguindo a
prioridade dos tipos de liga<;6esentre os nos, prioridade esta que (hfere para cada tipo
de texto. Respeita tambem 0posicionamento de partes da rede a uma ou outra posi<;ao
do documento atraves de um tipo especial de liga<;ao:liga<;aocom a estrutura do texto.
Desta forma, 0 editor de estruturas, que ajuda 0 escritor a criar seu documento
conforme 0tipo de texto escolhido, fica estreitamente ligado ao editor de ideias.
:::::::;::::::::::::::::,
:;;:::::::::::::::::::::,
::;;;:::::::::::::::::::1
~~~~;j~~H~~~~:~j~~j~~:j:
::::::::::::::::::;:::::, gg!mmmmm;~~~: ::::::::::::::::::::::::, :;::;::::::;;::;;:::::;:1 ::::::::::;;::::::::::::1 ::;:::::::::::::::::::::, ::::::::::;::::::;::::::, ::;;;:;::;::;;::::;;:;::, ::::::::::::::::::::::::.
~))1i!~!!~!i~ !if!!~j!~;;:
::::::::::::::::::::::::, ~;~~;~r;~~~i~~~~~;;~~~;:
!,!",!~llt,,'
111!11·1111!111!!I!!!!!il
.11!!I!lll!I!I!!II!II!'il
~~~~i~i'::ft···
...,.~."'.,~,..,~"..
..=~----~
llh ln k -U U - h u m a n .)\
II-" II.
d rvriIc. ..-u ...•.
(n.n_"u"~-WOY'f--II~
--~
,II-
II-r
••-o
Writer's Assistant fornece ajuda para a edi<;ao de cartas, relatorios tecnicose alguns documentos padr6es de empresas. Para relatorios tecnicos, por exemplo, sao
apresentadas ao escritor as partes tradicionais desse tipo de texto: titulo, nome(s)
do(s) autor(es), resumo, introdu<;ao e outras. 0 escritor muda de uma visao a outra
rapidamente, por exemplo, primeiro criando um outline nao muito detalhado no editor