• Nenhum resultado encontrado

Ferramentas de auxilio a escrita de artigos científicos em inglês como língua es...

N/A
N/A
Protected

Academic year: 2017

Share "Ferramentas de auxilio a escrita de artigos científicos em inglês como língua es..."

Copied!
237
0
0

Texto

(1)

\

UNIVERSIDADE DE SAD PAULO INSTITUTO DE FTslCA DE SAD CARLOS

DEPARTAMENTO DE FTslCA E CIENCIA DOS MATERIAlS

Ferramentas para Auxil iar a Escrita de Artigos Cientificos

em Ingl~s como Lingua Estrangeira

(2)

II

~

I ~~

f"J

UNIV~RSIDADE

~

I.

W-~_.)_~_

D E S A O P A U L O

~ In stitu to de Ffsica d e S io C arlos Av. Dr. Carlos Botelho,CEP 13560-250 - Silo Carlos - SP1465

Brasil

C:\WINWORD\WLA\OFDEFD.DOC Fone (0162) 72-6222

Fax (0162) 72-2218

MEMBROS DA COMISSAO JULGADORA DA TESE DE DOUTORADO DE

SANDRA

MARllA ALillSXO

APRESENTADA AO INSTITUTO DE FlSICA DE SAO CARLOS,

UNIVERSIDADE DE SAO PAULO, EM 31/08/1995.

~~~:b~~:~~;

__

~~~_~':~:~_a

Jr.

Prof. Dr. Luiz Nunes de Oliveira

__G0_~_~ r{l~__

t-: ~

(~~::_~_~~

Profa. Dra. Ariadne M.Brito R.Carvalho

0~/~

---~-~~~--~~_----l---Profa. f5ra. Clarisse Sieckenius de Souza

/ LJ/

.

{/ //l'Q

--- --- - ----~ - - - -

(3)

A g ra d e c im e n to s

Sao inumeros os agradecimentos ao Prof. Dr. Osvaldo N. O. Jr., cuja orienta<;ao,

encorajamento e cren<;a em mim ajudaram na realiza<;ao deste trabalho. Sem

duvida, os efeitos de sua energia e disposi<;aopara 0trabalho nunca cessarao de

produzir frutos.

As amigas: Gra<;a N., Rosely S., Renata, Grac;a P., Carolina, Cristina, Solange,

Agma e Roseli F. foram urn grande apoio dentro e fora da USP. Agrade<;o

especialmente a Agma e Renata pela ajuda na editorac;ao final da tese, e aos

professores Homero Schiabel e Niura Fontana pelas discussoes sabre 0 processo

e tecnicas de escrita. Obrigada a todas as secretiuias do Departamento de

Computa<;ao do ICMSC - 0 suporte tecnico e a amizade foram muito

gratificantes.

Agradecimentos especiais a Prof. Donia Scott pela orientac;ao durante 0 estagio

no Inform ation T echnology R esearch Institute, B righton U niversity. Seu

conhecimento e sabedoria tornaram aquele periodo decisivo para minha

forma<;ao. Agradecimentos tambem saD especiais a amiga e pesquisadora Cecile

Paris, pelo carinho em explicar tantas coisas e pelas tantas duvidas que

desapareceram depois das longas discussoes.

A

Lucia, obrigada por ter sido uma voz amiga durante 0 estagio. A todos os

amigos contemporaneos de doutorado: Carmo, Sandra, Rosangela, Roseli,

Jacques e David, muito obrigada pelas boas conversas, que tornaram este

periodo menos tensa. Obrigada ao aluno Roberto pel a ajuda na implementac;ao

da interface e filtros para 0 ambiente.

Urn muito obrigada vai para a pesquisadora Karen Kukieh, pela gentileza impar

em responder as minhas duvidas. Sua abordagem pragmatica na resoluc;ao de

problemas da area de Linguistiea Computaeional mareara para sempre meu

estilo de trabalho. Que eu possa ter pelo menos urn poueo de sua sensibilidade e

visao quando estiver orientando estudantes - Jl,lany thanks Karenl

Foram vahosas as discussoes com 0 Prof. Stan Matwin, da U niversity of O ttaw a

e com 0Prof. Luis Torgo da Universidade do Porto.

Agrade<;o a meus pais e irmaos pela constante alegria da eompanhia e pelo apoio e am or ineondieionais.

Finalmente, urn obrigada com urn grande abrac;o a minha melhor produc;ao:

(4)

Esta tese trata do problema da escrita de artigos cientificos em ingles como lingua

estrangeira. Do ponto de vista teorico, foram investigados metodos e tecnicas de

duas areas da Inteligencia Artificial - Linguistica Computacional e Raciocinio

Baseado em Casos -, em busca de soluc:;6espara a construc:;ao de ferramentas de

software que diminuissem os problemas de interferencia da l1ngua materna e de

falta de coesao e coerencia nos textos escritos por estudantes da area de fisica

experimental, principalmente. Do ponto de vista pratico, foram desenvolvidas

duas ferramentas de auxilio a escrita. Uma primeira, chamada Ferramenta de

Referencia, foi implementada utilizando-se 0 metodo de analise de corpus para a

gerac:;ao de urna Base de Express6es que contem as colocac:;6esdo tipo

express6es-padrao, comurnente encontradas em textos cientificos de artigos e livros de

subareas de fisica e informatica. 0 acesso as colocac:;6espode ser feito de tres

maneiras: atraves de componentes e subcomponentes da estrutura esquematica

de artigos da area de pesquisa experimental, atraves de palavras-chave

pertencentes a este genero, e pelos padr6es retOricos mais comuns que este genero

utiliza. Uma ferramenta de aquisic:;ao de conhecimento esta acoplada a

Ferramenta de Referencia, permitindo extensibilidade, facil personalizac:;ao, e

transporte (portability) para novos dominios. Testes com alunos de pos-graduac:;ao

em urn curso de Escrita Cientifica no IFQSC·USP comprovaram a eficacia da

ferramenta, urna vez que seu uso auxiliou na superac:;ao do bloqueio inicial em se

produzir urn primeiro rascunho de texto, e forneceu input adequado para a escrita

de textos coesos. Como observou-se, tambem, que esta ferramenta sO e adequada

para usuarios com boa recepc:;ao da lingua inglesa e alguma experiencia em

escrita cientifica, urna nova ferramenta foi implementada para urna classe de

usuarios que possuem problemas mais severos quanto a coesao e interferencia da

lingua materna. Ela foi denominada Ferramenta de Suporte, e para sua

implementac:;ao utilizou-se, alem do metodo de analise de corpus, a abordagem

baseada em casos para modelar as fases da escrita. A analise de corpus nesta

segunda ferramenta foi mais detalhada, ficando assim restrita a Sec:;ao

IntrodutOria de Artigos Experimentais. Esta analise identificou trinta estrategias

retOricas encontradas em artigos cientificos, geralmente realizadas por tres ou

quatro mensagens (denominac:;ao para os tipos diferentes de informac:;6es)

tomadas de urn conjunto de quarenta e cinco tipos. A base de casos da

implementac:;ao atual da ferramenta conta com cinquenta e quatro instancias de

introdu<;Oes autenticas das revistas P hysical R eview L etters e T hin Solid F ilm s,

urn nillnero ainda pequeno que deve ser aurnentado para que urna avaliac:;ao

quantitativa do metodo de busca seja realizada. Uma ferramenta para auxiliar 0

engenheiro de conhecimento na aquisic:;ao de novos casos e varios filtros para

automatizar 0 processo de edic:;ao dos casos foram implementados, tornando 0

processo de gerac:;ao de novos casos semi-automatico. Os trabaIhos futuros com

relac:;ao a esta segunda ferramenta devem tratar principalmente do acrescimo de

casos na base, da avaliac:;ao da precisao e revocac:;ao da busca, e de testes com

usuanos, que, com certeza, contribuirao para 0 aperfeic:;oamento de ferramentas

(5)

This thesis considers the problem of writing scientific papers in English as a foreign language. From the theoretical point of view, techniques from two areas of Artificial

Intelligence, namely Computational Linguistics and Case-based Reasoning, were

investigated in the search for possible solutions to minimize mother tongue

interference and lack of cohesion and coherence in student" texts, especially in experimental physics. Two writing tools were then developed. The first one, named

Reference Version, employed corpus analysis for creating a sentences base

containing collocations frequently used in scientific writing. Such collocations could be accessed in one of three ways: according to the components and subcomponents of

the schematic structure of a scientific paper, by searching keywords and

communicative goals. An acquisition mode was also implemented so that the tool can be customized easily thus allowing portability to other domains and possible extensions within a given domain. Experiments in a technical writing course at

IFQSC-USP for graduate student" have demonstrated the efficacy of the tool. It was

particularly useful in helping students to overcome the initial block in the

preparation of a first draft and also in providing contextualized linguistic input for producing a cohesive text. It was also observed that this first tool was only helpful

for students possessing reasonable reception of the English language and some

experience in scientific writing. A new, more sophisticated tool was then proposed and implemented. It is named Support Version and utilizes corpus analysis and the case-based approach as a framework for modeling the different stages of the writing process. Because a more detailed analysis had to be performed, the tool was

restricted to the Introductory Section of papers on experimental physics. In this

analysis 30 rhetorical strategies were identified which were generally realized

linguistically using 3 or 4 rhetorical messages from a set of 45 types of message. The

implemented cases base has 54 introductions from the Physical Review Letters and Thin Solid Films journals, which has been shown to be a far too small number for

reasonable recall and precision figures to be obtained. A scheme has been

incorporated into the tool for adaptations to be made in the cases recovered, by

making use of revision rules. In future the tool may be extended in a

straightforward way to other parts of a scientific paper or to other areas of research

with a semi-automatic edition process of new cases that has been built into the

(6)

Publica~oes

R e s u lta n te s d e s te T ra b a lh o

• Oliveira, Jr. O.N.; (Caldeira), Aluisio S.M. and Fontana, N. C husaum s: A W riting T ool R esource for N on-N ative U sers of E nglish. In: Computer Science: Research and Applications. R Baeza-Yates and U. Manber (eds.), Plenum Press, N.Y. pp. 63·72, 1992.

• Aluisio, S.M. and Oliveira, Jr. O.N. A C ase-B ased A pproach for D eveloping W riting T ools A im ed at N on-native E nglish U sers. A ser publicado em Lecture Notes In Computer Science (Springer-Verlag), como Proceedings da International Conference on Case-Based Reasoning, 1995,

• Fontana. N.: (Caldeira), Aluisio, S.M.; De Oliveira, M.C.F. and Oliveira Jr., O.N. C om puter A ssisted W riting A plications to E nglish as a F oreign L anguage, CALL, Volume 6 (2), p.

145-161, 1993.

• (Caldeira). Aluisio.s.M.: De Oliveira, M.C.F.; Fontana, N.; Nacamatsu, C.O. and Oliveira ,Ir., O.N. W riting tools for non-native users of E nglish. Proceedings of the XVIII Latinamerican Informatics Conference, Spain, p. 224-231, 1992.

• De Oliveira, M.C.F.; (Caldeira), Aluisio, S.M.; Masiero, P.C. & Oliveira Jr., O.N. A

D iscussion on H um an-C om puter Interfaces for W riting Support T ools. In Proceedings of the XII International Conference of the Chilean Computer Science Society, Santiago, Chile, pp. 223-233, 1992.

• Oliveira. Jr. O.N.; (Caldeira), Aluisio S.M. and Fontana, N. C husaum s: A W riting T ool R esource for N on-N ative U sers of E nglish, In Proceedings of the XI International Conference of The Chilean Computer Science Society, pp. 59-70. 1991.

• (Caldeira). Aluisio. S.M.; Oliveira Jr.. O.N. Proposta de urn Ambiente para Auxiliar na

Produyao de Textos Cientificos em Ingles. In: Proceedings do Congresso Nacional de

Informatica. 24. 1991.

• Aluisio, S.M. and Oliveira Jr. O.N. D eveloping C orpus-B ased W riting T ools A im ed at N on-native U sers of E nglish. A ser publicado nos Proceedings of The Eighth Annual Conference on Writing and Computers. 1995.

• Garcia Neto, A; De Oliveira, M.C.F.: Fortes, RP.M.; (Caldeira) Aluisio, S.M. and Oliveira Jr. O.N. A Softw are A rchitecture for a C om puter-A ided W riting E nvironm ent. In: Proceedings

of the 5th HCI International, p. 204, 1993. "

• (Caldeira). Aluisio. S.M.; Nunes, M.G.V. A D iscourse Schem a-B ased C om posing T ool. In: Proceedings of the 5th HCI International. p. 199. 1993.

• (Caldeira), Aluisio, S.M.; Nunes, M.G.V. A D iscourse Schem a-B ased C om posing T ool. In: Proceedings of The 6th Conference on Computers and Writing, 1993.

(7)

2 COMPUTADORES E ESCRITA. ...•••.•...•.•...•...••...•.•••..••...•••••••.•.•... 7

2.1 MODELOS COGNITIVOS DO PROCESSO DE ESCRIT A 9

2.1.10 M odelo de B ruce, C ollins, R ubin e G entner [B ruce-78]. 10

2.1.20 M odelo de F low er e H ayes [H ayes-80} 11

2.1.3 A lgum as C onclusoes Sobre 0 P rocesso de E scrita 12

2.2 FERRAMENTAS E AMBIENfES PARA A ESCRITA 14

2.2.1 W E : U m A m biente A 1ultim odal para a E scrita 19

2.2.2 JV riter'sA ssistant: M ovim ento F aci! entre as V isoes de um 22

T exto 22

2.2.3 A m bientes que R eutilizam T extos 24

2.3 ESCRITA EM INGLES COMO LiNGUA ESTRANGEIRA 25

2.3.1 A lguns E rros C om etidos por E studantes B rasileiros na 26

E scrita em Ingles 26

2.3.2 U m R ecurso de A juda T ecnica para a E scrita em Ingles 28

2.4 0 AMBIENfE AMADEUS 30

2.4.1 A F erram enta de R eferencia 31

2.5 SUMARIO 37

ANALISE DE CORPUS: INTRODU<;OES DE ARTIGOS CIENTiFICOS ...•.•••... 40

3.1 ESTRUTURAS ESQUEMATICAS PARA INTRODU<;:OES 43

3.1.1 M odelo C A R S (C reate a R esearch Space) 43

3.1.2 M odelo de W eissberg e B ucker 44

3.1.3 C om entarios sobre os A fodelos 46

3.2 A ANALISE DE UM CORPUS DE INTRODU<;:OES 47

3.2.1 A Sele(:iio do C orpus 49

3.2.2 O bjetivos e M etodologia 50

3.3 RESULT ADOS DA ANALISE 51

3.3.10 E squem a D etalhado para Introdu(:oes 51

3.3.2 P adroes de O rganiza(:iio T extual para Introdu(:iio 53

3.3.3 E strategias R etoricas 61

3.3.4 E struturas R etoricas das Introdu(:oes do C orpus 63

3.4 SUMARIO 66

PRINCIPIOS DA ABORDAGEM BASEADA EM CAS OS APLICADA A FERRAMENTAS PARA A

ESCRIT A •....•...•.••.••....••...•....•...•..•.••••••••..•...•.•••...•...••.••.• 68 4.1 PRINCiPIO DA PRE-COMPILA<;:Ao DO CONHECIMENTO DO GENERO 71

4.1.1 R epresenta(:oes do C onteudo de um T exto 72

4.1.2 F orm alism os para R epresenta~iio da E strutura do D iscurso 80

4.1.3 Sum ario dos T rabalhos e Sistem as D iscutidos 95

4.2 PRINCiPIO DA REUTILIZA<;:Ao DE MATERIAL LINGrnSTICO NAo FACTUAL 97

4.2.1 T ipos de D icionarios 98

4.2.2 Sistem as que U tilizam D icionarios de P adroes 99

4.3 PRINCiPIO DA UTILIZA<;:Ao DE 'fExros AurtNTICOS E ADAPT A<;:OES INTERATIV AS 104 4.3.1 F undam entos do R aciocinio A nalogicolB aseado em C asos 104 4.3.2 A A rquitetura B asica de Sistem as B aseados em C asos 107

(8)

5 UMA ARQUITETURA GENERICA PARA SUPORTE

A

ESCRITA. ....•...•.•...••...•....•..•.•.•.•...110

5.1A ARQUITETtJRA PARA FERRAMENT AS DE Auxiuo AORGANIZA~Ao TE;"''TUAL 111

5.2UM METODO PARA A IMPLEMENT A<;Ao DE FERRAMENT AS DE SUPORTEAESCRITA 113

5.3JUSTIFICATIVAS E LIMITA<;OES DO MODELO PROPOSTO 117

5.4 SuMARIo 119

60 MODELO COMPUTACIONAL: A FERRAMENTA PARA A ESCRITA DE INTRODUCOES120

6.1 A FERRAMENTA DE SUPORTE 121

6.2RECURSOS 124

6.2.1 B ase de C asos 124

6.2.2 U m a R ede C onceitual de E strategias e M ensagens 127

6.2.3 R egras e M edidas de Sim i laridade 136

6.2.4 R evisoes: A daptafoes para as E strategias R etoricas 145

6.2.5 Interface: .•Y V iew toolkit e N etscape brow ser 148

6.3PROCEssos E EXEMPLOS DE INTERA~OES 150

6.3.1 C oleta de Inform afoes e R ecuperafiio de C asos 151

6.3.2 Sim ulafoes das A daptafoes Interativas 155

6.4 SuJvwuo 161

7 CON CL usA 0 ...•... 163

7.1 CONTRIBUI~OES 165

7.1.1 C ontribuifoes para F erram entas de A uxilio

a

E scrita 165 7.1.2 C ontribuifoes para a E strutura E squem atica de Introdufoes 166

7.1.3 C ontribuifoes para a A bordagem B aseada em C asos 166

7.2LIMITA~OES 166

7.3TRABALHOS FtTfUROS , 167

7.3.1 C riafiio de um N ilcleo B asico de C onhecim ento L inguistico 168

7.3.2 A m pliafiio do E scopo da F erram enta de Suporte 168

7. 3. 3A va/iafiio da F erram enta de Suporte 169

7.3.4 C onstrufiio e A va/iafiio da F erram enta T utorial , , 170

A - AS MENSAGENS RETORICAS, SEUS ELEMENTOS SEMANTIC OS E SUA EXPRESsAo LIN Guis TI CA ...•...•...•...•...•...• 171

Al CONTEXruALIZA~Ao 173

A2 REVISAo DALlTERAnJRA 187

A 3NECESSIDADE DE MAIS INVESTIGA~Ao/GAPs 194

A4 PROPOSITO DA PESQUISA , 199

A5 METODOLOGIA 202

A6 PRINCIPAlS RESULTADOS 204

A 7VALOR DA PEsQUISA 204

A 8 ESTRUnJRA DO ARTlGO "",.""" ,.",."", , ", , """ 205

B - AS ESTRA TEGIAS RETORICAS ..•..•...•..•...•...•...•....•...•.. 206

B. 1CONTEXTUALIZA<;Ao ", """"", ', ,.. ,' '"'''''''''''''''''' ,.. ,.. , 207

(9)

B .3 NECESSIDADE DE M AIS INVESTIG AG Ao/G AP 2 1 1

B .4 PRoPO SITO DA PESQ UISA 2 1 2

B . 5M ETO DO LO G IA 2 1 4

B .6 PR!NcIP A1S RESULTADO S 2 1 5

B .7 VALO R DA PESQ UISA 2 1 6

(10)

in d ic e d e F ig u ra s

FIGURA 2.1: Amilise Do Processo Da Escrita [Bruce-78] 10

FIGURA 2.2: Diagrarna De Blocos Do Modelo Para A Escrita [Hayes-80] II FIGURA 2.3: Tela Do Correct Grammar Mostrando 0 Resumo Da Estatistica Para Urn Dado Texto 15 FIGURA 2.4: Tela Do Correct Grammar Corrigindo A Grarnatica 15

FIGURA 2.5: Sele9iioDe Regras De Estilo No Grammatik 16

FIGURA 2.6: Corre~ao De Jargao No Grarnrnatik 17

FIGURA 2.7: Exernplo De UrnO utline Gerado Pelo Microsoft Word 6.0 18 FIGURA 2.8A: Modos Rede, Arvore E Edi~ao Do Ambiente Para A Escrita We 20

FIGURA 2.8B: Ambiente We Com Seu Modo Texto Ativado 21

FIGURA 2.9: AAA Com Seus Varios Modos 22

FIGURA 2.10: A Visao De Rede No Ambiente Writer's Assistant 23 FIGURA 2.11: MOduloDe Ajuda Linguistica Do Ambiente Amadeus E Suas Duas Ferrarnentas

Desenvolvidas (Hachurado) 31

FIGURA 2.12: A Arquitetura Da Ferrarnenta De Referencia 31

FIGURA 2.13: Cornposi~ao De Artigos 33

FIGURA 2.14: Personaliza~ao Da Ferrarnenta 34

FIGURA 2.15: Trechos Dos Textos Escritos Por Estudantes Brasileiros 35 FIGURA 3.1: Modelo Para A Estrutura De Introdu~Oes[Swales-90] 44 FIGURA 3.2: Modelo Para A Estrutura De Introdu~oes [Weissberg-90] 45 FIGURA 3.3: Cornponentes E Estrategias Do Esquema Detalhado Para Introdu~Oes 52 FIGURA 4.1: Proposi~OesNumeradas Segundo A Ordern De Aparecirnento De Seus Predicados No Te;\.1073 FIGURA 4.2: Mensagern Semantica (Exernplo Tornado De [Srnadja-91)) 75 FIGURA 4.3: Exernplo Sirnplificado Das Entradas Do Lexico Frasal 76 FIGURA 4.4: Predicados Ret6ricos Utilizados Em Textplan [Maybury-91] 78

FIGURA 4.5: Defini~ao Da Rela~ao Evidencia [Mann-87] 79

FIGURA 4.6: Regras De Estrutura~ao Do Conteudo Sernantico [Cawsey-93] 81 FIGURA 4.7: Regras Para Amllise De Narra~Oes(Exernplo Tornado De [Brown-83]) 84 FIGURA 4.8: Modelo De Toulmirn Para A Estrutura De Urn Argumento (Exernplo Tornado De

[Rankin-93]: Outras DiscussOes Aparecern Em [Maybury-91]). 85 FIGURA 4.9: Agregado Da Rela~ao Antitese Expandido Para Refletir 0 Modelo De Argumenta9iio De

Toulrnin [Rankin-93] 86

FIGURA 4.10: Estrutura Esquernatica De Urn Artigo Cientifico [Kintsch-78: Weissberg-78: Trirnble-85:

Weissberg-90: Swales-90] 88

FIGURA 4.11: EstcigiosDe Urna Gsp Tipica Para Textos Bibliograficos [Teich-94] 90 FIGURA 4.12: Esquemas De Predicados Ret6ricos Para Defini~OesDe ~etos [Mckeown-85] 91

(11)

FIGURA 4.14: Operador Persuadir-Por-Motival;ao [Maybury-91] 93 FIGURA 4.15: Parte Da Hierarquia De Metas Comunicativas [Hovy-92] 94

FIGURA 4.16: Sumario Dos Trabalhos E Sistemas Revisados 96

FIGURA 4.17: Exempl0 De Uma Mensagem Utilizada Em Ana [Kukick-83] 99 FIGURA 4.18: Exemplo De Uma Entrada Do Lexico Frasal [Kukich-83] 99 FIGURA 4.19: Entrada Para "The Dow Jones Average Of 30 Industrial Stocks" [Smadja-91] 102

FIGURA 4.20: Entrada Para "Advancers" 103

FIGURA 4.21: Arquitetura Basica De Urn Sistema Baseado Em Casos [Hammond-90] 108 FIGURA 5.1: A Arquitetura Generica Para Ferramentas De Suporte 112 FIGURA 6.1: Arquitetura Da Ferramenta De Suporte De Introdw;oes 124

FIGURA 6.2: Uma Das Introdul;oes Da Base De Casos 125

FIGURA 6.3: Estrutura Ret6rica Representada Em Prolog 126

FIGURA 6.4A: Relal;ao Is_A Entre Subclasse (Estrategia Especifica A Urn Componente) E Classe

(Estrategia Generica) 128

FIGURA 6.4B: Relal;oes Is_A Entre Mernbros (Mensagens) E Classe (Estrategia Definic;ao) 129

FIGURA 6.5: Partes De Uma Estrategia 130

FIGURA 6.6 Parte Da Rede Conceitual De Estrategias E Mensagens 132 FIGURA 6.7: Urna Requisic;aoCornpletarnente Contida Em Urn Caso (Hachurado) 138 FIGURA 6.8: Urna Requisic;aoParcialrnente Contida Em Urn Caso (Hachurado) 139 FIGURA 6.9: Tela Inicial Do Ambiente Amadeus Para Acesso

As

Duas Ferrarnentas De Escrita 149

FIGURA 6.10: Tela Com As Instruc;oesDe Uso Do Netscape 150

FIGURA 6.11: Coleta De Informac;oesSobre A Estrutura De Urna Introduc;ao 151 FIGURA 6.12: Tela Do Netscape Com Os Tres Casos Recuperados 152

FIGURA 6.13: Visualizac;aoDo Prirneiro Caso Da Lista 153

FIGURA 6.14: Visualizal;ao Do Segundo Caso Da Lista 154

FIGURA 6.15: Visualizac;aoDo Terceiro Caso Da Lista 155

FIGURA 6.16: Mudanc;aDe Material Linguistico 157

FIGURA 6.17: Trocar Por Mensagem Similar 158

FIGURA 6.18: Remoc;aoDe Mensagens 159

FIGURA 6.19 Urn Dos Casos Recuperados Da Remoc;aoDe Mensagens 160

FIGURA 6.20: InserC;aoDe Mensagens 161

(12)

T ABELA 2.1: Ferramentas E Ambientes Para A Escrita

TABELA 2.2: Exemplos De Erros Cometidos Por Estudantes Brasileiros

T ABELA 3.1: Equivalencia Entre as Modelos De [Swales-90] E [Weissberg-90]

TABELA 3.2: Estruturas Ret6ricas Dos Artigos Da Revista Thin Solid Films

T ABELA 3.3: Estruturas Ret6ricas Dos Artigos Da Physical Review Letters

T ABELA 6.1: Representa9ao Prolog Para As Rela90es E Caraeteristicas De Conceitos

T ABELA 6.2 Subtipos Das Mensagens De "Declarar Proeminencia Do T6pico/ Area"

T ABELA 6.3 As Quatro Popula90es De Casos Similares Recuperados

T ABELA A1: Expressao Linguistica Do Componente G a p

2-l 27

-l8

M

65

130

13-l

l-l3

(13)

Capitulo

1

(14)

roblemas com a escrita podem afetar 0 desempenho de profissionais de

maneira marcante, principalmente no caso de cientistas e academicos que

precisam escrever com proficiencia e desembaraco nao apenas na lingua

materna, mas tambem em uma ou malS linguas estrangeirHs,

principalmente 0 ingles. Varias ferramentas de software [Cherry-82; Smith-86;

Sharples-89; Writing tools-91; Reference Software-92] tern sido criadas para auxiliar

no processo de escrita, muitas das quais ja estao disponiveis comercialmente. Como

ilustrado na revisao da literatura sobre ferramentas de auxilio

a

escrita (Capitulo 2),

a grande maioria delas e dedicada ao pos-processamento do texto atraves de analises

estatisticas, visando corrigi-Io tanto do ponto de vista da correcao gramatical, como cia

clareza, estilo, e concisao das ideias apresentadas. Apesar de serem extremamente

uteis para usuarios com dificuldades linguisticas, estas ferramentas sao limitadas

quanto

a

escrita numa lingua estrangeira, pois proporcionam somente mecanismos de

correcao e acabamento do texto, sendo que muitas vezes 0 usuario nao e capaz de

gerar urn texto passivel de ser apenas m elhorado.

Estudos mostraram que algumas das deficiencias de alunos brasileiros

realizando cursos de pos-graduacao no exterior estao relacionadas ao mau usa ou

omissao de express5es mais ou menos convencionais que desempenham func5es

especificas do texto academico [Fontana-91; Fontana-93]. Vma solucao pratica para

este problema consiste na utilizacao de express5es aprendidas com a pratica adquirida

na leitura de artigos - acreditamos ser esta estrategia largamente difundida entre

estrangeiros que precisam escrever em ingles. Ou seja, numa situacao de duvida, 0

escritor recorre a textos escritos por pessoas de reconhecida competencia. Para

otimizar 0 usa desta estrategia, foi feita uma compilacao de express5es e orac5es

extraidas de artigos e livros cientificos [Oliveira-91]. Vma verificacao surpreendente

foi que urn numero relativamente pequeno de express5es e orac5es pode ser suficientE~

para cobrir uma grande proporcao das expressOes e orac5es usadas numa certa area

do conhecimento. Isto ocorre porque as express5es e orac5es sao empregadas de

maneira sistematica, quando se descrevem tabelas, figuras, procedimentos

experimentais, ou quando se comparam resultados. Anteviu-se, a partir desta

constatacao, a possibilidade de se criar ferramentas de software que utilizem esta

(15)

Concebeu-se, portanto, urn ambiente de auxilio a escrita chamado AMADEUS

(AMiable Article Development for User Support), cujo modulo linguistico contaria

com tres tipos de ferramenta de auxilio: Ferramenta de Referencia, Ferramenta de

Suporte e Ferramenta Tutorial. Eventualmente, outras ferramentas, inclusive

comerciais - como os corretores ortograficos e gramaticais - poderao ser incluidas no

ambiente. A figura abaixo apresenta 0 Modulo de Ajuda Linguistica do ambiente

AMADEUS, no qual as duas ferramentas implementadas estao inseridas. A

Ferramenta de Ensinorrutorial sera futuramente desenvolvida.

Fe rra m e n ta d e R e fe re n c ia

F e rra m e n ta d e S u p o rte

F e rra m e n ta d e E n s in o fT u to ria l

A Ferramenta de Referencia, relatada no Capitulo 2, foi projetada e

implementada apos uma revisao das ferramentas de auxilio a escrita discutidas na

literatura. Esta ferramenta fornece ao usuario uma grande variedade de express6es

para que ele possa (a) ter urn "input" linguistico adequado as suas necessidades, (b)

adaptar as express6es que julgar apropriadas ao seu texto e (c) reproduzir formulas ou

express6es fixas quando estiver escrevendo sobre determinados aspectos do seu

trabalho. A ferramenta foi testada em urn curso de escrita tecnica para alunos de

pos-graduacao do Instituto de Fisica de Sao Carlos, e os resultados principais tambem san apresentados no Capitulo 2.

Embora a Ferramenta de Referencia seja util pois ajuda a superar 0

problema do bloqueio inicial com relacao a escrita, e, para alguns usuarios ajude a produzir bons textos, para outros parece faltar algum tipo de ajuda para solucionar

problemas textuais de ordenacao dos componentes do artigo e de escolha do melhor

padrao de oracao que e adequado para 0 texto sendo construido. Nesta tese,

argumentamos sobre a necessidade de uma analise de corpus de artigos cientificos

(16)

lexico a ser utilizado em ferramentas de auxilio

a

escrita.

E

importante diferenciar a analise de corpus que foi utilizada neste trabalho da tradic;ao probabilistica da area de

processamento de linguagem natural denominada, atualmente, de corpu.s-based

natural language processingl • A analise de corpus esteve restrita

a

sec;ao introdutoria

de artigos experimentais por ter sido bastante detalhada - os textos das introduc;5es

foram analisados em nivel de orac;5es. 0 dominio de aplicac;ao (ou area de pesquisa)

escolhido foi 0 da Fisica. Esta analise, que e descrita no Capitulo 3, resultou em urn

modelo detalhado para definir a estrutura esquematica de introduc;5es de artigos de

pesquisa experimental.

A intenc;ao de se realizar uma analise bastante detalhada foi a de se verificar

o grau de riqueza das express5es linguisticas que as mensa gens de cada componente

da estrutura apresentam. E tambem de levantar as varias estrategias que formam a

estrutura dos paragrafos de urn artigo cientifico. 0 resultado desta analise forneceu

subsidios para a escolha dos recursos com putacionais necessarios para a construc;ao da

Ferramenta de Suporte. A caracteristica principal que se exigiu desta ferramenta foi

que ela ajudasse urn nao nativo escrever, com certa fluencia2, artigos deste genero,

superando, assim, alguns dos problemas da Ferramenta de ReferEmcia.

Uma justificativa de ordem pratica para a busca de variac;5es e que uma

ferramenta de suporte

a

escrita nao pode limitar seus usuarios a produzir urn padrao

fixo para as estrategias e para as orac;5es, dado que as varias introduc;5es publicadas

permitem flexibilidade enquanto se mantem representativas do genera.

1 0 processamento probabili.'ltico da linguagem natural tenta construir sistemas sem qualquer conhecimento linguistico baseando-se na correla<;ao entre as ora<;oes fomecidas ao sistema e as probabilidades de suas ocorrencias computadas tomando-se como base imensos corpora de textos. Algumas descri<;oes de sistemas baseados em modelos estocasticos do ingles sao encontradas em rSmadja-91].

2Neste trabalho. vamos utilizar fluencia como 0 resultado da aphca<;ao efetiva de varias

(17)

No contexto descrito acima, urn dos propositos desta tese foi implementar

uma abordagem para a constru<;ao de ferramentas para a escrita baseada em casos e

revisoes, ou seja, adaptac;oes interativas. Casos codificam 0 conhecimento estatico da

estrutura e conteudo de artigos cientificos. Revisoes implementam 0 conhecimento

dimlmico, aquele que gera modificac;oes que pretendem tomar urn caso selecionado

pela ferramenta 0 mais proximo possivel da descric;ao das caracteristicas desejadas

para 0 artigo do usuario.

A abordagem utilizada esta baseada na teoria de Raciocinio Baseado em

Casos (RBC) [Hammond-90; Kolodner-92], mas difere dela pois 0 novo caso gerado

atraves da interac;ao nao e incorporado ao sistema. Esta simplificac;ao tern sew"

beneficios nesta nossa tarefa (suporte

a

escrita) tornando a implementac;ao mais

simples, uma vez que uma grande dificuldade do RBC esta no aprendizado (isto

e,

incorporar como novo conhecimento os novos casos aprendidos). Alem isso, a

abordagem proposta se justifica pois as ferramentas projetadas atraves dela nao sao

destinadas para gerar automaticamente urn artigo que seja coerente, coeso e

adequado ao proposito e publico alvo. A ferramenta so deve fornecer suporte a escrita

de urn texto inicial que, muito provavelmente, deve ser novamente revisado. A decisao

final sobre a qualidade do texto esta nas maos do usuario. Neste ponto, uma

ferramenta de suporte difere da abordagem de criticas para ferramentas, ou seja, dos

sistemas baseados em critic as [Fischer-91; Silverman-92; Rankin-93]. Critic as sao

sistemas que trabalham em cooperac;ao com humanos para resolver algum problema,

sendo que 0 papel destes sistemas e apresentar uma opiniao/critica, nao

necessariamente negativa, sobre 0 produto ou ac;ao gerada pelo humano que esta

interagindo. Estas diferenc;as entre as duas abordagens de interac;ao usuario-sistema

sao comentadas no Capitulo 5.

A metodologia utilizada pode ser dividida em 3 fases. A primeira fase

compreende a analise de corpus de introduc;oes para levantar 0 conhecimento lexico,

sintatico e retorico necessario para representar 0 conhecimento estatico do sistema

(casos) e verificar as revisoes possiveis e restric;oes de aplicac;oes para elas (Capitulo

3). A analise de corpus foi realizada em cinquenta e quatro artigos de Fisica

experimental sendo que 0 unico criterio empregado na selecao das introduc;oes foi 0

fato dos autores serem nativos do Ingles. Nao se pode garantir que todos os textos

tenham uma boa qualidade, mesmo tendo sido escritos por nativos e sido publicados

(18)

seria incluida a variavel de urn julgamento subjetivo, e a amostra poderia estar

viciada, ja que seria dada prioridade aos estilos prediletos do(s) inspetor(es). De

qualquer forma, sendo tornado urn grande numero de introdu<;6es para fazer parte da base de casos, possiveis flutua<;6es na qualidade dos textos sao minimizadas.

A segunda fase, implementa<;ao da ferramenta (Capitulo 6), materializa 0

modelo para a constru<;ao de ferramentas para a escrita proposto pela abordagem

(Capitulo 5). Uma vasta revisao da literatura foi realizada para justificar as escolhas

para a representa<;ao do conhecimento a ser utilizada nos varios m6dulos de recursos

do modelo. Esta revisao

e

apresentada no Capitulo 4. A interface da ferramenta e urn

ponto critico para 0 sucesso do modelo, pois ela torna disponivel para 0 usuario todo 0

conhecimento do sistema nesta tarefa intensiva que e a da escrita. Desta forma, a

interface e considerada tambem como urn dos recursos no modelo proposto.

Finalmente, 0 modelo subjacente e a ferramenta devem ser criticados. As

limita<;6es do modelo relacionadas a tarefas de auxilio

a

escrita nao suportadas sao

comentadas no Capitulo 5. Esta tese, entretanto, nao cobre a avalia<;ao da

Ferramenta de Suporte com usuarios reais, pois a fase de adapta<;6es da ferramenta

esta somente projetada e testes deste tipo requerem instrumentaliza<;ao da

ferramenta para guardar as a<;6esrealizadas e /o u tecnicas de psicologia experimental

para manter 0 registro da intera<;ao para posterior analise. Alem disso, 0 produto da

escrita (textos) deve tambem ser avaliado. Esta ultima fase exige trabalho intenso e

(19)

Capitulo 2

(20)

urante a ultima decada, foram desenvolvidas varias ferramentas de software para a escrita. Muito mais sofisticadas que os primeiros editores

e formatadores de textos que datam dos primeiros ambientes

computacionais, essas ferramentas podem ser classificadas de acordo com

diferentes criterios. Por exemplo, com relac;ao ao grupo de usuarios a que sao

destinadas (escritores academicos, editores, secretarias, estudantes); com relac;ao ao

uso (para melhorar varios aspectos de urn texto, para escrever urn texto que segue

uma especificac;ao, para aprender como se escreve urn tipo de texto); com relac;ao

a

tarefa a que sao destinadas (auxilio

a

escrita ou ensino da escrita); ao tipo de textos a

que servem (comerciais, academicos, instrucionais) ou a qual estagio do processo da

escrita sao adequadas. Esta ultima faceta e geralmente adotada como base para a

classificac;ao, uma vez que a escrita

e

uma tarefa sobre a qual atuam

simultaneamente varios tipos de restric;oes, que diferem de acordo com tres grandes

fases: de gerac;ao e organizac;ao de ideias, de transformac;ao das ideias em trechos de

texto continuos e de acabamento, ou seja, de polimento levando a urn texto

melhorado. A classificac;ao segundo 0 estagio do processo de escrita resulta em tres

classes de ferramentas:

• Ferramentas de Pre-processamento do texto, que fornecem ajuda para a fase

de gerac;ao de ideias e compreendem os editores graficos de redes de notas, os

editores graficos de estrutura em forma de arvore e os outliners textuais que

permitem expandir ou esconder os diferentes niveis de organizac;ao de urn texto;

• Ambientes para a Escrita, que compreendem urn conjunto de ferramentas

destinadas a dar suporte a uma grande parte do processo de escrita (geralmente,

da fase de gerac;ao e agrupamento de ideias ate a composic;ao de urn texto

continuo), ou a todo 0 processo. Combinam, geralmente, urn editor grafico para as

notas/ideias, urn editor de estruturas e urn editor de textos em urn unico ambiente;

e

• Ferramentas para Pos-processamento do texto, que sao destinadas a

melhorar a qualidade do texto e compreendem ferramentas para checagem de

estilo, corretores ortograficos e gramaticais, ferramentas estatisticas e corretores

(21)

Os ambientes estao, geralmente, baseados em urn modelo cognitivo do

processo de escrita, sendo 0 modelo de Flower e Hayes [Hayes-80] 0 mais utilizado.

Varios outros pesquisadores, por exemplo [Kintsch-78; Matsuhashi-81; Meyer-75;

Collins-80 e Bruce-78], estudaram os processos cognitivos dp. escritores P.

influenciaram fortemente 0 projeto de ferramentas para a escrita, e tambem

colaboraram para urn maior entendimento dos processos mentais envolvidos na

escrita.

N a pr6xima sec;ao apresentamos dois estudos e seus modelos do processo de

escrita: os estudos de Bruce et alli. [Bruce-78] em busca de uma teoria mais

abrangente da escrita1; e 0 modelo formal de Flower e Hayes [Hayes-80]. Na Sec;ao 2.2

comentamos alguns ambientes e ferramentas para a escrita descritos na literatura.

Apresentamos a seguir (Sec;ao 2.3) alguns problemas de nao nativos escrevendo em

ingles que motivaram 0 projeto da Ferramenta de Referencia (R eference T ool), que {~

apresentada na sequencia (Sec;ao 2.4). Esta ferramenta serviu para confirmar a

utilidade da estrategia de escrita baseada em textos reutilizaveis para auxiliar a

escrita em uma lingua estrangeira. A analise dos problemas de escrita que ela nao

consegue minimizar nos levou a projetar a Ferramenta de Suporte (Support T ool). 0

projeto desta ultima ferramenta exigiu urn estudo mais aprofundado da ret6rica de

artigos cientificos. Este estudo e apresentado no Capitulo 3, sendo os Capitulo 4, 5 e (;

responsaveis por apresentar os principios da abordagem adotada para 0 projeto de

ferramentas de suporte, 0 seu modelo generico, e os detalhes da implementac;ao dE~

uma ferramenta prot6tipo, respectivamente.

2 .1 M o d e lo s C o g n itiv o s

d o P ro c e s s o d e E s c rita

Os estudos sabre os modelos cognitivos do processo de escrita fornecem

explicac;oes para os problemas do bloqueio inicial do escritor diante de uma folha em branco ou de uma tela vazia; mostram as razoes para a diferenc;a de desempenho na escrita entre escritores experientes e iniciantes; e fornecem uma descric;ao sistematica

dos processos cognitivos e das estrategias utilizadas por escritores para gerenciar

(22)

2 .1 .1 0 M o d e lo d e B ru c e , C o llin s , R u b in e G e n tn e r [B ru c e -7 8 ]

o

trabalho de Bruce et alii. [Bruce-78], explora 0 processo de escrita a partir

de varias perspectivas. A primeira perspectiva concebe a escrita como urn ato

comunicativo no qual 0 leitor/audi€mcia tern urn papel importante; a segunda coloca a

escrita no contexto de uma taxonomia de atos comunicativos e analisa as diferencas entre ler e conversar, ou dar aulas, etc.; escrever uma estoria ou urn artigo. A terceira

e de especial interesse para 0 projeto de ambientes para a escrita, pois descreve a

escrita como urn processo que pode ser decomposto em dois grandes subprocessos:

geracao e manipulacao de ideias, e producao de texto para os diferentes niveIs

estruturais (texto, paragrafo, oracao e palavra).

Embora os processos que criam ideias e estruturas possam ocorrer

simultaneamente e interativamnte, os autores os colocam como passos separados de

urn procedimento para facilitar 0 entendimento destes processos. Assim, tal

procedimento deve criar urn texto que satisfaz restricoes vindas de tres fontes: da

estru tu ra (quais sao as boas form as para oracoes, para os paragrafos e para 0 texto

como urn to do), do co n teu d o (quais ideias devem ser utilizadas e como elas estao

relacionadas) e p ro p o sito (quais sao os objetivos a que se destina a escrita equal 0

modelo de usuario). A analise do processo pelo qual urn trecho de texto e construido

e

mostrada esquematicamente na Figura 2.1.

l

Restricoes de Conteudo

J

l

Restriyoes deProposito Descobrir Ideias

produZir-{

Ideias . "

Mampular Idelas

Produzir

Estrutura Panigrafos

Orayoes

Palavras

Os autores consideram a producao de ideias e producao de texto como

(23)

sequencia linear de palavras, 0 resultado da prodw;ao de ideias e urn conjunto de

ideias com viuias rela<;oes entre si. Alem disso, agrupar os dois pode trazer as

restri<;oes impostas

a

manipula<;ao de texto para urn estagio em que as ideias ainda

nao estao prontas. Nesse caso, dois resultados podern acontecer: 0 escritor gastar

tempo polindo urn texto que poden} eventualmente ser descartado e, talvez pior, pode

ser que 0 esfor<;o em polir 0 texto fa<;a com que 0 escritor se esque<;a do conteudo e

proposito.

2 .1 .2 0 M o d e lo d e F lo w e r e H a y e s [H a y e s -8 0 l

Flower e Hayes [Hayes-80] tambern analisaram 0 processo de escrita a partir

de varias perspectivas. Descrevern que 0 processo de escrita e (a) dirigido por

objetivos - autores iniciarn com urn proposito geral que se refina em subrnetas; (b)

destinado a satisfazer varias restri<;oes: 0 texto final deve integrar 0 conhecimento

sobre 0 assunto, estar gramaticalrnente correto e ser destinado a urn dado proposito; e

(c) urn processo que continuamente transforma a informa<;ao de uma representa<;ao

if

outra, partindo geralmente de trechos de informa<;oes, cita<;oes e notas, ate alcan<;ar

urn texto continuo e revisado.

0

diagrama de blocos do modelo e mostrado na Figura

2.2.

AMBIENTE DA TAREFA

Tarefa cia Escrita Texto

Topico

Audiencia Produzido

Proposito

P anejamento Tradu~o Revisao

Memoria do Escritor

~Organiza~O

I

Conhecimento do Topico

~

HGera9ao

I

--I

Conhecimento da Audiencia

~Criar Metas

I

Editar

Esquemas de Textos

I

I

I

MONITOR

(24)

o

diagrama mostra tres gran des componentes: 0 ambiente da tarefa, que

compreende fatores externos ao escritor; a memoria do escritor; e 0 monitor, 0proprio

escritor dirigindo seus processos cognitivos. 0 monitor dirige tres tipos de processos:

planejamento, tradu<;ao e revisao. 0 p la n eja m en to consiste das suboperac6es para

recuperar informac6es para a tarefa da escrita (geracao); para organizar as

informac6es mais apropriadas (organizacao); e criacao de metas para guiar a escrita

(criar metas). A tradu~ao toma informac6es da memoria e as transform a em orac6es

coerentes. Por ultimo, 0 processo de rev isa o melhora a qualidade do texto escrito

atraves de leitura e edicao. As tres operac6es, entretanto, nao ocorrem ciclicamente na

ordem planejar - traduzir - revisar, e sim respeitando uma hierarquia em que as

operac6es de edicao e geracao, tendo mais alta prioridade, podem interromper outros

processos. Dessa forma, 0 processo de traducao pode ser interrompido para a operacao

de revisao ou geracao de novas ideias.

2 .1 .3 A lg u m a s C o n c lu s o e s S o b re 0 P ro c e s s o d e E s c rita

As conclus6es dos dois estudos sobre 0processo de escrita sao, geralmente, as

mesmas:

• que tentar satisfazer todas as restric;6es impostas

a

escrita ao mesmo tempo pode

gerar urn bloqueio mental;

• que os escritores experientes conseguem urn desempenho maior na escrita, pois

dominam as estrategias especificas de cada fase e ignoram as restric6es de outras

fases quando se concentram em uma particular;

• que a escrita pode ser melhor descrita como urn processo ciclico que alterna a

geracao e organizacao de ideias (planejam ento), transformac;ao de notas/ideias em

texto continuo (tradur;do) e leitura e edicao de rascunhos (revisdo) que novarnente

alimenta 0 ciclo, pois novas ideias aparecem, pIanos sao reescritos e 0 rascunho

revisado, com as operac6es de edicao e geracao tendo rnais alta prioridade; e

• que escritores experientes desenvolvern uma estrutura de metas rnais elaborada

que os iniciantes. Por exemplo, se a meta inicial e publicar urn artigo em urna

revista, 0escritor pode gerar uma subrneta para a revisao da literatura enfatizando

a necessidade de urn estudo particular e uma sub submeta que aponta as falhas de

(25)

Existem, entretanto, algumas criticas com rela<;ao aos modelos,

principalmente ao mais conhecido deles, 0 modelo de Flower e Hayes [Hayes·80]. Elas

sao apresentadas abaixo.

Smith e Lansman [Smith·88] consideram 0 metodo de grava<;ao da

verbaliza<;ao dos processos mentais ( th in k - a lo u d p r o to c o f) , utilizado para a

explicita<;ao das atividades mentais de escritores, sujeito a certas deficiencias. 0

problema e que nem sempre escritores tern consciencia dos processos e estrategias de

escrita que eles utilizaram e, tambem, pedir que urn escritor fa Ie de seus pensamentos

na tarefa de escrita pode mudar 0 proprio processo. Entretanto, [Smith·88] admite

que a analise desses protocolos ajudou a entender como escritores trabalham. A critica

mais severa, todavia, foi com rela<;ao

it

verifica<;ao do modelo formal. Flower e Hayes

testaram 0 modelo com apenas urn unico sujeito. Para estudar as estrategias

cognitivas de escritores, e tambem para refinar 0 ambiente WE tomando-se como base

resultados empiricos, 0 T extL ab na Universidade da Carolina do Norte, encabe<;ado

por J. Smith, desenvolveu ferramentas para analise de protocolo automatizadas

[Smith-91; Walker-91]. Estas ferramentas automatizadas procuram superar as

deficiencias dos metodos tradicionais para analise do processo de escrita, dentre os

quais 0 utilizado por Flower e Hayes.

Sharples e Pemberton [Sharples-88] comentam a falta de especifica<;ao com

rela<;ao

it

natureza das representa<;5es do texto em cada estagio de sua constru<;ao e

lembram que 0 modelo de Flower e Hayes nao leva em considera<;ao as caracteristicas

dos tipos diferentes de meios de escrita (papel, computador, notas, etc.) e como estes

meios afetam a pratica da escrita. Para superar essas duas falhas, apresentam urn

modelo estendido que considera as tecnicas para gerar as varias representa<;5es do

texto durante 0 processo de escrita e indicam as rela<;5es entre as tecnicas e 0 meio

utilizado para a escrita.

Os modelos dos processos de escrita tambem nao incluem a situa<;ao de urn

escritor escrevendo em uma lingua nao nativa. Entretanto, eles ajudam a

compreender 0 processo geral de escrita e a pressupor quais as necessidades extras

desse tipo de escritor. Embora 0 ingles seja uma lingua internacional para a

comunica<;ao de trabalhos cientificos, ela nao e a lingua nativa nem a segunda lingua

(26)

essa situa<;ao especifica, isto e, a da escrita de artigos cientificos em ingles como uma

lingua estrangeira:

• existe a situa<;ao na qual urn escritor, embora sendo proficiente ou

quase-proficiente no mgles, sofre influencias de sua lingua materna; e

• a estrutura linguistica do ingles de artigos cientificos e bastante convencional e

nao compartilhar destas conven<;oes pode dificultar a publica<;ao de trabalhos de

pesqmsa.

2 .2 F e rra m e n ta s e A m b ie n te s p a ra a E s c rita

As ferramentas para p6s-processamento de texto sao as mais investigadas e

disseminadas. Comumente sao destinadas

a

lingua inglesa, sendo que varias delas

estao disponiveis comercialmente em processadores de texto como e 0 caso do

Grammatik [Reference Software-92] e Correct Grammar [Writing Tools-91]. Ja para a

plataforma Unix, temos 0 Writer's Workbench [Cherry-82; MacDonald-82], urn

conjunto de ferramentas que segue a filosofia "picll-and-choose" desse sistema

operacional. Existe tambem a versao do Grammatik para 0 frances, e esta sendo

implementado para 0 portugues 0 corretor gramatical de urn pacote de ferramentas

que inclui estatisticas sobre 0 texto (incluindo grau de legibilidade), regras para

corre<;ao de estilo e de erros mecanicos. Este pacote de ferramentas faz parte de urn

projeto conjunto entre empresa (ltautec/Philco) e universidade (USP-Campus Sao

Carlos) e foi incorporado ao processador de texto Redator Windows.

Outros exemplos de ferramentas de p6s-processamento encontram-se listados

na Tabela 1.1 que aparece no fim desta se<;ao. Estas ferramentas ofere cern

informa<;oes estatisticas como0 numero e tarnanho medio de paragrafos, senten<;as e

palavras do texto, e estatisticas que avaliam 0 grau de legibilidade do texto (Figura

2.3). Ofere cern, tambem, regras para corrigir a ortografia; a gramatica (Figura 2.4);

para adequar 0 estilo do texto a urn certo padrao geral (texto comercial, cientifico,

jornalistico), ou a urn padrao especiflco de uma companhia ou editora como faz 0

(27)

Readability Summary 15 paragraphs .••8 sentences 121 words 1118 syllables average averaqe average average

3.2 sentences each 15.0 words each

5.2 letters each 1.55 syllables per word

0 passive sentences

o

"of total

0 long sentences

o

"of total

0 misspelled words 100 " correct

0 other errors corrected 100 " correct

0 sentences hard to read 100 " correct

Flesch Readinq Ease score Grade level required

" U.S. adults who understand Flesch-Kincaid grade level Gunning Fog index

60.4 Easy 9.0

89 8.6 9.9

Figura 2.3: Tela do Correct Grammar mostrando 0 resumo da estatistica para urn

dado texto

Correct Grammar - C:\CORRGRAM\TOUR.CGD .•. •

Readability ~tyle .Qptions Help

Subject Verb Agreement

Consider 'That' instead of 'Those' and consider 'shipment' instead of 'shipments'. or consider 'drip' instead of 'drips' and consider 'meh' instead of 'melts'.

Tutorial

1st person singular I am I like

2nd person singular you are you like

3rd person singularhe/she/it is he/she/it likes

1 st person plural we are 2nd person plural you are

we like you like

situation in our hands.

I I • I all the time. The two shipments you sent us

some time ago has not yet arrived. we have waited for there delivery since January. 1991. At this point in time. we are getting impatient about the service we receive from your company.

(28)

A<; regras de estilo sao utilizadas para verificar 0 usa de voz passiva, jargao,

ora<;oes longas, expressoes redundantes, variedade das expressoes iniciais das ora<;oes

e outras. Geralmente a interface dessas ferramentas permite ao uSUllrio selecionar

quais regras devem ou nao ser aplicadas

a

revisao do texto.

E

essa combina<;ao de

regras que recebe 0 nome de estilo. 0 Grammatik possui dez estilos pre-definidos, 0

Correct Grammar nove, sendo que 0 usuario pode criar novos estilos atraves de novas

combina<;oes de regras. As Figuras 2.5 e 2.6 mostram, respectivamente, a interface do

Grammatik para a sele<;ao das regras de estilo e 0 funcionamento de uma checagem.

Tanto 0 Correct Grammar como0 Grammatik apresentam help on line que permite ao

usuario esclarecer duvidas, principalmente para erros em que 0 program a nao

apresenta sugestoes para a corre<;ao.

••••• Grammatilc 5

file Edit Checking Preferences Statistics Help

Writing Style Settings

Rule Classes: @

l$.if.I~j

[8J

Abbreviation

[8J

Archaic

[8J

Cliche

[8J

Coloquial

[8J

Commonly Confused

o

Custom Rule Class 1

o

Custom Rule Class 2

o

Custom Rule Class 3

[8J

End of Sentence Prepoution

[8J

Foreign

[8J

Formalisms

[8J

Gender Specific

[8J

Jargon

Writing style: Report

o

Grammar

0

Mechanical

[8J

long Sentence

[gJ

0 Y8fstated

[gI Paragraph Problem

[gJ

Passive Voice

[gJ

Peioratiye

[gIQuestionable Usage

[gIRedundant

[gJ

Second-PersOl'l Address

[gJ

Sentence Variety

[gJ

Split InfinitiYe

[gJ

Trademark

[gJ

Vague Adverb

[gIWordy

I

Cancell

I

H~

1

~ Consecutive nouns ~ Pasuye sentences (of last 10)

~ Consecutive prepositional phrases ~ Spell numbers below or equal to

~ long sentence length

@]

Words allowed in split infinitive

Embora as ferramentas de pos-processamento possam ser utilizadas para

ajudar escritores nativos e nao nativos de uma lingua, e sao uteisl.em varios aspectos, elas nao resolvem uma dificuldade comum a muitos escritores nao nativos: a produ<;ao

do primeiro rascunho. Na Se<;ao 2.3 veremos nossa primeira abordagem para esse

(29)

••••• Grammatik 5 - C:\GMKW\TOUR.DOC

Eile .Edit Stop ~hecking E!references Help

Clinton, Kentucky 02145.

Dear Ms. Gregg:.

Thank you for giving Joan and Be the opportunity to submit the attached proposal. It is always a pleasure doing business with Ted .•

Quallty and excellence are reflected in every office facility that we design. Already this year we have won three awards. We pride ourselves on our ability to deliver well-engineered designs within budget

constraints. We have yet to Biss a deadline in our Bany years of operation, our ten-year anniversary was celebrated last year. We are

faBiliar with your staff's needs we worked with you two years ago on the cafeteria project.

Check: due lo lhe lectthal

Advice: This long phrase can usuaD, be replaced with 'because'.

I I __

a-

I

[.lUMMi-I

I

Ignore. f t r t . I ~ .

1

'---Replace J

RmeplecelNe&l )

I

fk~(~~;'!!!e=

I

Das ferramentas de pre-processamento, os outliners textuais tambem esUio

disponiveis em varios processadores de texto e, embora simples, sao poderosas

ferramentas que ajudam urn escritor a encontrar rela<;6es hierarquicas coerentes

entre os topicos discutidos em urn texto. A Figura 2.7 mostra a estrutura, em tres

niveis de refinamento, gerada para este capitulo pelo outline do Microsoft Word 6.0.

(30)

Capitulo 2 - Computadores e Escrita

2.1MODELOS COGNITIVOS DO PROCESSO DE ESCRIT A

2.1.1 0 M odelo de B ruce, C ollins, R ubin e G entner [B ruce-78]

2.1.20 M odelo de F low er e H ayes [H ayes-80]

2.1.3A lgum as C onclusoes Sobre 0P rocesso de E scri ta

2.2FERRAMENT AS E AMBIENTES PARA A ESCRIT A

2.2.1 W E : U m A m biente M ultim odal para a E scrita

2.2.2 W riter's A ssistant: A fovim ento F acil entre as V isoes de um

T exto

2.2.3A m bientes que R eutilizam T extos

2.3 ESCRIT A EM INGLES COMO LiNGUA ESTRANGEIRA

2.3.1 A lguns E rros C om etidos por E studantes B rasileiros na

E scrita em Ingles

2.3.2 U m R ecurso de A juda T ecnica para a E scrita em Ingles

2.4 0 AMBIENfE AMADEUS

2.4.1 A F erram enta de R eferencia

2.5 SUMARIO

Os ambientes, entretanto, san mais completos, pois fornecem urn conjunto de

ferramentas integradas que gerenciam 0processo de escrita de urn documento desde a

fase de gerac;ao e organizac;ao de ideias ate a transformac;ao destas ideias em urn texto continuo. Sao graficamente orientados, ja que as ideias sendo geradas san de natureza

diversa de urn texto continuo, sendo melhor representadas como uma rede de notas.

Posteriormente, essa rede pode ser linearizada tomando-se como base tanto as

relac;6es entre os nos como a qual parte da estrutura do texto estao associadas (cf.

[Sharples-94] para uma comparac;ao de algoritmos de linearizac;ao de uma rede de nos

padrao hipertexto). as ambientes mais discutidos na literatura san 0 WE [Smith-8G;

Smith-88], 0 Writer's Assistant [Sharples-89; Sharples-90; Sharples·94] e SEPIA

[Streitz-90]. as dois primeiros san apresentados abaixo. Na Sec;ao 2.2.3, comentamos

ambientes que reutilizam textos, uma das caracteristicas tambem utilizadas na

(31)

A s decisoes de projeto de WE enfatizaram a construcao de urn ambiente que

simulasse os processos cognitivos utilizados por escritores. WE tern como base 0

modelo para a escrita de Flower e Hayes [Hayes-80]. A primeira decisao de projeto foi

fazer urn sistema dividido em quatro modos de operacoes, sendo que cada modo

somente permite as funcoes apropriadas ao modo cognitivo associado. Isto diminui a

sobrecarga cognitiva que teria urn usuario tentando satisfazer todas as restricoes da

escrita ao mesmo tempo.

Os quatro modos sao representados por quatro janelas diferentes e sao

rotulados como: rede, arvore, editor e texto, correspondendo ao modo exploratorio de ideias, organizacional, de escrita e edicao do modelo de Flower e Hayes. A Figura 2.8a

mostra uma parte de uma rede de ideias, a sua organizacao hierarquica no modo

arvore e urn no da arvore sendo editado. Nessa figura, 0 usuario ainda nao ativou 0

modo texto e dessa forma ele se encontra vazio. as usuarios podem se movimentar na arvore, operacao esta que carrega os rotulos e blocos de texto associados com os varios nos para dentro de tres areas da janela do modo texto. Rolando a tela de dois nos

adjacentes, uma para 0 fim e outra para 0 comeco, permite ao usuario verificar a

(32)

W riting (n.""'.,.e •• ptYW 8

Iw••.•.

ap.c~

""'.nt ANa.

I:Y'UM

.

2 M.re" 'ge~

N[TWOIIK MODE: N.t a IVlew Conuol 1Ol.p1.Y/Print TEXT MODE IVI.w COntrol IDlsplay,Pm,

,.;~~

I

I:Guid.N •••• 'or

I

I

Ott.nlutlon

I

I

Writ ••••

I

ftr.ctl ••

•..•...

__

..._

..

~

TilE! MOD!: Tre.a

IVlew Control 100,pl.y/Prtnt

~ I'" ow io

=

~~1

I""!

--·1

••• JllaMiftg I

Co••••t •••

.••••,.arcn ~ t •••• I EDIT MODE Eelltor IVle. Conerol Iolsp,.y/Pnnt

'""

rfx •••••.··101 E"'tor MocMI, ShOwn in the ~wer "tht qua.ant ot Plgun i.

pro ••• ., a Itanda" u .•t ••••tor tor •• "ancdng tl'1&concept ,..,,..,.nuCl

1fSl·•••·1onI by • ftOde ••.•to pnI,e. Thu,_ It ,uppons eM c09ftid.e P"VC." ot

IIngui.tic .neodlnt). Tne wn ••.•• Cllat. ,roClUet, ot cou"., Is • ~Ioc" ot

Fognlti¥·ltf'VanI ••• u.e that I, a,toe"te. wit" a pa"icula, ••••. Th. unde"yin, lylte.

niles a,.. tMS. tor a •••• ., '..-ne. ot cftaract." _WId •• intO wOrds,

~ri"'" ~

..

""-', pa,a9,a""" etc. In fUt•.•.••• ten,kIn, 0' W E, the ,yne ••• '""

'..",on ••••ton tor oeMr tinct, of .ata, ,ue" a ••. aphle', ,ound. and

lilt •••• .IClIIO.

!=OVnltlv. I-•• 10 ••••t_ ••• r/Sy •••• tII•••

..,Ilcatlo ~ .xt

~

I tII... I

A divisao em modo rede e arvore permite que, em urn prlmeiro momento, se

consiga flexibilidade e liberdade na geracao de i(U~ias. No modo arvore, algumas

restric6es nas relac6es entre ideias sac colocadas para se garantir coerencia. Embora

separados, os dois modos estao relacionados e

e

permitido mover nos e estruturas da

rede para 0 modo arvore. No modo editor, os nos sao editados gerando pequenas notas

de textos para as ideias. No modo texto, 0 usuario atravessa a arvore e 0 conteudo dos

nos vai sendo mostrado na janela de edicao. A ideia

e

fornecer ajuda para que 0

escritor cheque se existe coerencia entre dois nos adjacentes. Nesse ultimo modo, as

operac6es normais de edicao tambem sao permitidas. Veremos no Writer's Assistant

uma opcao automatizada desse processo de linearizacao de nos.

o

ambiente WE foi utilizado para construir urn prototipo para 0 ambiente

SEPIA (Structured Elicitation and Processing of Ideas for Authoring), urn sistema de

(33)

[Schuler-90] estende 0 conceito de modos do ambiente WE oferecendo modos de escrita

especiais que podem ser usados para criar urn hiperdocumento. AAA fornece cinco

atividades do processo de escrita de textos argumentativos em diferentes modos de

operal;ao: modo argumental;ao, retorico, arvore, texto e edil;ao. Os modos

argumental;ao e retorico substituem 0 modo rede de WE. Estes dois novos modos

propiciam a crial;ao de redes especializadas com nos do tipo topicos (issues), posil;oes

(positions), argumentos (argum ents) e fatos (facts) e ligal;oes do tipo

serve(issueA ,issueB ), substitui(issueA , issueB ) , suporta(positionA ,argum entB ), e outros.

W riting Envlron",.nt e"'Pty W 8 Iwon. Spac:.

t-

Int ••••••• I:)"..:·'" 2M a r1 :h ,eee

NETW O RK M O DE: N e t & Ivl •• Control IOlspl.y/Print TEXT MOOr Ivla.Cont"" IO bpl&y/Pr1nt

~u."'u••

I

T,..

_

..

·

T,... -.oaa, w tW cl\.pp.an k\ th. ~w.,.teft quadrant 0' Figun 6.

I

O~.nI.ulon

I I

Writing

I

p ro v id e , a n e n ftro n n M ln tt ••••.• d to th e o rg a n 'za tio n a l M G C le .

I~GUld'lin •• tor

1

Erractive •...__..

_-_

..

;]

Editor

·

Editor M O H , snow n W tithe tow er l'itn tquadrant at Figure Ii, provide ••. standard text .dltot' tor exp& ncU"g tlM concept "'pre,.nud by •. nod. Into pra.L Thus, It .up,oru the cogN t". process ot •••.••• nlc arc"'" The Interwtedla'& product, at course, Is •. block 0' text that Is associated w tth •. panicular node. The uncIar1ying .yn ••

"".t .,.. tho •• tor •. ""ar sequence ., charact.n dhrIdaa iruo wonI~

hs, p& r••.• ph., ate. anIY t •••.•axten"', of W f, the 'Y lte. wUJ

...

-

....•

.,-

.""

Text

1ftot

I

·

Text M oO ti, ,hO w n 6ft t •.•• upper len quadrant 0' figure, 6 and 10.

loun." ray" •• -.

L__

pro¥kI., an.~t tor editing u •• docu-.nt.

:J

fuid_'I~

·nnlnv

~gnh:l¥.

~.s••rc"'1 -rritlnt I E O fT M O O f S ltu a tto n & l A n a ly s is 'V la . C o n tru l ~ISPI.Y/Print

~

fPltuulon I IjCognltl •••I

"""''''1

ritlnt Io;:;;;;;u dltlnt ~ Con.tOne

pgnltlva

xp •.• "lo •• 'w•••.

---,

..

!Sy"••

dI•••. Iftpllculo1- •••

~

I dlt ••.

A Figura 2.9 mostra urn screendum p da interface do AAA, no qual 0 modo

(34)

,. A I". •.•eN t U ft"'_ .,. 1~ , •••1 M " I" .•••.• 1 1 I\1

••••••• II ...,. ••••• 'D\I.t •••••• 1M •••• t "t •• ".. •••••••

• • • • • • • • •., • • N d f t • • •,'-• • •nu'" .• ...,.f " " •.••

.H N l.,.', ••••••••••• .,..._ ••....".

• ()tir.-n.,.it ••••• ..., •• _ .r ,c••• r-. ,••,.•.

CIlil.- •••••••••• .,.fttfl' .,. ••••••. Ilea. ••••. "" •••.

&'INC IlN M " \" " " •• ,," I'" ~ •••••••• " I t ti'

,"" •••••••••.. AI•••••••••••••• , ••_ illIII~ ••••"' •

••.•••• •••, " ••• "'" C M l-. tY t*tt. '" III"" """"' .•.'" ftM

'" •••.•••••.•••••• .-eetI ••••• 1 ., tllJIthI.

-...c •..

2 .2 .2 W rite r's A s s is ta n t: M o v im e n to F a c il e n tre a s V is o e s d e u m

T e x to

o

Writer's Assistant

e

urn sistema prot6tipo que combina urn organizador de ideias, urn editor de estruturas e urn editor de textos, permitindo que facilmente se

mova de uma ferramenta a outra. Cada ferramenta consiste em urn modo de operacao

que fornece uma determinada visao do documento: visao de rede, visao de estrutura e

visao linear, respectivamente.

o

escritor pode editar notas e ligar seus r6tulos para formar uma rede de

(35)

2.10. Nesta figura, uma parte da rede e ligada ao corpo do documento e outra ao fim

do documento. 0 algoritmo linearizador automaticamente lineariza a rede, seguindo a

prioridade dos tipos de liga<;6esentre os nos, prioridade esta que (hfere para cada tipo

de texto. Respeita tambem 0posicionamento de partes da rede a uma ou outra posi<;ao

do documento atraves de um tipo especial de liga<;ao:liga<;aocom a estrutura do texto.

Desta forma, 0 editor de estruturas, que ajuda 0 escritor a criar seu documento

conforme 0tipo de texto escolhido, fica estreitamente ligado ao editor de ideias.

:::::::;::::::::::::::::,

:;;:::::::::::::::::::::,

::;;;:::::::::::::::::::1

~~~~;j~~H~~~~:~j~~j~~:j:

::::::::::::::::::;:::::, gg!mmmmm;~~~: ::::::::::::::::::::::::, :;::;::::::;;::;;:::::;:1 ::::::::::;;::::::::::::1 ::;:::::::::::::::::::::, ::::::::::;::::::;::::::, ::;;;:;::;::;;::::;;:;::, ::::::::::::::::::::::::.

~))1i!~!!~!i~ !if!!~j!~;;:

::::::::::::::::::::::::, ~;~~;~r;~~~i~~~~~;;~~~;:

!,!",!~llt,,'

111!11·1111!111!!I!!!!!il

.11!!I!lll!I!I!!II!II!'il

~~~~i~i'::ft···

...,.~."'.,~,..,~"..

..=~----~

llh ln k -U U - h u m a n .)

\

II

-" II.

d rvriIc. ..-u ...•.

(n.n_"u"~-WOY'f--II~

--~

,II

-

II

-r

••

-o

Writer's Assistant fornece ajuda para a edi<;ao de cartas, relatorios tecnicos

e alguns documentos padr6es de empresas. Para relatorios tecnicos, por exemplo, sao

apresentadas ao escritor as partes tradicionais desse tipo de texto: titulo, nome(s)

do(s) autor(es), resumo, introdu<;ao e outras. 0 escritor muda de uma visao a outra

rapidamente, por exemplo, primeiro criando um outline nao muito detalhado no editor

Imagem

Figura 2.3: Tela do Correct Grammar mostrando 0 resumo da estatistica para urn dado texto
Figura 2.13: Composicao de artigos. Esta figura mostra parte da sUbcategoriza9ao do componente Introdu9ao que foi ativado para trazer, na janela intitulada S e n te n c e s B a s e ,
Figura 2.14: Personalizacao da ferramenta. Esta figura mostra uma operayao de ligayao do padrao F o r e x a m p le , th e fe a s ib ility o f ..
Figura 6.10 apresenta uma tela com as instruc;6es para seu usa, isto e, para ativar a lista de casos recuperados
+2

Referências

Documentos relacionados

da quem praticasse tais assaltos às igrejas e mosteiros ou outros bens da Igreja, 29 medida que foi igualmente ineficaz, como decorre das deliberações tomadas por D. João I, quan-

5.2 Importante, então, salientar que a Egrégia Comissão Disciplinar, por maioria, considerou pela aplicação de penalidade disciplinar em desfavor do supramencionado Chefe

Assim sendo, a. tendência assumida pela pós - graduação em co- municação nos anos 60 contribuiu muito menos para melhorar e.. Ora, a comunicação de massa , após a Segunda Guerra

Em estudos mais aprofundados, tem-se a análise dinâmica não linear geométrica de estruturas laminadas modeladas com elementos tridimensionais de barra considerando o efeito

Um dos FH permanece na sala de trabalho, onde realiza várias tarefas: a validação das prescrições médicas informatizadas e manuais; a impressão dos mapas de

6 Num regime monárquico e de desigualdade social, sem partidos políticos, uma carta outor- gada pelo rei nada tinha realmente com o povo, considerado como o conjunto de

Os testes de desequilíbrio de resistência DC dentro de um par e de desequilíbrio de resistência DC entre pares se tornarão uma preocupação ainda maior à medida que mais