• Nenhum resultado encontrado

Projeto de um verificador ortográfico para a língua portuguesa.

N/A
N/A
Protected

Academic year: 2021

Share "Projeto de um verificador ortográfico para a língua portuguesa."

Copied!
97
0
0

Texto

(1)

VERA LÚCIA COSTA DE MEDEIROS

PROJETO DE UM VERIFICADOR ORTOGRÁFICO PARA

A LÍNGUA PORTUGUESA

Dissertação a p r e s e n t a d a ao Curso de

MESTRADO EM SISTEMAS E COMPUTAÇÃO

d a U11 i v e r s i cl a d e F e d e r a 1 d a P a r a í b a ?

e w c: u M p r i M e n t o a s e ;•: i gene i a s p ar a

obténsSío do Grau de M e s t r e .

JACOUES PHILIPPE SAUVE

Or i e n t a d o r

(2)
(3)

PROJETO DE UM VERIFICADOR O R T O G R Á F I C O

PARA A L Í N G U A PORTUGUESA

MERA LÚCIA COSTA DE MEDEIROS

TESE SUBMETIDA AO CORPO DOCENTE DA C O O R D E N A Ç Ã O DO CURSO DE

POS-GRADUAÇAO EM SISTEMAS E COMPUTAÇÃO DA UNIVERSIDADE FEDERAL DA

PARAÍBA COMO PARTE DOS REQUISITOS NECESSÁRIOS PARA A OBTENÇÃO DO

GRAU DE MESTRE EM CIÊNCIAS (M.Sc.).

A p r o v a d a p o r :

SILVIO R. DE LEMOS MEIRA - Ph.D

Examinador

Examinador

-CAMPINA GRANDE

ESTADO DA PARAÍBA - BRASIL

JANEIRO - 1 9 8 8

(4)

PR CUETO DE UM VERIFICADOR O R T O G R Á F I C O

PARA A L Í N G U A PORTUGUESA

C r i a r um t e x t o com o a u x i l i o do c o m p u t a d o r t e m s e t o r n a d o

uma t a r e f a c a d a v e z m a i s comum n o s d i a s de h o j e . E s t e p r o c e s s o ?

no e n t a n t o ? a l é m de nSo i m p e d i r a o c o r r ê n c i a de e r r o s

o r t o g r á f i c o s r e s u 11 a n t e s d a i g n o r â n c i a d o a u t o r ? c o n t r i b u i r> a r a

que n o v o s e r r o s o c o r r a m ? s e n d o e s t e s d e c o r r e n t e s do p r ó p r i o

P r o c e s s o d e d i g i t a s á o d o t e x t O.

A d e t e c ç ã o d e s t e s e r r o s a t r a v é s d e v e r i f i c a ç ã o a u t o m á t i c a

pode s e r e x t r e m a m e n t e útil no p r o c e s s o de r e v i s ã o de t e x t o s ?

mesmo s a b e n d o - s e que e s t e p r o c e s s o e n v o l v e a v e r i f i c a ç ã o de

o u t r o s a s p e c t o s q u e n a o a p e n a s a o r t o g r a f i a „

E s t e t r a b a l h o t e m r e l a s á o com a v e r i f i caot^áo o r t o g r á f i c a de

t e x t os ? ma i s p r e c i s a m e n t e ? com t e x t o s e s c r i t o s na 1í n g u a

p o r t u g u e s a . 0 p r i n c i p a l o b j e t i v o do t r a b a l h o c o n s i s t e em

p r o j e t a r um v e r i f i c a d o r o r t o g r á f i c o p a r a a l í n g u a p o r t u g u e s a ? e

c r i a r um m é t o d o a u t o m á t i c o de o b t e n ç ã o e c r i a ç ã o d o d i c i o n á r i o ?

no q u a l o v e r i f i c a d o r s e b a s e i a ..

(5)

SUMARIO

1 . INTRODUCAO 2

2. PROBLEMAS B Á S I C O S NA C O N S T R U Ç Ã O

DE UM VERIFICADOR O R T O G R Á F I C O . „ . . ., 11

2.1 FormasSío e r e c o n h e c i i m e n t o de p a l a v r a 11

2.2 O b t e n ç ã o e c r i a cílio de um d i c i o n á r i o ... 13

2.3 A b r a n g e n e i a . . . . 1 5

2.4 R e p r e s e n t a c a o do d i c i o n á r i o 17

2.5 A n a l i s e do u s o de p a l a v r a s . .19

3. VERIFICADORES O R T O G R Á F I C O S EXISTENTES... ..20

3.1 V e r i f i c a d o r e s p a r a a I f n g u a i n g l e s a . . . 20

3.1.1 SPELL (DEC-10) . . . ..20

3.1.2 TYPO 2 1

3.1.3 SPELL (Uni;;) 2 1

3.2 V e r i f i c a d o r e s 0 r t o g r á f i c o s p a r a

a 1í n g u a p o r t u g u e s a 23

4. O R G A N I Z A Ç Ã O DE UM VERIFICADOR O R T O G R Á F I C O

PARA A L Í N G U A PORTUGUESA (VOLP) ..25

4.1 M é t o d o de v e r i f i c a ç ã o o r t o g r á f i c a do VOLP... ...26

4.2 I n t e r f a c e com o u s u á r i o do VOLP 29

4.3 F o r m a ç ã o e r e c o n h e c i m e n t o de p a i a v r a s . . . 30

(6)

5. ESTRUTURAS DE DADOS DO VOLP... 34

5.1 E s t r u t u r a de a r m a z e n a m e n t o do t e x t o

na m e m ó r i a . . . . . . 3 4

5.2 D i c i o n ár i o p r i nc: i p a 1 . . . - . . . 3 9

5.3 Tab e I a de s u f i x o s ... .44

5 „ 4 D i c: i o n á r i o s e c u n d a r i o . . . „ 49

5 „ 5 L i s t a de exceetíes . . . 5 2

5 .6 D i c i o n á r i o de nomes p r ó p r i o s . 53

5.7 D i c i o n á r i o p a r t i c u l a r 54

6. ALGOR ITPIQ GERAI... DO VOLP 55

6.1 P e s q u i s a no d i c i o n á r i o p r i nc i p a i 5 8

6.2 P e s q u i s a no d i c i o n á r i o s e c u n d a r i o . . . 59

ó. 3 A 1 g o r 11 mo g e r a l do VOLP 60

7. O B T E N Ç Ã O E C R I A Ç Ã O DO

D I C I O N Á R I O DO VOLP 63

7.1 Cr i a cão da b a s e de d a d o s . . .„„.,.„ .66

7.1.1 T a b e l a de r e g r a s simbólicas... ...67

7.1 „ 2 Tab e I a de r e g r as ... - 68

7.1.3 T a b e l a d e s u f i x o s 7 0

7.1.4 D i c i o n á r i o de v e r b o s r e g u l a r e s . „.,...» 70

7.1.5 D i c i o n á r i o de v e r b o s i r r e g u l a r e s . . . ...73

7.1.6 D i c i on ár i o de p a l a v r a s . 75

7.2 Cr i a cá o do d i c i o n á r i o f o n t e 7 f i

7.3 Cr i ae:ao do d i c: i o n á r i o ob j e t o 80

(7)

CONCLUSÕES

(8)

FIGURAS

4 .1 E s t r u t u r a g l o b a l d o VOLP . 30

5«1 Exemp 1 o de uma e s t r u t u r a do t i p o t r i e . . . .. . .35

5,. 2 E s t r u t u r a d e a rmaz e n a M e n t o d o t e x t o:: t r i e / á r v o r e . . . 3 6

5.3 E s t r u t u r a de nodo da á r v o r e de p e s q u i s a b i n á r i a . 37

5.4 E s t r u t u r a do d i c i o n á r i o p r i n c i p a l . . . 4 1

5.5 Tab e1 a de s u f i x o s 45

5.6 E s t r u t u r a do d i c i o n á r i o s e c u n d a r i o . . . 50

5.7 E s t r u t u r a da l i s t a de e x c e c t f e s e d o s

d i c i on ár i os p a r t i c u l a r ( e s ) e de nornes p r ó p r i o s . . . 5 2

7.1 O b t e n ç ã o e Cr i a cão de d i c i o n á r i o.... 64

7.2 T a b e l a de r e g r a s s i mból i c a s . . » - » .68

7.3 T a b e l a de r e g r a s . . , . . 6?

7 „ 4 E s t r u t u r a s d o s d i c i o n á r i o s de v e r b o s r e g u l a r e s ... 71

7.5 E s t r u t u r a s d o s d i c i o n á r i o s de v e r b o s i r r e g u l a r e s ... 74

7 . 6 D i c i o n á r i o de p a i a v r a s 75

7 .7 E s t r u t u r a do d i c i o n á r i o f o n t e 7?

7.ô I... i s t a de r e g r a s c o n s i d e r a d a s 82

(9)
(10)

Í..Ib!IEQQU(iâQ

O u s o do c o m p u t a d o r na p r e p a r a ç ã o de d o c u m e n t o s t o r n a - s e

cada v e z m a i s e x t e n s o ? c o n t r i b u i n d o p a r a o c r e s c i m e n t o do m e r c a d o

de Si s t e m a s de P r o c e s s a m e n t o da Pa l a v r a .

Um s i s t e m a o p e r a c i o n a l t í p i c o de c o m p u t a d o r disptíe de

s i s t e m a s de a r q u i v o s ? e d i t o r e s e f o r m a t a d o r e s de t e x t o . 0 u s u á r i o

c r i a um d o c u m e n t o com o e d i t o r de t e x t o ? a r m a z e n a - o no s i s t e m a de

a r q u i v o s e u s a o f o r m a t a d o r de t e x t o p a r a i n t e r p r e t a r o s c o m a n d o s

d e f o r m a t a s á o e x i s t e n t e s no d o c u m e n t o.

No e n t a n t o ? e s t e m é t o d o de p r e p a r a ç ã o de d o c u m e n t o s n ã o

impede a o c o r r ê n c i a de e r r o s o r t o g r á f i c o s r e s u l t a n t e s da

ignorância do a u t o r . P o r s u a v e z ? o p r o c e s s o de d i g i t a ç ã o

c o n t r i b u i p a r a a inclusão de e r r o s o r t o g r á f i c o s d o s q u a i s ttOX

são c a u s a d o s p o r CDamerau c i t a d o p o r PETE 8 0 3 :

:l., t r a n s p o s i cão d e d u a s 1 e t r a s a d j a c e n t e s ;

2. uma 1 e t r a e x t r a ?

3. o m i s s ã o de uma l e t r a ?

4 „ u m a 1 e t r a i n c o r r e t a ;

Mas e r r o s o r t o g r á f i c o s i r r i t a m os l e i t o r e s . E p a r a a m a i o r i a

das p e s s o a s , a r e v i s ã o de um t e x t o o b j e t i v a n d o d e t e c t á - l o s é uma

t a r e f a e n f a d o n h a e de d i f í c i l s u c e s s o . F e l i z m e n t e e s t e

p r o c e d i m e n t o é p e r f e i t a m e n t e a d a p t á v e l ao c o m p u t a d o r : t r a b a l h o

(11)

m o n ó t o n a e r e p e t i t i v o que r e q u e r uma r á p i d a l e i t u r a e uma b o a

m e m ó r i a CBENT 8 5 3 . E p o s s í v e l um s i s t e m a a n a l i s a r a o r t o g r a f i a

de um t e x t o a p o n t a n d o as p a l a v r a s p o t e n c i a l m e n t e i n c o r r e t a s e

s u a s p r o v á v e i s c o r r e c o e s .

Ex i s t e m do i s t i p o s de a n á 1 i s e o r t o g r á f i ca : a v e r i f i c a o á o e a

c o r r e e á o . Dado um a r q u i v o t e x t o como e n t r a d a . - o v e r i f i c a d o r

o r t o g r á f i c o d e t e c t a t o d a s a s p a l a v r a s que e s t ã o i n c o r r e t a s . 0

c o r r e t o r o r t o g r á f i c o ? a l e m de d e t e c t a r a s p a l a v r a s i n c o r r e t a s ?

a p r e s e n t a a s p a l a v r a s c o r r e t a s que m a i s se " p a r e c e m " com a s

i n c o r i" e t a s ? p a r t i n d o d o p r i n c f p i o q u e o e r r o é r e s u 11 a d o d a s

f a 1

h

a s c om un s a o p r oc e s s o d e d i g i t aG ã' o C P E TE QQ3 .

Ao a n a l i s a r um t e x t o ? um v e r i f i c a d o r o r t o g r á f i c o pode

c o m e t e r d o i s t i p o s d e e r r o: n a' o d e t e c t a r uma p a 1 a v r a

o r t o g r a f i c a m e n t e i n c o r r e t a ? o u c 1 a s s i f i c a r c o mo i n c: o r r e t a um

p a l a v r a o r t o g r a f i c a m e n t e c o r r e t a . T o d o s o s v e r i f i c a d o r e s

o r t o g r á f i c o s c o m e t e m e r r o s - s e m u i t o s o u p o u c os? é um a q u e s ta' o

de p r o j e t o CBENT 8 5 1 .

0 f a t o d e um v e r i f i c a d o r o r t o g r á f i c o c o m e t e r e r r o s n ã o

impede o s e u uso? d e s d e que a t a x a de e r r o s e j a a c e i t á v e l . Dos

d o i s t i p o s de e r r o c i t a d o s a c i m a ? o m a i s g r a v e é a q u e l e em que o

v e r i f i c a d o r n a' o d e t e c t a u m a p a 1 a v r a o r t o g r a f i c a m e n t e i n c o r r e t a ?

f a z e n d o com que o u s u á r i o n ã o t o m e c o n h e c i m e n t o da e x i s t ê n c i a do

e r r o no t e x t o .

Segundo P e t e r s o n tPETE ttOD? t o d o s o s s i s t e m a s de

P r o c e s s a m e n t o de t ex t o s f u t u r o s a p r e s e n t a r ã o a ná1i s e

o r t o g r á f i c: a ,. A e x i s t é n c i a d e a n a l i s a d o r e s o r t o g r á f i c o s s u g e r e q u e

(12)

0 p a s s o s e g u i n t e s e r á c r i a r a n a l i s a d o r e s COM m a i o r nível de

s o f i s t i c a ç ã o ? que v e r i f i quem as e s t r u t u r a s s i n t á t i c a e s e m ã n t i c a

de um t e x t o . Cabe a um v e r i f i c a d o r s i n t é t i c o a n a l i s a r s e c a d a

s e n t e n ç a do t e x t o e n c o n t r a - s e a p r o p r i a d a m e n t e c o n s t r u í d a e

s i n t a t i c a m e n t e c o r r e t a . 0 v e r i f i c a d o r s e m â n t i c o a n a l i s a se a s

1 d é i a s d o t e ;•: t o e s t ã o c o r r e t a m e n t e d e s e n v o l v i d a s e a p r e s e n t a d a s ?

e s e o d o c

UM

e n t o s e e n c o n t r a c o m p

1

e t o e c o n s i s t e n t e „ F a

2

e r u m a

a n á l i s e s i n t á t i c a de um t e x t o de f o r m a i s o l a d a da a n á l i s e

s e m â n t i c a nem s e m p r e l e v a a um bom r e s u l t a d o ? c o n s i d e r a n d o que

f r e q u e n t e m e n t e a s e m â n t i c a d a s p a l a v r a s t e m e f e i t o s o b r e a

s i n t a x e da f r a s e em que a s mesmas e s t ã o i n s e r i d a s . P a r a c a d a

v e r i f i c a d o r d e v e r á e x i s t i r um c o r r e t o r e s p e c i f i c o c a p a z de

r e s o l v e r q u a i s q u e r p r o b l e m a s d e t e c t a d o s p e l o p r i m e i r o .

A v e r i f i c a

6

ã o o r t o g r á f i c a c o n s i d e r a a p a

1

a v r a

i n d i v i d u a l m e n t e ? n ã o l e v a n d o em c o n t a o c o n t e x t o em que a mesma

se e n c o n t r a ? nem a s u a s e m â n t i c a .

0 a s s u n t o a b o r d a d o n e s t e t r a b a l h o é v e r i f i c a ç ã o o r t o g r á f i c a .

A n t e s d e e s p e c i f i c a r m o s o s p r o p ò s i t o s d o m e s m o ? a p r e s e n t a r e m o s ?

de f o r ma s u c i n t a ? a l g u m a s c a r a c t e r f s t i ca s bási ca s d e s t e t i po de

v e r i f i c a s ã o ? t a i s com o ? mé t o d o s útili z a d o s e t i p o s de

P r o c e s s a m e n t o „

... 3

(13)

l - 1 Clétadoa ú& ví2i2i£icafi.'ÍQ actQÇir.à£j.£.a

S e g u n d o T u r b a IITURB 8 1 : i , o s m é t o d o s u t i l i z a d o s na

v e r i f i c a ç ã o o r t o g r á f i c a podem s e b a s e a r em a n á l i s e de f r e q u ê n c i a

de d i g r a m a s e t r i g r a m a s ( s e q u e n c i a de d o i s e t r ê s c a r a c t e r e s »

r e s p e c t i v a m e n t e ) n a s p a l a v r a s do t e x t o ou em d i c i o n á r i o s .

:l.., 1., 1 Ana 1 i se e s t a t f s t i c a

A a n á l i s e e s t a t í s t i c a é um m é t o d o b a s e a d o na f r e q u ê n c i a de

d i g r a m a s e t r i g r a m a s n a s p a l a v r a s do t e x t o . A q u e l a s que c o n t ê m

d i g r a m a s e t r i gramas i n f r e q u e n t e s ? com r e l a e á o ao r e s t a n t e do

t e x t o . - ou com r e l a s á o a l í n g u a ? sem s e b a s e a r no t e x t o ? sáo

c1 a s s i f i c a d a s c o m o b a s t a n t e p e c u l i a r e s e ? c on s e q u e n t e m e n t e ? com o

p o s s í v e i s p a l a v r a s o r t o g r a f i c a m e n t e i n c o r r e t a s »

Uma d a s v a n t a g e n s do m é t o d o é a redue:?ío s i g n i f i c a t i v a da

mefiiòr i a n e c e s s á r i a á v e r i f i c a s ã o o r t o g r á f i c a ? d i s p e n s a n d o a

o b r i g a t o r i e d a d e da e x i s t ê n c i a de um a r q u i v o de p a l a v r a s v á l i d a s

( d i c i o n á r i o ) u s a d o em um p r o c e s s o c o m p a r a t i v o com o t e x t o . Uma

o u t r a v a n t a g e m é que a l i s t a de p a l a v r a s d i s t i n t a s do t e x t o ?

a p r e s e n t a d a ao u s u á r i o a p ó s a v e r i f i c a ç ã o ? s e e n c o n t r a

d e c r e s c e n t e m e n t e o r d e n a d a p e i o í n d i c e de p e c u l i a r i d a d e . I s t o f a z

com que as p a l a v r a s i n c o r r e t a s - p a l a v r a s com a l t a

P e c u 1 i a r i d a d e - se e n c o n t r e m no i n f c i o d a l i s t a ? e s t i m u l a n cl o o

u s u á r i o a p e s q u i s á - l a s CPE-iTE SOU.

No e n t a n t o ? a t a x a de e r r o a p r e s e n t a d a p e l o m é t o d o é a l t a ?

já que m u i t a s Palavras o r t o g r a f i c a m e n t e v á l i d a s a p r e s e n t a m í n d i c e

de p e c u l i a r i d a d e a l t o ? e n q u a n t o que p a l a v r a s i n c o r r e t a s

... 4 ~

(14)

a p r e s e n t a m f r e q u e n t e m e n t e um b a i x o índice d e p e c u l i a r i d a d e . Uma

o u t r a d e s v a n t a g e m é o t a m a n h o da l i s t a a p r e s e n t a d a ao u s u á r i o

c o n t e n d o t o d a s a s pa 1 a v r a s d i s t i n t a s d o t e x t o . Um a f o r m a d e

s o l u c i o n a r e s t e p r o b l e m a é c o n s i d e r a r a l i s t a s ó a t é um c e r t o

g r a u d e p e c: u 1 i a r i d a d e.

0 TYPO? um d o s v e r i f i c a d o r e s o r t o g r á f i c o s do s i s t e m a U n i x ?

f a z u s o d e s t e m é t o d o . Com o o b j e t i v o de r e d u z i r o t a m a n h o da

l i s t a de p a l a v r a s d i s t i n t a s a p r e s e n t a d a s ao u s u á r i o ? o TYPO f a z

uso d e uma l i s t a d e p a l a v r a s v á l i d a s e d e u s o f r e q u e n t e em um

p r o c e s s o c o m p a r a t i v o ? e 1 i m i n a n d o d a p r i m e i r a t o d a s a s p a 1 a v r a s

que s'áo comuns á ambas CPETE 80:i CMQRR 75 J.

1 . :L . 2 A n a l i s e d e a f i x o s

A a n á l i s e de a f i x o s é um m é t o d o d e v e r i f i c a r ã o o r t o g r á f i c a

que c o n s i s t e na r e t i r a d a d o s a f i x o s ( p r e f i x o s e s u f i x o s ) d e uma

p a l a v r a a t é r e d u z i - l a ao s e u r a d i c a i ? e em uma p o s t e r i o r p e s q u i s a

d e s t e r a d i c a i no d i c i oná r i o .

Uma d a s v a n t a g e n s do m é t o d o é que um p e q u e n o d i c i o n á r i o

a b r a n g e um g r a n d e n ú m e r o d e p a l a v r a s ? já q u e m u i t a s d e l a s s ã o

v a r i a e d e s d e uma mesma e n t r a d a ( r a d i c a i ) do d i c i o n á r i o . Mesmo

n â' o e s t a n d o r e p r e s e n t a d a s e x p l i e i t a m e n t e ? e s t a s v a r i a G tí e s p o d e m

s e r r e co n h e c i da s. Uma o u t r a v a n t agem é q ue q u a i s q u e r p r e f i xo s

e / o u s u f

i

x o s p o d e m s e u n

i

r a q u a 1 q u e r r a d i c a 1 ? t o r n a n d o o

p r o c e s s o d e v e r i f i c a ç ã o b a s t a n t e f l e x í v e l .

No e n t a n t o ? é e s t a f l e x i b i l i d a d e que i n t r o d u z f a l h a s no

M

é t o d o .

R

a

d i

c a1 e a f i x o s i s o1 a d a m e n t e

v a l i

d o s p o d e m co n j u n t a m e n t e

(15)

f o r m a r uma pa1 a v r a o r t o g r a f i c a m e n t e i nvá 1 i da - Uma v e z r e t i r a d o s

os a f i x o s d e s t a pa 1 a v r a ? pe s qui s a d o e e n c o n t r a d o o r a d i c a 1 n o

d i c i on ár i o :• o v e r i f i c:ador o r t o g r áf i c o c 1 a s s i f i c a a P a 1 a v r a

i n i c i a l

COMO

c o r r e t a ? n'áo e x e r c e n d o nenhuma e s p é c i e de c o n t r o l e

s o b r e a s l e i s de f o r m a ç ã o da mesma. Uma o u t r a d e s v a n t a g e m

a p r e s e n t a d a p e l o m é t o d o é o n í v e l de c o m p l e x i d a d e do a l g o r i t m o

r e s p o n s á v e l p e l a r e t i r a d a d o s a f i x o s de c a d a p a l a v r a a s e r

a n a l i sada,.

A c e i t a r p a l a v r a s i n c o r r e t a s f o r m a d a s a p a r t i r de r a d i c a l e

a f i x o s c o r r e t o s p o d e s e r e v i t a d o c o m o u s o >: 1 e s i n a 1 i z a d o r e s

( f l a g s ) que a s s o c i a m a c a d a r a d i c a l do d i c i o n á r i o o s a f i x o s que

podem s e l i g a r ao mesmo? c r i a n d o uma p a l a v r a v á l i d a . E s t a t é c n i c a

f o i a d o t a d a p e l o s v e r i f i c a d o r e s o r t o g r á f i c o s SPELL d o s i s t e m a

Unix

CMcIL 62:i e SPELL do DEC-10 II PE TE SOU.

1.. :l. „ 3 P e s q u i s a g l o b a 1

Um o u t r o m é t o d o u t i l i z a d o na v e r i f i c a ç ã o o r t o g r á f i c a

c o n s i s t e na p e s q u i s a da p a l a v r a i n t e g r a l em um g r a n d e d i c i o n á r i o

o n d e s e e n c o n t r a m t o d a s as v a r i a s C e s v á l i d a s d a s p a l a v r a s que s e

d e s e j a a b r a n g e r . Uma d a s v a n t a g e n s e n c o n t r a d a s n e s t e m é t o d o é que

t o d a s a s p a l a v r a s i n c o r r e t a s s á o d e t e c t a d a s ? e a s d e m a i s

c1 a s s i f i ca d a s c o m o o r t o gr a f i c a m e n t e c o r r e t a s . 0 M e t o d o p erm i t e

que s e f a e a ? quando n e c e s s á r i o ? uma s e l e e á o d a s p a l a v r a s que

devam c o n s t a r n o s t e x t o s ? f o r s a n d o ? p o r exemp1 o ? o u s o de um

v o c a b u1á r i o l i m i t a d o v o 1 1 a do p a r a u m a d e t e r m i na da c 1 a s s e d e

1e i t o r e s .

(16)

COMO

d e s v a n t a g e n s ? o M é t o d o a p r e s e n t a o u s o d e

UM

g r a n d e

espaeio p a r a a r m a z e n a m e n t o d o d i c i o n á r i o e UM a u m e n t o no t e m p o do?

p e s q u i s a . - COM r e l a ç ã o ao M é t o d o a n t e r i o r . - d e v i d o a o c r e s c i M e n t o

do d i c i o n á r i o . E s t e M é t o d o é u t i l i z a d o p e l o v e r i f i c a d o r

o r t o g r á f i c o da IBÍ1 LPETE 8 0 3 .

0 s M é t o cl o s de v e r i f i c a e "í o o r t o g r á f i c a e x i s t e n t e s a p r e s e n t a M

v a n t a g e n s e d e s v a n t a g e n s COM r e l a ç ã o a a b r a n g ê n c i a ? v e l o c i d a d e ? e

r e q u i s i t o s de e s p a ç o em m e m ó r i a p r i n c i p a l e / o u s e c u n d á r i a . A

o p r f o

p o r

U M

d e t e r m i n a d o M é t o d o r e q u e r ? do p r o j e t i s t a ? uma p r é v i a

e s c o l h a d a s c a r a c t e r í s t i c a s que o v e r i f i c a d o r d e v e r á a p r e s e n t a r . ,

0 i d e a 1 s e r i a q u e c a d a u m a d e s t a s c: a r a c t e r 1 s t i c: a s s e c o

M

p o r t a s s e

c o n f o r m e o d e s e j a d o . Mas uma m a i o r a b r a n g ê n c i a i m p l i c a em UM

M a i o r

e s p a ç o de a r m a z e n a m e n t o e em uma menor v e l o c i d a d e .

A l g u n s p r o j e t i s t a s c r i a m v e r i f i c a d o r e s que s e b a s e i a m em

M a i s

de um m é t o d o ? v i s a n d o a t i n g i r um

M e l h o r

p o n t o d e e q u i l í b r i o

e n

11"

e e s t a s c a r a c t e r f s t i c a s CTU R B 8

12 .

:i.. 2 T i p o s d e p r o c e s s a

M

e n t o

De a c o r d o com a i n t e r f a c e com o u s u á r i o ? o v e r i f i c a d o r

o r t o g r á f i c o ( V 0 ) t e m p r o c e s s a m e n t o " b a t c h " o u " o n - l i n e " . E s t a

ê uma d a s d i f e r e n ç a s b á s i c a s e n t r e o s d i v e r s o s v e r i f i c a d o r e s

o r t o g r á f i c o s e x i s t e n t e s LTURB S:L] ,.

N o F' i" o c e s s a m e n t o " b a t c h " a v e r i f i c a c 3 o s e f a z 1 e v a n d o - s e e m

c o n t a t o d o o t e x t o . Como a s d u p l i c a ç õ e s d a s p a l a v r a s s # o

f r e q u e n t e s ? o r d e n a • - s e o t e x t o o b j e t i v a n cl o e l i m i n a r e s t a s

d u p 1 i c as 6 e s . Um a v e z o r d e n a cl o ? e com a s d u P 1 i c aG tí e s d e p a l a v r a s

(17)

e l i m i n a d a s : , o t e x t o é s u b m e t i d o a v e r i f i c a ç ã o o n d e c a d a p a l a v r a é v e r i f i c a d a de f o r m a i s o1 a d a . C o m o d i c i o n ári o t a m b é m o r d e n a d o ? e s t a v e r i f i c a ç ã o se p r o c e s s a com apenas um p a s s o . Um v e r i f i c a d o r com p r o c e s s a m e n t o " o n - l i n e " ? ou p r o c e s s a m e n t o i n t e r a t i v o ? c a m i n h a n o t e x t o a t é d e t e c: t a r um a p a 1 a v r a i n c o r r e t a ? s u s p e n d e a v e r i f i c a ç ã o e i n t e r a g e com o u s u á r i o s o l i c i t a n d o o t i p o de p r o c e d i m e n t o a s e r t o m a d o s o b r e a q u e l a p a l a v r a - d e i x a r i na 1 t e r a d a ? mod i f i c a r ? p e r m u t a r p o r o u t r a ( s ) pa 1 a v r a ( s ) ? e t c . Em s e g u i d a ? o p r o c e s s o de v e r i f i c a G ã o t e m c o n t i n u i d a d e . A v e r i f i c a ç ã o é f e i t a p a r a c a d a o c o r r ê n c i a da p a l a v r a no t e x t o ? o que c o n t r i b u i p a r a uma r e d u G ã o na v e l o c i d a d e do v e r i f i c a d o r ? já que o n ú m e r o de d u p l i c a s s e s de p a l a v r a s em um t e x t o é n o r m a l m e n t e b a s t a n t e a l t o . 0 p r o c e s s a m e n t o " b a t c h '' a p r e s e n t a a v a n t a g e m de v e r i f i c a r a p e n a s u m a o c o r r e m : i a d a p a 1 a v r a n o t e x t o ? e a d e s v a n t a g e m d e a p r e s e n t a r a s p a 1 a v r a s i n c o r r e t a s a o u s uá r i o a p e n a s q u a n d o o t e x t o já f o i t o t a 1 tttente s u b m e t i cio a v e r i f i caGa'o . 0 p r o c e s s a m e n t o

" o n - l i n e " ? ao c o n t r á r i o ? a p r e s e n t a a v a n t a g e m de i n t e r a g i r com o u s u á r i o 1 o g o que d e t e c t a uma p a 1 a v r a i n c o r r e t a no t e x t o ? mas v e r i f i c a u m a p a l a v r a t a n t a s v e ze s qu a n t a s f o r e m s u a s o c o r r ên c i a s no t e x t o . N ó s chamamos de " b a t c h + s e m i - i n t e r a t i v o " o p r o c e s s a m e n t o em que o v e r i f i c a d o r a n a l i s a t o d o o t e x t o p a r a ? em s e g u i d a ? m a n t e r um p r o c e s s o i n t e r a t i v o ( o p c i o n a l ) com o u s u á r i o ? o n d e e s t e d e t e r m i n a s e a p a l a v r a e s t á r e a l m e n t e i n c a r r e t a ? ou s e o v e r i f i c a d o r d e v e i n c l u í - l a no d i c i o n á r i o .

(18)

A a p r e s e n t a ç ã o d a s p a l a v r a s i n c o r r e t a s a t r a v é s de UM

p r o c e s s a m e n t o i n t e r a t i v o é Mais e s t i m u l a n t e do que a t r a v é s de um

p r o c e s s o n ã o i n t e r a t i v o . A p r o b a b i l i d a d e do u s u á r i o d e i x a r de

P e r c e b e r u m a p a l a v r a i n c: o r r e t a d i m i n u i ? j á q u e c a d a P a 1 a v r a é

a p r e s e n t a d a i n d i v i d u a l m e n t e ? em o p o s i cão á ex i b i c ã o de uma

p a l a v r a i n c o r r e t a e n t r e v a r i a s c o r r e t a s .

1.3 O b j e t i v o s do t r a b a l h o

Os p r o p ó s i t o s d e s t e t r a b a l h o c o n s i t e w em e l a b o r a r um p r o j e t o

de u m v e r i f i c a d o r o r t o g r âf i c: o p a r a a 1 1 n g u a p o r t u g u e s a í v

1

0 i... P ) ?

seM

:• no e n t a n t o ? i m p l e m e n t á - l o - 0 VOLP f a r á u s o de d i c i o n á r i o ?

terá um p r o c e s s a m e n t o " b a t c h + s e m i - i n t e r a t i v o " e a d o t a r á

o- m é t o d o a n á l i s e de a f i x o s a s s o c i a d o ao u s o de r e g r a s que

d i s c i p 1 i n a m a f o r m a cão d as p a l a v r a

s-í.4 O r g a n i z a ç ã o da t e s e

E s t a t e s e é c o n s t i t u í d a de fi c a p í t u l o s »

0 CAPITULO J. c o r r e s p o n d e a e s t a i n t r o d u ç ã o .

0 CAP I"f UL0 2 a p r e s e n t a o s p r o b 1 emas b á s i c o s na construc'áo

de um v e r i f i c a d o r o r t o g r á f i c o ? a b r a n g e n d o d e s d e a d e f i n i ç ã o de

" p a l a v r a " a t é a c r i a ç ã o e m a n u t e n ç ã o de d i c i o n á r i o s .

0 CAPITULO 3 f a l a s o b r e o s p r i n c i p a i s v e r i f i c a d o r e s

o r t o g i" á f i c o s p a r a a 11 n g u a i n g 1 e s a d e q u e s e t e m c: o n h e c i m e n t o .

T r a ç a a i n d a um p e r f i l de um v e r i f i c a d o r o r t o g r á f i c o para. a l í n g u a

p o r t u g u e s a „

9

(19)

D C A P I T U L O 4 a p r o? s e n t a a s c: a r a c t e r í s t i c a s de um v e r i f i c a d o r

o r t o g r á f i c o v o l t a d o p a r a a l í n g u a p o r t u g u e s a (VOLP>? e a s

s o l u e d e s e n c o n t r a d a s p a r a o s p r o b l e m a s l e v a n t a d o s no c a p í t u l o 2,

0 C A P I T U L. D '5 m o s t r a a s e s t r u t u r a s d e d a d o s u t i 1 i z a d a s p e 1 o

VQLP e a p r e s e n t a a s r a z o e s p e l a s q u a i s e l a s f o r a m p r o j e t a d a s

d a q u e l a f o r m a .

0 CAPITULO 6 é d e d i c a d o ao a l g o r i t m o g e r a l do VQLP.

0 CAPITULO 7 a p r e s e n t a o s m é t o d o s c r i a d o s p a r a o b t e n ç ã o e

c r i a c;:'áo do d i c i o n á r i o do VOLP .

F i n a I m e n t e

:

. o C A P I T U L 0 3 a p r e s e n t a a . c o n c l u s 'á o d o t r a b a 1 h o ..

10

(20)

-2- EBQBL£QâS liâSICOS ttâ CDfciSIEUÍiaa DE Ufi

UEB.IEIC.Ô.D.0.6. QB.IQGB

.aE ICO

S e i" i a b a s t a n t e ú t i 1 u m V e r i f i c a d o r q u e v e r i f iças s e a

e s t r u t u r a d a s s e n t e n ç a s » o u s o a p r o p r i a d o d a s p a l a v r a s ? a l é m da

0 r t o g i" a f i a p r o p r i a m e n t e d i t a . UM v e r i f i c: a d o r q u e f i z e s s e

e x a t a

M

e n t e o q u e q u a "1 q u e r p e s s o a f a z a o r e v i s a r u

M

t e x t o.

S e g u n d o Tu r b a I." T U R B 813? uma c o m p l e t a v e r i f i c: a a & o a u t o M á t i c a

é uma p r e t e n s ã' o b a s t a n t e o t i m i s t a ? u m a v e z q u e u

M

a 11 o g r a u d e

c o n h e c i

M

e n t o ? p o r p a r t e d o p r o g r a

M

a ? s e f a z n e c: e s s

à

r i o .. A s

e x p e r i e n c i a s f e i t a s ? e n v o 1 v e n d o v o c a b u 1 á r i o m u i t o r e s t r i t o e

1 i

M

i t a d a s e s t r u t u r a s d e s e n t e ri e a s ? e s t a o a i n d a b a s t a n t e d i s t a n t e s

da r e a l i d a d e ? o n d e n o r m a l m e n t e s e e n c o n t r a m t e x t o s COM UM e x t e n s o

v o c a b u l á r i o e um g r a n d e niámero de e s t r u t u r a s de s e n t e n s a s »

Pi a s ? t e n d o u m v e r i f i c a d o r o r t o g r á f i c o u m m e n o r n ív e 1 >::l e

s o f i s t i c a r ã o ? sua c o n s t r u G á o é e l e m e n t a r e l i v r e de m a i o r e s

p r o b l e m a s ? O b s e r v a - s e que e s t e p r e s s u p o s t o á f a l s o ? e as r a z o e s

que n o s l e v a m a c h e g a r a t a l c o n c l u s ã o c o n s t i t u e m e s t e c a p i t u l o . .

2.1 F o i" m a e: a' o e r e c o n h e c i m e n t o d e p a i a v r a

P a r t i n d o d o p r i n c í p i o q u e u m v e r i f i c a d o r o r t o g r á f i c o f a z u m a

v e r i f i ca cão a n í v e 1 de p a 1 a v r a ? d e v e - s e d e f i n i r ? i n i c: i a 1 m e n t e ? o

que é uma p a l a v r a ? i s t o á? o que c o n s t i t u i um á t o m o de

v e r i f i c a ç ã o .

P a r a e f e i t o d e r e c o n h e c i m e n t o d e p a 1 a v r a s ? s u p ti e - s e q u e o

t e x t o a s e r v e r i f i c a

d

o

é

c o n s t i t u í d o d e p a 1 a v r a s ( f o r m a d a s d e

(21)

c a r a c t e r e s p e r t e n c e n t e s ao a l f a b e t o de p a l a v r a ) s e p a r a d a s p o r

d e l i m i t a d o r e s ( f o r m a d o s p o r c a r a c t e r e s p e r t e n c e n t e s a um a l f a b e t o

de d e l i m i t a d o r e s ) . G e r a l m e n t e i m a g i n a - s e uma p a l a v r a como s e n d o

c o m p o s t a p o r l e t r a s m a i ú s c u l a s e m i n ú s c u l a s . No e n t a n t o , e l a p o d e

c o n t e r c a r a c t e r e s a c e n t u a d o s . - h í f e n ( - ) . - a p ó s t r o f e ( ' ).- d í g i t o s

( 0 9 ) e o u

11"

o s c a r a c t e r e s. H á n e c e s s i d a d e.- p o r t a n t o.- d e

a n a l i s a r a f r e q u ê n c i a de u s o d e s t e s c a r a c t e r e s n a s p a l a v r a s da

l í n g u a e d e c i d i r q u a i s d e l e s s e r ã o i n c l u í d o s no a l f a b e t o de

p a l a v r a s e q u a i s s e r á o i n c l u í d o s n o a l f a b e t o d e d e l i m i t a d o r e s .

D e t e r m i n a r o que d e l i m i t a uma p a l a v r a á s v e z e s n ã o é t ã o

s i m p l e s q u a n t o p a r e c e - q u a l q u e r c o i s a que n ã o é p a l a v r a d e v e

d e l i m i t a r uma p a l a v r a . Um f i m de l i n h a pode n ã o r e p r e s e n t a r UM

f i m de p a l a v r a - o usuário.- ao f o r m a t a r um t e x t o u s a h í f e n no

f i n a l da l i n h a s e p a r a n d o s í l a b a s d e uma mesma p a l a v r a .

Um o u t r o p o n t o a c o n s i d e r a r s ã o os comandos e n c o n t r a d o s n o s

t e x t o s c o m a n d o s g e r a d o s e i n t e r p r e t a d o s p o r um f o r m a t a d o r de

t e x t o ? que p a r e c e m p a l a v r a s ? mas que n á o devem s e r t r a t a d o s como

t a 1 . Es t e s coma nd os v a r i a m d e u m f o r m a t ad o r pa r a o u t r o ? e x i g i nd o

que o v e r i f i c a d o r s e j a c a p a z de m a n i p u l a r d i v e r s o s t i p o s de

comandos? o u que s e j a v o l t a d o e x c l u s i v a m e n t e p a r a t e x t o s g e r a d o s

P o r um de t e r m i nado f orma t a d o r . N o p r i m e i r o c as o ? s ã o n e c e s sá r i o s

v á i" i o s c o n j u n t o s d e r e g r a s d e r eco n h e c i m e n t o d e p a l a v r a s ?

e n q u a n t o que no s e g u n d o ? f a z - s e n e c e s s á r i o a p e n a s um c o n j u n t o .

UM o u t r o p r o b l e m a a p r e s e n t a d o n o â m b i t o d a p a l a v r a é q u a n t o

á " c a i x a " d a s l e t r a s . G e r a l m e n t e ? a

M a i o r i a

d a s l e t r a s de

u m

t e x t o ê m i n ú s c u l a . Desde que " o r t o g r a f i a " é n o r m a l m e n t e

12

(22)

-c o n s i d e r a d a u m a p a 1 a v r a i dê n t i -c a a " O r t o g r a f i a " . - g r a n d e p a r t e d o s

v e r i f i <:: a d o r e s o r t o g r á f i c o s m a p e i a t o d a s a s 1 e t r a s d o t e x t o p a r a

m a i ú s c u l a s ou p a r a minúsculas:, a n t e s de s u b m e t ê - l o a v e r i f i c a ç ã o .

No e n t a n t o o p r o b 1 e ma é u m p o u c o m a i s c o m p 1 e ;•: o j á q u e

e x i s t e m p a l a v r a s que s'ío i n i c i a d a s o b r i g a t o r i a m e n t e p o r

m a i ú s c u l a s (nomes p r ó p r i o s ) ou que usam l e t r a s e s t r i t a m e n t e

m a i ú s c u l a s ( s i g l a s ) . , As p a l a v r a s " i b m " e " f o r t r a n " ? p o r

e x e m p l o » d e v e r i a m s e r c o n s i d e r a d a s i n c o r r e t a s ? U p r o j e t i s t a do

v e r i f i c a d o r ou d e c i d e em a d o t a r um c o n t r o l e s o b r e o u s o c o r r e t o

de c a i x a d a s l e t r a s * ou s i m p l e s m e n t e f a z com que p a l a v r a s d e s t e

t i p o na o s e j a m s u b m e t i d a s à v e r i f i caca'o ^ p a r t i n d o do p r i n c í p i o

q u e e s t e t i p o d e p a 1 a v r a s - n o m e s p ró p r i o s

:

. s i g l a s . - a c r o s s e m i a s

n á o devem s e r o b r i g a t o r i a m o n t e do c o n h e c i m e n t o d e um

v e r i f i c a do r o r t o g r á f i c o íP E TE fi 0 1 .

2.2 O b t e n s á o e c r i a s a" o de um d i c i o n á r i o

A t a r e f a m a i s d i f í c i l no d e s e n v o l v i m e n t o de um v e r i f i c a d o r

b a s e a d o em d i c i o n á r i o é a o b t e n c á o e c r i a ç ã o do d i c i o n á r i o . O b t e r

um d i c i o n á r i o s i g i n i f i c a p e s q u i s a r em a l g u m a f o n t e e?

p o s t e r i oi"mente :• a r m a z e n a r no comp u t a d o r a s p a l a v r a s da 1 1 n g u a ,.

Por c r i a s â o do d i c i o n á r i o s u b t e n d e - s e o p r o c e s s o de e s t r u t u r a s a'o

d e s t a s p a l a v r a s de a c o r d o com o m é t o d o de v e r i f i c a ç ã o a d o b a d o

P e 1 o v e r i f i c a d o r .

P a r a d a r uma i d e i a da d i f i c u l d a d e e n f r e n t a d a q u a n d o s e o b t é m

uma l i s t a de p a l a v r a s v á l i d a s da l í n g u a ? CBENT 853 f a z uma

(23)

c o m p a r a ç ã o e n t r e a p r e p a r a ç ã o de um e n s o p a d o de e l e f a n t e e a

c o n s t r u ç ã o de um v e r i f i c a d o r o r t o g r á f i c o . No p r i m e i r o c a s o * o

p r i m e i r o p a s s o s e r i a c>ABa.r um e l e f a n t e . Já no s e g u n d o caso.-,

d e v e r ~ s e - i a o b t e r uma l i s t a de p a l a v r a s v á l i d a s na l í n g u a p a r a a

q u a l o v e r i f i c a d o r é v o l t a d o . S e g u n d o B e n t l e y ? a p ó s a l g u m t e m p o é

p o s s í v e l que s e c h e g u e a c o n c l u s ã o que é m u i t o m a i s fácil

p r e p a r a r um d e l i c i o s o e n s o p a d o de e l e f a n t e .

Sao v á r i o s o s f a t o r e s que c o n t r i b u e m p a r a t o r n a r e s t a t a r e f a

t 3 o árdua.. I n i c i a l m e n t e podemos c i t a r a r e l u t â n c i a d o s

f a b r i c a n t e s de d i c i o n á r i o s em f o r n e c e r uma c ó p i a em q u a l q u e r m e i o

p o s s í v e l de s e r l i d o no c o m p u t a d o r . Mesmo que um f a b r i c a n t e

f o r n e ç a uma c ó p i a ou que s e u s e um e x e m p l a r de d i c i o n á r i o p a r a s e

d a r e n t r a d a d o s s e u s v o c á b u l o s no c o m p u t a d o r ? o b s e r v a - s e que em

nenhum d o s d o i s c o n s t a m v á r i a s f o r m a s de p a l a v r a s ? t a i s como

P l u r a 1 •.• d i m i n u t i v o ? a u m e n t a i i v o ? e t c .

Um g r a n d e d i c i o n á r i o c o n t e r á a i n d a p a l a v r a s a r c a i c a s e

o b s c u r a s c u j a f r e q u ê n c i a de u s o n ã o j u s t i f i c a a i n c l u s ã o d a s

mesmas no d i c i o n á r i o do VO. A l é m do m a i s ? a i n c l u s ã o d e s t a s

palavras c o n t r i b u i p a r a a u m e n t a r a t a x a de e r r o do v e r f i c a d o r ?

c o n f o r m e v e r e m o s na sectcáa 2 . 3 .

A p e s a r d e s t e s p r o b l e m a s ? a p r o c u r a de um d i c i o n á r i o ?

p r e v i a m e n t e d i g i t a d o ? n ã o d e v e s e r d e s c a r t a d a ? p o i s o mesmo

p o d e r á s e r u s a d o em um p r o c e s s o c o m p a r a t i v o com uma l i s t a de

p a l a v r a s que s e r v i r'áo de e n t r a d a p a r a o d i c i o n á r i o d o VO?

a g i l i z a n d o o p r o c e s s o de o b t e n ç ã o do mesmo. E s t e m é t o d o f o i u s a d o

p e l o SPELL do U n i x CTURB fílll CClcIL 8 2 3 .

(24)

-Caso não se d i s p o n h a de um d i c i o n á r i o j á d i g i t a d o ? o

p r o c e s s o de o b t e n ç ã o é m a i s l e n t o e d i f í c i l » p o r é m n ã o é

i m p o s s í v e l - Um dos m é t o d o s que p o d e r á s e r u t i l i z a d o é a a n á l i s e

da f r e q u ê n c i a de u s o d a s p a l a v r a s ? c o n s i d e r a n d o um g r a n d e n ú m e r o

de t e x t o s onde os a s s u n t o s devem s e r o s m a i s d i v e r s o s . P a l a v r a s

m u i t o u s a d a s d e v e r ã o e s t a r o r t o g r a f i c a m e n t e c o r r e i a s e? p o r t a n t o ?

serão i n c l u í d a s no d i c i o n á r i o do VO. T e n d o o n ú m e r o de e n t r a d a s

d e s t e a t i n g i d o um c e r t o l i m i t e ? e l e p a s s a r á a s e r u s a d o p e l o VO?

e a s p a l a v r a s c o r r e i a s que? no p r o c e s s o de v e r i f i c a ç ã o de um

t e x t o ? possam v i r a s e r c i a s s i f i ç a d a s como i n c o r r e t a s ? p o d e r á o

p o s t e r i o r m e n t e s e i " i n c 1 u f d a s n o d i c i o ná r i o. Tu r b a f e z u s o d e s t e

m é t o d o na i m p 1 e m e n t a e á o de um v e r i f i c a d o r o r t o g r á f i c o LTURB S I 3 .

I n d e p e n d e n t e do m é t o d o u t i l i z a d o na o b t e n G á o do d i c i o n á r o ? a

t a r e f a s e m o s t r a l e n t a e c a n s a t i v a ? o n d e o p r o c e s s o de t r i a g e m s e

c o n c e n t r a d e m a s i a d a m e n t e n o ho me m.

C o n t r o 1 es p a r a mod i f i c a ç ã o do d i c i o n á r i o do VO s ã o

n e c e s s á r i o s e geram a n e c e s s i d a d e de um A d m i n i s t r a d o r de

D i c i o n á r i o que t e m como f u n ç ã o a s u a m a n u t e n ç ã o ; a d i c i o n a r n o v a s

p a l a v r a s e e x c l u i r a q u e l a s p o u c o ou n ã o u s a d a s CPETE 8 0 3 .

2 „ 3 A b r a n g e n e i a

Como t o d o a l g o r i t m o de r e c o n h e c i m e n t o de p a d r ã o » um

v e r i f i c a d o r o r t o g r á f i c o pode c o m e t e r do i s t i p o s de e r r o : f a l h a r

na a c e i t a ç ã o de uma p a l a v r a o r t o g r a f i c a m e n t e c o r r e t a ? ou f a l h a r

n a r e j e i «: ã' o d e uma p a 1 a v r a o r t o g r a f i c a m e n t e i n c o r r e t a L". P E "f E tí 6 J .

15

(25)

Se o v e r i f i c a d o r é b a s e a d o em um a l g o r i t m o de b u s c a ? e l e

d e v e r á m a n t e r uma l i s t a de p a l a v r a s o r t o g r a f i c a m e n t e c o r r e t a s

( d i c i o n á r i o ) que s e r á p e s q u i s a d a s e m p r e que uma p a l a v r a e s t i v e r

s e n d o v e r i f i c a d a » Se a p a l a v r a é e n c o n t r a d a ? a s s u m e - s e que a

mesma e s t á c o r r e t a ? c a s o c o n t r á r i o ? a p a l a v r a ê c l a s s i f i c a d a como

i n c o r r e t a .

A f a 1ha d e um v e r i f i c a do r n a a c e i t a a a o d e um a p a1 a v r a

c o r r e t a s e dá q u a n d o a mesma n á o s e e n c o n t r a no dicionário,, P a r a

r e d u z i r a p r o b a b i l i d a d e d e s t e t i p o de e r r o ? g e r a l m e n t e

a d i c i o n a - s e m a i s p a l a v r a s no d i c i o n á r i o . D e i x a n d o de l a d o o s

p r o b l e m a s a c a r r e t a d o s p o r e s t e p r o c e d i m e n t o - n e c e s s i d a d e de

m a i s m e m ó r i a e a u m e n t o n o t empo d e p e s q u i s a ? já d i s c u t i d o s no

C A P I T U L 0 1 •- ? o b s e r v a - s e u m a m a i o r p r o b a b i 1 i d a d e d o v e r i f i c a d o r

a c e i t a r p a l a v r a s o r t o g r a f i c a m e n t e i n c o r r e t a s CPETE 8 6 3 .

Mas como p o d e e s t e p r o c e d i m e n t o c o n t r i b u i r p a r a q u e uma

p a l a v r a i n c o r r e t a s e j a c l a s s i f i c a d a como c o r r e t a ? S e g u n d o

P e t e i " s o n ? i s t o o c o r r e q u a n d o o a u t o r / u s uá r i o p r e t e n d e n d o d i g i t a r

a palavra X? d i g i t a ? na r e a l i d a d e ? a p a l a v r a Y. " C a i x a " p o d e

s e r d i g i t a d a como " b a i x a " ? p o r e x e m p l o . 0 e r r o n ã o é d e t e c t a d o ?

q u a n d o a p a l a v r a d i g i t a d a c o n s t a no dicionário,. E s t e t i p o d e e r r o

p o d e r á s e r d e t e c t a d o a p e n a s p o r a l g o r i t m o s m a i s c o m p "1 e x o s q u e

usem i n f o r m a ç õ e s s i n t á t i c a s e s e m â n t i c a s .

P e t e r s o n a c r e s c e n t a a i n d a que a o c o r r ê n c i a d e s t e t i p o de

e r r o c r e s c e á m e d i d a que c r e s c e o t a m a n h o do d i c i o n á r i o . Quando

a u m e n t a - s e a a b r a n g ê n c i a de um d i c i o n á r i o ? t e n d e ~ s e a f a z e r

i n c l u s õ e s de p a l a v r a s o b s c u r a s e d e

P O U C O U S O ?

c u j a o r t o g r a f i a

(26)

P o d e c o i n c i d i r c o m a d a s p a 1 a v r a s d i g i t a d a s i n c o r r e t a m e n t e.

A i nda q u a n t o á a b r a n g ê n c i a do d i c: i o n á r i o> o p r o j e t i s t a t e r á

que d e c i d i r s e o mesmo d e v e r á e n g l o b a r nomes p r ó p r i o s e p a l a v r a s

e s t r a n g e i r a s c u j o u s o s e j a p o r d e m a i s f r e q u e n t e n o s t e x t o s da

c o m u n i d a d e » E s e os t e r m o s técnicos.- v o l t a d o s p a r a uma á r e a

específica:. d e v e r ã o c o n s t a r n e s t e d i c i o n á r i o ou s e f a r á u s o de

d i c i o n á r i o s e s p e c i a'l i z a d o s .

2.4 R e p r e s e n t a G á o do d i c i o n á r i o

0 d e s e mp e nh o de u m v e r i f i c a d o r o r t o g rá f i c o é m u i t o

impo r t a n t e.- p r i n c i p a 1 m e n t e s e e 1 e a p r e s e n 1 a p r o c e s s a m e n 1 o

" o n •••• 1 i n e " :• o n d e o u s u á r i o i n t e r a g e com o v e r i f i c a >::l o r d u r a n t e o

p r o c e s s o de v e r i f i c a s ã o .

S e g u n d o P e t e r s o n IIP E T E S 01 ? a e s t r u t u r a d o d i c i o ná r i o t e

M

f u n d a m e n t a l i m p o r t â n c i a no d e s e m p e n h o do VO. A d e t e r m i n a ç ã o de

uma e s t r u t u r a c o r r e t a ? p o r sua v e z ? d e p e n d e b a s i c a m e n t e da

c o n f i g u r a ç ã o do s i s t e m a de c o m p u t a cá o no q u a l se d e s e j a

i m p l e m e n t a r o VO? ou s e j a ? q u a l a m e m ó r i a p r i n c i p a l e s e c u n d á r i a

d i s p o n í v e l no c o m p u t a d o r ? q u a i s os m é t o d o s de a c e s s o e x i s t e n t e s

no s i s t e m a ? q u a l a v e l o c i d a d e de a c e s s o a d i s c o ou a d i s q u e t e ?

etc»

A e s t r u t u r a do d i c i o n á r i o d e v e c o n t e r ? em um e s p a ç o

r a z o á v e l ? i n f o r m a ç õ e s s u f i c i e n t e s p a r a que se t e n h a uma boa

q u a l i d a d e de r e s p o s t a ? e que e s t a r e s p o s t a s e p r o c e s s e em t e m p o

háb i 1 „

(27)

Há um g r a n d e i n t e r e s s e em s e o b t e r d i c i o n á r i o s b a s t a n t e

c o

M

p a c t o s „ I s t o s e d e v e ? p r i n c

i

p a 1 m e n t e.- a o u s o d e v e r i f i c a d o r e s

o r t o g r á f i c o s

eM M á q u i n a s

de p e q u e n o p o r t e b a s t a n t e c o m u n s em

escritórios,. Uma boa c o m p a c t a ç ã o p o d e s e r o b t i d a a s s o e i a n d o - s e o

uso do M é t o d o de A n á l i s e de a f i x o s a

U M a r e p r e s e n t a ç ã o de

d i c i o n á r i o do t i p o " T o t a l H a s h i n g " ? na q u a l a p e n a s um b i t na

t a b e l a h a s h i n d i c a se a p a l a v r a c o n s t a no

d i c i o n á r i o

( b i t l i g a d o )

ou na o ( b i t d e s l i g a d o ) - E s t a a s s o c i a ç ã o de M é t o d o de v e r i f i c a ç ã o

e f o r m a de r e p r e s e n t a ç ã o de d i c i o n á r i o r e d u z d r a s t i c a m e n t e a á r e a

o c u p a d a p o r este:. sem» no e n t a n t o ? c o m p r o m e t e r o d e s e m p e n h o ou a

q u a 1 i d a d e d e r e s p o s t a d o v e r i f i c a d o r ., E s t e s f a t o r e s d e p e n d e r "k o

a i n d a do t a m a n h o da t a b e l a h a s h e / o u do s e u g r a u de u t i l i z a ç ã o ?

já que

U M b i t na'o p o s s i b i l i t a a r e p r e s e n t a s ã o de c o l i s ó e s no

h a s h .,

Nu

i t o s v e r i f i c a d o r e s o r t o g r á f i c o s usam vár i os d i c i onár i os ?

t a n t o e s t á t i c o s - n ã o s e a l t e r a m d u r a n t e a v e r i f i c a ç ã o

q u a n t o d i n â m i c o s - podem r e c e b e r n o v a s p a l a v r a s d u r a n t e o

p r o c e s s o d e v e r i f i c a u; 'á o - ? c o m o o b j e t i v o d e m e l h o r a r o

d e s e m pe n ho d o v e r i f i c a d o r . Cada d i c i o n ár i o p o d e n

d o a p r e s e n t a r um a

e s t r u t u r a d i s t i n t a de a c o r d o com a s c a r a c t e r í s t i c a s e a

f i" e q u ê nc i a d e u s o d o mesmo.

Um VO p o d e r á a i n d a p e r m i t i r a c r i a ç ã o e a m a n u t e n C á o de

d i c i o n á r i o s e s p e c i a l i z a d o s v o l t a d o s p a r a a b r a n g ê n c i a de t e r m o s

t é c n i c o s que n ã o s ã o de i n t e r e s s e ou de u s o g e r a l . A e s t r u t u r a

d e s t e s d i c i o n á r i o s d e v e r á s e r c o m p a t í v e l com o c a r a t e r d i n â m i c o

d o s mesmos.

•••• 18

(28)

2.5 A n á l i s e do u s o de p a l a v r a s

A a n á l i s e das c a r a c t e r í s t i c a s de u s o d a s p a l a v r a s em

d i v e r s o s t e x t o s pode i n f l u e n c i a r no p r o j e t o de

U M v e r i f i c a d o r

0 r t o g i" á f i c o . C a r a c t e r f s t i c a s t a i s

C O M O

a f r e q uê n c i a d e u s o d a

P a 1 a v r a ? b e

M C

o

MO O S

eu t a

M

a n h o p o d e

M

c o n t r i b u i r d e f o r

M

a

P r o v e i t o s a n a c o n s t r u c ã o d o v e r i f içado r C T U P. B 8 1 3 .

De a c o r d o

C O M as informações o b t i d a s a t r a v é s d e s t a s

a n á l i s e s ? p o d e - s e c r i a r e s t r u t u r a s de d a d o s e a l g o r i t m o s que

w e l h o r s e a d a p t e m às p r o p r i e d a d e s da l i n g u a g e m u t i l i z a d a n o s

t e x t o s ? e q u e ? c o n s e q u e n t e m e n t e ? l e v e m o v e r i f i c: a d o r a a p r e s e n t a r

um me1hor d e s e m p e n h o »

E s t a s a n a l i s e s ? no e n t a n t o ? ex i gem um n ú m e r o s i gn i f i c a t i vo

de t e x t o s c o n t e n d o uma v a r i a d a gama de a s s u n t o s ? p a r a que s e

p o s s a e s t a b e 1 e c e r r e g r a s „ 0 t r a I:) a 1 h o f i c a b a s t a n t e s i

M p 1 i f i c a d o

q u a n d o p e s s o a s p e r t e n c e n t e s a á r e a s v o l t a d a s p a r a o e s t u d o do

c o m p o r t a m e n t o da língua?

C O M O

é o c a s o da L i n g u i s t i c a ? j á t e n h a m

1 e v a n t a d o e s t e t i p o d e i n f o r m a c ã o .

A i n e x i s t ê n c i a d e s t e t i p o de i n f o r m a ç ã o n ã o impede? no

e n t a n t o ? a c o n s t r u ç ã o de um VO. Uma v e z i m p l a n t a d o ? um VO

p o d e r á e v i d e n c i a r ? a t r a v é s de um u s o e x a u s t i v o ? as

c a r a c t e r í s t i c a s d a s p a l a v r a s n o s t e x t o s ? l e v a n d o o p r o j e t i s t a a

se c e r t i f i c a r se as e s t r u t u r a s e a l g o r i t m o s e s c o l h i d o s ?

i n i c i a 1 m e n t e ? s á o a d e q u a d o s ? e a f a z e r a 11 e r ac- o' e s n o s m e s m o s ?

c a s o s e j am n e c e s s á r i a s e p o s s f v e i

s-- 19

(29)

3.

àLQÍJim

UEEIEICâDQBES QBIQQBâEICQS EXISIEUIES

Es1e c a p f t u 1 o t e m como o b j e 1 i v o a p r e s e n t a r as

c a r a c t e r í s t i c a s b á s i c a s de a l g u n s v e r i f i c a d o r e s o r t o g r á f i c o s p a r a

a l í n g u a i n g l e s a e p o r t u g u e s a que s e t e m c o n h e c i m e n t o .

Nem s e m p r e um mesmo p a r â m e t r o s e r á a p r e s e n t a d o p o r t o d o s o s

v e r i f i c a d o r e s d e v i d o a i n e x i s t ê n c i a da i n f o r m a ç ã o na b i b l i o g r a f i a

p e s q u i s a d a . As i n f o r m a ç õ e s s o b r e o s v e r i f i c a d o r e s para. a l í n g u a

i n g l e s a c o n s t a m em a r t i g o s onde s ã o e v i d e n c i a d o s o s p r o b l e m a s

e n f r e n t a d o s d u r a n t e a f a s e de p r o j e t o ? e a s s o 1 u e: o e s e n c o n t r a d a s

P e1 o s p r o j e t i s t a s. A s i n f o r m aGO O S s o b r e o v e r i f i c a d o r p a r a a

l í n g u a p o r t u g u e s a c o n s t a m em m a n u a i s de u s u á r i o o n d e s e d á uma

m a i o r ê n f a s e á u t i l i z a G á o do v e r i f i c a d o r ? e n ã o â s u a c o n s t r u s ã o .

3.. 1 V e r i f i c a d o r e s p a r a a 1 í n g u a i n g 1 e s a

3 . 1 . 1 SPELL (DEC-10) CPETE 803

C r i a do em 1 9 7 1 po r P a i p h G o r i n ? o S PELL u s a o m e t o d o d e

v e r i f i c a ç ã o a n á l i s e de a f i x o s com c o n t r o l e s o b r e a f o r m a s a o de

p a l a v r a s . Tem p r o c e s s a m e n t o " o n - l i n e " e a p r e s e n t a s e u d i c i o n á r i o

em uma t a b e l a h a s h de 6 7 6 0 e n t r a d a s c u j o a c e s s o é d e t e r m i n a d o

p e 1 a f u ne a' o h a s h .

h ( P ) - <L1 * 26 + L 2 ) * 10 + m i n ( W L - 2 =. 9 )

onde L I e L2 = d o i s p r i m e i r o s c a r a c t e r e s da p a l a v r a P .•

r e s p e c t i v a m e n t e e WL t a m a n h o da p a l a v r a P.

- 2 0

(30)

3.1.2 TYPO ( U n i x ) CPETE « 0 3

E s t e v e r i f i c a d o r u s a o m é t o d o d e a n á l i s e da f r e q u ê n c i a de

d i g r a m a s e t r i g r a m a s n a s p a l a v r a s do t e x t o e u s a uma l i s t a de

2 5 0 0 p a l a v r a s m a i s comuns da l í n g u a p a r a ? a t r a v é s d e um p r o c e s s o

c o m p a r a t i v o ? r e d u 2 i r o t a m a n h o d a 1 i s t a a p r e s e n t a d a a o u s uá r i o.

A p r e s e n t a u m p r o c e s s a m e n t o " b a t c h ".

3.1.3 S P E L L ( U n i x ) CPETE 803 CBENT 85 3 Cílcli... 823

A p i" e s e n t a m o s m a i o r e s d e t a 1 h e s s o b r e e s t e v e r i f i c a d o r p o r

do i s mot i vos:: p r i me i r o p e l a ex i s t é n c i a de ma i o r e s i n f ormaoo'es na

b i b1 i o g r a f i a pe s g u i s a d a ? e s e g u nd o ? p e 1 a e n g e n h o s i da d e q u e

e n v o l v e u o s e u p r o j e t o ..

0 S P E L L f o i p r o j e 1 a d o p o r f\c I 1 r o y e m 19 7 8 „ M c 11 r o y

i n i c i a m e n t e dei d i c:ou-se á t a r e f a de c r i a Cá o do d i c i o n á r i o ?

i n c: 1 u i n d o v o c á b u 1 o s s e 1 e c i o n a d o s d e d i c i o n á r i o s e x i s t e n t e s ? o s

nomes p r ó p r i o s m a i s comuns da l i s t a t e l e f ó n i c a ? nomes f a m o s o s ?

n o M e m i t o 1 ó g i e: o s ? n o m e s d e g r a n d e s c o m p a n h i a s ? n o m e s g e o g r á f i c: o s ?

de a n i m a i s e de p a l a v r a s , , 0 r e s u l t a d o f o i uma l i s t a d e 7 5 0 0 0

p a i a v r a s .

Cl c: :t 1 r o y o p t o u p e 1 o m é t o d o d e a n á 1 i s e d e a f i x o s

P O

r a c h á - 1 o

n e c e s s á r i o e c o n v e n i e n t e . N e c e s s á r i o p o r n'áo h a v e r nenhuma l i s t a

com t o t a l a b r a n g ê n c i a s o b r e a l í n g u a i n g l e s a ? e c o n v e n i e n t e p e l a

r e d u c a o do t a m a n h o de d i c i o n á r i o d e 7 5 0 0 0 p a r a 3 0 0 0 0

p a l a v r a s » Uma v e z que a r e t i r a d a de a f i x o s p o d e r i a d e s t r u i r a

o r d e m a 1 f a b é t i e: a d o t e x t o ? 11 c 11 r o y o p t o u p o r u m a c e s s o r a n dó' m i c o

ao d i c i o n á r i o.

21

(31)

-P a r a que o S -P E L L a p r e s e n t a s s e um bom desempenho.- e r a

n e c e s s á r i o m a n t e r o d i c i o n á r i o na m e m ó r i a p r i n c i p a l - Mas? f l c l l r o y

s ó d i s p u n h a de uma m e m ó r i a com ó4 Kb de e s p a ç o de e n d e r e ç a m e n t o »

A s a 1 d a f o i a s s o c i a i " o m é t o d o d e a n á 1 i s e d e a f i x o s à

r e p r e s e n t a ç ã o " T o t a l H a s h i n g " p a r a o d i c i o n á r i o . Na p e s q u i s a de

urna p a l a v r a ? s e r i a a c e s s a d o o H ( P ) - é s i m o b i t da t a b e l a ?

c l a s s i f i c a n d o a p a l a v r a como c o r r e t a ? s e o mesmo e s t i v e r l i g a d o .

íl(P) r e p r e s e n t a a f u n ç ã o h a s h a q u a l a p a l a v r a P é s u b m e t i d a p a r a

g e r a s S o de uma e n t r a d a da t a b e l a . Uma p a l a v r a i n c o r r e t a p o d e r á

l e v a r a um b i t l i g a d o » No e n t a n t o ? a p r o b a b i l i d a d e d e s t e f a t o

o c o r r e i " é t ã o b a i x a que f l c l l r o y c o n s i d e r o u o f a t o i n s i g n i f i c a n t e »

A f a l h a é de um e r r o p a r a c a d a 4 0 0 0 p a l a v r a s v e r i f i c a d a s .

P a r a r e d u z i r a i n d a ma i s o e s p a ç o u t i 1 i z a d o p e l o d i c i o n á r i o ?

f l c l l r o y o r d e n o u a l i s t a de p a l a v r a s e p a s s o u a r e p r e s e n t a r

a p e n a s as d i f e r e n G a s e n t r e os s u c e s s i v o s v a l o r e s d o h a s h ? ou

s e j a ? a d i f e r e n ç a e n t r e a s e n t r a d a s da t a b e l a c u j o b i t e s t a r i a

ligado» F i c o u e s t a b e l e c i d o que o v a l o r i n i c a l s e r i a i g u a l a z e r o .

Ga s t a - s e ? em m é d i a ? :l. 3 ? 6 b i t s p a r a r e p r e s e n t a r um a d i f e r eno a »

Como r e s u l t a d o ? f l c l l r o y o b t e v e um d i c i o n á r i o que u s a 64 kb de

memor i a p r i nc i p a 1 »

f l c l l r o y a i n d a c r i o u a " L i s t a de Excectíes"» o n d e s e r i a m

i n c 1 u f d a s a s p a 1 a v r a s i n c o r r e t a s c o n s t i t u í d a s d e r a d i c a 1 e a f i x o s

c o r i" e t o s.- r e s u l t a n t e s ? na m a i o r i a d a s v e z e s ? d e u m e r r o n o

p r o c e s s o de d i g i t a ç ã o . As p a l a v r a s que c o n s t a m n e s t a l i s t a n ã o

s e r ã o r e c o n h e c i d a s como c o r r e t a s p e l o SPELL? mesmo que s e u s

a f i x o s e r a d i c a l c o n s t e m n o s d i c i o n á r i o s e s p e c í f i c o s .

(32)

Com uma ú n i c a e s i mp 1 es e s t r u t u r a de r e p r e s e n t a s á o de

d i c i o n á i" i o i1 c I'). r o y c o n s e g u i u c r i a r u

M V 0 d e e x c e l e n t e

d e s e

M p e n h o c u j a s c a r a c t e r 1 s t i c a s d i f i c i 1 m e n t e s á o e n c o n t r a d as em

um mesmo v e r i f i c a d o r o r t o g r á f i c o ; b a i x a t a x a de e r r o ? u s o de

p o u c o e s p a ç o de m e m ó r i a e um t e m p o de r e s p o s t a b a s t a n t e

s a t i s f a t ò r i o.

3»2 V e r i f i c a d o r o r t o g r áf i c o p a r a a 1 1 n gu a po r t u g u e s a

0 B e s t S p e l l IIWILD 8 6 1 f o i c r i a d o p e l a s o f t w a r e h o u s e U i l d

West., E s t e v e r i f i c a d o r u s a o m é t o d o de a n á l i s e de a f i x o s e

a p r e s e n t a p r o c e s s a m e n t o " b a t c h + s e m i •- i n t e r a t i v o " .

A s o f t w a r e ho u s e a 1e g a q ue s e u d i c i o n ár i o t e m uma

a b r a n g é n c i a d e -.< m a i s o u m e n o s ? 10 0., 0 0 0 p a 1 a v r a s ? e é r e p r e s e n t a d o

em uma t a b e l a hash? p e r m i t i n d o a v e r i f i c a ç ã o de 6 0 0 0 p a l a v r a s

P o i" m i n u t o em mi c r o c o m p u t a d o r e s c o m p a t f v e i s c o m o I B fl P C

a m e r i c a n o de 4? 77 ílHz? com uma t a x a de e r r o de uma f a l h a p a r a

c a d a 1 0 0 . 0 0 0 p a l a v r a s p e s q u i s a d a s » P e r m i t e a i n d a a c r i a e á o e

m a n u t e ne á o d e d i c i o ná r i o s e s p e c i a i i z a d o s «

Algumas c a r a c t e r í s t i c a s que a s o f t w a r e h o u s e a t r i b u i ao B e s t

S p e l l nos l e v a m a c r e r que e s t e v e r i f i c a d o r u t i l i z a " T o t a l

H a s h i n g " p a r a r e p r e s e n t a ç ã o do d i c i o n á r i o p a d r ã o . S e g u n d o o

m a n u a l de u s u á r i o ? a i n c l u s ã o de uma n o v a p a l a v r a no d i c i o n á r i o

p a d r ã o não a u m e n t a o t a m a n h o deste» Mo e n t a n t o ? o c o r r e um p e q u e n o

a u m e n t o na p r o b a b i l i d a d e de u m a

P a 1 a v r a i n c o r r e t a náo s e r

d e t o c t a d a. A l é m d i s s o ? t em-s e a a1 t a v e1 o c i d a d e d e v e r i f i c ao á o e

a p e q u e n a á r e a u t i 1 i z a d a p e l o d i c i o n á r i a guiando a r q u i v a d o em

23

(33)

-d i s c o 50 Kb „ A i nc 1 u s ã o -de Ma i s p a i a v r a s s i gn i f i c a Ma i s b i t s

l i g a d o s - N'áo o c o r r e n d o a u m e n t o na t a b e l a hash? a p r o b a b i l i d a d e de

e r r o ê M a i o r » 0 d i c i o n á r i o a r m a z e n a d o em d i s c o ? é? na r e a l i d a d e ?

UMa t a b e l a de b i t s .

(34)

-á. QBBâtilZâJCfiQ DE UO yEBIEICâQQB QBIQOBÔEICQ

BâBâ â LIfcieUâ EQBIUBUESâ lUQLEJi

A l í n g u a p o r t u g u e s a t e m c a r a c t e r í s t i c a s que j u s t i f i c a m

P e i" f e i t a m e n t e a u t i 1 i 2 a o & o cl e u m v e r i f i c a d o r o r t o g r á f i c o:

p o r t u g u ê s n ã o ê

UM a língua t o t a l Mente fonética» Nem

s e m p r e e x i s t e uma c o r r e s p o n d ê n c i a d i r e t a e n t r e o

S O M e

a o r t o g r a f i a d a s p a 1 a v r a 5 „

•- M u i t o s p r e f i x o s e s u f i x o s da língua p o r t u g u e s a s e r v e m

aos mesmos p r o p ó s i t o s e a p r e s e n t a m p e q u e n a s variastíes

o r t o g r á f i c a s ?

C O M O

p o r e x e m p l o : em~? en-» i n ~ ?

( MOV i Mento para d e n t r o ) ? i m- ? i n- ? i ••- < s e n t i do

c o n t r á r i o ? n e g a e á o ) ? á o s - ? d e s - ? 'á e s - ( p 1 u r a 1 d e

p a l a v r a s t e r m i n a d a s em á o ) .

- a l í n g u a p o r t u g u e s a p o s s u i i n ú m e r a s p a l a v r a s que se

c o n s t i t u e m » de uma f o r m a ou de o u t r a ? e x c e e ã o a a l g u m

t i po de regra»

- a c o n j ugaoiâo de v e r b o s na 1 fngua. p o r t u g u e s a é b a s t a n t e

c o m p l e x a » Sa'o i n ú m e r o s os v e r b o s que s e c o n j u g a m de

f o r m a t o t a 1 m e n t e i r r e g u 1 a r

-T o d a s e s t a s c a r a c t e r í s t i c a s l e v a m a f r e q u e n t e s e r r o s de

o r t o g r a f i a ? e r r o s d e c o r r e n t e s da i g n o r â n c i a do a u t o r . Se a e s t e s

e r r o s s ornam - s e a q u e 1 e s p r o v e n i e n t e s d o p r o c e s s o de d i g i t a e 'á o d e

t e x t o s ? a t i n g e - s e um nível de e r r o t a l ? que o a u x í l i o de um

v e r i f i c a d o r o r t o g r á f i c o t o r n a-s e d e g r a n d e i m po r t a n c i a.

(35)

O p r o j e t o e a i m p 1 a n t a G ã o de um v e r i f i c a d o r o r t o g r á f i c o e n v o l v e m praia l e m a s nem s e m p r e t r i v i a i s ? c o n f o r m e v i m o s no CAPITULO 2. E q u a n d o e s t e v e r i f i c a d o r é v o l t a d o p a r a uma l í n g u a

c o m c a r a c t e r i s t i c a s i g u a i s a e s t a s a p r e s e n 1 a d a s a n t e r i o r m e n t e ? o e s f o rG o do p r o j e 1 i s t a ? na b u s c a de uma s o l ueS'o p a r a os mesmos ?

t o r n a •••• s e b e m m a i o r . As s e E ti e S S e g u i n t e s s 'á o d e d i c a d a s à a p r e s e n t a ç ã o d a s n o s s a s soluctíes p a r a o s p r o b l e m a s comuns ao p i"o j e t o de um V0 . 4 . 1 M é t o d o de v e r i f i c a r ã o o r t o g r á f i c a d o UOLP T i' n h a m o s u m p r i n c 1 p i o f u n d a m e n t a 1 » t e n t a r m a n 1 e r a s i m p I i c i cl a cl e o m á x i m o p o s s 1 v e 1 ? e x c e t o q u a n cl o a m e s m a v i e s s e c o m p r o m e t e r a e f i c i ê n c i a o u o d e s e m p e n h o do VOLP. E r a P r i o i" i t á r i a a c r i a c 'á o d e e s t r u t u r a s s i m p 1 e s que 1 e v a s s e m ? p o s t e r i o r m e n t e ? a a l g o r i t m o s i g u a l m e n t e s i m p l e s ? f a c i l i t a n d o a i m p 1 a n 1 a c '3i o e a m a n u t e n a: ã o d o v e r i f i c a d o r -B a s e a cl o s n o f a t o que o u s o de d i c i o n á r i o na v e r i f i c a «: 'á o o r 1 o g i" á f i c a r e p r e s e n t a u m nível d e s o f i s t i c a G a' o m a i o r q u e a u t i 1 i za Gá o d e a n á1 i s e s e s t a 11s t iças? s e r a n d o ? n a m a i o r i a d as v e z e s m e l h o r e s r e s u 11 a d o s C P E T E 8 0 :i ? e c o n s i cl e r a n cl o q u e o v 01... P s e r i a v o l t a d o p a r a m á q u i n a s de p e q u e n o p o r t e ? a c h a m o s m a i s a d e q u a d o o u s o de d i c i o n á r i o s e d o m é t o d o de a n á l i s e de a f i x o s » P a r a e v i t a r que p a l a v r a s i n c o r r e t a s ? c o n s t i t u í d a s de r a d i c a l e a f i x o s c o r r e i o s ? f o s s e m c l a s s i f i c a cl a s c o m o c o r r e t a s ? r e s o l v e m o s e s t a b e l e c e r c o n t r o l e s o b r e o u s o a d e q u a d o de r a d i c a i s e a f i x o s a t r a v é s de r e g r a s » - 2 ó

(36)

UMa r e g r a r e p r e s e n t a um c o n j u n t o de s u f i x o s e* uma v e z

a s s o c i a d a a um r a d i c a l - . . e s t a b e l e c e que os mesmos podem s e u n i r

f o r m a n d o uma p a l a v r a o r t o g r a f i c a m e n t e c o r r e t a . M a i o r e s d e t a l h e s

s o b r e o u s o de r e g r a s s e r á o a p r e s e n t a d o s no

C A P I T U L O 15?

quando

espec: i f i c a r m o s a e s t r u t u r a do d i c i o n á r i o „

Nem t o d o s o s s u f i x o s que podem se l i g a r a um r a d i c a l p a r a

f o r m a ç ã o de uma p a l a v r a v á l i d a c o n t i n u a m t e n d o e s t a

ca r a c t e r f s t i c a s e a e s t e r a d i c a 1 s e a c r e s c e n t a r u m o u m a i s

p r e f i x o s »

C

o m o e x e m p 1 o a p r e s e n t a m o s o r a d i c a 1

p o b r .

0

s u f i x o

-e z i n h o

p o d e s e l i g a r a e s t e r a d i c a l f o r m a n d o uma p a l a v r a

o r t o g r a f i c a m e n t e c o r r e t a . . No e n t a n t o ? se a s s o c i a r m o s a e s t e

r a d i c a l o p r e f i x o em-? e s t e s u f i x o n ã o m a i s p o d e r á s e u n i r ao

r a d i c a l pobr,

0 uso do s u f i x o -ecer só então é p e r m i t i d o j u n t o a

e s t e r a d i c a l ? d e v i d o a a s s o c i a ç ã o d a q u e l e p r e f i x o .

0 LI s o d e r e g r a s q u e d e t e r m i n a s s e m a f o r m a«: á o d e p a l a v r a s c o m

relaeiáo t a n t o a o s p r e f i x o s q u a n t o a o s s u f i x o s ? l e v a r i a a uma

e s t r u t u r a de d i c i o n á r i o r a z o a v e l m e n t e c o m p l e x a que? a l é m de

r e q u e r e r um m a i o r e s p a ç o de a r m a z e n a m e n t o ? c o n t r i b u i r i a p a r a

t o r n a r o a 1 g o r 11mo de a n á 1 i s e de a f i x o s ma i s 1 e n t o e comp 1 exo»

A s o l u ç ã o e n c o n t r a d a f o i o p t a i — s e p e l a a n á l i s e apenas de

s u f i x o s ? mesmo s a b e n d o ~ s e que e s t a d e c i s ã o a c a r r e t a r i a em um

aumento no t a m a n h o do d i c i o n á r i o . S ó o s u f i x o de uma p a l a v r a s e r á

e x t r a í d o ? não s e f a z e n d o nenhuma d i s t i n ç ã o e n t r e o p r e f i x o e o

r a d i c a l .

0 que na língua p o r t u g u e s a c o n s i d e r a - s e p r e f i x o m a i s

r a d i c a i ? p a r a o

V O L P

s e r á c o n s i d e r a d o a p e n a s um r a d i c a l . I s t o é

v á l i d o t a n t o p a r a as p a l a v r a s do t e x t o q u a n t o para a s p a l a v r a s do

Referências

Documentos relacionados

Para traçar a evolução das relações de trabalho no Brasil este estudo divide- a em quatro etapas: passagem do trabalho escravo para o trabalho livre assalariado; integração

2. Destaque três determinantes que aparecem na tirinha, juntamente com seus substantivos. Era uma vez quatro indivíduos que se chamavam Todos, Alguém, Cada um e Ninguém. Todos tinham

Треба нам йти за вказівками найбільшого філософа, Ісуса Христа, які не прийшли, щоб засипляти людей і заохочувати, щоб раділи з того, що нема

A largura total da borracha de ligação deverá ser 25 mm maior que a largura nominal do piso do Anel selecionado (Ver TABELA DE DADOS – BLD 03) isto para que

Posteriormente, houve a análise de dois exemplos de conteúdos patrocinados nos moldes da publicidade nativa, disponibilizada pelo portal Buzzfeed, em seu site e página

A inclusão pressupõe acessibilidade. Muito mais de que ocupar os mesmos espaços os excluídos devem poder participar ativamente, trocar experiências e ter autonomia. A inclusão

Estudo realizado por Jamas, Hoga e Reberte (2013), que buscou, através de um estudo qualitativo, explorar a experiência relativa à assistência ao parto recebida em um centro de

Avaliação da infiltração de água no solo, em sistema de integração agricultura-pecuária, com uso de infiltrômetro de aspersão portátil. European small portable rainfall