• Nenhum resultado encontrado

O corpus tibullianum: uma análise quantitativa

N/A
N/A
Protected

Academic year: 2017

Share "O corpus tibullianum: uma análise quantitativa"

Copied!
17
0
0

Texto

(1)

A l f a , São P a u l o 2 5 : 3 1 - 4 7 , 1981

O CORPUS T I B U L L I A N U M :

U M A ANÁLISE Q U A N T I T A T I V A

Enzo Del CARRATORE*

Cicília Yuko W A D A * *

RESUMO: A partir dos dados extraídos do Corpus Tibullianum, e s u b m e t i d o s a t r a t a m e n t o es-tatístico, os a u t o r e s p r e t e n d e m reforçar a o p i n i ã o g e r a l m e n t e aceita de q u e a o b r a não f o i c o m p o s t a p o r um único p o e t a , a d m i t i n d o a p l u r a l i d a d e de a u t o r e s . P a r a t a n t o , u t i l i / a m , a distribuição de W a r i n g e os índices mais recentes de r i q u e z a l e x i c a l , a p o n t a n d o , e n t r e as d u a s partes e m q u e d i v i d i r a m o C o r p u s , di-ferenças que corroboram a hipótese inicial.

UNITERMOS: Estatística lexical; distribuição de Waring; estimadores; índices de riqueza lexical; extensão teórica do vocabulário.

I N T R O D U Ç Ã O

O presente t r a b a l h o irá apresentar uma abordagem q u a n t i t a t i v a dos dados fornecidos pelo Corpus Tibullianum, c o m a intenção precípua de salientar a u t i l i d a -de e a conveniência do emprego -de técni-cas probabilístitécni-cas de análise c o m o recurso eficaz de convalidação de teorias l i n -güísticas o u literárias. N ã o p r o p o m o s a substituição dos métodos q u a l i t a t i v o s tradicionais de interpretação de fatos l i n -guisticos o u de apreciação de obras literá-rias; desejamos somente m o s t r a r a críticos literários e a lingüistas alguns i n s t r u m e n -tos de trabalho que lhes poderão ser úteis e valiosos.

O aparato matemáticos sobre o q u a l se alicerça o t r a b a l h o f o i r e d u z i d o ao mínimo indispensável para a c o m p r e e n -são de qualquer leitor, p o r leigo que seja; fizemos isso para não espantar e afugen-tar a nossa clientela p o t e n c i a l de lingüistas

e de literatos, t r a d i c i o n a l m e n t e avessa neste país à ingerência de métodos de u m a ciência " e x a t a " n u m domínio p r e s u m i v e l -mente insubmisso a leis o u t r a s que não se-jam as da livre e espontânea criação. N o entanto, a ciência lingüística m u i t o l u c r a -ria c o m a aliança de que nos p r o p o m o s apresentar u m a breve e singela a m o s t r a . Mais e m e l h o r fizéramos, se tivéssemos à disposição dados que, c o r r i q u e i r o s em o u tras terras, inexistem na nossa; esta l i m i -tação servirá ao mesmo t e m p o de apelo aos estudiosos patrícios, e de p e d i d o de desculpas antecipado pelas eventuais fa-lhas ou omissões de nosso a r t i g o .

1 D I S T R I B U I Ç Ã O D E W A R I N G

I R W I N5

ao investigar o ajuste de modelos teóricos para descrever, na área das ciências biológicas, distribuições de freqüências c o m caudas longas, propôs a utilização de u m a distribuição baseada na expansão de u m a série de termos descres-centes, conhecida p o r série de W a r i n g :

1

x-a x ( x + 1)

+

a ( a + 1) x ( x + 1) (x + 2) + .

a ( a + l ) . . . ( a + i-2)

x ( x + l ) . . . ( x + i - l )

(D

* P r o f e s s o r T i t u l a r d o D e p a r t a m e n t o d e L i n g ü í s t i c a e L í n g u a P o r t u g u e s a d o I n s t i t u t o d e L e t r a s , H i s t ó r i a e P s i c o l o g i a — C a m p u s de A s s i s — U N E S P , S P .

(2)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

Essa série, p o r ser convergente para x > a > 0 pôde ser t r a n s f o r m a d a em distribuição discreta de p r o b a b i l i d a d e s ,

x-a a(x-a) (x-a)a(a + 1 )

x ( x + 1) x ( x + 1) (x + 2)

com parâmetros x e a, m u l t i p l i c a n d o os termos p o r (x-a):

+ ... +

( x - a ) a ( a + l ) . . . ( a + i-2) x ( x + l ) . . . ( x + i - l ) = 1 ( I I )

I r w i n d e n o m i n o u essa distribuição de probabilidades de "Distribuição de W a -r i n g " *.

1.1. H E R D A N4

em 1964, investigou p o r suas vez a aplicação da distribuição de Waring a dados o b t i d o s de textos literários, q u a n d o se realiza a contagem dos d i -ferentes vocábulos c o m freqüência i =

Pi = A s s i m :

x-a

1,2,3,... E m u m texto de t a m a n h o N , constituído de V vocábulos, observa-se que a distribuição dos V, vocábulos, isto é, dos vocábulos que aparecem n o t e x t o dado c o m freqüência 1,2,3..., é decres-cente; em v i r t u d e dessa p r o p r i e d a d e da distribuição, H e r d a n c o m p r o v o u o ajuste da distribuição de W a r i n g a dados l e x i -cais.

é a p r o b a b i l i d a d e de u m vocábulo ter freqüência 1;

p2 _ (x-a)a e a p r o b a b i l i d a d e de u m vocábulo ter freqüência 2; x ( x + l )

p _ ( x - a ) a ( a + l ) . . . ( a + i-2) é a p r o b a b i l i d a d e de u m vocábulo ter fre-1

x ( x + l ) . . . ( x + i - l ) qüênciai.

Para se obter o v a l o r de cada Pj (isto é, a p r o b a b i l i d a d e de u m vocábulo ter n o texto a freqüência i ) , é necessário conhe-cer o valor dos parâmetros a e x - o que nos leva ao p r o b l e m a dos estimadores desses parâmetros, que será t r a t a d o n o item seguinte.

U m a vez de posse dos valores de â e x, pode-se c o n s t r u i r o m o d e l o teórico de distribuição das freqüências dos vocábu-los n u m t e x t o q u a l q u e r , a p l i c a n d o a dis-tribuição de W a r i n g , d a seguinte m a n e i r a :

x-a x

(x-â)â v

x ( x + 1)

(x-a)â(â + 1)

o u : E ( v2) = E ( V , ) x + 1

x ( x + 1) (x + 2)

( x - â ) â ( â + l ) . . . ( â + i-2)

V o u : E ( V3) = E ( V2)

(â + 1) E ( V , )

E ( V2)

E ( V3 ) =

E ( V j ) =

x ( x + l ) . . . ( x + i - l )

Desse m o d o , o b t e m o s o número de d o que eles se r e p a r t a m de fato segundo a vocábulos que se espera e n c o n t r a r r e p a r t i - distribuição de W a r i n g .

dos pelas classes de freqüência i , a d m i t i n

-(x + 2)

o u : E ( V j ) = E ( V M)

â + i - 2

x + i-1

* U m estudo sucinto da distribuição (11), a p a r t i r d a e x p a n s ã o d a f u n ç ã o -p u n h a este a r t i g o .

(3)

acom-C A R R A T O R E , E . D e l & W A D A , acom-C . Y . O acom-C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São

P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

1.2 Estamos agora diante de duas d i s t r i -buições de freqüência: u m a observada, e a outra esperada — a construída sobre o modelo ora descrito. F o r m u l a m o s então a "hipótese n u l a " H0, isto é, a hipótese da "não diferença" entre as duas d i s t r i b u i -ções. O p r o b l e m a que se apresenta é o de verificar se os desvios existentes entre os valores efetivos observados V j e os espera-dos E(Vj) são significativos o u não: se os desvios se revelarem significativos, isto é, superiores a u m valor crítico a que está as-sociada uma p r o b a b i l i d a d e de ocorrência aleatória, rejeitamos a hipótese n u l a e concluímos que o m o d e l o teórico de dis-tribuição de freqüências não se ajusta aos dados observados; ao contrário, se os des-vios não forem significativos, não pode-mos rejeitar a hipótese n u l a , o que nos permite aceitar, d e n t r o de u m a m a r g e m previsível de erro, o fato de que o m o d e l o teórico se ajusta aos dados reais.

Para testar a hipótese n u l a , isto é, pa-ra tomar a decisão de rejeitá-la o u não, utilizamos o teste de aderência ( x2

de Pearson)*.

Rejeita-se H0 q u a n d o o v a l o r d o x2 obtido for superior o u igual ao v a l o r d o x2

crítico, c o m u m número de graus de l i -berdade dado p o r n = i - j - 1 , onde i é o nú-mero de classes de freqüência, e j o núme-ro de parâmetnúme-ros estimados.

2. OS E S T I M A D O R E S

U m m o d e l o probabilístico é caracte-rizado por seus parâmetros. C o m o esses

parâmetros n o r m a l m e n t e são desconheci-dos, torna-se necessário "estimá-los", is-to é, encontrar, a p a r t i r de dados amos-trais, valores que mais se a p r o x i m e m dos verdadeiros valores dos parâmetros p o p u -lacionais. Esses valores são resultados da-quilo que na Estatística c o s t u m a chamarse de " e s t i m a d o r e s " , que são então f u n -ções de variáveis aleatórias.

Para d e t e r m i n a r c o m o máximo de precisão o valor de u m parâmetro, pode-mos construir u m número p r a t i c a m e n t e i l i m i t a d o de estimadores ad hoc, além daqueles baseados em técnicas c o n v e n c i o -nais c o m o , p o r e x e m p l o , os estimadores obtidos pelo método da máxima verossi-milhança. Estes estimadores, e m b o r a pos-suam ótimas p r o p r i e d a d s e p o r isso for-neçam os melhores resultados, são de difícil obtenção na prática, p o r q u e as equações de máxima verossimilhança somente podem ser solucionadas p o r p r o -cessos iterativos, e x i g i n d o o e m p r e g o de algoritmos e o uso de c o m p u t a d o r .

N o caso dos parâmetros a e x da dis-tribuição de W a r i n g , e x a m i n a r e m o s a se-guir três tipos de estimadores dentre os comumente usados.

2.1 I r w i n propôs estimadores baseados na média observada£ i e na p r o b a b i l i d a d e p, associada aos vocábulos de freqüência 1. Daí as fórmulas **

a =

( I I I )

* P o r esse teste, o v a l o r d o x2

o b t i d o s e g u n d o a f ó r m u l a f, s e r v e p a r a a v a l i a r , e m t e r m o s d e p r o -b a -b i l i d a d e , o d e s v i o c o n s t a t a d o e n t r e os v a l o r e s r e a i s e os t e ó r i c o s . U m a d a s l i m i t a ç õ e s d o t e s t e é a d e o f e r e c e r r e s u l t a d o s p o u c o c o n f i á v e i s p a r a v a l o r e s c a l c u l a d o s m u i t o p e q u e n o s ; c o n v e n c i o n a - s e f i x a r o l i m i t e d e 5 c o m o o v a l o r m í n i m o a b a i x o d o q u a l o teste se t o r n a i n e f i c i e n t e , e p o r essa r a z ã o c o s t u m a s e a c u m u l a r as classes d e f r e q ü ê n c i a m a i s e l e v a d a n a c a u d a d a d i s -tribuição, a p a r t i r d o m o m e n t o e m q u e a p r i m e i r a d e l a s a p r e s e n t a r u m v a l o r c a l c u l a d o i n f e r i o r a 5. É o q u e se v e r i f i c a r á l o g o a d i a n t e nas t a b e l a s q u e i n t e g r a m este t e x t o .

* * A o b t e n ç ã o dessas f ó r m u l a s será d e t a l h a d a n o A n e x o .

(4)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

X = 1

$ 1

( I V )

Ml

Lembramos que a média observada é por esse a u t o r o b t i d a considerando i = 0,1,2,

" 1 = O p , + l p2 + 2 p3 + . . . + ( i - l ) p j ( V )

Observe-se, a esta a l t u r a , que I r w i n , ao lidar com problemas biológicos, consi-derou uma variável aleatória que assumia o valor inicial zero, o que não o c o r r e evi-dentemente c o m dados lingüísticos, onde

a variável "classe de freqüência" assume usualmente os valores i = 1,2,3,. . .

Deste m o d o , a média observada f = é obtida por:

f = l p j + 2 p2 + 3 p3 + . . . + i p ; ( V I )

A diferença entre f e é i g u a l a 1, o b t i d a pela subtração, m e m b r o a m e m b r o , de ( V I ) menos ( V ) , que resulta e m :

f / i , = P i P2 P 3

+ . . . +

C o m o , p o r definição, a soma das p r o b a b i l i d a d e s é sempre i g u a l a 1, l o g o

f — " 1 = 1 Ml

= ?

1

U t i l i z a r e m o s u m a notação mais f a m i l i a r aos que t r a b a l h a m c o m d a d o s lingüís-ticos, o p e r a n d o as seguintes substituições:

P l = q , = 1

V f =

N

Desta f o r m a , os estimadores ( I I I ) e ( I V ) de I r w i n p o d e m ser n o t a d o s p o r :

1

1 1

v V

( V I I )

1

-( V I I I )

2.2 A o aplicar os estimadores de I r w i n a dados de natureza lingüística, na t e n t a t i v a de ajuste do m o d e l o de W a r i n g à d i s t r i -buição de freqüências dos vocábulos de um texto literário, H e r d a n cometeu o equívoco de não perceber a diferença de 1

(5)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São

P a u l o , 25:31-47, 1 9 8 1 .

a = 1

( 1 -V D

V

( I X )

N

( V >

( X ) a

x

=

1 - V , v " 2.3 U m recente t r a b a l h o de R A T -K O W S -K Y1 0

chamou-nos a atenção para novos estimadores, descobertos p o r aquele pesquisador, e que, aplicados à d i s t r i -buição de W a r i n g , fornecem em m u i t o s casos um melhor ajuste de u m m o d e l o ca-paz de descrever satisfatoriamente a dis-tribuição dos vocábulos de u m texto se-gundo a o r d e m de freqüência de suas ocorrências. Isto po r qu e, ao contrário de Irwin e de H e r d a n , que levaram em c o n t a apenas os parâmetros f (freqüência

mé-dia) e P| ( p r o b a b i l i d a d e de ocorrência de um vocábulo de freqüência 1), R a t k o w s k y propõe u m método de estimação que u t i l i -za as classes de freqüência 1, 2 e 3 — o que p r o p o r c i o n a m a i o r f l e x i b i l i d a d e ao processo de cálculo dos valores teóricos, resultando daí, geralmente, u m a m e l h o r concordância entre os dados observados e os calculados para as várias classes de fre-qüência.

Os novos estimadores para os parâ-metros a e x são o b t i d o s pelas fórmulas

ü = d + ( d2

+ e )1 / 2

( X I )

â --= x ( l - p , ) ( X I I )

que requerem o cálculo prévio dos seguintes termos:

b = P2 * P.l

Pi

c = 2 + p2

- 3 pf - b

d =

hlLtAi^.

1

!

c

(6)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

O autor desse n o v o método de esti-mação aplicou-o a 33 obras literárias, ten-do o b t i d o resultaten-dos sensivelmente me-lhores em 26 casos em relação aos o b t i d o s através dos estimadores de I r w i n , e em 21 casos em relação aos o b t i d o s pelos estima-dores de H e r d a n . Além disso, R a t k o w s k y mostrou que, para 28 das 33 obras, a dis-tribuição de W a r i n g , calculada a p a r t i r dos novos estimadores, oferece u m a c o n -cordância aceitável c o m os dados observados, em termos de p r o b a b i l i d a d e , v e r i -ficada através do teste x2

.

3. A N Á L I S E Q U A N T I T A T I V A D O

Corpus Tibullianum.

Estamos agora em condições de a p l i

-car as noções teóricas expostas até a q u i à obra que constituirá o p r i n c i p a l o b j e t o d o nosso estudo.

3.1 À guisa de préteste e de e x e m p l i f i c a -ção do método empregado, a p l i c a m o s o procedimento descrito p o r R a t k o w s k y , comparando os resultados c o m os valores obtidos com a utilização dos estimadores de I r w i n e de H e r d a n . A o b r a escolhida para este p r i m e i r o ensaio f o i o p o e m a l a t i no Aetna, de a u t o r i a desconhecida *. C o -mo não dispúnha-mos de índice de palavras, procedemos ao l e v a n t a m e n t o m a -nual de todas as ocorrências d o t e x t o e à contagem das diversas classes de freqüên-cia, b que deu o r i g e m à tabela seguinte **:

TABELA 1

Valores observados e calculados dos vocábulos no poema Aetna

D a d o s : N = 4 3 2 4 , V = 1446, V , = 7 6 8 , V2 = 2 8 3 , V3 = 135

V a l o r e s c a l c u l a d o s V a l o r e s c a l c u l a d o s V a l o r e s c a l c u l a d o s Freqüências V a l o r e s o b s e r v a d o s E s t i m a d o r e s de I r w i n E s t i m a d o r e s de H e r d a n E s t i m a d o r e s de R a t k o w

¡ V . E f V ^ E ( V ¡ ) E t V ^

1 768 7 6 8 , 0 0 7 6 8 , 0 0 7 6 8 , 0 0

2 283 2 7 7 , 9 5 2 6 2 , 0 2 2 8 2 , 4 5

3 135 133,54 126,35 135,55

4 56 75,03 7 2 , 4 6 7 5 , 6 7

5 55 4 6 , 6 1 4 6 , 1 9 4 6 , 6 2

6 30 3 1 , 0 6 31,63 3 0 , 8 0

7 24 2 1 , 8 0 2 2 , 8 1 2 1 , 4 3

8 14 15,93 17,11 1 5 , 5 2

9 14 12,02 13,23 1 1 , 6 1

10 13 9 , 3 1 10,49 8,92

11 6 7,36 8 , 4 9 7 , 0 0

12 3 5,93 6,99 5 , 6 0

» 1 3 45 4 1 , 4 6 60,23 3 6 , 8 3

â 1,58652 1,25261 1,70548

X 3 , 3 8 3 6 4 2 , 6 7 1 5 0 3 , 6 3 7 3 5

X 2

1 0 g . l . 10,73 15,91 1 2 , 6 2

distribuição 0 , 6 2 1 0 6 0 , 8 9 7 7 6 0 , 7 5 4 3 0

p r o b a b i l i d a d e 3 7 , 8 9 10,22 2 4 , 5 7

r e s u l t a d o não r e j . H0 não r e j . HQ não r e j . H0

* U t i l i z a m o s a e d i ç ã o a c a r g o d e J . V e s s e r e a u , p u b l i c a d a p o r " L e s B e l l e s L e t t r e s "3.

(7)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

3.1.1 Comentários.

H0: V j = E(Vj)sigHifica que os desvios entre os valores re;:is e os d o m o d e l o teóri-co não são significativos; isto é, os valores reais seguem a distribuição de W a r i n g . A não rejeição da hipótese n u l a parece evidenciar que o m o d e l o teórico ( d i s t r i b u i -ção de W a r i n g ) se ajusta aos dados da rea-lidade fornecidos pelo t e x t o .

Notese que o m e l h o r ajuste d o m o -delo é dado, no nosso e x e m p l o , pelos esti-madores de I r w i n , e m b o r a os estiesti-madores de Ratkowsky e mesmo os de H e r d a n também tenham apresentado resultados que podem ser considerados satisfatórios. 3.2. Aplicaremos o mesmo p r o c e d i m e n t o aos dados extraídos do Corpus

Tibullia-num, obtidos p o r contagem m a n u a l a

par-tir do levantamento já c i t a d o de D e l l a Ca-sa, das "concordâncias" d o Corpus. Alguns esclarecimentos p r e l i m i n a r e s se fazem nece- i r i o s .

Inicialmente, acatando u m a c r i t e r i o -sa observação de C. M u l l e r 8

e l i m i n a m o s da contagem todos os nomes próprios, os de acidentes geográficos e os gentílicos: com efeito, além do a l t o g r a u de a r b i t r a -riedade de sua escolha em textos literá-rios, dá-se o caso, n u m corpus fragmentário constituído de poemas mais ou menos independentes u m d o o u t r o , de esses nomes estarem sujeitos a constante renovação, sem a regularidade e a cons-tância das repetições que se v e r i f i c a m n o resto do vocabulário. O mesmo não o c o r -re, em tese, em textos unitários c o m o o

Aetna, anteriormente analisado, razão

pela qual os nomes próprios f o r a m , nesse poema, conservados. E n t r e t a n t o , q u a l quer que seja a a l t e r n a t i v a escolhida ( m a -nutenção ou eliminação), os resultados observados divergem de m a n e i r a p o u c o significativa, c o m o tivemos o p o r t u n i d a d e de verificar em nossos cálculos, em rela-ção ao Aetna; a divergência, porém, torna-se m u i t o mais significativa em

rela-ção ao Corpus Tibullianum — o que aliás, era esperado, pelo que acabamos de ex-por.

C o m relação a esta última o b r a , u m a dificuldade de o u t r a o r d e m se apresenta: o p r o b l e m a da a u t o r i a . Sem entrar em pormenores, parece que esse p r o b l e m a pode ser equacionado, em linhas gerais, da seguinte maneira *: a a u t o r i a dos dois primeiros livros de Elegias, dos três em que modernamente c o s t u m a d i v i d i r - s e o

Corpus, é seguramente atribuída a Á l b i o

T i b u l o , poeta do I século a . C ; o terceiro livro, em sua m a i o r parte, se não em sua totalidade, é i n d e v i d a m e n t e atribuído a T i b u l o pela tradição m a n u s c r i t a , q u a n d o na realidade fatos lingüísticos e estilísticos parecem i n v a l i d a r essa atribuição, suge-rindo antes a existência de o u t r o a u t o r ( o u autores) para nós desconhecido, que teria composto, os poemas d o terceiro l i v r o procurando i m i t a r a língua e o estilo de T i b u l o . Esta é a teoria mais o u menos u n i -versalmente aceita e que parece destinada a ser d e f i n i t i v a , a não ser que a l g u m fato novo, pouco provável aliás, c o m o seria a descoberta de u m desconhecido m a n u s c r i -to, venha lançar reveladora luz sobre as trevas em que tateia a f i l o l o g i a clássica à procura de respostas a certas indagações. É na esperança de i n d i c a r u m c a m i n h o — já que não podemos oferecer soluções — que o presente t r a b a l h o é p r o p o s t o .

M a n t i v e m o s , para a nossa análise, a divisão já consagrada, e calculamos sepa-radamente os s u b c o n j u n t o s constituídos pelos livros I e I I de u m l a d o , e pelo l i v r o I I I do Corpus de o u t r o l a d o , a f i m de v e r i -ficar se a hipótese n u l a é aceitável, o u , em outras palavras, se os efetivos reais das classes de frequência dos vocábulos dos dois subconjuntos obedecem à d i s t r i b u i -ção de W a r i n g .

Obtivemos, assim, as tabelas que se-guem:

* O s i n t e r e s s a d o s p o d e r ã o e n c o n t r a r i n f o r m a ç õ e s m a i s d e t a l h a d a s s o b r e a c o n t r o v e r t i d a q u e s t ã o d a a u t o r i a d o Corpus

Tibullianum n o s c o m e n t á r i o s à e d i ç ã o d e "Les B e i l e s L e t t r e s " . f e i t o s p o r M A X P O N C H O N T1 3

(8)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m u m a a n a l i s e q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

T A B L 1 . A 2

V a l o r e s o b s e r v a d o s e c a l c u l a d o s p a r a os n o m e s c o m u n s d o Corpus Tibullianum ( L i v r o s I e I I )

D a d o s : N = 7 8 4 4 , V = 1834, V , = 8 4 2 , V , = 303, V , ^ 171

V a l o r e s c a l c u l a d o s V a l o r e s c a l c u l a d o s V a l o r e s c a l c u l a d o s Freqüências V a l o r e s o b s e r v a d o s E s t i m a d o r e s de I r w i n E s t i m a d o r e s de H e r d a i i E s t i m a d o r e s de R a t k o

-V

, E f V ^ E ( V , ) w s k y E t V ^ )

i 842 8 4 2 , 0 0 8 4 2 , 0 0 8 4 2 , 0 0

2 303 3 5 1 , 9 4 341,75 3 1 1 , 5 8

3 171 185,03 179,27 J 6 2 . 4 1

4 128 110,99 108,23 9 9 , 7 1

5 74 7 2 , 5 8 7 1 , 4 6 6 7 , 4 6

6 66 50,45 5 0 , 2 2 4 8 , 6 8

7 38 3 6 , 7 0 3 6 , 9 5 3 6 , 7 9

8 41 2 7 , 6 6 2 8 , 1 6 2 8 , 7 8

9 22 2 1 , 4 5 22.07 2 3 , 1 3

10 18 17,02 17.69 1 9 , 0 0

11 17 13,77 14,45 1 5 , 8 9

12 13 1 1,32 11,99 13,48

13 12 9 . 4 4 10,09 11,58

14 6 7,97 8 , 5 9 10,06

15 9 6 , 8 0 7,39 8,82

16 7 5,85 6.41 7 , 8 0

17 6 5,08 5,61 6 , 9 4

» 1 8 61 57,95 7 1 . 6 7 1 1 9 , 8 9

â 1,83948 1,62607 1,17160

X 3,4008 1 3 , 0 0 6 2 6 2 , 1 6 6 0 4

X 2

1 5 g . l . 2 5 , 3 0 2 3 , 0 2 5 1 , 7 4

distribuição 0 , 9 5 3 9 4 0 , 9 1 6 2 8 0 , 9 9 9 9 9

p r o b a b i l i d a d e 4 , 6 0 8,37 0 , 0 0

r e s u l t a d o r e i . H „ não rej H r e j . H0

3.2.1. Comentários.

Dois dos três modelos teóricos p r o

-postos recomendam a rejeição da hipótese

nula, sendo que u m deles — o construído

pelos estimadores de R a t k o w s k y , que

ge-ralmente p r o p o r c i o n a m resultados

satis-fatórios — não deixa qualquer m a r g e m de

dúvida: o modelo não se ajusta de m o d o

algum aos dados observados. O único

resultado positivo é o apresentado pelo m o

-delo construído sobre os estimadores de

Herdan; no entanto, o e r r o sobr o qual,

(9)

C A R R A T O R E , E . D e l & W A D A , C . Y .J

O C o r p u s T i b u l l i a n u m u m a análise q u a n t i t a t i v a . A l f a , São

P a u l o , 25:31-47, 1 9 8 1 .

T A B E L A 3

V a l o r e s o b s e r v a d o s c c a l c u l a d o s p a r a o s n o m e s c o m u n s d o Corpus Tibullianum ( L i v r o 111)

Dados: N = 4 2 8 2 , V = 1360, V , 709, V , 2 4 9 , V , - 137

r-reqüências V a l o r e s observados! V .

V a l o r e s c a l c u l a d o s E s t i m a d o r e s de I r w i n

E ( V . )

V a l o r e s c a l c u l a d o s E s t i m a d o r e s de H e r d a n

E ( V . )

V a l o r e s c a l c u l a d o s E s t i m a d o r e s de R a t k o -w s k y E ( V . )

1 7 0 9 , 0 0 2 2 4 7 , 8 5

3 120,88

4 6 9 , 8 1

5 4 4 , 7 1 6 3 0 , 7 2 7 2 2 , 2 1

8 16,69

9 12,93

10 10,27

11 8 , 3 2

12 6 , 8 6

> 1 3 59,75

709 2 4 9 137 76 45 24 23 19 19 8 3 6 42

7 0 9 , 0 0 2 6 1 , 3 6 127,19 7 2 , 1 8 4 5 . 2 1 3 0 , 3 4 21,43 15,74 1 1,93 9,28 7,37 5,96 4 3 . 0 1

7 0 9 , 0 0 2 5 9 , 6 2 126,38 7 1 , 8 9 4 5 , 1 7 3 0 , 4 1 2 1 , 5 5 15,88 12,07 9 , 4 1 7 , 5 0 6,08 4 5 , 0 4

r i o

g.i.

distribuição p r o b a b i l i d a d e

r e s u l t a d o

1.60344 3 , 3 4 9 7 4 10,64 0 , 6 1 3 7 6 3 8 , 6 2 não r e j . Hr

1,29620 2 , 7 0 7 8 9 16,66 0 , 9 1 7 7 7 8,22 não r e j . H ,

1,55805 3 , 2 5 4 9 1 12,28 0 , 7 3 3 2 5 2 6 , 6 8 não r e j . H „

3.2.2 Comentários.

Os três modelos c o n c o r d a m na não rejeição da hipótese nula, o que parece i n dicar de f o r m a irrecusável que a d i s t r i b u i -ção de W a r i n g é adequada para descrever a distribuição real dos vocábulos no subconjunto ora analisado d o Corpus, q u a l quer que seja o m o d e l o de estimação u t i l i -zado. A q u i também, c o m o no caso d o

Aetna, o melhor resultado é o b t i d o

atra-vés dos estimadores de I r w i n , e o p i o r pe-los de H e r d a n .

4. Conclusões.

Os dados apresentados até a q u i se prestam, a nosso ver, não para u m a solu-ção definitiva do p r o b l e m a da a u t o r i a d o

Corpus Tibullianum, mas e tão somente

para c o r r o b o r a r as conclusões de grande

parte da critica literária que não reconhe-ce em T i b u l o o a u t o r único d o Corpus que lhe f o i atribuído.

A quantificação e a análise de dados liguísticos, na realidade, raramente ofere-cem respostas definitivas e cabais a dúvi-das que p o r v e n t u r a s u r j a m ; mas elas for-necem ao crítico literário e ao filólogo excelentes instrumentos que poderão ser u t i lizados em combinação c o m o u t r o s , d o tando afirmações vagas e conclusões i m -precisas de u m rigor científico e de uma significância probabilística nada des-prezíveis.

É nessa linha de raciocínio que se si-tua a conclusão central do nosso t r a b a l h o . Não se pretende " p r o v a r " que o Corpus

Tibullianum f o i escrito por dois o u mais

(10)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m . u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 25:31-47, 1 9 8 1 .

dos livros I e I I (e possivelmente de uns poucos poemas curtos do l i v r o I I I , segun-do alguns críticos), sensegun-do o l i v r o I I I de autoria de u m poeta desconhecido, o u mesmo de vários (já se p r o p u s e r a m os n o -mes de Lígdamo, Válgio R u f o , Ovídio, Propércio, entre m u i t o s o u t r o s ) : aqui co-mo sempre cabe aos críticos a última, em-bora improvável, palavra. Nós apenas de-sejaríamos acrescentar mais u m d a d o aos muitos que compõem a já communis

opi-nio de que T i b u l o não f o i o único a u t o r

do Corpus Tibullianum. Nossa análise es-tatística aponta diferenças entre os dois subconjuntos do Corpus e diferenças sig-nificativas; a p r i m e i r a delas — e talvez a mais relevante — se verifica na própria construção de um modelo teórico de dis-tribuição de freqüência que, se para u m subconjunto (o l i v r o I I I ) se ajusta m u i t o bem aos dados observados, para o o u t r o subconjunto (os livros 1 e I I ) propõe u m a concordância inaceitável; o r a , parece pouco provável que isto tivesse o c o r r i d o se autor do Corpus fosse u m só.

4.1 Reconhecemos a fragilidade desta h i pótese — uma presunção de p r o b a b i l i d a de apenas. Mas a análise mais p o r m e n o r i -zada das unidades lexicais do C o r p u s re-vela fatos que, segundo cremos, favore-cem a aceitação da hipótese: há vocábulos que aparecem em proporção m u i t o m a i o r no l i v r o I I I do que no s u b c o n j u n t o f o r m a -do pelos livros I e I I (alguns exemplos:

aduersus, 8 e 1 respectivamente; aer, 5 e

0; alter, 9 e 2; carus, 10 e 3; densus, 6 e 1;

ergo, 5 e 0; maior, 7 e 0; minor, 5 e 1; pars, 7 e 1; pontus, 5 e 1; seu, 27 e 13; uel,

14 e 4). Este é u m fato de natureza es-tilística também capaz de sugerir, pela fal-ta de homogeneidade na distribuição dos vocábulos pelas partes d o t e x t o , a d u p l i c i -dade — ou mesmo a p l u r a l i d a d e — de au-tores. Há, evidentemente, casos notáveis do fenômeno inverso: vocábulos empre-gados um número de vezes m u i t o m a i o r

nos livros I e I I d o que no l i v r o I I I ( exem-plos: ad, 31 e 5 respectivamente; ager, 17 e 1; agua, 23 e 4; bos, 9 e 1; caput, 18 e 3;

plenus, 11 e 0; pes, 32 e 4; peto, 10 e 0; puer, 21 e 4; quotiens, 6 e 0; sequor, 8 e 1; sto, 16 e 1; tener, 28 e 4; tunc, 25 e 7; uua,

10 e I , entre m u i t o s o u t r o s ) , q u a n d o a proporção esperada — e realmente obser-vada em grande número de casos — seria a de 2 : 1 , desde que o p r i m e i r o s u b c o n j u n to contém p o u c o menos d o d o b r o das u n i -dades de texto contidas no segundo sub-conjunto. Observe-se que, de todos os exemplos apresentados, n e n h u m vocábu-lo é suscetível de revelar especialização le-xical exigida por situações especiais den-tro da temática desenvolvida no Corpus; trata-se, a nosso ver, de vocábulos (alguns deles meros instrumentos gramaticais des-providos de conteúdo semântico) que per-tencem ao léxico c o m u m da poesia l a t i n a da época clássica, e o seu emprego diferenciado reflete apenas preferências i n d i -viduais de cada a u t o r — o seu estilo. Pa-rece haver, p o r t a n t o , u m a sensível dife-rença de estilo entre as composições que constituem as duas partes em que c o n v e n -cionamos d i v i d i r o Corpus — f a t o , aliás, já abundantemente i l u s t r a d o pela crítica e hoje universalmente aceito.

4.2. Apesar da evidência dos fatos mos-trados nas considerações expostas até aqui, procuramos buscar mais elementos que testassem e convalidassem a nossa h i -pótese, e os encontramos sob a f o r m a de um índice que revelasse a riqueza lexical das duas partes do Corpus Tibullianum postas em c o n f r o n t o . A noção de riqueza lexical, c o m o bem adverte M U L L E R9

(11)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , S ã o P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

" A p l i c a d o a u m texto, o t e r m o riqueza le-xical é, pois, d e f i n i d o pelo número dos vocábulos, e nada m a i s " ( p . l 16)*

O método dos índices, descrito por M U L L E R9

e f u n d a m e n t a d o na c o m p a r a -ção dos parâmetros V (número de vocá-bulos), V . j (número de vocábulos de fre-qüência 1), f (frefre-qüência média) e q , (ín-dice de repetição) de dois textos d i s t i n t o s , considerando Na a extensão d o texto constituído pelos livros I e I I d o Corpus, e Nb a extensão do l i v r o I I I , não oferece re-sultado apreciável: não é possível rejeitar a hipótese de estrita igualdade de riqueza lexical entre os dois textos. E n t r e t a n t o uma explicação, bastante óbvia, nos

aponta o vício d o resultado e nos o b r i g a a percorrer outros caminhos: é que a dife-rença de extensão entre os dois textos é m u i t o grande ( Na = 7844; Nb = 4282), e é bastante evidente que u m texto de q u a l quer extensão terá p r o v a v e l m e n t e u m v o -cabulário mais rico d o que u m texto de extensão igual a cerca da metade d o p r i m e i ro. Isto significa que a riqueza d o v o c a b u -lário de u m texto é função da extensão desse mesmo t e x t o . U m a comparação vá-lida seria a efetuada entre o p o e m a Aetna e o l i v r o I I I d o Corpus Tibullianum, aproximadamente de igual extensão ( Na

= 4324; Nb = 4282); a tabela a b a i x o i n -dica os resultados.

Comparação dos índices

C. T i b . I , I I Na= 7844

C . T i b . Nb =

I I I 4282

V 1834

>

1360

V , 842

>

709

f 4,28

>

3,15

0,54

>

0,48

Conclusão:Ra=Rb(os dois textos não diferem em riqueza lexical).

Comparação dos índices

A e t n a C . T i b . I l l Na = 4324 Nb = 4282

V 1446

>

1360

V , 768

>

709

f 2,99

<

3,15

11 0,47

<

0,48

C o n c l u s ã o : Ra> Rb (o texto d o A e t n a é mais rico do que o l i v r o I I I d o C . T i b . )

N o entanto, o índice f (freqüência média), menor em C. T i b . I I I d o que em

C. Tib. I , I I (3,15 < 4,28), sugere maior

riqueza de vocabulário naquele d o que neste, m u i t o embora isoladamente o fato não seja p r o b a n t e , p o r q u a n t o f v a r i a c o m a extensão do t e x t o . V e r i f i c a r e m o s a se-guir, por outros métodos, se realmente o vocabulário do l i v r o I I I d o Corpus

Tibul-lianum é mais rico do que o dos l i v r o s I e

I I de T i b u l o .

4.3 O método ideal seria aquele em que se obtivesse u m índice de riqueza

lexi-cal independente do t a m a n h o dos textos a ser comparados. E x a m i n a r e m o s a q u i a l guns entre os vários que têm sido p r o p o s -tos, embora todos eles apresentem a l g u m a sensibilidade à extensão dos textos, va-riando segundo a extensão de cada t e x t o . 4.3.1 O índice de riqueza lexical p r o p o s t o por E. B r u n e t (apud 2), c o m o base de cálculo para o vocabulário teórico de q u a l -quer texto, obedece à fórmula.

W = N1 / (v

"b ) a

o n d e b = 20 e a = 0,172.

(12)

C A R R A T O R E , E . P a u l o , 25:31-"!

A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São

A p l i c a n d o essa fórmula aos nossos dados, obtivemos os seguintes valores:

no Corpus Tib. I , I I W = 11,79

no Corpus Tib. I I I W = 11,29

no Aetna W = 11,03

C o m o o v a l o r de W é inversamente p r o -porcional à riqueza do vocabulário de u m texto, pode-se c o n c l u i r que o vocabulário do l i v r o I I I do Corpus Tibullianum é mais rico do que o vocabulário dos l i v r o s I e I I ; o do Aetna, por o u t r o l a d o , é o mais r i c o dos três *.

4.3.2 Após criticar o índice W de B r u n e t , por não ser totalmente independente d o tamanho do texto, D U G A S T (2) propõe para o cálculo da extensão teórica de u m vocabulário a adoção da relação logaríti-ma log V / l o g N , simples e p o u c o sensível às variações de extensão dos textos; a partir dessa relação, o a u t o r f o r m u l a u m n o -vo índice de riqueza lexical de u m t e x t o :

n-v

onde n = l o g N e v = log V .

A aplicação da fórmula de Dugast f o r n e -ceu os seguintes valores:

no Corpus Tib. I I I : U = 24,02

no Corpus Tib. I I I : U = 26,35

no Aetna U = 27,54

variando U em razão diretamente p r o p o r -cional à riqueza d o vocabulário de u m

texto, os resultados c o n f i r m a m p l e n a m e n -te as conclusões expostas no i t e m an-te- ante-rior.

4.3.3. U m o u t r o método para c o m p a r a r a riqueza do vocabulário de textos de exten-são diferente baseia-se no princípio da redutibilidade do mais extenso p a r a o t a m a -nho do mais c u r t o ; isto é, calcula-se a estrutura lexical que u m texto A de t a m a -nho N passaria a ter, se a sua extensão fosse reduzida ao t a m a n h o N ' de u m t e x t o B. N o nosso caso, o o b j e t i v o é saber q u a l seria o total V de vocábulos d o subcon-j u n t o C. Tib. I e I I (e eventualmente a dis-tribuição de freqüências dos V j ) , se re-duzíssemos esse s u b c o n j u n t o de N = 7844 para N ' = 4282.

Dois são os processos que p o d e m ser utilizados para o cálculo d o vocabulário teórico V : o p r i m e i r o é o cálculo pelo modelo b i n o m i n a l da distribuição teórica, segundo o qual

E ( V ) = V - Z q ' V ; .

o segundo é o cálculo pelo c o n h e c i d o m o -delo de W A R I N G8

'9

. A lei b i n o m i a l ope-ra especialmente sobre as freqüências mais baixas, mas perde a eficácia c o m muita rapidez; a distribuição de W a r i n g , por sua vez, reduz p r o p o r c i o n a l m e n t e os efetivos de todas as classes de freqüência indistintamente, o que pode ser questio-nado.

A combinação dos dois m o d e l o s (o b i n o m i a l e o de W a r i n g ) devese a M . D u -brocard, e as tabelas numéricas que permitem a aplicação desse método a q u a l quer texto f o r a m elaboradas p o r R A T -K O W S -K Y e H A N T R A I S1 1

.

* C . M U L L E R9

( A n e x o 7 ) , r e p r o d u z a f ó r m u l a d e B r u n e t s e m a c o r r e ç ã o r e p r e s e n t a d a p e l o v a l o r b : W = Nv

,

p r o p o n d o a t r a n s f o r m a ç ã o p a r a u m í n d i c e R = ( 2 5 - W ) / l , 5 , t a l q u e O < R > 1 0 ; n e s t e c a s o , o b t i v e m o s os s e g u i n t e s v a l o r e s : n o Corpus Tib. I , I I : W = 1 1 , 7 3 3 ; R = 8 , 8 4

n o Corpus Tib. I I I : W = 1 1 , 2 1 7 ; R = 9 , 1 9

no Aetna: W = 1 0 , 9 6 6 ; R = 9 , 3 6 .

C o m o , a o c o n t r á r i o d e W , R é m a i o r q u a n t o m a i s r i c o f o r o v o c a b u l á r i o d e u m t e x t o , a c e i t a r - se-á a m e s m a c o n c l u s ã o . * * E n ã o c o m o c o n s t o u , p o r u m l a m e n t á v e l l a p s o d e r e v i s ã o : U = n2

(13)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

Depois de procedermos às i n t e r p o l a -ções necessárias, pois que a tabela não fornece os valores intermediários o b t i d o s por nós ( N V N = 4 2 8 2 / 7 8 4 4 = 0,546, com uma taxa de redução de N igual a 0,454; V , / V = 842/1834 que dá P, = 0,46; N / V = 7844/1834, que é a "f = 4,28), o cálculo d o vocabulário teórico do texto NMndica:

V = 1 8 3 4 X 0 , 6 5 2 = 1196.

Isto significa que, se o t e x t o d o Corpus

Tibullianum, livros I e I I , fosse r e d u z i d o

ao mesmo t a m a n h o do texto d o Corpus

Tibullianum, l i v r o I I I , o n o v o t e x t o assim

o b t i d o contaria c o m u m vocabulário de aproximadamente 1196 vocábulos d i f e -rentes, com u m a distribuição de freqüên-cias que não nos interessou calcular, mas que m u i t o provavelmente seguiria a d i s t r i -buição de W a r i n g . O r a , c o m o na realida-de o texto d o Corpus Tibullianum, l i v r o I I I , possui 1360 vocábulos, c o n t r a apenas 1196 do texto reduzido d o Corpus

Tibullianum, livros I e I I , concluise i m e d i a t a

-mente que o vocabulário d o Corpus

Ti-bullianum, l i v r o I I I , é sensivelmente mais

rico do que o vocabulário d o o u t r o sub-conjunto.

E m outras palavras, se T i b u l o tivesse escrito suas Elegias u t i l i z a n d o u m t o t a l de 4282 palavras em lugar das 7844 que real-mente usou, teria u t i l i z a d o p r o v a v e l m e n t e pouco menos de 1200 vocábulos d i f e r e n -tes, ao passo que o a u t o r (os autores) d o

livro I I I do Corpus se valeu de u m voca-bulário bem mais r i c o , de 1360 unidades.

Parece difícil acreditar que essa dife-rença seja meramente aleatória. T u d o aponta para a existência de mais de u m autor para o Corpus Tibullianum, analisado neste a r t i g o .

Esta é a nossa conclusão f i n a l .

4.4. A quantificação dos dados d o

Cor-pus Tibullianum e a utilização de alguns

procedimentos estatísticos p a r a a sua aná-lise levaram-nos às reflexões a q u i apresentadas. Os autores destas linhas não r e i v i n -dicam nenhuma o r i g i n a l i d a d e ; apena de-sejam chamar a atenção dos estudiosos, lingüistas o u estatísticos, p a r a os inegáveis benefícios que a i n t e r d i s c i p l i n a r i e d a -de po-de trazer às pesquisas em vários se-tores. A s ciências humanas, e a lingüística em particular, p o d e m enriquecer-se sobre-maneira a l i a n d o os t r a d i c i o n a i s métodos qualitativos de análise a rigorosos méto-dos q u a n t i t a t i v o s ; a estatística, p o r sua vez, poderá encontrar nos inúmeros da-dos fornecida-dos pela lingüística u m fecun-do campo de aplicação de suas teorias e de suas técnicas de análise. E m nosso país, quase t u d o está p o r ser feito; poucos são os trabalhos de que temos c o n h e c i m e n t o no domínio da estatística lingüística. N ã o demos certamente o p r i m e i r o passo, mas esperamos não ter d a d o o último.

C A R R A T O R E , E . D e l & W A D A , C . Y . L e C o r p u s T i b u l l i a n u m : u n e a n a l y s e q u a n t i t a t i v e . A l f a , São P a u l o , 25:31-47, 1 9 8 1 .

ABSTRACT: D'après les données observées dans / e C o r p u s T i b u l l i a n u m cl soumises ;ïs des procé-dés statistiques, les auteurs prétendent renforcer l'opinion, généralement admise, que cette oeuvre n'a pas été composée par un poète unique, et ils admettent donc la pluralité d'auteurs. Pour cela, ils utili-sent la distribution de Waring et les indices les plus récents de richesse lexicale, cl ils signalent, entre les deux parties dont ils ont divisé le C o r p u s , les différences qui renforcent l'hypothèse initiale.

(14)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , S ã o P a u l o , 2 5 : 3 1 - 4 7 , 1 9 8 1 .

R E F E R Ê N C I A S B I B L I O G R Á F I C A S 1. D E L L A C A S A , A d r i a n a . Le concordanze del

Corpus Tibullianum. G e n o v a , I s t i t u t o d i F i l o l o g i a Classica e M e d i o e v a l e , 1 9 6 4 . 2. D U G A S T , D a n i e l S u r q u o i se f o n d e l a n o

-t i o n d'é-tendue -théorique d u v o c a b u l a i r e . Le Français moderne, P a r i s , 4 ^ ( 1 ) : 2 5 - 3 2 , 1978.

3. L ' E T N A ( t e x t e établi et t r a d u i t p a r J . Vesse-r e a u ) , 2.éd. P a Vesse-r i s , L e s Belles L e t t Vesse-r e s , 1 9 6 1 .

4. H E R D A N , G u s t a v . Quantitative linguistics. L o n d o n , 1 9 6 4 ; apud M U L L E R , C . Principes et méthodes de statistique lexicale. P a r i s , H a c h e t t e , 1 9 7 7 .

5. I R W I N , J . O . T h e p l a c e o f m a t h e m a t i c s i n m e d i c a l a n d b i o l o g i c a l s t a t i s t i c s . Journal of the Royal Statistical Society, L o n d o n , A-12fi(\): 1-41, 1963.

6. J O H N S O N , N . L . & K O T Z , S a m u e l . Discrete distribuition. B o s t o n , H o u g h t o n M i f f l i n , 1970.

7. M E N A R D , N a t h a n Richesse l e x i c a l e et m o t s r a r e s . Le Français moderne, P a r i s , 4f ( 1 ) : 33-43, 1 9 7 8 .

8. M U L L E R , C h a r l e s . P e u t - o n e s t i m e r l'éten-due d ' u n l e x i q u e ? Cahiers de Lexicologie, Besançon, 2 7 ( 2 ) : 3 - 2 9 , 1 9 7 5 .

9. M U L L E R , C h a r l e s . Principes et méthodes de statistique lexicale. P a r i s , H a c h e t t e , 1 9 7 7 .

10. R A T K O W S K Y , D . A . U n e n o u v e l l e a p p r o c h e c o n c e r n a n t l ' a p p l i c a t i o n d e l a d i s t r i b u t i o n de W a r i n g a u x fréquences des v o c a b l e s dans les textes littéraires. Cahiers de ». Lexicologie, Besançon, 34(1): 3 - 1 8 , 1 9 7 9 .

1 1 . A T K O W S K Y , D . A . & H A N T R A I S , L i n d a . T a b l e s f o r c o m p a r i n g t h e r i c h n e s s a n d s t r u c t u r e o f v o c a b u l a r y i n texts o f d i f f e r e n t l e n g t h s . Computers and the Humanities, N e w Y o r k , 9 ( 2 ) : 6 9 - 7 5 , 1975.

12. T I B U L L E . Elégies, ( t e x t e établi et t r a d u i t p a r M a x P o n c h o n t ) , 4.éd. P a r i s , L e s Belles L e t t r e s , 1955.

(15)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , S ã o

P a u l o , 25:31-47, 1 9 8 1 .

ANEXO

A série de W a r i n g f o i o b t i d a p o r esse matemático inglês n o séc. X V I I 1 , pela

ex-1 ~

x-a i = 0

com

onde

x'1

' = x, x

e p o r t a n t o :

_ 1 /-a

x-a V o

que é igual a:

1

A1

pansão da função x^ã < através da fórmula de interpolação p o l i n o m i a l de d i ferenças finitas descendentes de N e w t o n -Gregory:

rli + l l

+

121 = x ( x + l ) , . . . . x >i + 1

l = x ( x + l ) . . . ( x + i )

a ( a + l ) , , a '1

'

+

x ( x + l ) x ( x - f - l ) ( x + 2 )

+ ...+

cfi + l ]

+

C o m o a serie é c o n v e r g e n t e , pois x > a > o , a multiplicação da série

por uma constante (x-a) p r o d u z u m a

dis-P ( I = i ) = ( x - a )

Essa distribuição discreta de p r o b a b i -lidades (de W a r i n g ) é u m caso p a r t i c u l a r de uma distribuição mais geral f o r m u l a d a por I r w i n , d e n o m i n a d a distribuição fato-rial inversa (5).

Entre os parâmetros que u m a d i s t r i -buição de probabilidades possui, os que

" 1

tribuição discreta de p r o b a b i l i d a d e s ( 6 ) , a que I r w i n d e n o m i n o u distribuição de W a -ring, e cuja função densidade é dada p o r :

*ü! i = 0 , 1 , 2 . . .

X[ i + U

melhor a caracterizam e a d e f i n e m são a esperança matemática (que se i d e n t i f i c a com a média) e a variância. D a d a a f u n -ção d e n s i d a d e de p r o b a b i l i d a d e s , calculam-se a média e a variância que, n o caso da distribuição de W a r i n g , são dadas respectivamente p o r :

x-a-1

, 2 = a ( x - l ) ( x - a )

( x - a - l )2

( x - a - 2 )

pode-se verificar facilmente que, q u a n d o 1 < (x-a) < 2, a variância é i n f i n i t a .

Os parâmetros nx e o2 ( p o p u l a c i o

-nais) p o d e m ser estimados p o r m e s2 (a-mostrais).

(16)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a . A l f a , São P a u l o , 25.31-47, 1 9 8 1 .

de freqüência 1, p , , em lugar de u t i l i - timador de a2

, i n f i n i t a d e n t r o d o

inter-zar s2

, visto que não é adequada c o m o es- valo de 1 a 2.

C o m o , por definição,

P , x

- a . ( x - a ) a f\ = — — e q , = ( 1 - p j ) = 1 - ^ ^ = — •

x

então

C o m o

obtém-se o valor de

de onde

x =

Mi

a x-a-1

x = a ( l + — ) + 1

Mi

a ( l + — ) = x-1 K l

Substituindo nesta última relação o v a l o r de x por _ J L _ i temos:

« 1

a ( l + J _ ) = . i

que resulta em

que é igual a

e finalmente

a +

K l Q i

a a

M I Q i

a ( 1 + — - — ) " -1 ,

MI Q i

1

1

Q i MI

e p o r t a n t o o estimador â em função de ¿, e q ( é d a d o p o r :

1

i

l

~ - 1

Q l Mi

Retomemos o valor de

x = a ( l + ) + 1 Ml

substituindo nesta relação o v a l o r de a por

1 _

1 " 1

(17)

C A R R A T O R E , E . D e l & W A D A , C . Y . O C o r p u s T i b u l l i a n u m : u m a análise q u a n t i t a t i v a A l f a , Sâo

P a u l o , 25:31-47, 1 9 8 1 .

obteremos:

1

1 1 (1 + — ) Ml

que dá como resultado

1 x =

então

Q l M!

Q l Mi

+

1

+ 1 ,

1

Ml

Ml

_Ml_

q i

Ml

1 1

que e igual a

x =

Qi Mi

1

_ 9 l _

— 1

Q j Mi — 1

e p o r t a n t o o estimador x em função de Çt] c íjj

1

x = Ql

1 1_

Ql Mi — 1

+ 1 ;

é d a d o p o r :

Referências

Documentos relacionados

b Cris Jaqueline: formada em Comunicação Social – Habilitação em Jornalismo pela Universidade de Passo Fundo, é jornalista e comunicadora na Rádio UPF de Passo Fundo,

Idades Fem.. Para esse efeito a associação deverá apresentar o seu plano de necessidades de formação à Câmara, fornecendo os seguintes elementos:. 3.1 Designação da Ação

as levam a procurar a ferramenta como um dispositivo para interagir com esses sujeitos são diversos, mas, independentemente do gatilho que as fez criar um perfil no aplicativo,

Para o estudo em questão, considera-se a AET como a metodologia apropriada para a solução dos problemas apresentados, uma vez que, na fase da análise da demanda, quando

Caracterizaçao suscinta do fruto, semente e dispersor das espécies arbóreas da regeneração natural monitoradas nas áreas de restauração florestal da MRN,

The development, production, use, profitability and disposal of these electrochemical energy storage technologies have a major importance for a sustainable development and

Assim sendo, mantendo-se todo restante raciocínio de interpretação do STJ no que à posição jurídica do beneficiário de promessa de alienação no processo de insolvência