• Nenhum resultado encontrado

A linguística de corpus aplicada ao estudo do léxico nos contos da tradição oral

N/A
N/A
Protected

Academic year: 2021

Share "A linguística de corpus aplicada ao estudo do léxico nos contos da tradição oral"

Copied!
784
0
0

Texto

(1)

Universidade de Trás-os-Montes e Alto Douro

A Linguística de Corpus Aplicada ao Estudo do Léxico

nos Contos da Tradição Oral

Volume I

Tese de Doutoramento em Ciências da Linguagem Especialização em Linguística Aplicada

Maria Isabel Antunes Moreira

Orientador: Professor Doutor Carlos da Costa Assunção

(2)
(3)

Universidade de Trás-os-Montes e Alto Douro

A Linguística de Corpus Aplicada ao Estudo do Léxico

nos Contos da Tradição Oral

Volume I

Tese de Doutoramento em Ciências da Linguagem Especialização em Linguística Aplicada

Maria Isabel Antunes Moreira

Orientador: Professor Doutor Carlos da Costa Assunção

Composição do Júri:

__________________________________________________________ __________________________________________________________ __________________________________________________________

(4)
(5)

V

Dedicatória

(6)
(7)

VII

Agradecimentos

Cumprida mais esta etapa, não posso deixar esta página em branco. Apesar de a investigação ser um trabalho solitário, ou como diz Kennedy (1998: 61) “yet, corpus-based research, like most linguistic research, is often solitary and non-corporate and envolves an interaction between text and the linguist´s mind assisted by the computer”, muitas foram as pessoas que me incentivaram e deram confiança, ajudando-me dessa forma a chegar aqui.

Sinto, por isso, necessidade de prestar os meus agradecimentos a todos os amigos, a quem peço desculpa por não nomear, que se foram manifestando fonte de incentivo e de apoio, fatores tão fundamentais como a minha determinação.

A todos, especialmente ao Professor Doutor Carlos da Costa Assunção, guia de mais esta caminhada, o meu sincero muito obrigada.

Um agradecimento especial ao Sr. Padre Joaquim Alves Ferreira, que já não está entre nós, mas cuja generosidade sem limites e palavras amigas e de incentivo guardarei para sempre no meu pensamento.

À Professora Doutora Isabel Cardigos, do CEAO, da Universidade do Algarve, um agradecimento particular pela amabilidade com que me ofereceu o seu mais recente trabalho, e as valiosas indicações que me deu.

Um agradecimento, também especial, para o Zé Paulo, pela revisão de texto e sugestões que me deu.

Por último, e em primeiro, agradeço ao meu pai e à minha mãe, que partiram entretanto, mas sinto que continuam a acompanhar-me e a dar-me força, e à minha filha, a quem peço novamente desculpa por todos os momentos de ausência, e a quem agradeço, também, pelo ser humano maravilhoso que é.

(8)
(9)

IX

Resumo

O trabalho de investigação que apresentamos tem como objetivo principal o estudo do léxico nos contos da tradição oral, primeiro, numa perspetiva geral, o estudo de todo o léxico de que se compõem os textos e, depois, numa perspetiva específica, o estudo do léxico associado a valores. Para a sua concretização, foram tratadas em ambiente informático, com programas de análise automática de textos, quatro recolhas efetuadas no âmbito dos contos da tradição oral (por Adolfo Coelho, Teófilo Braga, Consiglieri Pedroso e Joaquim Ferreira), constituindo um total de 319 textos.

Numa primeira parte procede-se a um enquadramento teórico no âmbito da linguística e lexicologia.

Os textos foram tratados com os programas Lexicon e NooJ, ambientes de desenvolvimento linguístico, no âmbito da linguística de corpus e da linguística computacional, em várias operações de análise de texto, tendo em conta duas perspetivas: uma global e outra comparativo-contrastiva.

Juntamente com a apresentação dos resultados estatísticos obtidos, criando um espaço que se pretende de reflexão social e, principalmente, reflexão educacional, procedemos a uma exaustiva apresentação e demonstração das potencialidades das ferramentas de linguística de corpus em estudos de corpora e tratamento de textos, desde a utilização de recursos existentes à criação de recursos específicos.

(10)
(11)

XI

Abstract

The research work here presented mainly aims the study of lexicon in the oral traditional tales, first, from a general perspective, the study of the entire lexicon that compose these texts, then, from a particular perspective, the study of the lexicon wich is related to values. In order to accomplish such purpose, four collections of oral traditional tales (performed by Adolfo Coelho, Teófilo Braga, Consiglieri Pedroso e Joaquim Ferreira), consisting on 319 texts, were worked under a computerized environment, with automatic texts analysis programs.

This study has a first part with some reflections about theoretical aspects relating to linguistics and lexicology.

The texts were worked with Lexicon and NooJ, natural’s language processing systems, inside corpus linguistics and computational linguistics context, in several text analysis operations, among two perspectives: a global one and a comparative-contrastive one.

Allong with the presentation of the obtained statistical results, creating a space that is intended for social reflection and, mainly, educational reflection, we proceeded to an exhausting presentation and demonstration of corpus linguistics tools potentialities in corpora studies and texts treatment, from the use of existent resources to the creation of specific ones.

(12)

XII

“Uma infância nova, uma ama velha outra vez, e um leito pequeno onde acabe por dormir, entre contos que embalam, mal ouvidos, com uma atenção que se torna morna, de perigos que penetram em jovens cabelos louros como o trigo… E tudo isto muito grande, muito eterno, definitivo para sempre, da estatura única de Deus, lá no fundo triste e sonolento da realidade última das coisas…”

(13)

XIII

ÍNDICE GERAL

Introdução--- 27 PARTE I --- 29 O léxico --- 29 1. O estudo do léxico --- 31 1.1. Léxico --- 32 1.2. Lexicologia --- 37 1.2.1. Lexicologia vs lexicografia --- 37 1.3. Palavra --- 39 1.3.1. Partes orationis --- 41 1.3.2. Problemas de delimitação --- 43 1.4. Léxico mental --- 56 PARTE II --- 59

Estudo informático-linguístico e lexical --- 59

1. Linguística de corpus --- 61

2. Corpus --- 103

2.1. Representatividade e tipologias de corpus --- 105

3. Abordagem linguística dos contos da tradição oral--- 113

4. Procedimentos metodológicos --- 117

5. Classes de palavras e categorias gramaticais --- 131

5.1. Artigos --- 147 5.1.1. Artigos definidos --- 148 5.1.2. Artigos indefinidos --- 149 5.2. Preposições --- 150 5.3. Pronomes --- 151 5.4. Conjunções --- 152 5.5. Numerais --- 153 5.6. Interjeições --- 154 5.7.Advérbios --- 155 5.8. Nomes comuns --- 157

5.8.1. Os nomes comuns mais frequentes, as formas de frequência 1, ou hapax legomena, os termos exclusivos de cada autor, e os que ocorrem nos 4 autores em simultâneo.--- 159

5.8.2. Número e género --- 169

5.9. Nomes próprios --- 175

5.9.1. Os nomes próprios utilizados nos textos de cada autor--- 176

5.10. Adjetivos --- 177

5.10.1. Adjetivos mais frequentes e adjetivos de frequência 1 --- 179

(14)

XIV

5.10.3. Gradação dos adjetivos --- 193

5.10.4. Funções do adjetivo --- 196

5.10.5 Colocação do adjetivo --- 197

5.10.6. O particípio passado com funções de adjetivo qualificativo --- 217

5.10.7. Antonímia e sinonímia: o maniqueísmo nos contos --- 224

5.11. Verbos --- 227

5.11.1. Verbos: formas mais frequentes e formas de frequência 1 ou hapax legomena --- 229

5.11.2. Presente do indicativo--- 231

5.11.3. Presente do conjuntivo --- 232

5.11.4. Pretérito imperfeito do indicativo --- 232

5.11.5.Pretério imperfeito do conjuntivo --- 232

5.11.6. Pretérito perfeito --- 233 5.11.7. Pretérito mais-que-perfeito --- 233 5.11.8. Futuro imperfeito --- 233 5.11.9. Futuro do conjuntivo --- 234 5.11.10. Imperativo --- 234 5.11.11. Condicional --- 234 5.11.12. Infinitivo pessoal --- 235 5.11.13. Infinitivo impessoal --- 235 5.11.14. Gerúndio --- 235 5.11.15. Particípio passado --- 236 5.12. Onomatopeias --- 239 5.13. Palavras latinas --- 240 5.14. Castelhanismos --- 241

6. Campos lexicais e campos temáticos --- 243

7. O diminutivo e o aumentativo --- 255

8. Os animais nos contos --- 267

9. O léxico simbólico nos contos --- 273

10. Os digrams --- 279

PARTE III --- 281

Léxico e valores nos contos da tradição oral --- 281

1. A questão axiológica nos contos da tradição oral--- 283

1.1. O léxico e os valores nos contos da tradição oral --- 292

1.1.1. Léxico e valores: procedimentos metodológicos --- 292

1.1.2. Léxico e valores: registos identificados no corpus--- 298

1.1.3. Léxico e valores: polarização positiva e polarização negativa --- 302

1.1.4. Léxico e valores: vertentes de significação ou domínios tipológicos - social/pessoal, espiritual/religioso e estético --- 305

1.1.5. Léxico e valores: riqueza vocabular --- 310

1.1.6. Léxico e valores: recursos para pesquisa --- 312

1.1.7. Léxico e valores: que valores? --- 315

Conclusão --- 319

Bibliografia --- 327

a) Bibliografia ativa --- 327

b) Bibliografia passiva --- 327

(15)

XV

2. Artigos ou capítulos em livros, revistas e/ou periódicos --- 345

3. Dissertações não editadas --- 354

4. CD-ROM --- 357

5. Ficheiros em formato digital --- 357

6. Webgrafia --- 361

Índice de Gráficos

Gráfico 1 – Totais do corpus: ocorrências, formas diferentes e lemas --- 135

Gráfico 2 – Classes de palavras e categorias gramaticais --- 135

Gráfico 3 – Totais gerais em cada autor: ocorrências, formas diferentes e lemas --- 141

Gráfico 4 – Frequência dos tempos verbais em Adolfo Coelho --- 236

Gráfico 5 – Frequência dos tempos verbais em Teófilo Braga --- 237

Gráfico 6 – Frequência dos tempos verbais em Consiglieri Pedroso --- 237

Gráfico 7 – Frequência dos tempos verbais em Joaquim Ferreira --- 238

Gráfico 8 – Totais corpus geral e valores: ocorrências, lemas e formas diferentes --- 299

Gráfico 9 – Total de ocorrências corpus: geral e valores --- 300

Gráfico 10 – Total ocorrências corpus e autores: geral e valores --- 301

Gráfico 11 – Total ocorrências valores autores --- 302

Gráfico 12 – Total ocorrências valores: polarização positiva e polarização negativa --- 303

Gráfico 13 – Totais valores autores: ocorrências, polarização positiva e polarização negativa--- 304

Gráfico 14 – Total ocorrências valores corpus por domínio tipológico --- 306

Gráfico 15 – Total ocorrências valores autores por domínio tipológico --- 308

Gráfico 16 – Total ocorrências valores corpus por domínio e polarização--- 309

Gráfico 17 – Total ocorrências valores autores, por domínio e polarização --- 310

Índice de Tabelas

Tabela 1 – Caracteres não reconhecidos pelo Lexicon --- 121

Tabela 2 – Total de palavras que o Lexicon não reconheceu --- 125

Tabela 3 – Totais do corpus: ocorrências, formas diferentes e lemas --- 134

Tabela 4 – Critérios de consulta utilizados no Lexicon --- 136

Tabela 5 – Totais em Adolfo Coelho: ocorrências, formas diferentes e lemas--- 139

Tabela 6 – Totais em Teófilo Braga: ocorrências, formas diferentes e lemas --- 139

Tabela 7 – Totais em Consiglieri Pedroso: ocorrências, formas diferentes e lemas --- 140

Tabela 8 – Totais em Joaquim Ferreira: ocorrências, formas diferentes e lemas --- 140

Tabela 9 – Riqueza vocabular 1 --- 142

Tabela 10 – Riqueza vocabular 2 --- 142

Tabela 11 – Ocorrências --- 144

Tabela 12 – Formas diferentes --- 145

Tabela 13 – Lemas --- 146

Tabela 14 – Frequências relativas aos artigos --- 147

Tabela 15 – Distribuição dos artigos--- 147

Tabela 16 – Percentagens relativas aos artigos --- 147

Tabela 17 – Artigos definidos --- 148

Tabela 18 – Artigos indefinidos--- 149

Tabela 19 – Frequências relativas às preposições --- 150

Tabela 20 – Distribuição das preposições --- 150

(16)

XVI

Tabela 22 – Distribuição dos pronomes --- 151

Tabela 23 – Frequências relativas às conjunções --- 152

Tabela 24 – Distribuição das conjunções --- 152

Tabela 25 – Frequências relativas aos numerais --- 153

Tabela 26 – Distribuição dos numerais --- 153

Tabela 27 – Frequências relativas às interjeições --- 154

Tabela 28 – Distribuição das interjeições --- 154

Tabela 29 – Frequências relativas aos advérbios --- 155

Tabela 30 – Distribuição dos advérbios --- 155

Tabela 31 – Frequências dos nomes comuns --- 157

Tabela 32 – Distribuição dos nomes comuns --- 157

Tabela 33 – Riqueza vocabular: nomes comuns 1 --- 158

Tabela 34 – Riqueza vocabular: nomes comuns 2 --- 158

Tabela 35 – Nomes comuns mais frequentes nos autores --- 160

Tabela 36 – Nomes comuns de frequência 1 --- 161

Tabela 37 – Nomes comuns exclusivos em cada autor --- 165

Tabela 38 – Nomes comuns que ocorrem nos 4 autores --- 169

Tabela 39 – Frequências relativas aos nomes próprios --- 175

Tabela 40 – Distribuição dos nomes próprios--- 175

Tabela 41 – Frequências relativas aos adjetivos --- 177

Tabela 42 – Distribuição dos adjetivos --- 177

Tabela 43 – Riqueza vocabular: adjetivos 1--- 178

Tabela 44 – Riqueza vocabular: adjetivos 2--- 178

Tabela 45 – Adjetivos mais frequentes nos autores --- 179

Tabela 46 – Adjetivos de frequência 1 --- 185

Tabela 47 – Adjetivos: adjunto adnominal posposto --- 208

Tabela 48 – Adjetivos: adjunto adnominal anteposto --- 216

Tabela 49 – Adjetivos: posição pré-nominal e pós-nominal--- 217

Tabela 50 – Adjetivos: particípio passado com funções de adjetivo qualificativo --- 223

Tabela 51 – Adjetivos: sinonímia e antonímia --- 226

Tabela 52 – Frequências relativas aos verbos--- 227

Tabela 53 – Distribuição dos verbos --- 227

Tabela 54 – Riqueza vocabular: verbos 1--- 228

Tabela 55 – Riqueza vocabular: verbos 2--- 228

Tabela 56 – Verbos: formas mais frequentes --- 230

Tabela 57 – Verbos: formas de frequência 1 --- 231

Tabela 58 – Verbos: presente do indicativo --- 231

Tabela 59 – Verbos: presente do conjuntivo --- 232

Tabela 60 – Verbos: pretérito imperfeito do indicativo --- 232

Tabela 61 – Verbos: pretérito imperfeito do conjuntivo --- 232

Tabela 62 – Verbos: pretérito perfeito --- 233

Tabela 63 – Verbos: pretérito mais-que-perfeito--- 233

Tabela 64 – Verbos: futuro imperfeito --- 233

Tabela 65 – Verbos: futuro do conjuntivo --- 234

Tabela 66 – Verbos: imperativo --- 234

Tabela 67 – Verbos: condicional --- 234

Tabela 68 – Verbos: infinitivo pessoal--- 235

Tabela 69 – Verbos: infinitivo impessoal --- 235

Tabela 70 – Verbos: gerúndio--- 235

Tabela 71 – Verbos: particípio passado --- 236

Tabela 72 – Frequências relativas às onomatopeias --- 239

Tabela 73 – Distribuição das onomatopeias --- 239

Tabela 74 – Frequências relativas às palavras latinas --- 240

Tabela 75 – Distribuição das palavras latinas --- 240

Tabela 76 – Frequências dos castelhanismos --- 241

Tabela 77 – Distribuição dos castelhanismos --- 241

Tabela 78 – Listagem dos tokens mais frequentes: palavras-chave e palavras-tema --- 246

Tabela 79 – Campos temáticos: palavras-chave --- 247

Tabela 80 – Campos temáticos: palavras-tema --- 252

(17)

XVII

Tabela 82 – Os animais nos contos --- 270

Tabela 83 – Léxico simbólico mais frequente --- 278

Tabela 84 – Os digrams mais frequentes --- 280

Tabela 85 – Totais corpus geral e valores: ocorrências, lemas e formas diferentes --- 298

Tabela 86 – Comparação geral e valores: percentagem lemas e formas diferentes --- 299

Tabela 87 – Total ocorrências corpus e autores: geral e valores --- 300

Tabela 88 – Totais autores: ocorrências geral e valores --- 301

Tabela 89 – Total ocorrências valores corpus: polarização positiva e polarização negativa --- 302

Tabela 90 – Totais valores polarização positiva e polarização negativa: ocorrências, lemas e formas diferentes--- 303

Tabela 91 – Totais valores autores: ocorrências, polarização positiva e polarização negativa--- 303

Tabela 92 – Totais autores: diferença percentual entre polarização positiva e polarização negativa - 304 Tabela 93 – Totais valores corpus por domínio: ocorrências, lemas e formas diferentes --- 305

Tabela 94 – Total ocorrências valores corpus por domínio em percentagem --- 305

Tabela 95 – Total ocorrências valores autores por domínio --- 306

Tabela 96 – Total ocorrências valores autores por domínio em percentagem--- 307

Tabela 97 – Totais autores: diferenças percentuais entre os domínios --- 307

Tabela 98 – Totais valores corpus por domínio e polarização: ocorrências, lemas e formas diferentes --- 309

Tabela 99 – Total ocorrências valores autores por domínio e polarização --- 309

(18)
(19)

XIX

Abreviaturas

No decorrer do nosso estudo, recorreremos ao uso de abreviaturas e siglas, das quais passamos a fazer a devida explicação.

Relativamente aos títulos dos contos, cuja distinção, no caso das versões diferentes do mesmo conto, será posteriormente feita em termos de autor, utilizaremos as seguintes abreviaturas/siglas (coincidentes com as iniciais dos títulos, excepto nos casos em que é necessário outro elemento identificativo1, ordenadas alfabeticamente para melhor identificação e localização):

Abreviatura/sigla Título do Conto

A A A A D R A A D S A A A D S P A B D D Q A B D S C A B E O S D P A B M A C D B. A C D M D O A C E A V A C E O C D F A C M A C. A Ca. A Car. A Carr. A D A D V A Da. V. A E A E D D A E D P A E Q C A Es. A F D B A F D C A F D D A F D L A F D R M A F E A N A F Q F B A G B A G E A-Aranha A-Adivinha-Do-Rei A-Afilhada-De-Santo-António A-Afilhada-De-S-Pedro A-Bengala-De-Dezasseis-Quintais A-Bicha-De-Sete-Cabeças A-Beata-E-O-Senhor-Dos-Passos A-Bela-Menina A-Cara-De-Boi A-Corça-Da-Maça-De-Ouro A-Carpideira-E-A-Viúva A-Cobra-E-O-Cordão-Do-Frade A-Comadre-Morte A-Cabacinha A-Cacheirinha A-Carpinteirazinha A-Carrapatinha Amores-Dobrados A-Da-Varanda A-Dama-Verde A-Enjeitada A-Esmola-Do-Diabo A-Enfiada-De-Petas A-Estátua-Que-Come A-Estalajadeira A-Filha-Da-Bruxa A-Filha-Do-Carvoeiro A-Filha-Do-Diabo A-Filha-Do-Lavrador A-Filha-Do-Rei-Mouro A-Formiga-E-A-Neve A-Feia-Que-Fica-Bonita A-Gata-Borralheira A-Graça-Estudantesca 1

Por exemplo, os artigos definidos que aparecem no início dos títulos dos contos foram mantidos tal como aparecem (A, As, O, Os), mantendo as formas em que aparecem no plural, e não apenas a inicial. Desta forma evitámos a necessidade de acrescentar outros elementos a alguns títulos que, com as iniciais coincidentes, ficam desta maneira já distinguidos.

(20)

XX A G M A Ga. M A H P A M A M C A M C A R N T A M D C V A M D F A M D P E D A A M E A M E A P A M E A V A M E O B A M E O F A M F A M Fi. A M G A M M A M M F A M Q C O M A M Q F U H R A M T A Ma. A Mi. A N D C A N F A P A P A A P C A P D A A P D C D O A P D E A P D O A P D P A P E A P M B A P Q A A P Q M D P A P Q N Q C C O P A R A R B N B A R D M A R E A C A R E A F A R E O B A R E O G A R E O L A R O A S A S D E A S D G A S D O A Si. A T D B A T D C A T D L A T D M H A T M. A V D G A V E O L A-Gaita-Maravilhosa A-Gaitinha-Maravilhosa A-Herança-Paterna A-Machadinha A-Mulher-Curiosa A-Menina-Com-A-Rosa-Na-Testa A-Menina-Do-Chapelinho-Vermelho A-Mão-Do-Finado A-Menina-Das-Pérolas-E-Aljofres A-Moura-Encantada A-Menina-E-A-Preta A-Menina-E-A-Vaquinha A-Menina-E-O-Bicho A-Menina-E-O-Figo A-Menina-Fadada A-Menina-Fina A-Mulher-Gulosa A-Muda-Mudela A-Menina-Mais-Feliz A-Mulher-Que-Cegou-O-Marido A-Morte-Que-Fez-Um-Homem-Rico A-Mulher-Teimosa A-Madrasta A-Mirra A-Noiva-Do-Corvo A-Noiva-Formosa A-Pomba A-Princesa-Abandonada A-Princesa-Carlota-(Grisélidis) A-Princesa-De-Áustria A-Princesa-Dos-Cabelos-De-Oiro A-Princesa-De-Ernis A-Paraboinha-De-Ouro A-Pele-Do-Piolho A-Princesa-Encantada A-Princesa-Maria-Bonita A-Princesa-Que-Adivinha A-Princesa-Que-Morreu-De-Paixão A-Princesa-Que-Não-Queria-Casar-Com-O-Pai A-Raposa A-Rosa-Branca-Na-Boca A-Romazeira-Do-Macaco A-Raposa-E-A-Cotovia A-Riqueza-E-A-Fortuna A-Raposa-E-O-Barqueiro A-Raposa-E-O-Galo A-Raposa-E-O-Lobo A-Rainha-Orgulhosa A-Sardinhinha A-Saia-De-Esquilhas A-Senhora-Da-Graça A-Sandália-De-Ouro A-Sina A-Torre-De-Babilónia A-Túnica-De-Cristo A-Torre-Da-Laranjinha A-Torre-Da-Má-Hora A-Tia-Miséria A-Velha-Das-Galinhas A-Velha-E-Os-Lobos

(21)

XXI A V F Al. D V As A E A As B D O As C A As C D R As C P As F As F D D V As Fi. As I G As L As N As O D A As P D P As S As T As T B D O As T C D A As T F As T L As T M As T M D O As T N As T P As T P A As V D A B B B B F C C B C D F C D O C E D C E E C M C N M C C R E J C S E C C U B S T L D C D Ca. D G D O M M T D V A C E F J S C F Q A O P H C D H D C H D C P E D C R H D G D M H D J G J M J P J Pe. J Q T T J R L B A-Velha-Fadada Alegria-Da-Viúva As-Adivinhas-Em-Anexins As-Barras-De-Ouro As-Crianças-Abandonadas As-Cunhadas-Do-Rei As-Cinco-Profissões As-Favas As-Filhas-Dos-Dois-Validos As-Fiandeiras As-Irmãs-Gagás As-Luzes As-Nozes As-Orelhas-Do-Abade As-Postas-Do-Peixe As-Sonsas As-Tias As-Três-Bolinhas-De-Oiro As-Três-Cidras-Do-Amor As-Três-Fadas As-Três-Lebres As-Três-Meninas As-Três-Maçãzinhas-De-Ouro As-Três-Nozes As-Três-Pombas As-Três-Pedrinhas-Azuis As-Vozes-Dos-Animais Brancaflor Bola-Bola Branca-Flor Clarinha Come-Bois Conto-Do-Fuso Cabelos-De-Ouro Casar-E-Descasar Conto-Em-Enigma Comadre-Morte Caiu-Me-Na-Minha-Catulinha Cravo-Rosa-E-Jasmim Ciência-Sabedoria-E-Capacidade Comera-Um-Bocadinho-Se-Tivera-Limão Desanda-Cacheira Dom-Caio Dichote-Galego Dá-Me-O-Meu-Meio-Tostão Dar-Vista-Aos-Cegos Esvintola Frei-João-Sem-Cuidados Filha-Que-Amamenta-O-Pai Hei-de-Comer-Dois História-Da-Carochinha História-Do-Compadre-Pobre-E-Do- Compadre-Rico História-Do-Grão-De-Milho História-De-João-Grilo João-Mandrião João-Peludo João-Pequenito Já-Que-Tanto-Teima João-Ratão Linda-Branca

(22)

XXII L D M D S P L D P M D S M D T D U P N M F M M M S M Su. M V Q D A Q Q M M N P S R O A O A D L O A D M O A D S A O B C O B D A O B R O C O Ca. D S C O C B O C D O C D B O C D E O C D O O C D P O C D P O C D R O C D S C O C D T J C O C E O C E A P O C E O G O C E O M O C L E A C R O C S O Ca. O Ca. B O Co. O Co. B O Coe. O D G O D J O F O F D F O F D M O F D P O G D B E O D M O G D G O G D M O G D P O G E O G E O L O G E O P O G. O Gi. O H D E D V Q O H Q B E O J B O J D P O J P Lenda-Da-Mãe-De-São-Pedro Lenda-Do-Paraíso Maria-Da-Silva Mentira-Do-Tamanho-De-Um-Padre-Nosso Manuel-Feijão Março-Marçagão Maria-Silva Maria-Subtil Mais-Vale-Quem-Deus-Ajuda-Que-Quem--Muito-Madruga Nascer-Para-Ser-Rico O-Avarento O-Aprendiz-De-Ladrão O-Aprendiz-Do-Mago O-Afilhado-De-Santo-António O-Boi-Cardil O-Burro-Do-Azeiteiro O-Bolo-Refolhado O-Caixeirinho O-Cavalo-Das-Sete-Cores O-Coelhinho-Branco O-Compadre-Diabo O-Castelo-De-Babilónia O-Criado-Do-Estrujeitante O-Cordão-De-Ouro O-Caldo-De-Pedra O-Conde-De-Paris O-Camareiro-Do-Rei O-Cavalinho-Das-Sete-Cores O-Caso-Do-Tio-Jorge-Coutinho O-Conde-Encantado O-Cuco-E-A-Poupa O-Coelho-E-O-Gato O-Cego-E-O-Moço O-Compadre-Lobo-E-A-Comadre-Raposa O-Conde-Soldadinho O-Carvoeiro O-Carneirinho-Branco O-Colhereiro O-Coelho-Branco O-Coelhinho O-Doutor-Grilo Origem-Dos-Javalis O-Feiticeiro O-Figuinho-Da-Figueira O-Ferreiro-Da-Maldição O-Filho-Do-Pescador O-Génio-Do-Bem-E-O-Do-Mal O-Gosto-Dos-Gostos O-Grão-De-Milho O-Guardador-Dos-Porcos O-Gigante-Encantado O-Grilo-E-O-Leão O-Galo-E-O-Pinto O-Galvão O-Gigante O-Homem-Da-Espada-De-Vinte-Quintais O-Homem-Que-Busca-Estremecer O-João-Bertoldo O-Jogo-Do-Pira O-João-Pequeno

(23)

XXIII O L D M C O L E O E O M O M A O M D A O M D B O M E A L O M E O L O M E O V O M S O O O E O B O O P O P B O P C O D B O P D C D C O P D F O P D O O P D O O P D P O P D P V O P E O P E A L D S A O P E O P O P Q F C S V O P S O Pr. E O R O R C O R D B D S L O R D G O R D N O R D P O R D S O R E O R E O G O S O S D C O S D J V O S D N O S D N O S E A A O S E O G O S P O S Q C C U V O S Q F A C O S Q F A I O S Q F P O I O T A O T D E O T E O T E A M O T O S E O S O U E S A O V Q Os C Os D A D T V A Os D C Os Du C Os D I Os D I E A M M O-Ladrão-Da-Mão-Cortada O-Lavrador-E-O-Ermitão O-Mágico O-Menino-Açafroado O-Mestre-Das-Artes O-Matador-Dos-Bichos O-Menino-E-A-Lua O-Mocho-E-O-Lobo O-Menino-E-O-Vento O-Menino-Sem-Olhos O-Ovo-E-O-Brilhante O-Ovo-Partido O-Pinto-Borrachudo O-Príncipe-Com-Orelhas-De-Burro O-Príncipe-De-Cabeça-De-Cavalo O-Preguiçoso-Da-Forneira O-Palmeiriz-De-Oliva O-Preço-Dos-Ovos O-Pucarinho-De-Prata O-Príncipe-Das-Palmas-Verdes O-Peixinho-Encantado O-Preto-E-A-Lâmpada-De-Santo-António O-Preto-E-O-Padre O-Príncipe-Que-Foi-Correr-Sua-Ventura O-Príncipe-Sapo O-Príncipe-Encantado O-Rabil O-Rei-Cego O-Rapaz-Das-Botas-De-Sete-Léguas O-Rabo-Do-Gato O-Rei-De-Nápoles O-Retrato-Da-Princesa O-Rio-De-Sangue O-Rei-Escuta O-Rapaz-E-O-Gigante O-Surrão O-Sapatinho-De-Cetim O-Senhor-Das-Janelas-Verdes O-Saco-Das-Nozes O-Sinal-Da-Nobreza O-Sal-E-A-Água O-Sapateiro-E-O-Galego O-Sapateiro-Pobre O-Sacristão-Que-Casou-Com-Uma-Velha O-Soldado-Que-Foi-Ao-Céu O-Sargento-Que-Foi-Ao-Inferno O-Soldado-Que-Foi-Para-O-Céu O-Touro-Azul O-Tesouro-Do-Enforcado O-Tesouro-Enterrado O-Tolo-E-As-Moscas O-Tinhoso-O-Ranhoso-E-O-Sarnoso O-Usurário-E-Santo-António O-Velho-Querecas Os-Corcundas Os-Dez-Anõezinhos-Da-Tia-Verde-Água Os-Dois-Compadres Os-Duzentos-Carneiros Os-Dois-Irmãos Os-Dois-Irmãos-E-A-Mulher-Morta

(24)

XXIV Os D M Os D P Os D P E A B Os F V Os L Os M Os M C E D O Os M P Os P D G Os S Os S E Os Se. E Os T C Os T E E O S Os T I Os T P Os T V P P C O D P D A P D C P D M A P E O P P E P P Q C O C R G S C S H S J S N S S T C O V T A T T Os-Dois-Mentirosos Os-Dois-Pedrinhos Os-Dois-Pequenos-E-A-Bruxa Os-Figos-Verdes Os-Ladrões Os-Macacos Os-Meninos-Com-Estrelas-De-Oiro Os-Meninos-Perdidos Os-Peixes-Do-Guardião Os-Simplórios Os-Sapatinhos-Encantados Os-Sete-Encantados Os-Três-Conselhos Os-Três-Estudantes-E-O-Soldado Os-Três-Irmãos Os-Três-Patrões Os-Três-Valentes Patranha Pacto-Com-O-Diabo Prova-De-Amor Pele-De-Cavalo Pedro-De-Malas-Artes Pedro-E-O-Príncipe Pedro-E-Pedrito Para-Quem-Canta-O-Cuco Raposinha-Gaiteira Sem-Ceia Santa-Helena São-Jorge Sempre-Não Sumido-Sejas-Tu-Como-O-Vento Tudo-Andaremos Tic-Taco

Relativamente a outros campos:

Abreviatura Descrição

adj Adjetivo

adv Advérbio

advl advérbio de lugar

advm advérbio de modo

advn advérbio de negação

advt advérbio de tempo

advdinc advérbio de inclusão

advexcl advérbio de exclusão

advaf advérbio de afirmação

advdes advérbio de designação

advduv advérbio de dúvida

advint advérbio de intensidade

artd artigo definido

(25)

XXV

cast Castelhanismo

conj Conjunção

inter Interjeição

lat palavra latina

loc adv locução adverbial

loc conj locução conjuncional

loc prep locução preposicional

nomc nome comum

nomp nome próprio

numc numeral cardinal

numo numeral ordinal

prep Preposição

prond pronome demonstrativo

pronind pronome indefinido

pronint pronome interrogativo

pronp pronome pessoal

pronpos pronome possessivo

pronr pronome relativo

vb Verbo

Abreviatura Descrição

cond Condicional

fut conj futuro do conjuntivo

fut imperf futuro imperfeito

ger Gerúndio

imperf conj imperfeito do conjuntivo

imperf ind imperfeito do indicativo

imper Imperativo

inf infinitivo impessoal

infp infinitivo pessoal

part Particípio

pres conj presente do conjuntivo

pres ind presente do indicativo

pret perf pretérito perfeito

pret m-q-p pretérito mais-que-perfeito

Abreviatura Descrição 1s 1ª pessoa do singular 1p 1ª pessoa do plural 2s 2ª pessoa do singular 2p 2ª pessoa do plural 3s 3ª pessoa do singular 3p 3ª pessoa do plural

(26)
(27)

27

Introdução

Do era uma vez… ao era outra vez…

O nosso estudo, cujo objeto são os contos da tradição oral, podia sem dúvida começar desta mesma maneira, isto é, utilizando as mágicas palavras de início dos textos de que nos ocupamos. De facto, este estudo começou exatamente com um Era uma vez…, e com o fascínio que essa fórmula mágica, à qual atribuímos uma importância sem limites, nunca deixou de transmitir ao ser humano em geral e a nós de uma maneira muito particular.

Para nós este fascínio, que começou com os primeiros passos na infância, consolidou-se pela e na vida profissional, na qual, entre outras, assumimos a função de contadores de histórias, seguros de que nenhuma outra atividade pode assumir os contornos e o alcance que esta nos permite concretizar (a todos os níveis e em todas as áreas de desenvolvimento). Esta é uma atividade fundamental, incomparável e insubstituível ao nível do pré-escolar.

Com efeito, convictos da importância que o desenvolvimento da linguagem e a construção do imaginário na criança detêm no seu desenvolvimento e formação enquanto ser adulto, bem como da importância que esse mesmo imaginário tem na formação de valores essenciais à estruturação e desenvolvimento de uma sociedade, e certos de que a literatura tradicional, mais concretamente os contos, proporcionam estes pressupostos fundamentais, com A Linguística de Corpus Aplicada ao Estudo do Léxico nos Contos da Tradição Oral pretendemos, fundamentalmente, aferir do léxico presente na literatura de tradição oral, mais precisamente nos contos, que se reveste de tal importância.

Constituem o corpus do nosso estudo as recolhas de contos da tradição oral efetuadas por Francisco Adolfo Coelho (1879), Teófilo Braga (1883-1914/15), Consiglieri Pedroso (1910) e ainda uma recolha efetuada em Trás-os-Montes, por Joaquim Alves Ferreira, e publicada já em finais do século XX, mais precisamente em 1999.

O nosso estudo, para o qual partimos tendo como base de trabalho fundamental ficheiros organizados durante o nosso mestrado, apresentar-se-á dividido em 3 partes fundamentais.

Uma primeira parte será dedicada a um enquadramento teórico no âmbito da linguística e lexicologia.

(28)

28

As segunda e terceira partes, essencialmente práticas, incidirão sobre o estudo dos contos da tradição oral à luz da linguística de corpus, utilizando ferramentas da linguística computacional (programas de análise automática de textos) e métodos estatísticos. Concretamente: na segunda parte, para além de uma abordagem teórica sobre a linguística de corpus e de alguns conceitos utilizados em linguística computacional, faremos uma reflexão sobre as vantagens da utilização das novas tecnologias, apresentando alguns programas possíveis, apresentaremos o método de trabalho por nós aplicado, incluindo a criação de recursos para esta análise, e os resultados dessa utilização (em termos globais do corpus e em termos comparativo-contrastivos entre os 4 autores), ao nível das classes de palavras e categorias gramaticais, da riqueza vocabular dos textos de cada autor, aferindo quais os campos temáticos predominantes no corpus em estudo. Faremos ainda uma reflexão sobre o uso de determinado tipo de léxico nestes textos, como são o diminutivo e o aumentativo e a referência aos animais, por exemplo.

Na terceira parte, após um breve enquadramento teórico sobre o campo da axiologia e sobre a questão axiológica nos contos, apresentaremos os resultados obtidos neste âmbito com a aplicação dos programas escolhidos aos textos que constituem o nosso corpus. Nomeadamente, compararemos os registos identificados no corpus, entre os autores, ao nível da sua frequência, polarização, riqueza vocabular e distribuição por vertentes de significação ou domínios tipológicos.

Apresentaremos, por fim, à semelhança do que fizemos com os recursos criados para a análise, alguns recursos criados para pesquisa, demonstrando as suas potencialidades, e faremos uma referência aos valores propriamente ditos identificados no corpus.

(29)

29

PARTE I

O léxico

“O léxico é a parte da língua que primeiramente configura a realidade extralinguística e arquiva o saber linguístico duma comunidade. Avanços e recuos civilizacionais, descobertas e inventos, encontros entre povos e culturas, mitos e crenças, afinal quase tudo, antes de passar para a língua e para a cultura dos povos, tem um nome e esse nome faz parte do léxico. O léxico é o repositório do saber linguístico e é ainda a janela através da qual um povo vê o mundo”.

(30)
(31)

31

1

. O estudo do léxico

O objeto do nosso estudo é o léxico dos contos da tradição oral portuguesa, a motivação é o acreditar que as palavras que os constituem são de grande importância ao nível da formação e desenvolvimento do ser humano. Aferir portanto desse léxico de que se constroem os contos torna-se para nós tarefa de primordial importância. Todas as transformações operadas em sociedade ao longo dos tempos, e têm sido muitas, são imediatamente representadas na língua: “a língua portuguesa é o resultado de uma longa história, e o léxico é o subsistema da língua mais dinâmico, porque é o elemento mais directamente chamado a configurar linguisticamente o que há de novo, e por isso é nele que se reflectem mais clara e imediatamente todas as mudanças ou inovações políticas, económicas, sociais, culturais ou científicas” (Vilela 1994: 14).

Também a forma de fazer linguística mudou substancialmente ao longo do tempo. Primeiro, “com o dealbar da linguística como ciência, no início do século XX, graças sobretudo aos ensinamentos de Saussure e seus seguidores, a língua passou a ser encarada como objeto de estudo por si própria e a ser alvo de um discurso que, como qualquer discurso científico, se quer descritivo, objectivo, distinto, portanto, do gramaticismo predominante ao longo da história2” (Correia 2008: 2) e depois, com início na segunda metade do século XX, e a um ritmo alucinante de desenvolvimento, com o aparecimento no panorama linguístico das ferramentas da linguística computacional (igualmente denominada de engenharia da linguagem) ou de corpus. A linguística de corpus mudou radicalmente a forma de fazer linguística e as possibilidades ao nível do tratamento do léxico.

No entanto, “a complexidade dos problemas inerentes ao tratamento do léxico” (Vilela 1979: 5) impõe que um estudo dedicado exclusivamente ao mesmo, ainda que essencialmente prático, principie com umas breves considerações teóricas sobre a matéria. Outras irão sendo feitas à medida que vão sendo utilizadas no nosso estudo.

2

“Ao longo do século XX, mesmo do ponto de vista científico, a concepção da língua foi-se enriquecendo. De uma concepção de língua como fenómeno social, introduzida por Saussure e seguida por grande parte dos linguistas da primeira metade do século, passou a ver-se a língua também como facto mental, graças, sobretudo, aos trabalhos de Chomsky e seus seguidores, já na segunda metade do século” (Correia 2008: 2).

(32)

32

1.1. Léxico

O termo léxico deriva do grego leksikós, -ê, -ón, relativo a palavras.

Segundo Vilela (1994: 10), que também cita Saussure, “O léxico duma língua pode ser visto como o dicionário ideal dessa língua, o «trésor des mots, tel qu’il est rangé dans un dictionnaire» ou, numa outra perspectiva, como «tout ce qui est indépendant des rapports grammaticaux concernant la phrase»”. O mesmo autor compreende o léxico como “a totalidade das palavras duma língua, ou, como o saber interiorizado, por parte dos falantes de uma comunidade linguística, acerca das propriedades lexicais das palavras (propriedades fonético-fonológico-gráficas, propriedades sintácticas e semânticas)” (Idem, 10).

Falar de léxico remete-nos para a necessidade de referir um outro conceito: vocabulário. De facto, alguns conceitos em linguística estão tão estreitamente ligados que falar de uns implica necessariamente referir os restantes. Desde logo os conceitos de léxico e vocabulário3. Com efeito, encontramos, não raras vezes, para além da questão da utilização, os conceitos de léxico e vocabulário definidos como sinónimos. Mostraremos diversas posições, relativamente a esta matéria, mas referimos desde já que nós compreendemos o léxico como a totalidade de palavras disponíveis em cada língua, por oposição a vocabulário, que entendemos como o uso efetivo das palavras, que os falantes dessa língua fazem, em discurso (oral ou escrito). Considerando indiscutível a interligação entre os dois conceitos, compreendemos o vocabulário como parte de um todo que é o léxico, estabelecemos a diferença entre os dois no sentido em que o primeiro remete para uma efetivação e o segundo para uma possibilidade. Por outras palavras, “lexique de la langue et vocabulaire d’un texte ou d’un discurs4” (Lehman e Martin-Berthet 1998: 16).

No Dicionário da Academia das Ciências podemos ver léxico, numa aceção, considerado sinónimo de glossário e vocabulário, definido como “lista de vocábulos de uma ciência, de uma técnica, de um domínio especializado ou de uma obra, com a

3

Os termos léxico e vocabulário têm sido, entre alguns linguistas, alvo de alguma discordância. Se por um lado há quem os considere sinónimos, por outro há quem os considere interligados, mas não passíveis de serem utilizados indiferenciadamente.

4

Jacqueline Picoche, em Études de Lexicologie et Dialectologie, refere que “L’équation Saussurienne: «Langage = langue (aspect social, bien-fonds d’une communauté linguistique) + parole (aspect individuel du langage, variant avec les utilisateurs) est reformulée par Guillaume em «langage = langue + discours». Discours plus souple que parole englobe la sèrie des manifestations physiques, orales, scripturales, pictographiques, gestuelles, ou psychiques (discours intérieur) qui sont le produit de la langue” (p.22).

(33)

33

respectiva definição” e, em aceção pertencente ao domínio linguístico, definido como “conjunto dos lexemas, unidades virtuais de significação, que pertencem ao domínio da língua de uma comunidade, de um locutor, por oposição à sua realização no discurso, ao vocabulário”. Citando M. L. Segura da Cruz, “Léxico é o conjunto das unidades linguísticas que constituem a língua de uma comunidade, vocabulário é o conjunto de unidades atualizadas no discurso, na ‘performance’, analisáveis, por exemplo em determinado texto, escrito ou oral”. Por seu lado o termo vocabulário, em aceção do domínio da linguística, é definido como o “conjunto dos vocábulos de uma língua” e, numa outra aceção, considerado sinónimo de glossário e de léxico, definido como “lista de palavras utilizadas por um autor numa obra”5

(Dicionário da Língua Portuguesa Contemporânea).

Alcaraz e Martínez, citados por Maria do Carmo Henríquez Salido em El Vocabulario Jurídico en el Dicionário da Academia das Ciências de Lisboa y el Diccionário de la Real Academia Española, estabelecem a distinção entre um e outro conceito, admitindo, contudo, a sua interligação. Nas suas palavras,

El léxico es, junto con la morfosintaxis, la fonologia, etc., uno de los principales niveles o componentes del análisis lingüístico. En principio, los términos ‘léxico’ e vocabulario son intercámbiales, ya que […] el conjunto de palabras de una lengua constituye su ‘léxico’ o ‘vocabulario’ […]. No obstante, se suelen hacer algunas matizaciones. Por lo general, se reserva el término ‘léxico’ para aludir al conjunto de clases abiertas portadoras de significado, mientras que el de ‘vocabulario’ se aplica a las clases cerradas, puesto que no se puede hacer una descripción lingüística sin que se reduzcan las clases abiertas a clases cerradas […]. En resumen, el ‘léxico’ es el conjunto de unidades léxicas que en un momento determinado están a disposición de un locutor/receptor, y el ‘vocabulario’ es la puesta en uso de un determinado número de las mismas por un grupo o un individuo (Salido 2002: 35).

Emile Genouvrier e Jean Peytard realizam a seguinte distinção de ordem terminológica entre vocabulário e léxico:

O léxico é o conjunto de todas as palavras que, num momento dado, estão à disposição do locutor. São as palavras que ele pode, oportunamente, empregar e compreender; constituem o seu léxico individual. O vocabulário6 é o conjunto das

5

Dicionário da Academia das Ciências, 2001, Lisboa: Academia das Ciências de Lisboa e Fundação Calouste Gulbenkian

6

Aldónio Gomes, no seu estudo Guia do Professor de Língua Portuguesa, refere que «Vocabulário é o conjunto das palavras usadas na realização dos vários actos de fala» e distingue três campos diferentes no estudo do vocabulário: o comum (o que consta dos dicionários não especializados), o fundamental (é constituído por um determinado número de palavras comuns a todo o falante de uma língua) e o especializado (vocabulário relativo a determinadas áreas do conhecimento)» (GOMES, et al. 1991: 47).

Para Maria Francisca Xavier e Maria Helena Mira Mateus, vocabulário é uma «Lista exaustiva das palavras de um corpus. O vocabulário distingue-se do léxico, que é entendido como o inventário de todas as

(34)

34

palavras efectivamente empregadas pelo locutor num acto de fala preciso. O vocabulário é a actualização de certo número de palavras pertencentes ao léxico individual do locutor». E acentuam que «vocabulário e léxico acham-se em relação de inclusão: o vocabulário é sempre uma parte, de dimensões variáveis, conforme as solicitações de momento, do léxico individual, que, por sua vez, faz parte do léxico global (Genouvrier e Peytard s/d: 280)

Harry Shaw define lexicon ou léxico como «vocabulário da linguagem duma determinada profissão, classe social, etc. (léxico dos estudantes, léxico dos marinheiros)» (Shaw 1982: 276).

No entanto, Mário Vilela expande este conceito ao considerar que “por léxico de uma língua poder-se-á entender o dicionário no duplo sentido de conjunto de palavras dessa língua e a sua inventariação (dicionarística ou lexicográfica), a competência lexical do falante/ouvinte nativo de uma língua e, na perspectiva resultante da função representativa da linguagem, o conjunto das unidades léxicas (=as unidades que representam a realidade extralinguística) duma língua” (Vilela 1979a: 9), sendo que «as palavras constituem o objeto da chamada lexicologia. […] A palavra como palavra léxica (Wortform) é um elemento do discurso, ou actualização de cada uma das possibilidades da forma básica no uso concreto condicionado pelo respectivo contexto»7 (Idem, 20 e 21). Ainda segundo o autor, “o léxico contacta directamente a experiência do mundo real, reflecte a multiplicidade do real e constitui o stock, o armazém donde os falantes extraem as palavras conforme as situações” (Ibidem, 33).

Galisson e Coste realizam a seguinte definição de vocabulário e léxico:

O par léxico-vocabulário decorre precisamente das oposições langue/parole – língua/fala (terminologia de G. Guillaume): léxico diz respeito à língua e vocabulário ao

discurso.

O léxico é constituído por unidades virtuais: os lexemas. Quando os lexemas se actualizam no discurso, tornam-se vocábulos. O conjunto dos vocábulos é o

vocabulário. O vocabulário está necessariamente ligado a um texto, escrito ou falado,

curto ou extenso, homogéneo ou compósito, enquanto o léxico, transcendendo o texto, está ligado a um ou vários locutores. O vocabulário de um texto pressupõe a existência de um léxico, do qual não é senão uma amostragem, isto é, um subconjunto (Galisson e Coste 1983: 433).

lexias de um dado estado de língua. Denomina-se ainda vocabulário um dicionário constituído pelos vocábulos mais frequentes da língua corrente, definidos sucintamente, seguidos por vezes do seu equivalente numa língua antiga ou estrangeira (MATEUS e XAVIER 1992: 399).

7

Roger Fowler diz-nos que “O termo contexto é frequentemente mencionado na teoria literária, se bem que apenas com uma conotação negativa: diz-se que os textos literários são independentes de qualquer contexto ou, em alternativa, que eles «criam os seus próprios contextos». Há quem diga que a diferença entre literatura e «discurso normal» reside neste facto” (Fowler 1994: 147).

(35)

35

Mário Vilela, ainda a propósito da noção de léxico, concretiza as duas perspetivas segundo as quais o mesmo deve ser entendido. Refere que o léxico é:

numa perspectiva cognitivo-representativa, a codificação da realidade extralinguística interiorizada no saber de uma dada comunidade linguística. Ou, numa perspectiva comunicativa, é o conjunto de palavras por meio das quais os membros de uma dada comunidade linguística comunicam entre si. Tanto na perspectiva da cognição-representação como na perspectiva comunicativa, trata-se sempre da codificação de um saber partilhado (=shared knowledge) (1995: 13).

O autor, que distingue vocabulário de léxico, estabelecendo que “o vocabulário é uma subdivisão do léxico, como, por exemplo, o léxico de um autor, o léxico de um texto, o léxico de uma escola, de uma área do saber, etc,” (Idem, 13), resume o que considera léxico de uma língua, numa perspetiva mais geral, referindo que este ”é assim um sistema de compreensão e configuração do mundo: é nele que uma dada comunidade linguística vasa o seu conhecimento e reconhecimento do mundo” (Idem, 78).

No mesmo sentido, para Baptista, que também relaciona vocabulário com léxico, estabelecendo a inclusão do primeiro no segundo,

o léxico de uma língua inclui, por um lado, uma parte passiva, um dicionário, onde estão registadas as propriedades das palavras e, por outro, uma parte activa, um conjunto de regras de formação de novas palavras. O léxico será, portanto, a codificação de um saber interiorizado por parte dos falantes de uma dada comunidade linguística.

O léxico é o conjunto de palavras de que os falantes de uma dada língua dispõem; o vocabulário, por sua vez, designa o conjunto de palavras que determinado falante dessa língua utiliza em dadas circunstâncias. Nessa perspectiva, só se poderá aceder ao léxico, realidade da língua, pelo conhecimento de vocabulários particulares, realidade da fala. Com efeito, embora o léxico transcenda os vocabulários, só através destes acedemos àquele. Por outro lado, não há vocabulário sem léxico: o primeiro constitui uma amostra do segundo (2004: 11 e 12).

Por outro lado, há autores que simplificam a definição de léxico considerando que “the term lexicon means simply «dictionary», and a dictionary is a list of words together with their meanings and other useful bits of linguistic information” (Spencer 1991: 47). Lehmann e Martin-Berthet corroboram, em parte, esta opinião referindo que “le lexique est partiellement représenté et décrit dans les dictionnaires” (1998: 15), mas pormenorizam-na referindo que

Le lexique en effet n’est pas une simple liste, qu’on ne pourrait ordonner que par l’ordre alphabétique; il s’organise sur les deux plans du sens et de la forme:

- la sémantique lexicale étudie l’organization sémantique du lexique: elle analyse le sens des mots et les relations de sens qu’il entretiennent entre eux;

- la morphologie lexicale étudie l’organisation formelle du lexique: elle analyse la structure des mots et les relations de forme et de sens qui existent entre eux (Idem,15).

(36)

36

Concluem referindo que “L’ensemble des mots d’une langue constitue son lexique” (Ibidem, 22)

“O léxico constitui um sistema aberto, mais ou menos imprevisível e quase infinito (…) sem ser uma manta de retalhos, não é um todo homogéneo, constitui o que costumamos designar por diassistema: as palavras de todos os dias convivem com as palavras dos especialistas, as palavras da língua falada (ou estilo coloquial) vivem lado a lado com as palavras da língua escrita (ou estilo reflectido), as palavras «velhas», ainda de uso corrente, coabitam com arcaísmos e neologismos” (Vilela 1995: 15 e 16). Hoje em dia, já ninguém duvida que

o léxico de uma língua é um conjunto apenas virtual de unidades lexicais e, portanto, impossível de descrever em extensão. A lexicologia ocupa-se de descrever a estrutura do léxico, o modo como se organiza, as regularidades apreensíveis no léxico, que têm vindo progressivamente a tornar-se mais claras para o observador: o léxico já não é hoje encarado meramente como o repositório das unidades lexicais e suas respectivas idiossincrasias, mas antes como uma componente de gramática que, apesar das suas particularidades (tais como o facto de ser uma componente aberta e em expansão, de limites imprecisos, abrangendo todo o universo conceptual de uma língua), apresenta as suas regularidades próprias e uma forma de estruturação específicas (Correia 2008: 3).

Com efeito, “A linguística computacional, a inteligência artificial, a linguística cognitiva, entre outros movimentos teóricos, obrigaram os linguistas à perspectivação do léxico como algo organizado” (Vilela 2002: 139 e 140), mas “os estudos lexicais passaram também a incorporar a tentativa de entender o modo como o conhecimento lexical é estruturado, adquirido e processado a nível mental e a linguística passou a ver o léxico como uma componente específica da gramática8 (Correia: 2008: 3 e 4).

8

Segundo Álvaro Iriarte Sanromán, que cita Rey-Debove, o léxico “não fazia parte da gramática principalmente porque, ao ser concebido como «um inventário aberto», não era passível de sistematização e, portanto, de estudo rigorosamente científico (Rey-Debove, 1970). Assim, num dos primeiros textos da lexicografia teórica moderna, Josette Ray-Debove (1970) nega ao léxico o estatuto de objecto passível de estudo científico dentro da gramática e contesta a existência de uma competência lexical análoga à competência gramatical. Para esta autora, todos os usuários e qualquer usuário de uma língua dominam o sistema gramatical da mesma (Rey-Debove, 1973: 97), enquanto nenhum deles individualmente domina o léxico da sua própria língua, que é uma realidade pertencente à comunidade linguística em geral, quer dizer, a todos os usuários e a nenhum deles em particular” (2001: 55).

(37)

37

1.2. Lexicologia

Conceito a que já fomos aludindo, a lexicologia (do grego leksikós, -ê, -ón, relativo a palavras + logia) é, dentro da linguística, a ciência que trata do estudo do léxico sob o ponto de vista estrutural e funcional: “A lexicologia costuma ser definida como a ciência do léxico de uma língua. Isto é, a lexicologia tem como objecto o relacionamento do léxico com os restantes subsistemas da língua, incidindo sobretudo na análise da estrutura interna do léxico, nas suas relações e inter-relações” (Vilela 1994: 10). A lexicologia é a “ ciência que se ocupa do estudo linguístico dos itens lexicais ou lexemas simples ou complexos. Para além da semântica lexical, a lexicologia envolve, ou pode envolver, a etimologia, a formação de palavras, a importação de palavras, a morfologia e a sintaxe. Ou seja, o objecto de estudo da lexicologia é a análise interna do léxico e as suas relações com os restantes subsistemas da língua” (Baptista 2004: 11). Vilela resume, referindo que

a lexicologia não tem como função inventariar todo o material armazenado ou incluído no léxico, mas sim fornecer os pressupostos teóricos, e traçar as grandes linhas que coordenam o léxico de uma língua. A sua função é apresentar as informações acerca das unidades lexicais necessárias à produção do discurso e caracterizar a estrutura interna do léxico, tanto no aspecto conteúdo, como no aspecto forma (1994: 10).

O autor refere, ainda, que “a semântica lexical pode situar-se no nível da «langue», da «norma» e no da «parole»: mas é apenas ao nível da «langue» que se situa a sistematicidade das unidades lexicais, o nível em que as unidades se configuram como unidades funcionais […] ao nível da «parole» situa-se o que pertence ao discurso concreto, a designação ou relação com o extralinguístico. […] Uma descrição funcional do conteúdo só é possível ao nível da «langue»: é aí que surgem com sistematicidade e necessariamente as relações e inter-relações léxicas” (Idem, 11 e 12).

1.2.1. Lexicologia vs lexicografia

A lexicologia e a lexicografia são ciências interligadas da linguística, que têm como objeto de estudo o léxico. Para além de partilharem o mesmo objeto de estudo, pode apontar-se a lexicografia como dependente da lexicologia9, pois são os estudos desta

9

Para Pereira (2003: 33), o papel da lexicologia, relativamente às outras ciências, vai muito além da influência sobre a lexicografia. Segundo a autora, que cita Mel'čuk (1995), “a vocação transdisciplinar da

(38)

38

última, de cariz essencialmente teórico, que permitem os trabalhos da primeira, de cariz essencialmente prático10. A lexicologia cria os fundamentos que servem de suporte à elaboração das obras de lexicografia. Porém, sendo ciências interligadas, e tendo ambas o mesmo objeto de estudo (o léxico), têm atuações distintas: a lexicologia trata do estudo científico do léxico, ao passo que a lexicografia trata da descrição do léxico em dicionários.

Embora a interligação entre as duas ciências, lexicologia e lexicografia, seja um dado consensual, já o mesmo não se passa relativamente ao objeto de estudo de uma e outra, ainda que, estamos em crer por uma questão de especificação, alguns autores refiram as duas ciências como tendo objetos de estudos diferentes. As autoras Lehmann e Marttin-Berthet (1998: 16), considerando que as duas disciplinas se interligam, diferenciam o objeto de estudo da lexicologia e da lexicografia, referindo que “La lexicologie et la lexicographie se sont constamment inspirées mutuellement, mais l’objet «langue» et l’objet «dictionnaires» sont de nature différente”. Também Pereira (2003: 25), que cita Quemada, estabelece distinção entre o objeto de estudo da lexicologia e o objeto de estudo da lexicografia:

Distinguir hoje a lexicografia da lexicologia consiste, de um modo consensual, em identificar a primeira como disciplina aplicada que tem por objecto a elaboração de dicionários, e a segunda como disciplina teórica cujo objecto é o estudo científico do léxico. «En régle génerale, dans les usages des spécialistes, comme dans les définitions des dictionnaires, la lexicologie est reconnue comme la “science du lexique” et englobe des approches aussi diverses que les théories linguistiques ou les méthodes dont elle se réclame: descritive, historique, structurale, sociale, etc. La lexicographie, pour sa part, est “l'art et la science du lexicographe, auteur de dictionnaires”».

Se é certo que a especificidade das funções de uma e outra ciência implicam abordagens diferentes, consideramos, contudo, que o objeto de estudo de uma e outra é sempre, em última instância, o léxico.

lexicologia, «science Carrefour», confere-lhe um papel de interface em relação às diferentes áreas disciplinares e níveis de análise em linguística”.

10

Vilela (1994: 11) refere mesmo a lexicografia como “o estudo da descrição da língua feita pelos dicionários, a elaboração de dicionários como aplicação dos dados da lexicologia”.

(39)

39

1.3. Palavra

Também ao nível do conceito de palavra, considerada a unidade básica do léxico e da lexicologia11, não é fácil encontrar uma definição simples ou, simplesmente, chegar a ter uma definição sequer. Alguns autores referem explicitamente a dificuldade no estabelecimento da noção de palavra12 ou, de outra forma, na dificuldade em concretizar o que é a palavra.

Jean Aintchison é perentório ao afirmar que “Everybody thinks that they know what a word is. But the matter, which seems so simple, is in fact enormously problematical” (2003: 35). Na realidade, quanto à noção de palavra, “nenhuma outra noção tem estatuto mais ambíguo […]. Os linguistas, também obrigados a utilizá-la constantemente, não alcançam dar-lhe uma definição unívoca” (Genouvrier e Peytard s/d: 270).

Haspelmath refere que “we do not have a good answer to the question of how to define the notion of word in a clear and consistent way that accords with our intuitions and with conventional practice, despite decades of research that has tried to adress the issue (…) we have no good basis for a general cross-linguistically viable word concept” (2011: 32). Continua mencionando que “the difficulties with a universally applicable word concept have been known for quite a while, and many linguists have concluded that the word cannot be defined universally, but only in a language-specific way” (Idem, 60).

Vilela, que se refere à palavra como a “unidade menor potencialmente isolável, autónoma, portadora de significado e função, que é separada como sequência de grafemas (ou letras), de outras palavras e que, no caso das palavras flexionais, dispõe de várias formas” (Vilela 1999: 52), refere também as enormes dificuldades encontradas ao nível da caracterização e definição da mesma: para o autor, ainda que, aparentemente, a noção de palavra pareça simples, a realidade é bem mais complexa do que isso. Refere, relativamente ao conceito “do que é a «palavra», o que corresponde à sua definição ortográfica: sequência de letras com espaço em branco dos dois lados. Contudo, a realidade da língua é bem mais complexa, como se vê pela simples noção de «polissemia» e «homonímia» (Vilela, 1995: 217 e 218). Pormenoriza, referindo e elencando uma série de explicações para esse facto,

11

Cf. Lehmann e Martin-Berthet (1998: 19) e Vilela (1994: 10).

12

Aquilo a que Pereira se refere como “a incontornável questão do estatuto e da (in)definição do conceito de palavra (2003: 47).

(40)

40

O reconhecimento da palavra como unidade da língua traz consigo uma série de dificuldades, quer quanto à sua caracterização, quer quanto à sua definição: dificuldades encontráveis na delimitação da palavra relativamente a outras unidades (morfema, grupo de palavras, etc.), ou dificuldades provenientes do ponto de vista em que se considera a palavra, ou ainda as dificuldades derivadas da palavra nas diferentes línguas. Assim, e a título de exemplo, há palavras que se aproximam muito do conceito de morfemas (verbos auxiliares), ou casos em que é difícil distinguir entre sintagmas fixos e palavras, ou ainda a existência de polissemia, que ao lado da homonímia, levanta dificuldades na identificação de palavra/palavras. Por outro lado, o carácter aberto do léxico, a sua mutabilidade (aparecimento desaparecimento de novas estruturas) semântica e estilística, a derivação e composição (processos sempre em aberto), não permitem um estudo sistemático do léxico sem dificuldades (Vilela 1979a: 16 e 17).

Alain Polguère, embora referindo-se ao próprio termo em si mesmo, refere outro desses fatores: a ambiguidade. Para ele, “ le term mot est ambigu13” (2008: 46). Continua

dizendo que “nous n’utilisons jamais mot comme terme linguistique technique et lui préférons un système assez riche, mais necessaire, de termes spécifiques: mot-forme, lexème, locution, lexie […] et vocable” (Idem, 47). Da mesma opinião é Michael Stubbs, que afirma que “The word 'word' is ambiguous. First, we have to distinguish between «lemas» and «word-forms»” (2002: 24). No mesmo sentido concorre a opinião de Eduardo Buzaglo Paiva Raposo, segundo o qual “a existência de palavras variáveis resulta muitas vezes num uso ambíguo do termo «palavra», que é conveniente esclarecer” (Raposo et al. 2013: 334). Ainda segundo o autor, “para evitar esta ambiguidade, é frequente, no âmbito da linguística contemporânea, chamar palavra a cada uma das formas particulares de um conjunto de formas variáveis e item lexical à entidade abstrata que representa o conjunto de formas, independentemente da variação flexional” (Idem, 334).

Com efeito, considerar o conceito de palavra é necessariamente considerar uma série de outros conceitos interligados, sem os quais a palavra não pode ser considerada. E se é verdade, já aqui o vimos, que sérios problemas se levantam na questão da definição/delimitação do conceito de palavra: a ambiguidade, a polissemia e a homonímia, a denotação e conotação, a estilística, a derivação e composição, por exemplo, também é verdade que a questão da dificuldade não é irresolúvel. Para Vilela, “têm-se apontado vários critérios na definição – identificação de palavra (cf. J. Krámsky 1969), havendo certo acordo em que os mais seguros serão os da isolabilidade, permutabilidade e autonomia por um lado e, por outro, os critérios semânticos” (1979a: 18), no entanto, “os traços resultantes da comparação entre sinónimos, antónimos, hipónimos, merónimos, etc., ou resultantes das construções gramaticais activadas a partir de cada elemento lexical, são

13

(41)

41

os dados com os quais definimos a unidade lexical. Há ainda outra via para se obter a definição de uma palavra: o recurso aos primitivos, ou «primitivos representacionais»” (Vilela 2002: 143). E conclui: “o significado de uma palavra recebe o seu valor de verdade dentro de uma frase num dado contexto” (Idem, 144).

Ultrapassando esta problemática da (in) definição de palavra, seja qual for a metodologia adotada na sua determinação, a palavra14 é a «Unidade linguística sintacticamente inanalisável, pertencente a uma categoria sintáctica, como nome, verbo ou preposição» (Mateus e Xavier: 279), ou, a palavra é “L’unité du lexique (…). L’identité d’un mot est constituée de trois éléments: une forme, un sens et une classe syntaxique” (Lehmann e Martin-Berthet 1998: 19). As autoras referem ainda que “En français, la tradition grammaticale reconnait huit classes de mots, appelées aussi parties du discours: non, verbe, adjectif, déterminant, pronom, adverbe, préposition, conjonction.” (Idem, 19). E concluem: “L’expression traditionnelle parties du discours est la traduction du latin partes orationis, où partes signifie «parties» par rapport au «tout» de l’énoncé (oratio); ce sont les unités constituants de la phrase” (Ibidem, 19).

1.3.1. Partes orationis

É na Grécia Antiga que se localizam os primeiros estudos da palavra. A palavra foi, com efeito, o primeiro objeto dos estudos gramaticais na Grécia Antiga: A expressão partes orationis (partes do discurso), viria a ganhar forma na primeira gramática do ocidente, sob o nome de Tecnné grammatiké, da autoria de Dionísio da Trácia, no século II a.C. Esta gramática, que incluía o estudo da letra, da sílaba e das partes do discurso, para a qual contribuíram em grande parte os trabalhos teóricos das escolas Aristótelica15 e Estóica, foi seguida pelos tratados gramaticais latinos16 de Varrão (séc. I a.C.), Quintiliano (séc. I), Donato (séc. IV) e Prisciano (séc. VI), entre outros, influenciando todos os estudos gramaticais posteriores, com visibilidade nas descrições das línguas modernas europeias.

14

As autoras referem que o termo vocábulo, «utilizado por vezes como sinónimo de palavra, designa uma unidade de um vocabulário, ou seja, de uma lista de palavras que ocorrem num dado corpus» (1992: 402).

15

Aristóteles, autor das obras De Interpretatione e Poetica, foi discípulo de Platão, para quem o discurso se separava em duas partes distintas: ónoma (nome) e rhema (verbo) (Cf. Platão - Crátilo e Sofista).

16

De língua latina (Varrão), Institutio oratoria (Quintiliano), Ars grammatica (Donato) e as Institutiones

Imagem

Figure 8.2 Types of link in the word-net
Tabela 1 – Caracteres não reconhecidos pelo Lexicon
Tabela 2 – Total de palavras que o Lexicon não reconheceu
Tabela 3 – Totais do corpus: ocorrências, formas diferentes e lemas
+7

Referências

Documentos relacionados

Nesse sentido, com a realização deste trabalho, objetivou-se avaliar a influência do nível de suplementação no terço final de gestação e início de lactação

(2019) Pretendemos continuar a estudar esses dados com a coordenação de área de matemática da Secretaria Municipal de Educação e, estender a pesquisa aos estudantes do Ensino Médio

Este subsídio é para aqueles que forem reformar a casa usando os serviços de alguma construtora que possua endereço na cidade de Hikone.. Informações Setor de Promoção da

libras ou pedagogia com especialização e proficiência em libras 40h 3 Imediato 0821FLET03 FLET Curso de Letras - Língua e Literatura Portuguesa. Estudos literários

Como no processo travelling grate o leito é estático, a queima se dá do topo para o fundo e após esta fase há a pós queima, onde não há aporte de calor proveniente

A cidade de Esperança conhecida como Lírio Verde do agreste paraibano, com seus aproximadamente 36 mil habitantes, encontrou na Casa de Saúde e Maternidade São Francisco de Assis e

A partir da junção da proposta teórica de Frank Esser (ESSER apud ZIPSER, 2002) e Christiane Nord (1991), passamos, então, a considerar o texto jornalístico como

Mesmo com suas ativas participações na luta política, as mulheres militantes carregavam consigo o signo do preconceito existente para com elas por parte não somente dos militares,