• Nenhum resultado encontrado

Corpus diacrônico escrito

2 A ORAÇÃO RELATIVA NAS GRAMÁTICAS DE LÍNGUA PORTUGUESA

5.1 Seleção, constituição e delimitação do corpus

5.1.3 Corpus diacrônico escrito

A Biblioteca Nacional de Portugal conta com um acervo digital que contém textos do século XII ao século XXI, consoante a descrição a seguir:

Para a selecção das obras a digitalizar, a BNP recorreu a diversos critérios durante os anos de 2002 a 2007, definidos em função da sua missão de conservação e divulgação do património documental português. Assim, tendo em vista a preservação de documentos de natureza frágil e/ou manuseamento difícil, foi seleccionado um

194 Esse banco de dados encontra-se disponibilizado virtualmente no seguinte endereço eletrônico:

conjunto significativo de documentos iconográficos (cartazes, estampas, desenhos, etc) e de material cartográfico, representando respectivamente 65% e 18% dos documentos digitalizados disponíveis na Biblioteca Nacional Digital.

No contexto da valorização e divulgação do património documental nacional, a BNP tem adoptado critérios de selecção de documentos para digitalização baseados no respectivo interesse histórico-cultural, tendo em conta a proveniência nacional das obras, a respectiva data de publicação e a tipologia de documentos.

São exemplos de aplicação destes critérios os projectos mais recentes financiados pelo Programa Operacional Sociedade do Conhecimento de digitalização de jornais portugueses do século XIX e de dicionários e enciclopédias publicados em Portugal nos séculos XVII a XIX, bem como o Projecto Patrimonia, financiado pelo Programa Operacional da Cultura, ao abrigo do qual foram já digitalizados cerca de 400 títulos de livro antigo português (i.e. documentos impressos publicados entre 1500 e 1800) e que teve continuidade durante o ano de 2008, com a digitalização de 1100 títulos dos séculos XVI e XVII que serão gradualmente colocados em linha. Subjacente à adopção deste critério de selecção de obras para digitalização está, também, o objectivo de aumentar o número de obras textuais impressas disponíveis na BND, que actualmente representam apenas 16% da colecção de documentos digitalizados.

No que se refere à língua de publicação, metade dos documentos disponíveis na BND são em língua portuguesa. Relativamente a outras línguas, cerca de 19% das obras disponíveis na BND foram publicadas em francês, 11 % em inglês, 3% em castelhano, 3% em italiano e 2% em alemão.

Quanto à classificação por assunto, sendo a maioria dos documentos publicados na BND de tipo iconográfico e cartográfico, também os principais domínios representados são as Artes (35%) e a História/Geografia (35%). Dos restantes documentos digitalizados, 12% inscrevem-se nas áreas de Ciências Sociais, 11% nas Ciências Aplicadas, sendo 4% das obras do domínio da Literatura/Linguística.

(descrição encontrada na seguinte pagina eletrônica: http://purl.pt/index/geral/PT/about.html) Para esta pesquisa, optamos por selecionar obras dos séculos XVI ao XX, posto que, a partir do século XVI, deu-se o aparecimento dos primeiros trabalhos metalinguísticos (gramáticas, dicionários, louvores da língua)195. Interessamo-nos em obter dados escritos legitimados e em conformidade com a formalização linguística vigente na época, por isso nosso interesse por obras a partir do século XVI, quando se iniciou a preocupação metalinguística em Língua Portuguesa. Preferimos manter a organização feita pela biblioteca, de modo que levamos em consideração a data da publicação da obra em Lisboa informada na ficha catalográfica feita pela biblioteca, embora reconheçamos que algumas das obras tenham sido publicadas tardiamente em relação à sua realização. Procuramos selecionar os textos cuja publicação não se distanciasse tanto do período de realização. Do mesmo modo, concernente à referência das obras, registram-se ora os autores, ora os responsáveis pela edição, ou ainda os nomes dos responsáveis que preservaram a obra antes de esta ser disponibilizada na biblioteca.

Com relação à seleção dos textos, adotamos os seguintes critérios:

195 Essa informação foi obtida no endereço eletrônico http://www.instituto-camoes.pt/ (Camões Instituto da

1) Selecionamos quatro obras em cada século (duas representativas da primeira metade do século e duas representativas da segunda metade);

2) Optamos por textos em prosa que tratam, de um modo geral, de temáticas variadas: a vida na corte, acontecimentos importantes, narrativas cavalheirescas, ensinamentos morais e religiosos, etc;

3) Selecionamos, preferencialmente, textos cujas sequências textuais predominantes fossem a descritiva, principalmente, e a explicativa e/ou argumentativa, justamente por acreditarmos que tais sequências propiciam a ocorrência de orações relativas pelo fato de que o nome antecedente à relativa necessitaria de caracterização, o que resultaria no uso desse tipo de oração. Assim sendo, poderíamos observar a partir de que fatores linguísticos (ou extralinguísticos) o que passa a assumir essa função gramatical de conector ou, em termos gerativos, complementizador;

4) Atentamos para a seleção de textos que tivessem um número de páginas aproximado, sempre que possível, para manter o equilíbrio do volume textual analisado em cada século (aproximadamente em torno de 100 páginas);

5) As obras escolhidas, desse modo, encaixam-se no que se costuma chamar de Português Arcaico (ou Clássico) e Moderno196, conforme o quadro a seguir:

Época Leite de

Vasconcelos Silva Neto Pilar V. Cuesta Lindley Cintra até sec. IV

(882) pré-histórico pré-histórico pré-literário pré-literário até aprox. 1200 (1214 – 1216) proto-histórico proto-histórico até 1385/1420 português arcaico trovadoresco galego- português português antigo até 1536/1550 português comum português pré- clássico português médio até sec. XVIII português

moderno português moderno português clássico português clássico até sec.

XIX/XX português moderno português moderno

Quadro 9: Quadro extraído de Mattos e Silva (2006, p. 25)

196 Nesta pesquisa, não entraremos na discussão sobre a classificação periódica do Português. Levamos em

Após a leitura de todos os textos, constituímos nosso corpus de ocorrências com 30 (trinta) contextos de usos de construções pseudorrelativas modalizadoras, distribuídas nas cinco sincronias destacadas no quadro a seguir:

SINCRONIA XVI XVII XVIII XIX XX TOTAL

OCORRÊNCIAS 3 5 3 10 12 32

Quadro 10: Número de ocorrências encontradas no corpus diacrônico de Escrita

Foram excluídas da análise quantitativa as ocorrências encontradas nos textos do século XX, posteriores a 1950, em razão de que nosso objetivo era observar dados de língua históricos, e, como seguimos a descrição de Borba (2008), são considerados contemporâneos os dados linguísticos a partir de 1950. Das 12 (doze) ocorrências referentes ao século XX, 2 (duas) não entraram na análise quantitativa, pois se encontram registradas no Século XX, posteriores a 1950. Servirão, por conseguinte, para a discussão qualitativa do fenômeno.

Descritos os critérios para a seleção, constituição e delimitação de nosso corpus, abordamos, a seguir, os processos metodológicos de análise.