• Nenhum resultado encontrado

03 Seleção e construção dos corpora e metodologia de análise

3.3. Metodologia para a seleção e análise dos dados

3.3.1 Os contextos de análise e as buscas realizadas

3.3.1.1 Os nomes próprios

No Corpus Tycho Brahe, havia uma problemática envolvendo a definição de nome próprio, pois os critérios adotados para a sua classificação faziam com que alguns nomes que não eram, de fato, próprios fossem marcados como tal. Isso se devia ao fato de terem sido aplicadas, na anotação morfológica, as siglas NPR ou NPR-P (Nome Próprio e Nome Próprio Plural, respectivamente) a todos os nomes comuns com letras maiúsculas. Além desse critério, eram classificados como nomes próprios (i) todas as formas de endereçamento, mesmo aquelas em que uma letra maiúscula não ocorre (Vossa Senhoria), (ii) títulos e epítetos, (iii) datas, dias da semana, meses e feriados, (iv) lugares e (v) sobrenomes.

A partir dessa classificação, foram realizadas no Corpus Tycho Brahe buscas necessárias para a recuperação de todas as ocorrências de nomes próprios, mesmo aquelas que estavam etiquetadas de forma inadequada para os propósitos desta pesquisa.

Ao fazê-lo, filtraram-se os casos que continham pronomes de tratamento. Além disso, não foram realizadas buscas em sintagmas nominais vocativos e apostos, visto que alguns estudos mostram que estes são contextos categóricos de apagamento do artigo (cf. CALLOU & SILVA (1997), BRAGA (2012)).

Assim, as buscas foram realizadas em cada tipo de NP que pode conter nomes próprios e que permite variação na ocorrência de artigo, a saber: NP-sujeito, NP-acusativo, NP- adverbial, NP-deslocado à esquerda (cf. exemplos ((54a) e (54b)), ((55a) e (55b)), ((56a) e (56b)) e ((57a) e (57b)), respectivamente). Além disso, realizou-se uma busca por nomes próprios que estivessem inseridos dentro de um sintagma preposicional (cf. exemplo ((58a) e (58b)), uma vez que o contexto de uso de preposição mostrou-se relevante na análise dos artigos definidos diante de pronomes possessivos em outros estudos. A descrição das buscas realizadas é apresentada no apêndice 01, junto a exemplos correspondentes a cada uma delas.

(54) a. e disse me o Susanário ou mo deu a entender, porque ele não sabe dizer isto, que o cozinheiro não andara bem em se meter nestes assados (91 ID C_001_PSD,115.1600)) – século XVIII.

b. Luís meditava nas revelações do lavrador, (B_005_PSD,10.246) – século XIX.

(55) a. Acabada a leitura, pedia que o desculpassem com sua irmã por se não demorar mais, pois queria ir visitar o Lausperenne, o que não tinha feito por falta de tempo (103 ID A_003_PSD,24.340)) – século XIX.

b. e alguns, com quem eu mais tarde falei, disseram me que era o general mais elegante e o cavalheiro mais simpático que acompanhava Massena (83 ID A_003_PSD,89.1384)) – século XIX.

(56) a. A quarta-feira seguinte nos saímos logo deste rio da Varela por nome Tinaçoreu (46 ID P_001,116.915)) – século XVIII.

b. Sexta feira passada, em Anvers, ao jantar, caiu uma medonha, que depois soube ter feito muitos estragos (65 ID O_001,141.1568)) – século XIX.

(57) a. Mas o Pilho, essa justiça lhe hei--de eu fazer (38 ID G-004,0.1289)) – século XIX.

b. Diodoro de Sicília diz, que Hércules, filho de Alcmene, a quem Euristeu pedira lhe trouxesse o talim de Hipólita, Rainha de as Amazonas, ele com efeito as combatera junto a as margens de o Termodon, e destruíra aquela nação guerreira (140 ID A_001_PSD,167.3845)) – século XVIII.

(58) a. e disparou um falcão com pelouro, que foi zonindo por cima das casas do Sabaio, onde pousava Dom Estevão da Gama (80 ID C_007,04.37)) – século XVI.

b. e dizendo- -lhe que nas casas de António Pessoa, dando a a cabeça, disse ao secretário: "Assim me toma o Senhor Martim Affonso como ladrão? (86 ID C_007,05.44)) – século XVI.

De posse dos resultados das buscas automáticas que somaram 16.876 ocorrências de nomes próprios no Corpus Tycho Brahe e 3.543no Corpus de artigos jornalísticos, a etapa posterior consistiu de uma filtragem manual nos dados. Essa análise se mostrou necessária, não somente devido ao problema de etiquetagem envolvendo os nomes próprios, como também por permitir uma análise detalhada dos resultados, que possibilitou avaliar o tipo de nome próprio, os contextos sintáticos em que ocorre, a influência do uso de títulos (como Conde, Príncipe, entre outros), a estrutura do sintagma (se nominal ou preposicionado), a presença de modificação, a sua ocorrência como item de enumeração, entre outros ambientes. Dessa maneira, esse refinamento dos dados trouxe resultados específicos para esta pesquisa e contribuiu para que se uniformizasse a classificação de nomes próprios no corpus nos NPs e PPs investigados.

Para tanto, foi realizada uma classificação retomando o que foi definido no primeiro capítulo dos dados em planilhas, de forma a separar a quantidade de ocorrências de nomes próprios que se referem a: (i) pessoas, (ii) sobrenomes (singulares e plurais), (iii) cidades, países e estados, (iv) título/ hierarquias, (v) rios, praias e oceanos/ ilhas, (vi) dias, (vii) meses, (viii) feriados, (ix) instituições, (x) profissões, (xi) divindades, (xii) nomes de objetos, (xiii) epítetos, (xiv) nacionalidades, (xv) empresas e (xvi) continentes. Os demais casos foram desconsiderados.

Essa organização dos dados permitiu ainda que se identificassem casos de usos categóricos, ou seja, contextos em que não se constata a possibilidade de variação quanto ao uso ou não de artigos definidos, como os descritos a seguir:

 Casos em que o artigo está sempre presente:

- Quando há modificação pré-nominal:

(59) A charidosa Elena, mais amante do alivio alheo, que do descanço proprio, tomava a tarefa de sua oraçaõ, aonde teria coroas para seu merecimento, nas rogativas por aquelles Espiritos, a quem romperia as cadeas de suas prizoens, com a força de sua intercessão (158 ID C_002,178.596)) – século XVII.

- Quando há nomes de rios e de lugares que não apresentam variação sincronicamente (no português europeu moderno):

(60) Como há-de chegar a a terra de promissão, quem leva o Egipto em a memória? (A_001_PSD,106.2441) – século XVIII.

 Casos em que o artigo está sempre ausente:

- Quando há sentenças de predicado secundário (cf. (61a)), estruturas de nomeação precedidas pela palavra nome (cf. (61b)) e em casos de dupla regência verbal (cf. (61c)).

(61) a. Dom Pedro de Sousa Holstein, que morreu Duque de Palmella, era irmão de a Condessa de Alva (A_003_PSD,70.1048) – século XIX.

b. e ao filho puzerão- -lhe nome Gelaldim61; (C_007,23.283) – século XVI.

c. Mas primeiro diga- -me, já que diz que sabe; por que é esta teima do seu tio de chamar ao Thomé, Gonçalo? (G-004,0.1798) – século XIX.

- Quando há nomes de rios e de lugares que não apresentam variação sincronicamente (no português europeu moderno):

(62) Roma, essa ilustre capital de o mundo, ou ao menos de a maior República, que o mundo viu; essa universal conquistadora, para cuja glória concorreu a fortuna mais constante, e cujo poder se manifesta ainda, ou já referido em os seus Fastos, ou já representado em os vestígios preciosos de as ruínas, como em obeliscos, arcos triunfais, colunas, circos, aquedutos, urnas sepulcrais; essa Cidade altiva em que o mundo se quis resumir, e abreviar; ela mesma conta a decadência de o seu esplendor nativo, de o tempo em que as ciências chegaram ao maior auge (A_001_PSD,131.3073) – século XVIII.

61 Há exceção envolvendo os nomes de Ilhas, pois nas duas ocorrências em que a palavra nome antecede o nome

próprio, o artigo definido está presente:

(i) Passada esta Ilha, acháram outra na mesma altura, a que puzeram nome a Cesarea, por amor do Imperador. (C_007,08.93) – século XVI.

(ii) e lhes puzeram nome as Filipinas, pelo Principe Dom Filipe, herdeiro do Imperador Carlos V. (C_007,09.104) – século XVI.

Além dos casos supracitados, quando há a ocorrência do quantificador todo(s), tem- se um contexto de pouca variação, com uma tendência forte à presença do artigo definido (cf. (63)). Ademais, todas as ocorrências com o verbo ser em sintagmas nominais não preposicionados foram excluídas do cômputo geral (cf. (64a), (64b), (64c) e (64d)), visto que a anotação sintática envolvendo esse verbo no corpus ainda é objeto de discussão.

(63) A dar lhe o parabéns de ter empunhado o Cetro, e a trazer a notícia, de que já todo o Brasil ficava rendido a a sua obediência, mandou Dom Jorge Mascarenhas, Marquês de Montalvão, e Vice-Rei daquele Estado, a seu filho Dom Fernando Mascarenhas no ano de 1641 (151 ID B_001_PSD,19.162)) – século XVII.

(64) a. Hoje é ... domingo ... (G-004,0.541) – século XIX.

b. Sou o Gregorio, moço do casal aqui do senhor Sebastião de Arruda. (G- 004,0.4047) – século XIX.

c. Eu sou António de Queirós e Meneses, da casa de Cimo de Vila. (B_005_PSD,56.1611) – século XIX.

d. de estas a Monarquia principal, é a Europa; (A_001_PSD,121.2834) – século XVIII.

Diante disso, todas as ocorrências descritas acima foram classificadas separadamente, com vistas a evitar que esses dados enviesassem os resultados relativos à ocorrência ou não de artigos definidos junto aos nomes próprios. Ademais, um estudo específico sobre as construções com o verbo ser torna-se, portanto, objeto de uma pesquisa futura.