• Nenhum resultado encontrado

Seleção das preposições e locuções prepositivas

Para a seleção das preposições simples, consultaram-se as obras de

Rocha Lima

(1999),

Cunha e Cintra

(2001),

Bechara

(2009) e

Ilari et al.

(2008). Por serem tidas como uma

classe fechada de palavras, este grupo de preposições foi encontrado em todas as obras:

a, ante, após, até, com, contra, de, desde, em, entre, para, perante, por, sem, sob e sobre.

Entretanto, depois de sucessivas consultas aos dicionários usados na pesquisa, as unidades

lexicais afora, conforme, consoante, dentre, durante, exceto, mediante, perante e segundo,

que também podem ser utilizadas em certo contextos como preposições, foram incluídos

ao grupo canônico, o que resultou em uma seleção final de 25 itens1.

Quanto às locuções prepositivas, pretendia-se, de início, coletar o maior nú-

mero possível dessas expressões também em gramáticas e dicionários, mas logo se verificou

que essas fontes apresentavam sempre uma amostra reduzida de locuções, o que não se

considerou suficientemente representativo de um grupo cuja diversidade quase dá à essa

categoria o status de classe aberta.

Assim, a solução foi recorrer à análise de corpus para selecionar mais uni-

dades. O corpus utilizado nessa etapa foi o CETENFolha2

e a ferramenta que permitiu a

sua manipulação foi o Unitex3

(PAUMIER,2002).

O Unitex é um programa para o processamento de coleções textuais com

base na manipulação de recursos linguísticos como dicionários e gramáticas. A versão 3.1

do software dá suporte ao português, graças à iniciativa do projeto Unitex-BR4, conforme

descrito em

Muniz, Nunes e Laporte

(2005). Para a sua utilização, partiu-se da coleta

de um grupo inicial de 100 locuções prepositivas em gramáticas do português, que foi

analisado manualmente afim de se identificar padrões de busca que pudessem ser usados

para a extração dos itens no Unitex. Uma amostra dessa análise é trazida no

Quadro 5.

Com essa estratégia, 35 padrões de busca diferentes puderam ser identificados, como

listado no

Quadro 6.

Em seguida, inseriu-se os padrões de busca no concordanceador5

do Unitex.

Para ilustrar esse recurso do programa, observa-se, na

Figura 20, a interface de busca

em que se insere o padrão de busca <ADV><DE> (“advérbio” seguido pela preposição

“de”). Essa consulta retorna uma lista de linhas de concordância (Figura 21), em que

1

Optou-se por excluir a preposição simples trás da descrição, porque seu uso é considerado raro na

língua e seu sentido é mais frequentemente lexicalizado por locuções prepositivas como “atrás de” e

“por trás de”.

2

Corpus composto por 24 milhões de palavras em português brasileiro com base nos textos do jornal

Folha de S. Paulo que fazem parte do corpus NILC/São Carlos

3

Disponível em: http://www-igm.univ-mlv.fr/ unitex/

4

Disponível em: http://www.nilc.icmc.usp.br/nilc/projects/unitex-pb/web/dicionarios.html

5

Concordanceadores são um tipo de ferramenta muito utilizada na Linguística de corpus para listar as

ocorrências de determinada expressão lexical, apresentadas de modo centralizado, com seu contexto

de ocorrência à esquerda e à direita, fornecendo uma visualização privilegiada do item.

Capítulo 4. Descrição linguística

68

todas as ocorrências encontradas com esse padrão são dispostas de modo centralizado.

Essa visualização facilita a tarefa de identificação das locuções prepositivas entre as ex-

pressões extraídas, como depois de, diante de e fora de, ao permitir analisar o contexto de

ocorrência. Dessa forma, identificaram-se as 235 locuções prepositivas reunidas no quadro

do Apêndice

A.

Quadro 5 – Amostra das locuções prepositivas e seus padrões de busca

Locuções prepositivas

Padrões de busca

em frente a

<em><N><a>

à direita de

<a.prep><N><de>

a partir de

<a.prep><V><de>

abaixo de

<ADV><de>

acima de

<ADV><de>

ao encontro de

<ao><N><de>

de cima de

<de><ADV><de>

de dentro de

<de><ADV><de>

de encontro a

<de><N><a>

dentro de

<ADV><de>

detrás de

<ADV><de>

em frente a

<em><N><a>

em frente de

<em><N><de>

junto a

<ADV><a>

junto com

<ADV><com>

para dentro de

<para><ADV><de>

para fora de

<para><ADV><de>

por entre

<prep><prep>

Fonte

Elaboração própria

Após a seleção das preposições e locuções a serem descritas, apresenta-se,

na

seção 4.2, a delimitação dos valores espaciais que caracterizam o sentido primordial,

com base nos conceitos cognitivos de Esquema Imagético, Eixo Espacial, Traço Semântico

e Frame.

Capítulo 4. Descrição linguística

69

Quadro 6 – Total de padrões sintáticos identificados a partir do grupo inicial de locuções pre-

positivas

<a.prep><N><de>

<de><ADV><de>

<na><N><de>

<a.prep><V><de>

<de><N><a>

<no><ADV><de>

<a.prep><N><com>

<ADV><em>

<no><N><de>

<ADV><de>

<N><a>

<nos><N><de>

<ao><N><de>

<do><N><de>

<para><ADV><de>

<aos><N><de>

<em><N><a>

<para><DET><ADV><de>

<às><N><de>

<em><N><de>

<pelo><ADV><de>

<com><N><em>

<em><N><com>

<por><ADV><de>

<com><N><de>

<CONJ><a>

<por><N><de>

<com><N><a>

<N><de>

<prep><prep>

<da><N><de>

<ADV><a>

<prep><prep><prep>

<de><N><com>

<ADV><com>

Fonte

Elaboração própria

Figura 20 – Interface de busca do Unitex com o padrão sintático <ADV+de>

Capítulo 4. Descrição linguística

70

Figura 21 – Resultado da busca do padrão <ADV><de> (Figura 20) no concordanceador do

Unitex

Capítulo 4. Descrição linguística

71

4.2 Delimitação dos valores das propriedades