Para a seleção das preposições simples, consultaram-se as obras de
Rocha Lima
(1999),
Cunha e Cintra
(2001),
Bechara
(2009) e
Ilari et al.
(2008). Por serem tidas como uma
classe fechada de palavras, este grupo de preposições foi encontrado em todas as obras:
a, ante, após, até, com, contra, de, desde, em, entre, para, perante, por, sem, sob e sobre.
Entretanto, depois de sucessivas consultas aos dicionários usados na pesquisa, as unidades
lexicais afora, conforme, consoante, dentre, durante, exceto, mediante, perante e segundo,
que também podem ser utilizadas em certo contextos como preposições, foram incluídos
ao grupo canônico, o que resultou em uma seleção final de 25 itens1.
Quanto às locuções prepositivas, pretendia-se, de início, coletar o maior nú-
mero possível dessas expressões também em gramáticas e dicionários, mas logo se verificou
que essas fontes apresentavam sempre uma amostra reduzida de locuções, o que não se
considerou suficientemente representativo de um grupo cuja diversidade quase dá à essa
categoria o status de classe aberta.
Assim, a solução foi recorrer à análise de corpus para selecionar mais uni-
dades. O corpus utilizado nessa etapa foi o CETENFolha2
e a ferramenta que permitiu a
sua manipulação foi o Unitex3
(PAUMIER,2002).
O Unitex é um programa para o processamento de coleções textuais com
base na manipulação de recursos linguísticos como dicionários e gramáticas. A versão 3.1
do software dá suporte ao português, graças à iniciativa do projeto Unitex-BR4, conforme
descrito em
Muniz, Nunes e Laporte
(2005). Para a sua utilização, partiu-se da coleta
de um grupo inicial de 100 locuções prepositivas em gramáticas do português, que foi
analisado manualmente afim de se identificar padrões de busca que pudessem ser usados
para a extração dos itens no Unitex. Uma amostra dessa análise é trazida no
Quadro 5.
Com essa estratégia, 35 padrões de busca diferentes puderam ser identificados, como
listado no
Quadro 6.
Em seguida, inseriu-se os padrões de busca no concordanceador5
do Unitex.
Para ilustrar esse recurso do programa, observa-se, na
Figura 20, a interface de busca
em que se insere o padrão de busca <ADV><DE> (“advérbio” seguido pela preposição
“de”). Essa consulta retorna uma lista de linhas de concordância (Figura 21), em que
1
Optou-se por excluir a preposição simples trás da descrição, porque seu uso é considerado raro na
língua e seu sentido é mais frequentemente lexicalizado por locuções prepositivas como “atrás de” e
“por trás de”.
2
Corpus composto por 24 milhões de palavras em português brasileiro com base nos textos do jornal
Folha de S. Paulo que fazem parte do corpus NILC/São Carlos
3
Disponível em: http://www-igm.univ-mlv.fr/ unitex/
4
Disponível em: http://www.nilc.icmc.usp.br/nilc/projects/unitex-pb/web/dicionarios.html
5
Concordanceadores são um tipo de ferramenta muito utilizada na Linguística de corpus para listar as
ocorrências de determinada expressão lexical, apresentadas de modo centralizado, com seu contexto
de ocorrência à esquerda e à direita, fornecendo uma visualização privilegiada do item.
Capítulo 4. Descrição linguística
68
todas as ocorrências encontradas com esse padrão são dispostas de modo centralizado.
Essa visualização facilita a tarefa de identificação das locuções prepositivas entre as ex-
pressões extraídas, como depois de, diante de e fora de, ao permitir analisar o contexto de
ocorrência. Dessa forma, identificaram-se as 235 locuções prepositivas reunidas no quadro
do Apêndice
A.
Quadro 5 – Amostra das locuções prepositivas e seus padrões de busca
Locuções prepositivas
Padrões de busca
em frente a
<em><N><a>
à direita de
<a.prep><N><de>
a partir de
<a.prep><V><de>
abaixo de
<ADV><de>
acima de
<ADV><de>
ao encontro de
<ao><N><de>
de cima de
<de><ADV><de>
de dentro de
<de><ADV><de>
de encontro a
<de><N><a>
dentro de
<ADV><de>
detrás de
<ADV><de>
em frente a
<em><N><a>
em frente de
<em><N><de>
junto a
<ADV><a>
junto com
<ADV><com>
para dentro de
<para><ADV><de>
para fora de
<para><ADV><de>
por entre
<prep><prep>
Fonte
–
Elaboração própria
Após a seleção das preposições e locuções a serem descritas, apresenta-se,
na
seção 4.2, a delimitação dos valores espaciais que caracterizam o sentido primordial,
com base nos conceitos cognitivos de Esquema Imagético, Eixo Espacial, Traço Semântico
e Frame.
Capítulo 4. Descrição linguística
69
Quadro 6 – Total de padrões sintáticos identificados a partir do grupo inicial de locuções pre-
positivas
<a.prep><N><de>
<de><ADV><de>
<na><N><de>
<a.prep><V><de>
<de><N><a>
<no><ADV><de>
<a.prep><N><com>
<ADV><em>
<no><N><de>
<ADV><de>
<N><a>
<nos><N><de>
<ao><N><de>
<do><N><de>
<para><ADV><de>
<aos><N><de>
<em><N><a>
<para><DET><ADV><de>
<às><N><de>
<em><N><de>
<pelo><ADV><de>
<com><N><em>
<em><N><com>
<por><ADV><de>
<com><N><de>
<CONJ><a>
<por><N><de>
<com><N><a>
<N><de>
<prep><prep>
<da><N><de>
<ADV><a>
<prep><prep><prep>
<de><N><com>
<ADV><com>
Fonte
–
Elaboração própria
Figura 20 – Interface de busca do Unitex com o padrão sintático <ADV+de>
Capítulo 4. Descrição linguística
70
Figura 21 – Resultado da busca do padrão <ADV><de> (Figura 20) no concordanceador do
Unitex
Capítulo 4. Descrição linguística
71
4.2 Delimitação dos valores das propriedades
No documento
PrepNet.Br: uma proposta de representação semântica para as preposições do português
(páginas 68-72)