• Nenhum resultado encontrado

1.2 O modelo do Léxico-Gramática

1.2.3 Premissa 3: Os testes de aceitabilidade são feitos com recurso mas-

No que se refere à obtenção dos dados linguísticos a serem descritos, há duas formas possíveis na literatura: (i) recorrendo-se a corpus; e (ii) por meio da introspecção, ou seja, o conhecimento linguístico do falante. Segundo Laporte (2015), ambas são úteis já que elas abarcam dois aspectos da realidade e uso linguístico. A utilização de corpora é importante para as formas que poderiam passar despercebidas pelo conhecimento do linguista, enquanto a introspecção é necessária para distinguir entre formas raras e aquelas que não estão em uso.

As duas formas (introspecção e observação em corpus) serão usadas neste trabalho para recensear os dados. Por outro lado, no que se refere ao julgamento de aceitabilidade das frases, o L-G requer um recurso massivo à introspecção.

Gross (1975, p.27) considera que a utilização apenas de corpus não permite uma análise Ąna da aceitabilidade das construções, pois pode não aparecer no corpus algum tipo frásico que existe na língua. Nesse sentido, é recomendável o uso da introspecção do linguista nativo. ŞA aceitabilidade é então uma noção muito complexa, que abrange as intuições de forma e de sentido, e que depende de inúmeros fatores culturaisŤ10 (GROSS, 1975, p.23).

O julgamento daquilo que se considera aceitável ou inaceitável na língua depende de dois critérios básicos: (i) a frase deve ser pronunciável; e (ii) a frase deve ser imediata- mente interpretável. Esse segundo critério permite que façamos paráfrases com elementos linguísticos semelhantes, a Ąm de comparar as estruturas. O fato de ser imediatamente interpretável não exclui os casos de ambiguidade de interpretação; pelo contrário, uma mesma frase pode ter diversos signiĄcados, e todas essas construções serão aceitáveis, desde que sejam pronunciáveis e imediatamente interpretáveis.

Laporte (2015) reformula o conceito de aceitabilidade, dizendo que: ŞPara ser acei- tável, uma forma tem que ser signiĄcativa. Quando linguistas julgam a aceitabilidade de

9 Tradução minha. Do original: ŞPar convention, les unités de base du sens seraient portées par ces

phrases simples. La description sémantique consisterait donc à décomposer les phrases complexes selon les phrases simples de base, elle ne différerait donc guère de la description syntaxique (Gross 1978). Cette position est celle de Harris 1968, 1976, 1978, elle ne pourrait guère être remise en cause que si les méthodes syntaxiques sŠavéraient impuissantes à réduire les phrases complexes à des phrases simplesŤ (GROSS, 1981, p.21).

10 Tradução minha. Do original: ŞLŠacceptabilité est une notion très complexe qui comporte des intui-

uma forma, eles julgam a probabilidade de aquela forma ser usada em algum contexto para veicular informaçãoŤ11. O autor ainda complementa que:

A aceitabilidade é uma forma simpliĄcada de probabilidade: uma sequência inaceitável é improvável de ocorrer, seja no discurso ou em qualquer outro lugar. Considerando- se que as probabilidades pertencem a uma escala contínua, a realidade linguística é mais complexa do que qualquer coisa que uma visão binária de aceitabilidade pudesse sugerir. Na prática, não há nenhuma maneira de medir a probabilidade de qualquer sequência em uma língua12

(LAPORTE, 2015).

Apesar dos problemas conceituais relacionados ao termo aceitabilidade, este ainda é o critério cientíĄco mais utilizado pelo Modelo do L-G. Ademais, o julgamento das aceitabilidades deve ser feito com recurso massivo à introspecção, sem descartar o uso de corpus. A noção de introspecção também é um conceito importante para a linguística teórica e não se confunde com a noção de intuição ou ŞachismoŤ. Conforme aponta Laporte (2015), a tarefa empírica de coletar dados introspectivamente segue sistematicamente procedimentos formais controlados.

Não se pode confundir a noção de aceitabilidade com a concepção de gramaticali-

dade porque essa segunda lida com o que é considerado certo e errado pelas gramáticas

normativas, enquanto a aceitabilidade diz respeito às leis que regem a competência do fa- lante. Dessa forma, um falante nativo seria capaz de dizer Eu lavei as vasilhas sujas, mas certamente não diria, em condições normais, *Vasilhas as eu lavou suja, que é considerada uma frase inaceitável porque, apesar de pronunciável, não é imediatamente interpretável. O conceito de (in)aceitabilidade é fundamental para o L-G porque é esse conceito que delimita o objeto de estudo: só podem ser analisadas e descritas as construções que, de fato, existem na língua.

Há na literatura trabalhos que se basearam no Modelo teórico-metodológico do Léxico-Gramática, porém optaram por utilizar apenas corpus para validar os exemplos (RADIMSKY, 2011, p.181): Şo ńteste de aceitabilidadeż, considerado como o principal meio de veriĄcação por Gross (1975, p.19-22), foi susbstituído por um recurso sistemá- tico a grandes corpora, o Corpus Nacional TchecoŤ13. Apesar dos resultados satisfatórios apresentados pelo autor, ainda assim consideramos que nem todas as possibilidades de construções linguísticas estão no corpus, por maior que ele seja.

11 Tradução minha. Do original: ŞTo be acceptable, a form must be meaningful. When linguists assess

the acceptability of a form, they assess the probability that it might be used in some context to convey informationŤ (LAPORTE, 2015).

12 Tradução minha. Do original: ŞAcceptability is a simpliĄed form of probability: an unacceptable

sequence is unlikely to occur, whether in discourse or anywhere else. Since probabilities belong to a continuous scale, linguistic reality is more complex than anything a binary view of acceptability might suggest. In practice there is no way to measure the probability of any sequence in a languageŤ (LAPORTE, 2015).

13 Tradução minha. Do original: Şńtest de lŚacceptabilitéż, considéré comme le moyen principal de

vériĄcation par M. Gross (1975: 19-22), a été remplacé par un recours systématique aux grands corpus, le Corpus national tchèque en lŚoccurrenceŤ (RADIMSKY, 2011, p.181).

Seguindo a abordagem geral proposta pelo Léxico-Gramática, os dados lexicais a serem analisados nesta pesquisa serão retirados de corpus, porém a veriĄcação de aceitabi- lidade passará também pelo crivo introspectivo da pesquisadora. Em suma: (i) recorre-se a corpus para recensear os dados linguísticos ou o fenômeno a ser descrito; (ii) propõe-se a análise e descrição das entradas lexicais a partir da aplicação de regras de transformação sintática às frases simples; e, por Ąm, (iii) veriĄca-se a aceitabilidade ou inaceitabilidade das frases.

Neste capítulo, apresentamos as duas principais teorias que norteiam esta pesquisa: a teoria transformacional e o Modelo teórico-metodológico do Léxico-Gramática. A teoria transformacional dá as bases para o sugimento do Léxico-Gramática, a partir dos conceitos de operadores e argumentos, das restrições de seleção que o operador impõe aos seus argumentos e das noções de frase elementar e de transformação. A partir dessa teoria, surge então o Modelo do L-G, que é ao mesmo tempo uma teoria e uma metodologia de descrição de línguas, que parte de três premissas fundamentais. São elas: (i) cada unidade lexical de uma língua possui sua própria gramática, ou seja, funciona de um modo particular na combinação com os outros elementos da língua; (ii) a unidade mínima de análise linguística deve ser a frase simples, que é constituída por um predicador e os argumentos essenciais que ele seleciona; e (iii) os testes para veriĄcar a aceitabilidade de determinada construção ou fenômeno devem ser feitos usando a introspecção do linguista falante nativo da língua a ser descrita.

A parte teórica do Modelo do L-G foi descrita neste capítulo. A parte que concerne à metodologia do L-G, bem como toda a metodologia utilizada nesta tese, será apresentada no capítulo seguinte.

2 Princípios e procedimentos metodológicos

Esta Seção apresenta: (i) o corpus utilizado para a obtenção dos dados (Seção 2.1); (ii) as ferramentas computacionais de auxílio ao recenseamento, processamento e análise das ocorrências (Seção 2.2); (iii) os procedimentos experimentais utilizados na análise (Seção 2.3); (iv) o modelo de formalização dos dados em matrizes (Seção 2.4); e (v) a proposta metodológica para a integração dos predicados nominais com o verbo dar em um parser (Seção 2.5).

As construções foram recenseadas a partir de três fontes diferentes (Seção 2.1): um corpus com textos reais (Subseção 2.1.1), uma lista de colocados em vários corpora (Subseção 2.1.2) e uma lista pré-construída de Npred (Subseção 2.1.3). Para a extração dos dados do corpus em textos reais, utilizamos a ferramenta Unitex (Seção 2.2.1). Para o recenseamento dos colocados do verbo dar em vários corpora, utilizamos o AC/DC1. Para a análise das propriedades de algumas construções, utilizamos, além da introspecção, o concordanciador WebCorp, que usa a web como corpus (Seção 2.2.2).

Após o recenseamento dos colocados de dar, construímos frases simples para cada uma das construções encontradas, para que se pudesse proceder à análise de suas proprie- dades. Em seguida, separamos as construções em diferentes classes (ver Parte I), com base em suas propriedades sintáticas e semânticas. A análise propriamente dita fundamenta-se nos princípios teóricos e metodológicos do Léxico-Gramática (GROSS, 1975, 1981), que tem como base a frase simples.

A análise foi feita com base nas propriedades formais, distribucionais e transforma- cionais das construções (Seção 2.3), e a descrição dessas propriedades foi feita em matrizes binárias, que é a formalização proposta pelo Modelo do L-G (Seção 2.4). Maurice Gross (1975) considerava ŞfalhasŤ as tentativas de formalização das regras gramaticais anteriores justamente porque aquelas propostas não previam a relação intrínseca que existe entre o léxico e a gramática que o descreve, por isso, propôs a metodologia do L-G, que tem como pano de fundo os procedimentos experimentais da gramática transformacional de Zellig Harris (1961, 1964, 1968).

Vale ressaltar que, mesmo que se tenha adotado corpora para a obtenção dos dados, é possível mesclar essa metodologia com o método introspectivo de análise. Algumas vezes, criam-se hipóteses que podem ser comprovadas por meio de exemplos construídos, ou seja, que não foram retirados do corpus, porém já têm seu uso consagrado na língua. As duas abordagens serão usadas simultaneamente para garantir uma descrição mais completa e abrangente do objeto de estudo.

Por Ąm, apresentaremos também uma proposta de integração dos predicados nomi- nais formados pelo verbo-suporte dar e um nome predicativo no parser XIP (MOKHTAR; CHANOD; ROUX, 2002), que é o analisador sintático usado na cadeia de processamento do Português STRING (MAMEDE et al., 2012). Na Seção 2.5, apresentaremos brevemente a metodologia utilizada para a integração desses dados no XIP, porém os resultados da tarefa, bem como a avaliação da performance do sistema, serão apresentados na Parte III.