O PROCESSAMENTO DA CONCORDÂNCIA DE NÚMERO ENTRE SUJEITO E VERBO NA PRODUÇÃO DE SENTENÇAS (versão apresentada para defesa em 16 de março de 2006)

(1)

Erica dos Santos Rodrigues

O PROCESSAMENTO DA CONCORDÂNCIA

DE NÚMERO ENTRE SUJEITO E VERBO

NA PRODUÇÃO DE SENTENÇAS

(versão apresentada para defesa em 16 de março de 2006)

Tese de Doutorado Tese apresentada ao Programa de Pós-graduação em Letras da PUC-Rio como requisito parcial

para obtenção do título de Doutor em Letras.

Orientadora: Profa. Letícia Maria Sicuro Corrêa (PUC-Rio) Co-orientador: Prof. Jairo Morais Nunes (USP-SP)

(2)

Para meu filho Henrique, pelo olhar terno, sempre.

(3)

Agradecimentos

A Letícia Sicuro Corrêa, minha orientadora, pelo contínuo aprendizado intelectual, pela dedicação constante, pela amizade e compreensão nos momentos críticos.

A Jairo Nunes, por ter renovado minha paixão pela sintaxe, pelo estímulo para a realização do trabalho e pelo tratamento sempre gentil e delicado.

A meu marido, pelo afeto, pela amizade, por ter acreditado mais em mim do que eu mesma.

Aos meus pais, pelo carinho e pela dedicação sem medidas.

Aos meus professores da PUC, da UFRJ e da UNICAMP, pela certeza de que estou na profissão certa.

A Cristina, Helena, Tânia, Claudinha, Vanise, Maria do Carmo, Violeta e Carmelita, por que vocês são o máximo, porque fazer tese é impossível sem amigos.

A Marina, amizade mais recente, pelas discussões de sintaxe e pela generosidade de compartilhar seu conhecimento.

A Juanito Avelar e Andrés Saab, pela troca de bibliografia e pelos comentários e sugestões.

A meu amigo-programador Claver, pela implementação dos experimentos, pelos papos, pelo exemplo de tranqüilidade.

Aos meus colegas da PUC, da UNICAMP e da UFRJ – Juanito, Ana Paula, Jéssica, Sílvia, Cínthia, Marcelo, Ricardo, Márcio, Antônio e outros, que eu possa ter esquecido de mencionar, pelo convívio e pela troca de idéias.

Aos meus colegas de trabalho, pela força na longa jornada.

Às meninas da secretaria, pelo sorriso largo e pela presteza em tudo.

A todo o pessoal do LAPAL, pela ajuda na aplicação dos experimentos e na caçada a voluntários.

A Michele, pela ajuda com os arremates da tese.

Aos participantes dos experimentos, pelos erros, meu material precioso de pesquisa.

(4)

Resumo

Rodrigues, Erica dos Santos; Corrêa, Letícia M. Sicuro. Nunes, Jairo M. Processamento da concordância de número entre sujeito e verbo na produção de sentenças. Rio de Janeiro, 2006. XXXp. Tese de Doutorado – Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro.

O processamento da concordância de número sujeito-verbo na produção de sentenças por falantes do dialeto culto do português brasileiro é investigado. A dissertação focaliza os chamados erros de atração e seu principal objetivo é identificar os fatores que interferem no processamento da concordância e prover uma explicação psicolingüística que seja compatível com pressupostos do Programa Minimalista da Lingüística Gerativa. Mais especificamente, busca-se examinar: i) as condições que favorecem os erros e as propriedades sintáticas que levam um núcleo interveniente a ser tomado como o controlador da concordância; ii) a interferência de informação morfofonológica de número dos elementos que integram os modificadores do DP sujeito; iii) a interferência de informação semântica de número no estabelecimento da concordância. Ainda como objetivo específico busca-se distinguir em termos estruturais os DPs responsáveis pelos erros de atração daqueles que licenciam uma forma singular ou plural do verbo -- as chamadas construções partitivas. Aplica-se uma tarefa psicolingüística envolvendo julgamento de gramaticalidade a fim de investigar diferenças de processamento da concordância entre as construções partitivas e os DPs complexos. A relevância dos tópicos investigados se deve ao fato de estes permitirem uma discussão mais ampla acerca da autonomia do formulador sintático. Parte-se de vasta revisão da literatura, na qual se reportam interferências sintáticas, semânticas e morfofonológicas no processamento da concordância em diferentes línguas. Explicações apresentadas por modelos de produção interativos e não-interativos são discutidas. Inclui-se ainda uma caracterização da concepção minimalista de língua, com o tratamento da concordância como processo de valoração de traços formais, e um modelo de produção de natureza serial, não-interativo, que incorpora um parser-monitorador funcionando paralelamente à formulação dos enunciados – modelo PMP (produção monitorada por parser). Em seguida, reportam-se 5 experimentos com falantes de português. Os resultados

(5)

indicaram efeito de marcação e de distância linear entre o núcleo do sujeito e o verbo, com mais erros para núcleo do sujeito não-marcado (singular) e linearmente distante do verbo, e efeito de posição estrutural do núcleo interveniente, com maior incidência de erros para os núcleos hierarquicamente próximos do nó mais alto do DP sujeito e núcleos inseridos em PPs argumentos. Um efeito semântico de distributividade associado a efeito de marcação também foi obtido. Quanto a fatores morfofonológicos, a informação de número no determinante (e não no nome) mostrou-se crucial para a identificação do número do DP sujeito. É proposta uma versão ampliada e revista do modelo PMP que unifica explicações para os erros de concordância em termos de uma escala de acessibilidade da representação do DP sujeito pela memória de trabalho eque leva em consideração as expectativas do parser como possível fator de interferência em erros de atração. Essa interferência ocorreria após o parsing do primeiro DP e afetaria a codificação morfofonológica do verbo. Em suma, a tese aqui veiculada é a de que os erros de concordância não ocorrem na computação sintática e que o formulador sintático atua de forma autônoma.

Palavras-chave

Psicolingüística; processamento de sentença; concordância entre sujeito e verbo; concordância entre sujeito e verbo no português; erros de atração; parser monitorador; distância linear e hierárquica; efeitos de distributividade; efeitos morfofonológicos.

(6)

Abstract

Rodrigues, Erica dos Santos; Corrêa, Letícia M. Sicuro (Advisor); Nunes, Jairo M. (Co-advisor). Processing of Subject-verb Number Agreement in Sentence Production. Rio de Janeiro, 2006. XXXp. Phd Dissertation – Departamento de Letras, Pontifícia Universidade Católica do Rio de Janeiro.

The processing of subject-verb number agreement in sentence production by speakers of the standard dialect of the Brazilian Portuguese is investigated. The dissertation focuses on attraction errors and its main aim is to identify the factors that interfere in agreement processing and to provide a psycholinguistic account, which is compatible with assumptions of the Minimalist Program of Generative Linguistics. This work examines, in particular: i) the conditions that favor attraction errors and the syntactic properties which make an intervenient head to be considered as the agreement controller; ii) the role of morphophonological information on number provided by the DP subject modifiers; iii) the interference of conceptual number in agreement. Additionally, the work intends to distinguish, in structural terms, the DPs responsible for attraction errors from those DPs that allow a singular and a plural form of the verb – the so-called partitive constructions. A psycholinguistic procedure of grammaticality judgment is conducted in order to verify agreement processing differences between partitive constructions and complex DPS. The relevance of these topics is due to the fact that they enable a more comprehensive discussion on the autonomy of the syntactic formulator in language production. An extensive review of the existing literature was carried out and results are reported, concerning the interference from syntactic, semantic and morphophonological factors on agreement processing in different languages. Explanations provided by interactive and non-interactive models are discussed in this work. The minimalist conception of language is presented according to which agreement is described as a feature valuation process and a serial non-interactive production model is characterized, which incorporates a monitoring-parser that works in parallel with speech formulation – PMP model (parser monitored production). A total of 5 experiments with Portuguese speakers are reported. The results show an effect of

(7)

errors caused by non-marked (singular) subject heads that are linearly distant from the verb, and an effect of the structural position of the intervenient head, with a large number of errors for intervenient heads that are near to the upper phrasal marker of the DP and for heads which are inserted in PP arguments. A semantic effect of distributivity associated with an effect of markedness was also obtained. As far as morphphonological factors, number information of the determiner (and not of the noun) has shown to be critical to subject number identification. A revised and improved version of the PMP model is proposed that unifies possible explanations for agreement in terms of on an accessibility scale of the DP subject representation in the working memory and that takes into account parser predictions as a possible factor of interference in attraction errors. This interference would occur after the parsing of the DP and would affect the morphophonological encoding of the verb. In sum, the main argument of the thesis is that agreement errors do not occur in the syntactic computation and that the syntactic formulator works autonomously.

Keywords

Psycholinguistics; Sentence Processing; Sentence Production; Subject-verb agreement; Subject-verb agreement in Portuguese; Attraction Errors; Monitoring Parser; Linear and hierarchical distance; Distributivity effects;

(8)

SUMÁRIO

1 Introdução 15

2 Arquitetura do sistema de produção e o processamento da concordância: a autonomia do formulador sintático em modelos interativos e não-interativos

20

3 Articulação entre teoria lingüística e psicolingüística no estudo do

processamento da concordância 26

3.1 Arquitetura do sistema lingüístico e a derivação sintática da

sentença no Minimalismo 27

3.2 Formulação sintática e derivação sintática 31

4 A investigação de erros de produção no estudo do processamento da concordância sujeito-verbo

37

4.1 Tipos de erros e fatores atuantes no processamento da concordância

38

4.1.1 Fatores semânticos 38

4.1.1.1 Distributividade 38

4.1.1.2 Coletivos, bipartidos e pluralia tantum 43

4.1.2 Fatores sintáticos 49

4.1.2.1 Distância linear 50

4.1.2.1.1 Distância linear entre o núcleo do sujeito e o verbo 50 4.1.2.1.2 Distância linear do núcleo interveniente em relação ao verbo

53

4.1.2.2 Distância hierárquica 60

4.1.2.3 Status argumental do sintagma modificador 64 4.1.2.3.1Resolução de ambigüidades estruturais e o papel de informação relativa à estrutura argumental de nomes e verbos

65

4.1.2.3.2 Diferenças estruturais entre argumentos e adjuntos e questões de acessibilidade no processamento

77

4.1.2.3.3 Erros de atração e o papel do status argumental de PPs

modificadores 79

(9)

5 Distinguindo casos de concordância licenciados pela gramática da língua de falhas de processamento: uma análise da concordância “facultativa” com construções partitivas

88

5.1 Análise lingüística 89

5.1.1 Concordância “ad sensum” e leitura de grupo vs. leitura distributiva

89

5.1.2 Estrutura das partitivas e dupla possibilidade de concordância 97

5.1.2.1 Análise proposta 106

5.1.2.2 A dupla possibilidade de concordância 116 5.2 Experimento psicolingüístico de julgamento de gramaticalidade contrastando construções partitivas x DPs complexos

120

6 Modelos interativos e não-interativos diante dos erros de atração 127

6.1 Modelos interativos 127

6.2 Modelos não-interativos 128

7. Modelo PMP – modelo de produção monitorada por parser

131

7.1 Propriedades do modelo 132

7.1.1 Incrementalidade moderada 132

7.1.2 Computação automática da concordância como processo de valoração de traços

135

7.1.3 Monitoração concomitante à produção por parte de um parser 136 7.2 Procedimentos implementados pelo parser monitorador e

explicação dos erros de atração 137

8. Experimentos de produção induzida de erros 140 8.1 Questões metodológicas no estudo da produção da linguagem e

a tarefa de indução de erros 141

8.2 Experimentos 143

8.2.1 Experimento 1 – distância linear sujeito-verbo e tipo de modificador

143 8.2.2 Experimento 2 – posição linear vs. posição hierárquica do núcleo interveniente e marcação morfofonológica 148

(10)

8.2.3 Experimento 3 – status argumental do PP modificador 154 8.2.4 Experimento 4 – distributividade e marcação morfofonológica 158

8.2.5 Experimento 5 – distributividade 163

9 Modelo de produção PMP revisto e ampliado 167

9.1 Erros de atração e escala de acessibilidade das representações

geradas pelo parser 167

9.2 Modelo PMP e Programa Minimalista: considerações acerca de um tratamento unificado para a computação sintática da concordância

173

10 Síntese e considerações finais 176

11 Referências bibliográficas 184

(11)

Lista de figuras

Figura 1: Arquitetura do sistema de produção da linguagem e monitoração da fala.

21

Figura 2: Concordância como operação de cópia de traços (Vigliocco, Butterworth & Garrett, 1996).

23

Figura 3: Concordância como operação de unificação de traços (Vigliocco, Butterworth & Garrett, 1996).

24

Figura 4: Computação da concordância através da operação

Agree. 30

Figura 5: Esquema de percolação ascendente do traço de número do núcleo interveniente para o nó mais alto do sujeito.

60

Figura 6: Esquema de percolação ascendente do traço de número de núcleos intervenientes inseridos em PPs e em orações

61

Figura 7: Operações de Number Marking e Number Morphing no processamento da concordância sujeito-verbo (adaptado de Bock et al., 2001)

129

Figura 8: Modelo PMP de processamento da concordância na produção de sentenças

139

Figura 9: Modelo PMP revisto e ampliado (explicação 2) 171 Figura 10 : Modelo PMP revisto e ampliado (explicação 3) 172

(12)

Lista de gráficos

Gráfico 1: Médias de respostas SIM em função do tipo de DP sujeito

123

Gráfico 2: Médias de respostas SIM em função do número do verbo

124

Gráfico 3: Médias de respostas SIM em função do tipo de DP sujeito e do número do verbo

124

Gráfico 4: Médias de erros de concordância em função do tipo de modificador e da distância entre o núcleo do sujeito e o verbo

146

Gráfico 5: Médias de erros de concordância em função do número de N1 e do número de N2

152

Gráfico 6: Médias de erros de concordância em função do status argumental do PP modificador

156

Gráfico 7: Médias de erros de concordância em função do número

do DP do nome local 161

Gráfico 8: Médias de erros de concordância em função do tipo

de expressão lingüística do DP distributivo 162

Gráfico 9: Médias de erros de concordância em função da

distributividade do DP sujeito 164

(13)

Lista de tabelas

Tabela 1:Média de erros de concordância por condição experimental

146

Tabela 2: Média de erros de concordância em função de Número de N1 e Número de N2

151

Tabela 3: Média de erros de concordância em função do status argumental do PP que contém o núcleo interveniente

156

Tabela 4: Média de erros de concordância em função do número

do DP do nome local 160

Tabela 5: Média de erros de concordância em função

do tipo de expressão lingüística de distributividade 161 Tabela 6: Média de erros de concordância em função da

distributividade do DP sujeito 164

Tabela 7: Média de erros de repetição do preâmbulo em função da distributividade do DP sujeito

(14)

É preciso começar o desenho para saber o que se quer desenhar.

(15)

1 Introdução

A presente tese tem como tema o processamento da concordância de número entre sujeito e verbo na produção de sentenças e está vinculada ao Projeto

Explorando relações de interface língua-sistemas de desempenho no processamento da concordância e na aquisição da linguagem normal e desviante

(CNPq), em desenvolvimento pelo Grupo de Pesquisa em Processamento e Aquisição da Linguagem, no LAPAL (Laboratório de Psicolingüística e Aquisição da Linguagem), da PUC-Rio.

O estudo da concordância no âmbito da pesquisa realizada em Psicolingüística é de particular relevância, pois permite a discussão de questões centrais acerca do processamento humano da linguagem, em especial, permite investigar como diferentes fontes de informação são recuperadas e mantidas na memória durante a produção da linguagem, como se dá o fluxo dessas informações ao longo do processamento e em que medida o formulador sintático atua de forma autônoma em relação aos demais componentes da arquitetura do sistema de produção.

A pesquisa sobre a concordância é também de grande interesse para o estabelecimento de uma articulação entre Psicolingüística e teoria lingüística, nomeadamente no que diz respeito ao trabalho que vem sendo desenvolvido dentro do quadro teórico do Programa Minimalista (Chomsky 1995, 1998, 1999, 2001). A caracterização de como se dá o estabelecimento da concordância durante a produção de sentenças poderá contribuir para uma melhor explicitação de como os sistemas de desempenho interagem com o sistema computacional da linguagem, do tipo de restrição que esses sistemas impõem às operações realizadas pelo sistema computacional, da relação entre derivação sintática num modelo formal de língua e o processo de formulação de sentenças em tempo real, entre outros aspectos.

O estudo da produção da linguagem enfrenta, não obstante, dificuldades de ordem metodológica, não sendo simples o controle do input que dá origem à produção bem como a obtenção de medidas confiáveis acerca das variáveis manipuladas. Nesse cenário, o emprego de técnicas que envolvem a produção induzida de erros se apresenta como uma alternativa importante em termos experimentais. A idéia por trás dessas técnicas é que o “erro” funcionaria como

(16)

uma espécie de janela para se investigar o funcionamento interno do sistema de produção, permitindo, no caso da pesquisa sobre a concordância, a formulação de hipóteses acerca da autonomia do formulador sintático.

Cumpre notar que nesse tipo de investigação, “erro” não é entendido como um desvio da norma culta, examinado sob uma perspectiva prescritivista. Trata-se de um lapso, uma falha de processamento, que ocorre com relativa freqüência na língua, sendo por vezes prontamente corrigido pelo falante. O tipo de erro analisado no estudo da concordância é o “erro de atração”, o qual se caracteriza pela concordância do verbo com um núcleo nominal interveniente entre aquele e o núcleo do sujeito, como se observa em (1).

(1) A análise dos resultados experimentais indicaram um efeito principal de número do núcleo interveniente no processamento da concordância.

É importante distinguir erros de atração de casos como o ilustrado em (2), em que tanto a concordância canônica quanto a concordância com um núcleo interveniente são consideradas gramaticais pelos falantes da língua.

(2) A maioria dos erros ocorreu/ocorreram após preâmbulos em que havia incongruência de número entre o núcleo do sujeito e o núcleo interveniente.

Um modelo de produção que procure explicitar o tipo de conhecimento lingüístico empregado na computação das relações de concordância e como o sistema opera ao colocar esse conhecimento em uso precisa prover uma explicação diferenciada para (1) e (2), o que só se torna possível com a incorporação de um modelo de língua que caracterize a informação de natureza lingüística que é acessível aos sistemas de desempenho.

O objetivo geral da tese é, pois, investigar o processamento da concordância de número entre sujeito e verbo por falantes do dialeto culto do português brasileiro, a fim de elucidar a natureza dos erros de concordância que ocorrem na produção de sentenças e o momento do processo de produção em que tais erros teriam origem. Procura-se distinguir esses erros dos chamados casos de concordância facultativa, em que o verbo concorda com um termo do modificador do sujeito, resultando numa estrutura licenciada pela gramática da língua. Nessa

(17)

investigação, busca-se uma articulação entre um modelo de língua, mais especificamente, aquele desenvolvido dentro do quadro teórico do Programa Minimalista, e um modelo de processamento voltado para a produção da linguagem. Assume-se como hipótese de trabalho a idéia que o formulador sintático funciona de forma autônoma, isto é, não está sujeito à interferência de informação diferente daquela que pode ser codificada como traços formais em um modelo de língua.

Em termos mais específicos, a pesquisa apresenta os seguintes objetivos:

¾ Examinar a interferência de fatores pertinentes à sintaxe e sua expressão no processamento da concordância, em particular no que diz respeito à organização linear dos constituintes da sentença, à estrutura hierárquica do DP1_{sujeito e à natureza argumental do modificador do sujeito;}

¾ Verificar a interferência de fatores morfofonológicos no processamento da concordância, em especial o papel da informação de número codificada nos núcleos nominais do DP sujeito;

¾ Avaliar o papel de informação semântica/conceitual de número do sujeito no estabelecimento da concordância verbal, em particular nos casos em que se observa uma não correspondência entre número conceitual e número gramatical, como nos sujeitos envolvendo substantivos coletivos e sintagmas com leitura distributiva.

1_{DP é a abreviatura para Determiner Phrase (sintagma determinante), termo introduzido na} literatura lingüística por Abney (1987) para fazer referência a estruturas que teriam um determinante como núcleo e um NP como complemento. A partir de semelhanças observadas entre estruturas nominais e verbais, como as estruturas de genitivo em inglês, Abney propôs que o determinante seria um núcleo funcional com propriedades semelhantes a I (Inflection) e que o NP seria o complemento desse núcleo D. Note-se, contudo, que o termo DP não é em geral empregado na literatura psicolingüística e as estruturas nominais são identificadas apenas como NPs. Nesta tese, utiliza-se NP quando este foi o termo adotado na literatura e mantêm-se inalteradas as representações nas quais as estruturas nominais foram analisadas como NPs. Nos demais casos, emprega-se DP, visto que o tratamento de alguns fenômenos relativos ao processamento da concordância parece requerer uma estrutura mais ampla do que o NP. Além disso, este é o termo correntemente utilizado em trabalhos desenvolvidos no âmbito da Teoria Gerativa, com a qual se busca uma aproximação na presente tese.

(18)

¾ Prover uma análise lingüística para a concordância do verbo com sujeitos formados por expressões partitivas (A maioria de, Uma parte de), a fim de diferenciar esse tipo de sujeito de outros estruturalmente semelhantes em que apenas a concordância canônica com o verbo é admitida.

¾ Detalhar e avaliar o modelo de processamento da concordância de número entre sujeito-verbo, proposto por Rodrigues & Corrêa (2004)/Corrêa e Rodrigues (2005)2, procurando verificar se o referido modelo dá conta dos resultados experimentais em português e se consegue explicar diferenças entre línguas.

Cumpre destacar, ainda, a relevância do presente trabalho do ponto de vista didático. Como se sabe, a concordância é um dos tópicos do ensino de gramática que mais estigmatiza aqueles que não dominam a norma culta. Qualquer tipo de desvio do que está prescrito nos compêndios gramaticais é imediatamente tratado como erro, sem uma problematização dos fatores que podem estar levando à produção de uma determinada forma. Aspectos ligados à variação lingüística e a aspectos relacionados a processamento são confundidos, impedindo muitas vezes que o professor identifique a fonte de dificuldades enfrentadas pelos alunos. Acredita-se, portanto, que uma caracterização dos fatores processuais que podem interferir no estabelecimento da concordância venha a contribuir para uma conscientização do professor quanto a aspectos da língua que independem do dialeto falado pelo aluno.

O trabalho está organizado da seguinte maneira. No segundo capítulo, apresenta-se como a arquitetura do sistema de produção da linguagem vem sendo caracterizada em modelos interativos e não-interativos, com particular ênfase à questão da autonomia do formulador sintático.

No terceiro capítulo, são tecidas considerações acerca de uma possível aproximação entre Psicolingüística e os desenvolvimentos recentes da teoria lingüística Gerativista, nomeadamente o Programa Minimalista. Apresenta-se em linhas gerais a arquitetura do sistema lingüístico nessa perspectiva teórica e

2_{O trabalho apresentado em Rodrigues & Corrêa (2004) baseia-se no modelo desenvolvido em} Corrêa & Rodrigues (2005), a partir da idéia de acessibilidade a representações derivadas do

(19)

examinam-se pontos de compatibilidade e incompatibilidade entre derivação sintática em um modelo formal de língua e derivação on-line de uma sentença.

O capítulo 4 é uma ampla revisão da literatura referente à pesquisa sobre erros de concordância, em que são apresentados resultados experimentais acerca da interferência de fatores semânticos, sintáticos e morfofonológicos no processamento da concordância.

No capítulo 5, busca-se prover uma análise lingüística para as construções partitivas em português. A dupla possibilidade de concordância verbal que essas construções licenciam é explicada em termos de representações estruturais distintas a elas subjacentes. Ao final do capítulo, reportam-se os resultados de um experimento psicolingüístico envolvendo um teste de julgamento de gramaticalidade, no qual se buscou verificar como os falantes avaliam a concordância singular e plural em sentenças com construções partitivas e com DPs complexos.

No capítulo 6, são retomados os resultados experimentais reportados na resenha da literatura e comenta-se como modelos interativos e não interativos do processamento da concordância explicam os erros de concordância.

Um modelo de produção monitorada por parser – modelo PMP (Rodrigues & Corrêa, 2004; Corrêa & Rodrigues, 2005) é apresentado no capítulo 7. São detalhadas as propriedades desse modelo e seu modo de funcionamento, procurando diferenciá-lo dos modelos de produção existentes.

O capítulo 8 reúne cinco experimentos de produção induzida de erros, os quais têm como objetivo investigar a interferência de fatores sintáticos, morfofonológicos e semânticos no processamento da concordância no português.

No capítulo 9, uma versão revista e ampliada do modelo PMP é proposta, tendo em vista os resultados dos experimentos. Essa versão busca explicar os erros em termos de uma escala de acessibilidade, na memória de trabalho, da representação do sujeito gerada pelo parser-monitorador. Ao final são tecidas algumas considerações acerca da possibilidade de um tratamento unificado da computação sintática da concordância e do processamento da concordância.

O último capítulo apresenta uma síntese da tese, em que se retoma a hipótese de trabalho e são apontados desdobramentos futuros para a pesquisa realizada.

(20)

2 Arquitetura do sistema de produção e o processamento da concordância: a autonomia do formulador sintático em modelos interativos e não-interativos

A produção da linguagem é concebida, na maior parte dos modelos de produção, como uma atividade complexa que envolve processamento de informação em diferentes níveis ou estágios (cf. Fromkin, 1971, 1973; Garrett 1975, 1980, 1988; Levelt, 1989; Bock & Levelt, 1994). Considera-se que a produção teria início com a conceptualização da mensagem que se deseja transmitir. Seguir-se-ia a esta etapa um processo de busca de elementos do léxico, os quais portariam traços semânticos compatíveis com os conceitos envolvidos na mensagem assim como com aspectos pertinentes à adequação de registro e a outros fatores de ordem pragmática. O acesso lexical envolveria também a recuperação de informação léxico-sintática do lema3_{, um tipo de representação} específica que agregaria informação gramatical acerca de um dado item lexical. De posse dessas representações, um formulador conduziria a codificação gramatical da sentença. Nessa fase de codificação gramatical, ocorreria a organização hierárquica da sentença e ordenação dos constituintes de acordo com ordem linear dos constituintes na língua. A essa fase seguir-se-ia a etapa de codificação morfofonológica da informação proveniente do componente sintático e a codificação fonológica, que possibilitaria a articulação da sentença.

É compatível com esses modelos a idéia de um parser monitorador, nos moldes do que propõe Levelt (1989). De acordo com Levelt, o falante usaria o próprio sistema de compreensão para monitorar os enunciados à medida que estes fossem sendo produzidos. O autor propõe que o parser teria acesso tanto às representações fonéticas pré-articulatórias, decorrentes do processo de codificação fonológica da sentença, quanto à fala já articulada. A vantagem dessa proposta é que não são necessários recursos adicionais de monitoramento para a detecção de erros: o falante, por ser ouvinte de sua própria fala, também seria capaz de

3_{O termo lema, introduzido por Kempen & Hoenkamp (1987; porém já citado em Kempen &} Huijbers, 1983), foi empregado originalmente para fazer referência à palavra como uma entidade semântico-sintática em oposição ao conceito de lexema, usado para designar os traços fonológicos da palavra (cf. Levelt, 1989). Com os desenvolvimentos da teoria de acesso lexical, o termo ganhou um uso mais restrito, passando a designar apenas a informação sintática acerca de uma dada palavra. Segundo Corrêa (2005ª; submetido, as propriedades que definem os lemas podem ser relacionadas a traços formais do Léxico de um modelo formal de língua enquanto que as propriedades que definem lexemas podem ser relacionadas com traços fonológicos.

(21)

verificar falhas em sua produção (cf. Postma, 2000). A seguir apresenta-se uma representação esquemática do processo de produção em modelos seriais.

Codifica

Codificaçção gramaticalão gramatical

Codificação (morfo)fonológica Articulação Traços semânticos Lema Lexema Acesso lexical Plano fonético Audição Sistema de compreensão Conceptualizador Geração da mensagem Esquemas discursivos; conhecimento enciclopédico, pragmático etc.

Fig. 1: Arquitetura do sistema de produção da linguagem e monitoração da fala.

Adaptação da representação de Levelt (1989) para o processamento de informações pelo falante. As caixas representam componentes de processamento e o círculo representa conhecimento armazenado.

Modelos interativos x não interativos e o processamento da concordância Uma questão acerca da qual os modelos de produção de sentenças divergem diz respeito a como se dá o fluxo de informação ao longo do processamento, mais especificamente, se poderia haver ou não interação entre informações de natureza distinta num dado estágio do processamento. Dependendo da resposta dada a essa questão, os modelos podem ser definidos como não-interativos ou interativos (cf. Vigliocco & Harstuiker, 2002).

Modelos não-interativos, como o caracterizado na seção anterior, apresentam, em geral, uma visão serial e unidirecional da produção da linguagem, em que não há possibilidade de interação entre os níveis de processamento (feedforward models). O input de um nível para o outro é mínimo, isto é, apenas informação relevante e necessária é encaminhada de um estágio para outro. Os modelos interativos, por sua vez, assumem uma concepção interativa do processamento com possibilidade de convergência de informações de fontes

(22)

distintas ao longo do processo de formulação de sentenças (Dell, 1986; Stemberger, 1985). Sob esse rótulo, agrupam-se desde modelos de orientação probabilística, baseados em satisfação de restrições, originalmente desenvolvidos no âmbito do estudo da compreensão (cf. Haskell & MacDonald, 2003), até modelos alinhados com a idéia de níveis de processamento (Vigliocco & Hartsuiker, 2002). No caso dos modelos interativos de níveis, considera-se a possibilidade de retro-alimentação de informações provenientes de um dado nível no nível anterior (feedbackward models).

Tanto em modelos seriais não-interativos quanto em modelos interativos de níveis, a concordância é computada no estágio de codificação gramatical. Nos modelos não-interativos, o formulador sintático estabelece a concordância exclusivamente com base em informação de natureza léxico-sintática, não havendo interferência de fatores semânticos ou morfofonológicos no processamento. Já nos modelos interativos de níveis, considera-se que a concordância, a despeito de ser um processo sintático, poderia mobilizar informação de natureza não-sintática. Nesse caso, o formulador sintático não atuaria de forma autônoma, encapsulada.

Quanto aos mecanismos sintáticos de implementação da concordância entre sujeito-verbo, duas alternativas são consideradas na literatura voltada à investigação de erros de atração: um mecanismo de cópia de traços (Kempen & Hoenkamp, 1987) e um mecanismo de unificação de traços (Kempen & Vosse, 1989; De Smedt, 1990).4

No mecanismo de cópia de traços (Kempen & Hoenkamp, 1987), uma fonte ou controlador transmite seus traços sintáticos (por exemplo, traços de pessoa, número, gênero) a um alvo. No caso da concordância sujeito-verbo, assume-se que o sujeito é o elemento controlador e que o verbo herda informação de número e pessoa do sujeito. Os valores dos traços de número e pessoa do sujeito são especificados a partir de um mapeamento de informação de natureza conceptual (no nível da mensagem) para uma representação léxico-gramatical. A transferência dos traços de número-pessoa do sujeito para o verbo se dá através da aplicação sucessiva de operações de cópia.

4_{Pode-se estabelecer uma certa correspondência entre os mecanismos de cópia e de unificação de} traços e os procedimentos de valoração (Chomsky, 1999) e de checagem de traços (Chomsky, 1995), propostos no âmbito do Programa Minimalista. O tratamento da concordância no Minimalismo será apresentado no capítulo 3.

(23)

Fig. 2: Concordância como operação de cópia de traços (Vigliocco, Butterworth &

Garrett, 1996).5

No mecanismo de unificação de traços (Schieber, 1986; De Smedt, 1990; Kempen & Vosse, 1989), os elementos envolvidos na relação de concordância apresentam informação relativa a número já especificada. Esses elementos funcionam como ‘parceiros’ de mesmo status no estabelecimento da concordância de número. Nessa proposta, o valor do número tanto do sujeito quanto do verbo é resultante de informação proveniente de representações conceituais. O modelo, contudo, é mais complexo do que o de cópia na medida em que se faz necessário um procedimento para garantir que os elementos envolvidos na concordância terminem com um mesmo valor. O procedimento proposto precisa ser capaz de examinar compatibilidades, verificar a interseção dos valores e realizar a unificação dos traços de ambos os nós. Veja-se, a seguir, figura ilustrativa do funcionamento desse processo:

5_{Na representação da concordância como um processo de cópia de traços, Vigliocco, Butterworth} & Garrett (1996) assumem o modelo de gramática procedural incremental (Incremental

Procedural Grammar), desenvolvido por Kempen & Hoemkamp (1987), no contexto de teorias computacionais de processamento de linguagem natural. Nesse modelo de gramática, os nós categoriais não seriam “elementos estruturais passivos”, mas “procedimentos ativos”, responsáveis pela construção de um tipo de constituinte sintático. Como em qualquer linguagem de programação, é permitida aos procedimentos sintáticos a chamada de subprocedimentos, dando origem a uma hierarquia de procedimentos representada em uma árvore sintática. Os nós terminais são procedimentos lexicais que não evocam nenhum subprocedimento. Os números subscritos servem para distinguir várias instanciações de um mesmo procedimento sintático na hierarquia.

The baby[-pl] on the blankets[+pl] is crying

NP1 det N1[-pl] PP P NP2 [+pl] N2 [+pl] det NPx[-pl] V [-pl] S [-pl] Representação conceitual Lemas Número é recuperado

The baby[-pl] on the blankets[+pl] is crying

NP1 det N1[-pl] PP P NP2 [+pl] N2 [+pl] det NPx[-pl] V [-pl] S [-pl] Representação conceitual Lemas Número é recuperado NP1 det N1[-pl] PP P NP2 [+pl] N2 [+pl] det NPx[-pl] V [-pl] S [-pl] Representação conceitual Lemas Número é recuperado

(24)

Fig.3: Concordância como operação de unificação de traços (Vigliocco, Butterworth

& Garrett, 1996).

É importante notar que os mecanismos de cópia e de unificação de traços adotados nos modelos de produção para caracterizar a concordância integram modelos computacionais de gramática voltados à geração de linguagem natural. Embora alguns desses modelos busquem atingir um certo grau de plausibilidade lingüística e psicológica (cf. Kempen & Hoenkamp, 1987), eles não estão preocupados com questões de aprendibilidade e tampouco levam em conta limitações próprias de um processador humano ao processamento lingüístico de sentenças.6 Enquanto nos modelos psicolingüísticos, a questão da precisão e da rapidez de como o sistema de produção opera são fundamentais, nos modelos computacionais, a facilidade de implementação do sistema e de gerenciamento das tarefas é crucial. Assim, embora seja possível uma aproximação entre modelos

6_{“[...] Humans and computers are subject to different constraints, in particular with respect to} attention span, memory size, and processing speed. There are also differences concerning the granularity of processes, the communication cost between processors, etc. With respect to representation, computer systems are often made efficient and manageable by a homogeneity at a high level (the representation formalism), whereas humans probably depend on homogeneity at a much lower level (the neuron). […]” De Smedt, Horacek & Zock (1996, p.2).

NP1 det N1[-pl] PP P NP2 [+pl] N2 [+pl] det NPx[-pl] V [-pl] S U

The baby[-pl] on the blankets[+pl] is crying Representação

conceitual

Lemas

Número é recuperado

[Pessoa:3, no: -pl] [Pessoa:3, no: -pl]

NP1 det N1[-pl] PP P NP2 [+pl] N2 [+pl] det NPx[-pl] V [-pl] S U

The baby[-pl] on the blankets[+pl] is crying Representação

conceitual

Lemas

Número é recuperado

(25)

psicolingüísticos e modelos computacionais, visto que ambos buscam caracterizar os procedimentos que permitem a geração de sentenças e os tipos de representação utilizados, é preciso ter em mente as diferenças quanto aos critérios que orientam a construção desses modelos.

Em relação a essa questão dos critérios, tem se revelado como promissora uma aproximação entre modelos de processamento e o modelo de língua desenvolvido no Programa Minimalista da teoria lingüística gerativista (Chomsky, 1995; 1998, 1999; 2001). Isso porque nessa proposta o que orienta a organização da arquitetura do sistema lingüístico não são apenas critérios de adequação descritiva e explanatória, mas também critérios de economia e de naturalidade conceptual, relativos a como o sistema da língua interage com os demais sistemas cognitivos. No próximo capítulo, será apresentado, em linhas gerais, o modelo de língua proposto no Minimalismo e serão discutidas as compatibilidades entre a derivação sintática de uma sentença no Minimalismo e o processo de formulação em tempo real de uma sentença.

(26)

3 Articulação entre teoria lingüística e psicolingüística no

estudo do processamento da concordância

O programa de pesquisa gerativista em sua mais recente etapa – o Programa Minimalista – assume uma perspectiva galileana no estudo da linguagem. Partindo da concepção de que a natureza é perfeita e simples, Chomsky propõe como seu projeto de investigação determinar se o próprio objeto da Lingüística, a linguagem humana, apresenta uma arquitetura perfeita. Segundo Negrão (2004), a adoção dessa perspectiva instaura uma nova ótica nos estudos da sintaxe, que está associada à compreensão do que se entende pelo adjetivo “perfeito”. Como observa a autora, “perfeito” é um adjetivo relacional, que exige a explicitação de seu termo de comparação. No Programa Minimalista, entende-se por arquitetura perfeita aquela capaz de prover as informações necessárias para os demais componentes da mente humana, externos à faculdade da linguagem. Reproduz-se a seguir citação de Chomsky 2002:

“A faculdade da linguagem tem que interagir com esses sistemas, senão ela não tem finalidade. Então podemos perguntar: ela é bem projetada para a interação com esses sistemas? Assim se obtém um conjunto de condições diferentes. E, de fato, a única condição que emerge claramente é a de que, dado que a linguagem é essencialmente um sistema de informação, a informação que ela armazena precisa estar acessível a esses sistemas, essa é a única condição. Pode-se perguntar, então, se a linguagem foi bem projetada para satisfazer essa condição de acessibilidade pelos sistemas nos quais ela se encaixa.”7

(Chomsky 2002, traduzido em Negrão 2004)

A noção de acessibilidade do sistema lingüístico pelos sistemas de desempenho, do ponto de vista da pesquisa em Psicolingüística, instaura a possibilidade de uma retomada de diálogo com a teoria gerativista.8

7_{“The language faculty has to interact with those systems, otherwise it’s not usable at all. So, we} may ask: is it well designed for the interaction with those systems? Then you get a different set of conditions. And in fact the only condition that emerges clearly is that, given that the language is essentially an information system, the information it stores must be accessible to those systems, that’s the only condition. We can ask whether language is well designed to meet the condition of accessibility to the systems in which it is embedded.” (Chomsky 2002, p.108)

8_{A história da Psicolingüística é marcada por momentos de aproximação e de distanciamento em} relação à Teoria Lingüística Gerativista (cf. Corrêa 2002; 2005a; submetido). O primeiro momento, de aproximação, ocorreu na década de 60, com a Teoria da Complexidade Computacional (Derivational Theory of Complexity (Miller & McKean, 1964), em que se buscou estabelecer uma correspondência entre demandas de processamento e operações transformacionais necessárias à derivação de uma sentença. Diante da inadequação empírica dessa Teoria,

(27)

instaurou-Na caracterização das operações mentais envolvidas nos processos de produção e compreensão de enunciados, os modelos de processamento lingüístico devem levar em conta as propriedades atribuídas à língua internalizada pelo falante. Daí a necessidade de os trabalhos em Psicolingüística incorporarem uma teoria lingüística que tenha como objetivo prover um modelo formal do conhecimento lingüístico que o falante tem de sua língua (cf. Corrêa, 2002; no prelo a). Nesse sentido, o Programa Minimalista representa um avanço para a aproximação entre as duas áreas, dado que as operações realizadas pelo componente computacional devem sempre resultar em estruturas legíveis pelos sistemas de desempenho. A medida, pois, de avaliação da teoria passa a ser de certo modo externa, no sentido que o sistema computacional deve responder a restrições impostas pelos sistemas de desempenho.

3.1 Arquitetura do sistema lingüístico e a derivação sintática da sentença no Minimalismo

No modelo de língua proposto no Minimalismo, a Faculdade da Linguagem compreende o sistema cognitivo da língua e os demais sistemas cognitivos com os quais este faz interface.9 O sistema cognitivo da língua envolve um léxico e um sistema computacional, que é o mecanismo responsável pela construção de objetos sintáticos a partir de um arranjo de itens lexicais selecionados do léxico e reunidos em uma Numeração. Na arquitetura proposta, os únicos níveis de representação são aqueles que fazem interface com os demais sistemas cognitivos: a Forma Lógica, que faz interface com o chamado sistema conceptual-intencional, e a Forma Fonética, que faz interface com o chamado sistema perceptual-articulatório.

se um período de distanciamento. Nesse segundo momento, a Psicolingüística deixou der ser uma área de teste para a Lingüística e se voltou para questões específicas de processamento, como acesso lexical Levelt (1983), procedimentos de parsing (Kimball, 1973; Frazier & Fodor, 1978; Wanner & Maratsos, 1978; Marcus, 1980) e decodificação do sinal acústico (Mehler, 1981). A Teoria Gerativa, por seu turno, passou a ocupar-se de questões ligadas à adequação explanatória e o caráter cada vez mais abstrato do modelo passou a dificultar a formalização da relação entre gramática e processador. Um terceiro momento surge na década de 90, com o Programa Minimalista, que passa a considerar, em seu modelo de língua, restrições impostas pelas interfaces da língua com os sistemas de desempenho. Nesse cenário, a discussão acerca da relação processador lingüístico-gramática pode ser retomada e novos direcionamentos de pesquisa podem ser concebidos.

9_{Hauser, Chomsky & Fitch (2002) referem-se ao sistema computacional em si como FLN} (Faculty of Language in the narrow sense) e ao conjunto deste com os demais sistemas cognitivos como FLB (Faculty of Language in the broad sense).

(28)

Um princípio que orienta o funcionamento do sistema computacional é o Princípio da Interpretabilidade Plena (Full Interpretation). De acordo com esse princípio, só pode chegar aos níveis de interface informação passível de ser lida pelos sistemas que interagem com a língua nesses níveis; cabe ao sistema computacional da língua, portanto, eliminar informação não-interpretável nas interfaces. A interpretabilidade constitui uma propriedade de traços do léxico. Cada item lexical é um conjunto de traços semânticos, fonológicos e formais. Traços semânticos seriam interpretáveis na interface semântica e traços fonológicos seriam interpretáveis na interface fonética. Quanto aos traços formais, estes são aqueles relevantes para as operações do sistema computacional (ex.: gênero, número, pessoa, caso, etc) e podem ser interpretáveis ou não em Forma-Lógica. Duas possibilidades de pareamento de traços interpretáveis e não-interpretáveis são consideradas no Programa Minimalista: através de um mecanismo de checagem de traços (Chomsky, 1995) e através de um mecanismo de valoração de traços (Chomsky, 1998, 1999). Na checagem, assume-se que todos os itens entrariam na derivação sintática com o valor de seus traços já especificado e no curso da computação sintática os traços não-interpretáveis seriam pareados aos interpretáveis, seus valores seriam checados e os não-interpretáveis seriam eliminados. Na valoração, os traços não-não-interpretáveis são valorados no curso da computação sintática, também a partir do pareamento com traços interpretáveis de mesma dimensão. O ponto de envio das informações para as interfaces Forma Lógica e Forma Fonética é chamado de Spell-Out. A operação que serve para concatenar objetos sintáticos é a operação Merge, a qual é implementada sem qualquer custo computacional, e a operação que permite deslocar objetos para posições mais altas na estrutura sintática (ex. interrogativas) é a operação Move, esta com custo computacional.

No que tange especificamente à questão da concordância sujeito-verbo, pode-se dizer que uma mudança importante ocorre no Minimalismo: a concordância passa a ser concebida como uma relação entre constituintes sintáticos, numa ruptura à visão assumida desde Polock (1989), em que a concordância era tratada em termos de uma projeção funcional AGR (agreement) para onde o verbo se movia a fim de receber marcas flexionais10. Essa mudança é

10_{Polock (1989) propõe a cisão da categoria funcional IP (inflectional phrase) em duas categorias} funcionais: TP (tense phrase) e AgrP (agreement phrase). Cada uma dessas categorias ocupa uma

(29)

determinada por restrições de legibilidade, pois a presença de marcas de concordância careceria de correlato semântico nas línguas.

Em Chomsky (1995), a concordância sujeito-verbo é explicada em termos de checagem de traços, numa posição estrutural de especificador-núcleo. O verbo inicialmente se move de sua posição de origem (núcleo de VP) para uma posição mais alta na estrutura, no caso TP, a fim de checar seus traços de tempo. TP, por sua vez, precisa de um elemento de uma dada categoria (com um traço D) em seu especificador, o que deflagra o movimento do sujeito para essa posição. T tem então seu traço D checado e apagado e o sujeito tem seu traço de caso checado por T. É nessa configuração de especificador-núcleo que se dá a checagem dos traços interpretáveis do sujeito com os traços não-interpretáveis do verbo.

Em Chomsky (1999), que assume a idéia de valoração, a concordância entre sujeito-verbo é implementada via uma operação sintática chamada Agree, que permite o pareamento de traços de mesma dimensão entre uma sonda (probe) e um alvo (goal), numa configuração de c-comando. Quando a sonda e o alvo se combinam, os traços φ não-interpretáveis da sonda são valorados. O traço de caso do alvo é definido como reflexo dessa operação. No caso da concordância entre sujeito e verbo, o núcleo T da categoria TP é a sonda (probe), com traços φ não-interpretáveis que precisam ser valorados. Essa sonda procura um alvo (goal) e encontra o sujeito com traços φ interpretáveis, o que permite que a valoração se efetue: Agree valora os traços não-interpretáveis de T e o traço de caso do sujeito passa a ser nominativo. Concomitantemente à atuação de Agree, ocorre o movimento do sujeito para a posição de especificador de T, em função de um traço EPP (extended projection principle). O verbo se move para T e lá recebe informação de tempo e número/pessoa.

posição específica na estrutura sintática e há longos debates acerca de qual das categorias dominaria a outra –se TP dominaria AgrP, como propõe Polock ou se AgrP dominaria TP, como propõe Belletti (1990), para as línguas românicas. A especificação de informação relativa a número/pessoa e tempo do verbo nesse momento da teoria é resultante de um movimento do verbo de sua projeção máxima para os núcleos Agr e T. O sujeito, por sua vez, nasce em uma posição interna ao VP, na posição de especificador, onde recebe papel temático do verbo. O caso do sujeito, no entanto, não pode ser atribuído nessa posição, visto que o verbo só atribui caso a seu complemento. O sujeito então se move para projeções acima de VP a fim de receber caso. A concordância, portanto, não é relacional, pois ela não é resultante de um pareamento de informação de número/pessoa do sujeito e do verbo, estabelecida numa dada configuração sintática.

(30)

TP vP C’ DP v’ VP V T Tempo 3µPess. S µ Num EPP T’ CP C 3ª pessoa Sing. µCaso DP

Fig. 4: Computação da concordância através da operação Agree. Ponto da derivação em que a sonda T tem seus traço não-interpretáveis de número e pessoa valorados pelos traços interpretáveis de mesma dimensão do alvo, o DP em especificador de vP.

Um aspecto importante em relação à geração de sentenças no Minimalismo é que esta se faz por aplicações sucessivas de operações computacionais que devem exaurir uma numeração. Isto é, assume-se uma abordagem derivacional da geração de sentenças. A derivação estará completa quando todos os itens da numeração forem utilizados. Isso se torna ainda mais dinâmico no modelo de 1999, em que é adotada a noção de fase. A idéia é que a derivação procederia por blocos, definidos por sub-arranjos de itens lexicais disponibilizados na Numeração. Passa-se a assumir que haveria múltiplos Spell-Outs durante a derivação sintática, o que permitiria que os níveis de interface fossem alimentados dinamicamente.

Cumpre ainda chamar a atenção para o pressuposto de que a sintaxe opera apenas com traços formais da língua. Traços fonológicos não são levados em conta pelas operações do sistema computacional. Isso é compatível com a idéia de que informação fonológica só seria inserida após a sintaxe.11 Conforme nota

11_{A noção de inserção tardia de traços fonológicos já aparece indicada em Chomsky (1995, nota} 10, p.381): “Indications of syllabic and intonational structure are not contained in lexical items. Nor is a good part of the output phonetic matrix: input and output are commonly quite different. Under the Distributed Morphology theory of Halle and Marantz (1993) and Marantz (1994),

(31)

Augusto (no prelo) a idéia de inserção tardia defendida pela Morfologia Distribuída (Halle & Marantz, 1993; Harley e Noyer, 1999) aplica-se bem ao modelo de 1999, em que traços não-interpretáveis entram na derivação sem valor definido. A idéia é que informação de natureza fonológica seria inserida após

Spell-Out, através de Itens de Vocabulário, que seriam o conjunto de sinais

fonológicos disponíveis em uma dada língua para a expressão de morfemas abstratos. A sintaxe estabeleceria uma relação entre o fragmento fonológico e uma posição sintática determinada. Assim, segundo Augusto, pode-se incorporar ao modelo de 1999 um componente morfológico flexional situado entre Spell-Out e PF.

3.2 Formulação sintática e derivação sintática

Vimos na seção anterior que o sistema computacional das línguas humanas, embora faça interface com o sistema conceptual-intencional e com o sistema fonético-articulatório, não sofre interferência de informação proveniente desses sistemas cognitivos no curso da derivação de uma sentença; logo, um tratamento da concordância que busque integrar teoria lingüística e processamento deve assumir uma perspectiva modular do processo de produção de sentenças, com um formulador sintático que atue de forma autônoma. Os modelos de produção não-interativos parecem ser, em princípio, compatíveis com o modelo de língua assumido no Minimalismo. A seguir, considera-se essa possibilidade de compatibilização no que diz respeito ao processo de formulação de sentenças e, em particular, ao processamento da concordância.

De acordo com modelos não-interativos que assumem uma arquitetura semelhante à de Levelt (1989), o processo de formulação sintática de um enunciado, em um modelo de produção, tem início com a concepção da mensagem, a que se segue a busca de representações lexicais com propriedades semânticas que possam servir para expressar as idéias pretendidas. No Minimalismo, a derivação sintática de uma sentença tem como ponto de partida uma dada Numeração (ou sub-arranjos de uma Numeração), a qual reúne os itens lexicais selecionados do Léxico.

phonological features do not appear at all in the NÆλ computation, words being distinguished (say, dog vs. cat) only within the phonological computation”.

(32)

A concepção de item lexical como um conjunto de traços semânticos, formais e fonológicos é compatível com o tratamento dado aos itens lexicais em teorias de acesso lexical, que consideram a existência de três estratos lexicais: um estrato conceitual, que reuniria conceitos lexicais associados a uma dada palavra; um estrato dos lemas, em que estaria representada informação acerca de propriedades gramaticais dos itens lexicais, e um estrato da forma, que teria informação relativa a morfemas e segmentos fonêmicos, os quais constituem o lexema de um item lexical (cf. Levelt et al., 1989).

Outro ponto de compatibilidade é a idéia de que existem dois tipos de traços formais (interpretáveis e não-interpretáveis) e que um deles só tem seu valor definido a partir de operações que ocorrem em um componente sintático. Conforme visto na seção 2, em Chomsky (1999) considera-se que os traços não- interpretáveis, isto é, aqueles que apresentam uma função sintática pura, são valorados no curso da derivação sintática e eliminados antes de chegarem à Forma Lógica. Na proposta de Levelt et al. (1999), os lemas apresentam parâmetros diacríticos que precisam ser definidos. Alguns desses diacríticos têm seu valor estabelecido com base em informação proveniente de uma representação conceitual, como é o caso do traço de tempo expresso no verbo. Outros, por sua vez, são valorados durante a etapa de codificação gramatical, como o traço de número do verbo, o qual assume o mesmo valor do traço de número do sujeito.

Em relação às etapas envolvidas no processo de codificação gramatical, é possível tentar caracterizá-las em termos das operações implementadas pelo sistema computacional da língua, que busca construir objetos sintáticos a partir de itens selecionados do léxico. A definição de Spell-Out como um ponto de envio de informação para os níveis de interface também parece ser compatível com a idéia de que, na produção de sentenças, o resultado da codificação gramatical é encaminhado para a codificação morfofonológica a fim de poder ser posteriormente articulado. Esse nível da codificação morfofonológica nos modelos de produção encontra um paralelo em um componente morfológico (ou morfofonológico), que estaria situado entre Spell-Out e PF no modelo de valoração de Chomsky (1999), o qual, conforme visto, é compatível com a idéia de inserção tardia de Itens de Vocabulário, nos moldes propostos pela Morfologia Distribuída. Esse componente morfológico lidaria com morfemas abstratos, resultantes de operações do sistema computacional, aos quais se associaria

(33)

conteúdo fonológico. Os Itens de Vocabulário seriam o conjunto de sinais fonológicos disponíveis em uma dada língua para a expressão desses morfemas abstratos. Nos modelos de produção, os chamados lexemas, recuperados do léxico no momento da codificação morfofonológica, podem ser tomados como elementos equivalentes aos Itens de Vocabulário. O quadro a seguir, reproduzido de Corrêa (submetido), permite visualizar as correspondências entre etapas envolvidas na produção e na derivação de sentenças:

Produção Derivação 1 Intenção de fala / conceptualização de uma

mensagem

2 Acesso a elementos de categorias funcionais e a elementos de categorias lexicais no Léxico Mental correspondentes a uma unidade de processamento

Constituição da Numeração a partir de elementos recuperados do léxico (matrizes constituídas por traços semânticos, fonológicos e formais)

3 Manutenção de representações correspondentes ao lema dos elementos recuperados do léxico

Numeração constituída – apenas os traços formais são relevantes para a derivação

4 Formulação sintática incremental (montagem de uma estrutura hierárquica)

Computação sintática (em fases) 5 Linearização (posicionamento dos

constituintes hierarquicamente relacionados)

Computação com operação de movimento

Spell out (via sintática da bifurcação)

6 Recuperação de lexemas e codificação morfofonológica

Derivação que resulta em PF (via componente fonológico, os traços fonológicos passam a ser relevantes)

7 Planejamento articulatório Interface FP (com correspondente LF) 8 Realização da fala

Outro aspecto que aproxima o modelo de língua dos modelos de produção é a abordagem derivacional e a idéia de fases. No Minimalismo, adota-se uma abordagem derivacional de geração de frases, de acordo com a qual a sentença é o resultado de aplicações sucessivas de operações computacionais. No modelo de valoração, considera-se também que existem pontos de envio de informação para a Forma Fonética e que o material enviado corresponde ao que integraria uma dada fase computacional. Esse funcionamento do sistema computacional é compatível com a idéia de que a estrutura sintática da sentença vai sendo construída de modo incremental (ou moderadamente incremental) e com idéia de que haveria unidades de processamento mantidas em uma memória de trabalho. Uma fase equivale no modelo de língua a um domínio estrutural, em que relações temáticas seriam estabelecidas – o vP , ou a um domínio estrutural em que relações proposicionais são consideradas - o CP. Em que medida cada um desses

(34)

blocos corresponde a uma unidade de processamento é um ponto de investigação que vem sendo considerado tanto no desenvolvimento de alguns modelos psicolingüísticos que tratam de forma integrada a produção e a compreensão de sentenças (cf. Corrêa & Augusto, 2005) como também em modelos computacionais de parsing, que assumem uma computação sintática com sondas (probes) e alvos (goals), como no modelo de valoração de traços do Minimalismo (cf. Fong, 2004).

Ainda quanto ao modo como transcorre uma dada derivação sintática, um aspecto a ser considerado é a direção em que se dá a montagem da estrutura sintática. No modelo proposto em Chomsky (95, 98, 99), a derivação sintática é

bottom-up e a adição de novo material é feita no topo da árvore sintática. Assim,

numa frase como Paulo comeu o bolo, primeiro há a formação do DP o bolo, que é concatenado ao verbo comer na posição de argumento interno desse verbo; depois disso, Paulo é concatenado ao conjunto comeu o bolo, em uma posição à esquerda desse sintagma.12 No entanto, quando se considera o processo tanto de produção quanto de compreensão de sentenças, verifica-se um outro direcionamento: as sentenças são formuladas e compreendidas da esquerda para a direita, de modo incremental.

Phillips (1996) apresenta uma possível solução para esse ponto. Inserido em uma perspectiva gerativista de análise lingüística, Phillips busca especificar um sistema unificado para gramática e processamento e propõe que a gramática é um sistema de construção de estrutura que opera de modo incremental, da esquerda para a direita. Apresenta como evidências para sua proposta o exame de testes de constituência em inglês, incluindo movimento, elipse, coordenação, escopo e ligação. O autor parte da constatação de que os resultados de testes de constituência são muitas vezes conflitantes e mostra que a solução para o problema de constituência está em propriedades de construção de estrutura de modo incremental. Com a idéia de derivação da esquerda para a direita, Phillips aproxima o modo de funcionamento da gramática do processador, unificando-os em um único sistema. O problema dessa abordagem é que, ao se assumir uma integração gramática/processador, erros de concordância precisam ser relacionados a falhas no componente sintático da língua, e torna-se difícil

12_{Note-se que apresentamos uma versão simplificada da composição da sentença Paulo comeu o} bolo. Numa análise detalhada, seria necessário considerar projeções funcionais como TP e vP.

(35)

explicar, mantendo-se a idéia de sintaxe autônoma, a interferência de fatores semânticos e morfofonológicos.

Um caminho alternativo para se discutir a relação gramática/processador é apontado por Corrêa (2005 a; submetido). Segundo a autora não se pode afirmar que gramática e processador são um sistema único, dado que a derivação envolve operações de movimento que não encontram correspondente em tempo real (estas seriam indicativas de processos bem iniciais da aquisição da linguagem quando parâmetros de ordem são fixados). A gramática seria uma entidade virtual, correspondente à capacidade computacional da língua, que teria como operação básica a concordância. Concordância, nesse sentido, tomada de forma genérica (Corrêa, 2005 b) assumindo Adger (2003), seria a operação que permitiria o pareamento de traços formais interpretáveis com seus homólogos não interpretáveis, de modo a atender o Princípio da Interpretabilidade Plena (Full

Interpretation), o qual garante que expressões lingüísticas possam ser faladas e

analisadas. Essa distinção parece bastante relevante, pois permite dar conta da produção e da compreensão e separar as operações do sistema computacional das ações do parser e do formulador, as quais têm propriedades específicas.13 Quanto aos erros de concordância, estes não ocorreriam durante a codificação gramatical, isto é, quando se dá propriamente a computação da concordância, mas sim seriam pré ou pós-sintáticos, mantendo-se, dessa forma, a autonomia do formulador sintático na produção de sentenças.

Fong (2004) implementa computacionalmente um modelo de parsing que estaria dentro do “espírito” de Corrêa (2005 a; submetido) no que tange à relação entre gramática e processador. O autor assume uma perspectiva de parsing incremental, da esquerda para a direita, o que é compatível com o modo como as sentenças vão sendo percebidas, e assume que o parser, no processo de análise da estrutura sintática, valoraria traços formais dos itens lexicais a partir da operação

Agree, que atuaria entre uma sonda e um alvo em uma dada configuração

estrutural. A gramática não é o parser, visto que este possui um modo de funcionamento próprio, com mecanismos de armazenamento e recuperação de informação necessária à computação sintática da sentença. Além disso, diferentemente do que se assume para uma derivação sintática no Minimalismo,

13_{Para uma visão detalhada da proposta de Corrêa, ver também Corrêa & Augusto (2005) e} Corrêa (2005 a; submetido).

(36)

Fong propõe que a derivação é top-down, lançando mão para isso de representações de estruturas sintáticas elementares (conforme proposto no contexto das Tree Adjoining-Grammars14), que seriam ativadas no parsing. Logo, embora operações gramaticais implementadas pelo parser possam ser caracterizadas conforme vem sendo proposto no modelo de Chomsky (1999), não há uma identidade entre gramática e processador.

No modelo de produção que será apresentado no capítulo 7 essa separação entre gramática e processador é assumida. Será visto como a computação sintática da concordância, passível de ser caracterizada em termos de valoração de traços formais, é implementada em um modelo de produção que incorpora um parser-monitorador.

14_{Tree Adjoining-Grammar (TAG) é uma meta-linguagem formal que permite expressar} generalizações sintáticas. Definida por Joshi e colegas (1975; 1985), é freqüentemente utilizada em Lingüística Computacional. A unidade sintática primitiva das TAGs são árvores elementares que consistem de um núcleo lexical e do(s) argumento(s) que o núcleo licencia. Estas árvores podem se combinar a outras por meio de operações específicas (chamadas substituição e adjunção), o que permite representar a estrutura das sentenças. Segundo Ferreira (1999),as TAGs instanciam análises sintáticas em uma dada notação formal, sendo, pois, possível empregar esse formalismo para diferentes abordagens teóricas – Minimalismo (Chomsky, 1995); Gramática Léxico-Funcional (Bresnan, 1982), etc.

(37)

4 A investigação de erros de produção no estudo do

processamento da concordância sujeito-verbo

Grande parte das pesquisas sobre produção da linguagem desde o trabalho seminal de Garrett (1975, 1980) tem se baseado no estudo de erros ou lapsos de fala/escrita A análise da natureza desses erros bem como das unidades afetadas tem permitido o desenvolvimento de modelos de produção da linguagem, em que são caracterizadas as unidades de processamento e as etapas envolvidas no processo de formulação de sentenças.

Erros de atração no estabelecimento da concordância sujeito-verbo vêm sendo amplamente reportados na literatura em diferentes línguas, tanto no que se refere à produção oral (Bock & Miller, 1991; Bock & Cutting, 1992; Bock & Eberhard, 1993; Vigliocco & Nicol, 1998; Franck, Vigliocco & Nicol, 2002, entre outros), quanto no que diz respeito à produção escrita (Fayol et al. 1994). O estudo desses erros tem permitido a formulação de hipóteses acerca de como as relações de concordância são processadas, quais os fatores atuantes no processamento e em que momento do processo de formulação de sentenças a concordância é computada.

Nesta seção, serão apresentados resultados experimentais acerca dos fatores que interferem no processamento da concordância. Como será visto em detalhes no capítulo 8, a tarefa empregada nos estudos sobre concordância é de produção induzida de erros e consiste na produção de uma frase com verbo flexionado que tem como sujeito um preâmbulo, o qual é apresentado por via oral ou escrita. A tarefa do participante é repetir oralmente o preâmbulo e completar a frase com um verbo. Os preâmbulos são sempre constituídos de um elemento nominal, que funciona como núcleo do sujeito, seguido de um núcleo nominal interveniente, também chamado de nome local, que aparece em um sintagma modificador do sujeito (ex.: O rótulo das garrafas). Nesses experimentos, o total de erros produzido por condição experimental é tomado como variável dependente15_e manipulam-se fatores de natureza semântica, sintática e morfofonológica.

15_{Variável dependente é a variável observada em um experimento ou estudo cujas mudanças são} determinadas pela presença ou intensidade de uma ou mais variáveis independentes (i.e. variáveis manipuladas no experimento).