O processo de bootstrapping na aquisição de linguagem

(1)

O PROCESSO DE BOOTSTRAPPING NA AQUISIÇÃO DE

LINGUAGEM

CAMPINAS,

2015

(2)

(3)

INSTITUTO DE ESTUDOS DA LINGUAGEM

Letícia Schiavon Kolberg

O PROCESSO DE BOOTSTRAPPING NA AQUISIÇÃO DE

LINGUAGEM

Dissertação apresentada ao Instituto de Estudos da Linguagem da Universidade Estadual de Campinas para obtenção do título de Mestra em Linguística.

Orientador (a): Profa. Dra. Ruth Elisabeth Vasconcellos Lopes

CAMPINAS,

2015

(4)

(5)

(6)

(7)

O papel do input na aquisição tem sido amplamente discutido dentro das teorias de

bootstrapping, que postulam que certas informações linguísticas seriam responsáveis pelo

disparo dos mecanismos inatos de aquisição. Embora não se acredite que apenas um tipo de pista (sintático, prosódico ou semântico) dê conta do processo de aquisição por si só, a maioria dos autores postula uma hierarquia de acesso a esses sistemas linguísticos. Pinker (1989) afirma que a informação semântica é a responsável pelo início da aquisição, sendo a base para a estrutura sintática; já Mazuka (1996) postula que para iniciar a aquisição é necessário determinar certos parâmetros básicos a partir do ritmo, sendo este o responsável lógico pelo disparo dos mecanismos inatos. A dificuldade em se chegar a um consenso sobre qual tipo de pista seria usado inicialmente gera o chamado bootstrapping problem (PINKER, 1989): Como se chega à estrutura sintática pela semântica sem compreender a correlação entre a estrutura sintática e a conceitual? Da mesma forma, como se pode usar pistas prosódicas sem a transposição do nível fonético/fonológico para o nível de representação formal? A fim de resolver estas questões, Hirsh-Pasek & Golinkoff (1996) postulam um modelo de coalisão em que pistas sintáticas, semânticas e prosódicas são usadas em conjunto desde o início, embora assumam pesos diferentes conforme a aquisição procede. Para isso, ressaltam três fases do desenvolvimento linguístico, baseadas no tipo de informação mais saliente: a fase prosódica, aproximadamente dos 0 aos 09 meses, na qual a criança realiza a segmentação inicial da fala e a delimitação de eventos; a semântica, dos 09 aos 24 meses, na qual ocorre o mapeamento semântico e a determinação de parâmetros básicos a partir de pistas redundantes do contexto; e a sintática, dos 24 aos 36 meses, na qual os parâmetros sintáticos mais complexos são determinados. As fases são corroboradas por evidências empíricas de crianças adquirindo o inglês, mas os resultados são considerados universais. A fim de somar evidências em favor desta hipótese, o objetivo principal desta dissertação é a adaptação de um dos testes realizados pelas autoras com crianças adquirindo o português brasileiro. O teste escolhido investigará a compreensão da ordem de palavras e sua correlação com os papéis de agente e paciente por crianças na segunda fase a partir do Paradigma de Olhar Preferencial Intermodal (SPELKE, 1979): dois monitores mostram vídeos dos personagens Ju e Nino realizando ações, sendo que em um monitor Ju é a agente, e no outro, paciente. O estímulo auditivo apresenta sentenças como “A Ju está coçando o Nino”, correspondentes a apenas um dos vídeos, enquanto uma câmera grava o tempo de fixação do olhar das crianças para cada vídeo. Os resultados gerais não mostram um tempo de fixação maior para o vídeo correspondente, o que poderia ser justificado pela falta de conhecimento do significado dos verbos usados no teste pelas crianças, já que, diferente de Hirsh-Pasek & Golinkoff, não acessamos esta informação antes da testagem. Estes, no entanto, nos farão questionar as fases do modelo de coalisão, levando-nos à reflexão de que a saliência perceptual entre os sistemas linguísticos talvez alterne não apenas conforme a fase da aquisição, mas também conforme as características de cada problema apresentado.

(8)

(9)

The role of the input in language acquisition has been widely discussed within

bootstrapping theories, that postulate that certain linguistic information are responsible for

triggering innate mechanisms for language acquisition. Although no author believes only one type of cue (syntactic, semantic or prosodic) would handle the acquisition process on itself, most of them postulate that the linguistic systems are accessed hierarchically. Pinker (1989) says that the semantic information is responsible for the beginning of language acquisition, being the basis for syntactic structure; on the other hand, Mazuka (1996) postulates that, in order to bootstrap acquisition, it is necessary to determine certain basic parameters through rhythmic information, the logic responsible for the triggering of innate mechanisms. The difficulty in getting to a consensus about what type of cue would be initially accessed generates the Bootstrapping Problem (PINKER, 1989): how does one gets to syntactic structure through semantics without knowing the correlation between conceptual and syntactic structure? By the same logic, how can one use prosodic cues without transposing the phonetic/phonological level to the level of formal representation? In order to solve these questions, Hirsh-Pasek & Golinkoff (1996) created a coalition model in which syntactic, semantic and prosodic cues are accessed together since the beginning of acquisition, although they take different weights as it proceeds. The authors postulate three phases of linguistic development, based on the most salient cues: the prosodic phase, from 0 to 9 months of age, in which the child performs initial segmentation of the input speech and the delimitation of events in the context; the semantic phase, from 9 to 24 months, when the processes of semantic mapping and basic parameter determination through redundant syntactic/semantic cues occur; and the syntactic phase, from 24 to 36 months, when more complex syntactic parameters are determined. Those phases are corroborated by empirical evidences from children acquiring English, but the results are considered universal. In order to gather evidence in favor of this hypothesis, the main goal of this dissertation is the adaptation of one of the tests ran by the authors, to be ran with children acquiring Brazilian Portuguese. The chosen test will investigate the comprehension of word order and its correlation with the agent and patient roles by children in the second phase postulated by the authors, through the Intermodal Preferential Looking Paradigm (SPELKE, 1979): two video monitors show videos of the characters Ju and Nino performing transitive actions, and when Ju is the agent in one video, it is the patient in the other. The audio presents sentences such as “Ju is scratching Nino”, corresponding to only one of the video screens, while a hidden camera records the eye fixations of children to each video screen. The main results do not show a longer fixation time to the video corresponding to the linguistic stimulus, which could be justified by the lack of knowledge

(10)

not access this information before the test. These results, however, will make us question the phases of the coalition model, leading us to the conclusion that the perceptual salience between linguistic systems perhaps alternate not just in conformity with the phase of development, but also with the characteristics of each presented problem.

Key words: Language Acquisition; Nativism; Psycholinguistics; Preferential Looking.

(11)

1. INTRODUÇÃO…...1

2. FUNDAMENTAÇÃO TEÓRICA...7

2.1. A perspectiva inatista...8

2.1.1.O papel da experiência...14

2.2. Bootstrapping...17 2.2.1. Teorias de bootstrapping...20 2.2.1.1. Bootstrapping semântico...21 2.2.1.2. Bootstrapping prosódico...26 2.2.1.3. Bootstrapping sintático...32 2.2.2. O Bootstrapping Problem...34

2.3. O modelo de coalisão de HP&G...35

2.3.1. Discussão...42

2.4. Compreensão de ordem de palavras...46

2.5. Previsões...51

3. METODOLOGIA...53

3.1. O Paradigma de Olhar Preferencial Intermodal...53

3.1.1. Porque testar compreensão...54

3.1.2. Possíveis problemas...55

3.2. O experimento de HP&G...57

3.2.1. Construção dos vídeos...58

3.2.2. Variáveis independentes...60

3.2.3. Variável dependente...60

3.2.4. Variáveis contrabalançadas...61

3.2.5. Contabilização dos dados...61

3.2.6. Descartes...62

3.2.7. Sujeitos...62

3.2.8. Resultados...62

3.3. Adaptação para o PB...63

3.3.1. Classificação semântica dos verbos...65

3.3.2. Pré-testagem...69

3.3.2.1. Construção dos vídeos...70

3.3.2.2. Variáveis independentes...77

3.3.2.3. Variável dependente...77

3.3.2.4.Variáveis contrabalançadas...78

(12)

3.3.2.6. Sujeitos e local de testagem...80

3.3.2.7. Procedimento...80

3.3.2.8. Contabilização dos dados...82

3.3.2.9. Descartes...84

3.3.2.10. Resultados preliminares...85

3.3.2.11. Discussão...86

3.3.3. Testagem...87

3.3.3.1. Construção dos vídeos...89

3.3.3.2. Variáveis dependentes, independentes e contrabalançadas...94

3.3.3.3. Materiais...94

3.3.3.4. Sujeitos e local de testagem...95

3.3.3.5. Procedimento...95

3.3.3.6. Grupo Controle...96

3.3.3.7. Contabilização dos dados e descartes...96

4. RESULTADOS...99

4.1. Resultados gerais...100

4.1.1. Geral...100

4.1.2. Resultados por sexo...103

4.1.3. Resultados por idade...105

4.1.4. Resultados por familiarização...106

4.1.5. Resultados por estímulo...108

4.1.6. Resumo dos resultados...109

4.2. Análise das etapas de saliência...110

4.2.1. Resultados Gerais...112

4.2.2. Resultados por sexo...113

4.2.3. Resultados por idade...114

4.2.4. Resumo dos resultados...114

5. DISCUSSÃO...117 6. CONCLUSÃO...129 7. REFERÊNCIAS...135 8. APÊNDICES...145 9. ANEXOS...153 xii

(13)

À minha família, por me apoiar em todas as decisões que tomo;

À minha mãe, pelo apoio financeiro, cultural, psicológico, emocional e afetivo 24h, pessoalmente ou via web;

Aos amigos do curso de Linguística da UNICAMP e do curso de Letras da UFPR, não apenas por serem leitores, corretores, debatedores, atores e “cobaias” deste trabalho, mas principalmente pelos momentos (necessários) em que me fizeram relaxar e rir disso tudo; À Thayse Letícia Ferreira e ao Fabio Luis Fernandes Mesquita, que me assistiram em todos os testes realizados, cedendo seu tempo (e paciência) sem pedir nada em troca;

Ao CNPq, pelo auxílio financeiro através de bolsa de estudos (no. Processo: 132039/2013-3);

Às instituições Potencial Semente do Saber e CMEI Vila Torres, que me receberam de braços abertos, cedendo seu tempo, seu espaço e suas crianças para que eu pudesse realizar meu experimento;

Aos professores do curso de Linguística da UNICAMP e do curso de Letras da UFPR, por terem guiado meu caminho pelos estudos da linguagem;

À minha orientadora, profa. Dra. Ruth Elisabeth Vasconcellos Lopes, pela orientação, confiança e paciência;

À banca, prof. Dr. Maximiliano Guimarães Miranda e profa. Dra. Ester Mirian Scarpa, pela leitura atenta do trabalho e sugestões valiosas que definitivamente o guiaram para seu estágio final;

À profa. Dra. Teresa Cristina Wachowicz, que foi quem me sugeriu o tema de

bootstrapping e me deu o “empurrão” inicial para dentro da vida acadêmica.

(14)

(15)

FIGURA 1 – Modelo de bootstrapping semântico proposto por Pinker (1989, pág.

362)...24

FIGURA 2 – Modelo de bootstrapping prosódico proposto por Christophe et. al. (2008, pág. 62)...29

FIGURA 3 – Distribuição das pistas durante a primeira fase da aquisição (in.:HIRSH-PASEK & GOLINKOFF, 1996, pág. 186)...39

FIGURA 4 – Distribuição das pistas durante a segunda fase da aquisição (in.:HIRSH-PASEK & GOLINKOFF, 1996, pág. 186)...41

FIGURA 5 – Distribuição das pistas durante a terceira fase da aquisição (in.:HIRSH-PASEK & GOLINKOFF, 1996, pág. 187)...42

FIGURA 6 – Configuração dos laboratórios usados por Hirsh-Pasek & Golinkoff (1996, pág. 107)...58

FIGURA 7 – Personagens dos vídeos usados na pré-testagem...71

FIGURA 8 – Disposição dos personagens durante as ações...72

FIGURA 9 – Painel onde os vídeos são apresentados...79

FIGURA 10 – Disposição dos materiais atrás do painel...79

FIGURA 11 – Preferência visual da mãe não imitada pela criança...81

FIGURA 12 – Posição da pesquisadora durante as sessões de teste...82

FIGURA 13 – Personagens dos vídeos usados na testagem...90

FIGURA 14 – Sala onde foram realizadas as sessões de teste definitivas...95

GRÁFICO 1 – Tempo médio de fixação por estímulo...102

GRÁFICO 2 – Tempo global de fixação...102

GRÁFICO 3 – Proporção média de fixação por estímulo por sexo...104

(16)

GRÁFICO 5 – Proporção média de fixação por estímulo por idade...105

GRÁFICO 6 – Proporção média geral de fixação por idade...106

GRÁFICO 7 – Proporção média de fixação por estímulo por familiarização...107

GRÁFICO 8 – Proporção média geral de fixação por familiarização...107

GRÁFICO 9 – Proporção média de fixação por estímulo...109

(17)

TABELA 1 – Resultados do experimento de HP&G...63

TABELA 2 – Telicidade: verbos novos vs. verbos de HP&G...68

TABELA 3 – Argumento interno prototípico: verbos novos vs. verbos de HP&G...68

TABELA 4 – Seleção de instrumento: verbos novos vs. verbos de HP&G...68

TABELA 5 – Roteiro da fase de introdução (pré-testagem)...74

TABELA 6 – Roteiro da fase de treino (pré-testagem)...76

TABELA 7 – Roteiro da etapa de teste referente à ação de “beijar”...77

TABELA 8 – Tempo de fixação do olhar para a ação correspondente vs. não correspondente por criança (pré-testagem)...86

TABELA 9 – Tempo médio de fixação do olhar para a ação correspondente vs. não correspondente (pré-testagem)...86

TABELA 10 – Diferenças entre o experimento da dissertação (Kolberg) e o experimento original (HP&G)...89

TABELA 11 – Roteiro da fase de introdução dos vídeos da testagem...92

TABELA 12 – Roteiro da etapa de teste para o verbo “coçar”...94

TABELA 13 – Tempo de fixação por criança (testagem)...101

TABELA 14 – Agrupamentos entre estímulos usando o método de Tukey a um nível de confiança de 95%...108

TABELA 15 – Preferência por uma das telas na fase de saliência por estímulo testado....111

TABELA 16 – Preferência absoluta por uma das telas na fase de saliência por estímulo testado...112

TABELA 17 - Proporção média de fixação do olhar para as etapas de saliência e de teste por cada estímulo e média geral...112

(18)

para o fator sexo...113 TABELA 19 – Proporção média de fixação do olhar para as etapas de saliência e de teste para o fator idade...114 Tabela 20 – Telicidade: classificação de estímulos testados...124 Tabela 21 – Argumento interno: classificação de estímulos testados...124 Tabela 22 – Seleção de instrumento: classificação de estímulos testados (E1 a E4 e T1 a T4)...124

(19)

1. INTRODUÇÃO

A perspectiva inatista, delineada especialmente a partir de trabalhos de Noam Chomsky (1959, 1986, dentre outros), jogou uma nova luz sobre o campo da linguística ao postular que as línguas naturais seguem restrições específicas geneticamente determinadas, comuns a todos os seres humanos. Com isso, pôde-se compreender que as línguas não são apenas um construto cultural, mas fazem parte de um conhecimento inato de operações e mecanismos restritivos que orientam a construção das gramáticas naturais. Dentro dessa perspectiva, a aquisição de linguagem mostra-se um campo de estudo fundamental para a compreensão de qualquer fenômeno linguístico: para uma determinada operação hipotética em qualquer nível (estrutural, prosódico ou lógico) ser corroborada, é preciso demonstrar como a criança poderia adquiri-la a partir dos mecanismos inatos.

Mas nem todo conhecimento sobre a língua1_{é inato. Além das diferenças determinadas}

por combinações de parâmetros linguísticos, que são como conjuntos de valores possíveis que determinam as especificidades das línguas naturais, existem também as diferenças de inventário lexical, sistema prosódico/fonológico, morfologia e realização fonológica, prosódica ou estrutural de características sintáticas e semânticas. Portanto, para se chegar ao conhecimento da língua materna, é preciso que a criança seja exposta à experiência, traduzida em termos de um input estrutural, prosódico/fonológico e semântico.

O papel do input é o objeto de estudo de trabalhos sobre bootstrapping, que pretendem explicar o processo de desencadeamento dos mecanismos de aquisição a partir da experiência linguística (PINKER, 1989; MORGAN & DEMUTH, 1996; dentre outros). Os modelos gerados por estas teorias em geral postulam uma hierarquia relativamente rígida de acesso aos sistemas linguísticos (prosódia, sintaxe e semântica), seja por uma ordem lógica de saliência no input, seja por exigências do mecanismo de aquisição ou por dependências entre esses sistemas. A ideia básica é a de que o sistema considerado primordial sustenta a aquisição dos outros, até o ponto 1 Aqui falamos de “língua” no sentido de Língua-E (externa), que é a realização social da capacidade linguística (e.g., o português, o alemão, o árabe, etc.). Em oposição, a Língua-I (interna) representa o conhecimento inconsciente e geneticamente determinado das operações e restrições que delimitam a Língua-E.

(20)

em que as correlações entre este e os demais não deem conta da interpretação dos dados do input. A partir de então, informações sobre os outros sistemas são acessadas, para que possa ocorrer a aquisição de características não diretamente relacionadas ao sistema de base. Enquanto alguns autores afirmam que esse sistema de base é a semântica (PINKER, 1989,1987; BLOOM, 1999; MACNAMARA, 1982, dentre outros), outros postulam ser a sintaxe (MAZUKA, 1996; WAGNER, 2006; BERNAL ET. AL., 2007, dentre outros), e ainda outros, a fonologia ou a prosódia (CHRISTOPHE ET. AL., 1997, 2008; KELLY, 1996; MORGAN, SHI & ALLOPENNA, 1996, dentre outros).

A dificuldade em se chegar a um consenso sobre qual sistema desencadearia a aquisição inicial gera o chamado bootstrapping problem (problema de bootstrapping (PINKER 1989)), que evidencia a aparente circularidade em se postular apenas um tipo de informação como responsável pela aquisição inicial. Embora todos os sistemas sejam independentes, eles se relacionam a ponto de ser difícil compreender como se poderia chegar ao conhecimento de um sem o auxílio dos demais.

A fim de resolver este problema, Hirsh-Pasek & Golinkoff (1996) postulam um modelo de aquisição a partir do input que mostra que, embora existam sistemas mais salientes em cada fase da aquisição, a semântica, a sintaxe, a prosódia e as informações contextuais e discursivas precisam estar presentes e acessíveis desde o início, de modo que as crianças possam relacioná-las em um processo de coalisão2_{. Para as autoras, a ordem de saliência entre as pistas se dá não}

por uma motivação puramente linguística, mas por correlação com o desenvolvimento de esquemas mentais de internalização e interpretação de eventos.

Dentro dessa hipótese, três fases da aquisição são destacadas, de acordo com as pistas mais salientes: a fase prosódica, que vai aproximadamente até os 09 meses; a semântica, dos 09 aos 24 meses; e a sintática, dos 24 aos 36 meses. Embora a ideia de que há alguma motivação externa para a aquisição não seja aceita nesta dissertação, por se acreditar na existência de uma faculdade da linguagem inata, que dá conta das “predisposições” (bias3_{) necessárias para a}

aquisição por si só, as fases postuladas parecem ser corroboradas por evidências empíricas de 2 O termo coalisão, traduzido do inglês “coalition” (“aliança”, “junção”), é usado por HP&G em função da ideia

de interdependência entre os sistemas linguísticos para a aquisição, que orienta o modelo proposto.

3 O termo bias será usado nesta dissertação com o sentido de uma predisposição instintiva a prestar atenção em certas informações específicas do input.

(21)

diversos estudiosos (GERKEN & MCINTOSH, 1993; NELSON, 1973; NEISSER & BECKLEN 1975, dentre outros). A hipótese inicial desta dissertação, então, é de que estas fases são universais, embora não por conta do processo de desenvolvimento de esquemas mentais, mas por motivações puramente linguísticas.

Como não se pode dar conta, na dissertação, de coletar evidências empíricas em favor desta hipótese para todas as fases postuladas, escolheu-se fazer uma reprodução adaptada de um dos experimentos de Olhar Preferencial realizados pelas autoras (a ser explicado com mais detalhe na seção de metodologia), que visa investigar a compreensão de ordem de palavras através da redundância entre pistas sintáticas e semânticas por crianças na segunda fase da aquisição.

Pretende-se, ao reproduzir o teste com crianças adquirindo o Português Brasileiro (PB), somar evidências em favor da ideia de que as crianças conseguem correlacionar pistas de diferentes sistemas linguísticos para a aquisição, indo contra certas teorias de bootstrapping que postulam uma hierarquia de acesso a esses sistemas. Também se pretende investigar a possível universalidade da segunda fase da aquisição postulada por HP&G, mais especificamente em relação à compreensão multimodal (já que depende da redundância entre pistas) da estrutura sintática. Se os resultados forem favoráveis a essa hipótese, ou seja, se os sujeitos testados conseguirem correlacionar pistas de ordem sintática e de contexto semântico para identificar a ordem de palavras canônica da língua, será possível prever que crianças entre um e dois anos adquirindo o PB também são capazes de procurar por correspondências entre pistas sintáticas e semânticas no input, e, a partir disso, chegar à compreensão da estrutura sintática antes mesmo da produção das primeiras combinações de palavras, assim como as adquirindo o inglês no teste de Hirsh-Pasek & Golinkoff (1996, doravante HP&G).

Para além da investigação empírica, também pretendo fazer uma discussão teórica sobre o modelo de HP&G, apontando suas vantagens e desvantagens. A questão central a ser debatida é a ideia de que o processo de aquisição seria motivado pelo desenvolvimento dos modelos mentais, o que contraria a ideia inatista de que não é necessário motivação externa ao próprio mecanismo de aprendizado linguístico (LAD, como veremos na sessão de fundamentação teórica) para a aquisição (desenvolvimento da Língua-I). Uma segunda questão é que nem todas as evidências

(22)

empíricas existentes apontam para a mesma hierarquia postulada pelas autoras, o que nos faz pensar que talvez a ordem de saliência observada seja apenas um construto artificial4_da

metodologia dos experimentos selecionados. Seria possível pensar então que as informações prosódicas, sintáticas e semânticas devem assumir pesos diferenciados não apenas em função do conhecimento linguístico e não-linguístico infantil, mas também de acordo com os tipos de problema com os quais a criança se depara no decorrer da aquisição (SIEGLER, 1987).

Esta dissertação será dividida em cinco capítulos. Na Fundamentação Teórica, exporei a literatura pertinente para o trabalho, incluindo uma pequena revisão da teoria inatista defendida por Chomsky (1959; 1986; 2005) e do papel da experiência dentro deste quadro, evidenciando a maior importância da informação linguística (em oposição à não-linguística) para a aquisição. Também revisarei a literatura sobre bootstrapping, fazendo uma divisão entre os modelos de

bootstrapping sintático, prosódico e semântico. Depois disso, exporei críticas a essa visão de bootstrapping hierárquico, que nos levarão a explorar o modelo de coalisão de pistas de HP&G.

Também farei uma pequena revisão sobre compreensão de ordem de palavras, explicando de que se trata essa compreensão precoce (já que anterior à produção de sentenças) para HP&G e para outros autores. Por fim, fecharei o capítulo levantando algumas previsões em relação ao experimento aplicado.

Na seção de Metodologia, farei uma revisão do Paradigma de Olhar Preferencial Intermodal para a área de aquisição, e justificarei a adaptação do experimento de HP&G para crianças adquirindo o PB. Para isso, mostrarei primeiro a metodologia e os resultados preliminares de uma pré-testagem feita com onze crianças de uma creche em Campo Largo – PR, justificando a partir dos problemas encontrados quais características do experimento foram mantidas e quais foram modificadas no teste definitivo.

Nos Resultados, mostrarei como as crianças responderam a cada estímulo testado a partir da observação do tempo médio de fixação do olhar geral e individual. Também farei uma discussão preliminar dos dados obtidos, apontando alguns problemas, em especial em relação à preferência por uma das telas nas etapas de saliência. Esse problema nos fará reanalisar os resultados de forma alternativa, o que reforçará as conclusões obtidas na primeira análise.

4 Klahr (1982) já levantou esta hipótese para modelos de “curva em U”, afirmando que estes seriam criados pelas condições experimentais.

(23)

Na Discussão, farei uma reflexão sobre os resultados encontrados, analisando cada fator que se mostrou estatisticamente relevante na análise, o que nos levará ao questionamento da adequação do modelo de HP&G para uma teoria de competência. Por fim, na seção de

Conclusão, farei um breve resumo sobre o caminho traçado pela dissertação, apontando os

(24)

(25)

2. FUNDAMENTAÇÃO TEÓRICA

Nesta seção apresentarei as teorias nas quais este trabalho se baseia. Em primeiro lugar, é importante ressaltar que os trabalhos sobre bootstrapping revisados aqui localizam-se dentro do quadro teórico inatista, pois se fala justamente sobre o desencadeamento dos mecanismos inatos de aquisição. Indicarei, então, a teoria inatista com que trabalho, sem, no entanto, entrar em detalhes que fujam ao meu objetivo principal, que é a investigação do modelo de aquisição postulado por HP&G. Qual a extensão do conhecimento inato infantil não é tão importante aqui quanto a assunção de que existe um conhecimento inato e de que ele é responsável pelas restrições e predisposições (bias) que determinam o tipo de informação retirada do input e onde procurá-la.

Também irei expor algumas teorias de bootstrapping, ressaltando os modelos que postulam hierarquias entre os tipos de pista utilizados pelas crianças no processo de aquisição. Exporei depois o problema fundamental deste tipo de abordagem hierárquica, o que nos levará à exploração da teoria de HP&G, que embora não seja classificada pelas autoras como uma teoria de bootstrapping (como será visto mais à frente), também trata do papel do input na aquisição. Após isso, farei uma sessão de discussão sobre a teoria das autoras, procurando rever certos conceitos ligados ao modelo proposto.

Por fim, fecharei a sessão com algumas previsões sobre o experimento proposto, indicando primeiramente o que estamos tomando por compreensão de ordem de palavras (i.e., que tipo de compreensão esperamos acessar através do teste), e logo após refletindo as possíveis implicações teóricas dos resultados obtidos, sejam eles favoráveis ou não à hipótese de que crianças de um a dois anos conseguem correlacionar pistas linguísticas sobre a ordem de palavras canônica da língua com a informação semântica do contexto.

(26)

2.1. A perspectiva inatista

A teoria inatista atual surgiu como reação contrária a teorias como as de Skinner (1957) e Piaget (PIATELLI-PALMARINI, 1983)5_{, que postulavam que mecanismos gerais de indução}

eram suficientes para a criança dominar a gramática complexa de uma língua, sem necessidade de nenhum mecanismo específico ou conhecimento prévio (inato). Noam Chomsky (PIATELLI-PALMARINI, 1983), contra essa posição, levantou o argumento de que seria realmente impossível aprender a fonologia, a sintaxe e a semântica de uma língua natural em tão pouco tempo se não houvesse algum tipo de conhecimento inato e específico, levando em conta que crianças com experiências de vida diferentes adquirem gramáticas fundamentalmente semelhantes a ponto de poderem comunicar-se e compreender outros falantes, enunciando e ouvindo uma quantidade infinita de frases possíveis.

Como se não bastasse a quantidade de regras e características fonéticas, sintáticas e semânticas que cercam uma língua natural, ainda se tem o fato de que o input ao qual a criança é exposta é cheio de erros e contém quantidade insuficiente de dados que deem conta da gramática complexa que ela chega a dominar com poucos anos de vida. Mesmo que a criança preste atenção a todos os enunciados que são realizados ao seu redor durante sua primeira infância (o que seria virtualmente impossível por questões de atenção, memória, capacidade auditiva, etc.), muitas estruturas gramaticais nunca seriam ouvidas ou seriam ouvidas muito poucas vezes para servirem de exemplo para a postulação de regras gramaticais, podendo ser ao invés disso tomadas como erros e ignoradas, ou como exceções a regras já postuladas anteriormente.

Muitos autores (CHOMSKY, 1975; CRAIN & LILLO-MARTIN, 1999; LEGATE & YANG, 2002; entre outros) assumem que, se não houvesse restrições de aprendizado específicas 5 As teorias destes dois autores também possuem certas diferenças entre si: o behaviorista Skinner (op. cit.) postulava que o aprendizado ocorre a partir de um mecanismo simples de estímulo e resposta, e que as crianças podem aprender a falar associando respostas fixas a estímulos específicos através de mecanismos de reforço, que recompensam respostas corretas e punem as incorretas, não havendo a necessidade de qualquer conhecimento inato geneticamente determinado para este processo. Já Piaget (op. cit.), em sua teoria de epistemologia genética, postulava que a criança aprende a língua materna (ou qualquer outra coisa) a partir de suas experiências com o ambiente, através de um conhecimento inato geral (em oposição a específico) que a permite observar relações entre causa e efeito em objetos e eventos. Apesar destas diferenças, ambos os autores são proponentes de teorias não-modularistas de aquisição, e por isso seus trabalhos são considerados bastante semelhantes pela literatura inatista.

(27)

e inatas, não seria possível explicar a complexidade de certas regras sintáticas, que poderiam gerar infinitas hipóteses sobre a gramática de uma determinada língua, algumas absurdas, mas muitas plausíveis. Poderíamos pensar que estas hipóteses erradas são descartadas através de evidência negativa direta, pela correção do adulto. Sabe-se, no entanto, que não só os adultos não corrigem todas as sentenças agramaticais produzidas pelas crianças (preocupando-se mais com o conteúdo das sentenças do que com sua forma, podendo inclusive corrigir uma sentença gramatical (se a criança está mentindo, por exemplo) ou confirmar uma sentença agramatical (se seu conteúdo é verdadeiro, por exemplo)) (PINKER, 1989), como as crianças são insensíveis às correções feitas pelos adultos, muitas vezes insistindo no erro mesmo depois de diversas tentativas de correção pelos pais. Um diálogo de Braine6_{(1971, p. 160-161) com sua filha, em}

que ele tenta corrigir a fala da criança diversas vezes, sem sucesso, serve de ilustração para este último ponto:

1) C.: Want other one spoon, daddy?

P.: You mean you want THE OTHER SPOON C.: Yes, I want the other one spoon please daddy P.: Can you say 'the other spoon'?

C.: Other... one... spoon. (…)7

Neste diálogo, vemos que por mais que o pai tente corrigir a expressão agramatical *“the

other one spoon” dita pela criança, ela parece insistir no “erro”, sem entender qual a sua intenção

com a correção. Primeiramente, vemos que ela pensa que o pai está corrigindo a “polidez” de sua solicitação, e então acrescenta “por favor” (please) ao pedido por *“the other one spoon”. Na segunda tentativa, o pai pede que ela repita a construção correta, “the other spoon”, mas ela parece ou não entender o porquê da repetição, ou não perceber o fato de que a versão do pai não

6 É interessante notar que Braine era um “antiinatista convicto”, nas palavras de Pinker (2004). Ainda assim, segundo Pinker, ele foi o primeiro a notar a falta de evidência negativa para a aquisição.

7 C.: Quero outra uma colher, papai?

P.: Você quer dizer que você quer A OUTRA COLHER. C.: Sim, eu quero a outra uma colher por favor papai. P.: Você consegue falar “a outra colher?”

(28)

contém o one agramatical. O diálogo se estende, e termina sem que o pai tenha conseguido modificar a construção adotada pela filha.

Vemos, então, que a evidência negativa direta não poderia ser usada pelas crianças para descartar hipóteses incorretas sobre a língua, tanto pela falta de correção sistemática dos pais quanto pela insensibilidade das crianças a elas. Mas temos ainda a possibilidade de uso de evidências negativas indiretas: exemplos de sentenças nunca ouvidas no input devem indicar construções impossíveis na língua materna. Nessa hipótese, a filha de Braine poderia aprender que “other one spoon” é agramatical observando que não há nenhuma instância de estruturas como esta no input. Isso, no entanto, também seria improvável, por dois motivos principais: em primeiro lugar, sem uma predisposição inata que impeça a criança de prestar atenção a informações irrelevantes no input, não se poderia saber qual tipo de ausência de informação seria relevante. Como a língua nos permite criar um conjunto infinito de sentenças a partir de um conjunto finito de regras, grande parte das sentenças faladas provavelmente nunca foram produzidas antes, e portanto fica difícil saber qual sentença ainda não apareceu por ser agramatical, ou qual sentença é uma combinação possível mas simplesmente ainda não foi ouvida. Uma criança que nunca ouviu, por exemplo, uma sentença em que “João” segue o verbo “amar”, poderia pensar que “Maria ama João” é agramatical. Em segundo, muitas hipóteses corretas também são muito pouco ou talvez nunca evidenciadas no input ao qual a criança é exposta nos primeiros anos de vida.

Crain & McKee (1986) apresentam um argumento bastante interessante a esse respeito, sobre as possibilidades de correferência entre um sintagma nominal e um pronome dentro de sentenças. Observe as sentenças abaixo, nas quais os índices acompanhando o pronome e o nome indicam correferência quando idênticos (como i,i), e não-correferência quando diferentes (como

i,j):

2) a) Joãoi disse que elei/j canta

b)* Elei disse que Joãoi canta

(29)

Vemos que, enquanto 2a é gramatical na leitura em que o pronome retoma João, 2b é agramatical na mesma leitura, sendo que o pronome só pode retomar outro referente fora da sentença, como em 2c. Essa impossibilidade de correferência entre o pronome e o sintagma nominal em sentenças como 2b (descrita pelo princípio C da teoria de ligação (Chomsky, 1981, revista por autores como Crain & Lillo-Martin, 1999), que postula que uma expressão referencial (expressão-R, tal como “João” ou “o Gato”) deve ser livre, e portanto não pode ser correferente a um pronome que a c-comanda) parece ser acessada facilmente por crianças com menos de três anos de idade (CRAIN & MCKEE, op. cit.). Em um experimento de Julgamento de Valor de Verdade (Truth-value judgement task, TVJT, em inglês), os autores pediam que as crianças julgassem se sentenças ditas por um fantoche eram verdadeiras ou falsas em relação a uma história sendo exibida em vídeo. O fantoche enunciava sentenças como 2b ou 2c, ou seja, em que o pronome em posição inicial ora era correferente ao sintagma nominal, ora se referia a outro personagem (o que era claro para a criança a partir da história exibida). As crianças julgaram sentenças como 2c verdadeiras 81% das vezes, contra apenas 12% de julgamentos favoráveis a 2b.

Observa-se, no entanto, que não há evidências claras no input que demonstrem a impossibilidade de 2b. Para que a evidência negativa indireta sozinha (i.e., sem um conhecimento inato específico) fosse eficaz nessa situação, seria preciso que as crianças compreendessem todos os referentes de todas as sentenças faladas pelos adultos, o que seria extremamente difícil, já que as pessoas não enunciam apenas sentenças que se referem ao momento presente; um adulto pode estar contando à criança algo que aconteceu no dia anterior sem sua presença, por exemplo, de forma que, a princípio, ela não seja capaz de definir o referente dos pronomes falados. Suponhamos, no entanto, que isso seja possível, i.e., que as crianças conheçam todos os referentes pronominais das sentenças proferidas pelos adultos, e cheguem à conclusão de que uma expressão referencial nunca pode ter como correferente um pronome que a antecede pois isso nunca foi ouvido na fala adulta. Se isso ocorresse, a criança teria um problema em mãos, com relação a sentenças como 3:

(30)

Aqui, o pronome está antecedendo “João”, mas a sentença é gramatical na leitura em que “ele” é correferente de “João” pois o pronome não c-comanda o sintagma nominal. Para ficar mais claro, explicarei resumidamente a noção de c-comando: trata-se de uma relação entre um determinado elemento da sentença (representado na estrutura hierárquica por “nós”8_{), seu irmão}

(ou seja, o nó com quem compartilha o nó-mãe) e todos os nós dominados por seu irmão. Observe a estrutura arbórea em 4:

4)

Nesta estrutura, os nós são representados pelas letras A, B, C e X1,2. As relações

“familiares” são bem claras: o nó que se encontra imediatamente acima de outro é seu nó-mãe, dois nós que dividem o mesmo nó-mãe são irmãos, e assim por diante. Vemos, então, que A e X1

são irmãos, pois dividem o mesmo nó-mãe (X2). Temos, então, que A e X1 se c-comandam

mutuamente, e A também c-comanda B e C, pois são nós filhos de seu irmão.

Voltemos às sentenças 2b e 3. Em 2b, “ele” está em uma posição semelhante à de A, enquanto “João” estaria na posição indicada por C9_{. Portanto, “ele” c-comanda “João” (já que A}

c-comanda C), e os dois não podem correferir, como descreve o princípio C10_{. Já no caso de 3,}

“ele” seria filho de A, mas “João” continuaria na posição indicada por C. Como, nesse caso, “ele” não é irmão de X1 (mas sim seu “sobrinho”), e portanto não c-comanda “João”, a correferência

entre esses dois elementos é possível.

8 Para uma explicação mais detalhada sobre as questões sintáticas pertinentes para a compreensão de c-comando, ver Crain & Lillo-Martin (op. cit.)

9 Aqui estamos observando as relações hierárquicas da estrutura sintática de modo bastante esquemático, mas é importante ressaltar que as árvores das sentenças expostas são bem mais complexas do que o desenho exposto no exemplo 4, havendo mais ramificações, como CP e TP, por exemplo. Para mais detalhes, ver trabalhos como os de Chomsky ou Crain & Lillo-Martin (op. cit.).

10 Também é importante ressaltar que, para estruturas de adjunto, as questões referentes à teoria de ligação tornam-se ainda mais complexas (vide autores citados).

(31)

Se não houvesse mecanismos inatos e específicos que indicassem a relação hierárquica entre os elementos nas sentenças, seria perfeitamente plausível que uma criança que nunca tenha ouvido uma sentença como 3 passasse a julgá-la agramatical, levando em conta a hipótese equivocada de que um nome nunca pode correferir com um pronome que o antecede11_{. No}

entanto, Crain & McKee (1986), em um experimento semelhante ao anteriormente citado, também mostraram que crianças antes dos três anos de idade já compreendem a possibilidade de sentenças como 3 e a impossibilidade de sentenças como 2b. Neste experimento, sentenças como “enquanto ele dançava, o Tartaruga Ninja comia pizza” (tradução minha), onde o pronome e o nome podem correferir, eram alternadas com sentenças como “ele estava dançando enquanto o Tartaruga Ninja comia pizza”, onde a correferência não é permitida. A ação encenada mostrava ora o Tartaruga Ninja dançando e comendo pizza enquanto os outros personagens estavam sentados, ora o Tartaruga Ninja comendo pizza enquanto outro personagem dançava. Os resultados mostraram que as crianças aceitavam a correferência entre o nome e o pronome na primeira sentença em cerca de 66,6% das vezes, e não aceitavam a correferência na segunda sentença em cerca de 90% das vezes.

Embora todos os pesquisadores inatistas usem argumentos como os demonstrados acima para comprovar a necessidade de conhecimento inato, não existe unanimidade sobre quantos e quais mecanismos são específicos e inatos, e quais são gerais e/ou adquiridos. A teoria mais tradicional, tal como postulada por Chomsky (1968b, e desenvolvida em 1995), dirá que as crianças nascem com o conhecimento de uma gramática universal (GU) determinada geneticamente, onde se encontram diversos princípios universais que regem todas as línguas naturais, como a existência de relações hierárquicas entre os componentes abstratos dentro das sentenças, ou a capacidade de recursividade (regras gramaticais podem se reaplicar às estruturas resultantes de sua aplicação anterior), e também diversos parâmetros que determinam as possíveis línguas do mundo, como o português, o japonês ou o alemão (BAKER, 2001). Diferenças paramétricas determinam, por exemplo, que a ordem de palavras canônica no português é SVO

11 Ou então que uma criança que já tenha ouvido uma sentença como 3 considere 2b gramatical, levando em conta a hipótese equivocada de que um nome sempre pode correferir com um pronome que o antecede.

(32)

(Sujeito-Verbo-Objeto), e no japonês e alemão, SOV, sendo o alemão ainda uma língua V2 (o verbo finito aparece em segunda posição em sentenças principais).

É importante ressaltar que a GU não deve ser vista como um conjunto de regras sobre como deve ser uma língua natural; ela é, na verdade, um conjunto de restrições que determinam como não deve ser uma língua, ou seja, delimitam o espaço de busca dos parâmetros linguísticos, descartando informações irrelevantes (NEVINS, 2004). Este dispositivo seria responsável pelos

bias que levam as crianças a prestar atenção em certas pistas (cues12_{) da língua materna e não em}

outras, como nas propriedades distribucionais de fonemas, para determinar que sons podem se combinar entre si e em quais partes da sentença (regras fonotáticas), mas não de itens lexicais de classe aberta, não correndo o risco de tomar como hipótese, através da frequência de ocorrência, que a palavra “fralda”, por exemplo, sempre segue o verbo “trocar”.

Além da GU, Chomsky (op. cit.) dirá que as crianças possuem um dispositivo de aquisição de linguagem (em inglês, Language Acquisition Device (LAD)), responsável por facilitar o acesso à GU no período de aquisição (PINKER, 1989). Isso justificaria a existência de um período crítico para a aquisição, após o qual não é possível adquirir uma língua materna da mesma forma que uma criança exposta ao input na época certa (MORIGUCHI ET. AL., 2008).

Esta dissertação tomará como pressuposto básico a teoria inatista delineada em termos gerais acima, levando em conta os argumentos levantados em seu favor. A discussão teórica, empírica e metodológica a ser feita nas próximas seções será guiada por ela, e, quando necessário, serão retomados alguns de seus pontos específicos para discussões e reflexões.

2.1.1. O papel da experiência

Como já visto acima, as línguas diferem quanto ao conjunto de segmentos fônicos que incluem, as sequências em que esses segmentos podem ser arranjados, os mapeamentos de tais sequências em conceitos, as maneiras com que elementos podem ser concatenados em palavras e as possibilidades de combinação de palavras para a formação de frases, cláusulas e sentenças. 12 O termo “cue” é usado por diversos trabalhos sobre bootstrapping para nomear a informação do input que “sinaliza” uma característica semântica, sintática ou fonológica da língua materna, desencadeando sua aquisição (CHRISTOPHE ET. AL., 2008; PINKER, 1989; dentre muitos outros).

(33)

Portanto, independente de quais sejam os princípios e parâmetros inatos, é evidente a necessidade de um input mínimo para a aquisição. Landau & Gleitman (1985) mostraram que a maior parte deste input inicial é composto por informação linguística, ao mostrar que mesmo com experiência limitada, crianças cegas conseguem dominar a língua materna relativamente com a mesma idade de crianças com visão normal. A visão, porta de entrada para a compreensão do contexto e da interação discursiva, considerada seminal para não-inatistas (BLOOM, 1983), parece retardar (mas não prejudicar) apenas o aprendizado dos usos discursivos da língua e o início da fase de nomeação de objetos. Parece, então, que a criança cega não tem problemas em dominar os aspectos linguísticos da língua a que está exposta, mas sim os não-linguísticos, como a aquisição do inventário lexical13_{e o discurso. A experiência do contexto, radicalmente diferente da de uma}

criança com visão normal, influenciará a Língua-E (externa), social, na qual os itens lexicais se encaixam. A Língua-I (interna), formada pelas relações gramaticais abstratas, só terá seu desenvolvimento prejudicado se houver falhas no input puramente linguístico.

Embora alguns autores (DA FONTE, 2013) afirmem que a falta de informação visual é compensada pela exploração através do tato, facilitada pela interação com o adulto, que ajuda a criança a alcançar objetos e definir conceitos do mundo visual, não se pode esperar que todo o processo de aquisição de uma criança cega dependa da interação com um adulto. Nenhum pai ou mãe passa o tempo todo descrevendo o contexto de fala para a criança, e muito menos é capaz de ensinar todos os itens lexicais que a criança mostra compreender em quatro anos de vida. Um exemplo interessante vem da aquisição dos verbos “ver” (see) e “olhar” (look), que embora sejam extremamente ligados ao mundo visual, são produzidos muito cedo pelas crianças estudadas por Landau & Gleitman, que os conceituam como “explorar pela modalidade de percepção principal” (pelo tato para elas, e pela visão para as pessoas com visão normal). Poderíamos pensar que a aquisição destes verbos é facilitada pelo adulto, que sempre tem um objeto próximo quando os usa com a criança, mas isso não é verdade: as autoras registram ocorrências do uso de “ver” e “olhar” em que não havia objetos por perto para serem explorados, ou em que o objeto em 13 Aqui estamos tratando como inventário lexical as sequências de sons particulares que formam os lexemas da língua. Como estes são particulares a cada língua, precisam ser adquiridos um a um pela experiência, embora com o auxílio do conhecimento inato de que sequências de sons mapeiam em conceitos no mundo, de que existem itens lexicais de classe aberta e classe fechada, e que os itens de classe aberta possuem certas propriedades semânticas e referenciais.

(34)

questão não era passível de exploração háptica (pelo tato), como a chuva, uma montanha ou um trem. Certas sentenças como “olha a bagunça que você fez!”, ou “vamos ver se a vovó está em casa?” também são encontradas na fala dirigida à criança cega, e nelas claramente não há nenhum objeto por perto para ser explorado.

Uma experiência bastante interessante feita pelas autoras consistia em pedir que as crianças cegas olhassem para cima ou vissem em cima, com ou sem um objeto presente para exploração háptica. Observou-se que, com o verbo “olhar”, as crianças levantavam as duas mãos para cima, mas com o verbo “ver”, além de levantar as mãos, elas procuravam algo para explorar, mostrando que elas compreendiam as diferenças semânticas sutis entre os dois verbos: “ver” expressa um estado mental, e portanto requer uma exploração minuciosa do objeto, enquanto “olhar” expressa uma ação, e requer apenas apreensão. Não se pode esperar que os adultos dêem conta de explicitar estas pequenas diferenças para as crianças cegas, mas, implicitamente, elas possuem uma fonte bastante confiável: as estruturas sintáticas em que encontramos o verbo “ver” são bastante diferentes das do verbo “olhar”. “Olhar”, por exemplo, pode ser usado no imperativo (“olhe!”), enquanto “ver” soa estranho (? “veja!”)14_{; já “ver”, diferente de “olhar”, pode ser usado}

em perguntas (“viu?” vs. *“olhou?”). Da mesma forma, “olhar” pode vir acompanhado da preposição “para”, como em “olhou para cima”, enquanto “ver”, não (*“viu para cima”)15_.

As observações feitas por Landau & Gleitman (op. cit.) servem para compreendermos melhor o papel da experiência na aquisição por qualquer criança com desenvolvimento cognitivo padrão, seja ela cega ou com visão normal. Não se pode negar a importância do contexto não-linguístico para o desenvolvimento de diversas habilidades cognitivas gerais, muitas delas inclusive necessárias para a comunicação verbal, como o princípio de cooperação (compreensão de que dois interlocutores agem em função do entendimento mútuo) e de atenção conjunta (dois indivíduos focalizam a atenção em um objeto ou conceito em comum através de indicação verbal, gestual ou de direcionamento do olhar)16_{. Mas existe uma separação entre o conhecimento}

necessário para o uso discursivo da língua (Língua-E, como já mencionado) e o conhecimento

sobre a língua (regras gramaticais, inventário fonético, ritmo prosódico, estrutura semântica,

14 See, em inglês, soa completamente agramatical no imperativo: * “see!”. 15 Para mais exemplos, ver Landau & Gleitman (op. cit.).

16 Neste ponto, o trabalho de Da Fonte (op. cit.) mostra-se bastante interessante, pois evidencia que pais de crianças cegas conseguem criar cenas de atenção conjunta com seus filhos através da exploração háptica.

(35)

etc.); como a faculdade da linguagem constitui um módulo à parte de outros módulos cognitivos, seu desenvolvimento independe de motivação externa à própria língua, ou seja, ao sinal de fala.

A experiência necessária para a aquisição da língua materna, portanto, consiste na informação linguística do sinal de fala. Já vimos, no entanto, que o contato com uma língua natural não pode ser suficiente para a aquisição; sem uma predisposição inicial a prestar atenção a certas características específicas da língua e correlacioná-las às informações corretas (como às propriedades distribucionais de fonemas, mas não de itens lexicais), a criança não seria capaz de lidar com a quantidade de hipóteses possíveis de serem levantadas a partir do input, e portanto não poderia adquirir uma língua materna. Por outro lado, se privarmos a criança de experiência linguística, ela também não aprenderá a falar, da mesma forma que não aprenderá a andar se impedida de movimentar-se. O papel da experiência, então, deve ser de desencadeadora dos mecanismos inatos, usados pelas crianças para desvendar as relações abstratas e apreender o léxico que compõe sua língua materna. A pergunta que deve ser feita então é como funcionam, quais são e de que se “alimentam” esses mecanismos. Esse é o papel das teorias de

bootstrapping, a serem descritas a seguir. 2.2. Bootstrapping17

O termo bootstrapping é usado na linguística para denotar o processo de desencadeamento (triggering) dos mecanismos inatos de aquisição através do input linguístico ao qual a criança é exposta. Esse input é teoricamente colocado em termos de pistas (cues), que são as características linguísticas responsáveis por acionar a segmentação da fala em unidades menores, a determinação de parâmetros sintáticos e o mapeamento semântico. O ritmo prosódico, por exemplo, é considerado por alguns autores (JUSCZYK, 1999; CHRISTOPHE ET. AL., 2004; STEEDMAN, 1996) como uma pista para a segmentação da fala. Um experimento de Jusczyk e 17 A metáfora bootstrap (“alça da bota”, em inglês) parece ter surgido nos Estados Unidos no início do século 19, na frase “pull oneself over a fence by one's bootstraps” (“puxar alguém por cima de uma cerca pelas próprias alças da bota”), denotando processos autossustentáveis que não necessitam de auxílio externo para funcionar, como um software que carrega automaticamente sempre que o computador é ligado. Na aquisição de linguagem, a metáfora pretende classificar o input como uma espécie de alavanca que possibilita a criança a pular a “cerca” da língua materna “by her own bootstraps”, ou seja, por conta própria, através de sua capacidade inata geneticamente determinada (eis a ideia de um processo autossustentável).

(36)

colegas (1999; JUSCZYK, HOUSTON & NEWSOME, 1999) mostrou que crianças de apenas 7.5 meses aprendizes do inglês identificam o padrão rítmico predominante da língua (silábico, forte-fraco) como pista para a segmentação da corrente de fala. Ao habituar as crianças a prestar atenção a palavras bissilábicas, o autor observou que elas eram capazes de identificar as palavras com padrão forte-fraco, como kingdom (com a sílaba mais forte marcada em negrito), dentro de sentenças, mas não as com padrão fraco-forte, como guitar, podendo inclusive segmentá-las erroneamente quando seguidas de um item funcional recorrente, hipotetizando, por exemplo, “taris” para uma frase como “the guitar is”. Isso pode significar que crianças de 7.5 meses procuram sempre associar sílabas fortes como “king” em “kingdom” e “tar” em “guitar” como o início (onset) de uma palavra nova, i.e., tomam a sílaba forte como pista para o início de palavras. A afirmação de que o input contém informações relevantes sobre a estrutura da língua materna pode fazer com que os argumentos levantados por teorias de bootstrapping sejam vistos por teorias não-inatistas como provas de que o estímulo não é pobre, e que, portanto, não é necessário haver um conhecimento específico e inato para a aquisição. Essa visão, no entanto, não leva em conta o fato já mencionado de que existem muitas informações diferentes no input, e enquanto algumas são relevantes para desvendar as características de uma língua, muitas, igualmente salientes, são irrelevantes (GUIMARÃES, 2013). Sem um conhecimento específico que oriente a criança a prestar atenção às pistas relevantes para a aquisição linguística, qualquer correlação no input poderia ser válida, como falar alto ao usar sentenças no imperativo, ou inclinar a cabeça para a direita ao fazer uma pergunta com qu- movido.

O que pesa neste argumento a favor do modularismo, então, não é a pobreza do estímulo, mas sim sua superabundância (surfeit of the stimulus, BECKER, KETREZ & NEVINS, 2011). Sem uma orientação a priori sobre onde procurar as informações relevantes, qualquer parte do estímulo é válida, qualquer entidade pode ser tomada como um conceito possível18_{, e, por}

consequência, qualquer hipótese pode ser levantada19_{. O papel da GU, então, é delimitar o espaço}

de busca da criança para apenas aquilo que é (ou pode vir a ser) relevante para a parametrização sintática, segmentação lexical e mapeamento semântico.

18 Ver Fodor (1980) para melhor desenvolvimento deste argumento em favor do inatismo.

19 Isso implica inclusive a possibilidade de que as hipóteses corretas nunca sejam levantadas, a não ser que a criança seja capaz de levantar todas as infinitas hipóteses possíveis ao mesmo tempo, o que também seria absurdo.

(37)

Dentro deste quadro, as teorias de bootstrapping modular propõem demonstrar quais informações do ambiente linguístico ao qual a criança é exposta (Língua-E, basicamente o fluxo de sentenças (utterances) não analisadas que a criança possivelmente chega a ouvir) sinalizam características relevantes que podem ser acessadas através do conhecimento inato e contribuem para o crescimento da Língua-I (i.e., o conhecimento gramatical interno) (LIGHTFOOT, 2010; 2007).

A partir destes argumentos, podemos levantar algumas ideias compartilhadas por todas as teorias a serem mencionadas a seguir (e também, não por acaso, por mim). Em primeiro lugar, o

input linguístico é visto como desencadeador (trigger20_{) dos mecanismos inatos de aquisição, já}

que possui informações sobre as características específicas das línguas. A grande diferença desta visão para outras dentro da teoria de princípios e parâmetros é que, ao invés de se postular que as crianças avaliam gramáticas em competição a partir de conjuntos de sentenças, acredita-se que elas interpretam o input que ouvem através do inventário de estruturas disponibilizadas pela GU, havendo então uma sequência de estruturas no desenvolvimento da Língua-I (LIGHTFOOT (2010, p. 677-678)). Como explicitado acima, a função das teorias de bootstrapping neste quadro é desvendar quais informações do input são relevantes para determinar as características específicas da língua, através de discussões teóricas de dados empíricos.

Em segundo, como também já apontado acima, acreditamos que o papel do conhecimento inato no processo de bootstrapping é delimitar as informações relevantes para a aquisição e determinar que tipo de pista essas informações sinalizam (como fronteiras prosódicas sinalizando a estrutura sintática, posições sintáticas sinalizando o significado semântico, etc.). Sem ele, seria impossível reconhecer as pistas relevantes para o bootstrapping, pois não haveria nada que indicasse, como vimos, que a altura da voz não sinaliza uma propriedade sintática, por exemplo.

Por último, é importante ressaltar que embora a maioria dos autores estudados aqui acredite que existe um único tipo de informação que desencadeia o início da aquisição, como veremos, todos concebem o processo de bootstrapping como presente durante todo o período de aquisição. Isso porque é obviamente impossível acessar todas as pistas necessárias para a 20 Para uma descrição bastante interessante sobre as diferenças do papel do input para diferentes teorias de

(38)

segmentação, parametrização e mapeamento semântico de uma vez, sendo mais provável que o acesso às diferentes informações do input ocorra em períodos distintos da aquisição, tanto por conta da necessidade de desenvolvimento linguístico (a estrutura de sentenças passivas, por exemplo, só pode ser acessada depois da aquisição de estruturas sintáticas mais básicas) quanto por conta da maturação de outros mecanismos cognitivos ou sensoriais, como a visão, audição, memória e atenção. Os autores estudados acreditam que esse argumento é mais bem descrito em termos de uma hierarquia rígida de acesso aos níveis de representação linguística, sendo apenas um nível considerado o responsável pelo início da aquisição, como veremos a seguir.

2.2.1. Teorias de bootstrapping

As teorias de bootstrapping em geral são divididas a partir do tipo de pista considerada basilar para o desencadeamento do início da aquisição: pistas prosódicas, sintáticas ou semânticas. A prosódia parece ser aceita de forma quase unânime pelos autores analisados como a “pedra fundamental” da aquisição, já que o sinal de fala é obviamente de onde vem a informação linguística (MORGAN & DEMUTH, 1996; JUSCZYK ET AL, 1999)21_{. Isso, no}

entanto, não significa que todos aceitem a prosódia como pista mais importante, mas apenas como a inicial, abrindo espaço para o mapeamento semântico e a parametrização sintática.

Exporei aqui três direções teóricas, determinadas de acordo com os tipos de pista considerados basilares em cada uma delas: a teoria de bootstrapping semântico, que afirma que o mapeamento de primitivos semânticos nas sentenças e a rotulação de objetos no mundo ocorrem antes da parametrização sintática, sendo as pistas semânticas as desencadeadoras da aquisição; a teoria de bootstrapping sintático, que postula que as pistas sintáticas, retiradas do input pela fonologia e prosódia, é que desencadeiam o processo de aquisição; e a de bootstrapping prosódico, que coloca maior peso na informação prosódico/fonológica para a aquisição, demonstrando que esta é suficientemente rica para que se possa desvendar os primeiros parâmetros sintáticos, bem como realizar a segmentação das primeiras palavras somente a partir dela.

21 Aqui não estamos ignorando o fato de que a “pedra fundamental” de crianças surdas será uma língua de sinais, e não uma língua oral. No entanto, por questões de simplicidade, trataremos aqui apenas das línguas orais.

(39)

Os autores revisados em geral baseiam-se em evidências empíricas relacionadas à compreensão linguística, e falam pouco sobre produção. Como veremos com mais detalhe na seção sobre compreensão de ordem de palavras, isso se dá por dois motivos principais: primeiramente, porque testes de compreensão podem ser aplicados em crianças desde os primeiros dias de vida, conseguindo demonstrar o conhecimento que precede a produção; e em segundo, porque a partir deles pode-se investigar como crianças processam as informações do

input em tempo real, enquanto experimentos de produção (ou observação de dados de fala

espontânea) apresentam um delay maior entre processamento e resposta (output).

Embora quase todos os autores postulem um modelo hierárquico para o uso de pistas no início da aquisição, veremos que nenhum deles dirá que ela pode proceder apenas a partir da sintaxe, da semântica ou da prosódia. O chamado bootstrapping problem (problema de

bootstrapping, como postulado por Pinker (1989) e discutido por Steedman (1996), Christophe

et. al. (2008) dentre outros) fala justamente sobre isso. Basicamente, a ideia da existência de uma única pista inicial gera circularidades fundamentadas na aparente interdependência entre os níveis de representação linguística para a aquisição, como será exposto de modo mais detalhado nas seções a seguir.

2.2.1.1. Bootstrapping semântico22

A teoria de bootstrapping semântico parece ser menos estudada do que as teorias de

bootstrapping prosódico ou sintático, mas, ainda assim, é possível encontrar três modelos

importantes dentro deste quadro: o de Pinker (1987, 1989, 1994); o de Macnamara (1982); e o de Bloom (1999). A assunção básica por trás deles é de que as crianças são capazes de aprender o significado de algumas palavras independentemente do aprendizado de regras gramaticais específicas, e através da apreensão da estrutura conceitual de alguns verbos (quais e quantos são seus argumentos semânticos), construir uma representação semântica das sentenças com ajuda de 22 Embora apenas a teoria de Pinker (1989) seja de fato nomeada como de bootstrapping semântico, por ser a única que pressupõe que o conhecimento das correspondências entre sintaxe e semântica faz parte do LAD e não do conhecimento linguístico per se (divisão explicitada por Macnamara (1982)), as demais teorias observadas são levadas em conta como alternativas à teoria de Pinker que também envolvem o uso de pistas semânticas (sobre objetos e relações no mundo) para o desencadeamento do processo de aquisição.

(40)

pistas do contexto. A representação sintática surgiria a partir das pistas de representação semântica, e seria usada na aquisição mais à frente em casos em que a ligação entre papéis gramaticais e posições sintáticas não é transparente (como em construções passivas).

Embora todos compartilhem essa hipótese, cada modelo possui uma visão diferente de como o aprendizado semântico alavancaria a aquisição sintática. A teoria de Macnamara (1982) se diferenciará das outras ao postular que as crianças começam com regras de mapeamento de palavras em categorias semânticas como “palavras de objeto” para nomes (nouns), “palavras de atributos de objetos” para adjetivos e “palavras para ações” para verbos, e por conta de inputs que não podem ser mapeados através dessas categorias, como nomes que não nomeiam objetos (p. ex., “amor”) ou verbos que não denotam ações (p. ex., “esperar”), são forçadas a expandi-las, tornando-as mais abstratas até que se tornem verdadeiras categorias linguísticas, como “nome”, “verbo” e “adjetivo”.

Como evidência para a postulação de categorias semânticas como precursoras de categorias sintáticas, tem-se o trabalho de Brown (1958, in.: MACNAMARA, 1982). Examinando o vocabulário de crianças entre quatro e cinco anos, o autor observou que os nomes usados (nouns) se referiam mais a objetos concretos, como pedras e galhos (em oposição a verdade e justiça), e seus verbos se referiam mais a ações, como comer e andar (em oposição a amar e esperar). Adicionalmente, Macnamara (op. cit.) observou que, ao menos até os 21 meses, seu filho conseguia generalizar nomes de objetos a coisas diferentes (como button para tipos diferentes de botões de camisa), bem como vários nomes para a mesma coisa (como John e dad para referir-se ao pai), mas tinha dificuldade em estender um nome de objeto a um verbo, como

comb, que significa tanto “escova” quanto “escovar”. Para Macnamara, isso mostra que a criança

tinha dificuldade em ultrapassar a barreira semântica que colocava objetos em uma classe de palavras diferente de ações.

Essa assunção, no entanto, é criticada pelos demais autores por contrariar a ideia de que o conhecimento de categorias sintáticas como nome, verbo e complementizador é inato (devemos nos lembrar de que estamos trabalhando aqui com teorias inatistas). Bloom (1999), por exemplo, dirá que até mesmo crianças pequenas possuem noções semânticas abstratas de indivíduos que mapeiam em NPs. Embora boa parte do vocabulário infantil denote nomes que nomeiam objetos e verbos que nomeiam ações, até mesmo crianças de um e dois anos conhecem palavras que