• Nenhum resultado encontrado

A Linguística de Corpus

No documento Universidade do Estado do Rio de Janeiro (páginas 114-200)

Por Linguística de Corpus entende-se

um conjunto de dados linguísticos, sistematizados segundo determinados critérios, suficientemente extensos em amplitude e profundidade, de maneira que sejam representativos da totalidade do uso linguístico ou de algum de seus âmbitos, dispostos de tal modo que possam ser processados por computador, com a finalidade de propiciar resultados vários e úteis para a descrição e análise (BERBER SARDINHA, 2004).

Assinalo, no texto acima transcrito, algumas questões que precisam ser consideradas quando se tem como intenção transportar estratégias de pesquisa para a análise de novos objetos inseridos em campos do conhecimento para os quais não foram pensados. Nesse sentido, ressaltei com grifos algumas dessas questões, ratificando a impossibilidade de uma transposição ponto-a-ponto da Linguística de Corpus para análises que se orientam pela Teoria do Discurso.

A primeira questão que destaco é o entendimento, compartilhado com Berber Sardinha (2004), de que a Linguística de Corpus não pode prescindir da análise ou de um trabalho

“feito à mão”, como, na mesma obra, o autor se expressa. Os processos investigativos são absolutamente dependentes do processo de análise realizado pelo pesquisador, mesmo que neles sejam utilizadas ferramentas de natureza digital. Essa análise tem, entretanto, no programa Wordsmith Tools, pensando segundo princípios que norteiam a Linguística de Corpus, ferramenta adequada. Situação que não descarta, depois do tratamento digital das informações, a necessidade de descrição e análise, como aponta o texto que abre este capítulo.

A redefinição do projeto de pesquisa a partir das mudanças que efetuei no trajeto teórico-metodológico posiciona o foco no processo de significação de unidades lexicais para, com base na lógica do significante – apresentada na seção anterior –, analisar os processos de condensação e deslocamento que permitem eleger significantes universalizados (significantes vazios/pontos nodais) e a flutuação de seus sentidos (significantes flutuantes). Interessa-me

identificar, no corpo textual empírico, (a) a variação de sentidos que adquirem determinados significantes; (b) que significante assume a função de ponto nodal; e (c) as metáforas que tomam a função de condensar os sentidos e que permitem a hegemonização de projetos curriculares.

Considerando a potência do programa Wordsmith Tools 5 para a análise do que proponho nesta tese, detenho-me na questão que vem preocupando os pesquisadores que se utilizam da Linguística de Corpus, no sentido de definir o status desse campo do conhecimento. A pergunta que traduz essa questão está expressa nos seguintes termos: a Linguística de Corpus é um campo específico do conhecimento ou apenas uma metodologia?

Tendo a aceitar a ideia de que colocar a possibilidade de diálogo entre a Teoria do Discurso e a Linguística de Corpus, conferindo a essa última o caráter de um dispositivo exclusivamente de natureza metodológica, não resolve a questão. O caráter absolutamente interconectado entre teoria e método, expresso no conceito de postura epistêmica (De Alba, 2007) “põe em suspeita” essa possibilidade de resposta. Em segundo lugar, retomando a definição que abre este capítulo, há, na transcrição, referência a um modo de organizar os dados linguísticos a serem analisados pelos diferentes programas que servem à Linguística de Corpus e esses modos de organizar não estão referidos apenas a uma adaptação da forma como os dados são preparados para a entrada no computador. Esses modos pressupõem uma determinada concepção de linguagem. Então, com a intenção de compreender a concepção de linguagem que serve de norte à Linguística de Corpus, nas subseções a seguir, trato do que, em cada uma delas, se configura dificuldade no sentido de estabelecer o diálogo da Teoria do Discurso com a Linguística de Corpus, ressaltando, também, positividades desse diálogo.

4.1.1 Análise de Conteúdo, Análise de Discurso e Teoria do Discurso: aproximações e afastamentos

Ao adotar a análise discursiva, estou me situando em um campo de análise designado como Teoria do Discurso, que, como modelo analítico, tensiona o que se designa por Análise de Conteúdo e por Análise de Discurso47. A Análise do Conteúdo (AC), fundada sob

47 Na discussão sobre os afastamentos e aproximações entre AC, AD e TD, utilizo os textos que foram produzidos no Grupo de Pesquisa Políticas de Currículo e Cultura, destacando, sobretudo, parte daqueles que foram elaborados por Oliveira, A. e Costa, Hugo H.C. Nessa seção, ainda, incorporo fragmentos da discussão travada pelo grupo de pesquisa coordenado, na Universidade do Porto, pela Profa. Dra. Carlinda Leite quando do meu estágio de doutoramento em Portugal, financiado pela

perspectivas positivistas, compreende o texto como uma estratégia de encobrimento de uma suposta significação mais profunda e seu papel é desenvolver uma técnica precisa capaz de descortinar o “verdadeiro significado” contido no texto. Nesse sentido, investiga a linguagem para revelar a realidade que a antecede, pressupondo um rigor científico capaz de transpassar o aparente e o superficial da linguagem e atingir os planos ideológicos e subjetivos que contaminam essa realidade. A concepção de neutralidade na investigação, corrigida por percursos teórico-metodológicos cientificamente estabelecidos, e a concepção de que a linguagem representa de forma única e inequívoca uma realidade dada a priori são traços marcantes dessa perspectiva de análise48.

Diferentemente, a Análise do Discurso (AD) apresenta-se como alternativa para essa concepção, corrigindo alguns de seus pressupostos. Na AD se reconhecem as implicações do envolvimento do pesquisador no desenvolvimento de suas atividades; se entende a dimensão articulada entre linguagem e sociedade, entremeada pelo contexto ideológico; se tensiona a concepção de texto como elemento revelador do contexto e de uma verdade absoluta. Para a AD, não há nos textos, ou nos significantes, um significado único e inequívoco. A linguagem se estabelece segundo formas de interação situadas historicamente e o que se escreve ou se fala se constitui como lugar de embates, tendo o discurso como limitador dessa tensão.

Intercambiando, por vezes, com a AD, sua designação49; aproximando-se no que se refere à noção de textualidade, para além do escrito e do falado; e interrogando-se em relação a uma possível transparência da linguagem através do conceito de discurso, Análise e Teoria do Discurso, por vezes, não estabelecem entre si limites muito categóricos. Entretanto, alguns afastamentos entre as duas concepções podem ser apontados.

A TD produz um deslocamento no lugar e peso da linguagem, inscrevendo-a numa problemática de implicação política, tensionando a concepção, presente na AD, de não fazer intervir hipóteses sobre como se constituem o social e os sujeitos, ou de explicar o social a partir do discurso. Na TD, a definição de discurso não se restringe ao campo da Linguística e é entendido como uma estrutura relacional que pode ser aplicado a qualquer objeto possível.

Para seus teóricos, discurso é uma estrutura de relações entre significante e significado, entre

Capes. Nesse grupo de pesquisa, os aportes teórico-metodológicos utilizados inscrevem-se no que, aqui, designo Análise de Discurso.

48 Surgida nos anos finais da década de 1960, a Análise de Conteúdo sofreu forte influência de Roman Jakobsen, considerado um dos membros mais célebres da escola crítica designada como Formalismo Russo, estabelecendo as bases para uma abordagem estruturalista da teoria literária. Os formalistas russos defendem um método “científico” para estudar a linguagem e concordam sobre a natureza autônoma dela, pressupostos que são compartilhados com a AC.

49 É comum encontrarmos autores que, compartilhando traços da Teoria do Discurso (TD), se situem como analistas do discurso (Burity, 2007).

linguagem e ação, entre elementos de diferentes outros discursos, tornando inócuas as distinções entre linguístico e extralinguístico e entre discursivo e não discursivo.

Defendendo a impossibilidade de um sujeito definido fora do campo discursivo e a incompletude da estrutura, a TD tensiona, primeiro, a redução do real ao pensamento, e, segundo, a ideia de sujeito uno que orienta reapresentações que faz do real, defendendo a existência de uma gramática na qual sujeitos e objetos são constituídos. Em analogia com a linguagem, na qual a gramática é entendida como um conjunto de regras que estabelece limites ao uso da língua, mas que não se aplicam a todas as línguas e nem sequer são aplicadas a uma mesma língua; na compreensão das relações sociais, essa gramática subjaz às formas de intervenção significativa, que se dão, não no campo do real, mas no campo simbólico – terreno do equívoco, da ambiguidade e da polissemia. Nesse sentido, cabe ao analista da Teoria do Discurso a compreensão dessa gramática, aceitando seu caráter provisório e contingente. Assim como na gramática da linguagem, que não é a mesma para todas as línguas, a gramática do social também não é a mesma para todos os objetos sociais.

Se, nos estudos do campo da Linguagem se pode delimitar, como subcampo, a Linguística de viés estruturalista, que tem como objetivo a compreensão de regras únicas para todas as línguas existentes, o mesmo não é possível para os objetos analisados no campo das Ciências Sociais, na perspectiva da Teoria do Discurso. Se, na TD se pode defender a existência de uma gramática, a impossibilidade dessa analogia com a linguagem no estabelecimento de uma Linguística do Social, isto é, de regras únicas para os objetos sociais se mostra pouco potente. Os argumentos para essa impossibilidade se encontram, portanto, na concepção da incompletude da estrutura, no sentido de uma unidade que lhe confira fechamento total. Esse é sempre, parcial, contingente e provisório, e é nessa concepção que se apoiam as críticas dirigidas à Análise do Discurso.

Mas, em que essas diferenças assinaladas entre as três abordagens teórico- metodológicas – AC, AD e TD – se conectam à Linguística de Corpus? O que isso tem a ver com os grifos assinalados na transcrição inicial deste capítulo?

Uma resposta possível é que tendo a classificar a Linguística de Corpus – mesmo correndo os riscos inerentes a qualquer ato classificatório, uma vez que as teorias compartilham sentidos entre si e constituem-se em teorias sempre hibridizadas – como uma estratégia de pesquisa que se insere no campo da Análise de Discurso. As marcas de empirismo, de realismo, de escolhas de natureza racionais e a concepção, como na transcrição inicial, de que seja possível representar a totalidade dos usos linguísticos são argumentos de que lanço mão para justificar essa inserção da Linguística de Corpus no campo da Análise do

Discurso50. São essas marcas que precisam ser ajustadas quando pensamos na reinterpretação da Linguística de Corpus para as análises na perspectiva da Teoria do Discurso.

Uma das afirmações básicas da Teoria do Discurso é que a totalidade não é um fundamento, mas um horizonte, no sentido do seu adiamento constante quando dele nos aproximamos. A totalidade perseguida pela Linguística de Corpus é, portanto, inalcançável na perspectiva da análise discursiva. A concepção de que se possa reunir um “conjunto de dados, suficientemente extensos em amplitude e profundidade, de maneira que sejam representativos da totalidade” (BERBER SARDINHA, 2004), não se constitui em exigência para os teóricos do discurso. Para esses, inspirados pela Psicanálise lacaniana, a totalidade de representação é impossível de ser atingida, como de igual modo não há uma realidade absoluta a todos os sujeitos. A realidade, ou o que é nomeado pela linguagem, é uma trama entre simbólico – que tem relação entre o sujeito que fala/escreve e o Outro – e imaginário – que sequer tem a mediação da palavra, constituindo-se em um campo de defesa e de resistência, em um campo do sujeito sem o Outro. Assim, os teóricos do discurso podem compartilhar com a Linguística de Corpus a ideia da linguagem como a estrutura que constitui a realidade, ou, em outras palavras, a ideia de que o que não puder ser dito na linguagem de um grupo social (ou subgrupo) não é parte da realidade desse grupo. Mas, apenas isso. A totalidade de representação, com os argumentos que anteriormente apresentei, é impossível de ser alcançada à medida que o real (e não me refiro aqui à ideia de realidade) se insere nessa estrutura (na linguagem), procurando dar existência ao que não existe. Buscando sempre uma linguagem que, quando constituída – na trama entre simbólico e imaginário –, não é mais do campo do real. Este permanece, “fazendo buraco”, procurando se fazer representar, mas sem alcançar a totalidade defendida pela Linguística de Corpus.

No que se refere à relação que se estabelece entre a Teoria do Discurso e a Linguística de Corpus, tendo a aceitar, então, a ideia de que suas interconexões não são estáveis e necessariamente não compartilham um mesmo conjunto de concepções sobre discurso, linguagem e política. Fica, então, mais uma pergunta para fechar esta seção: quais são, então, as possibilidades de diálogo entre elas?

Defendo que a compreensão dos processos de hegemonização nas políticas curriculares – objeto desta pesquisa – é possível, com restrições, a partir de aportes teórico-

50 Essa classificação se justifica pela hegemonia do estruturalismo à época da criação da Linguística de Corpus. Na esteira dos estudos de Ferdinand Saussure e Roman Jakobson, as bases teóricas desse movimento no campo da Linguística se assentam, dentre outras, nas concepções de totalidade, de transformação e de auto-regulação. Entretanto, desde o início dos anos de 1960 e 1970, uma gama de teorias questionam as bases teóricas do estruturalismo, dirigindo-lhe críticas, sobretudo, as ideias de verdade, de empirismo, de transparência da linguagem. Influenciadas, por Derrida, ressaltam o não fechamento da estrutura linguística

metodológicos que foram inicialmente delimitados para um domínio restrito – no caso da Linguística de Corpus, o comportamento linguístico de textos escritos /ou falados. No caso desta pesquisa que tem como objeto as políticas curriculares analisadas na perspectiva de currículo como texto e que defende a centralidade da lógica do significante, como unidade do simbólico, a interconexão entre uma e outra se estabelece a partir de ponto comum entre ambas: a importância da linguagem, criando coisas (tornando-as parte da realidade humana) que não tinham existência antes de serem cifradas, simbolizadas ou verbalizadas (FINK, 1998, p. 44). Entretanto, a despeito das dificuldades em relação à concepção, presente na Linguística de Corpus e no programa WS, de linguagem dotada de uma transparência que o tratamento probabilístico seja capaz de revelar, o uso desse programa se mostra potente por oferecer vantagens com relação à entrada, o gerenciamento e a saída das informações textuais que servem de material empírico a esta pesquisa.

4.1.2 Linguística de Corpus: reinterpretações na perspectiva da Teoria do Discurso

Em trabalho anterior (OLIVEIRA, 2011a), utilizei o Access e o Excel como ferramentas para organizar os textos. Embora facilitando a armazenagem e melhor organização das informações, tais ferramentas não se prestavam para analisar os textos curriculares: com elas o pesquisador continuava dependente de um trabalho de caráter fortemente artesanal.

O uso do computador para análise da linguagem é ainda pouco difundido e o marco de sua utilização é recente – aproximadamente há 48 anos, quando foi iniciada a coleta do Corpus Brown. Essa escassez do uso de computadores no campo se deve, dentre outras justificativas, a uma tensão entre duas concepções nele presentes no momento em que se iniciava a compilação desse primeiro corpus digital. A partir dos anos de 1950 e na esteira de Noam Chomsky, autores do campo da Linguística passam a defender a concepção de competência linguística, isto é, a concepção de que a língua é um conjunto infinito de frases que se pode criar a partir da interiorização das regras da língua e decorrentes da capacidade inata que o indivíduo tem de produzir, de compreender e de reconhecer a estrutura de todas as frases de sua língua, colocando, dessa forma, em xeque a necessidade de análise de dados empíricos nas pesquisas da linguagem (BERBER SARDINHA, 2000). Chomsky (2006), por meio da Linguística Gerativa, operou, então, uma mudança no enfoque dos estudos

linguísticos que “passam da análise exaustiva dos corpora [que naquele momento buscava ampliar seu campo de ação], realizada no âmbito das correntes estruturalistas, para a modelagem dos processos cognitivos subjacentes ao conhecimento da linguagem” (MAIA, 2012), fazendo diminuir os avanços que estavam, naquele momento, operando-se em relação à Linguística de Corpus.

Nos anos de 1990, entretanto, o aumento crescente de computadores nas pesquisas de diferentes campos do conhecimento, as críticas que se dirigem à Linguística Gerativa51, inaugurada por Chomsky, bem como a “existência de programas flexíveis e fáceis de usar”

(BERBER SARDINHA, 1999, p.2) colocam à disposição de pesquisadores “uma série de recursos, extremamente úteis e poderosos na análise de vários aspectos da linguagem”. Esses fatores, dentre outros, são responsáveis pelos avanços do campo da Linguística de Corpus e, consequentemente, do emprego das tecnologias informatizadas que lhe servem de apoio, dentre as quais o programa Wordsmith Tools (WS)52 se destaca. Com esse programa, anunciam-se algumas vantagens: contar significantes; identificar as ocorrências desses significantes nos textos, possibilitando a ampliação do quantitativo de textos estudados;

analisar a composição lexical que permite realçar um conjunto de significantes cuja formação parte de um radical comum; e identificar metáforas a partir da aplicação de padrões linguísticos de associação. Deu-se, assim, a aproximação com o programa Wordsmith53.

Na seção anterior, indiquei algumas questões que precisam ser ajustadas na transposição dos aportes teórico-metodológicos da Linguística de Corpus e de um de seus instrumentais – o Programa Wordsmith Tools 5 – para o trabalho de investigação que defende a Teoria do Discurso como modelo de análise. Argumentei que a Linguística de Corpus se insere no campo do que se vem chamando Análise do Discurso (AD), indicando suas marcas de empirismo, de realismo, de escolhas de natureza racionais e a concepção de que seja possível representar a totalidade dos usos linguísticos. Indiquei, também, que eram essas marcas que precisavam ser superadas para atender a pressupostos de análises com base na Teoria do Discurso (TD). Ressaltei, por fim, que, na perspectiva dessa última, a linguagem se

51 A ênfase na descrição das regras que permitem a todo o falante produzir enunciados gramaticais (competência linguística).

Essa descrição é possível a partir do emprego de métodos que possibilitam, pelo seu rigor, inferir quase mecanicamente a gramática de uma língua. A ênfase na descrição das regras que permitem a todo o falante produzir enunciados gramaticais (competência linguística). Essa descrição é possível a partir do emprego de métodos que possibilitam, pelo seu rigor, inferi r quase mecanicamente a gramática de uma língua.

52 Usei a versão 5.

53 Foram essas possibilidades que abriram caminho para a conversa que passamos a travar com a Linguística de Corpus, sobretudo nas aulas com a Profa. Dra. Tania Shepherd, do Departamento de Linguística Aplicada da Universidade do Estado do Rio de Janeiro.

inscreve numa problemática de implicação política, tensionando as concepções, presentes na AD, de não fazer intervir hipóteses sobre como se constituem o social e os sujeitos, e da impossibilidade de explicar o social a partir do discurso. Nesse sentido, caberia ao analista da Teoria do Discurso a compreensão de uma gramática do social, desde que assentada no seu caráter provisório e contingente e na sua impossibilidade de universalização para todos os objetos sociais.

Defendendo que, na TD, discurso não se restringe ao campo da Linguística, podendo ser entendido como uma estrutura relacional estendida a qualquer objeto possível, tensionei concepções presentes na Linguística de Corpus, face ao caráter de incompletude do que se designa discurso; à concepção de um sujeito capaz de determinar as representações da realidade; à impossibilidade de se alcançar uma totalidade de representação bem como face à impossibilidade de se encontrar intocada nos textos uma realidade absoluta a todos os sujeitos. Mas, concordando com a Linguística de Corpus, defendo, por outro lado, a ideia, presente em ambas, de linguagem como estrutura que constitui a realidade. Nesse sentido, se mostra produtivo aproveitar a análise textual em seus aspectos denotativos, privilegiada no uso do WS, buscando, na perspectiva da Teoria do Discurso, analisá-la em seus aspectos de conotação.

Atenta a essas questões, apresento, nas subseções a seguir, a forma como organizei o material empírico da pesquisa e a descrição do uso que fiz das ferramentas disponibilizadas no programa Wordsmith 5, um dos mais difundidos no campo da Linguística de Corpus.

4.1.3 A constituição do corpus de análise

Para a Linguística de Corpus, a seleção de material para a pesquisa precisa atender a algumas características que podem variar, entretanto, de autor para autor. Algumas delas, no entanto, são comuns: (a) ser representativo da totalidade do uso linguístico ou de algum de seus âmbitos (BERBER SARDINHA, 2004); (b) ser extenso para dar conta da perspectiva probabilística de análise da linguagem; (c) ser formatado digitalmente; e (d) possibilitar a constituição de se tornar referência padrão em outras análises. Visto que alguns dos pressupostos da Linguística de Corpus estão aqui modificados em função da sua tradução pela Teoria do Discurso, o material empírico selecionado para esta investigação não atende ao critério de ser representativo de uma totalidade pelos argumentos apresentados em relação à

No documento Universidade do Estado do Rio de Janeiro (páginas 114-200)