• Nenhum resultado encontrado

CAPÍTULO 2. METODOLOGIA DE PESQUISA

2.3. PROCEDIMENTOS DE COLETA DOS DADOS

2.3.3. CREA – Corpus de Referencia del Español Actual

O CREA incorpora mais de cento e sessenta milhões de formas produzidas em todos os países de fala hispânica, desde 1975.

Desse total, quase trinta e dois milhões correspondem ao período de 2000-04. 50% dos registros são da Espanha, enquanto os outros 50%, de países hispano-americanos: México, Argentina, Chile, Peru, Colômbia, Cuba, Venezuela, Porto Rico, entre outros. O material escrito coletado pertence às áreas de ficção, lazer, ciências sociais, atualidades, comércio e finanças, artes, ciência e tecnologia e saúde. Há, também, produções orais.

Decidiu-se por esse corpus de referência, considerando que é o mais completo do mundo hispânico, uma coleção de textos na qual está representado o espanhol dos últimos vinte e cinco anos de todas as regiões hispânicas, incluindo-se Estados Unidos e Filipinas. Outro aspecto importante para sua adoção é que se trata de um corpus gratuito, está disponível on-line (www.rae.es), e que apresenta uma quantidade significativa de concordâncias (aproximadamente oitocentas) para cada palavra.

Esse corpus permitiu-nos fazer uma comparação com os corpora de estudo, para responder às quatro perguntas da pesquisa, e foi a fonte da qual extraímos as linhas de concordância para a elaboração das atividades propostas aos informantes antes da elaboração da segunda redação.

O CREA pode ser classificado da seguinte maneira: - Modo: texto escrito e falado;

- Tempo: sincrônico, correspondente a um período de tempo (atual); - Seleção: monitor, sendo, desse modo, dinâmico;

- Conteúdo: os textos provêm de diferentes variedades sociolinguísticas específicas;

- Autoria: são vários os autores. Os textos escritos são procedentes tanto de livros quanto de jornais e revistas; e a fala oral está representada por transcrições de documentos sonoros, procedentes de transmissões radiofônicas e televisivas.

- Finalidade: de referência, ou seja, usado para fins de contraste com o corpus de estudo.

O CREA foi o corpus utilizado para se obterem as linhas de concordância que foram analisadas com vistas à definição de padrões e seus significados, que serviram de apoio para a criação de atividades.

Como já mencionamos, o CREA reúne mais de cento e sessenta milhões de formas coletadas em todos os países de fala hispânica, desde

1975. Dessas formas, quase trinta e dois milhões correspondem ao último período (2000-04). Nesse bloco, constam textos de grande interesse, por serem eles considerados um fenômeno de comunicação na Internet.

Nos QUADROS 2, 3, 4 e 5, apresentamos, a título de resumo, as características do corpus de referência CREA.

QUADRO 2: Composição do CREA.

Corpus Formas

CREA 163.279.050

Fonte: Elaborado pela autora (2013).

QUADRO 3: CREA. Origem das palavras.

Origem Porcentagem

Espanha 50%

Hispano América 50%

Fonte: Elaborado pela autora (2013).

QUADRO 4: Composição do CREA. Zonas linguísticas da América.

Zonas linguísticas da América Porcentagem

Andina 24% Caribenha 14% Central 4% Chilena 10% Mexicana 24% Rio-platense 24%

Fonte: Elaborado pela autora (2013).

QUADRO 5: Composição do CREA. Tipos de textos coletados.

Meio Porcentagem LÍNGUA ESCRITA 90% Livros 49% Imprensa 49% Miscelânea 2% LÍNGUA ORAL 10%

Incluíram-se, nos QUADROS 6, 7 e 8, a seguir, os números que permitem visualizar a estrutura do CREA, que privilegia tanto o espanhol da Espanha quanto o da América. Esse corpus, portanto, pode ser considerado válido, representando o espanhol em uso.

QUADRO 6: Composição do CREA. Critérios cronológicos.

Distribuição temporal dos textos do CREA 1975-1979 1980-1984 1985-1989 1990-1994 1995-1999 2000-2008

Fonte: Elaborado pela autora (2013).

QUADRO 7: Composição do CREA. Temas.

Distribuição dos textos do CREA por grandes áreas temáticas (porcentagens sobre o total)

1. Ciência e Tecnologia 10% 2. Ciências sociais, crenças,

pensamento 14%

3. Política e Economia 14%

4. Artes 10%

5. Lazer e vida cotidiana 10%

6. Saúde 10%

7. Ficção 22%

8. Radiofônico e televisivo 10% Fonte: Elaborado pela autora (2013).

QUADRO 8. Composição do CREA. Critérios geográficos. Porcentagem de formas no CREA Países ou zonas Espanha 50 % Espanha

Zona mexicana 20 % México, Sudoeste dos Estados Unidos, Guatemala, Honduras, El Salvador

Zona central 1,5 % Nicarágua e Costa Rica

Zona caribenha 8,5 % Cuba, Porto Rico, Panamá, República Dominicana, Costas de Venezuela e Colômbia e Nordeste dos Estados Unidos

Zona andina 10 % Restos de Venezuela e Colômbia,

Equador, Peru e Bolívia

Zona chilena 3 % Chile

Zona rio-platense 7 % Argentina, Paraguai e Uruguai

Fonte: Elaborado pela autora (2013).

É importante conhecer a composição do CREA no momento de interpretar os dados, principalmente os de frequência. Se uma palavra, por exemplo, é distribuída uniformemente durante o período coberto, aparecerá, entre 1995 e 1999, com o triplo de casos em relação ao período compreendido entre 1975 e 1979.

Do ponto de vista interno, o CREA está estruturado em diferentes módulos, o que permite que as consultas abranjam a totalidade dos textos ou unicamente aqueles de uma área geográfica específica, de uma ou mais variedades temáticas ou de uns anos em concreto.

O uso do CREA na Internet é bastante fácil. Podemos utilizá-lo a partir de qualquer computador, basta que estejamos conectados. Para utilizá-lo, deve-se acessar a página web da Real Academia (www.rae.es) e clicar em Consulta Banco de Dados. Nessa seção, pode-se escolher o corpus que se quer utilizar. Aparecerá uma interface, como a que está reproduzida na FIGURA 2.

FIGURA 2. Interface de consulta do CREA.

Fonte: Real Academia Espanhola (www.rae.es). Acesso em 05 de jan. de 2013.

As consultas de um corpus por meio das ferramentas que a Informática nos põe à disposição, em muitas ocasiões, resultam em concordâncias. Concordâncias são, como se pode observar nas Figuras 1 e 3, uma lista das aparições de determinada palavra ou de um determinado grupo de palavras em um corpus (ou em parte) que abarca a palavra de que faz parte o contexto, a referência à obra em que se encontra, bem como data, país de origem, etc. Dito de outro modo, um corpus não apenas se limita a mostrar que algo é utilizado, como também nos indica boa parte de suas circunstâncias de uso. Evidentemente, as concordâncias são geradas pelo computador, ainda que elas sejam anteriores à era da informática.

Com o paciente esforço de dezenas de freiras, já haviam sido, durante a Idade Média, elaboradas concordâncias sobre a Bíblia (CÓRDOBA RODRÍGUEZ, 2001).

Os corpora e as concordâncias podem ter múltiplas aplicações. Uma das mais simples é saber se uma palavra realmente é utilizada, ou seja, se ela existe. Talvez se possa pensar que é mais fácil pesquisá-la no dicionário. Não

podemos esquecer, contudo, que os dicionários nos fornecem uma informação muito parcial, se comparada à que podemos extrair de um corpus.

Por outro lado, a informação de um corpus bem elaborado é muito mais confiável que a de alguns dicionários.

De fato, um dos usos mais comuns dos corpora é comprovar o acerto ou não dos dicionários em suas definições, suas traduções, observações de uso, etc. (CÓRDOBA RODRÍGUEZ, 2001).

Assim sendo, um corpus é útil para que verifiquemos se realmente uma palavra é utilizada e em que condições. O termo coloquial “estudianta(s)”, extraído do CREA, é habitualmente utilizado por pessoas que disputam um jogo com a língua. Nesse vocábulo, fez-se o feminino em –a e não em –e, como consta na regra específica. Trata-se, muitas vezes, de uma incorreção proposital, praticada pelas pessoas que querem conferir um tom mais humorístico ao se referir a uma estudante.

O resultado está na FIGURA 3: o termo “estudiantas” aparece em oito ocasiões, em duas conversações (marcadas como orais) e em quatro textos escritos (de forma natural, apenas em três, porque o número 6 é um uso metalinguístico, que visa a questionar a palavra: “o uso de “estudianta” como feminino é mais que discutível). Das sete ocorrências restantes, duas são de usos literários (7 e 8), duas de usos orais informais (4 e 5) e três aparecem na reprodução de uma única carta de Pedro Salinas.

FIGURA 3: Concordâncias de “estudianta” e “estudiantas” no CREA.

Fonte: Real Academia Espanhola (www.rae.es). Acesso em 05 de jan. de 2013.

1 a en el gran salón de una de las residencias. Las estudiantas de italiano representaban una piececita 2 o bien. Encendí mis velas, y al poco vinieron las estudiantas. Se paran delante de cada casa y cantan 3 ntas señoras viejas arriba, festejadas por tantas estudiantas jóvenes abajo. Por lo demás el cuadro 4 o ya muchas personas, muchos de los estudiantes y estudiantas manejábamos nuestros carritos. Pero, 5 dado porque en las vacaciones, lo mismo que a las estudiantas, se le olvida la mitad de las cosas a 6 es feministas norteamericanos. Aun así, el uso de estudianta como femenino es más que discutible, por 7 dos muchachas de facciones tan eslavas, sin duda estudiantas de Moscú? Me acerco: hablan entre sí un 8 ole, tío bruto! El Gordo causó problemas con tres estudiantas de tercero de Letras, el primer año, el

O resultado da consulta às palavras “estudiante” e “estudiantes” chega a 9.790 ocorrências. O surgimento de apenas oito formas de “estudianta” nos permite postular que seu uso não deve ser considerado comum em espanhol.

Um corpus ajuda-nos também a reconhecer os aumentativos, diminutivos (que não aparecem nos dicionários), estrangeirismos, substantivos derivados de verbos, a comprovar se os vocábulos que os dicionários apresentam são ou não de uso frequente.

Os corpora também representam uma fonte de ideias e materiais para o professor de língua. Propõe-se, inclusive, que as concordâncias sejam utilizadas em sala de aula e que os estudantes de língua trabalhem com elas, já que é muito apropriado que eles descubram, por si sós, como elas funcionam. É necessário, todavia, que aprendam, em primeira instância, a trabalhar com as concordâncias.

São muitas as possibilidades de um corpus. Muitos programas de processamento de corpus podem gerar algum tipo de estatística sobre os vocábulos, contando, inclusive, com um sistema automático de busca de colocações (por exemplo, WordSmith Tools, SCOTT, 1997).