• Nenhum resultado encontrado

CAPÍTULO 3 – METODOLOGIA PARA ELABORAÇÃO DE UMA PROPOSTA DE

3.1. Metodologia

3.1.4. Metodologia para recolha e tratamento do corpus para suporte da análise

Como a elaboração de um dicionário de verbos faz parte deste estudo, a coleta de dados visa identificar quais são os verbos que ocorrem nos contextos selecionados. Optamos, na primeira fase, por coletar dados de textos escritos e, depois de identificados, os verbos passaram a ser analisados em outras fontes, como internet e canais televisivos, para percepção dos diferentes modos de uso.

Para compor o corpus inicial, recolhemos dados selecionados de revistas e jornais, de grande circulação no Brasil, que exercem influência nacional e que estão disponíveis em versões eletrônicas, com verbos selecionados de acordo com os temas. Enquadram-se nesses critérios as revistas da Editora Globo e da Editora Abril e jornal Folha de São Paulo, como apresentamos a seguir:

1) Alimentação: Revista Veja Comer & Beber. Editora Abril. Disponível em: http://vejabrasil.abril.com.br/portal;

2) Atividades comerciais (compra e venda): Revista Exame. Editora Abril. Disponível em: http://www.folha.uol.com.br;

3) Atividades domésticas: Revista Vida simples. Editora Abril. Disponível em: http://vidasimples.abril.com.br;

4) Clima e tempo: Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br;

5) Crime e violência: Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br; Jornal o Globo disponível em : G1.globo. com; 6) Educação: Revista Nova Escola. Editora Abril. Disponível em: http://revistaescola.abril.com.br;

7) Esportes: Site do Globo Esporte. Disponível em:

http://globoesporte.globo.com;

8) Festas e festividades: Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br;

9) Lazer: Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br;

10) Moradia: Arquitetura & Construção. Editora Abril. Disponível em: http://casa.abril.com.br/arquitetura-construcao, e Revista Globo Rural. Editora Globo. http://revistagloborural.globo.com/, Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br/;

11) Profissão e trabalho: Exame. Editora Abril. Disponível em: http://exame.abril.com.br/ Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br;

12) Relações sociais: Família. Disponível em http://mdemulher.abril.com.br/familia, Revista Caras. Disponível em: http://caras.uol.com.br;

13) Saúde e doenças: Revista Saúde. Editora Abril. Disponível em: http://mdemulher.abril.com.br/revistas/saude;

14) Trânsito e transportes: Jornal Folha de São Paulo. Disponível em: http://www.folha.uol.com.br;

15) Vestimentas e indumentárias: Revista Estilo de vida. Editora Abril. Disponível em: http://mdemulher.abril.com.br/revistas/estilo;

16) Viagens e hospedagem: Revista Viagem. Editora Abril. Disponível em: http://viajeaqui.abril.com.br/vt. Revista Viagem. Editora Abril. Disponível em: http://viajeaqui.abril.com.br/vt;

Na segunda etapa, optamos por selecionar 3 textos de cada fonte escolhida, formando um total de 66 textos relacionados aos contextos. Esses textos foram transformados em documentos do tipo txt. para serem processados no software AntConc 3.2.4w 17 (Windows),

cuja finalidade é o tratamento de textos por meio de sistema automático. Como resultado, obtivemos um total de 41.247 itens lexicais, dos quais 8.452 eram itens distintos, com frequência entre 1 - para vários itens como ÓTIMA, VÊM, VOLTOU - e 1.922 - para a preposição DE. Desse montante, coletamos 895 verbos, como lemas, entendidos como verbos no infinitivo, conforme anexo 3.

O software permitiu organizar os textos para, posteriormente, extrairmos os itens lexicais,seja em suas formas simples ou complexas,fornecendo lista de palavras de todos os textos, nas frequências e nas concordâncias.

O AntConc 3.2.4w (Windows) contém 7 (sete) ferramentas de processamento de dados:

1) Concordance Tool: apresenta o resultado da pesquisa de acordo com a palavra-

chave no contexto, fornecendo a palavra e a frase comumente usada em um corpus de textos.

17O software AntConc 3.2.4w (Windows) é de criação de Laurence Anthony. É uma ferramenta gratuita de

análise de corpus do Centro de Idioma de Inglês e Educação em Ciência e Engenharia, Faculdade de Ciências e Engenharia da Universidade de Waseda, Japão. Disponível no site Laurence Anthony’s Website,

2) Concordance Plot Tool: apresenta os resultados da pesquisa localizados com um formato de 'código de barras', permitindo a visualização da posição em que os resultados da pesquisa aparecem em textos-alvo.

3) File View Tool: apresenta o texto de arquivos individuais, permitindo a investigação mais detalhadamente dos resultados gerados em outras ferramentas de AntConc.

4) Clusters/N-Grams: apresenta os dados armazenados com base na condição de pesquisa, quer dizer, resume os resultados gerados na Concordance Tool ou Concordance Plot Tool. Essa ferramenta verifica todo o corpus para "N" (por exemplo, uma palavra, duas palavras, ...). Isso permite encontrar expressões comuns em um corpus.

5) Collocates: apresenta as colocações de um termo de pesquisa, permitindo a investigação dos padrões não-sequenciais na linguagem.

6) Word List: apresenta todas as palavras do corpus em uma lista ordenada por frequência, permitindo a localização das palavras mais frequentes no texto. 7) Keyword List: apresenta as palavras que são extraordinariamente frequentes (ou

pouco frequentes) no corpus, em comparação com as palavras em um corpus de referência, permitindo a identificação das palavras características do corpus.

Figura 12: Representação do software AntConc 3.2.4w (Windows)

Os textos selecionados para esta pesquisa foram indexados no programa e processados. A ferramenta word list forneceu uma lista de palavras contendo todas as palavras dos textos e sua respectiva frequência.

Os itens lexicais fornecidos são apresentados com a forma do texto de origem, ou seja, apresentam-se flexionados de acordo com a concordância exigida pela gramática do enunciado.

Figura 13: Lista de palavras do somatório dos 66 textos

Após a composição da lista de palavras do texto, com quantidade e frequência, foi possível verificar o contexto linguístico em que cada item aparece, por meio da ferramenta colocação.

Figura14: Palavra e contexto linguístico

Assim sendo, depois de executadas as duas etapas, recolhemos os itens lexicais que compõem o corpus inicial e que serviram de suporte para as análises.