• Nenhum resultado encontrado

A CRIAÇÃO DE CORPORA COMO UM PROCESSO CÍCLICO

2. FUNDAMENTAÇÃO TEÓRICA

2.1. LINGUÍSTICA DE CORPUS

2.1.5. A CRIAÇÃO DE CORPORA COMO UM PROCESSO CÍCLICO

Na compilação de corpora, é necessário aos pesquisadores executar esse passo metodológico como um processo contínuo, sempre levando em conta os objetivos de cada pesquisa, para possibilitar uma maior robustez nos resultados. Biber (1993) propõe um modelo para o desenho e compilação do corpus de pesquisa, conforme mostrado na Figura 1 abaixo:

FIGURA 1 – PROCESSO CÍCLICO PARA A CRIAÇÃO DE UM CORPUS

Fonte: Biber (1993, p. 256)11 11 Tradução minha. Investigação empírica piloto e análise teórica Desenho do corpus Compilação de uma parte do corpus Investigação empírica

Egbert (2019), em comentário sobre o processo cíclico proposto em Biber (1993, p. 256), sugere que o corpus não deve ser visto como um aglomerado de textos, mas sim como um conjunto que deve apresentar justificativas sistematizadas para sua compilação. Da mesma forma, independentemente da concepção inicial do pesquisador, não se deve esperar que tal desenho de corpus seja um planejamento estático. Tentativas adicionais deveriam ser feitas durante o processo, para adequar a amostra a um modelo ótimo que possa responder às perguntas de pesquisa apresentadas pelo pesquisador.

No primeiro passo da Figura 1, “Investigação empírica e análise teórica”, Biber reitera que a coleta de um corpus de estudo deve ser precedida de uma análise teórica: deve-se identificar os parâmetros desse corpus e estabelecer razões abalizadas para a escolha dos textos que o comporão. Tais razões, entretanto, nem sempre devem ser de natureza linguística: ao se coletar um corpus de estudo de textos jornalísticos, por exemplo, deve-se dar primazia aos veículos de comunicação mais representativos do gênero escolhido, ou a um período histórico específico, ou qualquer outra característica que atenda às definições previamente estabelecidas pelo pesquisador. Para que seja representativa, a amostra escolhida deve representar da melhor maneira possível toda a população de textos do gênero escolhido para a pesquisa. Essa afirmação é reiterada por Egbert (2019, p. 30) quando ele afirma que um corpus representativo é uma amostra consistente de textos que representa um domínio-alvo ou uma população linguística bem definidos.12

Para que a representatividade de um corpus de estudo seja avaliada, em primeiro lugar há de se considerar o tipo de pesquisa para a qual ele irá servir, na medida em que nenhum corpus consegue responder a quaisquer perguntas de pesquisa. Assim, um corpus perfeitamente adequado para um tipo de investigação pode não servir a um propósito distinto (EGBERT 2019, p. 33).

Depois de propor estabelecer os objetivos da pesquisa baseada em corpus, Biber (1993) sugere, como segundo passo, o “Desenho do corpus” (Figura 1), que diz respeito à escolha dos textos que comporão a amostra estudada. A decisão de inclusão ou exclusão de textos é abalizada por parâmetros tanto linguísticos e

12 Do inglês: "…a representative corpus [is] a principled sample of texts that represent a well-defined

metodológicos da própria Linguística de Corpus, quanto da competência das diferentes áreas de conhecimento que utilizam os pressupostos da LC como ferramentas de investigação.

Em seguida, no terceiro passo sugerido por Biber (1993), um corpus piloto é criado com base nas perguntas de pesquisa e nos parâmetros estabelecidos nos passos anteriores e, no passo seguinte, o corpus piloto passa por uma investigação empírica com o propósito de verificar se os parâmetros estabelecidos para a compilação do corpus de estudo atendem às necessidades da pesquisa ou devem ser modificados. Algumas partes desse processo podem ocorrer continuamente, até que se obtenha um corpus com a robustez necessária para desejavelmente responder às perguntas de pesquisa, com a fiabilidade esperada.

Egbert (2019, p.36) tomou como base a representação esquemática cíclica de Biber (1993) para a construção de um corpus de pesquisa e sugeriu desdobrá-la em 9 etapas:

1. Estabelecer (e projetar) os objetivos e o planejamento da pesquisa 2. Definir o domínio (a população)

3. Desenhar o corpus 4. Coletar a amostra

5. Fazer a anotação no corpus

6. Avaliar a representatividade do corpus em relação ao domínio 7. Avaliar a representatividade linguística

8. Repetir os passos 3-5, se necessário 9. Criar relatório13

Entre as principais diferenças entre o processo cíclico de quatro passos de Biber (1993) e as nove etapas sugeridos por Egbert (2019), há algumas sugestões pertinentes. Por exemplo, na primeiro etapa de Egbert (2019), “Estabelecer (e

projetar) os objetivos e o planejamento da pesquisa”, além de ressaltar a importância

do estabelecimento de objetivos claros de pesquisa para a subsequente compilação do corpus, o autor preconiza a projeção de objetivos adicionais para o corpus, para

13 Tradução minha, do inglês: "1. Establish (and project) research objectives and design / 2. Define

the target domain (population) / 3. Design the corpus / 4. Collect the sample / 5. Annotate the corpus / 6. Evaluate target domain representativeness / 7. Evaluate linguistic representativeness / 8. Repeat steps 3-5, if necessary / 9. Report".

que ele possa ser utilizado em pesquisa futuras, fazendo assim com que o corpus compilado se torne mais atrativo a outros pesquisadores. Na terceira etapa sugerida por Egbert (2019), “Desenhar o corpus”, além de sugerir que o pesquisador tome as decisões de planejamento previamente discutidas nesta seção para garantir que a amostragem compilada seja representativa da população em estudo, Egbert oportunamente sugere que decisões de âmbito mais prático, como prazos, custos e modos de armazenagem dos arquivos também devem ser levadas em consideração.

A quinta etapa na esquematização de Egbert (2019), “Fazer a anotação no

corpus”, não figura como uma etapa apartada das demais apresentadas por Biber,

mas como parte integrante da etapa Investigação empírica. Anotar o corpus significa reunir informações externas sob a forma de cabeçalhos informativos para cada texto pertencente ao corpus. A seleção de quais informações reunir depende, em grande parte, dos objetivos do estudo, mas pode-se dar como exemplos a autoria do texto, o ano de publicação, o registro ou a faixa etária, entre outros. Tais informações são de extrema valia para que se possa compreender os resultados e justificar as hipóteses levantadas e as generalizações feitas sobre o uso da linguagem.

A última etapa sugerida por Egbert (2019), “Criar relatórios”, diz respeito à documentação do processo de concepção e compilação do corpus, uma atividade contínua durante toda a pesquisa. Segundo o autor, a descrição detalhada da metodologia utilizada na pesquisa baseada em corpus não somente servirá para orientar o próprio pesquisador durante todos os passos de sua própria pesquisa, como também servirá de base para futuras pesquisas. Egbert diz também (2019, p.37):

Uma documentação cuidadosa e abrangente do desenho e da construção de um corpus auxiliará aqueles que utilizam o corpus e os que consomem as informações das pesquisas baseadas em corpus a tomar decisões fundamentadas a respeito de um corpus.14

A recomendação acima exemplifica a predisposição de muitos pesquisadores

14 Do inglês: “Careful and comprehensive documentation of the design and constructioin of a corpus

will help corpus users and consumers of corpus research to make informed decisions regarding a corpus.” (Tradução minha).

da área de Linguística de Corpus para a cooperação e para o compartilhamento de resultados e melhores práticas, testemunhada por mim de modo regular no Grupo de Estudos em Linguística de Corpus, GELC, liderado pelo Professor Tony Berber Sardinha. Em se tratando de uma área de estudo relativamente recente, a cooperação entre pesquisadores se mostra fundamental para o desenvolvimento das pesquisas e para a disseminação dos resultados.

Na terceira seção desta dissertação, a Metodologia, serão explicados em detalhes os passos realizados para a construção do SMC para que ele atenda às necessidades da investigação aqui apresentada de modo a produzir resultados robustos e relevantes para o estudo do universo artístico de Sally Mann.