• Nenhum resultado encontrado

Primeiramente, é relevante pontuar que a compilação deste corpus não objetivou abarcar todos os documentos já publicados no âmbito da área do PLNM e de áreas correlatas, devido à dificuldade em realizar este mapeamento e às limitações de tempo e de recursos da pesquisa. Evidenciamos também que o corpus é composto apenas por documentos disponibilizados gratuitamente online.

Ademais, alguns dos documentos encontrados, mesmo que se inserissem na área do PLNM ou em áreas correlatas, foram desconsiderados pelos seguintes motivos: (i) por estarem retidos a pedido dos autores, (ii) por possuírem acesso embargado, restrito ou pago, (iii) por

não possuírem versão digital, (iv) por apenas poderem ser acessados nas instituições de origem, (v) por não conterem UFEs ou siglas relevantes para esta pesquisa99.

A compilação dos documentos que compõem o corpus de estudo foi feita a partir de buscas realizadas nos seguintes locais:

(i) Revista SIPLE; (ii) Acervo Celpe-Bras100;

(iii) site Português para Estrangeiros101;

(iv) site Foca no Português para Estrangeiros102;

(v) Portal do Professor de Português Língua Estrangeira/Língua Não Materna – PPPLE103;

(vi) Biblioteca Digital Brasileira de Teses e Dissertações – BDTD104;

(vii) site da American Organization of Teachers of Portuguese – AOTP105;

(viii) site do Grupo de Estudos e Pesquisas em Linguística Aplicada – GEPLA106;

(ix) site da Associação de Professores de Português – APP107;

(x) Portal de Periódicos CAPES108;

(xi) Scientific Electronic Library Online – SciELO109;

(xii) GoRead110;

(xiii) Repositório Científico de Acesso Aberto de Portugal – RCAAP111.

99 Essa verificação foi feita a partir de buscas por “portugu” e “língua”, por meio dos atalhos Ctrl+F e Ctrl+L (em

documentos.pdf e .docx, respectivamente) em cada documento acessado.

100 As buscas foram realizadas a partir da listagem de pesquisas voltadas ao exame Celpe-Bras, disponibilizada

neste acervo criado na Universidade Federal do Rio Grande do Sul. A listagem consultada está disponível em: http://www.ufrgs.br/acervocelpebras/pesquisas/textos-publicados-sobre-o-exame-celpe-bras. Acesso em: 19 ago. 2020.

101 Disponível em: https://www.unicamp.br/~matilde/index.html. Acesso em: 19 ago. 2020. 102 Disponível em: https://www2.iel.unicamp.br/matilde/. Acesso em: 19 ago. 2020. 103 Disponível em: https://ppple.org/. Acesso em: 19 ago. 2020.

104 Disponível em: https://bdtd.ibict.br/. Acesso em: 19 ago. 2020. 105 Disponível em: https://www.aotpsite.net/. Acesso em: 19 ago. 2020. 106 Disponível em: http://www.gepla.ufc.br/. Acesso em: 25 ago. 2020. 107 Disponível em: https://www.app.pt/. Acesso em: 25 ago. 2020.

108 Disponível em: https://www.periodicos.capes.gov.br/. Acesso em: 19 ago. 2020. 109 Disponível em: https://scielo.org/. Acesso em: 19 ago. 2020.

110 Disponível em: https://www.goread.com.br/. Acesso em: 19 ago. 2020. 111 Disponível em: https://www.rcaap.pt/. Acesso em: 19 ago. 2020.

As buscas nos sites Português para Estrangeiros, Foca no Português para Estrangeiros, GEPLA, APP, AOTP112, bem como no PPPLE e no GoRead foram feitas de forma manual.

Contudo, as buscas no PPPLE e no GoRead não foram produtivas para esta pesquisa, pois no caso do primeiro portal, os documentos disponibilizados eram apenas atividades e roteiros didáticos que não continham UFEs e contextos atestatórios, definitórios ou metalinguísticos relevantes para esta pesquisa, e no caso da GoRead, nada relacionado à área de PLNM foi encontrado.

Para as pesquisas nos outros repositórios e bases de dados, UFEs e CUFEs identificados no estudo exploratório realizado anteriormente a esta pesquisa foram utilizados, com algumas modificações, como expressões de busca113. Em geral, os repositórios e bases de dados

permitem a definição de filtros com o intuito de refinar a busca e restringir os resultados. Os filtros utilizados nas buscas foram o de idioma (apenas documentos em português) e o de intervalo de tempo (2000-2020). No Quadro 3, a seguir, estão apresentadas as expressões de busca nos repositórios e bases de dados.

Quadro 3 –Expressões de busca nos repositórios e bases de dados pesquisados Língua Portuguesa (para/por/a) Estrangeiros Português (como) Língua Adicional

Português Acadêmico Português (como) Língua Estrangeira Língua Portuguesa (para/na) Diáspora Português (como) Língua de Herança Português (para/por/a) Falantes de Outras Línguas Português (como) Língua Não Materna

Português (para) Fins Específicos Português (como) Língua Segunda Português (para/por/a) Imigrantes Português (no) Exterior

Português (para/por/a) Indígenas Português (para/por/a) Refugiados

Português Instrumental Português (para/por/a) Trabalhadores Transplantados Português (como) Língua de Acolhimento Português (no) Estrangeiro

Português (para/por/a) Hispanofalantes Português (para/por/a) Surdos Fonte: Elaborado pelo autor.

Algumas publicações selecionadas para compor o corpus não são somente da área da Linguística Aplicada ou unicamente do PLNM, mas também da área de Políticas Linguísticas. Há publicações também da área da Lexicologia, da Terminologia, de Bilinguismo e

112 A partir dos sites da APP e da AOTP, tivemos acesso a alguns eventos acadêmicos da área da Linguística e

outros específicos da área do PLNM. A partir da identificação destes eventos, realizamos buscas em anais por textos que contivessem UFEs relevantes para a análise a ser desenvolvida nesta pesquisa. Por meio destas buscas, alguns resumos e trabalhos publicados em anais que continham UFEs pertinentes para esta pesquisa foram adicionados ao corpus de estudo.

113 Para esta pesquisa de mestrado, recorremos às listagens de candidatos a UFEs produzidas no escopo de nosso

estudo exploratório, de modo a formular nódulos de busca nos repositórios e bases de dados. Todavia, as listagens de candidatos a UFEs identificados no estudo exploratório não foram apresentadas em Lisboa (2020), devido às limitações de espaço do artigo.

Multilinguismo, da Sociolinguística, da Fonética, da Fonologia e da Fraseologia, que versam sobre o PLNM. Muitos documentos relacionados ao ensino de outras línguas para alunos lusófonos e outros estritamente da área de PLM também surgiram nas buscas, contudo, como a área-alvo desta pesquisa é o PLNM, essas publicações foram desconsideradas.

A cada arquivo selecionado, abria-se o documento, contrastavam-se as informações com as tabelas de dados e fazia-se uma breve busca, por meio dos atalhos Ctrl+F ou Ctrl+L (em arquivos .pdf e .docx, respectivamente), por “portugu” ou “língua”114, e analisávamos se os

documentos continham ocorrências de UFEs, CUFEs e/ou siglas relevantes para esta pesquisa, haja vista que, considerando a natureza da pesquisa, seria improdutivo compilar documentos que não contivessem nenhuma UFE ou sigla referentes às potenciais subáreas de atuação do PLNM. Portanto, nos casos em que não foram encontradas UFEs, CUFEs ou siglas pertinentes para a pesquisa, os documentos foram desconsiderados. Dentre os documentos da área de PLNM que não possuíam UFEs, CUFEs e siglas relevantes para esta pesquisa, grande parte era composta por resumos em anais de eventos acadêmicos.

É relevante pontuar que algumas instituições de ensino superior disponibilizam os Trabalhos de Conclusão de Curso, Dissertações e Teses em arquivos desmembrados, como, por exemplo, cada capítulo como um arquivo separado. Nesses casos, foi necessário fazer o

download dos arquivos separadamente e utilizar uma ferramenta online115 para fazer a junção

desses documentos, haja vista que seria necessário que cada arquivo do corpus fosse um documento completo.

Outro ponto relevante a ser enfatizado é em relação aos livros e anais de eventos acadêmicos. No caso dessas publicações, decidiu-se desmembrar esses documentos em arquivos separados para cada capítulo/resumo/trabalho, haja vista que os anais e a maioria dos livros são compilados de textos de vários autores, e como no processo de planejamento do

corpus definiu-se a inclusão de autoria de cada texto como essencial (cf. Subcapítulo 4.1), a

informação de autoria dos textos é mais relevante do que a informação de organização dos anais e livros. Ademais, grande parte dos anais e livros não foram compilados por completo, pois nem todos os textos publicados nesses compilados versavam sobre o PLNM, não continham

114 Essas buscas foram realizadas por “portugu” e “língua” com o intuito de encontrarmos UFEs como Português

como Língua Estrangeira, Português Instrumental, Língua Portuguesa para Indígenas etc.

115 A ferramenta utilizada para realizar a junção de arquivos desmembrados foi a iLovePDF, uma ferramenta online

UFEs, CUFEs ou siglas pertinentes para esta pesquisa e/ou não estavam integralmente disponíveis online, situações que também justificam o desmembramento de cada texto completo como um arquivo separado.

O Quadro 4, a seguir, apresenta o número total de documentos por categoria textual ao final do procedimento de compilação descrito ao longo deste subcapítulo.

Quadro 4 – Número total de documentos por categoria textual

CATEGORIA TEXTUAL Nº DE DOCUMENTOS

Artigos Científicos 338

Capítulos de Livros 160

Dissertações 525

Livros (não organizados) 2

Resumos (Eventos Acadêmicos) 451

Teses 118

Trabalhos Completos (Eventos Acadêmicos) 171

Trabalhos de Conclusão de Curso (Graduação e Especialização) 23 Fonte: Elaborado pelo autor.

Devido à extensão do corpus compilado e às limitações de tempo da pesquisa, foi necessário selecionar uma amostra do corpus para basear a proposta de harmonização terminológica desta pesquisa, haja vista que seria impossível analisar integralmente o corpus respeitando os prazos de defesa desta dissertação. No subcapítulo seguinte, detalhamos os procedimentos realizados para a seleção do corpus de amostragem utilizado como base para a proposta de harmonização terminológica.