• Nenhum resultado encontrado

METODOLOGIA DE TRABALHO PARA A IDENTIFICAÇÃO E DESCRIÇÃO DAS POLISSEMIAS DE UM TERMO

2.2. Constituição dos corpora: uma perspectiva diacrônica 1 Corpora Diacrônicos: uma metodologia de trabalho

2.2.3. Critérios para a constituição dos corpora

A escolha dos critérios para a constituição dos corpora é um ato que deve ser ponderado e discernido, considerando que a realização de cada estudo apresenta uma particularidade em função dos objetivos estabelecidos. Desse modo, a estipulação de critérios, para um dado estudo, é um princípio único e preciso, que deve ser seguido de maneira fiel aos propósitos selecionados.

Pensamos que o terminólogo ao iniciar a constituição de um corpus não deve fundamentar-se de maneira categórica nos manuais de corpora ou nos guias de usuários ou em outro tipo de documento, pelo fato de que, como referimos anteriormente, cada estudo sobre uma determinada temática privilegia critérios que estejam em consonância com as hipóteses e os propósitos de uma pesquisa.

A consulta a esses documentos, por parte do terminólogo, deve ser realizada com cautela, permitindo um melhor e maior conhecimento e entendimento dos trabalhos desenvolvidos em Linguística de corpus. Nesse sentido, o terminólogo deve

desenvolver mecanismos para superar algumas complexidades que encontrará ao trabalhar com os corpora, conforme mencionado anteriormente (ponto 2.2.1).

Para essa tarefa, optamos por compilar corpora constituídos por artigos científicos, obedecendo aos seguintes critérios:

O corpus constituído para esse trabalho é formado por textos que tratam da toxicomania (Br) / toxicodependência (Pt) sobre a temática da saúde pública. No entanto, é difícil delimitar textos que abordam estritamente a temática referida, uma vez que a interdisciplinaridade é uma característica encontrada pelos especialistas para melhor fundamentar e explicar uma dada realidade. Nesse sentido, a saúde pública pode apresentar-se sob a perpectiva de outras áreas, como é o caso da medicina geral, da psicologia, da psiquiatria, etc.

Os artigos científicos são provenientes de variadas revistas on-line, em língua portuguesa (variante do Brasil e de Portugal), que podemos considerar como fontes fiáveis e credíveis.

A fiabilidade e a credibilidade são critérios que se baseiam quer nos autores e nos trabalhos publicados por esses especialistas nas revistas on-line; quer nas instituições que esses especialistas integram; quer nas instituições que estão por detrás da implementação e divulgação dessas revistas; quer no nível de conhecimento que essas revistas têm tanto a nível nacional, quanto internacional.

Tendo em conta esses critérios, é necessário lembrar que ambas as coleções de textos provêm de espaços geográficos e socioculturais distintos.

Os textos referentes à variante do português do Brasil foram extraídos do site Scielo Brasil, uma biblioteca eletrônica, que tem uma coleção de artigos científicos brasileiros.

Segundo o site Scielo Brasil, os artigos são parte de um projeto de pesquisa desenvolvido pela FAPESP (Fundação de Amparo à Pesquisa do Estado de São Paulo), em parceria com a BIREME (Centro Latino-Americano e do Caribe de Informação em Ciências da Saúde). Ainda de acordo com o site, a partir de 2002, esse projeto passou a contar com o apoio do CNPq (Conselho Nacional de Desenvolvimento Científico e Tecnológico).

Cada texto que constitui o corpus é oriundo de diferentes revistas. Referimos ainda que as revistas de onde foram extraídos os artigos sobre a toxicodependência não tratam exclusivamente desse fenômeno.

Para a variante do português Europeu, os artigos são oriundos da revista “Toxicodependências”, revista científica criada em 1995 pelo IDT (Instituto da Droga e da Toxicodependência).

A partir do ano de 2012, essa instituição passou a ser chamada de SICAD Serviço de Intervenção nos Comportamentos Aditivos e nas Dependências.

Um outro critério a ser considerado diz respeito à opção por analisar e descrever os textos somente escritos em língua portuguesa que veiculam informações referentes ao espaço geográfico, econômico e sociocultural no Brasil e em Portugal. Nesse sentido, descartamos as traduções e qualquer outro tipo de textos que veiculam informações exteriores ao espaço delimitado.

A opção por esses textos vai ao encontro a necessidade de analisar e descrever o conhecimento dos especialistas nesses espaços, contemplando as realidades distintas de ambos os países, e ainda as variantes de uma mesma língua que podem veicular diferentes particularidades, e que de certo modo, podem até mesmo apresentar algumas semelhanças.

Para a classificação dos textos no eixo diacrônico, decidimos considerar a data de publicação, mesmo sabendo que essa data pode apresentar um período distante da data em que o texto foi concebido.

Porém, é necessário referir que os textos não apresentam uma data de concepção, apenas uma data de recepção por parte das revistas. Consideramos que essa última data, eventualmente, pode ser a mais próxima da concepção das produções escritas. Nesse sentido, tomamos em conta, a data de recepção dos textos (para aqueles que apresentam essa data) como a possível data de concepção do próprio artigo que veicula o sentido polissêmico de um termo, pois essa significação está intrisecamente vinculada ao espaço do tempo no qual ela é utilizada. Desse modo, esse espaço de tempo deve ser demarcado.

Essas decisões foram tomadas, pelo fato, de os textos apresentarem uma data de concepção. Esse critério está intimamente ligado à uniformização, organização e sistematização dos textos.

É a partir dessa data de recepção do texto que se pode delimitar as informações linguísticas. Em alguns casos, o espaço de tempo entre a recepção de um artigo e a sua publicação pode demorar vários meses. Desse modo, nota-se uma defasagem no que diz respeito a veiculação da polissemia do termo e ainda a ocorrência de desatualização do conhecimento. Assim, é necessário desenvolver critérios que possam dar conta dessa problemática. Aliado a esses critérios, o tratamento automático da polissemia deve ser realizado, considerando essa realidade.

Os corpora constituídos para esse trabalho compreendem os anos de 1990 até 2011. Para ambas as variantes, existem algumas datas, onde não encontramos textos que melhor representassem os critérios, aqui, elencados.

Para a variante do Brasil, a toxicomania comporta-se como uma realidade que procura abranger, toda a esfera de ocorrência. Desse modo, encontramos textos que apresentam o ponto de vista do legislador ou do sociólogo, por exemplo, que de certo modo, apresentam discursos que se desvinculam da temática proposta para fundamentar a escolha dos textos, a saúde pública. Consequentemente, esses textos foram descartados.

Para a variante de Portugal, temos em conta somente os textos a partir de 1995, afinal essa é a data de início da revista. O ano de 2011 foi o último ano de publicação da revista Toxicodependências.

Esclarecemos que o espaço de cinco anos de diferença no que se refere a análise e a descrição da polissemia nominal diacrônica, entre a variante brasileira e portuguesa, não irá comprometer o resultado de nosso trabalho, pois não se trata de observar qual das variantes apresenta um maior número de sentidos referente a um dado termo. O objetivo proposto visa a análise e a descrição dos sentidos polissêmicos diacrônicos do termo “drogas”, tendo em conta um espaço sociocultural delimitado.

Com base nesses critérios, estamos cientes de que o corpus não é um espaço que veicula apenas o vocabulário especializado de um domínio de especialidade e as

significações dos termos desse mesmo domínio. Os corpora auxiliam-nos a entender o comportamento de um domínio e a analisar e descrever as significações polissêmicas do termo resultantes de distintas perpectivas.

Optamos por analisar a relação termo/sentido no domínio da toxicomania (Br) / toxicodependência (Pt), seguindo o eixo temporal, sem qualquer interrupção no tempo, salvo os anos em que não encontramos artigos, conforme mencionado anteriormente. Esse tipo de análise falcuta-nos resultados relevantes quando se está interessando em saber se houve uma continuidade ou ruptura no que se refere à polissemia de um termo ao longo do tempo.

Para a realização desse trabalho, partimos dos contextos, tendo em conta que esses espaços são partes integrantes dos textos. Desse modo, os contextos apresentam uma codificação de acordo com o texto de onde são extraídos e em função da ocorrência da polissemia do termo situado no eixo temporal.

A esse respeito, lembramos Pincemin que se refere à necessidade de codificação dos textos que constituem o corpus, acrescentando que a estruturação dos textos delimita a autonomia relativa aos contextos que é exigida pelos tratamentos efetuados sobre o corpus: “Le codage de textes, à l’intérieur du corpus, est essentiel, puisque la structuration des textes organise les contextes des éléments linguistiques, et que leur délimitation institue l’autonomie relative des segments textuels requise par les traitements effectués sur le corpus. ” (Pincemin, 1999 :26).

São os contextos que permitem uma delimitação do sentido polissêmico do termo, no discurso científico.