1.2. Linguística de Corpus e Corpora
1.2.3. Corpus de Especialidade
A designação de corpus de especialidade deve-se ao facto de este corpus ser constituído por textos referentes a uma língua de especialidade pertencente a um
Disponível em http://webdeptos.uma.es/filifa/personal/amoreno/teaching/el/corpus-typ.html. [acedido em 2005.10.15].
As duas principais bases teóricas do estudo
domínio ou sub-domínio do conhecimento. Neste contexto, uma língua de especialidade é utilizada, de acordo com as palavras de Pavel et ai. (2002: xvii), " (...) para
proporcionar uma comunicação sem ambiguidade numa área determinada do conhecimento ou da prática, com base num vocabulário e em usos linguísticos específicos desse campo".
Nesta altura, julgamos interessante e oportuno fazer, ainda, duas breves referências. A primeira ao corpus para fins específicos {special purpose corpus), proposto por Pearson (1998: 48), que muito linearmente o descreve como um corpus cuja composição é determinada pelo fim específico para o qual se destina, o que na realidade se aplica a este projecto. A segunda referência, que temos como particularmente semelhante ao corpus supracitado, é o corpus situacional que Temmermann (2000: 53-54) propõe para o conjunto de documentos e fragmentos de textos avaliados, seleccionados e organizados mediante um critério específico.
A construção de corpora de especialidade para extracção de informação terminológica em línguas de especialidade é proposta como uma das muitas possibilidades de estudo e aplicação prática que o campo da Linguística Computacional oferece nos dias de hoje. É comummente aceite que a qualidade de um corpus de especialidade, no qual se baseia um estudo ou um trabalho de investigação, determina a qualidade do seu resultado final. Esta constatação reflecte a importância da observação de certos preceitos na construção de um corpus. A sua estrutura deve ser arquitectada consoante a finalidade da pesquisa e deve ser representativa de uma determinada língua de especialidade. Embora não exista um conjunto fixo de procedimentos para a elaboração de um corpus, a realidade é que há elementos estruturantes de carácter mais generalista que devem ser pré-definidos e observados na sua construção, tais como são os propostos por McEnery et ai. (1996: 21-6): leitura automática, extensão, amostra e representatividade e, por fim referência padrão, sobre os quais fazemos em seguida algumas breves considerações.
Em relação à leitura automática ela é hoje em dia praticamente indissociável da descrição de corpus. As contribuições no campo da programação computacional, que através das suas ferramentas informáticas se tornam elementos potenciadores da análise e exploração de corpora, têm sido determinantes para o seu rápido reconhecimento como área de estudo da Linguística Aplicada. A importância e utilidade do uso de computadores é salientada por Biber et ai. (1998:4-5) quando refere: "(•••) computers
As duas principais bases teóricas do estudo during an analysis. Computers can also be used interactively, allowing the human analyst to make difficult judgements while computer takes care of record-keeping."
O segundo elemento referido pelos autores McEnery et ai. (1996: 21-6), diz respeito à extensão do corpus. Contudo, por se tratar de uma amostra, seja ela de cerca de 157.000 átomos (por língua), de que é exemplo o Projecto de Riscos Naturais:
Cheias, ou de 100 milhões de palavras como é o caso do British National Corpus
(BNC), o seu tamanho é sempre limitado. Uma vez que não é esperado que um corpus de especialidade atinja a dimensão de um corpus geral ou de referência, torna-se fundamental investir na qualidade e representatividade dos textos seleccionados. É, aliás, por esse motivo que Johansson (1991: 306) defende que os corpora pequenos têm a vantagem de poderem ser cuidadosamente construídos e exaustivamente analisados sob as mais variadas formas. Este critério de exigência funciona como garantia da fiabilidade e do sucesso dos resultados do estudo. De qualquer forma, focalizar a importância de um corpus no seu tamanho é ter, como refere Leech (1991: 10), uma visão naïve, pois como é facilmente perceptível, "(...) a collection of machine readable
text does not make a corpus."
A extensão de um corpus encontra-se geralmente associada à representatividade, tido como um dos aspectos mais importantes na sua construção. Não existe, no entanto, uma medida exacta para a representatividade, embora seja ideia generalizada que um
corpus de especialidade não necessita ser tão extenso como um corpus geral ou de
referência. O que está demonstrado por autores como Sardinha (1999) e Biber et ai. (1998), é que quanto mais extenso for, maior será a probabilidade de nele se encontrarem representados registos de baixa frequência. Num corpus de especialidade, a classificação de representatividade não significa que este seja absolutamente exaustivo nessa mesma área de especialização, mas que funcione como uma amostra significativamente expressiva de uma determinada realidade ideal para pesquisas específicas. Neste sentido, e na medida do possível, o corpus deve conter textos completos pois, com apenas pequenos excertos e amostras corre-se o risco de se perder, por exemplo, a riqueza terminológica, contextual ou conceptual de um texto.
Para além da representatividade máxima de uma língua ou sub-língua de especialidade é crucial o controlo da tipologia dos textos a incluir num corpus. Conforme lembra Hassan (in Sardinha, 2000: 348), "Para serem adequados, os corpora
devem ser afinados com os objectivos da análise." É, desta forma, importante ter em
As duas principais bases teóricas do estudo
conta dois aspectos determinantes, sendo o primeiro a sua autenticidade, isto é, os textos não foram propositadamente criados para esta situação, à excepção, por razões óbvias, de textos em formato de glossário. O segundo aspecto refere-se às suas afinidades semânticas fazendo ressaltar, por isso, a sua homogeneidade ao nível do conteúdo. Maia (2002a: 30) refere que este tipo de textos pode incluir vários níveis de especialização, embora a tendência seja a de utilizar textos com elevado grau de densidade e especificidade lexicais e terminológica que, quando elaborados correctamente contribuem para um maior sucesso da pesquisa e extracção de informação terminológica.
É, pois, necessário dominar o mais possível o funcionamento dos corpora, já que pelas provas dadas ganharam o estatuto de ferramentas indispensáveis para a realização de um qualquer trabalho terminológico, pelo que o nosso estudo não é excepção. Os
corpora de especialidade oferecem a possibilidade de fornecer dados terminológicos
tais como termos, bem como definições e contextos de uso, como teremos oportunidade de verificar nos Capítulos 2 e 3, deste trabalho.
A definição
2. A definição
Juntamente com a unidade terminológica, a definição é um elemento chave nos estudos terminológicos. Sager, numa perspectiva mais abrangente, refere no Prefácio do seu livro "Essays on Definition" que a definição "(...) occupies a central place in all
sciences and is a fundamental tool in logic, philosophy of ideas and semantics (...)."
(Sager, 2000: vii). Por extensão, podemos referir que o texto que comporta a definição ocupa um lugar de relevo nos estudos terminológicos e no trabalho terminográfico.
Uma vez que a constituição de terminologias advém, essencialmente, de necessidades comunicativas dos agentes de um dado domínio de especialidade, o texto definicional deve corresponder ao objectivo do produto terminográfico, isto é, deve haver uma correlação entre a escolha do léxico que compõe as definições terminológicas de um dicionário, glossário etc., e o público ao qual se destinam.
Não é objectivo desta dissertação elencar todos os modelos de definição que têm vindo a ser propostos desde a Antiguidade até aos nossos dias, nem pretendemos abordar a problemática dos conceitos da filosofia e da lógica que subjazem aos termos
definir e definição. Contudo, em coerência com a distinção entre termo e não-termo,
(apresentada no ponto 1.1.3.2), consideramos igualmente indispensável para o nosso estudo enveredaremos por um caminho mais estreito que conduz apenas a uma breve descrição da definição no seu sentido mais lato, concretizando no sub-capítulo 2.3. a descrição de definição terminológica.