• Nenhum resultado encontrado

1. POLISSEMIA NOMINAL DIACRÔNICA

1.6. Tratamento informático da polissemia: por que da necessidade de desambiguização?

É evidente o fato de a ocorrência da polissemia ser uma realidade presente no discurso especializado. Porém, para muitos terminólogos, linguistas e outros especialistas que trabalham com a descrição da língua numa perspectiva computacional, a representação desse fenômeno constitui um desafio, que pode ser resolvido a partir da desambiguização do termo polissêmico.

Essa tarefa consiste em relacionar e representar cada uma das polissemias do termo como uma ocorrência única, ou seja, forma e conteúdo caracterizam-se por ser uma relação biunívoca, independentemente de a forma ser a mesma.

Na literatura da Inteligência Artificial, a desambiguização é uma característica essencial quando se aborda o fenômeno da polissemia. É quase unâmine o ponto de vista partilhado por especialistas em Terminologia, Ontologia, Engenharia do conhecimento, etc, de que a polissemia seja limitada a um termo homonímico.

Assim, como esforço para reduzir a ocorrência da polissemia nas linguagens especializadas, é crescente a prática da concepção de softwares com o propósito de

relacionar um termo a uma significação. A esse respeito, Silva (2006) menciona que os estudos realizados em linguística computacional privilegiam a construção de algoritmos como forma de identificar e desambiguisar os sentidos polissêmicos de uma unidade.

A defesa pela desambiguização dos sentidos de uma unidade polissêmica, juntamente com os ideais propostos por Wüster, lembra-nos que o estudo da Terminologia de caráter normativo proporcionou ao tratamento automático das línguas de especialidade um aspecto prescritivo, pois a formalização é fundamentada na construção de axiomas que resultam no estabelecimento da relação biunívoca entre formas e/ou entre forma e conteúdo.

A esse respeito, Slodzian refere que, assim como as linguagens de programação, a Terminologia comporta-se como uma fonte de desambiguização em relação à ocorrência de polissemia: “Tout comme les langages de programmation sont construits pour échapper à la polysémie des langues naturelles, la terminologie est conçue comme un rempart contre la polysémie en vue de perfectionner la langue naturelle et la «rendre sûre»” (Slodzian, 2000:64).

Por sua vez, Pisanelli et al., apesar de reconhecerem a relevância da polissemia, tendo em conta a partilha do conteúdo semântico entre diferentes bases de dados, chamam a atenção para o fato de que esse fenômeno pode ser prejudicial quando se trabalha, por exemplo, com o processamento de língua natural e o acesso a informações terminológicas de caráter normativo: “Polysemy is definitely not a negligible issue in information management, since the current demand is for an effective sharing of the semantic content of data among different databases or knowledge repositories. It may seriously hamper crucial services such as intelligent information access, natural language processing or terminological standards definition and the widespread diffusion of the so-called "semantic web".” (Pisanelli et al., 2004:416).

Park (2007) refere que as pesquisas desenvolvidas para desambiguizar esse fenômeno apresentam-se mais produtivas quando realizadas a partir do contexto.

No âmbito do tratamento informático da língua é constante a utilização do termo formalização, como meio de fixar uma dada forma ao seu conteúdo.

A esse respeito, lembramos Rastier et al. (1994); os autores sublinham que a formalização ocorre a partir de uma sintaxe construída por regras que podem representar as frases, expressões, etc, de uma dada língua; a linguagem formal é definida por uma única ordem, denominada de ordem sintática, que por sua vez, fornece um inventário de regras que serão operadas através de símbolos reconhecidos pela máquina. Nas palavras dos autores, “un langage formel se définit par un seul ordre: un ordre syntaxique (qui stipule un inventaire de règles opérant sur ces symboles)” (Rastier et al., 1994:17).

No que se refere ao reconhecimento da forma e de seu conteúdo, a construção de regras será elaborada e executada dependendo da natureza dos formalismos e de sua função.

Desse modo, a relação entre forma e conteúdo é regida por uma negociação convencionada pelo linguista-terminólogo e pelo informático, especialistas que vão decidir o que uma dada forma vai representar num determinado momento do discurso. Assim, a arbitrariedade é uma característica inerente à concepção do processo de identificação e reconhecimento da relação forma/conteúdo.

O diálogo homem-máquina é uma relação complexa, se consideramos que por detrás das formalizações semânticas encontra-se a dificuldade que consiste em expressar através de axiomas que uma forma, num determinado contexto, pode apresentar um sentido e que, num mesmo ou num outro contexto, essa mesma forma pode referir-se a um outro distinto sentido.

No tocante ao tratamento da polissemia, tentamos investigar se o conceito de formalização poderá abranger a complexidade que está por detrás da tarefa que é descrever a polissemia numa perspectiva automática, considerando que esse fenômeno consiste no estabelecimento de relações entre uma só forma com várias significações.

Desse modo, apresentamos a definição do verbete “formalisation/formalisme” retirado do “Dictionnaire des sciences du langage”: “Le terme de formalisme, appliqué

à une méthodologie scientifique, désigne un ensemble de représentations abstraites exprimées au moyen d'un langage formel. Un langage formel est un artefact, élaboré à partir de concepts logiques ou mathématiques, et construit à partir de définitions a priori. (...) Un formalisme suppose des conditions de formalisation strictes. Ainsi formaliser une règle*, par exemple, exige une définition rigoureuse des objetcs qu'elle se donne, une absence d'ambiguïté dans la définition, donc un métalangage* également stabilisé, une formalation explicite, permettant son application par un automate*, et où l'intuition par conséquent n'a aucune part.” (Neveu, 2004:136-137).

Diante da definição de formalização, pensamos ser conveniente e útil falar sobre tratamento automático da polissemia como um processo que viabiliza a representação do conteúdo polissêmico de uma forma.

O tratamento automático da polissemia constitui uma barreira, que ainda não chegou a ser superada. A esse respeito, lembramos Cadiot e Habert. Os autores evidenciam que as ferramentas automáticas existentes não estabelecem as relações entre os diferentes sentidos de uma unidade lexical, que de certa maneira partilham características em comum: “Les analyses automatiques, elles, pratiquent le plus souvent le dégroupement homonymique faute d'avoir encore pu établir des dispositifs satisfaisants pour articuler ces sens ressentis comme apparentés.” (Cadiot e Habert, 1997:3). Embora seja uma citação de um texto escrito há cerca de 16 anos, no entanto mantem-se atual.

A tarefa de associar automaticamente vários sentidos entre si, considerando que esses mesmos elementos são semelhantes em função de suas características, e que ainda podem ocorrer em apenas um ou vários contextos, constitui um problema a resolver. Acrescentamos ainda que a ocorrência do sentido de um termo, em situação de discurso, nem sempre é apresentada de forma clara e objetiva no contexto.

Diante dos obstáculos anteriormente citados, Apidianaki refere que a dificuldade de se associar os sentidos a um dado termo reside na definição desse mesmo sentido e na falta de consenso entre os especialistas no que se refere à descrição do próprio sentido sob a ótica do tratamento automático: “La notion du sens peut être appréhendée de différentes manières et la diversité des représentations sémantiques existantes démontre la difficulté de trouver un consensus concernant la

nature du sens et sa description optimale dans le cadre du traitement automatique.” (Apidianaki, 2006:2).

Seguindo essa mesma linha de pensamento, Mazaleyrat reconhece a dificuldade de estabelecer relações entre os sentidos polissêmicos de uma unidade lexical. Desse modo, o autor questiona como representar a relação estabelecida entre um sentido com outros elementos. “En revanche, c’est beaucoup moins simple pour les unités lexicales polysémiques dont les sens sont, rappelons-le, distincts mais apparentés. Un polysème serait bien relié à une seule et unique entrée, mais à combien de structures sémantico-conceptuelles celle-ci serait-elle associée?” (Mazaleyrat, 2010:149).

As citações mencionadas demonstram a necessidade de se refletir sobre a descrição da polissemia a partir do sentido. Considerando-se o sentido como um elemento central dos estudos sobre esse fenômeno, é necessário delimitar o seu estudo em função do objetivo a ser realizado, que, nesse caso, diz respeito à análise e à descrição da polissemia para fins de automatização.

Reconhecemos que a identificação e a extração dos conteúdos semânticos por parte dos sistemas informáticos gera uma série de problemas, tanto para o linguista- terminólogo, quanto para o informático.

Assim, mencionamos que a relação entre esses dois profissionais é de extrema relevância para alcançar resultados satisfatórios em relação à concepção de ferramentas que possam reconhecer com fiabilidade o conteúdo semântico de um termo.

O linguista-terminólogo, como especialista da língua, é conhecedor das regras gramaticais do sistema linguístico. Dessa maneira, a sua tarefa consiste em descrever esse sistema, conforme o objetivo do estudo. Com base nos corpora de especialidade, por exemplo, esse especialista descreve as variadas e distintas ocorrências do termo relacionado com os seus conteúdos.

Por fim, podemos referir a relevância dos dados quantitativos para identificar as mudanças que ocorrem na língua. O uso de dados quantitativos permitem aos linguistas acompanhar as mudanças específicas no que diz respeito à evolução da

língua, bem como identificar e descrever as tendências gerais da mudança que seriam difíceis de serem traçadas com precisão, sem o auxílio desses dados (cf. Sánchez- Marco et al., 2010).

Sem desmerecer a relevância das ferramentas automáticas desenvolvidas em função de uma abordagem prescrita pela teoria terminológica, convém ainda lembrar que as variações são realidades inerentes ao funcionamento das línguas de especialidade. Desse modo, a polissemia necessita ser reconhecida, identificada e sistematizada.

O reconhecimento do tratamento automático da polissemia como um fenômeno diacrônico que constitui a realidade de todo domínio de especialidade beneficia a descrição e sistematização e organização do próprio domínio.