• Nenhum resultado encontrado

Compreendendo a Importância de Incertezas em Ontologias

Se não entrarmos muito em questões filósóficas ou religiosas, de fato a incerteza é onipre- sente no nosso cotidiano, e isso não é algo tão surpreendente.

Há quase um século, o Demônio de Laplace6 foi considerado como morto por estudiosos da física quântica, que afirmam a impossibilidade de se determinar duas propriedades de uma partícula quântica simultaneamente com exatidão, inserindo-se então um certo grau de incerteza (princípio da incerteza). O raciocínio diagnóstico (amplamente utilizado por médicos, técnicos de oficinas de automóveis, auditores da Receita ou CGU, etc.) é incerto por natureza, pois utiliza as consequências (sintomas) para implicar causas - algo ilógico. Ora, a nossa própria linguagem utilizada na comunicação é repleta de incertezas; quem já conseguiu transmitir com exatidão a intensão real na primeira tentativa, sem se usar termos “redundantes”? Pelo menos, reconheço que esta dissertação está repleta de redundâncias.

Além da incerteza oriunda do próprio domínio de conhecimento, um caso previsto na Web Semântica é a união de ontologias (como mencionado na Seção 2.3.4), que é uma potencial fonte de contradições ou imprecisões na informação.

Outro problema que se imagina ocorrer em ontologias convencionais é o problema de infor- mações incompletas. Esse tipo de situação ocorre quando instâncias (indivíduos) de classes são pesquisadas, mas algumas instâncias críticas para terminar a pesquisa não estão presentes.

Com a condição acima, uma busca que trata essas instâncias geraria resultados duvidosos, pois não haveria elementos que atenderiam a 100% do requisitado. O modelo convencional so- mente considera os casos de requisitos “completamente atendidos” ou “completamente falhos”; nesse caso, as instâncias que atendem “parcialmente” aos requisitos deveriam ser eliminadas ou consideradas? Note que se considerarmos as “parciais” como “completas”, as “parciais” que atenderam a poucos requisitos serão tratadas com a mesma importância dos que atende- ram mais requisitos; no caso contrário, se ignorarmos os resultados “parciais”, informações preciosas serão desperdiçadas e a busca não seria eficaz.

Adicionalmente, problemas de confiabilidade da fonte de informação podem surgir. Surge também a necessidade de se “ponderar”, de alguma forma, as informações quanto sua credibi- lidade na hora de realizar buscas (ou inferências). Reforça-se então a necessidade de represen- tação e manipulação de ontologias com tratamento de incertezas, que é um dos nossos objetos de estudo.

A Uncertainty Reasoning for the World Wide Web Incubator Group(72), um grupo incu- bado pelo W3C, tem trabalhado na determinação de soluções para tratamento de incerteza em tecnologias World Wide Web. A linguagem PR-OWL (vide Seção 2.6), com sua abordagem probabilística, está sendo referenciada como uma das possíveis abordagens.

O Capítulo 7 apresenta um exemplo real que ilustra melhor um domínio com necessidade de tratamento de incertezas. Nesse problema, uma abordagem probabilística foi escolhida como solução. A leitura desse exemplo pode auxiliar melhor o leitor no entendimento dos detalhes sobre a necessidade de tratamento de incerteza na Web Semântica.

2.4.1 A Abordagem Probabilística

A abordagem probabilística baseia-se nas teorias da probabilidade para a representação de incertezas em uma ontologia. A probabilidade está intimamente relacionada com a freqüência,

6O Demônio de Laplace é uma figura hipotética criada pelo matemático Pierre-Simon Laplace na tentativa de

se ilustrar uma situação em que se todas as partículas do universo e seus estados (momento) fossem conhecidos, seria possível revelar o passado e o futuro com exatidão.

crença, ocorrência ou relações de causa e efeito sobre um evento. Podemos aplicar diversos conceitos da teoria do conjunto para o tratamento de probabilidades.

A representação é feita através de numerais com valores dentro do intervalo fechado entre 0 e 1. O processo de validação e inferência é feita basicamente com o auxílio de modelos bayesianos. Um exemplo é a PR-OWL, linguagem tratada na Seção 2.6 como proposta de extensão da OWL para a incorporação de tratamento de incerteza por uso de probabilidades. A representação de incerteza da PR-OWL segue o formalismo MEBN.

As razões que podem justificar o uso da abordagem probabilística são muitas. Dentre elas, podemos citar as seguintes:

• A incerteza é representada por valores numéricos limitados no intervalo [0,1]. Operações são fechadas nesse intervalo (i.e. qualquer operação resultará em um valor no intervalo [0,1]).

• Possui propriedades bem definidas e predizíveis matematicamente. • Possui restrições suficientes para manter o resultado computável. • É semanticamente bem definida.

• Intimamente ligada à “freqüência” ou “chance” de ocorrência; seja, está ligada à estatís- tica, a observação dos fatos; logo, abstrai-se a capacidade de atualização das ontologias através da observação dos fatos.

• Comparado ao modelo fuzzy, pode ser mais facilmente estendido a domínios maiores, pois sua semântica é definida e a lógica fuzzy representa um conceito relativamente res- trito de incerteza (o “vago”).

• Desde que uma informação represente somente um (1) “significado” em um determinado momento, a probabilidade representa melhor a realidade do que a lógica fuzzy. Ilus- trando esse exemplo, informações ambíguas com 50% de validade indicam que uma das interpretações é válida com 50% de chance (mas que somente uma das interpretações da instância será válida em um determinado momento).

• Como comparação, o “0.5” na lógica fuzzy indica que uma instância está “meio” ver- dadeira e “meio” falsa simultaneamente, enquanto que na probabilística ele indica que a instância fará parte da verdade na metade das ocasiões observadas (ou com a metade da chance total) - no final, a instância pertencerá a somente um dos conjuntos, nunca em ambos.

Uma linguagem de representação de ontologias não possui valor prático sem um modelo computacional de edição e inferência. O UnBBayes-MEBN realiza uma implementação de editor e máquina de inferência para a PR-OWL, linguagem de ontologia probabilística.