Funcionamento do Raciocínio Baseado em Casos

2.4 RACIOCÍNIO BASEADO EM CASOS

2.4.2 Funcionamento do Raciocínio Baseado em Casos

O Caso é um pedaço contextualizado de conhecimento, o qual representa uma experi- ência contendo lições passadas e o seu contexto de uso (WATSON e MARIR, 1994). Tipica- mente é representado por: (i) um problema (cenário do caso); (ii) uma solução (conjunto de passos para solucionar o problema) e (iii) um resultado (comportamento do domínio após a aplicação da solução).

O caso pode ser apresentado por inúmeras formas, no entanto, é consenso na comuni- dade RBC a dificuldade em identificar exatamente qual informação deve ser registrada para a sua representação (KOLODNER, 1992).

Kaufmann (2003) considera que, de modo geral, a representação de um caso pode ser vista como um conjunto de pares (atributo-valor) indexados (armazenam informações que auxiliam na redução do espaço de busca de um caso) ou não (usados para armazenar informa- ções sobre o contexto do caso, mas sem auxiliar a recuperação). Dessa forma, a definição dos atributos indexados influencia na precisão e velocidade de recuperação de casos.

SHIU e PAL (2004) ressaltam que um bom índice em RBC deve ser unívoco, permi- tindo a distinção macro sem ser totalmente exclusiva.

A indexação de um caso envolve a atribuição de índices para facilitar a sua recupera- ção, devendo ser: (i) previsíveis quanto à futura utilização para solucionar diferentes proble-

mas; (ii) endereçados as similaridades entre os casos; (iii) abstratos o suficiente para permitir o uso futuro do caso-base; (iv) concretos o suficiente para ser reconhecidos no futuro (WAT- SON e MARIR, 1994).

Os índices então são utilizados na fase de recuperação através do cálculo de similaridade entre os vários casos.

Na etapa de recuperação, o sistema RBC efetua a busca na memória de casos no intui- to de identificar casos-base similares ao consultado. Dessa forma, para que a recuperação de casos seja possível, são necessárias as seguintes etapas (CAMARGO, 1999):

 Identificar características semelhantes: consiste no auxílio ao usuário em construir con- sultas com atributos relevantes para a recuperação do caso;

 Avaliar similaridade: avaliada com base nos casos candidatos, contidos na base. Essa avaliação é realizada pela junção dos recursos sistema e especialista: identificação do sistema de casos com atributos semelhantes aos informados na pesquisa, possibilitando a avaliação do especialista baseando em seu conhecimento pessoal.

 Seleção: identificar o melhor caso dentre os apresentados após a avaliação de similaridade.

A recuperação de casos está intimamente relacionada ao armazenamento e indexação destes. A similaridade é obtida através de uma medida de distância. Os métodos vizinho mais próximo, algoritmo de indução e o de recuperação de padrões são os mais comumente utilizados, podendo ser utilizados sozinhos ou mesmo combinados, de acordo com a estratégia de recuperação (SHIU e PAL, 2004). Para efeito deste estudo, serão aprofundados os conheci- mentos sobre o método vizinho mais próximo.

O vizinho mais próximo é obtido através da comparação entre o problema atual e os casos passados por meio do cruzamento da soma ponderada de suas características. Para isso são utilizadas as similaridades global e local. A similaridade global é determinada através da média ponderada de todas as similaridades locais, obtidas pelo valor (relacionado ao peso) de semelhança de um determinado atributo. Dessa forma, os pesos de cada funcionalidade devem ser atribuídos de forma criteriosa, pois serão através destes a mensuração do grau de impor- tância dos atributos que compõem um caso (WATSON e MARIR, 1994).

∑

∑ (1)

onde: C = Caso consultado; R = Caso recuperado da base; n = número de atributos no caso; w = peso atribuído ao i-ésimo atributo; f = função que calcula a similaridade local entre os casos

C e R para o i-ésimo atributo.

O ajuste de pesos pode e deve ser efetuado visando a melhor identificação da similaridade.

São muitas as funções de similaridade local, pois seu cálculo é dependente do tipo de dado do atributo (SHIU e PAL, 2004):

 Distância Euclidiana: corresponde à distância geométrica de dois objetos no plano mul- tidimensional. Nessa equação o peso indica a importância do atributo no caso. É comumente utilizada para identificar similaridades entre os atributos baseados em casos.

√ (2)

onde = a distância euclidiana entre as coordenadas p e q, ajustada pelo peso w.  Distância de Hamming: corresponde à distância entre dois bits na comparação entre ve-

tores.

 Distância Levenshtein: corresponde ao cálculo da quantidade de transformações (inclu- são, alteração, exclusão) sofridas por uma string. Dessa forma, será considerada de mai- or semelhança a string que possuir menor número de transformações para ser conside- rada similar à consultada.

 Cosine Similarity: definida pela medida de similaridade existente entre o coseno do ân- gulo de dois vetores. Usualmente utilizada para medir a similaridade entre documentos textuais, constituindo um vetor pela frequência dos termos apresentados.

_{√ √} (3)

onde A e B são dois vetores distintos.

 Jaccard Coefficient: a similaridade é definida através da diversidade de um conjunto, dividindo a quantidade de elementos de intersecção pelos elementos de união.

(4)

 Overlap Coefficient: a similaridade é definida através da relação entre o tamanho de in- terseção entre dois conjuntos e o tamanho do menor conjunto, definindo o quão próxi- mo está o menor conjunto do subconjunto do conjunto maior.

(5)

ação o custo computacional pode não ser satisfatório. Ao contrário do que ocorre nos bancos de dados tradicionais que recuperam através da igualdade entre os termos, o raciocínio baseado em casos se preocupa com a similaridade entre atributos, sem a necessidade da perfeita semelhança.

A partir da identificação de semelhanças, é possível reutilizar algum caso. O reuso de casos pode ser realizado das seguintes formas: (i) reinstanciação, solução aproveitada comple- tamente para o novo caso, ou (ii) adaptação, construção de uma nova solução, considerando os casos apresentados, porém modificando-os de acordo com as necessidades da situação em questão (SHIU e PAL, 2004).

Após o reuso, o caso está pronto para ser posto em prática. Neste momento é realizado o acompanhamento da eficiência do caso, identificando e reparando as possíveis falhas na solução escolhida.

Por fim, o caso é retido e disponibilizado no sistema de RBC para novas situações problema.

No documento Reuso de decisões no processo de desenvolvimento de software (páginas 42-45)