PRO_I°OSTA
DE
MODELO
RBC PARA
A RECUPERAÇAO
INTELIGENTE
DE JURISPRUDÊNCIA
NA
PROPOSTA
DE
MODELO
RBC PARA
AA RECUPERAÇAO
INTELIGENTE
DE JURISPRUDENCIA
NA
JUSTIÇA
FEDERAL
Mário de
Sena
Braga JúniorDissertação apresentada ao
Programa de Pós-Graduação
em
Engenharia de Produção da
Universidade Federal de Santa Catarina
Como
requisito parcial para obtençãoFlorianópolis
2001
do título de Mestre
em
ll
Mário
de
Sena
Braga
JúniorPROPOSTA
DE
MODELO
RBC PARA
'_A RECUPERAÇAO
INTELIGENTE
DE JURISPRUDENCIA
NA
JUSTIÇA
FEDERAL
Esta dissertação foi julgada e aprovada para obtenção do título de Mestre
em
Engenhariade
Produçao no Programa de Pós-Graduação
em
Engenhariade
Produção
da Universidade Federal de Santa Catarina.Florianópolis, 14 de
dezembro
de,.2001.Prof. Ricar o M' anda Bar 'a, Ph. D.
Co rden dor do C so
BANCA
EXAMINADORA
ProfÍ6hri~re
-~ àz Wangenheim, Dra Eng.ntador
Profa. Elisabeth Sueli pecialiski, Dra. Prgf/fiejndro a '
o r`
À
Deus
pela sua fidelidade.À
minha querida Kátia pelo seuamor
e incentivo.Aos
meus
filhos Luís Mário e Luís HenriqueIV
Agradecimentos
À
União Educacional de Brasília e à Universidade Federal de Santa Catarina pela oportunidade de realização do mestrado.À
Professora Christiane Gresse vonWangenheim
pela orientação e apoio.Aos
professores do curso de pós-graduaçãopelos conhecimentos transmitidos.
À
equipe de apoio doPPGEP
pela atenção e presteza nos atendimentos de secretaria.
Ao
professor Nelson daUNEB
pelas palavras de confiança.
À
colega Raquel doTRF
pelo vasto e importante material sobre
RBC
colocados à minha disposição.Ao
estagiário Adriano doTRF
pelo auxílio na diagramação do trabalho.
À
Secretaria de informática doTRF
pelo apoio e incentivo.
À
Secretaria de Jurisprudência, Regimento e Divulgação institucional doTRF
'
pelo repasse das informações de jurisprudência.
À
colega Yara doTRF
pelo auxílio na revisão de português.
A
todos que direta ou indiretamente contribuíram para a realizaçaoa sabedoria entrará no teu coração e o conhecimento será agradável à tua aIma".
suMÁR|o
RESUMO
... ..XiiiABSTRACT
... .. xv 1INTRODUÇAO
... .. 1.1 Motivação ... .. 1.2 Objetivos ... ._ 1.2.1 Objetivo Geral ... _. 1.2.3 Objetivos Específicos ... .. 1.3 Justificativa e Importância ... _. 1.4 Ambiente de Aplicação ... _. 1.5 Estrutura do Trabalho ... .. 2FUNDAMENTAÇÃO
TEÓRICA
... .. 2.1 Inteiigência Artificial ... _. Vl 1 G)U'IJ>›<.›JCaJ0O0J 9 9 2.1.1 Representaçao do Conhecimento ... .. 10 2.1.2 Processamento do Conhecimento ... .. 132.2 Raciocínio
Baseado
em
Casos
-RBC
... .. 152.2.1 Histórico ... .. 15 2.2.2 Ciclo
de
Processamento ... _. 18 2.2.2.1 Representação deCasos
... _. 21 2.2.2.2 Indexaçãode
Casos
... .. 24 2.2.2.3 Recuperaçãode
Casos
... .. 25 2.2.2.4 Reutilização deCasos
... .. 29 2.2.2.5 Revisãode Casos
... .. 30 2.2.2.6 Retenção deCasos
... .. 30 2.2.3 Aplicações Jurídicas ... .. 312.3 Aspectos da Pesquisa de Jurisprudência ... ._ 32 3
JURISPRUDÊNCIA
NO
TRF
... ..37 3.1 Processamentode
Acórdaos ... ._ 37 3.2 Cadastro de Acórdãos ... ._ 38 3.3 Recuperação de Informações ... _. 41 4MODELO
RBC
PROPOSTO
... ..45 4.1 Idéias Básicas ... ..45
4.3
Método de
Recuperação4.3.1 Ajuste da Situação ... ..
4.3.2 Aplicação da Métrica de Similaridade ... ..
4.3.3 Seleção e Apresentação dos Acórdãos ... _.
4.4 Aquisição Contínua de
Novos
Acórdãos ... ._5
CONCLUSÕES
E
RECOMENDAÇÕES
PARA
FUTUROS TRABALHOS
6FONTES
BIBLIOGRÁFICAS
... ..7
ANEXOS
... .. 7.1Exemplo
de Acórdao ... ._ 7.1.1Documento
Produzido no Gabinete do Juiz ... ..7.1.2
Documento de
Pesquisa da Internet ... ..Vlll
LISTA
DE
FIGURAS
Figura
1:0
Ciclo doRBC
... ..19Figura 2: Etapas do Processamento de Acórdãos ... .. 38
Figura 3: Tela de Atualização de Acórdãos ... ..40
Figura 4: Tela Inicial de Pesquisa de Acórdão ... ..42
Figura 5: Tela de Processos Pesquisados ... ..43
Figura 6:
Esquema
Lógico da Busca Textual Atual ... ..44Figura 7: Motor de Conhecimento
RBC
na Recuperação de Acórdãos ... ..45Figura 8:
Esquema
Lógico da Busca Textual Inteligente ... ..53LISTA
DE
QUADROS
Quadro 1: Exemplos de Aplicações
em
RBC
na área de inteligência jurídica ... ..32X
LISTA
DE
TABELAS
Tabela 1: Demonstrativo dos Acórdãos Publicados, Cadastrados e Expurgados .4O
Nomes
e Siglas
BRS
/SEARCH
-
Software textual daempresa
Padrão iXCJF
-
Conselho da Justiça FederalCHECKLIST
-
Lista de conferênciaCYRUS
-
Computerized Yale Retrieval and UpdateSystem
FAQ
-
FrequentlyAsked
QuestionsFGTS
- Fundo
de Garantia porTempo
de ServiçoFUZZY
- Método
matemático nebuloso de recuperação de casosHTML
- Hyper TextMarkup Language
IA - Inteligência Artificial
IPP
-
Integrated Partial ParserISO - International Organization for Standardization
IBM
- International Business Machines CorporationlNTERMEDlA
TEXT
-
Software textual daempresa
OracleJURIS -
Sistema deAcompanhamento
Processual doTRF
da 1a RegiãoMOP
-
Memory
Organization PackagesNEAREST-NEIGHBOR
- Método
vizinho-mais-próximode recuperação de casos
ODBC
-
Open
DataBase
ConnectivityORACLE
-
Fabricante de Software de banco de dadosPL/
SQL
- Procedural Language/Structured QueryLanguage
RAM
-Random-Access
Memory
RBC
-
RaciocínioBaseado
em
Casos
RBR
-
RaciocínioBaseado
em
RegrasRlSC
-Reduced
lnstruction SetComputer
SAM
-
Primeiro software decompreensão
da históriaSCALA
/BULL
- Computador
daempresa
ABC
BULL
STOPWORDS
-
Palavras e/ou conectores definidos paraserem
retirados do'
texto
SUB
JUDICE
-
Em
juízoTRF
-
Tribunal Regional Federal da 13 RegiãoRESUMO
BRAGA
Jr., Mário de Sena. Propostade Modelo
RBC
para aRecuperaçao
Inteligente
de
Jurisprudência na Justiça Federal. 2001. 89f. Dissertação(Mestrado
em
Engenharia de produção) - Programa de Pós-Graduaçãoem
Engenharia de produçao,
UFSC,
Florianópolis.No
sistema jurídico brasileiro, a jurisprudência é fonte formal do Direito, utilizada na interpretação de leis e solução de casos jurídicos.O
conteúdo dajurisprudência é representado pelos acórdãos proferidos nos tribunais.
A
principal dificuldade dos proflssionais da área juridica é encontrar, no meio
de
tantas decisões, os acórdãos mais
adequados
para a solução de seusproblemas.
Os
sistemas atuais localizam e selecionam as informações pormeio de operadores textuais, levando-se
em
conta somente as palavras encontradas no texto dos acórdãos.De
uma
maneira geral, as pesquisas nesses sistemas saodemoradas
e abrangentes, dificultando a escolha dasolução mais apropriada para os problemas jurídicos. Partindo dessa
constatação, o presente trabalho propõe
um
modelo de inteligência artificialem
RBC
(RaciocínioBaseado
em
Casos) para a recuperação inteligente dejurisprudência na Justiça Federal.
A
técnica deRBC
é utilizada pararecuperação de
documentos
jurídicos semelhantes eadequados
auma
determinada solução.O
atual sistema de jurisprudência do Tribunal RegionalFederal da la Região, desenvolvido. exclusivamente para pesquisa textual,
serviu de referência para os estudos comparativos de viabilidade do novo modelo.
A
proposta manteve a atual sistemática de pesquisa textual eXIV
acórdãos.
A
nova arquiteturacompreende
pesquisa textual, estruturas de conhecimento, vocabulário controlado e grau de similaridade que, conjuntamente,tendem
a melhorar a precisão e eficiência do sistema dejurisprudência.
Palavras-chave: Inteligência Artificial,
RBC
(RaciocínioBaseado
em
Casos),Teoria de Conhecimento, Justiça Federal, Jurisprudência, Acórdão,
ABSTRACT
BRAGA
Jr., Mário de Sena. Propostade Modelo
RBC
para aRecuperação
Inteligente de Jurisprudência na Justiça Federal. 2001. 89f. Dissertação
(Mestrado
em
Engenharia de produção) - Programa de Pós-Graduaçãoem
Engenharia de produção,
UFSC,
Florianópolis.ln the Brazilian juridical system, jurisprudence is the formal source of the
Law, used in the interpretation of laws and the solution of Iawsuits.
The
contentof the jurisprudence is represented by the sentences uttered in the tribunais.
For the professionals of the juridical area it is difficulty to find, in the middle of so
many
decisions, the most appropriate sentences for the solution of theirproblems.
The
current systems locate and select the information through textual operators, taking into account only the words found in the text of the sentences.In general, searches in those systems are slow and covered, making difficult
the choice of the most appropriate solution for the juridical problems. Leaving of that verification, the present work proposes a
CBR
(Case-Based Reasoning) forthe intelligent retrieval of jurisprudence in the Federal Justice.
The
technique ofCBR
is used for similar and appropriate retrieval of juridical documents for a certain situation.The
current system of jurisprudence of the Tribunal Regional Federal, developed exclusively for textual research, served as reference for the comparative studies of viability of thenew
model.The
proposal maintained thecurrent systematic of textual research and added a knowledge motor for the
production and retrieval of the sentences.
The
new
architecture considerstextual research, knowledge structures, controlled vocabulary and slmilarity degree that, jointly, tend to improve the precision and efficiency of the
jurisprudence system.
Key-words: Artificial intelligence,
CBR
(Case-Based Reasoning), Theory ofl
1
|NTRoouÇÃo
A
inteligência artificial possuicampo
para muitas aplicações na áreado
conhecimento jurídico (Hoeschl, 1997), principalmente na busca
de
analogiasentre julgamentos proferidos pelos tribunais a respeito de
um mesmo
assuntojuridico. Esses julgamentos,
em
sentido uniforme,que
se referem a casosidênticos, repetidamente manifestados, constituem o que
denominamos de
jurisprudência (Federighi, 1999).No
sistema jurídico brasileiro, a jurisprudênciaé fonte formal do Direito Positivo (Reale, 1994).
A
jurisprudência é textualmente representada pelos acórdãos e divulgadapelo Diário
de
Justiça,que
publica asementas
de todos os acórdãos proferidospelo Tribunal.
Em
seguida, essasementas
são selecionadas, catalogadas eindexadas na base
de
jurisprudência para, então,serem
colocadas à disposiçãodo
público para consulta. Mensalmente, o Tribunal Regional Federalda 1° Região analisa e insere,
em
média, 2.000 acórdãos na basede
jurisprudência. .
Apesar da média bastante elevada
de
publicações inseridas, o processode
recuperação e
armazenamento
de acórdãos não é eflciente e preciso.As
principais causas e conseqüências desses problemas são:Causas:
~/ a arquitetura do sistema atual de jurisprudência é
baseada
unicamente na indexação textual, não existindo
nenhuma
preocupação
com
a semelhança de conteúdo' dos acórdãos~/ o
método de
pesquisaempregado
limita-se àcomparação
entre aspalavras do texto de entrada e as palavras do texto do acórdão
recuperado,
sem
a preocupaçãocom
o conhecimento jurídico aliconfido.
Conseqüências:
\/ elevada ocorrência de consultas abrangentes,
com
a exibiçãode
acórdãos
sem
nenhuma
indicação de semelhança de conteúdos, oque
dificulta ao pesquisador encontrar a informação mais apropriadaao problema a ser resolvido;
~/ várias inclusões de acórdãos repetidos, devido as falhas na pesquisa
de casos análogos, o
que
gera o acúmulo de informações desnecessárias na base de dados.Diante dessa situação, procuro-se na inteligêncianartificial
uma
novatecnologia
que
oferecesse recursos maisadequados
ao aprimoramentoda
qualidade
de
pesquisade
jurisprudência.Sabe-se
que
a aplicação da Inteligência Artificial na jurisprudênciatem
sidoexeqüível,
com
resultados satisfatórios, pelo uso da técnicade
RaciocínioBaseado
em
Casos -
RBC
(Aamodt&
Plaza, 1994). Essa técnica selecionacasos anteriores e semelhantes,
em
concordânciacom
as informações deuma
situação específica.
Dessa
maneira, os acórdãos são identificados porsimilaridade e aproveitados para
um
determinado casode
entrada (Weber,1998).
A
propostado
presente trabalho é apresentarum
modelo
de pesquisade
jurisprudência inteligentecom
oemprego
doRBC,
tendo por base os acórdãos3
do
Tribunal Regional Federal da 1” Região. Pretende-secom
o novomodelo
produzir pesquisas mais eficientes e precisas na área
de
jurisprudência eresolver os problemas apresentados pelo uso exclusivo da indexação textual.
1.1
Motivaçao
A
principal motivação reside na possibilidade demudança
do
paradigmaatual de pesquisa de jurisprudência do TRF, pautada na busca de bases textuais, para a construção
de
um
modelo de conhecimento de casos, a partir da utilização da tecnologiaRBC, que
representauma
ferramenta poderosadentro da inteligência artificial (Aamodt
&
Plaza, 1994).A
mudança
possibilitaráque
magistrados, advogados, estudantesde
direitoe outros interessados
tenham
acesso mais eficiente e preciso aos acórdãosque
mais seassemelham
às suas necessidades de argumentação jurídica.1.2
Objetivos
1.2.1 Objetivo Geral
O
objetivo geral deste trabalho é desenvolveruma
proposta demodelo
para a recuperação e oarmazenamento
inteligentede
jurisprudênciabaseado
em
RBC
que
possibilite a busca rápida, organizada, eficiente e precisade
acórdãos mais assemelhados às necessidades do pesquisador, levando-se
em
conta o conhecimento jurídico neles inserido.1.2.3 Objetivos
Específicos
~/ conhecer a teoria
RBC,
como
técnicade
IA e sua aplicação àjurisprudência;
~/ apresentar o modelo de jurisprudência textual existente no TRF,
levando-se
em
consideração os aspectos demodelagem
e funcionalidade;l
›/ analisar e caracterizar os acórdãos do TRF;
1
desenvolveruma
proposta deabordagem
inteligente para arepresentação, recuperação e aquisição continua
de
acórdãos e~/ definir as estruturas
de
conhecimento e a métricade
similaridadeaplicada ao
modelo RBC.
1.3 Justificativa
e Importância
O
modelo atualde
pesquisa de jurisprudência doTRF
está pautadoem
banco
dedados
textual e apresenta deficiências na recuperação dos acórdãos.No
sistema sãoarmazenados
osdados
referentes ao processo, suaementa
e outras informações que melhor identifiquem a decisão proferida nojulgamento. Depois de indexadas, essas informações
passam
a fazer partedo
sistema para a recuperação dos acórdãos. Assim, a busca é feita a partir
da
similaridade
com
as palavras constantes no textode
entrada da pesquisa, enão
com
o conteúdo, o que propicia o aparecimento de grande quantidadede
documentos.
Dessa
forma, a seleção dos acórdãos torna-se morosa, vistoque
precisam ser analisados para escolha daqueles
que
melhor se apliquem à solução do problema.Uma
forma de contornar onúmero
excessivode
5
registros para análise.
O
prejuízo é oenorme tempo
utilizado na pesquisa e a necessidade do conhecimento mais apurado dos operadores booleanosde
busca textual.
Assim
sendo, torna-se premente amudança
do modelo
atual poruma
tecnologia mais avançada e inteligente
que
possibilite a recuperaçãode
acórdãos
de
conteúdo semelhante ao questionado.O
RaciocínioBaseado
em
Casos
apresenta-secomo
a melhoropção
tecnológica para esse casorxoioóner, 1993).
'
A
pesquisa de jurisprudência inteligente visa encontrar a similaridade entre decisões passadas,de
formaque
possam embasar
novas situações surgidas (Weber, 1998).O
modelo proposto baseia-seem
resultados significativos na consultade
jurisprudência pela diminuição de informações redundantes, possibilitando a
celeridade na recuperação
de
casos equivalentes e, conseqüentemente,orientações e argumentações jurídicas mais consistentes e precisas.
Os
acessos se tornarão mais eficazes e eficientes para magistrados, advogados,
estudantes e o público
em
geral, tornando-seuma
importante fontede
pesquisa para acomunidade
jurídica do país.Em
resumo, o impulso produzido pela tecnologia de inteligência artificial,com
a aplicação do modeloRBC,
vai representaruma
significativa contribuição para o aperfeiçoamento, divulgação e pesquisa da jurisprudência no âmbitoda
justiça federal.O
Tribunal Regional Federal da 13 Região,com
sedeem
Brasília, foiinstalado
em
1989 ecompõe-se de
vinte e sete juízes vitaliciosnomeados
peloPresidente da República.
É
de
competência do Tribunal julgar causasoriginárias ou
em
graude
recurso na esfera da justiça federal.Assim que
chegam
ao Tribunal, os processos são distribuídosautomaticamente aos juizes relatores, após a análise da matéria jurídica
de
cada processo e a especialização dos Órgãos julgadores.Os
Órgãos julgadores estão divididosem
plenário, seções e turmas,sendo
responsáveis pela tramitação e julgamento dos processos.
A
fasede
julgamento representa a primeira etapa
do
ciclo de geraçãode
um
acórdão.No
Anexo
7.1, apresenta-seum
exemplo típico de acórdão proferido pelo TRF.Depois do julgamento, os relatores preparam os respectivos acórdãos para publicação na imprensa oficial.
A
partir dessemomento,
aComissão de
Jurisprudência seleciona os acórdãos que farão parte da pesquisa
de
jurisprudência
do
Tribunal.O
TRF
possuium
sistema eletrônico de jurisprudênciacom
aproximadamente 110.000 acórdãos
armazenados
nobanco
dedados
textualBRS
Search versão 6.3. Atualmente, são incluidos,em
média, 100 acórdãospor dia.
Os
dados
de cadastro emovimentação
processual ficam gravados no banco dedados
relacional Oracle 8i.A
proposta prevê que a recuperaçãotextual e a integração total ao banco de dados relacional por meio do uso dos
7
Os
módulosde
carga e pesquisa da base textual foram desenvolvidosem
Visual Basic versão 6.0.A
conexãocom
o banco dedados
Oracle 8i é feita viaODBC
versão 7.3.A
pesquisa disponível na intranet/internet foi desenvolvidaem
HTML.
As
opções de pesquisa são por meio de texto livre (temática) e/ou filtrosde
pesquisa
como
número
do processo, relator e órgão julgador. Hoje, amédia
aproximada de consulta de jurisprudência é
de
1.000 acórdãos por dia.Antes da inclusão na base de jurisprudência, a
Comissão
de Jurisprudênciaseleciona os acórdãos por assunto.
Os
acórdãoscom
omesmo
teor/relatorsão desconsiderados para fins de
armazenamento
no banco de dados. Essaanálise é feita pela
comparação
textual do acórdãode
entradacom
osacórdãos armazenados. Depois, os acórdãos selecionados são indexados e
colocados à disposição no
banco
dedados
textual para pesquisa.A
base dedados
textual, incluindo os indices, ocupauma
área de discode
aproximadamente 3,8 gigabytes.
À
O
sistema possui os seguintes recursos computacionais para o seufuncionamento: servidor Scala/Bull
com
8 processadores Riso de 75 mhz, 2gigabytes
de memória
RAM
e 100 gigabytes de disco.O
sistema operacional éUnix Aix//BM,
com
capacidade para 500 ligações simultâneas.Todo
estudo feito para omodelo
proposto considera a sistemáticade
seleção
de
acórdãos, o ambiente atualde
software e hardware instalados e a previsibilidadedo
aumento
significativo dos julgamentos para os próximos anos,em
virtude das evidências estatisticas apresentadas no Capitulo 3.1.5
Estrutura
do
Trabalho
O
trabalho está estruturadoem
cinco capítulos assim distribuidos: opresente capitulo apresenta os seguintes itens: assunto de pesquisa, objetivos, justificativa e importância e ambiente de aplicação para o novo modelo.
O
Capitulo 2 trata da fundamentação teórica para o conhecimentoda
Inteligência Artificial direcionada
ao
RBC
e aspectos relacionados à pesquisa de jurisprudência.O
Capitulo 3 é dedicado ao estudo de casodo
sistemade
jurisprudênciado
TRF,
baseado
em
modelo textual, abordando a estrutura, o processamento, o cadastro e a recuperaçãode
acórdãos.No
Capítulo 4, apresenta-seuma
proposta de desenvolvimentodo modelo
RBC
para a pesquisa inteligentede
jurisprudência, incluindo a visão geral, arepresentação
do
conhecimento, recuperação e aquisição continuade
casos.Finalmente, no Capítulo 5, são apresentadas as conclusões sobre o
modelo
9
nú I
2
FUNDAMENTAÇAO
TEORICA
2.1 Inteligência Artificial
A
Inteligência Artificial (IA) estuda os possiveismodos
decomo
fazer amáquina executar ações próprias da inteligência
humana.
Representa ocampo, na ciência da computação, destinado ao desenvolvimento de sistemas
que
simulam algum aspectode
cogniçãohumana
(Rich, 1993).Para atingir essa meta de pesquisa, a Inteligência Artificial desenvolve modelos computacionais
que
possam
imitar o comportamentohumano.
Esses modelos nãosomente
contribuem para o aperfeiçoamento das máquinas,mas
representam
uma
motivação para se conhecer melhor as atividades mentaisdo
homem
(Nascimento Jr.&
Yoneyama,
2000).Segundo
Harmon &
King (1988),uma
das áreasde
estudo da InteligênciaArtificial ocupa-se
com
sistemas queusem
o conhecimento simbólico parasimular o comportamento dos especialistas humanos.
Nessa
área, encontram-se os sistemas especialistas e os sistemas de Raciocínio
Baseado
em
Casos
(RBC).Os
sistemas especialistasempregam
regras práticas ou heuristicas parafocarem o problema fornecido e manipularem as descrições simbólicas, a fim
de que discorram sobre o conhecimento passado, fazendo
recomendações
experimentais ou atribuindo pesos às opções apresentadas
(Harmon
&
King, 1988).O RBC
éum
tipode
raciocinio que busca soluções paraum
determinado problema mediante a análise comparativa da realidade anterior euma
outrasemelhante apresentada (Hoeschi, 1997).
Entre as aplicações
em
Inteligência Artificial,somente
o estudodo
RBC
fazparte das próximas seções, devido a sua importância no desenvolvimento
da
pesquisa.
2.1.1
Representação
do Conhecimento
Conforme
Nascimento Jr.& Yoneyama
(2000, p.50), “intuitivamente,conhecimento é
um
conjunto de informaçõesque
permite articular os conceitos, os juízos e o raciocinio, usualmente disponíveisem
um
particular dominiode
atuação".O
conhecimento é manipulado pelos sistemas especialistas epode
ser representado por símbolos ede
diversas formas, taiscomo
textos, fórmulas matemáticas, figuras, maquetes, filmes, discos, protótipos etc.Em
um
sistemaespecialista, representar o conhecimento significa utilizar
métodos
paracodificá-lo (Durkin, 1994).
Ainda de acordo
com
Durkin (1994),uma
das mais importantes responsabilidades do engenheirodo
conhecimento é a escolha da melhor e da maisadequada
técnicade
representação do conhecimento parauma
determinada aplicação.
Nesta seção, têm-se, resumidamente, algumas das técnicas
empregadas
na representação do conhecimento de casosem
RBC:
scripts,MOPs,
triades objeto-atributo-valor, regras, redes semânticas, frames e formulário.Il
Scripts: para Riesbeck
&
Schank
(1989), eles são utilizados para oconhecimento das ações de terceiros, contanto
que
executem aquiloque
se espera dentrode
uma
determinada seqüência. Pode-se dizerque
são estruturasque
auxiliam o conhecimento de situaçõespadronizadas.
Ajudam
a interpretarum
novo evento a partir dautilização de scripts
em
casos passados. Serviu de inspiração paraos estudos dos sistemas
em
RBC.
MOPs
(Memory
Organization Packages): são usados pararepresentar o conhecimento sobre classes
de
eventos,especialmente eventos complexos (Riesbeck
&
Schank, 1989).Os
eventosMOPs
basicamentepossuem
asmesmas
informações dos scripts.A
diferença éque
osMOPs
possuem
estruturas dememória
dinâmica; já os scripts trabalham
com
estruturas de conhecimentoestáticas.
Um
MOP
pode
ter especializações, ou seja,MOPs
com
versões mais especificas.
Um
MOP
mais geral é dito seruma
abstraçãodo
mais específico.Um
MOP
possuium
conjuntode
normas que
representam as suas características básicas (deeventos, metas, elementos etc).
Suas
conexõesem
memória
dinâmica permitem,
em
RBC,
determinar quais equando
asinformações estarão disponíveis para o “raciocinador“'.
Tríades Objeto-Atributo-Valor: representa
um
fatoque pode
serusado para declarar o valor de
uma
determinada propriedadedo
objeto (Durkin, 1994).É
um
tipo de proposiçãoque
divideuma
dada
declaraçãoem
três partes distintas: objeto, atributo e valordo
atributo.
Os
valores são únicos ou valorados.O
objeto representadopode
ser concreto ou abstrato, como, por exemplo,um
carro,um
avião,
um
caso de amor,uma
hipoteca,um
empréstimo bancário etc.Os
atributos são caracteristicas ou propriedades geraisque
descrevem
os respectivos objetos.Um
fatopode
assumir valorverdadeiro, falso ou incerto (de acordo
com
o fator de certeza).Regras: é
uma
forma de conhecimento procedural (Durkin, 1994). Associa determinada informação auma
ação. Descrevecomo
resolver,
um
problema por meio deuma
seqüência lógica deum
oumais antecedentes (premissas) e de
um
ou mais conseqüentes(conclusões). Exemplo: IF premissa(s)
THEN
conclusão(ões).Numa
regra
podem
existir várias premissascom
os operadores “and” e “or”.Chamamos
deRBR
o sistema de RaciocínioBaseado
em
Regras, oumelhor, o sistema especialista
que
utiliza o princípio de regras para resoluçãode
problemas.Redes
Semânticas: éuma
coleção de nós representando objetos,conceitos ou eventos relacionados.
As
relações são representadaspelos arcos.
A
hereditariedade éuma
das características das redes semânticas.Em
outras palavras,um
objeto herda característicasde
outros objetos relacionados.
A
rede deve prever tratamentode
exceção para
quando
um
atributo não puder ser herdado por outro objeto.13
~/
Frames ou
Quadros: segundo
Nascimento Jr.& Yoneyama
(2000.p. 52), “são estruturas de
dados
com
lacunas quepodem
ser preenchidascom
informações declarativas ou processuais”.~/ Formulários: é
uma
representação linear remanescente dasestruturas
de
bancode
dados,onde
cada caso é representado porum
conjunto decampos
e valores. Funcionabem
quando
seconhecem
os conteúdos aserem
colocados nos casos.2.1.2
Processamento
do Conhecimento
Como
o conhecimento deve ser processado para a soluçãode
problemas nos sistemas especialistas? Eisuma
questão para analisarmos primeiramenteem
termos do usodo
raciocinio.Segundo
Durkin (1994, p. 91), o processode
raciocínio combina fatos
com
conhecimentos adquiridos, derivando estratégias e conclusões lógicas para a resolução de problemas. Entendendocomo
osseres
humanos
raciocinam,como
eles trabalham os problemas dentro deum
conhecimento geral de dominio, é possível planejar o processamentodo
conhecimento
em um
sistema especialista.Uma
das formasde
raciocinio é a analogia.Nesse
caso, o raciocínio aplicaexperiências anteriores, semelhantes ou diferentes, guardadas na memória,
em
situações atuais
que
exigemuma
solução.Com
base nessa lógica, surgiram os modelos especialistasem
RBC.
O
conhecimento, nesse caso, é representado eAlém
do raciocínio analógico, existem as formasde
dedução, indução,abdução, senso
comum,
monotônico e não-monotônico quetambém
sãoutilizadas no desenvolvimento dos sistemas especialistas.
O
processamento do conhecimento pressupõe a sua aquisição, seuarmazenamento
e sua inferência.A
aquisição de conhecimento tem figurado entre ostemas
mais atuais erelevantes no contexto
do
desenvolvimento de Sistemas Inteligentes e pode,em
parte, ser dificultada pela interpretação incorreta das intençõesdo
especialista. Surge nessemomento
a figura do engenheiro do conhecimentofornecendo os meios para que o especialista consiga transmitir a sua maneira
de solucionar os problemas. “A aquisição
de
conhecimento éum
processode
modelagem
construtiva e não simplesmenteum
problema de transferênciade
conhecimento especializado. Portanto, o papel crucial do engenheiro
do
conhecimento inclui o desenvolvimento
de
ferramentas emétodos
para ajudar especialistasem
seu esforço para expressar, elaborar e fornecer seus modelosdo
dominio.Além
disso, ferramentas de aquisição de conhecimento necessitamde capacidade para
acomodaràas mudanças
em
representação de modelosmentais vagos para modelos conceituais explícitos e eventualmente para
uma
base de conhecimento operacional".
O
processode
aquisição de conhecimento é dividido nos seguintes estágios: 1) decisão inicial do conhecimento necessário (análise inicial); 2)obtenção do conhecimento vindo de especialistas
humanos
e sua interpretaçãol5
casos; 3) representação
do
conhecimento pela sua codificação na linguageminterna
do
sistema, conforme algumas descrições contidas no item 2.1.1.Em
relação ao ciclo de processamento do conhecimentoem
RBC,
omesmo
pode
ser analisadoem
termos de recuperação, reutilização, revisão e retençaode
casos, a ser descrito detalhadamente no item 2.2.2.2.2
Raciocínio
Baseado
em
Casos
-RBC
2.2.1 Histórico
Na década de
70, surgiram os primeiros sistemas especialistasque
utilizavam a técnica de raciocínio
baseado
em
regras para simulaçãoem
computador
do
comportamentode
especialistas humanos.Posteriormente, os estudos foram conduzidos
parauma
nova possibilidadede
aquisiçãodo
conhecimento por meiode
experiências passadas. Verificou-seque, para aquisição
de
um
conhecimento especifico, é preferível o especialista reportar-se a fatos já ocorridos a explicar a seqüência de raciocinio necessária para a soluçãodo
problema (às vezes desconhecida). Surge assim a técnicade
RaciocínioBaseado
em
Casos
(RBC),um
novo paradigma para soluçãode
problemas pela reutilização da experiência de casos resolvidos anteriormente. Assim, defini-se
RBC
como
uma
técnicade
inteligência artificialque
reproduzaspectos da cognição
humana
para resolver problemas especialistas (Weber, 1998).Para
Aamodt
&
Plaza`(1994), pensarem RBC
implica pensar na resoluçãode
'problemas e na aprendizagem.Quando
os problemas são resolvidos, aspessoas se baseiam
em
conhecimentos genéricos e teóricosarmazenados
sobre o assunto etambém
em
experiências especificas e práticas passadas._
O
estudo desse novo paradigma iniciou-secom
Roger
C.Schank
(1982)que
considerava as lembranças de fatos passados o elemento crucial na capacidade decompreensão
e aprendizado do serhumano.
Como
exemplo, considereum
programador que, para resolverum
problemade
lógicade
programação, lembra-se das rotinas desenvolvidas anteriormente e delas se utiliza na aplicação ou adaptação
de
um
novo programa.A
pesquisade Schank
concentrou esforços para desenvolverum
programade
computadorque
fosse capaz de compreender oque
fosse lido. Cnou-se,então, o script,
uma
espécie de estruturade
conhecimento de alto nível pararepresentar,
em
memória, informações sobre eventos.Os
scripts poderiam serusados para prover informação básica durante o processamento da
compreensão
e foram usados pelo programaSAM
(primeiro programade
compreensão
da história). Definiu-se, assim, a teoria daMemória
Dinâmica,uma
memória
do conhecimento, estruturada e representadaem
MOPS
(Memory
Organization Packages);uma
teoria que permitepossam
asestruturas ser alteradas conforme as novas experiências,
promovendo
aaprendizagem (Schank, 1982).
Segundo
Barletta (apud Can/alho, 1996), oRBC
originou-se da teoria dal7
raciocínio e
deu
uma
arquitetura para construir esse tipode
raciocínio no computador.O
método
de construçaode
RBC
é interessante, simples e natural(Kolodner, 1993).
A
idéia principal éque
experiências passadaspossam
ser recordadas e ajustadas para satisfazer as necessidades de novos problemas.Como
ébem
mais fácil paraum
especialista recordar a soluçãoque
eledeu
paraum
casodo
que
recordar a seqüênciade
raciocinio aplicada para alcançartal solução, então, desenvolver sistemas especialistas
usando
RBC
parecebem
mais simples e natural do que, por exemplo, usar raciociniobaseado
em
regras.Para Kolodner (1993), as principais vantagens e desvantagens na utilização
de
um
sistemaRBC
são:Vantagens:
~/ permitir soluções de problemas de forma mais rápida e
em
dominios não conhecidos completamente;W
fornecerum
meio de avaliar soluçõesmesmo
não existindoum
método
algoritmico definido;/
realizar a interpretação de conceitos abrangentes e mal definidos;~/ sen/ir de alerta às pessoas,
em
funçãodo
conhecimentode
experiências adquiridas, para
que
nao repitam erros cometidos nopassado e
~/ focar a atenção nas características principais do problema.
/
possibilidadede
aplicaçãode
casosnão
validadosem
situaçõesnovas, ocasionando resultados ineficientes, soluções erradas e mal
avaliadas;
/
existência deuma
forte tendência dos casos influenciarem aspessoas na resolução
de
um
novo problema e induzi-las ao erro e~/ possibilidade de algumas pessoas,
com
pouca experiência, nãoutilizarem o conjunto de casos mais apropriados no processo de raciocínio, prejudicando a solução
do
problema.2.2.2 Ciclo
de
Processamento
A
arquiteturaRBC
pode ser vista, deuma
forma mais genérica, pelas etapas definidas na Figura 1,que
representam o ciclo de processamentode
desse sistema (conhecidocomo
R4) (Aamodt&
Plaza, 1994):1.
Recuperação
deum
ou mais casos similares;2. Reutilizaçäo da informação e
do
conhecimentodo
caso recuperado,adaptado ou não, para resolução do problema;
3. Revisão da solução proposta (avaliação);
4. Retenção da experiência útil para resolução de futuros problemas
19 Figura 1:
O
Ciclo doRBC
Problema C Éiii??'ÍííííííííífiííÉI:§:¡:¿_,_v:_. Iíi5ÊÊÊ*ÊÊÊf5F?z2§f§§§fz› Caso ,_..:zz:z¿¿§¿§š¿¿¿¿§::fíš;§;§;;.- ,,,m_1
"'~'z;;£¿§;1' d'd° ___: Caso Recupe Casos §:§:f:{:§:§z< : ¡:§:{= Anteriores 'Í' _ Iš2Ê1š152š1O".1E1ʧ ~I-I~. . .~I~I .Éfšfšfšfšfšã ÍÊÉÊÊÊ ‹-. Í'I'1'Í'Í'Í'Â'Í'Í'Í'Í' z ~:-'-;-:-:-:-:~:~:= §:§:§:§:§:§¡_.'§:f:Ê . ' ' ' ' ^ ' ' ' ' É; 20 §:§:¶:§:§:= izgzzzgzgzwzzzzzzg ›C0flh9C1m8fll0_ izzg. fgfzgzgzgzâ 1-1- Gera' ~i~
N
s«W,,,.Ui
L' . Caso ' ' 4 ' ` I ' ' . ' . ' ' . . . À - ` I I _ 8 restam. “ífãf*`_.;š;i;5;E;E;E_q;;f R@r›=f=d° _z;:§._,I
~=£;E;E;i;5gšzš;E;51*' _:szEIÍ*IfiišššfšÊšëâzãfâzâ:z:z«â.â.â.â.â:zrzz; °==° fiššff*_.;;;E;š;š;E;š;š§z¡z»' “'**=Í=š=š=š=€;E;š;š;šzE=š=š¢z $°lU¢i°~
' “**5Ê5ʚʚÊ.Ê.EVlSÂ0š%šíš%š%š%šÊíÊš= "““°
Soluçao Soluçao
Confirmada Sugerida
Fonte:
Aamodt
&
Plaza (1994)Essas etapas servem de orientação para a aplicação prática
do
RBC
erepresentam
um
ciclo contínuo de raciocinio interdependente e inter-relacionado.
Cada
etapa é constituída deum
conjuntode
tarefasque
podem
ser implementadas por meiode
diferentes técnicas.As
particularidadesdo
domínio da aplicação definirão as etapas,
modelagem
e a linguagem aserem
empregadas
no desenvolvimento do sistemaem RBC
(Ramos, 2000).Levando-se
em
consideração a arquitetura apresentada, amodelagem do
sistemaRBC
pressupõe a existência dos seguintes procedimentos:\/
J
\/
/
organização
da
bibliotecade casos
compreende
a representação do conjunto de casos selecionados,sua indexação e organizaçao de forma linear ou hierárquica.
recuperação
e classificaçãode
casos
relevantesa recuperação é realizada pelo grau de similaridade na
comparação
dos índices de casos e depois classificados
segundo
critériosde
relevância estabelecidos.
As
técnicasde
recuperaçãode
casosincluem estes métodos: matemáticos nebulosos (fuZZy); vizinho-
mais-próximo (nearest-neighbor);
métodos
estatísticos e indutivos.construção
de
uma
solução
ou
interpretaçao parao
novo
caso
o
RBC
pode
serum
solucionador de problemas ou interpretadorde
soluções.
Como
solucionador, oRBC
deve proveruma
solução efazer as adaptações necessárias para
um
resultado satisfatório.O
processo
pode
ser usadotambém
para prevenção de possiveisfracassos. Sistemas solucionadores de problemas são utilizados
basicamente para casos
de
planejamento, projeto e diagnósticos.O
RBC
interpretativo utiliza os casos recuperados para construçãode
argumentos contra ou a favor da interpretação proposta pelo novocaso.
Dessa
forma, avalia situações ou soluções no contexto deexperiências passadas.
avaliação
do
resultado e atualizaçãoda base de casos
a solução adaptada é testada por meio da simulação ou aplicação
21
sucesso ou fracasso
do
caso. Ocorrendo sucesso edependendo da
relevância (utilidade) da informação, o novo caso poderá ser
indexado e
armazenado
na base de casos, para novas consultas.Havendo
fracasso, o novo caso será explicado e reavaliado parapossíveis reparos.
Nessa
situação, oarmazenamento
do casopoderá ser útil para se evitar ou explicar fracassos posteriores.
A
habilidade de integrar novas experiências à biblioteca de casos faz
com
que o sistema se torne mais e mais eficiente.É
essa habilidadeque
permiteque
o sistema aprenda (Carvalho, 1996).As
formas de representação e recuperação de casos, itens consideradosrelevantes para a implementação de
um
sistemaRBC
interpretadorde
problemas, são objetos de maior atenção nas abordagens seguintes.
2.2.2.1
Representação de
Casos
Um
caso é a formalização deum
conhecimento adquirido de experiências práticasem um
determinado contexto.Quando
os casos estão organizados e mantidosem
memória,damos
onome
de base de casos.Para
Aamodt
&
Plaza (1994), o problema da representação estáem
decidiro que será
armazenado
no caso. Para isso, deve existiruma
estruturaapropriada
de
descrição dos casos euma
formade
organização e indexaçãona memória.
Segundo Kambhampati
(apud Carvalho, 1996, p.22), existem dois critériosimportantes
que
devem
ser considerados ao se decidir oque
será representado no caso: a funcionalidade e a facilidade de aquisiçãode
conhecimento.
O
requisito de funcionalidade assegurauma
representaçãoem
que somente
osdados
úteis ao sistema serão armazenados.O
outro requisitoassegura
que
somente
informaçõescom
facilidade de aquisiçãode
conhecimento sejam representadas no caso.
De
acordocom
Bergmann, Breen, Göker,Manago
&
Wess
(apudRamos,
2000, p.18), há três abordagens principais para a representação
de
casosque
diferem
segundo
a origem, a forma e o conhecimento empregado:abordagem
baseada
em
textos,abordagem
baseadaem
conversação eabordagem
estrutural.
Na abordagem baseada
em
textos, os casos são representadosem
textolivre.
É
utilizadaem
ambienteshow
to do eFAQs
(FrequentlyAsked
Questions)e indicada para dominio de poucos casos.
O
custode
controle de qualidade éalto. r
Na abordagem baseada
em
-conversação, os dominios são constituídosde
problemas simples e resolvidos
com
muita freqüência,como
é o caso dossuportes aos usuários;
É
utilizadaonde
poucas questões são necessárias paraa
tomada
de decisão. Possuium
custo alto de manutenção.A
abordagem
estrutural é descrita pelos atributos e valores predefinidos(atributo e valor).
Os
atributospodem
ser estruturadosem
tabelas relacionaisou
em
paradigmas de orientação a objetos.O
custo demanutenção
é baixo,enquanto o investimento inicial de produção do modelo de domínio é alto. Apresenta melhores resultados do que as duas abordagens anteriores.
Os
componentes
principais na representação dos casos são (Kolodner,23
~/ descrição
do
problema ou situação: descreveum
problema a sersolucionado ou
uma
situação a ser interpretada, classificada oucompreendida. Identifica basicamente as características dos
elementos de entrada do sistema. Por meio dessas características, o
RBC
recupera casos similares na base de casos. .A descriçãodo
problema possui três
componentes
básicos: objetivos aserem
alcançados na resolução dos problemas, as restrições a esses
objetivos e as características e relacionamentos da situação- problema;
/
descrição da solução: representa a descrição da açãoempregada
naresolução
do
problema.São
descritas a própria solução, o raciocínioempregado, outras soluções, justificativas e adaptações e
/
descrição dos resultados: especifica os acontecimentos ocorridos nasolução dos problemas ou
como
a solução foi realizada.A
descriçãocontempla tanto o resultado da solução (de sucesso ou fracasso) quanto sua interpretação.
Como
visto anteriormente, existem muitos formalismos para a representação do conhecimentode
casos,como
scripts,MOPs,
tríade objeto-atributo-valor, regras, redes semânticas, frames, formulários etc., que são
utilizados por diversos sistemas já construídos
em
RBC.
O
importante naescolha da forma de representar os casos é levar
em
consideração sua2.2.2.2
Indexação
de
Casos
Num
sistema deRBC,
os índices representamuma
interpretação deuma
situação especifica e indicam os casos na memória que são mais similares a
um
caso de entrada usado para pesquisa (Kolodner, 1993). Para
Weber
(1998), a indexaçãode
casos éum
instrumento para orientar a similaridade.A
identrticaçãodas características relevantes de
um
caso vão determinar a sua similaridadecom
outros casos. Essas características são definidascomo
indices na recuperação decasos. _
A
escolha correta dos indices,em
qualquer sistema, depende do que éconsiderado significante para o sistema (Schank, 1982). Por exemplo, enquanto o
nome
de
uma
pessoa envolvidaem
determinado processo na justiça não éuma
caracteristica importante na recuperação de casos
de
jurisprudência; omesmo
não ocorre para o sistema de
acompanhamento
de processos, onde onome
do
envolvido é extremamente relevante para identificação e associação
de
atos efatos ocorridos
com
essa pessoa durante a tramitação do processo.Os
índices precisam ser cuidadosamente selecionados para que apenas os casos mais úteispossam
ser recuperados de fomwa rápida, eficiente e precisa.As
tarefas e dominios envolvidos no problemapodem
ser analisados para quese descubram os descritores funcionalmente relevantes usados na descrição e
indexação dos casos, criando-se assim o vocabulário de indexação.
Os
indices, nesse caso, são selecionados a partir do vocabulário de indexação. Essevocabulário é fonnado por
um
conjunto de dimensões e valores.As
dimensões e valorespodem
ser imaginadoscomo
“atributo e valor' deuma
estrutura frame ou25
“predicado e argumento”
de
uma
representação utilizando cálculo de predicado deprimeira
ordem
(Kolodner, 1993).Os
indices deum
casopodem
ser selecionadosmanualmente
ouautomaticamente.
A
seleção manual é vantajosa parauma
indexação precisade
casos não muito complexos.A
indexação automática usamétodos
baseados
em
check/ist, diferenças e explicação.No
método
de check/ist, osíndices são escolhidos
com
basenuma
lista fornecida pelo sistema, contendoas caracteristicas
que
podem
ser usadascomo
índices; nosegundo
método,são extraídas diferenças entre
um
novo caso e outros casos damemória
parautilização
como
indices; nométodo baseado
em
explicação, os casos sãoanalisados individualmente
em
funçãode
sucesso ou fracasso dos índices.O
melhor
método de
recuperação é aqueleque
levaem
consideração a facilidadede
indexação e sua precisão na escolha dos casos.2.2.2.3
Recuperação de
Casos
Um
sistemaem RBC
deve terum
algoritmo de recuperação capazde
detectar casos similares a cada nova situação apresentada.
Um
caso útil éaquele
que
é similar à nova situaçãoem
dimensões (caracteristicas)que
ajudam
o programa a realizar suas tarefas ou a alcançar suas metas (Kolodner,1993).
A
definição dessa similaridade entre os casos é fruto do conhecimentodo
domínio da aplicação por parte deum
especialista.Segundo
Aamodt &
Plaza (1994), existem dois tipos de similaridade: asintática (simples) e a semântica (complexa).
A
similaridade sintática écategorias, qualificação etc.
A
similaridade semântica engloba o significado doscasos.
Uma
forma simples e direta de modelar similaridade é atribuir (1)unidade para função resultante similar, (0) para resultante não similar ou valores intermediários (implementado por meio
de
regras) entre O e 1 (Weber,1998).
A
organização dos casosem
memória
juntamentecom
os algoritmosde
busca,
casamento
e classificação garantemuma
recuperação de casoseficientes.
O
algoritmo de busca é dependente da estrutura de biblioteca de casosque
se aplica (linear, rede etc.).
A
funçãode casamento
usa o algoritmode
buscapara julgar o potencial de utilidade (melhor casamento) dos casos da
memória
com
o novo caso apresentado durante a pesquisa.Quando
são julgados muitoscasos úteis, é usada
uma
função de classificação para ordenar os casos maisrelevantes.
Existem diversos algoritmos de recuperação
de
casos, porém,em
ferramentas comerciais, as duas técnicas mais utilizadas são: nearest-neighbor (vizinho-mais-próximo) e inductive retrieva/ (recuperação indutiva) (Carvalho, 1996, p.25).Na
recuperação indutiva, a partir deum
atributo chave, é construídauma
árvore
de
decisão indexada para organização e recuperação dos casos.A
técnicado
vizinho-mais-próximo calcula a distância euclidiana entre doiscasos. Essa distância representa a medida numérica de similaridade.
Quanto
menor
a distância, maior o grau de similaridade entre os casos, conformeexpressão abaixo:
27
‹P,Q>=‹§1‹›‹*;-›‹*;›2›'”2
P
eQ
são dois casos descritos pelos vetores de atributos x ° e × ° ,respectivamente.
Outro cálculo é feito pela medida
de
similaridade global utilizando a técnicado
vizinho-mais-próximo (Bueno, 1999), representando a média ponderadapara
uma
pesquisa de casosde
“n” índices:sim
rs, cf) =É
‹õ-‹/3,, /¢,z›W»
¡=1
Onde,
S
= Ajuste da SituaçãoC,- = caso ida base de conhecimento
lj = índice j
I$,~ = índice ju, do ajuste da situação I¢,¡ = índicejmdo
casoi
Vl/¡ = peso do indicej
Nessa
expressão, “o grau total da similaridade deum
caso é calculadoatravés
da
soma
de todos os valores locais da similaridade e multiplicado porum
fatorde
peso determinado”.O
grau de similaridade é fundamental para a busca de informações, pois a recuperação é feita através da similaridade existente entre os casos.Há
quatro espécies de similaridade (Camargo, 1999): “1) similaridade semântica: é o tipo mais simples de similaridade, pois nao considera fatores conte›‹tuais, sereferindo aos atributos que são sintaticamente idênticos
em
duas situações; 2)similaridade estrutural: é mais complexa que a anterior.
Os
casosdevem
estarligados por meio
de
estruturas isomórficas.O
isomorfismodepende
daexemplo, dois casos sao slmi ares se as suas estruturas de relaçoes e
argumentos forem semelhantes; 3) similaridade organizacional: é imposta aos casos
armazenados
em
localizações próximas namemória
de casos; 4)similaridade pragmática: duas partes são pragmaticamente similares se
ocuparem
papéis similaresem
suas respectivas situações”.A
A
similaridadedo
caso de entrada é avaliadaem
relação aos casoscandidatos da base
de
dados. Assim,uma
medidade
similaridade é geradapara cada caso selecionado da base,
em
função dacomparação
prévia entre ocaso de entrada e o caso candidato da base.
A
comparação
é feita pela semelhança das características ou atributosque
representam o conteúdo e ocontexto da situação.
Segundo
Weber
(1998), a medida de similaridade é ovalor numérico resultante do uso de
uma
métrica.A
métrica éuma
funçãonumérica que calcula sinteticamente os valores
de
similaridade individuais,considerando suas importâncias.
A
medida
resultante da métrica serve dereferência para ordenação dos casos mais similares.
A
similaridade é muito influenciada pelo conhecimento especialistado
domínio.
O
especialista éum
ente fundamental para a escolha dos indicesde
busca e atribuição dos respectivos pesos para o cálculo. da métrica
de
similaridade.É
precisoque
todos os aspectosque
envolvam a recuperação estejam representados e definidos pelo especialista para a obtenção dos melhores resultados na recuperação dos casos. Outra maneira de atribuirvalores
de
importâncias aos índices é fazeruma
avaliação estatística deum
conjunto conhecido
de
casos e determinar as melhores soluções e condições29
No
processode
recuperaçao, existeuma
etapa seguinte de ajusteda
situação
que
é utilizadaquando
um
novo caso não estiver representadoda
mesma
formaque
os casos da memória.O
novo casopode
estar incompleto,impreciso ou
não
conter o conjunto de características inferidas durante arepresentação do caso.
A
meta é capturar a nova situação e modelá-la naforma
dos casos da base.O
ajuste é viável pelo uso de vocabulárioscontrolados ou filtros opcionais na pesquisa (Weber, 1998).
2.2.2.4 Reutilização
de
Casos
A
reutilizaçãodo
caso recuperado levaem
consideração dois aspectos: 1) as diferenças entre o caso passado e o corrente; 2) quais as partesdo
caso recuperadopodem
ser transferidos para o novo caso (Aamodt&
Plaza, 1994).Os
casospodem
ser simplesmente copiados ou adaptados para melhorsolução
do
problema apresentado.No
caso de cópia, as semelhanças sãomais relevantes que as diferenças encontradas. Assim, o caso recuperado é transferido integralmente para a solução do problema.
Em
outras situações,em
função das diversas diferenças encontradas nacomparação
dos casos,exigem-se adaptações para
uma
solução maisadequada
ao problema.A
adaptaçãopode
ser feita pela transformação de soluções passadas(adaptação por transformação) ou derivando os
métodos
que
geraram a solução original sobre as características do novo caso,dando
origem auma
nova solução (adaptação derivacional).
Existem as seguintes formas de transformação: 1) transformação
de
bom
solução.
Levam
em
conta a importância e as funções de diferentescomponentes de
um
item, para determinar se elesdevem
ser retirados ousubstituídos; 2) reparo guiado por modelo: 'representa
uma
coleçãode
heuristicasque
acessam
modelos causais para transformaruma
velha solução e adequá-Ia à nova situação; 3) adaptaçãobaseada
em
crítica: utilizada para rastreamentode
soluções quase corretas.Uma
critica checa seuma
particularcombinação de
caracteristicaspode
causar problemasem
uma
solução. Paracada problema encontrado é aplicada
uma
estratégiade
reparo.A
adaptação derivacional aplica as regras que geraram a velha solução para solucionar o problema atual.A
idéia é armazenar juntocom
a soluçãodo
caso o conjunto de passos
que
conduziram àquela soluçao.2.2.2.5 Revisão
de
Casos
Esta etapa consiste na oportunidade de aprender
com
as eventuais falhasocorridas na reutilização dos casos. Possui duas tarefas: 1) avaliação
da
solução gerada pela reutilização; obtenção de aprendizado
em
casosde
sucesso (retenção); a avaliação da solução divide-se em: avaliação por especialista, avaliação nomundo
real e avaliação no modelo; 2) reparaçãoda
solução dentro do dominio específico do conhecimentoem
situaçõesde
insucesso na recuperação dos casos (Aamodt&
Plaza, 1994).2.2.2.6