Prof. Laurence Rodrigues do Amaral
2 – Representação do
Conhecimento
Inteligência Artificial
Prof. Laurence Rodrigues do Amaral
Introdução
• O conhecimento pode ser definido como a informação armazenada ou os modelos
usados por uma pessoa ou máquina para
interpretar, identificar, predizer e responder apropriadamente ao mundo externo
• A importância de se representar o conhecimento não é apenas poder recuperá-lo no futuro, mas também raciocinar com ele, e principalmente, a facilidade para agregar novos conhecimentos
Prof. Laurence Rodrigues do Amaral
Introdução
• Para que o conhecimento possa ser
armazenado e manipulado por um
computador é preciso que sejam adotados
modelos adequados ao seu
processamento
• Assim, a escolha do modelo mais
adequado para a RC em um computador
depende, basicamente, do tipo de
Prof. Laurence Rodrigues do Amaral
Introdução
• O que diferencia uma representação de
conhecimento de um sistema “ad hoc” de
manipulação de estruturas de dados é o
fato da representação do conhecimento
ter um significado externo, isto é,
Prof. Laurence Rodrigues do Amaral
Introdução
• A manifestação inteligente pressupõe
aquisição, armazenamento e inferência
do conhecimento
• Grande esforço em IA tem se concentrado
em buscar ou aperfeiçoar formalismos
Prof. Laurence Rodrigues do Amaral
Introdução
• Os estudos sobre a representação do
conhecimento estão ligados à hipótese de RC de Brian Smith
– Qualquer processo inteligente realizado por uma máquina deve conter uma estrutura que permita uma descrição proporcional do conhecimento
exibido pelo processo, e que, independentemente de uma semântica, tenha um papel formal, causal e
essencial na geração do comportamento que manifesta tal conhecimento
Prof. Laurence Rodrigues do Amaral
Introdução
• Para resolver os problemas mais
complexos encontrados na IA, é
necessária uma grande quantidade de
conhecimentos e certos mecanismos para
manipulá-los
• Para implementar estes problemas, é
necessário contar com uma forma
Prof. Laurence Rodrigues do Amaral
Entidades
• RC possui dois tipos diferentes de
entidades
– Fatos: verdades em algum mundo relevante, essas são as coisas que se quer representar; – Representação de fatos: com algum
formalismo escolhido, essas são as coisas que efetivamente serão capazes de
Prof. Laurence Rodrigues do Amaral
Conceitos
• RC pode ser definida como um conjunto de convenções sintáticas e semânticas que tornam possível descrever coisas
• A RC para sistemas de IA é uma visão conexionista de que várias unidades
interconectadas idênticas são coletivamente responsáveis para representar vários conceitos • Um conceito é representado num senso
distribuído e é indicado por um envolvimento em atividades sobre uma coleção de unidades
Prof. Laurence Rodrigues do Amaral
Características da RC
• Escopo e granularidade: partes do domínio considerado;
• Indeterminação e definição das noções
primitivas de representação: alternativas de modelagem;
• Modularidade, compreensibilidade:
“clusterização” do conhecimento, legibilidade;
• Conhecimento explícito e flexibilidade: toda a informação necessária à solução do problema está na base de conhecimento e não embutida em outro componente
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Conhecimento procedural: o
conhecimento é representado em forma
de funções/procedimentos
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Redes Semânticas
– O conhecimento é representado por um rótulo de grafos direcionados, cujos nós representam
conceitos e entidades, enquanto os arcos
representam a relação entre entidades e conceitos – Os modelos mais avançados e complexos de
representação de conhecimento que combinam, em um grafo orientado, tanto associações declarativas como procedurais
– Constitui estruturas muito poderosas que conseguem representar vários tipos de conhecimento
Prof. Laurence Rodrigues do Amaral
Redes Semânticas
• Este modelo é o mais parecido com o que
se imagina acontecer no mecanismo
cerebral
• As redes constituem uma importante
estrutura capaz de simular o modelo
psicológico da memória associativa,
permitindo associações ente objetos com
características em comum
Prof. Laurence Rodrigues do Amaral
Redes Semânticas
Prof. Laurence Rodrigues do Amaral
Redes Semânticas
Prof. Laurence Rodrigues do Amaral
Redes Semânticas
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Redes Semânticas
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Frames
– Se baseiam na hipótese de que as pessoas usam
conhecimentos adquiridos em experiências anteriores para resolver situações novas
– A nova experiência também serve para incrementar o conhecimento atual, gerando uma maior
especialização
– Cada nó tem várias propriedades que podem ser especificadas ou herdadas por padrão
– Assim, um frame consiste de um conjunto de atributos valorados (slots) que descrevem as propriedades do objeto representado
Prof. Laurence Rodrigues do Amaral
Frames
Prof. Laurence Rodrigues do Amaral
Frames
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Lógica: um modo de declaração que
representa conhecimento
– Lógica Proposicional
– Inferência por Proposições
– Lógica de Predicados ou de Primeira Ordem – Lógica na forma clausular e cláusula de Horn – Lógica Temporal
– Lógica Modal
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Árvores de Decisão
– Conceitos são organizados em formas de árvores – Vantagem: existência de várias técnicas de buscas
que operam em árvores e, consequentemente, tem obtido sucesso em diversas aplicações
– Desvantagens
• O fato de que um mesmo conceito pode ser representado por árvores diferentes
• Árvores muito grandes se tornam difíceis de interpretar; dificultam a alteração (inserir e remover dados) e a
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Árvores de Decisão
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Conhecimento Estatístico: uso de
fatores de incerteza, Redes Bayesianas,
Teoria de Dempster-Shafer, Lógica Fuzzy
Prof. Laurence Rodrigues do Amaral
Redes Bayesianas
• Foram desenvolvidas no início dos anos 80 para facilitar a tarefa de
predição em sistemas de Inteligência Artificial (AI)
• Em resumo, Redes Bayesianas (RB) também conhecidas como
redes de opinião, redes causais, gráficos de dependência
probabilística, são modelos gráficos para raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis
(discreta ou contínua), e os arcos representam a conexão direta entre eles.
• Ela vem se tornando a metodologia padrão para a construção dos
sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.
• Redes Bayesianas são modelos de representação do conhecimento
que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.
Prof. Laurence Rodrigues do Amaral
Redes Bayesianas
• Matematicamente, uma Rede Bayesiana é uma
representação compacta de uma tabela de conjunção de probabilidades do universo do problema. Por outro lado, do ponto de vista de um especialista, Redes Bayesianas constituem um modelo gráfico que representa de forma simples as relações de causalidade das variáveis de um sistema.
• Essa representação tem como uma das suas principais características a adaptabilidade, podendo, a partir de novas informações, e com base em informações de
cunho verdadeiro, gerar alterações nas dependências e nos seus conceitos. Permite, dessa forma, que as
probabilidades não sejam meros acasos, podendo confirmar e criar novos conceitos.
Prof. Laurence Rodrigues do Amaral
Redes Bayesianas
• Representa 3 tipos de conhecimento do domínio:
– Relações de independência entre variáveis aleatórias – Probabilidades a priori de algumas variáveis
– Probabilidades condicionais entre variáveis dependentes
• Permite calcular eficientemente:
– Probabilidades a posteriori de qualquer variável aleatória (inferência)
• Conhecimento representado:
– Pode ser aprendido a partir de exemplos
Prof. Laurence Rodrigues do Amaral
Redes Bayesianas
• Regra de Bayes
• Aplicação da Regra de Bayes no
diagnóstico médico
P(A/B) = P(B/A)P(A) P(B) • Seja M = meningite e S = rigidez no pescoço • Um médico sabe: •P(S/M) = 0.5 •P(M) = 1/50.000 •P(S)=1/20 P(M/S)=P(S/M)P(M) P(S) =0,5*(1/50000)=0,002 1/20 • A probabilidade de uma pessoa ter meningite dado que ela está com rigidez no pescoço é 0,2% ou ainda 1 em 500.Prof. Laurence Rodrigues do Amaral
Semântica da Rede Bayesiana
• Representação da distribuição de
Probabilidade Conjunta das variáveis de
interesse: P(y
1^...y
n)
• Redes Bayesianas levam em
consideração a independência
condicional entre subconjuntos de
variáveis
Prof. Laurence Rodrigues do Amaral
Estrutura das Redes Bayesianas
• Uma Rede Bayesiana é um grafo acíclico e
dirigido onde: Cada nó da rede representa uma
variável aleatória
– Um conjunto de ligações ou arcos dirigidos conectam pares de nós
• Cada nó recebe arcos dos nós que tem influência direta sobre ele (nós pais).
– Cada nó possui uma tabela de probabilidade
condicional associada que quantifica os efeitos que os pais têm sobre ele
Prof. Laurence Rodrigues do Amaral
Redes Bayesianas
Tempestade Ônibus de Turismo
Fogo no Acampamento
Trovão Fogo na floresta
Raio
T,O T,¬O ¬T, O ¬T, ¬O FA 0.4 0.1 0.8 0.2 ¬FA 0.6 0.9 0.2 0.8 Fogo no Acampamento Distribuição de Probabilidade:
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Regras: sistemas de produção para
codificar regras de condição/ação
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• Lógica Fuzzy é um conjunto de métodos
baseados no conceito de conjunto difuso e
operações difusas, que possibilita a
modelagem realista e flexível de sistemas
• Vantagem: possibilidade de se capturar,
em um modelo matemático, conceitos
intuitivos como graus de satisfação,
conforto, adequação, etc.
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• Característica especial: representar uma forma inovadora de manuseio de informações
imprecisas, de forma muito distinta da Teoria de Probabilidades
• Provê um método de traduzir expressões verbais, vagas, imprecisas e qualitativas,
comuns na comunicação humana em valores numéricos
• Isso abre as portas para se converter a experiência humana em uma forma
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• Áreas de aplicação
– Controle econômico de sistemas de condicionamento de temperatura – Controle de máquinas de lavar e secadoras de roupa
– Controle de freios ABS
– Injeção eletrônica de combustível e transmissão automática em veículos
– Sistemas de tratamento de água – Direção automática de trens
– Sistemas de reconhecimento de voz e imagem – Controle de tráfego urbano e rodoviário
– Detecção de fraudes em cartões de crédito – Reconhecimento de assinaturas
– Diagnóstico de câncer por ultrasonografia – Estabilização de imagens em filmadoras – Controle integrado de grupos de elevadores
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• Pontos fortes
– Capacidade de capturar com clareza e
concisão as várias nuances dos conceitos psicológicos utilizados pelos seres humanos em seu raciocínio usual
– Se formos solicitados a classificar o status dos 3 copos idênticos quanto a seu grau de preenchimento, e só utilizarmos os
predicados CHEIO e VAZIO, como expressar a condição do copo central?
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• Na verdade, o copo está meio CHEIO e
meio VAZIO
• O problema é que os paradigmas
tradicionais de classificação costumam
exigir a tomada de decisões abruptas
(“CRISP”)
– Isto é, descartar tons de cinza entre o absolutamente preto e o absolutamente branco
Prof. Laurence Rodrigues do Amaral
Lógica Fuzzy (ou Difusa)
• O analista fuzzy responderia
– O copo central está CHEIO com grau de 50% e VAZIO com grau de 50%
– O copo da esquerda está CHEIO com grau de 0% e VAZIO com grau de 100%
– O copo da direita está cheio com grau de 100% e VAZIO com grau de 0%
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Prof. Laurence Rodrigues do Amaral
Paradigmas de representação
• Processamento Paralelo Distribuído: utiliza-se de modelos conexionistas
• Esquemas híbridos: qualquer representação do formalismo que emprega a combinação de esquemas de representação do conhecimento • Casos: usa a experiência passada, acumulando
casos e tentando descobrir, por analogia, soluções para outros problemas