2IA-RepresConhec

(1)

Prof. Laurence Rodrigues do Amaral

2 – Representação do

Conhecimento

Inteligência Artificial

(2)

Introdução

• O conhecimento pode ser definido como a informação armazenada ou os modelos

usados por uma pessoa ou máquina para

interpretar, identificar, predizer e responder apropriadamente ao mundo externo

• A importância de se representar o conhecimento não é apenas poder recuperá-lo no futuro, mas também raciocinar com ele, e principalmente, a facilidade para agregar novos conhecimentos

(3)

Introdução

• Para que o conhecimento possa ser

armazenado e manipulado por um

computador é preciso que sejam adotados

modelos adequados ao seu

processamento

• Assim, a escolha do modelo mais

adequado para a RC em um computador

depende, basicamente, do tipo de

(4)

Introdução

• O que diferencia uma representação de

conhecimento de um sistema “ad hoc” de

manipulação de estruturas de dados é o

fato da representação do conhecimento

ter um significado externo, isto é,

(5)

Introdução

• A manifestação inteligente pressupõe

aquisição, armazenamento e inferência

do conhecimento

• Grande esforço em IA tem se concentrado

em buscar ou aperfeiçoar formalismos

(6)

Introdução

• Os estudos sobre a representação do

conhecimento estão ligados à hipótese de RC de Brian Smith

– Qualquer processo inteligente realizado por uma máquina deve conter uma estrutura que permita uma descrição proporcional do conhecimento

exibido pelo processo, e que, independentemente de uma semântica, tenha um papel formal, causal e

essencial na geração do comportamento que manifesta tal conhecimento

(7)

Introdução

• Para resolver os problemas mais

complexos encontrados na IA, é

necessária uma grande quantidade de

conhecimentos e certos mecanismos para

manipulá-los

• Para implementar estes problemas, é

necessário contar com uma forma

(8)

Entidades

• RC possui dois tipos diferentes de

entidades

– Fatos: verdades em algum mundo relevante, essas são as coisas que se quer representar; – Representação de fatos: com algum

formalismo escolhido, essas são as coisas que efetivamente serão capazes de

(9)

Conceitos

• RC pode ser definida como um conjunto de convenções sintáticas e semânticas que tornam possível descrever coisas

• A RC para sistemas de IA é uma visão conexionista de que várias unidades

interconectadas idênticas são coletivamente responsáveis para representar vários conceitos • Um conceito é representado num senso

distribuído e é indicado por um envolvimento em atividades sobre uma coleção de unidades

(10)

Características da RC

• Escopo e granularidade: partes do domínio considerado;

• Indeterminação e definição das noções

primitivas de representação: alternativas de modelagem;

• Modularidade, compreensibilidade:

“clusterização” do conhecimento, legibilidade;

• Conhecimento explícito e flexibilidade: toda a informação necessária à solução do problema está na base de conhecimento e não embutida em outro componente

(11)

Paradigmas de representação

• Conhecimento procedural: o

conhecimento é representado em forma

de funções/procedimentos

(12)

(13)

Paradigmas de representação

• Redes Semânticas

– O conhecimento é representado por um rótulo de grafos direcionados, cujos nós representam

conceitos e entidades, enquanto os arcos

representam a relação entre entidades e conceitos – Os modelos mais avançados e complexos de

representação de conhecimento que combinam, em um grafo orientado, tanto associações declarativas como procedurais

– Constitui estruturas muito poderosas que conseguem representar vários tipos de conhecimento

(14)

Redes Semânticas

• Este modelo é o mais parecido com o que

se imagina acontecer no mecanismo

cerebral

• As redes constituem uma importante

estrutura capaz de simular o modelo

psicológico da memória associativa,

permitindo associações ente objetos com

características em comum

(15)

Redes Semânticas

(16)

Redes Semânticas

(17)

Redes Semânticas

(18)

(19)

Redes Semânticas

(20)

Paradigmas de representação

• Frames

– Se baseiam na hipótese de que as pessoas usam

conhecimentos adquiridos em experiências anteriores para resolver situações novas

– A nova experiência também serve para incrementar o conhecimento atual, gerando uma maior

especialização

– Cada nó tem várias propriedades que podem ser especificadas ou herdadas por padrão

– Assim, um frame consiste de um conjunto de atributos valorados (slots) que descrevem as propriedades do objeto representado

(21)

Frames

(22)

Frames

(23)

Paradigmas de representação

• Lógica: um modo de declaração que

representa conhecimento

– Lógica Proposicional

– Inferência por Proposições

– Lógica de Predicados ou de Primeira Ordem – Lógica na forma clausular e cláusula de Horn – Lógica Temporal

– Lógica Modal

(24)

Paradigmas de representação

• Árvores de Decisão

– Conceitos são organizados em formas de árvores – Vantagem: existência de várias técnicas de buscas

que operam em árvores e, consequentemente, tem obtido sucesso em diversas aplicações

– Desvantagens

• O fato de que um mesmo conceito pode ser representado por árvores diferentes

• Árvores muito grandes se tornam difíceis de interpretar; dificultam a alteração (inserir e remover dados) e a

(25)

(26)

Árvores de Decisão

(27)

Paradigmas de representação

• Conhecimento Estatístico: uso de

fatores de incerteza, Redes Bayesianas,

Teoria de Dempster-Shafer, Lógica Fuzzy

(28)

Redes Bayesianas

• Foram desenvolvidas no início dos anos 80 para facilitar a tarefa de

predição em sistemas de Inteligência Artificial (AI)

• Em resumo, Redes Bayesianas (RB) também conhecidas como

redes de opinião, redes causais, gráficos de dependência

probabilística, são modelos gráficos para raciocínio (conclusões) baseado na incerteza, onde os nós representam as variáveis

(discreta ou contínua), e os arcos representam a conexão direta entre eles.

• Ela vem se tornando a metodologia padrão para a construção dos

sistemas que confiam no conhecimento probabilístico e tem sido aplicada em uma variedade de atividades do mundo real.

• Redes Bayesianas são modelos de representação do conhecimento

que trabalham com o conhecimento incerto e incompleto através da Teoria da Probabilidade Bayesiana, publicada pelo matemático Thomas Bayes em 1763.

(29)

Redes Bayesianas

• Matematicamente, uma Rede Bayesiana é uma

representação compacta de uma tabela de conjunção de probabilidades do universo do problema. Por outro lado, do ponto de vista de um especialista, Redes Bayesianas constituem um modelo gráfico que representa de forma simples as relações de causalidade das variáveis de um sistema.

• Essa representação tem como uma das suas principais características a adaptabilidade, podendo, a partir de novas informações, e com base em informações de

cunho verdadeiro, gerar alterações nas dependências e nos seus conceitos. Permite, dessa forma, que as

probabilidades não sejam meros acasos, podendo confirmar e criar novos conceitos.

(30)

Redes Bayesianas

• Representa 3 tipos de conhecimento do domínio:

– Relações de independência entre variáveis aleatórias – Probabilidades a priori de algumas variáveis

– Probabilidades condicionais entre variáveis dependentes

• Permite calcular eficientemente:

– Probabilidades a posteriori de qualquer variável aleatória (inferência)

• Conhecimento representado:

– Pode ser aprendido a partir de exemplos

(31)

Redes Bayesianas

• Regra de Bayes

• Aplicação da Regra de Bayes no

diagnóstico médico

P(A/B) = P(B/A)P(A) P(B) • Seja M = meningite e S = rigidez no pescoço • Um médico sabe: •P(S/M) = 0.5 •P(M) = 1/50.000 •P(S)=1/20 P(M/S)=P(S/M)P(M) P(S) =0,5*(1/50000)=0,002 1/20 • A probabilidade de uma pessoa ter meningite dado que ela está com rigidez no pescoço é 0,2% ou ainda 1 em 500.

(32)

Semântica da Rede Bayesiana

• Representação da distribuição de

Probabilidade Conjunta das variáveis de

interesse: P(y

₁

^...y

_n

)

• Redes Bayesianas levam em

consideração a independência

condicional entre subconjuntos de

variáveis

(33)

Estrutura das Redes Bayesianas

• Uma Rede Bayesiana é um grafo acíclico e

dirigido onde: Cada nó da rede representa uma

variável aleatória

– Um conjunto de ligações ou arcos dirigidos conectam pares de nós

• Cada nó recebe arcos dos nós que tem influência direta sobre ele (nós pais).

– Cada nó possui uma tabela de probabilidade

condicional associada que quantifica os efeitos que os pais têm sobre ele

(34)

Redes Bayesianas

Tempestade _{Ônibus de Turismo}

Fogo no Acampamento

Trovão Fogo na floresta

Raio

T,O T,¬O ¬T, O ¬T, ¬O FA 0.4 0.1 0.8 0.2 ¬FA 0.6 0.9 0.2 0.8 Fogo no Acampamento Distribuição de Probabilidade:

(35)

(36)

Paradigmas de representação

• Regras: sistemas de produção para

codificar regras de condição/ação

(37)

Lógica Fuzzy (ou Difusa)

• Lógica Fuzzy é um conjunto de métodos

baseados no conceito de conjunto difuso e

operações difusas, que possibilita a

modelagem realista e flexível de sistemas

• Vantagem: possibilidade de se capturar,

em um modelo matemático, conceitos

intuitivos como graus de satisfação,

conforto, adequação, etc.

(38)

Lógica Fuzzy (ou Difusa)

• Característica especial: representar uma forma inovadora de manuseio de informações

imprecisas, de forma muito distinta da Teoria de Probabilidades

• Provê um método de traduzir expressões verbais, vagas, imprecisas e qualitativas,

comuns na comunicação humana em valores numéricos

• Isso abre as portas para se converter a experiência humana em uma forma

(39)

Lógica Fuzzy (ou Difusa)

• Áreas de aplicação

– Controle econômico de sistemas de condicionamento de temperatura – Controle de máquinas de lavar e secadoras de roupa

– Controle de freios ABS

– Injeção eletrônica de combustível e transmissão automática em veículos

– Sistemas de tratamento de água – Direção automática de trens

– Sistemas de reconhecimento de voz e imagem – Controle de tráfego urbano e rodoviário

– Detecção de fraudes em cartões de crédito – Reconhecimento de assinaturas

– Diagnóstico de câncer por ultrasonografia – Estabilização de imagens em filmadoras – Controle integrado de grupos de elevadores

(40)

Lógica Fuzzy (ou Difusa)

• Pontos fortes

– Capacidade de capturar com clareza e

concisão as várias nuances dos conceitos psicológicos utilizados pelos seres humanos em seu raciocínio usual

– Se formos solicitados a classificar o status dos 3 copos idênticos quanto a seu grau de preenchimento, e só utilizarmos os

predicados CHEIO e VAZIO, como expressar a condição do copo central?

(41)

Lógica Fuzzy (ou Difusa)

(42)

Lógica Fuzzy (ou Difusa)

• Na verdade, o copo está meio CHEIO e

meio VAZIO

• O problema é que os paradigmas

tradicionais de classificação costumam

exigir a tomada de decisões abruptas

(“CRISP”)

– Isto é, descartar tons de cinza entre o absolutamente preto e o absolutamente branco

(43)

Lógica Fuzzy (ou Difusa)

• O analista fuzzy responderia

– O copo central está CHEIO com grau de 50% e VAZIO com grau de 50%

– O copo da esquerda está CHEIO com grau de 0% e VAZIO com grau de 100%

– O copo da direita está cheio com grau de 100% e VAZIO com grau de 0%

(44)

(45)

(46)

Paradigmas de representação

• Processamento Paralelo Distribuído: utiliza-se de modelos conexionistas

• Esquemas híbridos: qualquer representação do formalismo que emprega a combinação de esquemas de representação do conhecimento • Casos: usa a experiência passada, acumulando

casos e tentando descobrir, por analogia, soluções para outros problemas