Aula 22

(1)

DSC/CEEI/UFCG

Inteligência Artificial I

Aprendizagem

(Parte III)

Prof.a_{Joseana Macêdo Fechine}

joseana@dsc.ufcg.edu.br

Carga Horária: 60 horas

Universidade Federal de Campina Grande Departamento de Sistemas e Computação

(2)

2

Aprendizagem

Tópico

(3)

DSC/CEEIUFCG 3

Redes Neurais

Componentes de um neurônio

 É uma célula do cérebro cuja principal função é coletar,

processar e disseminar sinais elétricos.

 Acredita-se que a capacidade de processamento de

(4)

4

Componentes de um Neurônio

 Axônio – transmissão de sinais a partir do corpo

celular; poucas ramificações e compridos;

 Dendritos – conduzem sinais para a célula; têm

muitas ramificações (zonas receptivas);

 Sinapses – estruturas funcionais elementares que

mediam as conexões entre os neurônios

(5)

DSC/CEEIUFCG

5  Plasticidade de um neurônio – capacidade de

adaptação ao ambiente.

 Mecanismos de Plasticidade (cérebro de um adulto)

 _{Criação de novas conexões sinápticas}  Modificação das sinapses existentes

 Plasticidade - essencial para as Redes Neurais

Artificiais

(6)

6

Neurociência computacional

 Modelo matemático do neurônio criado por

McCulloch e Pitts (1943)

 Interesse nas propriedades mais abstratas da RNs

 Habilidade para executar computação distribuída  _{Habilidade para tolerar entradas ruidosas}

 Habilidade para aprender

 Uma das formas mais populares e efetivas de

(7)

DSC/CEEIUFCG

7

Inspiração Biológica

(8)

8

Neurônio artificial projetado por McCulloch e Pitts (1943)

 sinais são apresentados à entrada;

 cada sinal é multiplicado por um número, ou peso, que indica a sua

influência na saída da unidade;

 é feita a soma

ponderada dos sinais que produz um nível de atividade;

 se este nível de

atividade exceder um certo limite (threshold) a unidade produz uma

determinada resposta de saída.

Função de ativação

(9)

DSC/CEEIUFCG

9

Neurônio Artificial

 “Dispara” quando uma combinação linear de suas

(10)

10

Redes Neurais Artificiais

 Cada unidade i calcula

 Uma soma ponderada de suas entradas

 Depois, aplica uma função de ativação g a essa soma

para derivar a saída





n j j i j i

w

a

in

0 ,        



 n j j i j i i g in g w a a 0 , ) (

(11)

DSC/CEEIUFCG

11

A função de ativação

 g é projetada para atender a dois propósitos

 Deseja-se a unidade “ativa” (próxima de =1) quando as

entradas “corretas” forem recebidas e “inativa” (próxima de 0) quando as entradas “erradas” forem recebidas

 A ativação precisa ser não-linear

(12)

12

Exemplo:

 sinais de entrada X₁, X₂, ..., X_p (0 ou 1)  pesos W₁, W₂, ..., W_p, valores reais.

 limitador t;

 Neste modelo, o nível de atividade a é dado por: a = W₁X₁ + W₂X₂ + ... + W_pX_p

 A saída y é dada por: • y = 1, se a ≥ t ou • y = 0, se a < t.

(13)

DSC/CEEIUFCG

13

Exemplos de Aplicações

 Exemplo bem simplificado: suponha que você está

em uma encruzilhada com quatro caminhos a seguir, e precisa escolher o mais fácil.

 Como você nunca andou em nenhum deles, o peso de cada

um é 1, ou seja, tanto faz escolher qualquer um.

 Você escolhe um deles, e anda até descobrir um lago em

que deve atravessar a nado. Pela dificuldade, você deve aumentar o peso deste caminho para 2.

 _{Quando outra pessoa chegar na mesma encruzilhada,}

saberá que o caminho de maior peso é o mais difícil a seguir.

 A rede neural “aprende” a determinar os pesos de acordo

(14)

14

Rede Neural - Organização em Camadas (Exemplo)

(15)

DSC/CEEIUFCG

15  As camadas são classificadas em três grupos

(usualmente):

 Camada de Entrada: onde os padrões são

apresentados à rede;

 Camadas Intermediárias ou Escondidas: onde

é feita a maior parte do processamento, através das conexões ponderadas; podem ser

consideradas como extratoras de características;

 Camada de Saída: onde o resultado final é

concluído e apresentado.

(16)

16

Redes Neurais: Classificação dos Modelos Conexionistas

 Em relação à estrutura da rede:

 Redes de uma única camada  Redes de múltiplas camadas  Redes do tipo uni-direcional  Redes do tipo recorrentes

 Redes com estrutura estática (não altera a sua estrutura)  Redes com estrutura dinâmica (altera a estrutura)

 Redes com conexões de ordem superior

(17)

DSC/CEEIUFCG

17

Estruturas de rede

 Redes acíclicas ou redes de alimentação direta:  _{Representam uma função de sua entrada atual;}  NÃO têm nenhum estado interno além dos pesos.

 Redes cíclicas ou redes recorrentes:

 Utilizam suas saídas para realimentar suas próprias

entradas;

 Níveis de ativação da rede formam um sistema

dinâmico

 Pode atingir um estado estável ou exibir oscilações;

 A resposta da rede a uma determinada entrada pode

(18)

18

Redes de alimentação direta

 Representa uma função de suas entradas

 Dados os valores de entrada a₁ e a₂ a rede calcula:

a₅= g(W_3,5a₃ + W_4,5a₄)

(19)

DSC/CEEIUFCG

19

Redes de alimentação direta

 Expressando a saída de cada unidade oculta como

uma função de suas entradas percebe-se que:

 a₅ é uma função das entradas da rede;

 Os pesos da rede atuam como parâmetros dessa

função;

 A rede calcula h_w(x);

 Ajustando os pesos muda-se a função que a rede

representa;

(20)

20

Processos de Aprendizado

 A propriedade mais importante das redes neurais é

a habilidade de aprender com seu ambiente e com isso melhorar seu desempenho.

 Isso é feito através de um processo iterativo de

ajustes aplicado a seus pesos, o treinamento.

 O aprendizado ocorre quando a rede neural atinge

uma solução generalizada para uma classe de problemas.

(21)

DSC/CEEIUFCG

21

Algoritmo de Aprendizado

 Conjunto de regras bem definidas para a solução de

um problema de aprendizado.

 Existem muitos tipos de algoritmos de aprendizado

específicos para determinados modelos de redes neurais.

 Os algoritmos diferem entre si principalmente pelo

modo como os pesos são modificados.

(22)

22

Redes Neurais: Classificação - Aprendizado

 Em relação ao aprendizado:

 Aprendizado supervisionado

 Aprendizado semi-supervisionado  Aprendizado não supervisionado  Aprendizado instantâneo

 Aprendizado por pacotes  Aprendizado contínuo  Aprendizado ativo

 Aprendizado: aproximação de funções  Aprendizado: classificação

 Usar apenas uma base de exemplos de aprendizado  Usar uma base de aprendizado e uma base de teste de

generalização

(23)

DSC/CEEIUFCG

23

Redes Neurais: Classificação dos Modelos Conexionistas

 Em relação as unidades da rede:

 Redes baseadas em Perceptrons (MLP - Multi-Layer Perceptron)

 Redes baseadas em Protótipos (RBF - Radial Basis Function)

(24)

24

Exemplos de Redes Neurais

(25)

DSC/CEEIUFCG

25

Aplicações Práticas

 Reconhecimento de Padrões: Caracteres, Imagens,

Voz, etc

 Sistemas de Auxílio ao Diagnóstico: Médico, Falhas

Mecânicas, etc

 Robótica Inteligente

 Previsão: Tempo, Cotações da Bolsa de Valores, etc  Sistemas de Controle

 Processamento de Sinais

 Processamento de Linguagem Natural

 Data Mining

(26)

26

Aplicações Práticas

 http://www.nd.com/neurosolutions/products/ns/nnandnsvideo.html

 http://fbim.fh-regensburg.de/~saj39122/begrolu/kohonen.html

(27)

DSC/CEEIUFCG

27  Exemplo de uso prático no Brasil: Visanet, operadora de

cartões de crédito.

 A empresa implantou um sistema de rede neural, batizado de Lynx, que detecta possíveis fraudes em transações com cartão.  A base de dados fornece um histórico e o hábito de consumo de

cada número de cartão de crédito Visa emitido no país.

 Número de transações anteriores: mais de 850 milhões.

 São emitidos alertas para os bancos toda vez que o Lynx detecta variáveis fora dos padrões e, portanto, a possibilidade de fraude.

 O sistema compara o comportamento de cada transação com os padrões armazenados na base de dados.

 Uma despesa em um estabelecimento comercial nunca utilizado antes por determinado cartão, por exemplo, gera uma variável.

 O cadastro e o histórico do próprio estabelecimento comercial geram outras variáveis - que levam em conta fatores como a ocorrência de casos anteriores de fraude.

 A soma dessas variáveis resulta em um índice de probabilidade de fraude que vai de 1% a 100%.

Exemplos de Aplicações

(28)

28  Exemplo: Reconhecimento de fala – reconhecer 1

de 10 vogais entre h_d (em inglês)

 – F1 e F2: parâmetros retirados da análise espectral do

som da palavra.

(29)

DSC/CEEIUFCG

29

 Neural Networks Java Applets:

 _{Perceptron Learning Rule (CNNL)}

 Image Compression Using Backprop (CNNL)

 _{Generalizations of the Hamming Associative Memory}

(CNNL)

 Joone - Java Object Oriented Neural Engine

 _{Porta XOR}

 Simulador de Redes Neurais: SNNS (Stuttgart Neural Network Simulator)

Exemplos de Aplicações

(30)

30

Por que utilizá-las?

 Generalização: Podem aprender através de conjuntos de exemplos e apresentar respostas coerentes para entradas não vistas durante o treinamento.

 Adaptabilidade: Podem adaptar-se a um novo ambiente através de alterações em seus pesos sinápticos. Também podem ser projetadas para alterarem seus pesos em tempo real ou para operarem em

ambientes que variem com o tempo.

 Informação Contextual: Processam as informações contextuais de forma natural, uma vez que o processamento de um neurônio é

afetado pelo processamento de outros neurônios da rede.

 Uniformidade: A mesma notação é utilizada em diferentes domínios de aplicações; os neurônios são encontrados em todas as redes neurais; é possivel utilizar os mesmos algoritmos de aprendizagem e teorias em diversas apllicações; através da integração homogênea de módulos, podemos construir redes modulares.

(31)

DSC/CEEIUFCG

31

Vantagens

 Aquisição automática de conhecimentos empíricos a

partir de uma base de exemplos de aprendizado referente a um problema;

 Manipulação de dados quantitativos, aproximados e

mesmo incorretos com uma degradação gradual das respostas;

 Grande poder de representação de conhecimentos

através da criação de relações ponderadas entre as entradas do sistema;

(32)

32

Desvantagens

 Dificuldade de configuração das redes em relação à

sua estrutura inicial e também no que se refere aos parâmetros dos algoritmos de aprendizado;

 Dificuldade de explicitar os conhecimentos

adquiridos pela rede através de uma linguagem compreensível para um ser humano;

 Dificuldade de convergência (bloqueios) e

instabilidade, inerentes aos algoritmos de otimização empregados;

 “Lentidão” do processo de aprendizado / adaptação.

Redes Neurais Artificiais

(33)

DSC/CEEIUFCG

33

Aprendizagem

(34)

34

Aprendizagem

Sistemas baseados em Redes Neurais Redes Bayesianas Algoritmos genéticos Sistemas Especialistas Sistemas Nebulosos (fuzzy) Sistemas de Aprendizagem simbólica indutiva Sistemas de PLN

conhecimento intensional (regras)

conhecimento extensional (exemplos)

simbólico numérico Sistemas baseado em casos Robôs