REDES NEURAIS
REDES NEURAIS
Marley Maria B.R.
Marley Maria B.R.
Vellasco
Vellasco
ICA: Núcleo de Pesquisa em InteligênciaICA: Núcleo de Pesquisa em Inteligência
Computacional Aplicada
Computacional Aplicada
PUC
PUC--RioRio
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
MOTIVAÇÃO
MOTIVAÇÃO
Constatação que o cérebro processa informações de forma diferente dos computadores convencionais
Ð
COMPUTADORCOMPUTADORprocessamento extremamente rápido e preciso na execução de seqüência de instruções Î muito mais lento no reconhecimento de padrões
Ð
Processamento altamente paralelo
Processamento altamente paralelo
(10
(101111neurônios com 10neurônios com 1044 conexões cada)conexões cada)
CÉREBRO
CÉREBRO
velocidade 1 milhão de vezes mais lenta que qualquer “gate” digital Î processamento extremamente rápido no reconhecimento de padrões
Problema dos 100 Passos
Problema dos 100 Passos
Neurônio: 2ms
Ô
Processador: 2ns
Ó
Processador é 106 mais rápidoque o neurônio
Ð
Cérebro reage a um estímulo entre 0,20,2e 1 seg.
Ð
MOTIVAÇÃO
MOTIVAÇÃO
•
•
Observações:
Observações:
– O cérebro tem ∼ 10 bilhões10 bilhõesde neurônios. – Cada neurônio tem ∼ 1.0001.000a 10.00010.000conexões
Ð –
–60 trilhões60 trilhõesde conexões - 10101414 sinapsessinapses!
Ð
– Cada pessoa pode dedicar 100.000 conexões100.000 conexões
para armazenar cada segundo de experiência
(65 anos ⇒ 2.000.000.000 de segundos!)
– Durante os 2 primeiros anos de vida, 1.000.0001.000.000
de sinapses
de sinapsessão formadas por segundo!!
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
OBJETIVO
OBJETIVO
Estudar a teoria e a implementação de
sistemas
massivamente
massivamente
paralelos
paralelos
, que
possam processar informações com
eficiência comparável
eficiência comparável ao cérebro.
DEFINIÇÃO
DEFINIÇÃO
Redes Neurais Artificiais
Redes Neurais Artificiais
são sistemas
inspirados nos neurônios biológicos
neurônios biológicos
e
na estrutura
estrutura massivamente
massivamente
paralela
paralela
do
cérebro, com capacidade de adquirir
adquirir
,
armazenar
armazenar
e utilizar
utilizar
conhecimento
IDÉIA BÁSICA
IDÉIA BÁSICA
Sistemas compostos de diversas
Sistemas compostos de diversas
unidades simples
unidades simples
(neurônios artificiais)
(neurônios artificiais)
ligadas de maneira apropriada, podem
ligadas de maneira apropriada, podem
gerar
gerar
comportamentos interessantes e
comportamentos interessantes
e
complexos
complexos.
.
Comportamento
Comportamento é determinado pela
é determinado pela
estrutura das ligações (
estrutura das ligações (
topologia
topologia) e
) e
pelos
pelos
valores das conexões
valores das conexões
(pesos
(pesos
sinápticos
sinápticos
)
)
Aquisição de Conhecimento:
Aquisição de Conhecimento:
Aprendizado
Aprendizado
Treinamento efetuado através da apresentação de exemplos
Ð
Existe uma variedade de algoritmosalgoritmos que
estabelecem QUANDOe COMO os parâmetros
da Rede Neural devem ser atualizados
Ð
Algoritmos:Substituem a programação necessária para a execução das tarefas nos computadores
APLICAÇÕES GERAIS
APLICAÇÕES GERAIS
;
Reconhecimento de Padrões
;
Classificação de Padrões
;
Correção de Padrões
;
Previsão de Séries Temporais
;
Aproximação de Funções
;
Suporte à Decisão
;
Geração de Informação
;
Descoberta de Conhecimento
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características
Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
Características Básicas
Características Básicas
Devido à similaridade com a estrutura
do cérebro, as Redes Neurais exibem
características similares ao do
comportamento humano, tais como:
Características Básicas
Características Básicas
•
•
Procura Paralela e
Procura Paralela e
Endereçamento pelo Conteúdo
Endereçamento pelo Conteúdo
:
:
O cérebro não
não
possui endereço de
endereço de
memória
memória
e não
não
procura
procura
a
informação sequencialmente
sequencialmente
Características Básicas
Características Básicas
•
•
Aprendizado
Aprendizado
:
:
A rede aprende por experiência
aprende por experiência
, não
necessitando explicitar os algoritmos
para executar uma determinada
tarefa
Características Básicas
Características Básicas
•
•
Associação
Associação
:
:
A rede é capaz de fazer associações
entre padrões diferentes
Características Básicas
Características Básicas
•
•
Associação
Associação
:
:
A rede é capaz de fazer associações
entre padrões diferentes
Ex:
Foto
Î
Pessoa
Sintomas
Î
Doença
Leitura de Sensores
Î
Falha
Características Básicas
Características Básicas
•
• GeneralizaçãoGeneralização::
Habilidade de lidar com
ru
ruíídos e distordos e distorççõesões, respondendo
corretamente a padrões novos.
Î
Redes Neurais são capazes de generalizar o seu generalizar o seu conhecimento conhecimentoa partir de exemplos anteriores
Características Básicas
Características Básicas
• • AbstraçãoAbstração::Capacidade de abstrair a essência de um abstrair a essência de um
conjunto de entradas
conjunto de entradas, isto é, a partir de padrões ruidosos, extrair a informação do padrão sem ruído.
Características Básicas
Características Básicas
•
• Robustez e Degradação GradualRobustez e Degradação Gradual::
A perda de um conjunto de elementos processadores e/ou conexões sinápticas não causa o mal funcionamento da rede neural.
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
EVOLUÇÃO
EVOLUÇÃO
McCulloch & Pitts (Mathematical Bio-Physics, Vol. 5, 1943),
“A Logical Calculus of Ideas Immanent in Nervous Activity”
Von Neumann Marvin Minsky Frank Rosenblatt Machine Intelligence Macroscopic Intelligence Microscopic Intelligence 1945 Digital Computers 1950 Black-Box AI (LISP) Perceptron, Adaline 1960 Mainframes Theorem Solver
1970 Vax 780 (Time Sharing) Expert Systems 1980 Workstations, PCs Commercialization of E.S. Rumelhart, Hopfield 1990 Desktop Supercomputers Commercialization of N.N.
EVOLUÇÃO
EVOLUÇÃO
•
•
Modelo de
Modelo de
McCulloch
McCulloch
-
-
Pitts
Pitts
:
:
w w11 w w22 w wnn x x11 x x22 x xnn T wi= + 1 -i = 1,2,..., n s s Entradas (valores 0,1) Entradas (valores00,,11) n sk+1= 1 se Σ w ixik ≥ T i=1 n 0 se Σ wixi k < T i=1 n sk+1= 1 se Σ w ixik ≥ T i=1 n 0 se Σ wixi k < T i=1EVOLUÇÃO
EVOLUÇÃO
•
•
Modelo de
Modelo de
McCulloch
McCulloch
-
-
Pitts
Pitts
:
:
T=0 T=0 T=0 T=1 T=1 T=0 T=1 x1 x2 x1 x3 x2 1 x3 -1 s entrada excitatória s k+1= xk 1 1 1 1 1 1 1 -1 -1 -1 -1 s entrada inibitória NAND __ A B AB 0 0 1 0 1 1 1 0 1 1 1 0 NAND NAND____ A B AB A B AB 0 0 1 0 0 1 0 1 1 0 1 1 1 0 1 1 0 1 1 1 0 1 1 0 NOR ___ A B A+B 0 0 1 0 1 0 1 0 0 1 1 0 NOR NOR ______ A B A+B A B A+B 0 0 1 0 0 1 0 1 0 0 1 0 1 0 0 1 0 0 1 1 0 1 1 0 Célula de Memória na ausência de entradas, a saída é armazenada indefinidamente Célula de Memória Célula de Memória na ausência de entradas, na ausência de entradas, a saída é armazenada a saída é armazenada indefinidamente indefinidamenteHISTÓRICO
HISTÓRICO
• McCulloch & Pitts (1943):
– modelo computacional para o neurônio artificial. Não possuía capacidade de aprendizado
• Hebb (1949):
– modelo de aprendizado ((HebbianHebbianLearningLearningRuleRule).).
• Rosenblatt (1957):
– modelo Perceptron, com grande sucesso em certas aplicações e problemas em outras aparentemente similares.
• Minsky & Papert ( Perceptrons 1969):
– prova matemática de que as redes Perceptron são incapazes de solucionar problemas simples tipo OU-EXCLUSIVO
• Rumelhart (início da década de 80):
– novos modelos que superaram os problemas dos Perceptrons.
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
CONCEITOS BÁSICOS
CONCEITOS BÁSICOS
•
•
Neurônio Artificial
Neurônio Artificial
– (Elemento Processador)
•
•
Estruturas de Interconexão
Estruturas de Interconexão
– FeedForward de 1 camada
– FeedForward de Múltiplas Camadas – Recorrente (com realimentação)
Elemento Processador
Elemento Processador
Elemento Processador inspirado no Neurônio Biológico
Squashing SquashingFunctionFunction
Elementos Básicos
Elementos Básicos
•
•
Estado de Ativação
Estado de Ativação
Î
s
j•
•
Conexões entre Processadores
Conexões entre Processadores
– a cada conexão existe um peso sináptico
que determina o efeito da entrada sobre o processador Îwji
•
•
Função de Ativação
Função de Ativação
– determina o novo valor do Estado de Ativaçãodo processador Îsj= F (netj)
Funções de Ativação
Funções de Ativação
É a função que determina o nível de
ativação do Neurônio Artificial:
s
j= F(net
j)
F(netj) F(netj) F(netj)
netj
netj netj
Degrau
Degrau Pseudo-Pseudo-LinearLinear SigmoidSigmoid
RN x Sistema Nervoso Real
RN x Sistema Nervoso Real
9 Feed-Forward 9 totalmente conectada 9 estrutura uniforme 9 poucos tipos de processadores 9 geralmente estática ¾ Recorrente ¾ conexões localizadas ¾ módulos funcionais ¾ centenas de tipos de neurônios ¾ dinâmico
Tipos de Processadores
Tipos de Processadores
Î
Recebe os dados de entrada
Î
Apresenta os dados de saída
Î
As suas entradas e saídas
permanecem dentro do sistema
Neurônio Artificial
Neurônio Artificial
3 pontos importantes: ÂThresholding
 Não-Linearidade  Saturação F(netj) netj threshold saturação não-linear F(net) net w0 w1 w2 x1 x2 bias y net = w0+ w1x1+ w2x2 F(net) = 1 (sigmoid) 1 + e-net
Neurônio Artificial
Neurônio Artificial
Em função das equações de
net
e
F(net)
:
1 y = F(net) = 1 + e -(w 0+ x1w1+ x2w2) Fórmula matemática representada pelo neurônio artificial x1 x2 yExemplos
Exemplos
Regressão Linear: y = a0+ a1x1+ a2x2+ a3x3 Variáveis explicativas Representação Neural Bias = +1 a2 a1 a0 a3 x3 x2 x1 y Função linearAcha aretaretacom erro mínimoque passe pelos
pontos existentes (padrões de treinamento) Reta obtida pela regressão Deslocamento em função do a0(bias)
Exemplos
Exemplos
Transformada de Fourier:
y = a0+ a1sen(wt + φ1) + a2sen(2wt + φ2) + a3sen(3wt + φ3) + ... Representação Neural +1 (bias) t (tempo) yTodos com função de ativação senoidal Função Linear w a1 a0 a3 a2 3w 2w φ2 φ3 φ1
CONCEITOS BÁSICOS
CONCEITOS BÁSICOS
•
•
Neurônio Artificial
Neurônio Artificial
– (Elemento Processador)
•
•
Estruturas de Interconexão
Estruturas de Interconexão
– FeedForward de 1 camada
– FeedForward de Múltiplas Camadas – Recorrente (com realimentação)
Topologias das Redes
Topologias das Redes
Neurais
Neurais
•
•
Redes
Redes
Feed
Feed
-
-
Forward
Forward
:
:
– redes de uma ou mais camadas de processadores, cujo fluxo de dadosfluxo de dadosé sempre em uma única direçãouma única direção, isto é, não existe realimentação.
•
•
Redes Recorrentes
Redes Recorrentes
:
:
– redes com conexões entre processadores da mesma camada e/ou com processadores das camadas anteriores (realimentaçãorealimentação).
Redes
Redes Feed
Feed-
-Forward
Forward
Redes de uma camada
Redes de uma camada
PE3 PE2 PE1
PEn
Redes
Redes Feed
Feed-
-Forward
Forward
Rede de Múltiplas Camadas
Rede de Múltiplas Camadas
Camada Intermediária
(Escondida) Camada de Saída
PE3 PE2 PE1 PEn PE1 PE2 PEm
H 1 I 1 Novo dado (não apresentado durante o treinamento) I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w
Exemplo 1: Reconhecimento de Padrões
Exemplo 1: Reconhecimento de Padrões
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w w w w w w w w w w w Atividade Neural Entrada Pesos Escondida Saída Pesos
Exemplo 1: Reconhecimento de Padrões
Exemplo 1: Reconhecimento de Padrões
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos O 1 O 2 O 3 Saída
Exemplo 1: Reconhecimento de Padrões
Exemplo 1: Reconhecimento de Padrões
janela Entradas da rede Dados de Treinamento Série temporal
Exemplo 2: Previsão
Exemplo 2: Previsão
janela previsto Entradas da rede Saída da rede: Valor previsto Dados de Treinamento Série temporal
Exemplo 2: Previsão
Exemplo 2: Previsão
Dados previstos Dados reaisRedes Recorrentes
Redes Recorrentes
I n p u t
I n p u t
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
I n p u t
I n p u t
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRedes Recorrentes
Redes Recorrentes
O u t p u t
O u t p u t
R R e e a a l l i i m m e e n n t t a a ç ç ã ã o oRede Convergiu para um estado estável
Rede Convergiu para um estado estável
Memória
Memória
Autoassociativa
Autoassociativa
Padrão de entrada
Padrão
de entrada 11° ciclo° ciclo 22° ciclo° ciclo
3° ciclo estável -3° ciclo estável
-•
•
Exemplo 1:
Exemplo 1:
–– Rede de 120 processadoresRede de 120 processadores
CONTEÚDO
CONTEÚDO
•
•
Introdução
Introdução
– Motivação, Objetivo, Definição, Características Básicas e Histórico
•
•
Conceitos Básicos
Conceitos Básicos
– Neurônio Artificial, Modos de Interconexão
•
•
Processamento Neural
Processamento Neural
– Recall e Learning•
•
Regras de Aprendizado
Regras de Aprendizado
– Regra de Hebb, Perceptron, Back Propagation, Hopfield, Competitive Learning, RBF, etc.
Processamento Neural
Processamento Neural
O processamento de uma Rede Neural
pode ser dividido em duas fases:
Processo de cálculo da saída da rede, dado um certo padrão de entrada
-Recuperação da Informação
Recuperação da Informação
Processo de atualização dos pesos sinápticospara a aquisição do conhecimento - Aquisição da InformaçãoAquisição da Informação
Aprendizado
Aprendizado
Aprendizado
Aprendizado
• Processo pelo qual os parâmetros livres
-pesos sinápticos -de uma rede neural são
adaptados através de um processo contínuo
de estimulação pelo ambiente.
• Existem 3 tipos básicos de aprendizado:
; Treinamento Supervisionado (TS); ; Treinamento Não-Supervisionado; ; “Reinforcement Learning”.
Treinamento Supervisionado
Treinamento Supervisionado
Geralmente efetuado através do processo
de minimização do erro
minimização do erro
calculado na saída.
A rede é treinada através do fornecimento dos
valores de
entrada
entrada
e de seus respectivos
valores desejados de
sa
sa
í
í
da
da
(“training pair”).
Treinamento Supervisionado
Treinamento Supervisionado
PESOS AJUSTÁVEIS (W) PESOS PESOS AJUSTÁVEIS AJUSTÁVEIS (W) (W) CÁLCULO DO ERRO (e) CÁLCULO CÁLCULO DO ERRO DO ERRO (e) (e) PADRÃO PADRÃO DE ENTRADA DE ENTRADA (X) (X) SAÍDA SAÍDA (s) (s) VALOR VALOR DESEJADO DESEJADO (t) (t) e(t,s) e(t,s)Treinamento Supervisionado
Treinamento Supervisionado
Treinamento Supervisionado
Treinamento Supervisionado
FUNÇÕES OBJETIVO: Genérica
• Sum
Sum
of
of
Squared
Squared
Errors:
Errors
E
SSE= Σ
pΣ
i(t
pi- y
pi)
2p = padrões
i = elemento processador de saída
Treinamento Supervisionado
Treinamento Supervisionado
FUNÇÕES OBJETIVO: Classificação
• Cross
Cross
Entropy
Entropy
Error (
Error (
logarithmic
logarithmic
error):
error)
E
log= Σ
pΣ
i[ t
piln y
pi+ (1 - t
pi)ln(1 - y
pi)]
p = padrões
i = elemento processador de saída
y
piÖ interpretada como a probabilidade
de o
padrão p
pertencer à
classe i
Treinamento Não
Treinamento Não
-
-
Supervisionado
Supervisionado
“Self-Organization”
Î Não requer o
Não requer o
valor desejado de sa
valor desejado de sa
í
í
da
da
da rede. O
sistema extrai as características do
conjunto de padrões, agrupando-os em
classes inerentes aos dados
classes inerentes aos dados
.
Aplicado a problemas de “
“
Clusterização
Clusterização
”
”
PESOS AJUSTÁVEIS (W) PESOS PESOS AJUSTÁVEIS AJUSTÁVEIS (W) (W) PADRÃO PADRÃO DE ENTRADA DE ENTRADA (X) (X) SAÍDA SAÍDA (s) (s)
Treinamento Não
Treinamento Não
-
-
Supervisionado
Supervisionado
w1 t w2t w3t PE3 PE2 PE1
s
1s
2s
3 x1 x2 x3Topologia
Topologia
w1 t w2t w3tTreinamento Não
Treinamento Não
-
-
Supervisionado
Supervisionado
vetores de entrada
vetores de entrada
vetores de pesos no instante t
vetores de pesos no instante t
vetores de entrada
vetores de entrada
vetores de pesos no instante t
vetores de pesos no instante t
vetores de pesos após aprendizado
vetores de pesos após aprendizado
w1 t w2t w3t w1 t+n w2 t+n w3 t+n PE3 PE2 PE1
s
1s
2s
3 x1 x2 x3Topologia
Topologia
w1 t+n w2t+n w3t+nTreinamento Não
“
“Reinforcement
Reinforcement
Learning”
Learning
”
• Semelhante ao Treinamento Supervisionado (existe um objetivo);
• NÃO existe um targetpara cada padrão;
• Existe uma realimentação (sinal de reforço) que avalia a resposta como boaou ruim;
• O objetivo é maximizar a quantidade de reforço
positivo Î Ex. aprendizado de jogos, robôs
autômatos;
.
“
“Reinforcement
Reinforcement
Learning
Learning
”
”
•O Sistema de Aprendizado aprende a realizar uma aprende a realizar uma certa tarefa
certa tarefasomente com base nos resultados de sua nos resultados de sua experiência com uma interação com o ambiente experiência com uma interação com o ambiente.
Ambiente Ambiente Ambiente Sistema de Aprendizado Sistema de Sistema de Aprendizado Aprendizado Crítico Crítico Crítico Sinal de Sinal de Reforço Reforço Ações Ações Vetor de Vetor de Estado Estado
TS com “Distal
TS com “Distal
Teacher”
Teacher
”
• Treinamento intermediário entre o aprendizado supervisionado e o reinforcement learning
TS com “Distal
TS com “Distal Teacher
Teacher”
”
• Exemplo 1: controle de uma plantacontrole de uma planta
Controlador
Controlador
Controlador PlantaPlantaPlanta
Sinal de erro Sinal de erro e e Σ Entrada da Planta Entrada da Planta u u Sinal de Sinal de Referência Referência d d Saída Saída da Planta da Planta y y + +
-TS com “Distal
TS com “Distal
Teacher”
Teacher
”
• Exemplo 2: braço mecânicobraço mecânico
θ1 θ2 θ3 (θ1 θ2 θ3) (x,y) (x’,y’) Rede Neural Braço Mecânico Posição desejada Ângulos das juntas Posição real
Recuperação de Dados
Recuperação de Dados
Recuperação de Dados
Recuperação de Dados
Assumindo que um conjunto de padrões
tenha sido
armazenado, a Rede Neural
armazenado
pode executar as seguintes tarefas:
– Auto-associação – Hetero-associação – Classificação – Previsão GENERALIZAÇÃO GENERALIZAÇÃO
Recuperação de Dados
Recuperação de Dados
Autoassociação
Autoassociação
:
:
A Rede Neural recupera o padrão armazenado mais semelhante ao padrão de entrada
apresentado. Recuperação de padrões ruidosos Padrão de entrada distorcido Padrão correto recuperado
Recuperação de Dados
Recuperação de Dados
Autoassociação
Autoassociação
:
:
A Rede Neural recupera o padrão armazenado mais semelhante ao padrão de entrada
apresentado. Recuperação de padrões ruidosos
Recuperação de Dados
Recuperação de Dados
Heteroassociação
Heteroassociação
:
:
A Rede Neural armazena a associação entre
um par de padrões. Recuperação de um
padrão diferente do da entrada. Padrão de entrada com ou sem ruído Padrão correto recuperado ASCII Code of digit ‘1’
Recuperação de Dados
Recuperação de Dados
Heteroassociação
Heteroassociação
:
:
A Rede Neural mapeia um certo vetor de vetor de
entrada
entradaem um padrão de saída diferente.padrão de saída diferente.
Recuperação de Dados
Recuperação de Dados
Classificação:
Classificação:
A Rede Neural responde com a informação relativa
à classe (categoria) a qual o padrão de entrada
pertence (dentro de um conjunto de classes pré-determinado).
Ex:Padrões de entrada divididos em 3 classes distintas.
Caso especial de Heteroassociação (também chamado Pattern Recognition)
Padrão de entrada com ou sem ruído Classe 3 - (Quadrados) Classe 3 Classe 2 Classe 1
1 1 1 0 0 0 0 0 0 0 0 0
Recuperação de Dados
Recuperação de Dados
Classificação:
Classificação:
A Rede Neural responde com a informação relativa
à classe (categoria) a qual o padrão de entrada
pertence (dentro de um conjunto de classes pré-determinado).
Recuperação de Dados
Recuperação de Dados
Previsão:
Previsão:
O objetivo é determinardeterminar qual será o valor de uma o valor de uma
determinada quantidade em um instante de
determinada quantidade em um instante de
tempo
tempo tt0+k0+k (k>0), utilizando dados medidos até o instante t0inclusive.
t f(x)
t0-n
t0-na t0Î pontos do conjunto de treinamento t > t0 Î pontos previstos (k=1). t0
Recuperação de Dados
Recuperação de Dados
Previsão:
Previsão:
O objetivo é determinardeterminar qual será o valor de uma o valor de uma
determinada quantidade em um instante de
determinada quantidade em um instante de
tempo
tempo tt0+k0+k (k>0), utilizando dados medidos até o instante t0inclusive.
t f(x)
t0-n
t0-na t0Î pontos do conjunto de treinamento
t > t0 Î pontos previstos (k=1). t1
Recuperação de Dados
Recuperação de Dados
Previsão:
Previsão:
O objetivo é determinardeterminar qual será o valor de uma o valor de uma
determinada quantidade em um instante de
determinada quantidade em um instante de
tempo
tempo tt0+k0+k (k>0), utilizando dados medidos até o instante t0inclusive.
t f(x)
t0-n
t0-na t0Î pontos do conjunto de treinamento
t > t0 Î pontos previstos (k=1).
Recuperação de Dados
Recuperação de Dados
Previsão:
Previsão:
O objetivo é determinardeterminar qual será o valor de uma o valor de uma
determinada quantidade em um instante de
determinada quantidade em um instante de
tempo
tempo tt0+k0+k (k>0), utilizando dados medidos até o instante t0inclusive.
t f(x)
t0-n
t0-na t0Î pontos do conjunto de treinamento t > t0 Î pontos previstos (k=1). t1t2t3
Recuperação de Dados
Recuperação de Dados
Previsão:
Previsão:
O objetivo é determinardeterminar qual será o valor de uma o valor de uma
determinada quantidade em um instante de
determinada quantidade em um instante de
tempo
tempo tt0+k0+k (k>0), utilizando dados medidos até o instante t0inclusive.
t f(x)
t0-n
t0-na t0Î pontos do conjunto de treinamento t > t0 Î pontos previstos (k=1). t1t2 t0+t
Recuperação de Dados
Recuperação de Dados
Generalização:
Generalização:
A Rede Neural responde corretamente a um padrão de entrada fora do conjunto de treinamento .
GENERALIZAÇÃO
GENERALIZAÇÃO
A Rede Neural responde corretamente a um padrão de entrada fora do conjunto de
treinamento Interpola corretamente os novos
pontos apresentados
x f(x)
x1 x2 x3 Xnovox4 x5
generalizações Boa interpolação
Interpolação ruim
xiÎ pontos do conjunto de treinamento xnovoÎ novo ponto para generalização
Exemplos de Treinamento
Exemplos de Treinamento
Supervisionado
Supervisionado
n
Reconhecimento de Caracteres
Reconhecimento de Caracteres
o
Previsão de Séries Temporais
Previsão de Séries Temporais
Reconhecimento de
Reconhecimento de
Caracteres
Caracteres
H 1 I 1 Atividade Neural Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w PesosEstrutura da Rede Neural
Estrutura da Rede Neural
H 1 I 1 Dados para Treinamento I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w Alvo
Processo de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída PesosH 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para Treinamento H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para Treinamento H 1 I 1 Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Pesos Dados para TreinamentoAtualização dos pesos em função do erro
Atualização dos pesos em função do erro
H 1 I 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w Alvo
Processo de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaB
H 1 I 1 Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Pesos Dados para TreinamentoAtualização dos pesos em função do erro
Atualização dos pesos em função do erro
B
I 1 H 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos TreinamentoZ
Dados paraH 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoZ
Dados para AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaZ
Dados para H 1 I 1 Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Pesos Dados para TreinamentoAtualização dos pesos em função do erro
Atualização dos pesos em função do erro
Z
I 1 H 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoH 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para Treinamento AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 Saída H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Dados para Treinamento Entrada PesosEscondidaPesos Saída
Atualização dos pesos em função do erro
Atualização dos pesos em função do erro
H 1 I 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w Alvo
Processo de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaB
H 1 I 1 Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Pesos Dados para TreinamentoAtualização dos pesos em função do erro
Atualização dos pesos em função do erro
B
I 1 H 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos TreinamentoZ
Dados paraH 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoZ
Dados para AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaZ
Dados para H 1 I 1 Entrada Pesos Escondida I 2 I 3 H 2 H 3 w w w w w w w w w O 1 Saída O 2 O 3 w w w w w w w w w Erro =-Processo de Aprendizado
Processo de Aprendizado
Pesos Dados para TreinamentoAtualização dos pesos em função do erro
Atualização dos pesos em função do erro
Z
I 1 H 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoH 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w w
Processo de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para Treinamento AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 Saída H 1 I 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
I 1 H 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w wProcesso de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoB
Alvo
Processo de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaB
I 1 H 1 I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w w AlvoProcesso de Aprendizado
Processo de Aprendizado
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos TreinamentoZ
Dados para H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w Alvo w w w w w w w w wProcesso de Aprendizado
Processo de Aprendizado
w Atividade Neural Entrada Pesos Escondida Saída Pesos Dados para TreinamentoZ
Dados para AlvoProcesso de Aprendizado
Processo de Aprendizado
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos Dados para Treinamento O 1 O 2 O 3 SaídaZ
Dados paraProcesso de Generalização
Processo de Generalização
Recuperação da Informação
Aprendida
H 1 I 1 Novo dado (não apresentado durante o treinamento) I 3 H 2 H 3 w w w w w w w w w O 1 O 2 O 3 w w w w w w w w wProcesso de Generalização
Processo de Generalização
I 2 Atividade Neural Entrada Pesos Escondida Saída Pesos H 1 I 1 I 2 I 3 H 2 H 3 O 1 O 2 O 3 w w w w w w w w w w w w w w w w wProcesso de Generalização
Processo de Generalização
w Atividade Neural Entrada Pesos Escondida Saída PesosProcesso de Generalização
Processo de Generalização
Atividade Neural H 1 I 1 I 2 I 3 H 2 H 3 w w w w w w w w w w w w w w w w w w Entrada Pesos Escondida Pesos O 1 O 2 O 3 Saída Resposta Resposta correta a um correta a um novo padrão! novo padrão!Previsão de
Previsão de
Séries Temporais
Séries Temporais
Série temporal janela alvo Entradas da rede = nvalores passadosEstrutura da Rede Neural
Estrutura da Rede Neural
Dados de Treinamento Saída Desejada = valor da série k passos à frente Ex:5 valores passados Ex:valor um passo à frente Entradas da rede Saída da rede: Valor previsto um passo à frente
Processo de Aprendizado
Processo de Aprendizado
Série temporal janela alvo Dados de TreinamentoAjuste dos pesos a partir do erro (Erro= alvo - previsto) Entradas da rede Saída da rede: Valor previsto um passo à frente
Processo de Aprendizado
Processo de Aprendizado
Série temporal janela alvo Dados de Treinamentojanela alvo
Ajuste dos pesos a partir do erro (Erro= alvo - previsto) Entradas da rede
Processo de Aprendizado
Processo de Aprendizado
Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frente janela alvo Entradas da rede Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frenteAjuste dos pesos a partir do erro (Erro= alvo - previsto)
Processo de Aprendizado
Processo de Aprendizado
janela alvo Entradas da rede Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frenteAjuste dos pesos a partir do erro (Erro= alvo - previsto)
Processo de Aprendizado
Processo de Aprendizado
janela alvo Entradas da rede Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frenteAjuste dos pesos a partir do erro (Erro= alvo - previsto)
Processo de Aprendizado
Processo de Aprendizado
Ajuste dos pesos a partir do erro (Erro= alvo - previsto) Entradas da rede Saída da rede: Valor previsto um passo à frente
Processo de Aprendizado
Processo de Aprendizado
Série temporal janela alvo Dados de Treinamento janela alvoAjuste dos pesos a partir do erro (Erro= alvo - previsto) Entradas da rede
Processo de Aprendizado
Processo de Aprendizado
Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frente janela alvo Entradas da rede Dados de Treinamento Série temporal Saída da rede: Valor previsto um passo à frenteAjuste dos pesos a partir do erro (Erro= alvo - previsto)
Processo de Aprendizado
Processo de Aprendizado
Processo de Generalização
Processo de Generalização
Recuperação da Informação
Aprendida
janela Entradas da rede Dados de Treinamento Série temporal
Processo de Generalização
Processo de Generalização
janela previsto Entradas da rede Saída da rede: Valor previsto Dados de Treinamento Série temporalProcesso de Generalização
Processo de Generalização
Dados previstos janela previsto Entradas da rede: inclui o(s) valor(es) previstos pela RedeSaída da rede: Valor previsto Dados de Treinamento Série temporal Dados previstos
Processo de Generalização
Processo de Generalização
janela previsto Dados de Treinamento Série temporal Dados previstosProcesso de Generalização
Processo de Generalização
Entradas da rede: inclui o(s) valor(es) previstos pela RedeSaída da rede: Valor previsto