Segunda etapa: treinamento e adapta¸c˜ ao

5 Modelo baseado em regras nebulosas com aprendizado

5.2 Modelo construtivo baseado em regras nebulosas (C-FSM)

5.2.2 Segunda etapa: treinamento e adapta¸c˜ ao

O algoritmo construtivo consiste na modifica¸cão da estrutura gerada na etapa de inicializa¸cão. Estas modifica¸cões são executadas durante o processo de aprendizado, mediante a aplica¸cão de operadores de adi¸cão e de elimina¸cão de regras nebulosas em conjunto com o algoritmo EM. Previamente ao aprendizado da estrutura, é necessário definir critérios de adi¸cão e de poda, baseados em condi¸cões desejadas ou pré-definidas. Quando o modelo atual não satisfaz as condi¸cões desejadas, então a estrutura do modelo é modificada, seja gerando novas regras ou eliminando regras existentes como parte da estrutura do modelo. No caso

em que uma das regras que compõem a estrutura atual do modelo não é mais relevante, esta é eliminada da estrutura. Assim, o novo modelo é atualizado e re-ajustado aplicando uma seqüência de passos EM, tendo sempre em considera¸cão as restri¸cões e condi¸cões definidas para os parâmetros através das Equa¸cões (5.5)-(5.8).

Os critérios para a aplica¸cão dos operadores de adi¸cão e de poda de regras nebulosas são descritos a seguir.

5.2.2.1 Gera¸c˜ao de uma nova regra o adi¸c˜ao

O critério definido para a gera¸cão de uma nova regra nebulosa é chamado critério do antecedente, pois este tem como objetivo alocar os dados de entrada em regiões ativas de- finidas para as regras nebulosas. Dado que cada uma das M parti¸cões é representada pelo antecedente de cada uma das M regras nebulosas, o critério é a princ´ıpio orientado à gera¸cão ótima dos antecedentes destas regras.

O critério do antecedente avalia a capacidade de cada regra nebulosa gerar cada um dos dados de entrada e assim, cobrir de forma adequada o espa¸co de entrada definido pelos dados apresentados. Isto é, cada dado de entrada deve ser gerado por uma das regras locais com uma probabilidade m´ınima superior a um limiar pré-definido. Isto implica na localiza¸cão do dado de entrada na região ativa da regra nebulosa.

Seja Rk

i∗ a regra que fornece o maior grau de pertinˆencia para xk, i∗ ∈ {1, 2, . . . , M}, k =

1, 2, . . . , N. Considerando que os dados seguem uma distribui¸c˜ao normal e dado o n´ıvel de

confian¸ca de γ%, pode-se construir o intervalo de confian¸ca [ci−zγ

diag(Vi), ci+zγ

diag(Vi)],

no qual ci ´e o centro e diag(Vi) ´e a diagonal principal da matriz Vi. Neste trabalho, foi

considerado um n´ıvel de confian¸ca γ = 72, 86%, tal que P(−zγ < Z < zγ) = 72, 86%, com

Z _{∼ N(0, 1), como ilustra a Figura 5.}

Assim, a probabilidade de xk

ativar a i−ésima regra (ver Equa¸cão (4.4)) deve ser superior a 0, 1357, de acordo com a tabela de distribui¸cão normal. Ou seja:

P[ i∗ _{| x}k ] > 0, 1357 (5.9) com: i∗= arg max i ³ P[ i_{| x}k ]´ i=1,...,M (5.10)

ci+ zγ p diag(Vi) ci− zγ p diag(Vi) xk γ%

Da tabela de distribui¸c˜ao normal: γ = 72, 86%

zγ = 1, 1

P(i_|x )

Se NΩ >0⇒ Nova regra

0, 1357= (1− 0, 7286)/2

Figura 5: Condi¸c˜ao para gerar uma nova regra nebulosa.

Se a condi¸cão definida pela Equa¸cão (5.9) não for satisfeita por um ou mais dados do conjunto de treinamento, significa que estes dados possuem uma probabilidade de pertencer a alguma região ativa coberta pela base de regras, inferior ao desejado. Denotando por Ω o conjunto contendo todos os dados entrada-sa´ıda que não satisfazem a Equa¸cão (5.9), uma nova regra será inserida à estrutura do sistema, ou seja:

M = M + 1 (5.11)

A nova regra com região de ativa¸cão tem por objetivo incluir os dados ainda não considerados pelas regras já existentes, de tal forma que a parti¸cão do espa¸co de entrada seja otimizada, obtendo assim um novo ótimo local por meio do re-ajuste do modelo. Desta maneira, o centro da nova regra é inicialmente estimada como:

c_M+1 = 1

Nng

t∈Ω

x(t) (5.12)

sendo NΩ o n´umero de dados [xt yt] em Ω. Al´em disso, os demais parˆametros da nova regra

nebulosa s˜ao inicializados como segue:

• σM+1 = 1, 0;

• θM+1 = [¯y 0 . . . 0], onde ¯y ´e calculado como o valor m´edio das sa´ıdas desejadas perten-

centes ao conjunto Ω.

• Vi = 10−4I, onde Ip×p ´e a matriz identidade;

• αi = 1/(M).

Após a inser¸cão da nova regra, a estrutura do sistema é re-ajustada durante algumas

itera¸cões EM. Como αi indica a relevância de cada regra nebulosa, a sua re-inicializa¸cão é

necessária para que todas as regras tenham o mesmo peso, fazendo com que o ajuste dos parâmetros seja não-tendencioso, obtendo assim, uma nova parti¸cão do espa¸co de entrada. A

re-inicializa¸cão de Vi é necessária já que o processo de re-ajuste definirá novos valores de dis-

pers˜ao para cada regra nebulosa, de acordo com a nova parti¸c˜ao gerada, ou seja, considerando neste processo a nova regra inserida na estrutura do modelo.

5.2.2.2 Elimina¸c˜ao ou poda

Os parˆametros αi, i = 1, . . . , M podem ser considerados como uma medida indireta da

importância ou relevância de cada regra nebulosa para a arquitetura atual do modelo de série temporal, com rela¸cão as outras regras, isto devido à condi¸cão de unicidade definida no

Capitulo 4, Equa¸cão (4.3), e a defini¸cão de αi dada pela Equa¸cão (5.5).

Como é observado, αi é proporcional à soma de todas as estimativas a posteriori hk_i dos

graus de pertinˆencia de todo o conjunto de treinamento. Portanto, quanto mais cada regra ´e

ativada, maior ser´a o respectivo valor de αi.

Esta caracter´ıstica é de grande utilidade para a sele¸cão de regras a serem eliminadas. Se existe a necessidade de eliminar alguma regra ou modelo local, um poss´ıvel candidato será

aquele com o menor valor de αi. O valor m´ınimo ou limiar para αi ´e denotado por αmin, de

tal forma que, se

αi < αmin (5.13)

então a i−ésima regra nebulosa será eliminada da estrutura atual do modelo, sendo αmin

definido pelo usu´ario via tentativa e erro.

Após a elimina¸cão de uma regra, o C-FSM é re-ajustado por algumas itera¸cões EM utilizando as Equa¸cões (5.5)–(5.8) até atingir a convergência. Ou seja, até a fun¸cão de

verossimilhan¸ca atingir um máximo local ou um máximo número de itera¸cões previamente

definido.

A utiliza¸cão da fun¸cão de verossimilhan¸ca como fun¸cão objetivo, em conjunto com o algoritmo EM é de interesse neste trabalho, já que este não só trata do erro quadrático

médio, mas também da variância do erro, aumentando assim, as possibilidades de obter melhores resultados.

Ambos os operadores, de adi¸cão e de elimina¸cão de regras nebulosas serão também apli- cados na estratégia de aprendizado online a ser descrito no próximo cap´ıtulo.

A primeira etapa de inicializa¸cão descrita para esta abordagem de aprendizado offline é necessária, já que, o algoritmo EM é sens´ıvel à inicializa¸cão. Como o algoritmo de aprendizado construtivo offline é baseado nas Equa¸cões (5.5)-(5.8), as quais são derivadas do algoritmo de otimiza¸cão EM, uma boa inicializa¸cão aumentará as possibilidades de obter modelos eficientes no final do aprendizado construtivo. Assim, o algoritmo de aprendizado construtivo pode ser resumido de acordo com os passo seguinte:

Algoritmo 5 APRENDIZADO CONSTRUTIVO OFFLINE

Seja N o n´umero de dados entrada-sa´ıda que comp˜oem o conjunto de treinamento.

Definir αmin.

Passo 1. Inicializa¸c˜ao do modelo C-FSM:

• Passo 1.1 Definir uma estrutura inicial para o modelo, composto por M = M0 regras

nebulosas.

• Passo 1.2 Ajustar os parˆametros utilizando o algoritmo EM tradicional utilizando

o conjunto de treinamento previamente definido. Passo 2. Aprendizado:

• Passo 2.1 Adi¸c˜ao: Verificar a necessidade de uma nova regra utilizando o crit´erio

definido pela Equa¸cão (5.9). Caso seja necessário, gerar nova regra e re-ajustar os parâmetros do modelo utilizando o algoritmo EM tradicional.

• Passo 2.2 Puni¸c˜ao: Verificar a relevˆancia de cada uma das regras. Eliminar da

estrutura do modelo as regras que satisfa¸cam o critério de poda definido pela Equa¸cão (5.13). Re-ajustar os parâmetros do modelo utilizando o algoritmo EM tradicional.

• Passo 2.3 Verificar o critério de parada (ou por número máximo de itera¸cões ou por

erro m´ınimo atingido). Se o crit´erio de parada for satisfeito, para o processo. Caso contr´ario, voltar para o passo 2.1.

No documento Analises de series temporais e modelagem baseada em regras nebulosas (páginas 67-72)