• Nenhum resultado encontrado

Os seguintes conceitos s˜ao definidos: • vout como a vari´avel de sa´ıda emV ; • V∗ = v

1, . . . , v∗n como o vetor de todas as vari´aveis discretizadas em V : originalmente qualitativas ou discretizadas pelo DPV; • v∗

out como a vari´avel de sa´ıda em V∗;

• ˜X = ˜x1, . . . , ˜xn comos os valores previstos de v∗out pela RB; • ˜X1 = ˜x1

1, . . . , ˜x1n como os valores previstos corretamente de v∗out pela RB;

• ˜X0= ˜x0

1, . . . , ˜x0n como os valores previstos incorretamente de v∗out pela RB; • ev(x) = n X i=1 beliefi· pontomedioi (5.19) como uma fun¸c˜ao que retorna o valor quantitativo esperado de uma classe em vout∗ , baseado nas probabilidades da rede (beliefs) e em uma lista com os n´umeros reais que representam cada classe de vout∗ . A lista de n´umeros reais ´e criada atrav´es dos pontos m´edios de cada classe de v∗out comparados com vout.

A discretiza¸c˜ao de uma vari´avel vi no DPV depende dos pontos de corte pico e vale, al´em de um coeficiente de relevˆancia pr´e-definido (α). Entretanto, a distribui¸c˜ao de probabilidade em vi influencia o processo de inferˆencia de toda a RB (Equa¸c˜ao 3.1).

57

Portanto, ´e necess´ario discretizar todas as vari´aveis simultane- amente, o que gera um Problema de Otimiza¸c˜ao Global (HORST; RO- MEIJN, 2002), ou seja, encontrar o melhor conjunto de condi¸c˜oes aceit´aveis

para atingir um objetivo formulado por termos matem´aticos.

Nesta disserta¸c˜ao, a fun¸c˜ao objetivo consiste em discretizar todas as vari´aveis do conjunto de dados, de forma que o erro de previs˜ao da vari´avel de sa´ıda seja o menor poss´ıvel.

Assumindo que vout pode tanto ser quantitativa quanto quali- tativa, duas fun¸c˜oes objetivo diferentes podem ser usadas. Se vout for qualitativa,

encontre V∗= max acuracia(v∗out) (5.20) onde

acuracia(v∗out) = | ˜X 1|

| ˜X0| + | ˜X1| (5.21) Por´em, se voutfor quantitativa, a fun¸c˜ao objetivo ´e dada pela mi- nimiza¸c˜ao do erro NRMSE (normalized root mean square error ), dado por

encontre V∗= min N RM SE(vout) (5.22) onde N RM SE(vout) = 100 · q 1 n Pn i=1(xi− ev( ˜xi))2 xmax− xmin (5.23) O erro NRMSE ´e calculado a partir do erro RMSE, que ´e con- siderado uma boa medida de desempenho embora seja dependente de escala. A normaliza¸c˜ao do erro traz a vantagem de independente de escala e a poss´ıvel compara¸c˜ao entre diferentes bases de dados (HYND- MAN; KOEHLER, 2006).

A execu¸c˜ao do m´etodo DPV segue o fluxo geral de execu¸c˜ao do Algoritmo Gen´etico (Figura 5). Por´em, ´e necess´ario definir o valor de α (o mesmo para toda a execu¸c˜ao), as vari´aveis V do dom´ınio e a vari´avel de sa´ıda vout.

Ap´os a defini¸c˜ao de parˆametros, o algoritmo segue o fluxo do AG, com a cria¸c˜ao randˆomica de indiv´ıduos, a avalia¸c˜ao da popula¸c˜ao atrav´es da fun¸c˜ao fitness, a sele¸c˜ao, o crossover e a muta¸c˜ao.

58

Para cada indiv´ıduo da popula¸c˜ao, ´e feita a discretiza¸c˜ao de to- das as vari´aveis quantitativas (utilizando o Algoritmo 3), cria-se uma RB utilizando as vari´aveis discretizadas e as qualitativas do tipo na¨ıve Bayes e calcula-se o valor de fitness seja pela acur´acia (voutqualitativa) ou pelo erro (vout quantitativa). Caso vout seja quantivativa, o DPV procura minimizar o fitness (erro) e caso voutseja qualitativa, o DPV procura maximizar o fitness (acur´arica).

O resultado do m´etodo ´e aquele considerado o melhor indiv´ıduo da execu¸c˜ao, ou seja, com o melhor fitness. Portanto s˜ao retornados os pontos de corte para cada vari´avel e a RB criada atrav´es desses pontos de corte.

O algoritmo expresso em Algoritmo 4 mostra o fluxo de trabalho que satisfaz as fun¸c˜oes objetivo (Equa¸c˜oes (5.20) e (5.22)), utilizando a t´ecnica de Algoritmos Gen´eticos (AG).

Algoritmo 4 M´etodo de Discretiza¸c˜ao pico e vale via AG

1: α ← algum coeficiente de relevˆancia α, (0 < α < 1)

2: V ← vari´aveis de algum dom´ınio de aplica¸c˜ao

3: vout ← vari´avel de sa´ıda em V

4: P = ind1, . . . , indn ← o vetor de indiv´ıduos randomicos contendo os cortes de pico e vale para cada vari´avel quantitativa em V (po- pula¸c˜ao)

5: while n˜ao encontrou solu¸c˜ao do

6: for all indi in P do

7: discretize todas as vari´aveis quantitativas (Algoritmo 3)

8: RBi← uma RB com todas as vari´aveis - qualitativas e quan- titativas ap´os discretiza¸c˜ao - topologia Na¨ıve Bayes

9: if vout is qualitativa then

10: f itnessi ← acuracia(vout) (Equ (5.20))

11: else

12: f itnessi ← N RM SE(vout) (Equation (5.22))

13: end if 14: end for 15: sele¸c˜ao() 16: crossover() 17: muta¸c˜ao() 18: end while

19: return o melhor indi em P (aquele com o melhor fitness) e RBi (a RB criada por esse indiv´ıduo)

59

A complexidade computacional do m´etodo DPV, assim como o fluxo geral do algoritmo, ´e semelhante `a do Algoritmo Gen´etico cl´assico, que, em uma popula¸c˜ao de n indiv´ıduos possui complexidade de O(n log n) ∗ O(f itness) para `a convergˆencia do algoritmo (GOLD- BERG, 1989).

A fun¸c˜ao fitness no DPV utiliza dois m´etodos fundamentais: a discretiza¸c˜ao de todas as vari´aveis e a pr´opria inferˆencia Bayesiana. A fun¸c˜ao de discretiza¸c˜ao possui a complexidade de O(k ∗ m) onde k ´e a quantidade de vari´aveis cont´ınuas e m ´e a quantidade de registros em cada vari´avel. Portanto a complexidade geral do m´etodo DPV, ´e dada pela f´ormula:

O(n log n) ∗ [O(k ∗ m) + O(inf erence)] (5.24) Sendo que O(inf erence) depende do algoritmo de inferˆencia Bayesiana utilizado, que ´e considerado um problema do tipo NP-hard (COOPER, 1990). O algoritmo utilizado nesse trabalho foi implemen- tado no shell Netica1 da Norsys Software Corp e utiliza t´ecnicas do tipo “join tree” (SPIEGELHALTER et al., 1993).

61

6 RESULTADOS E DISCUSS ˜AO

Para avaliar a performance do DPV duas situa¸c˜oes foram testa- das: quando a base de dados tem uma sa´ıda qualitativa (Se¸c˜ao 6.1) e quando a vari´avel de sa´ıda ´e quantitativa (Se¸c˜ao 6.2).

Quando a vari´avel de sa´ıda ´e qualitativa, o objetivo do algo- ritmo ´e realizar a classifica¸c˜ao da vari´avel estimando a probabilidade de cada uma de suas classes. Portanto, a fun¸c˜ao objetivo do problema de otimiza¸c˜ao est´a em maximizar a acur´acia (classifica¸c˜ao correta).

Quando a vari´avel de sa´ıda ´e quantitativa o objetivo do algo- ritmo vai al´em da classifica¸c˜ao: ´e necess´ario que a m´edia estimada pelo vetor de probabilidade reflita o comportamento da vari´avel. Portanto, nesse caso, a fun¸c˜ao objetivo est´a relacionada com a minima¸c˜ao do erro (NRMSE) entre a m´edia estimada e o valor real de cada registro.

O DPV ´e um m´etodo de Aprendizagem Supervisionada (MIT- CHELL, 1997) e os dados s˜ao divididos em dois conjuntos: treinamento e teste.

O coeficiente de relevˆancia α adotado neste trabalho foi de 0.8. Esse valor foi escolhido ap´os uma busca por coeficientes melhores adap- tados aos problemas apresentados.

Os resultados obtidos foram comparados com dois m´etodos de discretiza¸c˜ao para Redes Bayesianas: EWD e EFD.

Documentos relacionados