PROPRIEDADES PICO E VALE - Método de discretização de variáveis para redes bayesianas utilizand

Para descrever as propriedades dos pontos de corte no método DPV, os seguintes conceitos são definidos no contexto de uma variável vi:

• p(x) como uma fun¸c˜ao que recebe um valor x como entrada e retorna o percentil que esse valor se encontra;

• p−1_{(y) como a fun¸}_c˜_{ao inversa da fun¸}_c˜_{ao p(x): recebe um percentil} y como entrada e retorna o valor x que ele representa;

• vale como o percentil expresso pelo ponto de corte vale; • pico como o percentil expresso pelo ponto de corte pico;

• vale < pico; • X∗_{= x}∗

1, . . . , x∗ncomo o vetor discretizado do conjunto de valores de vi (X = x1, . . . , xn).

• pxmin como o percentil que representa o menor valor (xmin) em

vi;

• pxmax como o percentil que representa o maior valor (xmax) em

vi; ´

E poss´ıvel mesclar ou desprezar pontos de corte se eles não forem relevantes para a solu¸cão. A relevância dos pontos de corte e sua proximidade com os valores extremos (xmin e xmax) são expressos por um coeficiente de relevância α (0 < α < 1) definido por parâmetro, que de- termina quão perto o ponto de corte está desses valores. A proximidade para os dois pontos de corte segue as seguintes equa¸cões:

xmin p−1_(vale) ≤ α =⇒ p −1_{(vale) ≥} xmin α (5.1) p−1(pico) xmax < α =⇒ p−1(pico) < xmax∗ α (5.2) como vale < pico, a seguinte inequa¸cão é válida:

xmin

α < xmax∗ α (5.3)

Ou seja, para que exista um valor válido de α é necessário satis- fazer a inequa¸cão:

α2> xmin xmax =⇒ α >r xmin xmax (5.4) ´

E necessário, portanto, aplicar uma corre¸cão em α para assegu- rar que os pontos sempre possuam um intervalo de valores considerado relevante independente da proximidade de xmin e xmax. O valor ajustado do coeficiente, α0, é definido por:

α0= ((1 − δ) · α) + δ (5.5) onde δ ´e o coeficiente limite entre xmin e xmax, definido por:

δ =r xmin xmax

com essa defini¸cão, é poss´ıvel inferir que o limite da Equa¸cão 5.5 quando δ → 0 é:

lim

δ→0((1 − δ) · α) + δ = α (5.7) Ou seja, quando a distância entre xmin e xmax for muito grande (tender ao infinito), o valor de δ tende a zero e α0_{= α. A relevˆ}_{ancia dos} cortes, é portanto determinada pelo coeficiente ajustado α0. O menor valor relevante de vale é dado por:

p−1(valemin) = xmin

α0 (5.8)

e o maior valor relevante de pico ´e:

p−1(picomax) = xmax· α0 (5.9) Através das Equa¸cões 5.8 e 5.9 e considerando que ambos os pontos de corte possuam diferentes defini¸cões, é poss´ıvel definir a seguinte hierarquia:

pxmin≤ vale ≤ γ < pico ≤ pxmax (5.10)

onde γ = valemin+picomax

2 representa o limite entre pico e vale. Os seguintes crit´erios s˜ao usados para mesclar ou desprezar pontos de corte:           

caso 1: se p_p−1−1(vale)_(pico) > α0, ent˜ao mescle por

vale+pico 2 caso 2: se p−1_x(pico)

max > α

0_{, ent˜}_{ao despreze o corte de pico} caso 3: se xmin

p−1_(vale) > α0, ent˜ao despreze o corte de vale

caso 4: se caso 2 e caso 3 ent˜ao mescle por vale+pico₂

(5.11) A caracter´ıstica da RB de representar o conhecimento de forma expl´ıcita cria uma preocupa¸cão quanto ao nome das classes em X∗, que devem ser intuitivas e expressar suas propriedades. Dessa forma, os nomes das classes foram escolhidos levando em considera¸cão a Equa¸cão 5.11.

O cálculo da relevância dos cortes pico e vale no método DPV é feito de forma paramétrica e é necessário a defini¸cão de alguns parâmetros, como: a variável a ser discretizada, o valor do coeficiente de relevância α, e os dois pontos de corte respeitando a hierarquia da Equa¸cão 5.5. Esses parâmetros são definidos como entrada para o cálculo.

Após a defini¸cão dos parâmetros de entrada, é aplicada a corre¸cão do valor alpha pela Equa¸cão 5.5 e são calculados os valores de caso1, caso2 e caso3 através da Equa¸cão 5.11. Os valores calculados deter- minarão a quantidade de classes para a discretiza¸cão e o rótulo das mesmas.

O fluxo geral do cálculo da relevância dos cortes e sua respectiva discretiza¸cão pelo método DPV é expresso no Algoritmo 3.

Algoritmo 3 Relevˆancia dos cortes de pico e vale e discretiza¸c˜ao

1: v ← a vari´avel quantitativa a ser discretizada

2: α ← algum coeficiente de relevˆancia α, (0 < α < 1)

3: vale ← algum percentil de acordo com a Equa¸c˜ao 5.10

4: pico ← algum percentil de acordo com a Equa¸c˜ao 5.10

5: α0← corre¸c˜ao do α (Equa¸c˜ao 5.5)

6: caso1 ← p_p−1−1(vale)_(pico)

7: caso2 ← p−1_x(pico)

max

8: caso3 ← xmin

p−1_(vale)

9: if caso1 > α0 or ( caso2 > α0 and caso3 > α0 ) then 10: discretize v usando “baixo” e “alto” (2 classes)

11: else if caso2 > α0 then

12: discretize v usando “baixo” e “m´edio” (2 classes)

13: else if caso3 > α0 then

14: discretize v usando “m´edio” e “alto” (2 classes)

15: else

16: discretize v usando “baixo”, “m´edio” e “alto” (3 classes)

17: end if

18: return v discretizada (v∗)

5.1.1 Exemplo de Aplica¸c˜ao

Imagine uma situa¸cão onde xmin = 10, xmax = 12 e α = 0.8. Caso fosse aplicado o coeficiente de relevância sem efetuar a corre¸cão (α = α0), o menor valor poss´ıvel para o vale ser considerado relevante, pela Equa¸cão 5.8, é:

p−1(valemin) =

(xmin= 10)

(α0 _{= α = 0.8)} = 12.5 (5.12) De forma an´aloga, o maior valor poss´ıvel para o pico ser consi-

derado relevante, pela Equa¸c˜ao 5.9, ´e:

p−1(picomax) = (xmax= 12) · (α0= α = 0.8) = 9.6 (5.13) Esses valores geram uma contradi¸c˜ao, pois nunca seria aceito como relevante nenhum corte de vale ou de pico.

Para realizar a corre¸cão em α é necessário calcular o δ pela Equa¸cão 5.6 e aplicar a corre¸cão do coeficiente de relevância pela Equa¸cão 5.5: δ = s (xmin= 10) (xmax= 12) ∼ = 0.8334 (5.14) α0= ((1 − (δ = 0.8334)) · (α = 0.8)) + (δ = 0.8334) = 0.96668 (5.15) E por consequência, os valores de p−1(valemin) e p−1(picomax) são alterados pelas Equa¸cões 5.8 e 5.9:

p−1(valemin) =

(xmin= 10)

(α0 _{= 0.96668)}∼= 10.3447 (5.16)

p−1(picomax) = (xmax= 12) · (α0= 0.96668) ∼= 11, 6001 (5.17) Após definido os pontos de corte é necessário analisar a relevância dos mesmos (Equa¸cão 5.11).

Vamos supor que o algoritmo tenha definido os pontos de corte, e em uma variável vitenha sido encontrado o valor de vale = 20. Ou seja, o corte de vale encontra-se no percentil 20. Vamos supor ainda, que por interpola¸cão linear fosse encontrada p−1(vale) = 10.3. Da mesma forma para o corte de pico, imagine que pico = 98 e p−1(pico) = 11.9 Observe que nesse caso o corte de pico seria desprezado: o único corte válido seria o de vale.

Caso vale = 10, p−1(vale) = 10.15, pico = 80 e p−1(pico) = 11.5, seria desprezado o corte de vale.

Caso os valores estejam próximos, por exemplo,vale = 48, p−1(vale) = 10.98, pico = 52 e p−1(pico) = 11, nesse caso os dois cortes são unidos e é criado um novo corte pela Equa¸cão 5.11:

(vale = 48) + (pico = 52)

e seu percentil estabelecido por interpola¸c˜ao linear. Nesse caso, corte = 50 e p−1(corte) = 10.99.

Se o valor de vale for muito baixo e o de pico muito alto simulta- neamente é feito um novo corte de forma similar ao exemplo anterior. Nunca ocorrerá um caso em que o corte de vale seja muito alto ou que o pico seja muito baixo, pois esses cortes obedecem a hierarquia estabelecida na Equa¸cão 5.10.

No documento Método de discretização de variáveis para redes bayesianas utilizando algoritmos genéticos (páginas 53-58)