3.2 Medidas de Avalia¸c˜ao de Conhecimento
3.2.2 Medidas Subjetivas
Em Silberschatz & Tuzhilin (1996) foi proposta uma classifica¸c˜ao para as medidas subjetivas, que considera os aspectos subjetivos (interesse do usu´ario) na avalia¸c˜ao de regras. Essa classifica¸c˜ao identifica as duas principais raz˜oes que tornam o conhecimento interessante, que s˜ao a inesperabilidade e a utilidade.
Inesperabilidade (Unexpectedness) - o conhecimento ´e interessante se ´e novo para o usu´ario ou contradiz seu conhecimento pr´evio ou sua expectativa.
Utilidade (Actionability ) - o conhecimento ´e interessante se o usu´ario pode tomar alguma decis˜ao com ele obtendo alguma vantagem.
Esses dois conceitos n˜ao s˜ao excludentes entre si. Regras interessantes podem ser apresentadas de maneira combinada, podendo ser: inesperadas e ´uteis, inesperadas e n˜ao ´
uteis ou esperadas e ´uteis.
Liu, Hsu, Chen, & Ma (2000) prop˜oem quatro medidas para identificar regras de associa¸c˜ao esperadas e inesperadas considerando o conhecimento pr´evio do dom´ınio. Para captar o conhecimento que o usu´ario possui sobre o dom´ınio, Liu, Hsu, Chen, & Ma (2000) prop˜oe uma linguagem predefinida, podendo expressar o conhecimento como:
Impress˜ao geral (GI)- rela¸c˜ao que o especialista acredita existir entre os itens especi- ficados.
gi(< S1, . . . , Sm >) [suporte, confian¸ca]
Conhecimento impreciso (RPC)- conhecimento que o especialista sup˜oe ser verdadeiro.
rpc(< S1, . . . , Sm → V1, . . . , Vg >) [suporte, confian¸ca]
Conhecimento preciso (PK)- o usu´ario acredita na precis˜ao da associa¸c˜ao.
pk(< S1, . . . , Sm → V1, . . . , Vg >) [suporte, confian¸ca]
Nessa linguagem para especifica¸c˜ao do conhecimento, os valores de suporte e confian- ¸ca s˜ao opcionais. O usu´ario tamb´em pode definir uma taxonomia, ou seja, especificar categorias e n´ıveis de abstra¸c˜ao para os atributos. As classes definidas nessa taxonomia podem ser utilizadas na especifica¸c˜ao dos conhecimentos. Assim, cada elemento Si (ou
Vi) pode ser um item, uma classe ou uma express˜ao C+ ou C∗, nas quais C ´e uma classe.
C+ e C∗ correspondem, respectivamente, a uma ou mais, ou zero ou mais, instˆancias da classe C.
O conhecimento especificado ´e utilizado para analisar as regras descobertas. Cada regra descoberta tem sua estrutura comparada com cada conhecimento especificado, a fim de verificar o n´umero de itens que casam com os elementos especificados pelo usu´ario. A partir dessas an´alises s˜ao calculados os valores das medidas conformidade, antecedente inesperado, conseq¨uente inesperado e antecedente e conseq¨uente inesperados.
As medidas s˜ao definidas em rela¸c˜ao ao grau com que o LHS e/ou RHS da regra descoberta casa(m) com o conhecimento fornecido pelo usu´ario. Assim, Lij ´e um fator
que mede o quanto do LHS da regra est´a em conformidade com o LHS do conhecimento fornecido pelo especialista do dom´ınio. Pode ser considerado o mesmo para Rij em rela¸c˜ao
a RHS. Os valores destes fatores variam de 0 (nenhuma conformidade) a 1 (conformidade completa).
Conformidade - identifica e classifica regras em conformidade com uma impress˜ao geral ou um conhecimento impreciso fornecido pelo usu´ario especialista do dom´ınio.
conf mij = Lij · Rij (3.12)
Antecedente inesperado - avalia se o antecedente (LHS) da regra ´e inesperado.
unexpCondij = 0 se Rij − Lij ≤ 0, Rij − Lij se Rij − Lij > 0. (3.13)
Conseq¨uente inesperado - avalia se o conseq¨uente (RHS) da regra ´e inesperado.
unexpConseqij = 0 se Lij − Rij ≤ 0, Lij − Rij se Lij − Rij > 0. (3.14)
Antecedente e conseq¨uente inesperados - avalia se o antecedente e o conseq¨uente da regra s˜ao inesperados.
bsU nexpij = 1 − maxconfmij, unexpConseqij, unexpCondij
(3.15)
Os valores de Lij e Rij s˜ao calculados de acordo com o tipo de conhecimento fornecido
pelo usu´ario que est´a sendo utilizado. Se o conhecimento foi fornecido como uma impress˜ao geral, o c´alculo de Lij e Rij ´e dado por:
se LMij LNi > RMij RNi ent˜ao Lij = min LMij LNi ,SMij SNj (3.16) Rij = RMij RNi (3.17) sen˜ao Rij = min RMij RNi ,SMij SNj (3.18) Lij = LMij LNi (3.19) sendo que,
• LNi e RNi representam, respectivamente, o n´umero de itens no antecedente e no conse-
q¨uente da regra descoberta;
• SNj se refere ao n´umero de elementos1 do conjunto especificado pelo usu´ario como sendo
uma impress˜ao geral. Caso SNj = 0, ent˜ao a raz˜ao SMSNijj = 1;
• LMij e RMij representam, respectivamente, o n´umero de itens no antecedente e no con-
seq¨uente da regra descoberta que casam com os elementos da impress˜ao geral;
1
Conforme foi definido por Liu, Hsu, Chen, & Ma (2000), o conhecimento fornecido pelo usu´ario pode ser composto por itens e/ou classes de uma taxonomia, aqui chamados de elementos.
• SMij refere-se ao n´umero de elementos do conjunto especificado pelo usu´ario que casam
com itens da regra descoberta.
Se o conhecimento foi fornecido como um conhecimento impreciso, o c´alculo de Lij e
Rij ´e dado pelas equa¸c˜oes 3.20 e 3.21:
Lij = min LMij LNi ,LSMij LSNj (3.20) Rij = min RMij RNi ,RV Mij RV Nj (3.21) sendo que,
• LNi e RNi representam, respectivamente, o n´umero de itens no antecedente e no conse-
q¨uente da regra descoberta;
• LSNj e RV Nj representam, respectivamente, o n´umero de elementos no antecedente e no
conseq¨uente do conhecimento impreciso. Caso LSNj = 0 (ou RV Nj = 0) ent˜ao LSMLSNij
j = 1
(ou RV Mij
RV Nj = 1);
• LMij e RMij representam, cada qual, o n´umero de itens no antecedente e no conseq¨uente
da regra descoberta que casam respectivamente com o antecedente e o conseq¨uente do conhecimento impreciso;
• LSMij e RV Mij representam, cada qual, o n´umero de elementos no antecedente e no
conseq¨uente do conhecimento impreciso que casam respectivamente com o antecedente e o conseq¨uente da regra descoberta.
Nesta se¸c˜ao foram apresentadas medidas de avalia¸c˜ao objetivas e subjetivas. Na pr´ox- ima se¸c˜ao s˜ao descritas algumas t´ecnicas de visualiza¸c˜ao de informa¸c˜ao, que tamb´em podem ser usadas para auxiliar a avalia¸c˜ao de regras.