• Nenhum resultado encontrado

O Ambiente para Explora¸c˜ ao de Regras RulEE

No documento Generalização de regras de associação (páginas 106-110)

O Ambiente para Explora¸c˜ao de Regras RulEE (Paula 2003) foi desenvolvido com o objetivo de viabilizar tanto a an´alise quanto a disponibiliza¸c˜ao de regras de Classifica¸c˜ao (Mitchell 1998; Monard & Baranauskas 2003a; Monard & Baranauskas 2003b), Regress˜ao (Weiss & Indurkhya 1998) e Associa¸c˜ao (Agrawal & Srikant 1994; Adamo 2001). Nesse ambiente, o processo de an´alise e disponibiliza¸c˜ao das regras est´a baseado na id´eia de se utilizar um Reposit´orio de Regras e Medidas, que ´e a entidade principal do ambiente. No reposit´orio s˜ao armazenados os conjuntos de regras, os valores das medidas e as con- sultas realizadas pelos usu´arios. A arquitetura geral do ambiente RulEE ´e ilustrada na Figura 5.2.

Figura 5.2: Arquitetura geral do ambiente RulEE. Fonte: (Paula 2003)

Na Figura 5.2, os elementos que est˜ao no retˆangulo pontilhado correspondem ao RulEE. O ambiente tem como entrada arquivos no formato texto contendo conjuntos de regras de Classifica¸c˜ao, Regress˜ao ou Associa¸c˜ao representados em suas respectivas sintaxes padr˜oes (Prati, Baranauskas, & Monard 2001; Pugliesi, Dosualdo, & Rezende 2003; Melanda & Rezende 2003). Por utilizar sintaxes padr˜oes de representa¸c˜ao de regras e pelo projeto Discover possuir bibliotecas de convers˜ao dos diversos tipos de regras para essas sintaxes

padr˜oes, podem ser inseridas no ambiente as sa´ıdas de uma grande variedade de sistemas e algoritmos de Extra¸c˜ao de Conhecimento de Dados, entre os quais podem ser citados: C4.5, C4.5rules, C5.0/See5, Cubist, CN2, Ripper, Trepan, Newid, RT, M5, RETIS, CART, Weka, SNNS, SVMTorch, Apriori, MagnumOpus e Mineset.

Para avaliar as regras, o RulEE apresenta um conjunto de medidas de avalia¸c˜ao. Ap´os um conjunto de regras ter sido inserido no ambiente, os valores das diversas medidas s˜ao calculados e ficam dispon´ıveis para os usu´arios. O ambiente provˆe f´acil acesso `as regras e aos valores dessas medidas, e permite ainda que v´arias medidas sejam utilizadas de forma combinada para a an´alise (pela aplica¸c˜ao de restri¸c˜oes ou filtros) e ordena¸c˜ao das regras. Al´em disso, com o intuito de auxiliar a cria¸c˜ao de novas medidas e a realiza¸c˜ao de experimentos, nesse ambiente ´e poss´ıvel definir de maneira simples novas medidas cujo valor pode ser obtido a partir de uma express˜ao que utiliza o valor de outras medidas. O c´alculo do valor de novas medidas ´e realizado por procedimentos desenvolvidos pelos pr´oprios usu´arios, bastando ao ambiente invocar esses procedimentos e buscar o valor desejado no arquivo contendo o resultado da execu¸c˜ao do procedimento. A implementa¸c˜ao do ambiente RulEE permite que essas configura¸c˜oes possam ser realizadas facilmente, sem necessidade de alterar o c´odigo fonte.

Uma descri¸c˜ao mais detalhada dos elementos representados na Figura 5.2 ´e fornecida a seguir:

M´odulos para Processamento S˜ao os programas desenvolvidos para processamento de dados, regras e informa¸c˜oes dos usu´arios. Os m´odulos para processamento en- contrados no ambiente s˜ao:

• M´odulo de Gerenciamento: respons´avel pelo gerenciamento das regras dis- ponibilizadas no ambiente. Esse m´odulo recebe requisi¸c˜oes da Interface do ambiente, busca as regras correspondentes no Reposit´orio de Regras, invoca os m´odulos de P´os-Processamento ou recupera algum conjunto de dados no Reposit´orio de Dados, para ent˜ao retornar o resultado da requisi¸c˜ao para a Interface.

O M´odulo de Gerenciamento ´e respons´avel pela inser¸c˜ao dos conjuntos de regras de Classifica¸c˜ao, Regress˜ao e Associa¸c˜ao (em seus respectivos formatos padr˜ao) no Reposit´orio de Regras e Medidas e pela obten¸c˜ao ou c´alculo dos valores de medidas para as regras.

• M´odulos de P´os-Processamento: s˜ao os m´odulos respons´aveis pelo c´alcu- lo das medidas de avalia¸c˜ao das regras disponibilizadas. Esses m´odulos con- tˆem procedimentos para c´alculo das medidas e apresentam m´etodos distintos

para tratamento de regras de Classifica¸c˜ao, Regress˜ao e Associa¸c˜ao. E im-´ portante destacar que no ambiente RulEE s˜ao utilizados os m´odulos de p´os- processamento implementados no projeto Discover, sendo que para isso foi definida uma interface para invocar os m´etodos de p´os-processamento quando necess´ario.

Interface Por meio da Interface, o usu´ario pode acessar todas as informa¸c˜oes disponibi- lizadas pelo ambiente RulEE. A Interface ´e baseada na www, a fim de aproveitar algumas de suas vantagens, como independˆencia de plataforma e, especialmente, facilidade de utiliza¸c˜ao pelos usu´arios do processo independente de sua localiza¸c˜ao f´ısica. Pela Interface do ambiente, o usu´ario interativamente seleciona as regras que julgar mais interessantes, utilizando as medidas dispon´ıveis, para ent˜ao interpret´a- las e utiliz´a-las. Uma outra fun¸c˜ao da Interface ´e coletar, armazenar e disponibilizar informa¸c˜oes fornecidas pelos usu´arios. Uma das telas da interface do RulEE ´e apre- sentada na Figura 5.3.

Figura 5.3: Interface do ambiente RulEE

Cabe ressaltar que Paula (2003), em seu trabalho, n˜ao se preocupou com quest˜oes de usabilidade da Interface e que essas quest˜oes ser˜ao abordadas em trabalhos futuros. Reposit´orios Correspondem `a Base de Dados, desenvolvida utilizando o gerenciador MySQL (Axmark, Widenius, & DuBois 2002) e os arquivos nos quais s˜ao armaze-

nadas as informa¸c˜oes disponibilizadas. No ambiente, s˜ao encontrados trˆes tipos de reposit´orios:

Reposit´orio de Informa¸c˜oes de Usu´arios Conjunto de tabelas nas quais s˜ao armazenadas as informa¸c˜oes relacionadas aos usu´arios do ambiente. Algumas informa¸c˜oes armazenadas s˜ao: cadastro de usu´arios, coment´arios e vota¸c˜oes em regras.

Reposit´orio de Regras e Medidas Conjunto de tabelas para armazenamento das regras e dos valores das medidas a serem disponibilizadas no ambiente. Um aspecto importante foi a defini¸c˜ao do modelo desse reposit´orio, de forma a facilitar o armazenamento e recupera¸c˜ao das regras, o cadastro e inser¸c˜ao de novas medidas para avalia¸c˜ao, e o c´alculo e recupera¸c˜ao dos valores das medidas para as regras.

Reposit´orio de Dados Arquivos nos quais s˜ao armazenados os dados referentes aos conjuntos de regras disponibilizados. Esses dados podem ser utilizados para auxiliar o usu´ario na compreens˜ao das regras, assim como podem ser utilizados por algum m´odulo de P´os-Processamento.

Entre as principais caracter´ısticas ou funcionalidades implementadas no ambiente RulEE podem ser citadas:

• o c´alculo das medidas objetivas para avalia¸c˜ao de regras descritas no framework apresentado em Lavraˇc, Flach, & Zupan (1999) e da medida RI (Piatetsky-Shapiro 1991) para a an´alise das regras;

• a implementa¸c˜ao de consultas para recupera¸c˜ao dos conjuntos de regras e dos res- pectivos valores de medidas;

• a Interface simples e interativa baseada na www;

• a possibilidade de an´alise dos conjuntos de regras utilizando consultas de forma iterativa;

• o armazenamento de valores inseridos por usu´arios como indicativos da interessabili- dade, compreensibilidade, utilidade e novidade das regras, al´em do armazenamento de coment´arios anexados `as regras dos conjuntos de regras e das consultas.

Al´em das caracter´ısticas citadas, com o desenvolvimento do m´odulo computacional RulEE-GAR, o ambiente RulEE passou a fornecer funcionalidades para a generaliza¸c˜ao

de Regras de Associa¸c˜ao e para a an´alise e explora¸c˜ao das regras generalizadas. O am- biente RulEE ´e detalhadamente descrito em Paula (2003). J´a o m´odulo RulEE-GAR ´e apresentado na pr´oxima se¸c˜ao.

No documento Generalização de regras de associação (páginas 106-110)