• Nenhum resultado encontrado

A arquitetura estabelecida por esse trabalho e implementada para resolu¸c˜ao do problema proposto e experimenta¸c˜ao das caracter´ısticas dissertadas foi composta de 4 componentes: componente de extra¸c˜ao, componente de busca e recupera¸c˜ao de da- dos, componente de processamento de dados e componente de representa¸c˜ao. Sendo

o componente principal o de processamento de dados, destinado a implementar a heur´ıstica descrita por esse estudo. Cada componente desse descreve uma parte da arquitetura que pode se implementada por diversos tipos de tecnologias e cada componente pode ser substitu´ıdo por outro cujos padr˜oes de entrada e sa´ıda sejam os mesmos.

A arquitetura geral desse sistema proposto pode ser entendida atrav´es diagrama mostrado pela imagem 4.1. Seus componentes implementados s˜ao descritos passo a passo pelas subse¸c˜oes seguintes de forma gen´erica sem se ater a uma tecnologia espec´ıfica. Cada subse¸c˜ao explica como devem ser os componentes para constru¸c˜ao de uma ferramenta que implemente a solu¸c˜ao proposta pelo presente estudo.

Figura 4.1: Arquitetura geral

4.3.1

Componente de extra¸c˜ao

O componente de extra¸c˜ao deve ser composto por um m´odulo capaz de ler um arquivo de entrada com uma listagem de referˆencias a ser analisada. Essa listagem deve estar em um formato padr˜ao que exiba os metadados de cada referˆencia a fim de ser poss´ıvel utilizar um parser que leia tais informa¸c˜oes e as disponibilize de forma que possa ser processada. Esse estudo utilizou o padr˜ao BIBTEX para representar suas referˆencias.

Portanto, esse componente recebe como entrada um arquivo padr˜ao e seu m´odulo de processar BIBTEX disponibiliza um objeto padronizado para acesso e leitura de todos os metadados das referˆencias listadas. Sua representa¸c˜ao ´e mostrada pela figura 4.2:

Figura 4.2: Componente voltado para processar listagens de referˆencias em um formato padr˜ao. Sua sa´ıda ´e um objeto com acesso padronizado para leitura das informa¸c˜oes processadas

4.3.2

Componente de busca e recupera¸c˜ao

O componente de busca e recupera¸c˜ao deve ser composto por um m´odulo capaz de buscar em uma base de dados, seja ela local ou remota, informa¸c˜oes acerca de referˆencias, cita¸c˜oes e detalhes associados a uma publica¸c˜ao. Para isso, esse compo- nente recebe como entrada um objeto com acesso padronizado contendo informa¸c˜oes de um ou mais artigos a serem buscados em formato de lista ou em formato de grafo. A sa´ıda disponibilizada por esse componente dever´a ser um objeto grafo tamb´em padronizado para posterior acesso a suas informa¸c˜oes.

O objeto de sa´ıda deve ser constru´ıdo com base em 2 informa¸c˜oes b´asicas: iden- tificador de um artigo e liga¸c˜oes de referˆencia e cita¸c˜ao entre os artigos contidos no objeto. Esse tamb´em deve ser capaz de armazenar em sua estrutura interna dados associados a cada artigo representado pelos v´ertices do grafo gerado. A imagem 4.3 ilustra sua representa¸c˜ao:

Figura 4.3: Componente voltado para processar listagens de referˆencias em um formato padr˜ao. Sua sa´ıda ´e um objeto com acesso padronizado para leitura das informa¸c˜oes processadas

4.3.3

Componente de processamento

O componente de processamento ´e o cerne da implementa¸c˜ao. Esse ´e o com- ponente respons´avel por implementar a heur´ıstica proposta por esse estudo. Nele s˜ao processados os dados recebidos, atrav´es de um objeto com formato padronizado de acesso, e disponibiliza-se um objeto de sa´ıda para leitura e apresenta¸c˜ao das informa¸c˜oes geradas.

Esse componente ´e composto por 4 m´odulos: pontua¸c˜ao, clusteriza¸c˜ao, expans˜ao e sugest˜ao conforme mostra a figura 4.4 :

Figura 4.4: Componente voltado para processar listagens de referˆencias em um formato padr˜ao. Sua sa´ıda ´e um objeto com acesso padronizado para leitura das informa¸c˜oes processadas

O m´odulo de pontua¸c˜ao ´e respons´avel por fazer a leitura inicial do objeto recebido pelo componente e processar os dados de acordo com o m´etodo proposto. Esse componente disponibiliza como sa´ıda um objeto com dados em formato de grafo, cujos v´ertices encontram-se pontuados.

O m´odulo de clusteriza¸c˜ao, recebe um objeto com os dados em formato de grafo e encontra clusters seguindo a o m´etodo escolhido para esse fim. Sua sa´ıda ´e o objeto grafo de entrada acrescido de atributos que armazenem as listas de clusters formados com seus respectivos v´ertices.

O m´odulo de expans˜ao recebe como entrada um objeto grafo. O m´odulo ´e res- pons´avel por selecionar as informa¸c˜oes a serem expandidas e as disponibilizar em formato de objeto grafo que cont´em em um atributo uma listagem de v´ertices desse grafo a serem expandidos. Ou ainda, esse m´odulo ´e respons´avel apenas por entregar o objeto de sa´ıda em formato de grafo j´a expandido.

O m´odulo de sugest˜ao recebe como entrada um objeto grafo cujos v´ertices pos- suem pontua¸c˜oes acerca de suas relevˆancias. Esse m´odulo ´e respons´avel por seleci- onar, seguindo seu m´etodo interno os v´ertices a integrarem uma listagem sugerida. Essa listagem passar´a a integrar um atributo do objeto grafo de sa´ıda.

Portanto, esse componente recebe como entrada um objeto grafo que pode passar por uma expans˜ao iterativa necessitando se comunicar com o componente de busca e recupera¸c˜ao. Esse componente disponibiliza como sa´ıda um objeto grafo podendo conter uma listagem de v´ertices sugeridos.

4.3.4

Componente de representa¸c˜ao

O componente de representa¸c˜ao possui o m´odulo de gerar visualiza¸c˜ao que ´e res- pons´avel pela parte visual das informa¸c˜oes. Esse recebe um objeto grafo com seus poss´ıveis atributos adicionados, realiza sua leitura e o representa graficamente. A implementa¸c˜ao desse componente pode se dar n˜ao necessariamente utilizando mode-

los de representa¸c˜ao em grafos, mas qualquer modelo que seja capaz de representar os relacionamentos recebidos.

Figura 4.5: Componente voltado para processar listagens de referˆencias em um formato padr˜ao. Sua sa´ıda ´e um objeto com acesso padronizado para leitura das informa¸c˜oes processadas

Documentos relacionados