• Nenhum resultado encontrado

A figura 3.6 apresenta um diagrama de atividades que contempla os trˆes aspectos enumerados nas se¸c˜oes 3.1, 3.2 e 3.3. O diagrama apresenta os passos propostos, pelo presente estudo, que, ao final de sua execu¸c˜ao, apresentar´a um novo conjunto de elementos da bibliografia que s˜ao desconhecidos ou foram negligenciados pelo pesquisador.

Figura 3.6: Diagrama de atividades das etapas de apoio

3.4.1

C´alculo de relevˆancia

O passo de pontua¸c˜ao, ser´a respons´avel por prover uma forma de quantificar a relevˆancia mencionada na se¸c˜ao 3.1 para cada estudo a ser analisado. Para o de-

vido fim, pode-se utilizar n˜ao somente o algoritmo proposto, HITS, mas tamb´em outros algoritmos de c´alculos de relevˆancia para n´os em um grafo ou outra forma de pontua¸c˜ao que leve em considera¸c˜ao os relacionamentos existentes entre os docu- mentos envolvidos. Por´em, o presente estudo, ir´a considerar o HITS como principal quantificador, conforme j´a justificado seu uso.

Essa ´e a primeira das trˆes atividades a serem repetidas de forma iterativa con- forme apresentado pelo diagrama de atividades da figura 3.6. A cada itera¸c˜ao, essa atividade ir´a recalcular as pontua¸c˜oes de todos os n´os do grafo atual. Isso significa dizer que a cada expans˜ao, todos os n´os que j´a existiam ter˜ao suas pontua¸c˜oes re- calculadas e possivelmente alteradas dependendo da nova estrutura formada ap´os a adi¸c˜ao de poss´ıveis novos n´os ao grafo pela itera¸c˜ao anterior.

A atividade de c´alculo de relevˆancia ´e de grande importˆancia. Ela ´e respons´avel por gerar medidas que tornar˜ao poss´ıvel realizar tanto a atividade de expans˜ao da bibliografia como a sugest˜ao de novas bibliografias. O produto gerado por essa atividade ir´a se tornar parte das regras utilizadas para condu¸c˜ao para as demais atividades citadas.

3.4.2

Agrupamento por ´area

Em seguida, para prover uma forma de executar o descrito pela se¸c˜ao 3.2, o passo de clusteriza¸c˜ao ir´a dividir as referˆencias do grafo total em grupos atrav´es do m´etodo de Louvain (BLONDEL et al., 2008). Esse m´etodo levar´a em considera¸c˜ao a estrutura do grafo existente, ou seja, os relacionamentos existentes no presente grafo. Cada comunidade encontrada, conforme j´a mencionado em proposta (se¸c˜ao 1.3), representar´a um conjunto de documentos pertencentes a um tema em comum. Essa medida possibilita que a busca seja conduzida filtrando os temas envolvidos no prop´osito de pesquisa estabelecido. Com isso pode-se experimentar buscas com larguras mais equilibradas, nas quais cada ´area seja igualmente buscada ou pode- se escolher que apenas determinadas ´areas sejam expandidas. Para esse passo, o presente estudo ir´a considerar como padr˜ao a largura mais equilibrada poss´ıvel a fim de n˜ao criar vi´es em suas indica¸c˜oes finais.

Al´em disso, utilizar largura mais equilibrada poss´ıvel, tamb´em significa n˜ao pre- estabelecer o n´umero de comunidades a serem formadas. Deixar que o algoritmo encontre uma convergˆencia de acordo com seus crit´erios de maximiza¸c˜ao. Crit´erios esses que ser˜ao explicados na se¸c˜ao de algoritmo.

Essa ´e a segunda das trˆes atividades a serem repetidas. A cada itera¸c˜ao, essa ser´a respons´avel por encontrar todas as comunidades existentes no grafo atual. Da mesma forma que a atividade de pontua¸c˜ao, essa atividade poder´a ser afetada pela inclus˜ao de novos n´os oriundos da itera¸c˜ao anterior. Ao serem adicionados novos

n´os, poss´ıveis novas comunidades podem ser encontradas e comunidades encontradas previamente podem ser repartidas.

3.4.3

Expans˜ao da bibliografia

No final de cada itera¸c˜ao, se faz necess´aria a expans˜ao da bibliografia para cobrir a necessidade apresentada na se¸c˜ao 3.3. Essa atividade ditar´a, atrav´es da quantidade de melhores referˆencias pontuadas por comunidade, quantas ser˜ao as referˆencias a serem consideradas para a expans˜ao do conjunto bibliogr´afico existente. Isso proporciona uma outra forma de controlar o alcance da descoberta a ser realizada. Com isso, pode-se especificar o qu˜ao profundo deseja-se que a busca expanda cada assunto.

Al´em disso, h´a o sentido da busca. Trata-se de uma forma de se controlar qual ser´a o sentido que alimentar´a o grafo com novas informa¸c˜oes. Conforme explicado na se¸c˜ao 3.3, podem ser dois: sentido das referˆencias, passado, e o sentido das cita¸c˜oes, futuro. Vale enfatizar que as cronologias s˜ao relativas ao momento de cria¸c˜ao de cada documento de onde se partiu a busca.

O processo de expans˜ao ser´a realizado de forma iterativa. Por isso ´e necess´ario que haja uma forma de controlar a quantidade de itera¸c˜oes a ser realizada. Para isso haver´a uma medida que representar´a o alcance da profundidade na expans˜ao do conjunto bibliogr´afico que o pesquisador possui inicialmente.

O alcance da profundidade descreve o n´umero i de itera¸c˜oes na etapa de busca e servir´a para regular o tamanho do crescimento da base de dados existente ao longo das itera¸c˜oes. Em outras palavras, seja um grafo que represente a bibliografia de um estudo, as cita¸c˜oes e referˆencias dessa bibliografia. O alcance da profundidade indica a distˆancia m´axima que deseja-se alcan¸car atrav´es das referˆencias iniciais at´e referˆencias que ainda n˜ao tenham sido expandidas (que n˜ao possuam mapeadas suas liga¸c˜oes com referˆencias fora do conjunto inicial).

3.4.4

Sugest˜ao de nova bibliografia

A atividade de sugest˜ao, ap´os n itera¸c˜oes mencionadas, ir´a prover, atrav´es do n´umero de sugest˜oes por ´area existente, quantas sugest˜oes deseja-se obter. Ser˜ao selecionadas as n referˆencias mais bem quantificadas pelo HITS ao longo de suas itera¸c˜oes. Essas sugest˜oes ir˜ao representar o conjunto dos poss´ıveis estudos que fo- ram esquecidos ou negligenciados pelo estudo alvo envolvido e poder˜ao ser sugeridos para uma leitura de seus resumos e em seguida, se assim for de fato relevante, sua leitura na ´ıntegra.

Documentos relacionados