Investigação da Disposição dos Dados - Paralelização de algoritmos de busca de documentos m

Esta seção apresenta propostas que exploram a disposição de dados frente aos processadores paralelos que visam a melhorar a localidade dos dados na hierarquia de memória disponibili- zada pela arquitetura da GPU. O resultado dessa investigação é a geração de duas estratégias de particiomento de dados entre os processadores de granularidade grossa apresentadas nas Subseções 4.2.1 e 4.2.2. Por meio dessas estratégias, é proposta uma estratégia de paralelização para o processamento de consulta e duas estratégias de paralelização para o processamento de lote de consultas, sendo que estas são apresentadas no Cap´ıtulo 6.

documentos mais relevantes, atravessando todas as listas invertidas dos termos da consulta ao mesmo tempo para avaliar todas as ocorrˆencias de um mesmo docID nas listas invertidas de todos os termos da consulta. Ent˜ao, para executar qualquer algoritmo dessa abordagem, um processador precisa ter acesso a todas listas invertidas dos termos da consulta.

Neste intuito de abordar os algoritmos DAAT, são propostas partições que contêm partes de todas as listas invertidas da consulta para explorar a localidade de memória dos processadores. Esse particionamento é efetivado de maneira que cada partição tenha o tamanho θ (Nm

|P|)

documentos, onde Nm ´e o tamanho da maior lista invertida dentre os termos e o P ´e o conjunto

de processadores de granularidade grossa. Assim, as listas invertidas dos termos da consulta são particionadas entre os processadores de granularidade grossa, de modo que cada partição contenha todas as listas invertidas dos termos da consulta. Dessa forma, garante-se que as partições se adequem nas memórias internas dos processadores de granularidade grossa. Esse particionamento é demonstrado na Figura 4.1. Seguindo essa ideia de particionamento, são propostas duas estratégias, Particiomento Homogêneo e Particionamento Heterogêneo, que são apresentadas nas Subseções 4.2.1 e 4.2.2, respectivamente.

Figura 4.1: Divis˜ao das listas invertidas.

4.2.1 Particionamento Homogˆeneo

Na primeira estratégia de particionamento, as listas de postings dos termos da consulta são divididas em partições homogêneas com o mesmo número de identificadores de documentos (docIDs). Os documentos são particionados de acordo com o número de multiprocessadores, como descrito na Figura 4.2.

Essa estratégia objetiva simplicidade e maximização dos processadores através do melhor balancemento de carga. Contudo, ela tem uma desvantagem impl´ıcita. Nos algoritmos DAAT, os documentos são avaliados completamente em uma única vez, ou seja, todas as ocorrências de um documento são avaliadas conjuntamente. Com as partições homogêneas, um dado identifi-

cador de documento pode aparecer em mais de uma lista de postings e em posições diferentes. Dessa forma, há possibilidade de que as ocorrências de um mesmo documento estejam em partições distintas e, assim, somente a avaliação parcial dos docIDs é realizada por um deter- minado processador. Nesse caso, os documentos relevantes podem ser descartados do resultado dos top-k documentos, fazendo com que essa estratégia tenha impacto na acurácia dos algoritmos. Por exemplo, na Figura 4.2, as ocorrências dos docIDs 6, 7 e 10 estão distribu´ıdas nas partições dos SM0e SM1. Essa distribuição faz com que os SMs consigam obter somente

avaliac¸˜ao parcial desses docIDs.

Figura 4.2: Estrat´egia de Particionamento Homogˆenea entre os SMs.

4.2.2 Particionamento Heterogˆeneo

A segunda estratégia propõe dividir as listas de postings em segmentos de acordo com inter- valos de docIDs. Para isso, um processamento é efetuado nas listas de postings de maneira que todos segmentos tenham o mesmo intervalo de docIDs. Dessa forma, os segmentos poderão ter tamanho diferentes. Por essa razão, essa estratégia é nomeada de particionamento heterogêneo. O particionamento é realizado a partir de uma sequência de fases. Na primeira fase, são obtidas as posições das partições homogêneas a partir do número de processadores, como mos- trado na Figura 4.2, processo idêntico ao particionamento homogêneo. Posteriormente, na segunda fase, a partiçao de documentos é delimitada pelos documentos localizados nas extremi- dades das partições homogêneas. O docID inicial de uma partição é o maior docID localizado na primeira posição de fora da extremidade inicial (posição mais à esquerda) da partição de cada lista invertida adicionando-se uma unidade no seu valor. Enquanto o docID final é o maior valor de docID localizado na posição da extremidade final (posição mais à direita) da partição de cada lista invertida. As Figuras 4.3 e 4.4 detalham esse processo. Ao alcançar as faixas de docIDs, todas as ocorrências de um documento estarão localizadas em uma única partição,

evitando assim avaliac¸˜oes parciais.

A estratégia heterogênea pode produzir partições com tamanhos diferentes, como demonstrado no exemplo da Figura 4.4. Observa-se que neste exemplo houve desbalanceamento de carga entre os processadores, no caso da partição do SM5, somente um docID é processado.

Apesar desse desbalanceamento de carga, essa estrat´egia foi projetada para garantir os mesmos resultados dos algoritmos sequenciais.

Figura 4.3: Obtenc¸˜ao dos documentos iniciais e finais.

Figura 4.4: Partições heterogêneas geradas pela segunda fase.

Todas as estratégias de particionamento, homogênea e heterogênea, são realizadas dinami- camente para cada consulta de entrada e não requisitam qualquer processamento na construção do ´ındice invertido, ou seja, não necessitam de processamento prévio à consulta. Isso significa que nenhuma informação extra é necessária no ´ındice invertido para realizar os particionamen- tos. Por trabalhar com posições, ao obter os docIDs inicial e final, essas estratégias apresentam vantagens ao não exigir intersecções de listas invertidas e nem qualquer algoritmo de busca, por exemplo, a busca binária que é a mais utilizada nas soluções de intersecção. Na prática, os tamanhos das faixas das partições em cada lista invertida não são conhecidos ao processar

consultas, somente os identificadores de documentos iniciais e finais.

No documento Paralelização de algoritmos de busca de documentos mais relevantes na web utilizando GPUs (páginas 53-57)