Testando a qualidade da nossa implementação em paralelo

5.4 Testes em FORTRAN

5.4.2 Testes Active PCDM

5.4.2.1 Testando a qualidade da nossa implementação em paralelo

Como esse foi nosso primeiro contato com a programação em paralelo, decidimos testar a qualidade da nossa implementação dos métodos ActivePCDM e da versão em paralelo do método UBCDM, testado na Subseção 5.4.1, que chamaremos no decorrer do texto de PUBCDM. Escolhemos implementar esse último método, pois confrontaremos com uma implementação em C++ do mesmo método, com resultados numéricos apresentados no artigo [37], chamado nesse artigo de PCDM1, e disponibilizado para download 3.

Para realizar os testes com o método PCDM1, fizemos uma modificação na implemen- tação original para facilitar a comparação dos tempos entre nossa implementação em FORTRAN e o método PCDM1, implementado em C++. Para citá-la, acrescentamos o cálculo do tempo envolvendo o cálculo extra do gradiente da parte suave da função objetivo e do valor de função corrente, no final de cada ciclo do método. Ele foi retirado do cálculo do tempo do relógio de parede, na versão original do código dos autores.

Visando tornar mais justa a comparação do tempo gasto pelos métodos, não acres- centaremos, nas nossas implementações em FORTRAN, o tempo gasto para calcular o valor de

ω e das constantes de Lipschitz por blocos, devido ao método PCDM1 não levar em consideração

esses cálculos na medição do tempo gasto.

O primeiro conjunto de dados que usaremos para comparar o desempenho dos métodos são problemas gerados aleatoriamente, similares aos usados em uma parte dos experimentos envolvendo o método PCDM1 [37, Exemplo 8.1], cujo gerador foi obtido junto à implementação do método PCDM1. Com este gerador, podemos controlar a dimensão da matriz do problema e uma quantidade fixa de elementos não nulos para todas as colunas da matriz gerada. Por um lado, isso introduz uma grande artificialidade no problema, pois poucos problemas extraídos de situações reais teriam essa característica. Por outro lado, isso garante um controle no número de elementos não nulos das linhas da matriz, fundamental para um bom desempenho dos métodos de descenso coordenado em paralelo, já que o speedup depende do número de elementos não nulos da linha com mais elementos não nulos, a constante ω da Subseção 2.2.

Construímos 3 problemas aleatórios com dimensões próximas dos valores usados em [37, Exemplo 8.1] e descritos na Tabela 5. Nessa tabela apresentamos algumas informações relevantes sobre o problema: dimensão da matriz dos dados, número de elementos não nulos em cada uma das colunas da matriz, valor de função da solução do problema arredondada pela quarta casa, uma unidade para cima, e porcentagem de elementos nulos da solução.

Usaremos para os testes dessa seção, além dos 3 problemas sintéticos, 4 problemas reais presentes nas Tabelas 3 e4. Escolheremos 2 de cada tabela, excluindo-se os 18 problemas usados para calibragem dos parâmetros, com o critério que esses 2 problemas sejam aqueles com maior e menor valores de ω proporcionalmente, em cada uma das tabelas. Tais problemas são:

SL17, SL20 e SC20, SC25.

Tabela 5 – Problemas gerados aleatoriamente Rótulo ps, nq # “ 0 por coluna F˚

LASSO nzpx˚LASq AL1 p1 ˆ 107, 2 ˆ 107q 30 2.804 ˆ 1013 99.9985%

AL2 p2 ˆ 107, 1 ˆ 107q 30 6.658 ˆ 1014 99.9999%

AL3 p2 ˆ 107, 1 ˆ 107q 20 1.065 ˆ 1014 99.9998%

Para os experimentos numéricos, rodamos cada um dos 3 métodos, PCDM1, PUBCDM e ActivePCDM, a quantidade fixa de 100n iterações e variamos o número de threads dentro do conjunto de valores t1, 2, 4, 8u. Nas tabelas com os resultados dos experimentos, colocamos o tempo gasto por cada método, separando-os pelo número de threads e descrevemos o valor da aceleração do programa com mais de uma thread, quando comparado ao programa serial; essa informação aparecerá nas tabelas como speedup.

Tabela 6 – Desempenho dos métodos em paralelo para o problema AL1, com percentual

ω{n “ 0.0005%, para um número fixo de iterações, com 1, 2, 4, e 8 threads