Implementação de MPI em Java

(1)

Implementac¸˜ao de MPI em Java

Claudio Schepke [email protected]

1

PPGC - Instituto de Informática - UFRGS Programação com Objetos Distribu´ıdos

Professor Cl´audio Geyer

Resumo. MPI é um padrão para a comunicação paralela e distribu´ıda ampla- mente utilizado em aplicações desenvolvidas em linguagem como Fortran, C e C++. Com o surgimento de Java, inúmeras propostas foram apresentadas para a utilização de MPI nessa linguagem. Estas propostas estão baseadas na cha- mada de métodos nativos ou na utilização de implementações especialmente de- senvolvidas com os recursos de comunicação existentes em Java. Neste sentido, esse trabalho apresenta algumas bibliotecas desenvolvidas para a utilização de MPI em Java, buscando destacar as diferentes estratégias de comunicação es- colhidas em cada caso.

1. Introduc¸˜ao

Java é uma linguagem de programação orientada o objetos que possibilita a fácil abstração de um problema, além de disponibilizar recursos para a programação distribu´ıda (RMI e sockets) e concorrente (threads) [6, 5]. No entanto, a linguagem não oferece ne- nhum recurso de alto n´ıvel para a comunicação via troca de mensagens, voltado para a computação paralela, que suporte diretamente o modelo SPMD (Single Program Mul- tiple Data) de programação. Neste contexto, diversos trabalhos foram desenvolvidos para que fosse poss´ıvel explorar esse paradigma de comunicação. Estas propostas estão baseadas em modificações dos mecanismos disponibilizados pela linguagem (RMI, Ja- vaSpaces), através do desenvolvimento de novas metodologias de programação para- lela [11, 10, 4], como também pela adoção de recursos disponibilizados para outras lin- guagens de programação, tais como PVM e MPI [3, 13].

A adoção de recursos de comunicação existentes em outras linguagens possui al- gumas vantagens. O fato desses modelos ter sido validado e utilizado por um grande número de programadores garante uma fácil adaptação, tanto na implementação como na utilização dos recursos em Java. Este é o caso de MPI, que atualmente é um padrão para a programação paralela. A utilização de MPI em Java pode ser feita através de diferentes formas, tanto através do acesso à versões já existentes, compiladas para uma determinada arquitetura, como através de implementações feitas diretamente em Java [2].

Este trabalho apresenta algumas bibliotecas MPI propostas para Java, buscando

descrever as principais caracter´ısticas e estratégias de implementação adotadas em cada

uma delas. A próxima seção descreve as duas abordagens adotadas para a utilização de

MPI em Java. Na seqüência são discutidas algumas implementações que exemplificam

essas abordagens. A sec¸˜ao seguinte resume as caracter´ısticas encontradas nessas bibli-

otecas, buscando relacionar as diferenc¸as existentes entre as ferramentas. Por fim s˜ao

apresentadas as conclusões obtidas com a realização deste trabalho.

(2)

2. Implementac¸˜ao de MPI em Java

MPI (Message Passing Interface) [13] é uma especificação para a implementação de bibli- otecas de comunicação via troca de mensagens. A especificação propõem a padronização de funções que realizam a comunicação e sincronização de processos. Para tanto, MPI define diferentes formas de comunicação, tais como comunicações ponto a ponto, cole- tivas e em grupos, as quais são realizadas através dum amplo conjunto de funções. Es- tas operações podem ser disponibilizadas em diferentes implementações como MPICH, LAM-MPI e WMPI, cada qual expressando o mesmo conjunto de funcionalidades.

Uma das formas de utilização de MPI em Java é através de JNI (Java Native Inter- face, que possibilita o acesso às funcionalidades compiladas para uma arquitetura nativa.

Desta forma, uma das abordagens de implementação adotadas está no desenvolvimento de interfaces que realizem a invocação das funções compiladas quando um método MPI

é chamado em Java. Essa escolha possibilita obter um bom n´ıvel de desempenho nas comunicações em relação as implementações nativas, gerando apenas um sobrecusto de- vido à manipulação de métodos em Java. Por outro lado, um ponto negativo é o fato de que a portabilidade caracter´ıstica de Java é perdida, uma vez que o uso das interfaces limita o uso da linguagem a uma determinada distribuição de MPI.

Outra forma poss´ıvel para a utilização de MPI em Java é através de implementações desenvolvidas diretamente nessa linguagem. Neste caso a portabilidade

é garantida, no entanto os custos de comunicação são geralmente maiores. Este fato ocorre devido a ineficiência na serialização dos dados e na inexistência de métodos de comunicação de dados tipados [12]. A transmissão dos dados em Java ocorre através dos métodos java.io.InputStream e java.io.OutputStream. Estes métodos permitem que sejam transmitidos apenas um vetor de bytes. Para a transmissão de outros tipos de dados

é necessário a serialização dos mesmos, o que é bastante ineficiente em Java uma vez que

é necessário a cópia de uma região da memória. Assim, a partir da versão 1.4, este pro- blema foi resolvido com a incorporação da classe Java.nio, o que permitiu o surgimento de bibliotecas que apresentam mecanismos de comunicação mais eficientes [12].

3. Implementações baseadas na chamada de métodos nativos

Nesta seção são descritas as implementações de JavaMPI e mpiJava, as duas principais interfaces de acesso as funções de MPI nativas. Para cada uma delas são descritas as caracter´ısticas e os testes de desempenho apresentados em artigos publicados.

3.1. JavaMPI

JavaMPI é uma das primeiras interfaces que permite ligar Java a uma implementação de MPI [8]. Para tanto, é utilizado o gerador JCI (Java-to-C Interface), responsável pela criação da interface a partir do arquivo header de uma implementação de MPI. Desta forma, JCI gera arquivos com as classes Java e as declarações dos métodos nativos, além de funções stub em C e arquivos de shell script, utilizados na compilação e ligação do código à implementação de MPI. Através dessa técnica, JavaMPI permite ligar dinami- camente uma biblioteca MPI à máquina virtual Java (JVM) em tempo de execução, pos- sibilitando o acesso a todas as funcionalidades de uma implementação completa de MPI através de JNI (Java Native Interface).

Do ponto de vista do programador, o estilo de programação em JavaMPI é um

pouco mais complicado do que os apresentados em outras linguagens. Por exemplo, o

acesso a todas as constantes de MPI é feito através da instanciação de um objeto da classe

de constantes. O mesmo ocorre às funções de MPI, que são invocadas através dos métodos

(3)

de outra classe espec´ıfica, responsável pela definição de todos os métodos. Já os tipos primitivos recebem outra nomenclatura, tentando contornar o fato de que os tipos em Java e C podem ser representados por diferentes tamanhos.

A validação do modelo apresentado em [8] mostra que os tempos de comunicação e execução em Java para a implementação paralela do programa IS (ordenamento inteiros) do benchmark NAS são bastante altos. No entanto, a medida em que um número maior de processadores é utilizado, a diferença entre os tempos das implementações em C e Java diminui. Para o caso em que são utilizados 16 processadores, o tempo de comunicação em Java fica em média duas vezes maior.

3.2. mpiJava

A interface mpiJava busca prover uma completa programação orientação a objetos, dis- ponibilizando também o acesso a todas as funcionalidades de uma implementação t´ıpica de MPI [1]. O acesso às funções nativas de MPI também é feito através de JNI, conforme ocorre em JavaMPI. No entanto, a interface Java não é gerada automaticamente. Já a estrutura da biblioteca mpiJava está organizada numa hierarquia de classes semelhante as implementações realizadas em C++, onde em cada uma delas são definidas determinados tipos de funções, conforme as caracter´ısticas das operações. No topo da hierarquia existe uma classe chamada mpi, que precisa ser inclu´ıda no código-fonte escrito em Java para que seja poss´ıvel o acesso aos métodos.

A implementação de mpiJava possui algumas modificações em relação às implementações nativas na lista de argumentos. Isso é feito devido ao fato de que não

é poss´ıvel a passagem de argumentos por referência em Java. No caso do retorno de um vetor, geralmente são transmitidos apenas a seqüência de dados, sem o uso de uma estru- tura mais complexa. Já para as funções que deveriam retornar um flag de status é feito o retorno de um objeto, cujo valor é null caso algum erro de operação tenha ocorrido.

Quanto a programação, o suporte de mpiJava em relação à JavaMPI é melhor, podendo utilizar diferentes implementações de MPI como substrato.

Os resultados de um pingue-pongue apresentados em [1] mostram que o desem- penho da implementação apresenta um aproveitamento da largura de banda menor para mensagens com até 128 KB em testes realizados com memória compartilhada, tanto sob as implementações MPICH como WMPI, sendo que a última apresentou um desempe- nho melhor. O mesmo acontece em sistemas com memória distribu´ıda. No entanto, a implementação utilizando WMPI apresentou um desempenho mais próximo da versão nativa. Já para os casos em que são utilizados tamanhos de mensagem maiores, ambos tendem a ter uma vazão de dados semelhante.

4. Implementações utilizando mecanismos de comunicação de Java

A utilização de MPI através de bibliotecas desenvolvidas em Java pode ser feita através de diferentes implementações. Cada uma delas explora uma determinada abordagem de comunicação, resultando em diferentes valores na vazão de dados, conforme será visto nas implementações de MPIJ, PJMPI, JMPI e MPJava a seguir.

4.1. MPIJ

MPIJ é uma implementação completamente desenvolvida em Java, que busca apresentar

uma boa relação de desempenho em relação as implementações nativas [7]. Para tanto, a

serialização de um vetor de dados é feita através do uso de métodos nativos, uma vez que a

serialização em Java é um processo que apresenta um grande custo, devido a necessidade

(4)

de cópia de memória. Assim, quando MPIJ é iniciada, ela primeiramente busca uma biblioteca de serialização nativa. Caso nenhuma biblioteca for encontrada, MPIJ faz uso dos recursos existentes em Java.

A implementação de MPIJ busca aumentar o desempenho na comunicação sob diferentes formas. Uma delas consiste em explorar o compartilhamento de variáveis em sistemas multiprocessados, o que permite a cópia direta de dados entre buffers, aumen- tando eficiência em ambientes com essa caracter´ıstica. MPIJ propõem também o envio de dados tipados, uma vez que esta seria uma alternativa que dispensaria o processo de serialização da forma em que ele é feito em Java. A adoção dessa técnica não prenderia a biblioteca a um determinado ambiente, como ocorre nos casos em que a serialização é feita através de métodos nativos.

Os testes de desempenho, conforme descritos em [7], mostram que os tempos de ping-pong e ping-ping (máximo de largura de banda quando duas mensagens são trans- mitidas em direções opostas) são semelhantes em sistemas com memória distribu´ıda. Já para sistemas com memória compartilhada a vazão de MPIJ é um pouco menor que o de WMPI. Isto se explica devido a diferença de latência que existe em cada um desses ambi- entes, sendo menor para MPIJ num sistema com memória distribu´ıda. Outros resultados demonstram que a utilização de métodos de serialização nativos aumenta a vazão para ti- pos primitivos, tanto em relação a WMPI, quanto em relação a serialização feita em Java.

Quanto aos testes realizados com a função barreira, em alguns casos a implementação com MPIJ se mostrou melhor.

4.2. PJMPI

PJMPI é uma implementação de MPI puramente desenvolvida em Java, onde a comunicação entre processos é feita através da utilização de sockets. [14]. Em cada nó existe um processo ServerSocket, responsável por escutar continuamente uma de- terminada porta. Quando uma solicitação é feita por uma central de controle, é ge- rada uma comunicação ponto-a-ponto através de sockets. Assim, a comunicação é feita através dos métodos DataInputStream e DataOutputStream. De forma especial, para as comunicações não bloqueantes são usadas threads e duas filas para envio e recebimento de dados.

Algumas caracter´ısticas espec´ıficas da biblioteca s˜ao:

• A existência de todos os tipos de dados básicos de MPI, além da possibilidade de criação de novos tipos baseada numa classe abstrata;

• O uso de vetores que substituem o acesso aos dados atrav´es de ponteiros;

• O uso da classe Object para o armazenamento de diferentes tipos de vetores;

• A recuperação de um tipo de dados através de um método espec´ıfico;

• A simplificação da chamada dos métodos, explorando o polimorfismo de Java;

• O mecanismo de leitura dinˆamica de uma classe que ´e enviada pela central de controle.

Os resultados apresentados em [14] apontam para o fato de que desempenho de PJMPI se apresentou similar ao de WMPI para o programa cpi, sendo levemente superior.

Já para a multiplicação de matrizes a diferença de tempo é bastante expressiva, tanto pelas operações com vetores serem mais lentas em Java, como devido ao custo de serialização dos dados.

4.3. JMPI

JMPI é uma implementação de MPI que utiliza RMI, serialização de objetos e

introspecção para a troca de mensagens [9]. A estrutura de JMPI é formada pela API

(5)

de MPI, responsável pela definição das funções, pela camada de comunicação que de- fine o núcleo de primitivas de comunicação e pela JVM, responsável pela compilação e execução do código binário. A camada de comunicação da biblioteca é formada por múltiplas threads, sendo responsável pela inicialização da JVM, por coordenar as mensa- gens entre os processos e pelo conjunto de primitivas de comunicação. As mensagens são passadas através dos argumentos das chamadas RMI. Para as chamadas ass´ıncronas são utilizadas threads, responsáveis pela comunicação não bloqueante.

JMPI apresenta recursos para a programação e serializaç ão eficiente de dados.

No caso da programação, a biblioteca apresenta suporte a vetores multi-dimensionais armazenados seqüencialmente na memória. Através da introspecção é poss´ıvel definir o número de dimensões desses vetores.Já a serialização eficiente é feita através de KaRMI, um recurso desenvolvido pela SUN capaz de melhor também o desempenho das chamadas de RMI [9].

A validação da implementação foi feita através de comparações entre mpiJava, JMPI usando RMI e JMPI usando KaRMI, conforme apresentado em [9]. Os resultados mostram que a implementação utilizando KaRMI tem uma vazão de dados significativa- mente melhor em relação a implementação com RMI numa implementação de ping-pong.

No entanto, o uso de mpiJava apresenta uma vazão melhor para mensagens com tamanhos de até 30 KBs. Outros valores obtidos numa implementação paralela de fractais de Man- delbrot mostram que o tempo de execução de JMPI é um pouco mais de duas vezes mais lento.

4.4. MPJava

MPJava também é uma implementação desenvolvida completamente em Java, mas que não realiza acesso a métodos nativos para a serialização de objetos [12]. Ao invés disso, a biblioteca faz uso dos recursos disponibilizados pelo pacote Java.nio, integrado a lin- guagem a partir da versão 1.4. O pacote permite a cópia direta de tipos nativos de/para buffers, algo que não era poss´ıvel de ser feito com vetores através do pacote Java.io. O novo pacote possibilita também o acesso direto dos buffers de Java aos buffers alocados numa pilha em C, os quais não serão removidos pelo coletor de lixo.

MPJava baseia-se no fato de que cada máquina possui uma JVM funcionando e que a comunicação entre elas é feita através dum TCP SocketChannel do pacote NIO.

A rede de comunicação criada a partir de TCP SocketChannel é inicializada por um nó mestre, que serve meramente de coordenador dos nós escravos. Para tanto, duas pos- sibilidades podem ser adotadas: A primeira é a chamada de lamexec, um utilitário da implementação LAM-MPI. A segunda consiste na execução de daemons nos nós escra- vos, os quais esperam uma solicitação do nó mestre através dum canal multicast. Os nós que respondem a solicitação recebem uma mensagem com uma lista de parâmetros, os quais são utilizados na execução da máquina virtual invocada através do método java.lang.Runtime.exec().

Outras caracter´ısticas da implementação são:

• A capacidade de uma única thread controlar vários sockets de comunicação, evi- tando que uma sobrecarga muito grande fosse gerada no gerenciamento caso cada socket fosse gerenciado por uma thread;

• A existência de dois algoritmos para broadcast: concorrente e paralelo. Na implementação concorrente, cada processo possui uma thread de envio e recebi- mento. Na paralela, a transmissão dos dados ocorre de forma logar´ıtmica. sendo utilizado somente uma thread para isso;

• A alocação prévia de buffers, buscando aumentar o desempenho e facilitar o ge-

renciamento dos recursos.

(6)

Os resultados mostrados em [12] apontam para uma melhor vazão de MPJava em relação a utilização de LAM-MPI e java.io nos testes de ping-pong. Para os valo- res obtidos através da comunicação todos-com-todos, o desempenho de MPJava é me- lhor que o de LAM-MPI quando um número maior de processos é utilizado e quando as mensagens não são muito pequenas. Os valores também mostram que o desempe- nho da implementação usando o algoritmo concorrente de broadcast é melhor. Já numa comparação entre execuções de implementações do Gradiente Conjugado em Fortran e em Java os tempos de broadcast obtidos em Java foram bem menores, diminuindo a relação a medida em que um número maior de processadores era utilizado. Por outro lado os tempos das operações de redução se mostraram favoráveis a implementação em Fortran.

5. Avaliac¸˜ao das ferramentas

Num primeiro momento, as implementações baseadas no acesso a métodos nativos via JNI apresentam-se como uma solução capaz de prover formas de comunicação eficientes.

Este é o caso das interfaces JavaMPI e mpiJava, as implementações mais conhecidas para esta abordagem. A primeira delas foi facilmente criada através dum gerador JCI. No entanto, a implementação não faz um uso pleno da orientação a objetos, sendo que a sua utilização é um pouco mais dif´ıcil em relação a mpiJava. Para o segundo caso tem-se uma implementação que explora melhor a orientação a objetos. além do fato de mpiJava possibilitar a utilização de diferentes implementações de MPI. Um aspecto negativo na utilização das interfaces é de que estas não são portáveis, uma vez que são realizadas chamadas para uma determinada implementação nativa. Além disso, os resultados que foram publicados demonstram que os tempos de comunicação são geralmente um pouco piores.

As implementações desenvolvidas completamente em Java buscam superar di- versos limitantes da linguagem. Uma delas é o custo de serialização de objetos e tipos nativos, que precisam ser transformados num vetor de bytes primeiramente. Aliado a isso, existe a falta de métodos que possibilitam a comunicação de tipos nativos. A Ta- bela 1 apresenta os mecanismos de comunicação adotados para cada uma das bibliotecas de comunicação analisadas neste trabalho.

Tabela 1 - Mecanismos de comunicac¸˜ao adotados nas bibliotecas MPI de Java Biblioteca Mecanismo

MPIJ Serialização através de métodos nativos e uso memória compartilhada PJMPI Uso de Sockets e serialização de Java

JMPI Uso de RMI e KaRMI

MPJava Pacote Java.nio: c´opia de tipos nativos

Analisando a tabela, pode-se observar que a estratégia adotada por MPIJ é bastante simples, não utilizando a forma de serialização proposta por Java. Mesmo assim, este tipo de operação agrega os custos de chamada dos métodos. MPIJ também explora o fato da memória ser compartilhada em arquiteturas multiprocessadas. Desta forma, não

é necessária nenhum tipo de comunicação via rede. Os resultados dessas abordagens demonstram que a latência da comunicação entre diferentes processadores é menor em relação a outras implementações devido a eficiência da serialização.

Diferentemente de MPIJ, PJMPI utiliza a serializac¸˜ao t´ıpica de Java, realizando a

comunicação por sockets. PJMPI é uma implementação que explora somente recursos de

Java, visto que sockets e threads s˜ao disponibilizados diretamente pela API. Devido a este

(7)

fato, o desempenho da biblioteca apresenta-se bem inferior as implementações nativas de MPI. Já a implementação de JMPI é feita sob RMI, um recurso de comunicação para sistemas distribu´ıdos. Os resultados obtidos mostram que essa abordagem apresenta- se bastante ruim, uma vez que a comunicação de RMI é s´ıncrona. Para a obtenção do assincronismo são utilizadas threads, gerando um sobrecusto a mais nas comunicações.

Todas as bibliotecas citadas anteriormente possuem como substrato de comunicação a classe Java.io. O mesmo não ocorre com MPJava, que utiliza a classe Java.nio para a chamada dos métodos de comunicação de mais baixo n´ıvel. Os testes comparativos feitos com implementações nativas e com Java.io demonstram o quanto estas introduções feitas em Java ajudam a diminuir a latência na transmissão de dados, especialmente para mensagens grandes e que envolvem um número maior de processado- res.

6. Conclus˜ao

Apesar de inúmeros esforços terem sido apresentados para que fosse poss´ıvel a utilização de MPI em Java, nota-se que a sua utilização limitou-se apenas ao campo da pesquisa. Em parte, este fato ocorreu devido a falta de recursos espec´ıficos de programação voltados para a computação numérica e, ao mesmo tempo, devido a existência dos mesmos em linguagens de programação mais tradicionais, limitando assim a utilização de Java. Outro motivo que pode ser considerado está no fato de que as primeiras implementações não conseguiram obter um bom n´ıvel de desempenho, sem ferir as caracter´ısticas básicas de Java.

Neste sentido, este trabalho contribui com uma análise de diferentes implementações de MPI para Java, mostrando que existem diferentes possibilida- des de implementação, tanto através do acesso a métodos nativos, como através de implementações puras em Java. De forma especial, cabe ressaltar a importância das modificações inseridas na API Java através da classe Java.nio, o que possibilitou a cópia de tipos nativos e, desta forma, melhorar o mecanismo de comunicação de Java.

Para trabalhos futuros pretende-se realizar a instalação das ferramentas, buscando realizar uma comparação prática entre elas através de aplicações numéricas t´ıpicas. Outra tarefa a ser feita é a análise de outras formas de comunicaç ão paralelas, os quais exploram outros paradigmas de programação. Em termos de pesquisa, existe ainda a possibilidade de realizar modificações nas bibliotecas apresentadas, buscando extrair delas uma maior desempenho.

Referˆencias

[1] Mark Baker, Bryan Carpenter, Geoffrey Fox, Sung Hoon Ko, and Sang Lim. MPIJAVA:

An Object-Oriented JAVA Interface to MPI. In Proceedings of the 11 IPPS/SPDP’99 Workshops Held in Conjunction with the 13th International Parallel Processing Symposium and 10th Symposium on Parallel and Distributed Processing, pages 748–762, London, UK, 1999. Springer-Verlag.

[2] Bryan Carpenter, Vladimir Getov, Glenn Judd, Anthony Skjellum, and Geoffrey Fox.

MPJ: MPI-like message passing for Java. Concurrency: Practice and Experience, 12(11):1019–1038, 2000.

[3] A. Geist, A. Beguelin, J. Dongarra, W. Jiang, R. Manchek, and V. Sunderam. PVM: Pa-

rallel Virtual Maching - A User’s Guide and Tutorial for Networked Parallel Com-

puting. The MIT Press, Cambridge, Massachusetts, 1994.

(8)

[4] Paul A. Gray and Vaidy S. Sunderam. IceT: distributed computing and Java. Concur- rency: Practice and Experience, 9(11):1161–1167, 1997.

[5] Gregory R. Andrews. Foundations of Multithreaded, Parallel, and Distributed Program- ming. Addison-Wesley, USA, 2001.

[6] Paul Hyde. Java Thread Programming. Sams Publishing, Indianapolis, Indiana, USA, 1999.

[7] Glenn Judd, Mark Clement, Quinn Snell, and Vladimir Getov. Design issues for effici- ent implementation of MPI in Java. In JAVA ’99: Proceedings of the ACM 1999 conference on Java Grande, pages 58–65, New York, NY, USA, 1999. ACM Press.

[8] Sava Mintchev and Vladimir Getov. Towards Portable Message Passing in Java: Binding MPI. In PVM/MPI, pages 135–142, 1997.

[9] Steven Morin, Israel Koren, and C. Mani Krishna. JMPI: Implementing the Message Passing Standard in Java. In IPDPS ’02: Proceedings of the 16th International Parallel and Distributed Processing Symposium, page 191, Washington, DC, USA, 2002. IEEE Computer Society.

[10] Hernˆani Pedroso, Luis M. Silva, and Jo˜ao Gabriel Silva. Web-based metacomputing with JET. Concurrency: Practice and Experience, 9(11):1169–1173, 1997.

[11] Michael Philippsen and Matthias Zenger. JavaParty — transparent remote objects in Java.

Concurrency: Practice and Experience, 9(11):1225–1242, November 1997.

[12] William Pugh and Jaime Spacco. MPJava: High-Performance Message Passing in Java using Java.nio. In Proceedings of MASPLAS 03 Mid-Atlantic Student Workshop on Programming Languages and Systems. Haverford College, 2003.

[13] Marc Snir, Steve Otto, Steven Huss-Lederman, David Walker, and Jack Dongarra. MPI:

The Complete Reference. The MIT Press, Cambridge, Massachusetts, 1996.

[14] WeiQin Tong, Hua Ye, and WenSheng Yao. PJMPI: Pure Java Implementation of MPI.

vol. 01(no. 1):p. 533, 2000.