Um Sistema de Fluxos de Trabalho Científicos Eficiente e Escalável

(1)

Um Sistema de Fluxos de Trabalho Cient´ıficos Eficiente e Escal´avel

George Teodoro e Renato Ferreira

Departamento de Ciência da Computação

Universidade Federal de Minas Gerais

Belo Horizonte, Brasil

{george, renato}@dcc.ufmg.br

Resumo

O aumento no volume de dados cient´ıficos dispon´ıvel ge-rou uma demanda de processamento que extrapola a capa-cidade de apenas um computador, criando a necessidade de utilização de recursos distribu´ıdos para a análise desses dados. Entretanto, a maioria das aplicações cient´ıficas são seq üenciais e não são capazes de utilizar ambientes dis-tribu´ıdos. Em resposta a essas dificuldades foram introdu-zidos os sistemas de fluxo de trabalho cient´ıficos, os quais permitem a execução de aplicações sequênciais em ambi-entes distribu´ıdos, possibilitando a exploração de grandes bases de dados. Neste trabalho, apresentamos um sistema de fluxo de trabalho único no sentido de que o mesmo foi especialmente desenvolvido para facilitar a execução des-sas aplicações em ambientes distribu´ıdos utilizando bancos de dados para armazenamento de dados cient´ıficos. Nosso sistema é otimizado para execução fluxos de trabalho inten-sivos em dados, pois nos preocupamos com gerenciamento dos mesmos. Os resultados mostram que podemos alcançar speedups próximos do linear para aplicações sofisticadas, criadas por múltiplos componentes.

1. Introduc¸ ˜ao

A análise de grandes volumes de dados tem se tornado fundamental em diversas áreas da ciência. Os avanços na área de tecnologia e computação tem permitido a criação e o armazenamento de dados cada vez mais volumosos. Um exemplo de projeto cient´ıfico que gera dados signifi-cativamente volumosos é o projeto Large Handron Collider (LCD), iniciado em 2006 no CERN, que deverá gerar da ordem de petabytes de dados por ano [4].

Associado a isso, notamos que muitas dessas análises podem ser vistas como a aplicação sucessiva de diversas etapas de processamento nesses grandes volumes de dados, tendo como objetivo produzir resultados publicáveis a partir dos dados brutos. Essas computações podem ser

modela-das como redes de processamento em fluxo de dados, sendo descritas como grafos direcionados onde os nodos represen-tam componentes de processamento e as arestas os fluxos de dados entre eles.

Os sistemas de fluxo de trabalho cient´ıficos [2, 8, 9] (Sci-entific Workflow Systems) foram introduzidos com o obje-tivo de facilitar a execução dessas análises para dados muito volumosos, que geram longos per´ıodos de processamento. Esses sistemas devem prover um ambiente onde cientistas possam criar e descrever componentes baseados nas tarefas que desejam executar, organizar os componentes em fluxo de trabalho de acordo com a semântica da aplicação, execu-tar os fluxos criados em grandes coleções de dados e moni-torar a execução, por exemplo, através da análise de resulta-dos intermediários. Esses sistemas também devem, natural-mente, explorar o paralelismo inerente a múltiplas tarefas num ambiente distribu´ıdo como um Grid, além de permitir a reutilização de componentes, ou seja, etapas de processa-mento entre aplicações.

Na Figura 1, vemos o fluxo de trabalho de uma aplicação biomédica t´ıpica de análise de imagens. Esse exemplo en-volve análise de imagens microscópicas de placentas de ra-tazanas para estudar mudanças no fen ótipo, induzidas por manipulações genéticas.

Nesse artigo, apresentamos um sistema de execução de fluxos de trabalho cient´ıficos baseado em Mobius [7] e Anthill [5]. Nesse sistema, duas premissas foram obser-vadas: 1) Tanto os dados de entrada quando os dados de sa´ıda são grandes, e precisam ser armazenados em ambien-tes distribu´ıdos; 2) Muitas das etapas da execução estão pre-viamente implementadas e devem poder ser incorporadas ao fluxo de trabalho a partir de implementações protótipo, como códigos matlab. Mobius foi usado como armazena-dor persistente de dados, tantos os iniciais como os finais e os intermediários (aqueles que migram entre componentes). Anthill é nossa plataforma de execução de aplicações de fluxos de dados. Nesse ambiente as aplicações são decom-postas em filtros que transformam dados recebidos em stre-ams de entrada, produzindo assim strestre-ams de sa´ıda. Anthill

(2)

FG/BG N o r m a l i z a ç ã o d o H i s t o g r a m a Classifiçacão d e C o r e s S e g m e n t a ç ã o d e T e c i d o s

I I,1 I,2 I,3 O I: Imagens Entrada (slides de placenta) I,n: Imagens depois de n operações O: Imagens de saída

Figura 1. Fluxo de trabalho exemplo.

permite que cada filtro seja instanciado um n úmero transpa-rente de vezes, de forma a equilibrar os tempos de proces-samento entre os vários estágios e obter speedups em plata-formas distribu´ıdas. Esse modelo de ambiente de execução é bastante prop´ıcio para a implementação do nosso sistema. Os experimentos demonstraram que foi poss´ıvel obter spee-dups altos para aplicações compostas a partir de componen-tes previamente constru´ıdos como códigos seq üenciais.

O restante de artigo é organizado da seguinte forma: na Seção 2, apresentamos alguns dos principais trabalhos rela-cionados; na Seção 3 discutimos a arquitetura deste sistema; na Seção 4 é apresentada a aplicação exemplo, assim como a mesma foi mapeada em um fluxo de trabalho; na Seção 5 fazemos análise de resultados; e finalmente na Seção 6 apre-sentamos as conclusões e os trabalhos futuros;

2 Trabalhos Relacionados

Em [2] é apresentado um sistema de gerenciamento de fluxos de trabalho que utiliza bancos de dados para o ar-mazenamento das informações sobre os fluxos e gerenci-amento dos mesmos durante a execução. Essa estratégia difere da adotada nesse trabalho, pois aqui utilizamos ban-cos de dados para armazenar os dados de entrada, inter-mediários e produzidos como sa´ıda pelos fluxos.

Chimera [6] é um sistema que armazena as transformações às quais os dados de entrada são sub-metidos para fins de proveniência. Essa informação pode ser utilizada por exemplo para: re-execução de aplicações, re-criação de resultados, etc. Em nosso ambiente optamos pelo armazenamento de todos os estágios intermediários dos dados. O projeto Pegasus desenvolve um sistema que armazena informações sobre derivação de dados utilizando Chimera, mas também trata do mapeamento de fluxos de trabalho em grid de computadores. A abordagem utilizada permite que o usuário crie um fluxo de trabalho abstrato que posteriormente é mapeado em um fluxo concreto.

Em Kepler [9] é apresentado um sistema de gerencia-mento de fluxos de trabalho cient´ıficos, o qual disp õe de fer-ramentas para criação e execução desses fluxos utilizando serviços web. O modo de composição de fluxos tado é baseado na noção de atores, primeiramente apresen-tada em PTOLEMY II. Esse sistema apresenta soluções in-teressantes para gerenciamento de fluxos de trabalho, en-tretanto não apresenta soluções satisfatórias para integração das aplicações em execução com os dados que as mesmas

utilizam. Dessa forma, constru´ımos nosso sistema com a idéia de que o mesmo deveria prover uma interação eficiente e escalável com bancos de dados distribu´ıdos, possibili-tando o armazenamento de dados nesses sistemas.

A ferramenta responsável por executar os fluxos de tra-balho criados em nosso sistema é o Anthill [5], o qual baseia-se no modelo de programação filtro-fluxo (filter-stream), originalmente proposto em Active Disks [1]. No Anthill, filtros são cada etapa de processamento e os fluxos são as abstrações de comunicação entre filtros. Aplicações que utilizam este sistema são conjuntos de filtros executados sobre uma rede de computadores conectados através de flu-xos, criando paralelismo de tarefas. Em tempo de execução, são criadas múltiplas cópias de cada filtros, permitindo que cada estágio seja replicado, criando paralelismo de dados.

Finalmente, apresentamos Mobius [7] um banco de da-dos XML para ambientes distribu´ıda-dos heterogêneos, o qual é responsável pelo armazenamento dos dados utilizados como entrada ou criados em tempo de execução. Este sis-tema é projetado como um conjunto de serviços conectados através de redes utilizando protocolos bem definido. Os da-dos nesse ambiente são modelada-dos por meio de esquemas XML e armazenados como documentos XML, permitindo o uso de protocolos bem definidos para o armazenamento e pesquisa em sistemas heterogêneos.

3 Arcabouc¸o do sistema de fluxos de trabalho

Nesta seção, descrevemos o n úcleo do sistema de flu-xos de trabalho. Primeiramente, na Seção 3.1 apresentamos Anthill e Mobius, utilizados na construção desse sistema e a seguir, na Seção 3.2, apresentamos o n úcleo do sistema de execução de fluxos de trabalho.

3.1 Anthill e Mobius

O sistema de fluxos de trabalho foi desenvolvido utilizando Anthill [5] e Mobius [7]. Anthill é res-ponsável por gerenciar a comunicação e executar aplicações em ambientes distribu´ıdos heterogêneos e gerenciar a comunicação. Essa ferramenta utiliza conceitos do modelo de programação filtro-fluxo [1] (filter-stream) com algumas extensões. No modelo de programação filtro-fluxo, filtros são a representação de cada estágio da computação, onde existe transformação sobre dados, e os fluxos são abstrações

(3)

de comunicação entre os filtros. Aplicações, neste modelo, são criadas por um processo de decomposição em filtros, ou seja, pela divisão da aplicação original em blocos de pro-cessamento que comunicam entre si através de um fluxo de dados uni-direcional sobre uma rede de computadores.

Este modelo de construção de aplicações, naturalmente, cria paralelismo de tarefas, pois os filtros são executados como em um pipeline comunicando-se através da rede. Além disso, em tempo de execução, pode-se criar múltiplas cópias transparentes de cada um dos filtros que comp õem a aplicação nas máquinas dispon´ıveis, criando desta forma uma maneira de replicar a cada um dos estágios do pipeline. Uma vez que os dados enviados a cada dos estágios também podem ser particionados, cria-se paralelismo de dados.

Mobius [7] é um sistema de banco de dados XML para ambientes distribu´ıdos heterogêneos. Este sistema é pro-jetado como um conjunto de serviços frouxamente conec-tados com protocolos bem definidos. O componente Glo-bal Model Exchange (GME) é responsável por prover su-porte a criação, gerenciamento e controle de versão de es-quemas XML. No Mobius, cada documento deve satisfazer ao esquema registrado no GME. O componente Mako, por sua vez, é responsável pelos serviços de criação e gerenci-amento de bases de dados em ambientes distribu´ıdos. Do-cumentos que estejam em conformidade com os esquemas podem ser armazenados, pesquisados e recuperados remo-tamente de cada uma das instâncias do Mako que operam independentemente. Os dados armazenados nesse sistema são indexados e podem ser pesquisados eficientemente uti-lizando XPath. Em nossa implementação, Mobius é res-ponsável pelo armazenamento dos dados utilizadas como entrada, criados em tempo de execução e os resultados. Dessa forma, cada unidade de dado do sistema é armaze-nada como um documento XML, assim quando falarmos sobre documentos no restante deste texto estamos nos refe-rindo as unidades de dados.

3.2 Arquitetura do sistema distribu´ıdo de

execu¸

c˜

ao de fluxos de trabalho

O sistema é composto de três componentes principais, conforme pode ser visto na Figura 2: repositório de biblio-tecas compartilhadas e executáveis, criador de fluxos de tra-balho e ambiente distribu´ıdo de execução de fluxos de traba-lho. As duas primeiras partes, apresentadas em detalhes no artigo [11], permitem que os usuários possam armazenar e compartilhar programas e apresentam uma ferramenta para criação de fluxos de trabalho baseados em componentes ar-mazenados no repositório. Usuários utilizando essas ferra-mentas podem criar fluxos de trabalho baseados em progra-mas compilados sem a necessidade de reescrita de código, permitindo que aplicações seq üenciais sejam executadas em ambientes distribu´ıdos. O ambiente de execução,

apresen-tado em detalhes a seguir, é dividido em sistema de suporte a execução, sistema de gerenciamento de fluxos de trabalho e gerenciador de armazenamento persistente de dados.

Criador de Filtros

Ambiente distribuído de execução

Sistema de suporte a execução

Gerenciador de Armazenamento Persistente

Criador de Fluxos de Trabalho

Sistema de gerenciamento do workflow Filtros da aplicação

Repositório de bibliotecas compartilhadas e executáveis

Retorna executável

Armazenador de Dados em Memória

Gerenciador de Meta-dados

Descritor do fluxo

Figura 2. Arquitetura do Sistema

3.2.1 Sistema de suporte a execuc¸˜ao

Como discutido anteriormente, este componente foi imple-mentando utilizando Anthill [5], o qual é responsável por instanciar e monitorar a execução dos fluxos de trabalho. Entretanto, tivemos que modifica-lo para que o mesmo pu-desse atender aos requisitos necessários para a construção dos sistema de gerenciamento de fluxos de trabalho, discu-tido em detalhes na seção 3.2.2.

As modificações feitas permitiram que aplicações pudes-sem comunicar-se transparentemente com o sistema de ge-renciamento, enviando informações necessárias para o con-trole da execução, tais como: quais dados foram proces-sados; requisição por dados, sempre que um filtro estiver dispon´ıvel; resultados parciais.

3.2.2 Sistema de gerenciamento de fluxos de trabalho

O sistema de gerenciamento do fluxo de trabalho é com-posto de dois componentes, o gerenciador de meta-dados (GMD) e o armazenador de dados em memória (ADM). Ambos foram desenvolvidos utilizando Anthill [5], desta forma, pode-se, durante a execução, instanciar tantas cópias de cada um dos componentes, quantas sejam necessárias. A seguir descrevemos detalhadamente o GMD e o ADM.

Gerenciador de meta-dados (GMD) E respons´avel pela´

(4)

a todos dados de entrada, criados durante a execução e de sa´ıda. Quando a execução do fluxo de trabalho é iniciada, o GMD recebe como entrada uma pesquisa do tipo XPath [3], que é utilizada para delimitar o conjunto de dados de en-trada da aplicação. Este repassa a requisição ao gerenciador de armazenamento persistente de dados (GAP), descrito em detalhes na seção 3.2.3, que retorna os meta-dados de cada um dos documentos que satisfazem a pesquisa. Tão logo termine esse processo, o GMD possui a informação sobre a localização de cada um dos documentos do conjunto de entrada. No processo de execução, cada documento passa por três estágios:

• “Não processado”: todos os documentos do conjunto de dados de entrada são considerados “não processa-dos” no in´ıcio da execução, o que significa que os mes-mos estão dispon´ıveis para processamento.

• “Sendo processado”: o documento assume este estado quando é retornado para algum filtro. Além disso, to-dos os documentos criato-dos durante a execução estão nesse estado, pois eles foram criados e enviados para serem processados por outro filtro.

• “Processado”: um documento é dito processado so-mente quando já foi processado por um filtro e o resul-tado de seu processamento já tenha sido enviado para outro filtro e ao ADM.

Em tempo de execução o GMD é responsável por decidir quais documentos devem ser processados por cada filtro. Está partição é feita sob-demanda, sempre que um filtro que lê dados do conjunto de entrada encontra-se dispon´ıvel o GMD é transparentemente notificado. Durante o processo de escolha do dado a ser processado tentamos, sempre que poss´ıvel, retornar um documento que seja local ao filtro, reduzindo dessa forma o custo de transmissão dos dados.

Armazenador de dados em mem´oria (ADM) O

arma-zenador de dados em memória é o componente responsável por prover a interface de leitura e escrita de dados entre os filtros da aplicação e o GAP. Durante a inicialização do sis-tema de fluxo de trabalho são criadas múltiplas cópias deste de acordo com configuração do usuário.

Quando a aplicação começa sua execução os filtros são agrupados aos ADMs dispon´ıveis. Esse agrupamento faz uma amarração de cada filtro ao ADM que responderá suas requisições durante toda a execução do fluxo, a amarração tenta fazer com que os filtros sejam atendidos pelo ADM locais. Caso não exista ADM na mesma máquina o filtro é ligado a um ADM qualquer.

Assim, durante a execução, quando os filtros requisitam dados, a requisição é repassada ao ADM correspondente.

O ADM, por sua vez, repassa a requisição ao GMD e es-pera pelo meta-dado do documento que deve ser proces-sado. Então o ADM verifica se este dado está armazenado em memória, caso não esteja acessa o GAP e retorna os dados ao filtro. As diversas instâncias de ADM trabalham independentemente, dessa forma elas podem estar lendo di-ferentes porções de dados simultaneamente. Isso cria uma forma de leitura de dados similar à tradicional leitura para-lela de dados (parallel I/O), exceto pelo fato de que estamos realizando-a em bancos de dados XML distribu´ıdos.

A tarefa de armazenamento de resultados parciais ou in-termediários também é executado pelo ADM. Quando so-licitado ele pode armazenar todos os dados enviados en-tre componentes dos fluxos. Durante a execução o ADM cria bases de dados distribu´ıdas para cada um dos fluxos de dados existentes e armazena todas as comunicações como documentos no Mobius. Assim, sempre que filtros trocam mensagens elas também são enviadas ao ADM, que arma-zena os dados em memória e deixam a aplicação prosseguir sua execução, fazendo a escrita em segundo plano. Como no caso da leitura, esse processo é feito independentemente pelas múltiplas instâncias de ADM, criando um esquema de escrita em paralelo.

3.2.3 Gerenciador de armazenamento persistente

(GAP)

O gerenciador de armazenamento persistente foi constru´ıdo com Mobius [7]. Ele utiliza o Mobius para instanciar bases de dados em ambientes distribu´ıdos. O GAP, como discu-tido anteriormente, é responsável pelo armazenamento dos dados de entrada, sa´ıda e intermediários das aplicações de fluxo de trabalho. Todos esses conjuntos de dados são de-finidos por esquemas XML e armazenados como bases de dados XML. Quando a aplicação gera algum documento, esse é enviado ao ADM e então armazenado no GAP.

4 Aplicac¸˜ao Exemplo

Nesta seção, apresentamos a aplicação exemplo [10], utilizada na avaliação desse sistema e o fluxo de trabalho no qual ela foi mapeada. A aplicação utiliza imagens mi-croscópicas de alta resolução para estudar mudanças, indu-zidas por manipulações genéticas, no fen ótipo de placenta de ratazanas. O objetivo da mesma é fazer a segmentação de imagens, que comp õem visões 3D de placentas de rata-zanas, em regiões correspondentes aos três tipos de tecidos: labirinto, espongioblasto e glicogênio.

Na figura 3, é apresentada uma visão completa da aplicação. A mesma foi dividida em 6 estágios, sendo que alguns deles podem ter mais de uma etapa. A seguir, des-crevemos os três estágios que foram mapeados em fluxos de trabalho:

(5)

• Separac¸˜ao do plano da frente do plano do fundo

(Foreground/Background Separation (FG/BG)): as

imagens são convertidas do formato RGB para CMYK e as combinações das cores dos canais são limitadas a valores estipulados pelo usuário. O resultado dessa operação é o plano da frente da imagem.

• Normalização do histograma: as imagens precisam ter suas cores ser corrigidas. Este processo ocorre em três fases: calcula-se a média das cores de todas as imagens; escolhe uma imagem para ser o alvo da normalização; e normaliza o histograma de cores de cada uma das outras imagens utilizando o da imagem alvo.

• Classificação das cores: nesse estágio da aplicação cada pixel da imagem é classificado em de 8 classes: n úcleo escuro, n úcleo de intensidade mediana, n úcleo claro, n úcleo extra claro, células de sangue vermelho, citoplasma claro, citoplasma escuro e fundo da ima-gem.

• Segmentação dos tecidos: as imagens são divididas em regiões de 40x40 pixels, para as quais são cal-culadas 3 probabilidades baseadas na densidade da área, sendo esses valores utilizados na classificação da região em um dos 3 tecidos.

FG/BG ITK Placenta PNG Máscara PNG Normalização de histograma MatLab Teste de Cores MatLab (R, G, B) CSV Imagem referência Referência Cor corrigida PNG Classificação de cores ITK Imagem mapeada PNG Segmentação dos tecidos MatLab Mapa de segmentação PNG Classificação de bayes ITK Interação Humana Informação de treinamento PNG Fase de treinamento Estágio 1 Estágio 3 Estágio 4 Estágio 5 Estágio 6 Estágio 2

Figura 3. Aplicaç ão de segmentaç ão da pla-centa de ratazana

4.1 Mapeamento da aplica¸

c˜

ao exemplo em

fluxo de trabalho

O mapeamente foi realizado utilizando as ferramentas apresentadas no artigo anterior [11], neste texto não apre-sentamos detalhes sobre essas ferramentas, apenas uma breve discussão sobre os passos que o usuário deve seguir para a criação do fluxo de trabalho, que são:

Desenvolvimento dos filtros : nesta fase ´e realizado o

principal trabalho de integração de uma aplicação qualquer para utilização deste sistema, que consite da construção da seção compiledFilters do arquivo de configuração chamado de “Descritor do fluxo”. Para tanto, o usuário deve forne-cer dados como: o nome da biblioteca e função que será utilizada no filtro ou executável, as entradas e seus tipos, a informação a respeito da transformação dos dados que che-gam nos canais do fluxo em dados tratáveis pelos programas e etc.

Desenvolvimento do fluxo : Na fase de composic¸˜ao do

fluxo de trabalho o usuário precisa especificar quais filtros fazem parte dos fluxos, além das conex ões entre eles. A informação é retirada, respectivamente, das seções place-ment e layout do “Descritor do fluxo”. Depois de realizar essas etapas o usuário precisa apenas executar um script, gerado pelo nosso sistema, com os parâmetros da aplicação e a consulta XML utilizada para identificar o conjunto de dados de entrada armazenados no GAP.

4.1.1 Fluxo de trabalho da aplicac¸˜ao exemplo

Nesta seção, descrevemos o fluxo de trabalho gerado a par-tir da aplicação exemplo. Primeiramente, como pode ser visto na Figura 3, dividimos a aplicação em 6 estágios e posteriormente mapeamos os 3 computacionalmente mais intensos em fluxos de trabalho, como pode ser visto na Fi-gura 4. Na mesma fiFi-gura, acima, representamos a visão que o usuário tem ao criar o fluxo de trabalho e abaixo a visão desse mesmo fluxo do ponto de vista do ambiente de execução.

A entrada do estágio 4 da aplicação depende do fim do processamento do estágio 2. Porém os estágios 2 e 3 po-dem ser executados concorrentemente, dessa forma cons-tru´ımos um sub-fluxo para cada um dos estágios 3 e 4, as-sim quando 3 é executado o sistema cuida da criação de bases distribu´ıdas e do armazenamento de sua sa´ıda, que é utilizada como entrada de 4.

O estágio 6 possui um fluxo entre dois filtros, como pode ser visto na Figura 4, existe uma seta pontilhada desse fluxo(stream) para o sistema de gerenciamento de fluxos de trabalho. A seta representa a opção de armazenamento

(6)

FG/BG ITK

Normalização de histograma MatLab

Sistema de Gerenciamento de fluxos de trabalho

Classificação de cores ITK Segmentação dos tecidos MatLab FG/BG

.

Sistema de Gerenciamento de fluxos de trabalho

Normalização de histograma

...

.

Classificação de cores Escritor Segmentação dos tecidos Escritores

. . .

Estágio 3 Estágio 4 Estágio 6

Figura 4. Fluxo de trabalho da aplicac¸ ˜ao da placenta de ratazana

eficiente de resultados parciais, ou seja, de mensagens en-viadas entre filtros. Esses resultados podem ser utilizados para reiniciar fluxos de trabalho sem a necessidade de exe-cutar totalmente o mesmo, sendo útil para aplicações que são fortemente afetadas por parâmetros.

5 Resultados experimentais

Nesta seção, apresentamos os resultados experimentais utilizando o fluxo de trabalho da Figura 1, que foi cri-ado a partir de quatro estágios de processamento de uma aplicação biomédica de análise de imagens [10]. Detalhes sobre o mapeamento da aplicação no fluxo podem ser vistos nos artigos [11, 12]. Nossos experimentos foram executa-dos em um cluster de computadores com 20 máquinas co-nectadas por um switch Fast Ethernet. Cada nodo tem um processador AMD Athlon(tm) 64 Processor 3200+, 2GB de memória e S.O. Linux 2.6.

Durante a avaliação do sistema utilizamos uma base de dados com 866 imagens (23.49GB) como entrada. O con-junto de dados foi dividido igualmente e armazenado no GAPD. Criamos um cópia de ADM e uma instância do GAPD em cada uma das máquinas, uma cópia de GMD em uma delas e uma cópia de cada um dos filtros do fluxo por máquina. As execuções em nossos experimentos utilizam no min´ımo duas máquinas, em virtude de não termos uma versão serial que execute sobre todas as imagens.

A Figura 5(a) apresenta os resultados do est´agio FG/BG,

o tempo de execução utilizando duas máquinas é 3.800 segundos e decai quase linearmente com o aumento do n úmero de nodos. A Figura 5(b), apresenta os resulta-dos da etapa de “normalização do histograma”, o tempo de execução com duas máquinas é de cerca de 7.000 segundos e o speedup obtido é próximo do linear.

Já a Figura 5(c), mostra detalhadamente os tempos do estágio de normalização do histograma. Como pode ser visto, o tempo total é dominado pela função de processa-mento, que representa o tempo entre a chamada do exe-cutável utilizado nesse estágio e a finalização do mesmo. O overhead adicionado pela utilização desse sistema é muito pequeno, o mesmo pode ser dado, de forma super-estimada, pela diferença entre o tempo total de execução e o tempo gasto na função de processamento.

Na Figura 5(d), mostramos os resultados obtidos du-rante a execução do estágio “Classificação das cores” e “segmentação dos tecidos”. Este é o estágio mais demo-rado da execução, sendo seu tempo de execução com duas máquinas de aproximadamente 55.000 segundos. Mais uma vez o tempo decai linear com o aumento do n úmero de máquinas. Em especial, apresentamos o resultado do último estágio da aplicação exemplo quando salvamos e quando não salvamos os dados enviados do passo “Classificação das cores” para o “segmentação dos tecidos”. Os experimentos comprovam a eficiência no armazenamento de resultados parciais, pois média da diferença entre os mesmos é de ape-nas 5%.

6 Conclus˜oes

Neste trabalho, apresentamos um sistema de suporte a fluxos de trabalho para aplicações intensivas em dados para ambiente distribu´ıdos heterogêneos. O sistema foi cons-tru´ıdo sobre Anthill [5], consistindo de filtros Anthill cri-ados automaticamente a partir da descrição alto n´ıvel dos componentes da aplicação do usuário. Os filtros gerados podem executar códigos arbitrários de usuário através de uma interface simples.

As avaliações experimentais mostram que o sistema é capaz de executar aplicações sofisticadas, com múltiplos componentes, alcançando speedups lineares. Os resulta-dos destacam o baixo overhead introduzido pelo sistema na execução da aplicação. Os resultados mostram que os cus-tos introduzidos no armazenamento de resultados parciais, ou seja, dados enviados entre componentes de um fluxo, tem a média de apenas 5%, indicando a eficiência do sistema nessa tarefa.

Nossos trabalho futuros partem da observação que aplicações t´ıpicas esperadas para nosso modelo movimen-tam grandes massas de dados, e têm um tempo de execução na escala de dezenas de horas. Nesse cenário, é de se espe-rar que várias aplicações distintas estejam em execução

(7)

0 500 1000 1500 2000 2500 3000 3500 4000 20 16 12 8 4 2

Tempos de execução (segundos)

Número de máquinas

Estágio Foreground/Background (FGBG−866 images(23.49GB)) Tempo de teste (a) 4 6 8 10 12 14 16 18 20 22 20 16 12 8 4 Valor Número de máquinas

Speedup do estágio de normalização do histograma(866 imagens e máscaras) Speed−up

Speed−up linear

(b)

multaneamente. Dessa forma, desejamos implementar me-canismos que permitam otimizações inter-aplicações, al-guns deles são: o compartilhamento de componente em tempo de execução, pois aplicações diferentes podem utili-zar componentes comuns; utilização de caching semântico, de forma a extrair informação parcial necessária em um aplicação, diretamente do espaço de memória de outra que esteja executando simultaneamente.

Referˆencias

[1] A. Acharya, M. Usysal, and J. Saltz. Active disks: Program-ming model, algorithms and evaluation. Eighth Int.

Confe-rence on Architectural Support for Programming Languages and Operations Systems (ASPLOS VIII), Oct 1998.

[2] A. Ailamaki, Y. E. Ioannidis, and M. Livny. Scientific work-flow management by database management. In SSDBM ’98:

Proceedings of the 10th International Conference on Scien-tific and Statistical Database Management, pages 190–199,

Washington, DC, USA, 1998. IEEE Computer Society. [3] A. Berglund, S. Boag, D. Chamberlim, M. F. Fern´andez,

M. Kay, J. Robie, and J. Sim´eon. Xml path language (xpath).

World Wide Web Consortium (W3C), August 2003.

[4] CERN. Large hadron collider (lhc)

-http://www.interactions.org/lhc/.

[5] R. Ferreira, W. M. Jr., D. Guedes, L. Drummond, B. Cou-tinho, and G. Teodoro. Anthill:a scalable run-time environ-ment for data mining applications. SBAC-PAD, 2005.

0 1000 2000 3000 4000 5000 6000 7000 20 16 12 8 4 2

Tempo de execução (segundos)

Número de máquinas

Normalização do Histograma (866 imagens de placenta (23.49GB)) Tempo de teste Função de processamento Leitura de dados Funções de (des)serializar Escreve para fluxo

(c) 0 10000 20000 30000 40000 50000 60000 20 16 12 8 4 2

Tempo de Execução (seg)

Número de Nodos

Tempo de Execução − Classif. das Cores e Seg. do Tecido (866 imagens) Salvando estado intermediário

Não salvando estado intermediário

(d)

Figura 5. Resultados Experimentais

[6] I. Foster, J. Vockler, M. Wilde, and Y. Zhao. Chimera: Avir-tual data system for representing, querying, and automating data derivation. The 14th Conference on Scientific and

Sta-tistical Database Management (SSDBM’02), 2002.

[7] S. Hastings, S. Langella, S. Oster, and J. Saltz. Distributed data management and integration framework: The mobius project. Global Grid Forum 11 (GGF11) Semantic Grid

Ap-plications Workshop, pages 20 – 38, 2004.

[8] G. Kola, T. Kosar, J. Frey, and M. Livny. Disc: A system for distributed data intensive scientific computing.

WORLDS’04, December 2004.

[9] B. Lud¨ascher, I. Altintas, and C. Berkley. Scientific work-flow management and the Kepler system. Concurrency and

Computation: Practice & Experience, Special Issue on Sci-entific Workflows, 18(10):1039–1065, 2005.

[10] T. C. Pan and K. Huang. Virtual mouse placenta: Tissue layer segmentation. Proceedings of the 27th Annual

Inter-national Conference of the IEEE Engineering in Medicine and Biology Society (EMBC2005), Sep 2005.

[11] G. Teodoro, T. Tavares, R. Ferreira, T. Kurc, W. Meira, D. Guedes, T. Pan, and J. Saltz. Run-time support for ef-ficient execution of scientific workflows on distributed envi-ronmments. SBAC, October 2006.

[12] G. Teodoro, T. Tavares, R. Ferreira, T. Kurc, W. Meira, D. Guedes, T. Pan, and J. Saltz. Run-time support for ef-ficient execution of scientific workflows on distributed envi-ronmments, invited paper. IJPP, to appear 2007.