O Impacto da Métrica e do Escalonador Sobre a Performance dos Supercomputadores Paralelos

(1)

&(1752'(&,Ç1&,$6(7(&12/2*,$ &8562'(3Ï6*5$'8$d2(0,1)250È7,&$ ',66(57$d2'(0(675$'2 -RVLOHQH$LUHV0RUHLUD &DPSLQD*UDQGH3% $EULO 2,PSDFWRGD0pWULFDHGR(VFDORQDGRU VREUHD3HUIRUPDQFHGRV 6XSHUFRPSXWDGRUHV3DUDOHORV

(2)

025(,5$-RVLOHQH$LUHV 0, 2,PSDFWRGD0pWULFDHGR(VFDORQDGRUVREUHD3HUIRUPDQFHGRV6XSHUFRP SXWDGRUHV3DUDOHORV 'LVVHUWDomRGH0HVWUDGR8QLYHUVLGDGH)HGHUDOGH&DPSLQD*UDQGH&HQWUR GH&LrQFLDVH7HFQRORJLD&RRUGHQDomRGH3yV*UDGXDomRHP,QIRUPiWLFD &DPSLQD*UDQGH3DUDtED0DLRGH S,O 2ULHQWDGRU:DOIUHGRGD&RVWD&LUQH)LOKR 3DODYUDV&KDYH $UTXLWHWXUDGH&RPSXWDGRUHV 3URFHVVDPHQWR3DUDOHOR $YDOLDomRGH'HVHPSHQKRGH6XSHUFRPSXWDGRUHV (VFDORQDPHQWRGH6XSHUFRPSXWDGRUHV &'8±

(3)

81,9(56,'$'()('(5$/'(&$03,1$*5$1'( &(1752'(&,Ç1&,$6(7(&12/2*,$ &8562'(3Ï6*5$'8$d2(0,1)250È7,&$ -RVLOHQH$LUHV0RUHLUD :DOIUHGRGD&RVWD&LUQH)LOKR 2ULHQWDGRU

Cam pina Grande - PB Abril - 20 0 3

2,PSDFWRGD0pWULFDHGR(VFDORQDGRU VREUHD3HUIRUPDQFHGRV

6XSHUFRPSXWDGRUHV3DUDOHORV

Dissertação submetida à Coordenação do Curso de Pós-Graduaç o em Informática da Universidade Federal de Campina Grande, como parte dos requisitos necessários para obtenç o do grau de Mestre em Informática.

ÈUHDGH&RQFHQWUDomR5HGHVGH&RPSXWDGRUHVH 6LVWHPDV'LVWULEXtGRV

(4)

2,PSDFWRGD0pWULFDHGR(VFDORQDGRUVREUHD 3HUIRUPDQFHGRV6XSHUFRPSXWDGRUHV3DUDOHORV -RVLOHQH$LUHV0RUHLUD 'LVVHUWDomRDSURYDGDHP>&OLTXHDTXLHGLJLWHDGDWDGHDSURYDomR@ :DOIUHGRGD&RVWD&LUQH)LOKR'RXWRU 2ULHQWDGRU >&OLTXHDTXLHGLJLWHRQRPHFRPSOHWRGRFRPSRQHQWHGDEDQFDHWLWXODomR@ &RPSRQHQWHGD%DQFD >&OLTXHDTXLHGLJLWHRQRPHFRPSOHWRGRFRPSRQHQWHGDEDQFDHWLWXODomR@ &RPSRQHQWHGD%DQFD &DPSLQD*UDQGH>&OLTXHDTXLHGLJLWHDGDWDGHDSURYDomR@

(5)

"Tudo tem o seu tempo determinado, e há tempo para todo propósito debaixo do céu: Há tempo de nascer e tempo de morrer; Tempo de plantar e tempo de arrancar o que se plantou; Tempo de matar e tempo de curar; tempo

de derribar e tempo de edificar; Tempo de chorar e tempo de rir; tempo de prantear e tempo de saltar; Tempo de espalhar pedras e tempo de a-juntar pedras; tempo de abraçar e tempo de

afastar-se de abraçar; Tempo de buscar e tempo de perder; Tempo de guardar e tempo de deitar fora; Tempo de rasgar e tempo de coser; tempo de estar calado e tempo de falar; Tempo de amar e tempo de aborrecer; Tempo de guerra e tempo de paz."

(6)

$'HXVTXHHVWiQRFRQWUROHGHWXGR

.

$5LFDUGRTXHPHWUDQVPLWHDPRUHPWRGRVRV PRPHQWRV $'DQLHODTXHpSXUDWHUQXUDHFDULQKR $0DUFHORTXHDGRoDRVPHXVGLDV $*DEULHOTXHDOHJUDDPLQKDYLGD $:DOIUHGRTXHPHIH]XOWUDSDVVDUPHXVOLPLWHV

(7)

$JUDGHFLPHQWRV

Agradeço à Dataprev, n a pessoa de Rôm ulo, que m e proporcion ou a oportu-n idade de chegar até aqui através do Program a de Ioportu-nceoportu-ntivo à Pós-graduação. A Mauro, pela paciência e bom hum or para en ten der m in ha ausên cia. A J úlio César por estar sem pre disposto a esclarecer m inhas dúvidas, m esm o as m ais triviais. E tam bém à Equipe de Operações, especialm ente aqueles que sem pre m e fizeram sen tir parte dela, ainda que distan te fisicam en te.

Agradeço a Aninha que facilita a vida de todos n ós, alun os. Ao corpo de pro-fessores da COPIN, pela dedicação e em pen ho em n os tornar Mestres. Ao professor Fubica que m e fez passar pela prova da peneira e perceber que podia ir adiante. Ao professor Antôn io Berto que, no m om en to m ais difícil, am pliou o m eu con ceito so-bre verdade.

Agradeço aos m eus filhos Daniela, Marcelo e Gabriel por aceitarem os m o-m en tos eo-m que eu “vivia” n o coo-m putador, eo-m bora seo-m coo-m preen der beo-m o por-quê. Especialm ente a Ricardo por nun ca reclam ar, por m e in cen tivar, por acreditar em m im , por m e am ar m uito e por ser um com pan heirão, sem pre. Aos m eus pais pela educação que m e proporcionaram . À vovó, pela acolhida carin hosa n as m inhas idas e vin das.

Finalm en te, agradeço a Walfredo pela paciên cia de esperar que eu enxergas-se as con clusões que ele já vira anos-luz adian te. Por m e incentivar. Por nun ca for-çar dem ais. Por ser tão ocupado, m as ter sem pre tem po dispon ível. Por ter o dom de en sin ar todo o tem po, até n o cafezinho. Por ser am igo. E por m e fazer acreditar que n ão há lim ites, em bora às vezes pareça im possível ir além .

(8)

ËQGLFH $JUDGHFLPHQWRV YLL ËQGLFH YLLL /LVWDGH)LJXUDV [ /LVWDGH7DEHODV [L /LVWDGH7DEHODV [L ,QWURGXomR

1.1. Sum ário da Dissertação ...3

1.2. Estrutura da Dissertação...4

6XSHUFRPSXWDGRUHV 2.1. Processam en to Paralelo ...6

2.2. Supercom putadores Paralelos ... 10

3HUIRUPDQFH 3.1. Medin do Perform ance ...11

3.2. WRUNORDG... 13 3.3. Escalonadores ... 15 &RQVHUYDWLYH%DFNILOOLQJ... 17 (DV\%DFNILOOLQJ... 18 3.4. Métricas ... 19 7XUQDURXQGWLPH (WW) m édio... 19 6ORZGRZQ m édio... 21 %RXQGHGVORZGRZQ m édio ...22 3HUSURFHVVRUERXQGHGVORZGRZQ m édio ...22

Média geom étrica do WXUQDURXQGWLPH...23

7KURXJKSXW...24

Utilização ...24

3HUIRUPDQFH5HODWLYD 4.1. Defin ição ...25

(9)

Sim ulação ... 28

:RUNORDGV... 28

4.3. Métricas Tradicionais...29

4.4. Perform an ce Relativa ... 30

4.5. An alisan do as Características dos Program as ...33

Núm ero de processadores (Q) ...33 Tem po requisitado (WU) ...36 Área requisitada (WU×Q)... 38 Tem po de execução (WH)... 41 Área de execução (WH×Q) ...43 4.6. Con clusão ...45 (VFDORQDPHQWRH0ROGDELOLGDGH 5.1. SA...49 5.2. SAs× SAi...53 Sim ulação ...54

5.3. Avaliação de Perform an ce... 55

Program a WDUJHW em ZRUNORDG estática ... 57

Program a WDUJHW em ZRUNORDG em tem po de subm issão ... 60

Program a WDUJHW em ZRUNORDG em tem po de execução ...62

Quando todos usam SA ...65

5.4. Con clusão ...70

&RQFOXV}HV 5HIHUrQFLDV%LEOLRJUiILFDV

(10)

/LVWDGH)LJXUDV )LJXUD±0XOWLSURFHVVDGRU>@ )LJXUD±033>@ )LJXUD12:>@ )LJXUD*ULG&RPSXWDFLRQDO>@ )LJXUD)RUPDRXiUHDGHXPSURJUDPD )LJXUD/LVWDGHDORFDomRDSyVDVXEPLVVmRGHFLQFRUHTXHVWV>@ )LJXUD/LVWDGHDORFDomRDSyVREDFNILOOLQJLQLFLDGRSRU$WHUPLQDUQRWLPH >@ )LJXUD/LVWDGHDORFDomRDQWHVGR(DV\EDFNILOOLQJ )LJXUD/LVWDGHDORFDomRDSyVR(DV\EDFNILOOLQJ )LJXUD±([HPSORGH3HUIRUPDQFH5HODWLYD )LJXUD3HUIRUPDQFHUHODWLYD&7& )LJXUD3HUIRUPDQFHUHODWLYD.7+ )LJXUD3HUIRUPDQFHUHODWLYD6'6& )LJXUD3HUIRUPDQFHUHODWLYD6<17 )LJXUD3HUIRUPDQFHUHODWLYDGDVTXDWURZRUNORDGVSRUQ )LJXUD3HUIRUPDQFHUHODWLYDGDVTXDWURZRUNORDGVSRUWU )LJXUD3HUIRUPDQFHUHODWLYDGDVTXDWURZRUNORDGVSRUWU×Q )LJXUD3HUIRUPDQFHUHODWLYDGDVTXDWURZRUNORDGVSRUWH )LJXUD3HUIRUPDQFHUHODWLYDGDVTXDWURZRUNORDGVSRUWH×Q )LJXUD0ROGDELOLGDGHGRVSURJUDPDVSDUDOHORV>@ )LJXUD6HOHomRGRVUHTXHVWVSHORVXVXiULRV>@ )LJXUD6$VHOHFLRQDQGRRUHTXHVW>@ )LJXUD6$GHFLGLQGRQRPRPHQWRGRLQtFLRGRSURJUDPD )LJXUD3HUIRUPDQFHUHODWLYDZRUNORDGHVWiWLFD )LJXUD3HUIRUPDQFHUHODWLYD±ZRUNORDGHPWHPSRGHVXEPLVVmR )LJXUD3HUIRUPDQFHUHODWLYD±ZRUNORDGHPWHPSRGHH[HFXomR )LJXUD3HUIRUPDQFHUHODWLYD6$ 6$ )LJXUD3HUIRUPDQFHUHODWLYDVSHHGXSOLQHDU

(11)

/LVWDGH7DEHODV 7DEHOD0pGLDDULWPpWLFDGRWXUQDURXQGWLPH 7DEHOD&iOFXORGRVORZGRZQ 7DEHOD6ORZGRZQGHSURJUDPDVPXLWRFXUWRV 7DEHOD'HVFULomRGDVZRUNORDGV 7DEHOD±(DV\×&RQVHUYDWLYHEDFNILOOLQJFRPPpWULFDVWUDGLFLRQDLV 7DEHOD6XPiULRSRUQ&7& 7DEHOD6XPiULRSRUQ.7+ 7DEHOD6XPiULRSRUQ6'6& 7DEHOD6XPiULRSRUQ6<17 7DEHOD6XPiULRSRUWU&7& 7DEHOD6XPiULRSRUWU.7+ 7DEHOD6XPiULRSRUWU6'6& 7DEHOD6XPiULRSRUWU6<17 7DEHOD±6XPiULRSRUiUHDUHTXLVLWDGD&7& 7DEHOD±6XPiULRSRUiUHDUHTXLVLWDGD.7+ 7DEHOD±6XPiULRSRUiUHDUHTXLVLWDGD6'6& 7DEHOD±6XPiULRSRUiUHDUHTXLVLWDGD6<17 7DEHOD6XPiULRSRUWH&7& 7DEHOD6XPiULRSRUWH.7+ 7DEHOD6XPiULRSRUWH6'6& 7DEHOD6XPiULRSRUWH6<17 7DEHOD6XPiULRSRUWH×Q.7+ 7DEHOD6XPiULRSRUWH×Q.7+ 7DEHOD6XPiULRSRUWH×Q6'6& 7DEHOD6XPiULRSRUWH×Q6<17 7DEHOD:RUNORDGVGHUHIHUrQFLDSDUDRPRGHORGHFDUJD>@ 7DEHOD4XDQWLGDGHGHH[SHULPHQWRVSRUVXSHUFRPSXWDGRU 7DEHOD&HQiULRVVLPXODGRVFRP6$ 7DEHOD6XPiULRGH6$HPZRUNORDGHVWiWLFD

(12)

7DEHOD±0pWULFDVSDUDZRUNORDGHVWiWLFD 7DEHOD6XPiULRGH6$ HPZRUNORDGHPWHPSRGHVXEPLVVmR 7DEHOD6XPiULRGH6$HPZRUNORDGHPWHPSRGHVXEPLVVmR 7DEHOD±0pWULFDVSDUDZRUNORDGHPWHPSRGHVXEPLVVmR 7DEHOD6XPiULRGH6$HPZRUNORDGHPWHPSRGHH[HFXomR 7DEHOD6XPiULRGH6$ HPZRUNORDGHPWHPSRGHH[HFXomR 7DEHOD±0pWULFDVSDUDZRUNORDGHPWHPSRGHH[HFXomR 7DEHOD0pGLDJHRPpWULFDSDUDPROGDELOLGDGHFRP6$ H 6$ 7DEHOD6XPiULRGDSHUIRUPDQFHUHODWLYD6$ 6$ 7DEHOD0pGLDJHRPpWULFDFRPVSHHGXSOLQHDU 7DEHOD6XPiULRGDSHUIRUPDQFHUHODWLYDSDUDVSHHGXSOLQHDU 7DEHOD'LOHPDGRSULVLRQHLUR 7DEHOD'LOHPDGRSULVLRQHLURSDUD6$H6$

(13)

&DStWXOR,

,QWURGXomR

O poder com putacion al oferecido pelo processam en to paralelo está cada vez m ais acessível aos usuários de com putadores. Através das plataform as de procesam ento existentes hoje e de m uitas outras em desen volvim en to, já é possível con struir um supercom putador paralelo a partir de um conjunto de m áquinas, a exem -plo do que acontece com %HRZXOI[47]. En tretanto, se você não pode construir o

seu próprio supercom putador, existe a altern ativa de utilizar a com putação em

*ULG[16], um a plataform a que provê m eios para que um usuário possa utilizar

re-cursos com putacion ais distribuídos pelo m undo.

Na verdade, para cada classe de aplicações paralelas existe um a plataform a que m elhor se adequa às suas características. En tre as principais plataform as de processam en to paralelo estão os supercom putadores paralelos de m em ória distri-buída, tam bém con hecidos por 033V (Processadores Massivam ente Paralelos).

Estes supercom putadores são form ados por um con junto de nós (processador e m em ória) independen tes, in terconectados por redes dedicadas e m uito rápidas [12]. Possuem a característica de ter um escalonador cen tral que controla os pro-gram as a serem processados a partir de um a fila de execução. É sobre esta classe de supercom putadores que estarem os tratando n este trabalho, os quais vam os cham ar de supercom putadores paralelos.

Os supercom putadores paralelos surgiram para aten der a crescen te dem an-da por capacian-dade de processam en to. As aplicações se torn aram m uito com plexas e volum osas, conseqüentem en te con sum indo um tem po m uito grande para a obten-ção de resultados. Em um am biente onde aplicações dem oram dias, sem an as e até an os para serem processadas, com o é o caso do m apeam ento do genom a hum ano ou das sim ulações clim áticas da terra, a diferen ça de perform ance pode ser crucial. Para um a aplicação que é executada em um a hora, esta diferen ça de perform an ce pode até não ser percebida. Porém , em um processam ento que dem ora um an o, um a m elhoria de perform an ce de 50 % antecipa o resultado em 6 m eses.

(14)

A questão é: com o m elhorar a perform ance dos supercom putadores parale-los? A perform ance destes supercom putadores é afetada por diversos fatores carac-terísticos ao seu am biente. Há o m étodo de gerenciam en to da fila de execução, co-n hecido com o algoritm o de escaloco-n am eco-nto, que procura otim izar a m aco-n eira que os program as serão alocados para processam ento [25]. Outro fator, a carga de traba-lho, conhecida com o ZRUNORDG, possui características que in fluen ciam diretam ente

o com portam ento do sistem a, tais com o a distribuição dos tem pos de execução e a qualidade dos pedidos de subm issão dos program as que a com põem , en tre outras [22] [36]. E, surpreendentem en te, têm sido com provado que a m étrica utilizada para represen tar o desem pen ho do sistem a tam bém pode influenciar nos resulta-dos da avaliação de perform ance [20 ] [21] [42]!

Com a finalidade de otim izar a perform an ce das aplicações subm etidas a es-tes supercom putadores, foi desenvolvido SA, um escalon ador de aplicações. SA trabalha a partir de altern ativas de subm issão de um program a fornecidas pelo u-suário, realizan do um a projeção da execução e assim escolhen do a m elhor alterna-tiva de subm issão. Estes program as que podem ser subm etidos de diversas m an ei-ras são conhecidos com o program as m oldáveis. SA efetivam en te m elhora a per-form an ce dos program as m oldáveis [9].

O objetivo do n osso trabalho é estudar algun s aspectos das interações en tre os fatores que afetam a perform an ce dos supercom putadores paralelos. Com rela-ção à m étrica de perform ance, an alisam os aquelas que são m ais usadas atualm en te e propom os um a m étrica que interfira m enos n o processo de avaliação, que seja pouco tenden ciosa e que traga m ais inform ações sobre a relação sistem a ×

ZRUNORDG. Esta m étrica é cham ada de Perform an ce Relativa [41]. Com relação ao

m étodo de escalonam en to, realizam os um estudo sobre o uso do escalon ador de aplicação SA. SA tem o objetivo de m elhorar a perform ance da aplicação que esca-lona, e efetivam en te alcan ça este objetivo [9]. Mais do que isso, com o com porta-m en to agregado con seqüen te do uso de porta-m últiplas in stân cias de SA, o próprio sis-tem a sis-tem sua perform an ce m elhorada em algum as situações [11]. SA escolhe a m e-lhor altern ativa de escalon am ento n o m om en to da subm issão. Avaliam os a possibi-lidade de SA atuar n ovam en te n o m om en to do in ício da execução, com a expectati-va de m elhorar ain da m ais a perform an ce do program a. Tan to para a m étrica com o

(15)

para o m étodo de escalon am en to, realizam os experim en tos e apresen tam os os re-sultados obtidos.

6XPiULRGD'LVVHUWDomR

Nós m ostram os n esta dissertação com o a m étrica de perform ance e o m éto-do de escalonam ento podem in fluen ciar no desem penho éto-dos supercom putaéto-dores paralelos.

Apesar do resultado da avaliação de perform ance aparentem en te depen der apen as do escalon ador e da carga de dados sendo processada, há casos n a literatura que m ostram a in fluên cia de outro fator: a m étrica [20 ] [21] [25] [42]. Baseados n estes conflitos de resultados aparen tem en te gerados pelas m étricas, realizam os um experim en to prático que con stata que a m étrica utilizada pode alterar o resul-tado da avaliação de perform an ce. A fim de esclarecer m elhor esta questão, propo-m os upropo-m a propo-m étrica, 3HUIRUPDQFH 5HODWLYD, que procura m inim izar o efeito da

m étrica sobre a avaliação de perform an ce [41]. Isto é possível porque Perform an ce Relativa utiliza toda a distribuição dos resultados e n ão se baseia em estatísticas para a sum arização dos dados. Além disso, Perform ance Relativa tem o objetivo de prover in form ação que perm ita com preen der m elhor a atuação do escalon ador so-bre os dados processados pelo supercom putador.

O m étodo de escalon am ento é crucial para a perform an ce dos supercom pu-tadores paralelos, pois trata do m odo que os program as são alocados da fila de es-pera para a execução. Program as m oldáveis são aqueles que podem ser executados em partições de diversos tam an hos. Com o a m aioria dos program as paralelos hoje são m oldáveis [14], esta característica pode ser aproveitada para m elhorar a per-form ance destes program as. SA é um escalon ador de aplicação que tem o objetivo de escolher a m elhor altern ativa de escalon am en to para um program a m oldável [9]. SA atin ge este objetivo e, além disso, tam bém m elhora a perform an ce do sis-tem a em certas situações, quan do várias in stâncias de SA estão sen do usadas no m esm o supercom putador [11]. A fim de investigarm os a possibilidade de m elhorar ainda m ais a perform an ce alcan çada pelo uso de SA, realizam os um a m odificação n a sua im plem en tação. SA n a sua form a origin al decide qual o tam an ho da partição a ser usada no m om en to da subm issão do program a. A nossa m odificação

(16)

acres-que SA possa ser invocado tam bém no m om ento em acres-que um program a é adian tado na fila de espera e pode in iciar sua execução im ediatam ente. Cham am os esta alte-ração de 6$ QR LQtFLR GD H[HFXomR. Verificam os que esta m odificação m elhora

isoladam en te a perform an ce da aplicação que SA escalona. En tretan to, este com -portam en to piora o desem pen ho global do sistem a quando m uitas instân cias de SA estão sendo usadas. Os resultados m ostram que não parece ser in teressante para o sistem a ter SA atuando tan to no m om en to da subm issão com o no m om en to do in í-cio da execução do program a. Confirm am os através das nossas sim ulações que o uso de SA apen as n o m om en to da subm issão, isto é, n a sua form a origin al, é m e-lhor para a perform an ce do sistem a com o um todo, quando m uitas instân cias de SA estão atuan do. Detalharem os esta an álise no capítulo V, Escalonam ento e Moldabi-lidade.

(VWUXWXUDGD'LVVHUWDomR

Esta dissertação está organizada em seis capítulos. Este capítulo delineia a pesquisa e apresenta o cen ário do nosso estudo, delim itan do a sua área de abran -gên cia. O segundo capítulo descreve os supercom putadores e a m an eira com o eles trabalham . O terceiro capítulo discute a avaliação de perform ance dos supercom putadores paralelos e os fatores envolvidos n esta questão. O quarto capítulo m ostra a m étrica de perform ance proposta, Perform ance Relativa, jun tam en te com o estudo de caso realizado sobre o assun to. O capítulo cinco apresenta um a discussão sobre o im pacto do escalonador sobre a perform ance dos supercom putadores paralelos através do estudo de altern ativas de escalonam ento de program as m oldáveis e o respectivo estudo de caso. Finalm ente, o capítulo seis apresen ta as conclusões do n osso trabalho.

(17)

&DStWXOR,,

6XSHUFRPSXWDGRUHV

O crescim en to da utilização de com putadores para a resolução de problem as in tensificou-se n as últim as décadas. Com o os processadores têm -se torn ado cada vez m ais rápidos, seria possível supor que em algum m om en to n ão fosse m ais n e-cessário aum en tar o seu poder com putacional. En tretanto, historicam en te, quan do um a tecnologia em particular satisfaz as aplicações conhecidas, novas aplicações surgem dem an dando o desen volvim en to de novas tecn ologias [28 ].

Mesm o com o crescim en to acelerado da capacidade com putacion al dos pro-cessadores (praticam ente dobran do a cada 18 m eses [16]), existem hoje aplicações que dem an dariam m uito tem po de processam en to seqüen cial. São aplicações in-ten sivas em processam en to e/ ou in in-ten sivas em dados. Estas aplicações possuem cálculos extrem am en te com plexos, dem an dando m uito tem po para que sejam con-cluídas; outras, por sua vez, processam en orm e quantidade de dados, con sum in do dias, m eses e até anos de execução.

A fim de possibilitar a obtenção de resultados de form a ainda m ais rápida, surgiu o processam en to paralelo. Tradicionalm en te, o desen volvim en to da com pu-tação de alta perform an ce foi m otivado por com putações n um éricas de gran de com plexidade, com o aplicações de previsão do tem po, projeto de dispositivos m e-cân icos e circuitos eletrôn icos e sim ulações de reações quím icas. Atualm ente o que tem im pulsionado a procura por com putadores m ais rápidos são tipicam en te apli-cações que n ecessitam do processam ento de grande quan tidade de dados, tais co-m o gráficos avançados para toco-m ografia coco-m putadorizada [48 ], realidade virtual, vídeo conferência, diagn ósticos auxiliados por com putador na m edicin a, sim ula-ções clim áticas da terra, sim ulação do com portam en to das galáxias e m apeam en to gen ético [45], entre outras. Estas aplicações se ben eficiam do processam en to para-lelo para acelerar a obtenção dos resultados.

(18)

3URFHVVDPHQWR3DUDOHOR

Um a aplicação paralela é com posta por várias tarefas. As tarefas que com -põem um a aplicação paralela executam em vários processadores, caracterizando desta form a o paralelism o da aplicação e con seqüente redução n o seu tem po de execução.

Os processadores usados por um a determ in ada aplicação constituem a SOD WDIRUPDGHH[HFXomR da aplicação. A compreensão das plataformas de execução de

processam ento paralelo é essen cial para que se possa escolher e aproveitar as ca-racterísticas de cada um a que favoreçam um a determ in ada classe de aplicações. Vejam os a descrição proposta por Cirn e em [12], que classifica as plataform as de execução de aplicações paralelas de acordo com sua con ectividade, heterogeneida-de, com partilham ento, im agem do sistem a e escala. Esta classificação baseia-se no escalon ador.

Con ectividadediz respeito aos canais de com unicação que interligam os

pro-cessadores que com põem a plataform a de execução.

Heterogen eidadetrata das diferen ças en tre os processadores, que podem ser

de velocidade e/ ou arquitetura.

Com partilham en toversa sobre a possibilidade dos recursos usados por um a

aplicação serem com partilhados por outras aplicações.

Im agem do sistem a se refere à existência de um a visão ún ica da plataform a, independen te do processador sen do utilizado. Por exem plo, todos os processadores da plataform a en xergam o m esm o sistem a de arquivos?

Escala estabelece quantos processadores tem a plataforma.

Cada aplicação paralela tem um a série de requisitos, que podem ser m elhor ou pior atendidos por um a dada plataform a. Em prin cípio, procuram os executar um a aplicação paralela em um a plataform a adequada às características da aplica-ção. Por exem plo, con sidere conectividade, um aspecto em que plataform as dife-rem consideravelm ente. Para obter boa perform ance de um a aplicação paralela cujas tarefas se com un icam e sincron izam freqüen tem en te, n ecessitam os utilizar um a plataform a de execução com boa conectividade.

Podem os agrupar as plataform as de execução hoje existentes em quatro gran des grupos: 603V, 033V, 12:V e *ULGV.

(19)

603V(ou m ultiprocessadores sim étricos) são m áquin as em que vários

pro-cessadores com partilham a m esm a m em ória. Multipropro-cessadores sim étricos possi-bilitam um fortíssim o acoplam en to entre os processadores e executam um a única cópia do sistem a operacional para todos os processadores. Portan to, eles apresen -tam um a im agem ún ica do sistem a e excelen te con ectividade. Todavia, m ultipro-cessadores sim étricos apresen tam lim itações em escalabilidade, raram en te ultra-passando 16 processadores. Multiprocessadores são relativam en te com uns n o m er-cado e vão desde m áquinas biprocessadas ,QWHO até gran des servidores com o os ,%0S6HULHV. A Figura 1 m ostra a arquitetura de um m ultiprocessador.

)LJXUD±0XOWLSURFHVVDGRU>@

033V (ou supercomputadores paralelos) são compostos por vários nós

(pro-cessador e m em ória) indepen den tes, in terconectados por redes dedicadas e m uito rápidas. 033V incluem supercom putadores paralelos com o o ,%063 e &UD\7(,

com o tam bém FOXVWHUV de m enor porte m ontados pelo próprio usuário. Tipicam en

-te cada nó roda sua própria cópia do sis-tem a operacional, m as um a im agem co-m uco-m do sisteco-m a é ico-m pleco-m en tada através da visibilidade dos co-m esco-m os sisteco-m as de arquivo por todos os nós. Um 033 é controlado por um escalonador que determ ina

quais aplicações executarão em quais nós. Ou seja, não se pode utilizar um nó que não tenha sido alocado à aplicação pelo escalonador. A Figura 2 apresen ta a arqui-tetura de um 033. 033Vsão a plataform a alvo deste trabalho.

Mem ória

CPU

... CPU

(20)

)LJXUD±033>@

12:V(ou redes de estações de trabalho) são sim plesm en te um conjun to de

estações de trabalho ou 3&V, ligados por um a rede local [1]. 12:V são

arquitetu-ralm en te sem elhan tes aos 033V. Am bas plataform as são form adas por n ós que

agregam processador e m em ória. Um a diferen ça en tre 12:V e 033V é que os nós

que com põem um 033 tipicam en te são con ectados por redes m ais rápidas que as

que con ectam os nós das 12:V. Mas a prin cipal diferen ça entre am bas

arquitetu-ras é que 12:V n ão são escalon adas de form a cen tralizada. Isto é, em um a 12:,

n ão há um escalon ador para o sistem a com o um todo. Cada nó tem seu próprio es-calonador local. Com o resultado, n ão há com o dedicar um a partição da 12: a

um a só aplicação paralela. Portanto, um a aplicação que executa sobre a 12: deve

con siderar o im pacto sobre sua perform ance da con corrên cia por recursos por par-te de outras aplicações. A Figura 3 ilustra esquem aticam en par-te um a 12:.

)LJXUD12:>@ CPU Mem . CPU Mem . CPU Mem . ... Escalonador requisições CPU Mem . CPU Mem . CPU Mem . ...

(21)

*ULGV são o passo n atural depois das 12:V no sentido de m ais heterogen

ei-dade e m aior distribuição. Os com ponen tes de um *ULG n ão se restringem a

proces-sadores, poden do ser 603V e 033V com o tam bém in strum entos digitais. *ULGV

tipicam en te n ão forn ecem um a im agem com um do sistem a para seus usuários. Com pon en tes do *ULG podem variar drasticam ente em capacidade, software in

sta-lado, sistem as de arquivo m ontados e periféricos in stalados. Além disso, os com po-n epo-ntes de um *ULG podem estar sob o controle de diferen tes entidades e, portanto,

em dom ínios adm in istrativos diversos.

Con seqüen tem en te, um dado usuário pode ter acesso e perm issões bastan te distintas n os diferen tes com pon entes de um *ULG. Naturalm ente, o *ULG não pode

ser dedicado a um usuário, em bora seja possível que algum com pon en te possa ser dedicado (um 033, por exem plo). A Figura 4 m ostra um *ULG onde tem os um m

i-croscópio fazendo instrum en tação eletrôn ica e um com putador arm azen an do gran de quan tidade de dados.

)LJXUD*ULG&RPSXWDFLRQDO>@ CPU Mem . CPU Mem . CPU Mem . ...

Internet

(22)

Com o já dissem os, o dom ín io do nosso trabalho está inserido n a área dos

033V, ou Supercom putadores Paralelos de Mem ória Distribuída, cham ados aqui

de supercom putadores paralelos.

6XSHUFRPSXWDGRUHV3DUDOHORV

Um supercom putador paralelo é com posto de um certo n úm ero de proces-sadores trabalhando cooperativam en te, cada um com a sua própria m em ória, co-nectados por um a rede in tern a extrem am en te rápida. Os program as executados n este am bien te tipicam en te possuem tarefas que se com unicam e sincron izam .

Neste am bien te paralelo um program a deve explicitar o grau de paralelism o, isto é, o núm ero de processadores ou QRGHV(Q) - tam bém conhecido com o WDPD QKRGDSDUWLomR ou sim plesm en te WDPDQKR - e o tem po requisitado (WU) necessários

à sua execução [9]. A relação en tre o núm ero de processadores e o tem po requisita-do é cham ada de IRUPD ou iUHD, com o m ostrado na Figura 5.

)LJXUD)RUPDRXiUHDGHXPSURJUDPD

Um program a subm etido ao supercom putador pode n ão en con trar recursos dispon íveis para ser executado im ediatam en te e en tão é colocado em um a ILODa

qual é controlada pelo HVFDORQDGRU do supercom putador.

O escalon ador tem a fun ção de receber as requisições dos program as e deci-dir quando estesin iciarão a execução e que processadores usarão. Ou seja, o

esca-lonador decide qual program a da fila de execução será o próxim o a ser executado. O escalon am en to n os supercom putadores paralelos é um tipo de escalon am ento

RQOLQH, pois lida com program as que chegam con tin uam ente ao sistem a [17]. Q

WU

Q

(23)

&DStWXOR,,,

3HUIRUPDQFH

Avaliação de Perform an ce é difícil. Em am bien tes paralelos, em particular, o processo de avaliação de perform ance é m ais crucial e com plexo do que em am bi-en te seqübi-en ciais [38 ]. A perform ance dos sistem as paralelos é influbi-en ciada por um a m ultiplicidade de fatores relacionados à estrutura das aplicações e à sua habi-lidade em explorar as características de paralelism o do sistem a [7], além de sofrer in fluência do m odo com o o sistem a paralelo trabalha. Não vam os explorar aqui as características das aplicações, o que seria um outro cam po de pesquisa, m as sim o am bien te onde estas aplicações são executadas e os fatores que in fluen ciam na ava-liação de perform an ce destes sistem as com putacion ais.

0HGLQGR3HUIRUPDQFH

A avaliação de perform an ce é freqüentem ente realizada com o objetivo de com parar diferen tes im plem en tações de sistem as. Faz parte da avaliação trazer à ton a diferentes aspectos de desem pen ho observados duran te a com paração. Estas diferenças de desem pen ho refletem as características próprias e individuais de cada sistem a sendo avaliado. En tretanto, as diferenças de perform an ce en contradas po-dem estar sen do influen ciadas pela m etodologia utilizada duran te a avaliação, pois a perform ance de um sistem a n ão é apen as fun ção de seu projeto ou de sua im ple-m entação, ple-m as pode ser afetada pela carga à qual o sisteple-m a está subple-m etido, e ain da pela m étrica que está sen do utilizada para represen tar o desem penho observado [24].

A técnica m ais com um en te utilizada para avaliar a perform an ce de super-com putadores é o EHQFKPDUNLQJque con siste em subm eter o sistem a a um con

-jun to represen tativo e abrangente de carga a fim de an alisar o seu com portam ento [7]. Existem ferram en tas de software que se propõem a auxiliar o avaliador neste processo, oferecen do um a m assa de dados projetada de form a a represen tar am -plam ente as situações reais, além de forn ecer com o saída gráficos e relatórios que

(24)

serão interpretados pelo avaliador de perform ance. Estes WRRONLWVtêm o objetivo de

autom atizar o processo de avaliação, dim inuir o tem po n ecessário para efetivação dos experim entos e m in im izar o n úm ero de erros n a avaliação, em sum a aum en-tando a produtividade do processo [7]. Porém , usan do um a ferram en ta com o esta, o avaliador deverá ter um pouco m en os de trabalho, m as n ão poderá deixar de an a-lisar se os dados são m esm o represen tativos, se a m étrica usada foi adequada e se os resultados estão bem representados, en tre outros aspectos a considerar. Em re-sum o, o WRRONLW poderá ajudar o avaliador, m as não suprim e a etapa de an álise m

i-n uciosa de todos os aspectos que ei-n volvem um a avaliação de perform ai-n ce.

J ain propõe em [33] um a abordagem sistem ática do estudo de m edição de perform an ce :

• Definir o sistem a e os objetivos que este deseja alcan çar;

• Descrever o que o sistem a faz e quais são as respostas a serem considera-das;

• Selecionar as m étricas de avaliação a serem utilizadas;

• Listar os parâm etros con siderados;

• Selecionar os fatores a serem estudados, isto é, os parâm etros que irão variar para produzir os diferentes resultados;

• Selecionar as técn icas de avaliação, com o por exem plo sim ulação, m edi-ção, an álise.

• Selecionar a carga (ZRUNORDG) a ser aplicada para geração dos resultados;

• Projetar os experim en tos;

• An alisar e interpretar os dados obtidos;

• Apresen tar os resultados.

Para cada observador pode haver um conjunto de m étricas significativas, depen dendo do que se deseja avaliar n o sistem a com putacion al. Por exem plo, a análise de desem pen ho de um program a pode ser feita em fun ção da quantidade de tem po de CPU utilizado, do tem po total de E/ S (entrada/ saída) ou da utilização de m em ória, depen den do de qual com pon en te do sistem a se está analisando: CPU, subsistem a de E/ S ou subsistem a de m em ória virtual.

Para os supercom putadores paralelos, vam os considerar perform an ce atra-vés do pon to de vista de um usuário que subm ete o seu program a e espera obter um a resposta ³R PDLV UiSLGR SRVVtYHO´. O problem a é que em bora “R PDLV UiSLGR

(25)

SRVVtYHO´ seja n ão-am bíguo para um a determ inada aplicação, m étricas que sum

ari-zam os resultados para toda a ZRUNORDGpodem ser en ganadoras. Há exem plos n a

literatura que m ostram a m étrica in fluen cian do nos resultados da avaliação [20 ] [21] [25] [42]. Estes exem plos m ostram casos onde, usan do m étricas diferen tes para avaliar o desem penho de escalon adores, foram obtidos resultados con traditó-rios.

Em prin cípio a perform an ce deveria depender apenas da ZRUNORDGque está

sendo processada [17] [36] e do m étodo de escalonam ento utilizado para gerenciar a fila de execução dos program as [23]. Hoje já se con hece que a realidade n ão é bem assim . Há um a in teração en tre os fatores que estão presentes n o contexto dos supercom putadores paralelos: Escalonador, :RUNORDGe Métrica [20 ]. Vam os

exa-m inar aqui cada uexa-m destes aspectos isoladaexa-m ente para eexa-m seguida nos aprofun-darm os na in fluên cia da m étrica e do escalonador. Esta escolha n os pareceu m ais interessante, desde que a in fluên cia da ZRUNORDG é hoje am plam en te in vestigada na

literatura [17] [18 ] [22] [36] [37] [39] [53].

Além de todos estes fatores, é preciso ain da tom ar cuidado ao representar os resultados obtidos, pois gráficos com escalas pouco claras ou m al representadas, com parações entre equipam en tos de configurações diferen tes ou m esm o de carac-terísticas diferentes e o uso de unidades de m edida inadequadas podem levar a re-sultados distorcidos e en gan osos [3].

:RUNORDG

A perform an ce de um sistem a paralelo depen de em parte da carga que ele está processan do [7] [21] [36]0 . Deste m odo, para com parar e avaliar diferentes sistem as com putacion ais paralelos é necessário caracterizar a carga à qual serão subm etidos.

Existem duas m aneiras m ais com uns de usar um a carga de dados para avali-ar um sistem a [17]:

• Utilizar um a am ostra de dados real, coletada em um período de tem po

ZRUNORDGWUDFHouORJde sistem a, ou

• Criar um m odelo de carga ZRUNORDG PRGHOa partir de dados

(26)

A van tagem de usar um WUDFHé que torn a o teste m ais realista, pois os dados

refletem precisam ente a carga real com toda a sua com plexidade, m esm o que esta com plexidade n ão seja con hecida por quem realiza o teste. A desvan tagem é que o

WUDFH reflete um a carga específica, e é sem pre question ável se o resultado pode ser

gen eralizado para outros sistem as.

Outro aspecto com relação ao WUDFH é que ele reflete a carga aplicada a um a

determ inada configuração, portan to o m esm o WUDFH quan do usado com o m odelo de

carga para outra configuração torn a difícil a com paração en tre os dois sistem as [17].

A característica m ais relevan te do m odelo de cargasin tético é que ele con

-tém exatam en te o que o m odelador deseja. Isto pode ser um a van tagem ou um a desvan tagem : vantagem porque o m odelador con hece as características do m odelo e pode con trolá-las, e desvan tagem porque os WUDFHV podem con ter certas

caracte-rísticas que são descon hecidas do m odelador, e portan to n ão serão in cluídas no m odelo de carga construído [8 ].

Algum as outras vantagen s que os m odelos de cargas sin téticos possuem so-bre os WUDFHV são:

• Quem m odela tem am plo conhecim en to da característica da carga, sen do fácil determ inar quais parâm etros estão relacion ados com os outros, e es-ta in form ação é parte in tegrante do m odelo;

• É possível alterar os parâm etros do m odelo a fim de in vestigar a sua in-fluên cia sobre o resultado. Isto perm ite m edir a sen sibilidade do sistem a a diferen tes parâm etros. Tam bém é possível selecion ar os parâm etros do m odelo que m ais se adequam à avaliação de um determ in ado com puta-dor, ou conjun to de com putadores sen do avaliados;

• Um m odelo não é afetado pela política de um determ in ado local, vigen te n a época em que o WUDFH foi gravado: por exem plo, pode existir um a

polí-tica de não perm itir que program ascom tem po de execução superior a

quatro horas sejam executados, o que m odificará a distribuição natural de execução;

• Os ORJV podem estar “poluídos” por dados in válidos, com o a inclusão de

(27)

recursos. Em um m odelo sintético, tais program as podem ser evitados ou m odelados explicitam en te, se desejado;

• Finalm en te, a m odelagem pode aum entar o n osso entendim en to e levar a n ovos projetos baseados n este conhecim en to. Por exem plo, é possível projetar um a política de geren ciam en to de recursos param etrizada por um m odelo de carga. À m edida que os ORJV apresen tarem características

diversas do m odelo, n ovas políticas podem ser defin idas, assim com o o m odelo pode sofrer tran sform ações.

Vale ressaltar que o estudo de m odelagem de carga vem sendo influenciado pelas novas características de sistem as paralelos. A m etodologia geralm ente usada em am bien tes de processam en to seqüen cial n em sem pre provê um a descrição cor-reta de carga em arquiteturas paralelas [39].

O prin cipal problem a com m odelos de carga sin téticos, assim com o WUDFHV, é

a sua represen tatividade. Isto é, com que grau de sem elhança o m odelo represen ta a carga que o sistem a irá encon trar n a prática. Será que o com portam ento do sis-tem a quan do do uso do m odelo de carga represen ta o seu com portam en to quando em operação real? O m odelo contem pla todas as situações que o sistem a irá en con-trar n a prática?

(VFDORQDGRUHV

O m étodo de escalonam en to trata de com o os program as que estão n a fila de espera serão alocados para execução.Na prática, o com portam ento dos

escalona-dores de supercom putaescalona-dores variam de m áquin a para m áquin a, e até quan do o m esm o software de escalon am ento é usado, cada local estabelece sua própria polí-tica de escalon am ento, o que im plica n a m udan ça de com portam en to dos escalo-nadores [9]. Assim , depen den do da política de escalon am en to escolhida, os siste-m as podesiste-m apresen tar variações de desesiste-m pen ho, in fluencian do n a perforsiste-m ance do supercom putador paralelo.

Com o já vim os, em um am bien te de processam ento paralelo um program a deve explicitar o n úm ero de processadores (Q) e o tem po requisitado (WU) para a sua

execução. Note que o program a é abortado pelo sistem a caso ele exceda o tem po requisitado.

(28)

Um program a subm etido pode n ão en con trar recursos disponíveis para ser executado im ediatam ente. Quan do isso acontece, o program a é colocado em um a fila, a qual é controlada pelo escalon ador do supercom putador. O escalon ador tem a fun ção de receber as requisições dos program as e decidir quan do estes iniciarão a sua execução e que processadores usarão. O algoritm o usado para alocar os pro-gram as é con hecido com o m étodo de escalon am en to. Obviam ente, depen dendo da política de escalonam en to escolhida, os sistem as podem apresen tar variações de desem penho.

A prática atual n o escalonam en to de program a de supercom putadores para-lelos apresenta algum as características com un s [9]:

• Os program as podem com eçar fora de ordem (isto é, m esm o que o pro-gram a [ chegue an tes de \, \ pode com eçar an tes de [);

• Os recursos ociosos são reutilizados (isto é, o tem po que foi requisitado e não foi usado pode ser alocado para outros program as);

• A prioridade é baseada no tem po (um program a que chegou há m ais tem po tem m aior chance de ser o próxim o a executar do que um que che-gou há pouco tem po) e

• Existe algum m ecan ism o para evitar que os program as grandes dem orem m uito para executar.

Apesar de existirem vários escalon adores atualm ente (Easy [35], PBS [32], Maui [40 ], LSF [46], CRONO [43], entre outros) vam os descrever os m étodos de escalon am en to &RQVHUYDWLYH EDFNILOOLQJ e (DV\ EDFNILOOLQJ. Estes m étodos im

ple-m en taple-m os quatro ple-m ecanisple-m os descritos aciple-m a e serão objetos do nosso estudo de caso. São duas variações do m étodo EDFNILOOLQJ. %DFNILOOLQJ é um a otim ização do

m étodo FCFS ()LUVW&RPH)LUVW6HUYHG), onde os program as que chegam para

exe-cutar são colocados em um a fila e alocados por ordem de chegada. Com o os pro-gram as requerem um determ in ado núm ero de processadores para executar (Q),

pode acon tecer de haver processadores dispon íveis, m as não em quantidade sufici-en te para que o prim eiro program a n a fila possa executar. %DFNILOOLQJ ten ta reduzir

ao m ín im o esta subutilização de recursos através da alocação de outros program as da fila capazes de preenchê-los utilizar os processadores dispon íveis [42].

(29)

&RQVHUYDWLYH%DFNILOOLQJ

No algoritm o do &RQVHUYDWLYHEDFNILOOLQJ, quando o escalon ador encon tra o

prim eiro program a que n ão dispõe de recursos para ser executado im ediatam ente, percorre a fila procuran do um outro que possa ser executado com os recursos que estão dispon íveis no m om en to. Este program a pode então ser adian tado, desde que não atrase o início estim ado de n enhum outro ocupan te da fila de espera.

Deste m odo, o algoritm o garante previsibilidade, pois n o m om en to da sub-m issão já é possível garan tir usub-m lisub-m ite sub-m áxisub-m o para o in ício de usub-m prograsub-m a (sub-m á-xim o porque os program as à sua fren te n a fila poderão term in ar antes ou en tão o próprio program a poderá ser adian tado através de EDFNILOOLQJ).

&RQVHUYDWLYH EDFNILOOLQJusa um a lista de alocação que inform a, em

qual-quer m om en to, quais processadores estão sendo utilizados por quais program as [25]. Os program as que chegam ao sistem a são processados usan do )&)6. Por

e-xem plo, a Figura 6 m ostra a subm issão de cinco UHTXHVWV n a seguinte ordem : A, B,

C, D e E. Perceba que C é colocado an tes de B porque no m om en to em que WLPH

os recursos disponíveis n ão são suficien tes para que B seja executado, m as aten dem a C.

)LJXUD/LVWDGHDORFDomRDSyVDVXEPLVVmRGHFLQFRUHTXHVWV>@

Quando um program a term in a usando m enos tem po do que foi requerido,

&RQVHUYDWLYH EDFNILOLQJ exam ina a fila pela ordem de subm issão e adianta o

pri-m eiro prograpri-m a que cabe n o VORW que acabou de tornar-se vago. Se este rem

aneja-m en to criar outro VORW, este é preen chido da m esm a form a. O processo term ina

quando n ão há m ais EDFNILOOLQJ a ser feito. A Figura 7 m ostra o que acon tece

quan-do A term ina n o WLPH : B é prom ovido para in iciar logo depois de C, D segue B,

1 2 4 6 8 9 13 Time P ro c e s s o rs $ % & ' ( 1 6 5 4 2 3

(30)

m as E pode term in ar an tes do in ício estim ado de B e en tão é adiantado para o in í-cio da fila, de m odo que possa com eçar sua execução im ediatam en te.

)LJXUD/LVWDGHDORFDomRDSyVREDFNILOOLQJLQLFLDGRSRU$WHUPLQDUQRWLPH >@

(DV\%DFNILOOLQJ

O algoritm o de (DV\EDFNILOOLQJ tam bém percorre a fila no m om en to em que

um program a não pode ser executado, a fim de encaixar um outro que aproveite os recursos disponíveis. A diferen ça é que este m étodo é m ais agressivo, pois perm ite adian tar qualquer program a da fila de espera desde que isto n ão cause atraso ao prim eiro da fila [42].

Este algoritm o gan ha em agressividade, propondo um a m aior utilização do sistem a, m as perde em previsibilidade, pois é im possível estabelecer qualquer ga-rantia de quan do um program a será executado. Por exem plo, a Figura 8 m ostra a subm issão de cinco UHTXHVWVn esta ordem : A, B, C, D e E.

)LJXUD/LVWDGHDORFDomRDQWHVGR(DV\EDFNILOOLQJ

Quando um program a term in a usan do m en os tem po do que o requisitado,

(DV\ EDFNILOOLQJpercorre a fila e adian ta o prim eiro program a que couber no VORW

que ficou vago. A diferen ça é que os outros program as da fila podem ter seu in ício estim ado postergado, exceto o prim eiro. Vejam os quando A term ina no WLPH : B

1 2 4 6 8 9 ₁₆ Time P ro c e s s o rs $ B _' ( 1 6 5 4 2 3 & 3 4 1 2 4 6 11 Time P ro c e s s o rs % & ' ( 1 6 5 2

(31)

já está executando, C é o prim eiro da fila e E pode ser adian tado pois há recursos suficien tes para atendê-lo sem atrasar C, em bora isto provoque o atraso do início estim ado de D. D tin ha in ício previsto n o WLPH e após o EDFNILOOLQJ sua nova

pre-visão é in iciar n o WLPH . A Figura 9 m ostra a lista de alocação após o (DV\ EDFNILOOLQJ.

)LJXUD/LVWDGHDORFDomRDSyVR(DV\EDFNILOOLQJ

0pWULFDV

As m étricas são os m étodos utilizados para representar o desem pen ho de um sistem a. Existem algum as m étricas com um en te utilizadas n a avaliação de perfor-m an ce de supercoperfor-m putadores paralelos, sen do que cada uperfor-m a delas possui caracte-rísticas diferentes que podem ser in teressan tes para um determ inado tipo de sis-tem a, m as pouco adequadas a outros.

A situação ideal é que a m étrica n ão in terfira na avaliação, m as n a verdade a m étrica pode ter um efeito determ inan te sobre a con clusão da avaliação de perfor-m an ce. Eperfor-m [20 ] foi realizado uperfor-m estudo que verifica a interação das perfor-m étricas de perform an ce com a ZRUNORDG e os m étodos de escalon am en to, e percebeu-se que

estes fatores in teragem e podem distorcer o resultado da avaliação. Nosso interesse é detalhar cada tipo de m étrica a fim de conhecer suas características e procurar com preender com o as m étricas são capazes de favorecer um determ inado tipo de escalon ador ou ZRUNORDGe assim in fluenciar o resultado da avaliação de

perfor-m ance do supercoperfor-m putador paralelo.

7XUQDURXQGWLPHWWPpGLR

O WXUQDURXQGWLPH, tam bém conhecido com o tem po de resposta, é defin ido

1 2 3 8 9 10 11 12 Time P ro c e s s o rs B ' ( 1 6 5 4 2 3 & 5

(32)

m om ento em que toda a sua saída é produzida e o program a term ina. O WXUQ DURXQGWLPHé m uito bom para m edir a perform an ce de um a aplicação. No entan to,

querem os um a m étrica que represen te a perform an ce do sistem a, assim o WXUQ DURXQGWLPHm édio passa a ser um a escolha natural.

No entan to, quan do usam os m édia aritm ética, tem os que considerar as características desta estatística sum arizadora. A m édia aritm ética representa o “cen -tro de gravidade” de um con jun to de observações [17]: [_L

Q

[=1

∑

. A m édia

arit-m ética é a idéia que ocorre à arit-m aioria das pessoas quan do se fala earit-m “arit-m édia”, e pos-sui certas propriedades in teressantes e úteis que explicam porque é ela a m edida de tendência central m ais utilizada[52]:

• A m édia de um con jun to de n úm eros pode sem pre ser calculada.

• Para um dado con jun to de núm eros, a m édia é única.

• A m édia é sen sível a (ou afetada por) todos os valores do con jun to. As-sim , se um valor se m odifica, a m édia tam bém se m odifica.

Entretan to, a m édia possui ainda a característica de ser in fluenciada por va-lores extrem os. O problem a é usar a m édia quando a distribuição é m uito elástica. Vejam os um exem plo :

Q~PHURGH SURJUDPDV WW VHJXQGRV PpGLDDULWPpWL FD VHJXQGRV 10 0 1 1 99 1 1 20 0 0 20 .99 7DEHOD0pGLDDULWPpWLFDGRWXUQDURXQGWLPH

Com o vim os, os valores extrem os in fluen ciam bastante n esta m edida, e ape-n as um valor m ais alto pode elevar a m édia. (Neste caso a m oda - valor que m ais ocorre no con junto - represen taria m elhor os dados, porém só é possível chegar a esta conclusão porque conhecem os os dados).

3UREOHPDUHODFLRQDGRjSHUIRUPDQFH Se a distribuição dos dados

pa-ra avaliação do sistem a for m uito elástica, ou se n ão for conhecida, a perform ance calculada através desta m étrica pode estar distorcida [22].

(33)

6ORZGRZQPpGLR

O VORZGRZQ, tam bém con hecido com o fator de expan são, é o WXUQDURXQG WLPH n orm alizado pelo tem po de execução: V = WW / WH, on de WW é o WXUQDURXQGWLPH

e WH é o tem po de execução [23]. Lem bre que WW= WZ+ WH.

Assim , se o tem po de espera de um program a for igual ao seu tem po de exe-cução, ele sofrerá de um fator de expan são de 2.

WHPSRGHH[HFXomR WH WHPSRGHHVSHUD WZ VORZGRZQ V WZWHWH 20 m s 20 m s (20 + 20 )/ 20 = 2 7DEHOD&iOFXORGRVORZGRZQ

O VORZGRZQ é utilizado a fim de reduzir valores extrem os associados a

pro-gram as m uito lon gos. A idéia principal por trás do VORZGRZQ é que um program a

espere n a fila um tem po proporcional ao seu tem po de execução.

3UREOHPD UHODFLRQDGR j SHUIRUPDQFH O VORZGRZQ supervaloriza a

im portância dos program as m uito curtos. Veja a Tabela 3, por exem plo. Um pro-gram a que é executado duran te 10 0 m s e espera n a fila por 10 m inutos (60 0 .0 0 0 m s) possui um VORZGRZQ de 60 0 1. J á um program a que é executado por 10

segun-dos (10 .0 0 0 m s) e espera n a fila os m esm os 10 m inutos (60 0 .0 0 0 m s) possui um

VORZGRZQ de 61. Observa-se que, em sistem as n os quais o núm ero de

processado-res pode ser escolhido autom aticam ente pelo escalon ador através de algum as al-ternativas possíveis de UHTXHVWV, o próprio sistem a poderia m elhorar o seu VORZGRZQ escolhen do utilizar m en os processadores. Além disso, a utilização desta

m étrica pode en corajar o sistem a a fazer com que os program as tenham um tem po de execução m aior, para poder baixar o valor do VORZGRZQ.

WHPSRGHH[HFXomR WH WHPSRGHHVSHUD WZ VORZGRZQ V WZWHWH 10 0 m s 60 0 .0 0 0 m s (60 0 .0 0 0 + 10 0 )/ 10 0 = 60 0 1 10 .0 0 0 m s 60 0 .0 0 0 m s (60 0 .0 0 0 + 10 .0 0 0 ) / 10 .0 0 0 = 61 7DEHOD6ORZGRZQGHSURJUDPDVPXLWRFXUWRV

(34)

%RXQGHGVORZGRZQPpGLR

O ERXQGHG VORZGRZQ procura atenuar o VORZGRZQatravés da defin ição de

um lim ite para o tem po de execução, EV WW PD[WH

τ

A diferença é que, para program as m uito pequen os, o VORZGRZQ será lim itado pelo valor-lim ite

τ

escolhi-do, e não pelo tem po de execução. O com portam ento desta m étrica vai depender do valor de W[23]

.

3UREOHPD UHODFLRQDGR j SHUIRUPDQFH Apresen ta os m esm os

proble-m as que slowdown . Aléproble-m disso, coproble-m o estiproble-m ar o valor ideal de

τ

?

3HUSURFHVVRUERXQGHGVORZGRZQPpGLR

Percebeu-se que program as que fazem a m esm a quan tidade de processa-m ento e têprocessa-m o processa-m esprocessa-m o WXUQDURXQGWLPH podem ter VORZGRZQ diferentes, se

varia-rem a quantidade de processadores e o tem po, ou seja, se variavaria-rem a sua “form a”. Por exem plo, um program a que executa im ediatam ente em um ún ico pro-cessador por 10 0 segun dos tem um VORZGRZQ de 1, en quan to que um program a

que espera 90 segun dos n a fila e en tão é executado em 10 processadores por 10 segun dos tem um VORZGRZQ de 10 . Os dois program as têm o m esm o tem po de

pro-cessam en to total e o m esm o WW, m as os valores de VORZGRZQ são diferen tes. Esta

verificação levou a proposição de um a nova m étrica, den om in ada “SHUSURFHVVRU ERXQGHGVORZGRZQ” [53]:

SSVORZGRZQ WWQ PD[WHW_onde_Q_{é o n úm ero de processadores}

usado pelo program a. Ou seja, divide-se o valor original do ERXQGHG VORZGRZQ

pelo núm ero de processadores utilizados. No exem plo, o valor do SSVORZGRZQ

para o program a que usa 10 processadores é n orm alizado para 1, enquan to que o program a que usa só um processador fica com o SSVORZGRZQ tam bém de 1.

3UREOHPD UHODFLRQDGR j SHUIRUPDQFH Apresen ta os m esm os

(35)

0pGLDJHRPpWULFDGRWXUQDURXQGWLPH

A m édia geom étrica é defin ida por Q

Q

Q [ [

[ [

PHGJHRP

(

₁

,...,

)

=

₁

*

...

*

. Ela tem a característica de ser m en os in fluenciada por valores extrem os [9]. A idéia de usar a m édia geom étrica ao in vés da m édia aritm ética tem o objetivo de reduzir o efeito dos program as com tem po de execução m uito lon go. Por esta razão, a m édia geom étrica é usada para agregar o tem po de execução dos program as que com -põem o 6SHF%HQFKPDUN [51].

5HODomRFRPDDQiOLVHGHSHUIRUPDQFHA m édia geom étrica dos WXUQ DURXQGWLPHVé um a m étrica utilizada para represen tar o desem penho do escalon

a-dor. Tem a propriedade de refletir igualm en te um a m elhoria de perform ance em qualquer um dos program as que com põem a ZRUNORDG. Por exem plo: seja P a

per-form an ce de um a ZRUNORDG calculada através da m édia geom étrica

Q

[ [

3

=

₁

)

,...,

(

)

,...,

(

)

,...,

(

1 1 1 1 Q Q Q Q \ \ PHGJHRP [ [ PHGJHRP \ [ \ [ PHGJHRP

=

.

Com parando com a m édia aritm ética, a m édia geom étrica é m en os influen-ciada por valores extrem os. Com o tipicam ente as ZRUNORDGpossuem valores m uito

elásticos, o resultado da perform ance que envolve estas ZRUNORDGV sofrerá m en os

in fluên cia destes valores extrem os se calculado através da m édia geom étrica do que através da m édia aritm ética. Além disso, a m édia geom étrica reflete igualm ente um in crem en to (ou dim inuição) n a perform ance de qualquer um dos program as que com põem a ZRUNORDG.

(36)

3UREOHPDPodem os ter que

∑

[_L

<

∑

\_Le PHGJHRP

(

[_L

)

>

PHGJHRP

(

\_L

)

. O som atório dá um a noção intuitiva de perform ance, pois represen ta o total do tem po de processam en to. A relação acim a pode acon tecer se houver algum \_L m ui-to grande, por exem plo, pois a m édia geom étrica não é tão afetada por um ún ico valor quan to o som atório.

7KURXJKSXW

Podem os definir WKURXJKSXW com o a quantidade de tarefas executadas em

um certo período de tem po. Para sistem as paralelos, poderíam os pen sar com o a quantidade de program as processados em um certo período de tem po.

3UREOHPDEsta m étrica faz m ais sen tido para um sistem a RQOLQH fechado,

onde assum e-se que há um con jun to fixo de program as a serem processados. Para um sistem a RQOLQH aberto, on de novos program as chegam a todo m om ento, o W KURXJKSXW irá variar em fun ção das características dos program as que estão

che-gando. Isto é, dependendo das características da ZRUNORDG, o WKURXJKSXW poderá

variar con sideravelm ente.

8WLOL]DomR

Utilização representa a razão en tre a efetiva utilização do sistem a e a sua ca-pacidade total de processam en to.

3UREOHPDEm program as rígidos, a utilização é determ inada pela m an eira

que os program as estão chegan do para serem processados (DUULYDO UDWH, sen do

razoável representar o desem pen ho do sistem a em fun ção da utilização. J á para program as m oldáveis, m udar o tam an ho da partição provavelm en te irá alterar as características de execução do program a, afetando assim a utilização.

(37)

&DStWXOR,9

3HUIRUPDQFH5HODWLYD

Acreditam os que boa parte do problem a da in terferên cia da m étrica sobre o processo de avaliação de perform ance dos supercom putadores paralelos seja devi-do à n atureza sum arizadevi-dora das m étricas baseadas em estatísticas utilizadas até en tão. A sum arização oferecida por um a estatística perde m uita in form ação, um a vez que as distribuições dos WXUQDURXQGWLPHV são tipicam en te m uito elásticas n as ZRUNORDGVdos supercom putadores [36]0 . Propom os com o solução o uso da 3HU IRUPDQFH5HODWLYD, que se baseia em toda a distribuição dos WXUQDURXQGWLPHV

obtidos pelos escalonadores avaliados.

A análise de perform an ce baseada em Perform an ce Relativa parece sofrer m enos in terferência da ZRUNORDG do que as m étricas baseadas em estatísticas

su-m arizadoras, usu-m a vez que seu resultado inclui a análise de toda a distribuição e não usa sum arização dos dados. Possibilita tam bém um a boa visualização gráfica com -parativa dos resultados.

'HILQLomR

A perform an ce relativa tom a com o base a relação en tre os dois valores de

WXUQDURXQGWLPHobtidos para um m esm o program a através das duas alternativas

de escalonam en to que se deseja com parar. A m etodologia utilizada é a seguin te:

• Defin e-se quais escalonadores (ou supercom putadores) deseja-se com pa-rar, dois a dois (cham em os de D e E);

• Tom a-se um a determ inada ZRUNORDGde tam an ho Pa ser subm etida aos

dois escalon adores De E;

• Registra-se o WXUQDURXQG WLPHde cada program a obtido em cada

esca-lonador (WW eWW );

• Calcula-se a razão en tre os Ppares dos WXUQDURXQGWLPHV, (WW /WW );

• Finalm en te, calcula-se a distribuição acum ulada de freqüên cia das razões obtidas, a fim de obter a represen tação gráfica.

(38)

A Figura 10 m ostra um exem plo de Perform an ce Relativa. Para cada razão Linterpreta-se o resultado da seguin te m aneira:

• Se WW WW , o program a obteve o m esm o WXUQDURXQGWLPH n os dois

escalonadores;

• Se WW WW o program a obteve m elhor WXUQDURXQG WLPH n o

escalo-n ador D;

• Se WW WW ! o program a obteve m elhor WXUQDURXQG WLPH n o

escalo-n ador E.

)LJXUD±([HPSORGH3HUIRUPDQFH5HODWLYD

Através da Figura 10 percebem os que aproxim adam en te 65% dos program as obtiveram o m esm o valor de WXUQDURXQGWLPH n os dois escalon adores; o escalon

a-dor D foi m elhor em aproxim adam en te 11% dos WXUQDURXQGWLPHV e o escalon ador E foi m elhor em aproxim adam en te 24% dos WXUQDURXQGWLPHV. Mais ain da, a

par-tir do gráfico é possível avaliar o im pacto que os escalon adores De E tiveram sobre

os program as que beneficiaram . Por exem plo, algun s program as chegaram a con-cluir em tem po 32.0 0 0 vezes m enor quando usan do o escalon ador D. Por outro

la-do, o escalon ador E con cluiu algun s program as em tem po 1.0 0 0 .0 0 0 de vezes m

e-nor que o escalonador D.

O uso desta m étrica é interessante porque analisa toda a distribuição da

ZRUNORDG, ao con trário das m étricas baseadas em estatísticas. Assim , as

caracterís-ticas da ZRUNORDG, tais com o ser dom in ada por program as m uito lon gos ou ainda

possuir valores extrem os que afetem a m édia aritm ética dos WXUQDURXQGWLPHV n ão

1/32768 1/1024 1/32 1 32 1024 32768 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 C D F Performance relativa - tta / ttb

(39)

in terferem no resultado desta m étrica, um a vez que a com paração é feita program a a program a.

Este m ecan ism o de avaliação perm ite que se conheça exatam ente em quanto um algoritm o de escalon am en to foi m ais eficiente do que outro para um a ZRUNOR DG, além de perm itir iden tificar para quais program as. A partir destas inform ações

é possível isolar o con junto de program as on de cada algoritm o foi m elhor, a fim de iden tificar e estudar suas características, com o verem os adiante no estudo de caso.

Com o desvan tagem , podem os citar que para com parar m ais de dois escalo-nadores é n ecessário fazê-lo dois a dois, obten do sem pre a relação de um WXUQ DURXQGWLPH para com outro.

(DV\u&RQVHUYDWLYH%DFNILOOLQJ

Nosso estudo de caso in vestiga o con trovertido problem a (DV\EDFNILOOLQJ× &RQVHUYDWLYH EDFNILOOLQJ[25] [42].Os artigos [25] e [42] analisam a perform an ce

de com putadores IBM SP2 utilizan do am bas as form as de %DFNILOOLQJ: (DV\ e &RQVHUYDWLYH. No artigo [25] con clui-se que a perform ance dos dois algoritm os é

sim ilar, sendo que &RQVHUYDWLYHpossui a vantagem da previsibilidade. Em [42],

chega-se à conclusão que, de form a geral, as ZRUNORDGVproven ientes dos com

puta-dores SP2 favorecem o (DV\ EDFNILOOLQJ.Porém em algum as m étricas o resultado

parece se inverter. Fica n o ar, portan to, a pergun ta: Qual m étrica vale de fato? Estes resultados con trovertidos e in conclusivos hoje conhecidos nos m otiva-ram a utilizar esta nova m an eira de com parar desem pen ho, Perform ance Relativa, a fim de avaliarm os o m esm o problem a.

Realizam os a sim ulação dos m étodos de escalonam ento &RQVHUYDWLYH EDFNILOOLQJ e (DV\ EDFNILOOLQJ a fim de efetuar o processo de avaliação de

perfor-m an ce destes algoritperfor-m os através de alguperfor-m as perfor-m étricas con hecidas e taperfor-m béperfor-m da Per-form an ce Relativa. Foram usados três ORJV de ZRUNORDGVprovenien tes de

diferen-tes cen tros de supercom putação disponíveis n a ZHE[31] [44] e ain da um a quarta ZRUNORDG sin tética obtida através de um m odelo de carga [10 ].