• Nenhum resultado encontrado

Avalia¸c˜ao de Desempenho

N/A
N/A
Protected

Academic year: 2022

Share "Avalia¸c˜ao de Desempenho"

Copied!
24
0
0

Texto

(1)

Avalia¸c˜ ao de Desempenho

September 28, 2010

(2)

O que ´ e desempenho?

em primeiro lugar, uma ´otima tradu¸c˜ao paraperformance...

:-)

tempo de execu¸c˜ao (o centro das aten¸c˜oes!) outras: projeto, ciclo de vida, manuten¸c˜ao, ...

mesmo outras medidas de execu¸c˜ao podem ser importantes:

utiliza¸ao de mem´oria throughput

uso da rede

(3)

Como estudar desempenho?

lei de Amdahl

se programa tem fra¸c˜ao 1/s inerentemente sequencial, a maior acelera¸ao que conseguiremos ´e des

relevante quando se paraleliza programas j´a existentes extrapola¸c˜ao a partir de observa¸c˜oes

“implementamos o algoritmo na m´aquina X e obtivemos uma acelera¸ao de 10.8 em 10 processadores”

(4)

Como estudar desempenho? (cont)

an´alise assint´otica

an´alise mostra que o tempo ser´a O(n log n)

mas o que est´a acontecendo nos casos que realmente nos interessam?

(5)

Como estudar desempenho? (cont)

modelos de desempenho experimentos

simula¸c˜ao

(6)

Modelos de desempenho

objetivo: explicar dados observados e prever comportamento em circunstˆancias futuras

necessidade de abstrair detalhes menos importantes previs˜ao do tempo de execu¸c˜ao:

T =f(N,P,U, ...)

N: tamanho do problema P: n´umero de processadores U: n´umero de tarefas ... outras caracter´ısticas

(7)

Defini¸c˜ oes

tempo de execu¸c˜ao: tempo decorrido do momento em que o primeiro processador come¸ca a executar uma tarefa da aplica¸c˜ao at´e o momento em que o ´ultimo processador para de executa.

podemos olhar o tempo em cada processador:

T =Tcompj +Tcommj +Tidlej

ou o tempo total:

T = (Tcomp+Tcomm+Tidle)/P

(8)

Reduzindo complexidade

desenvolver uma express˜ao matem´atica para descrever T ´e uma tarefa complexa...

m´aquina ideal

sem preocupa¸c˜ao com topologia da rede, hierarquia de mem´oria, etc

an´alise em escala

tentativa de identificar fatores insignificantes an´alise emp´ırica

calibragem de modelo com experimentos

(9)

Tempo de computa¸c˜ ao

especifica¸c˜oes: flops (n´umero de opera¸c˜oes de ponto flutuante por segundo)

[wikipedia] As of 2010, the fastest PC processors six-core has a theoretical peak performance of 107.55 GFLOPS (Intel Core i7 980 XE) in double precision calculations. GPUs are considerably more powerful, for example, Nvidia Tesla C1060 GPU computing card performs around 933 GFLOPS in single precision calculations while AMD’s HemlockXT 5970 reaches 4.64 TFLOPS. ...

possibilidade de medir partes em programa sequencial implementa¸c˜ao dekernels para medidas

cuidados com altera¸c˜oes devidas a mem´oria, etc

(10)

Tempo de comunica¸c˜ ao

diferen¸ca intra e inter-processador tempo idealizado:

Tmsg =tstartup+ttwordL

experimentos espec´ıficos podem determinar esses tempos

(11)

eficiˆ encia e acelera¸c˜ ao

acelera¸c˜ao (speedup) – ganho com P processadores Arelativa= TT1

P

eficiˆencia (efficiency) – utiliza¸c˜ao de cada processador Erelativa = PTT1

P

acelera¸c˜ao e eficiˆencia absolutas

tempo do melhor algoritmos sequencial

(12)

Anomalias em acelera¸c˜ ao

acelera¸c˜ao anˆomala ou super linear motivos:

cache, mem´oria virtual

irregularidade das estruturas do problema

(13)

Escalabilidade

algoritmo pode ser adaptado?

como reage a crescimento de N?

como reage a crescimento de P?

como reage a altera¸c˜oes em tstartup ettword?

(14)

Escalabilidade com N fixo

qual o maior n´umero de processadores que podem ser usados produtivamente?

(15)

Escalabilidade com N crescendo

qual o maior n´umero de processadores que podem ser usados produtivamente?

conceito deisoeficiˆencia:

como a quantidade de computa¸ao tem que crescer, quando P cresce, para manter a eficiˆencia constante?

Erelativa=PTT1

P =T T1

comp+Tcomm+Tidle

T1=E(Tcomp+Tcomm+Tidle)

(16)

Estudo experimental

abordagem iterativa

1 experimentos para encontrar parˆametros (tstartup, etc)

2 an´alise te´orica

3 implementa¸ao

4 experimentos para confimar previs˜oes de an´alise

(17)

Projeto de experimentos

´

area com suas pr´oprias quest˜oes e literatura

twelve ways to fool the masses when giving performance results on parallel computers (David Bailey)

levantamento do que queremos obter...

reprodu¸c˜ao de experimentos j´a realizados por outros grupos

(18)

Projeto sistem´ atico de experimentos

defini¸c˜ao precisa de objetivos (fronteiras) sele¸c˜ao de m´etricas

enumera¸c˜ao de parˆametros que afetam o desempenho todos os parˆametros que podem afetar o desempenho sele¸c˜ao de fatores para estudo

sele¸c˜ao de carga de trabalho sele¸c˜ao de m´etricas

projetos dos experimentos

an´alise e interpreta¸c˜ao de resultados

(19)

M´ etricas

velocidade

tempo de resposta throughput

recursos consumidos confiabilidade

tempo entre falhas disponibilidade

fra¸ao do tempo em que sistema est´a dispon´ıvel outros que n˜ao sabemos como medir...

usabilidade flexibilidade ...

(20)

Cargas de Trabalho

hist´oricas X sint´eticas

n´ıvel (aplica¸c˜ao, sistema operacional, CPU)

representatividade (rela¸c˜ao da carga sint´etica com a carga real...)

taxa de chegada de pedidos demanda de recursos perfil de utiliza¸c˜ao

(21)

Erros comuns em an´ alise de desempenho

objetivos preconceituosos abordagem n˜ao sistem´atica n´ıvel de detalhe inadequado parˆametros importantes ignorados cargas n˜ao representativas

...

(22)

experimentos – dificuldades

algoritmos n˜ao determin´ısticos precis˜ao do timer

loops de repeti¸c˜ao e m´edias custos de inicializa¸c˜ao e termina¸c˜ao interferˆencia de outros programas interferˆencia entre experimentos

executar em diferentes ordens pode explicitar interferˆencia aloca¸c˜ao de recursos aleat´oria

(23)

Avalia¸c˜ ao – motivos para surpresas

desbalanceamentos de carga computa¸c˜ao replicada

algoritmo e ferramenta que n˜ao combinam competi¸c˜ao por banda passante

(24)

Referˆ encias

Foster (DBPP): cap´ıtulo 3 (ler)

David Bailey. Twelve ways to fool the masses when giving performance results on parallel computers. Supercomputing Review, Aug. 1991, pg. 54–55.

R. Jain. The Art of Computer Systems Performance Analysis.

Wiley, 1991.

Referências

Documentos relacionados

A avaliação pré RP era composta de teste de função pulmonar, gasometria arterial, índice de massa corporal (IMC), também foi aplicado o questionário SGRQ, medição

A hip´ otese ´ e que grupos de tarefas que possuem o mesmo consumo de recurso computacio- nal podem receber a mesma configura¸c˜ ao de parˆ ametros de desempenho, ent˜ ao, atrav´ es

Instrumentos operacionais de política CETI utilizados para promover a inovação em diferentes estágios. Fuente:

ESTADO DE SÃO PAULO – FEEESP entidade sindical de 2º grau e o SINDICATO DOS ESTABELECIMENTOS DE ENSINO NO ESTADO DE SÃO PAULO - SIEEESP, entidade sindical de 1º grau,

Nas instalações do Posto de Turismo pode obter informações acerca dos recursos turísticos existentes no concelho e na Região Oeste, bem como dos diversos restaurantes e unidades

476, de 16 de janeiro de 2009, conforme alterada (“Instrução CVM 476” e “Oferta”), em regime de garantia firme de colocação para o Valor Total da Emissão, de forma individual

A principal forma de avaliar os fios multifilamentos con- tínuos é mediante o ensaio de tração, que deve ser realizado em equipamento próprio para ensaio de fios têxteis, o qual

3259 21 Animação e dinamização de actividades lúdico-expressivas - expressão musical 50 3260 22 Animação e dinamização de actividades lúdico-expressivas -