• Nenhum resultado encontrado

1 I NTRODUÇÃO

4.2 PREMISSAS E RESTRIÇÕES

5.1.1 REDES COM 16 NODOS

5.1.1.1 Tráfego Uniforme

No padrão de tráfego Uniforme, as topologias experimentadas foram: Malha 2D, Toroide 2D, Malha 3D, Barramento e Crossbar. Todos os roteamentos utilizados são de caminho mínimo. As topologias Anel e Anel Cordal apresentaram deadlock com algoritmos de roteamento de caminho mínimo, portanto não foram avaliadas nesse cenário. Os gráficos que ilustram os resultados dos experimentos das topologias com 16 elementos sob tráfego uniforme são apresentados na Figura 28. Para simplificar, das topologias em anel, apenas a Anel Cordal foi utilizada nos comparativos.

Do experimento, como já esperado, o Barramento foi o caso de pior desempenho, devido à grande concorrência pelo único recurso da arquitetura. O Toroide 2D foi a topologia que apresentou a taxa mais alta de tráfego aceito (vazão). Porém, a Malha 3D teve desempenho superior em relação à latência média e apresentou menor dispersão (jitter – flutuação da latência) em relação às demais. Próximo ao ponto de saturação (30 MHz), o tráfego aceito da Malha 3D também foi superior ao aceito pelo Toróide 2D. Os resultados numéricos são discutidos em uma sub-seção de análise ao final dos experimentos e detalhados no APÊNDICE E.

(a) (b)

(c) (d)

(e)

Figura 28. Resultados do experimento de topologias com 16 elementos sob tráfego uniforme: (a) Latência Média x Tráfego Oferecido; (b) Latência Média x Tráfego Oferecido (s/

barramento); (c) Tráfego Aceito x Tráfego Oferecido; (d) Latência Média x Frequência de Operação (s/ barramento); (e) Distribuição de latências próximo ao ponto de saturação da rede (30 MHz – s/ barramento)

A vazão mais alta no Toróide 2D é devido à sua simetria, tanto na ortogonalidade da rede quanto na disposição dos enlaces no dimensionamento utilizado (4x4). Por esse motivo, essa topologia apresentou melhor distribuição de carga pela rede. Destaca-se que, em relação à Malha 2D, a melhoria foi significativa devido aos enlaces adicionais nas bordas e cantos. Dessa forma, o caminho mínimo mais longo é de cinco roteadores (Hop Count Máximo: 5), enquanto na Malha 3D o Hop

Count Máximo é de 6 roteadores e na 2D é de 7 roteadores.

Em relação ao Crossbar, tanto a Toróide 2D quanto a Malha 3D apresentaram maior tráfego aceito, devido à melhor distribuição de carga pela rede. Em relação ao jitter, que foi verificado próximo ao ponto de saturação (30 MHz), a Malha 3D apresentou menor dispersão, ou seja, oferece maior regularidade na entrega dos pacotes em relação à latência. O Toroide 2D apresentou dispersão semelhante ao Crossbar, porém, com maior número de pacotes entregues com latência baixa.

5.1.1.2 Tráfego Bit-Reversal

As topologias avaliadas no cenário Bit-reversal foram: Anel Cordal, Barramento, Crossbar, Malha 2D, Malha 3D e Toróide 2D. Os gráficos que ilustram os resultados neste cenário de tráfego com 16 elementos são apresentados na Figura 29.

Do experimento, assim como no tráfego Uniforme, o barramento foi o caso de pior desempenho, pelo mesmo motivo, à concorrência pelo recurso exclusivo. Os resultados do barramento foram omitidos para melhor ilustrar os demais, uma vez que operou saturado nas frequências analisadas. O Crossbar apresentou o maior tráfego aceito (vazão) e a menor latência média, ou seja, foi superior às demais arquiteturas em ambas as métricas.

No tráfego Bit-reversal os fluxos por nodo são exclusivos, pois cada fonte gera pacotes para apenas um destino. Isso justifica o fato de o Crossbar ter apresentado melhor desempenho. Nessa arquitetura, cada nodo possui uma ligação direta com todos os demais nodos na rede. Também não há fluxos de diferentes fontes para um mesmo destino, ou seja, não há concorrência entre diferentes fluxos.

(a) (b)

(c) (d)

(e)

Figura 29. Resultados do experimento de topologias com 16 elementos sob tráfego bit-

reversal: (a) Latência Média x Tráfego Oferecido (s/ anel cordal); (b) Latência Média x

Tráfego Oferecido; (c) Tráfego Aceito x Tráfego Oferecido; (d) Latência Média x Frequência de Operação; (e) Distribuição de latências próximo ao ponto de saturação da rede

As topologias Anel Cordal e Toroide 2D apresentaram desempenho superior às Malhas 2D e 3D. Isso porque o número médio de saltos na distribuição Bit-reversal é menor na Anel Cordal e

Toroide 2D. Na Anel Cordal, o enlace cruzado faz com que a distância até o destino seja pequena. No Toroide 2D, os enlaces nas extremidades fazem com que os fluxos mais distantes para a Malhas sejam menores nessa topologia. Os fluxos mais distantes nas Malhas são os entre as extremidades: esquerda-superior e direita-inferior (2D); e esquerda-superior-cima (X-Y-Z) e direita-inferior-baixo (3D). Nesses fluxos, o Hop Count é de 7, 6, 3 e 3 roteadores nas topologias Malha 2D, Malha 3D, Anel Cordal e Toroide 2D, respectivamente.

Destaca-se que, o Crossbar tem a capacidade de operar em uma frequência de operação mais baixa em relação às demais, o que é uma vantagem dado que quanto menor a frequência, menor é o consumo de energia (análise que não é parte deste estudo). Do mesmo modo, o Anel Cordal e o Toroide 2D são capazes de operar em frequência mais baixa sem saturar, comparadas às topologias em Malha.

Quanto as dispersões das latências, foram ilustrados os gráficos nos pontos mais próximos a rede saturada, porém, as frequências são diferentes para cada caso. Nas topologias em Malha, a frequência foi a mesma, todavia, enquanto apresentam maior quantidade de pacotes entregues com baixa latência, elas sofrem maior dispersão, com pacotes experimentando latências muito altas. As topologias Toróide 2D, Anel Cordal e o Crossbar apresentaram semelhança na dispersão, porém enquanto as duas primeiras operam a 30 MHz a terceira opera a 10 MHz.

5.1.1.3 Tráfego Perfect Shuffle

As topologias avaliadas no cenário Perfect shuffle foram as mesmas que no Bit-reversal. Os gráficos que ilustram os resultados neste padrão de tráfego com 16 elementos são apresentados na Figura 30. Do mesmo modo que no Bit-reversal, essa distribuição gera fluxos exclusivos. Também como na distribuição anterior, os resultados do Barramento são omitidos para melhor ilustrar os demais, tendo em vista que o Barramento opera saturado nas frequências experimentadas.

A topologia Anel Cordal foi a que apresentou pior desempenho, menor vazão e maior latência média. Isso ocorre porque diferentes fluxos (par origem – destino) do Perfect Shuffle competem pelos mesmos enlaces do anel, o que gera contenções em pontos da rede. A Malha 2D foi inferior às demais topologias, pelo mesmo motivo que no Anel Cordal, alguns caminhos são utilizados por múltiplos fluxos.

(a) (b)

(c) (d)

(e)

Figura 30. Resultados do experimento de topologias com 16 elementos sob tráfego perfect

shuffle: (a) Latência Média x Tráfego Oferecido; (b) Latência Média x Frequência de

operação; (c) Tráfego Aceito x Tráfego Oferecido; (d) Distribuição de latências próximo ao ponto de saturação da rede; (e) Jitter do Toroide 2D e Malha 3D sob operação normal

O Crossbar foi o caso de melhor desempenho, porém apresentou diferença mínima em relação ao Toroide 2D e à Malha 3D. Essas duas últimas apresentaram o mesmo desempenho sob este cenário de tráfego. Isso, porque o maior salto na Malha 3D é menor que no Toroide 2D, entretanto, mais

pacotes com o menor número de saltos são entregues no Toroide 2D, o que gera o equilíbrio de desempenho nesse caso.

Quanto à dispersão na frequência de operação anterior ao ponto de saturação, o Anel Cordal entrega uma grande quantidade de pacotes com baixa latência. Contudo, essa topologia apresenta o maior espalhamento nas latências experimentadas pelos pacotes, além de ser a rede em que a saturação ocorre em frequência de operação mais alta em relação às demais, ou seja, é pior. Na Malha 2D, um fenômeno semelhante ocorre, mas a dispersão é menor e a frequência na saturação também. As demais topologias apresentam comportamento equivalente sob frequência de operação baixa (10 MHz).

5.1.1.4 Tráfego Butterfly

Dos padrões de tráfego utilizados, o Butterfly é o mais singular, pois possui apenas quatro pares de nodos comunicantes. As topologias avaliadas neste cenário são as mesmas utilizadas nos anteriores. O Barramento, pior caso de desempenho, não é ilustrado. Os gráficos do comparativo de topologias sob tráfego Butterfly são apresentados na Figura 31.

O Crossbar apresentou o melhor resultado pois, conforme mencionado, o número de saltos é mínimo (um roteador) e não há disputa por recursos. Porém, as topologias Anel Cordal e Malha 3D apresentaram o mesmo comportamento entre si, o qual foi muito próximo ao do Crossbar. Isso, porque essas topologias não sofrem concorrência entre fluxos em nenhum recurso da rede e o Hop

Count é fixo de três roteadores para todos os fluxos.

Na Malha 2D e no Toroide 2D, o comportamento é idêntico, pois os caminhos de todos os fluxos são os mesmos. Nessas topologias, o Hop Count também é fixo, só que de quatro roteadores, um a mais do que na Anel Cordal e Malha 3D. Além disso, também há concorrência de enlaces entre diferentes fluxos de comunicação, o que justifica o não aumento na vazão após a saturação.

(a) (b)

(c) (d)

Figura 31. Resultados do experimento de topologias com 16 elementos sob tráfego butterfly: (a) Latência Média x Tráfego Oferecido; (b) Latência Média x Frequência de operação; (c) Tráfego Aceito x Tráfego Oferecido; (d) Distribuição de latências

5.1.1.5 Tráfego Transposto

No tráfego Transposto, as topologias avaliadas foram as mesmas que nos demais experimentos. Assim como nos outros casos, o Barramento apresentou os piores resultados e o Crossbar os melhores. Na Figura 32, os resultados dos experimentos são ilustrados.

Nas demais topologias, o Toroide 2D foi superior. Isso ocorre pelo menor número médio de saltos na rede e menor concorrência entre fluxos. O Anel Cordal apesar de possuir a mesma média de saltos da Malha 2D, possui menor concorrência entre os fluxos. A Malha 2D possui menor número de saltos médio que a Malha 3D e sofre menor concorrência entre fluxos.

(a) (b)

(c) (d)

Figura 32. Resultados do experimento de topologias com 16 elementos sob tráfego transposto: (a) Latência Média x Tráfego Oferecido; (b) Latência Média x Frequência de operação; (c) Tráfego Aceito x Tráfego Oferecido; (d) Distribuição de latências

Em relação às dispersões de latência próximo ao ponto de saturação, o Crossbar não apresentou dispersão pois todos os pacotes são entregues com latência mínima. As Malhas 2D e 3D apresentaram dispersão semelhante. O mesmo ocorre entre o Toroide 2D e o Anel Cordal, exceto que na primeira há uma grande quantidade de pacotes entregues com latência baixa, enquanto na segunda, a dispersão é maior e há uma regularidade no número de pacotes entregues com diferentes latências.

5.1.1.6 Tráfego Complemento

O padrão de tráfego Complemento é o que melhor explora a bisseção da rede. As topologias avaliadas foram as mesmas que nos experimentos anteriores e os resultados são mostrados na Figura

33. O Crossbar apresentou melhor desempenho, porém o Toroide 2D obteve comportamento semelhante. Isso, porque o número de saltos é o mesmo para todos os fluxos, além disso, não há concorrência entre os fluxos.

(a) (b)

(c) (d)

Figura 33. Resultados do experimento de topologias com 16 elementos sob tráfego complemento: (a) Latência Média x Tráfego Oferecido; (b) Latência Média x Frequência de operação;

(c) Tráfego Aceito x Tráfego Oferecido; (d) Distribuição de latências

As topologias Anel Cordal e as Malhas 2D e 3D apresentaram desempenho equivalente entre si, pois o número médio de saltos é o mesmo no complemento e a concorrência entre os fluxos também.

No Crossbar e no Toroide 2D, não houve dispersão de latências no ponto próximo à saturação, pois todos os pacotes foram entregues com a latência mínima. Nas demais, a dispersão foi semelhante,

dado que, nesse cenário, essas topologias apresentam comportamento equivalente, mesmo número de saltos médio e concorrência entre fluxos.

5.1.1.7 Análise

Dos padrões de tráfego experimentados, apenas no cenário uniforme cada nodo fonte encaminha pacotes para múltiplos destinos. Nos demais, cada origem gera pacotes apenas para um determinado destino. A distribuição Uniforme (também referida como aleatória) é a mais utilizada nos experimentos relatados na literatura, conforme exposto no capítulo do Estado da Arte. Essa distribuição têm a característica de distribuir a carga por toda a rede. As demais distribuições são baseadas em padrões de permutação usualmente utilizados em algoritmos numéricos de processamento paralelo (ex. Transformada de Fourier). A utilização dos enlaces da rede não é uniforme nesses padrões, contudo, essas distribuições atingem um grau máximo de localidade temporal (DUATO; YALAMANCHILI; NI, 2003, p. 481). Destaca-se que não foi adotado o padrão de tráfego não uniforme porque esse explora a localidade da comunicação na rede e essa localidade seria diferente para cada topologia. Ou seja, seriam geradas distribuições espaciais com uma quantidade diferente de fluxos de comunicação em cada topologia.

Em todos os casos, o Barramento apresentou o pior caso de desempenho. Esse resultado já era esperado, pois, essa estrutura conta com um recurso único que é compartilhado por todas as portas de comunicação. A exemplo do tráfego Uniforme, enquanto as demais topologias operam com latência aceitável e sem saturar acerca de 40 MHz, o Barramento somente opera sob condições normais (não saturado) acima de 400 MHz.

Em todas as distribuições baseadas em permutação, o Crossbar apresentou melhor desempenho, o que também era esperado, pois cada nodo nessa arquitetura possui ligação com todos os demais. Sendo assim, cada origem de tráfego possui um canal exclusivo de comunicação com seu destino, o que não gera nenhum tipo de concorrência entre diferentes fontes de pacotes.

Entretanto, sob tráfego Uniforme, o Crossbar não foi a arquitetura de melhor desempenho, tendo em vista que seu tráfego aceito foi menor que nas topologias Toroide 2D e Malha 3D. Do mesmo modo, essas duas topologias apresentaram menor latência média operando em frequência de operação baixas, próximas ao ponto de saturação (30 MHz). Embora em frequências mais altas, a

latência média tenha sido menor no Crossbar, em alguns casos, é preferível que a rede opere sob frequência de operação mais baixa, pois dessa forma, o consumo de energia é menor.

O Crossbar apresentou menor desempenho em relação às redes Toroide 2D e Malha 3D devido ao maior número de pacotes requisitando as mesmas portas de saída, ou seja, o árbitro opera com um maior número de requisições e concessões. Já no Toroide 2D e na Malha 3D, o roteador possuirá no máximo cinco portas nos arranjos utilizados com 16 nodos e, portanto, o árbitro opera com no máximo cinco requisições e concessões. Por consequência, após o tráfego estar distribuído pela rede, no Toroide 2D e na Malha 3D, em cada roteador, a concorrência é menor entre os pacotes. Dessa forma, os roteadores são capazes de extrair mais pacotes de diferentes fontes em menor tempo, enquanto nessas mesmas fontes, outros pacotes são encaminhados, os quais também enfrentam menor concorrência em cada roteador, o que diminui a contenção. O Quadro 15 ilustra os resultados dos experimentos sob tráfego uniforme operando a 30 MHz, frequência mais próxima do ponto de saturação.

Experimentos de topologias com 16 nodos a 30 MHz sob tráfego Uniforme

Topologia Mecanismos de comunicação Métricas

Tipo Dimen. Rot. Arb. C.F. Mem. Chav. Lat. Méd. (ciclos) Vazão Jitter*

Malha 2D 4x4 XY RR BC FIFO s/ CV WH 3123,2 0,2790 2468,9

Malha 3D 4x2x2 XYZ RR BC FIFO s/ CV WH 267,0 0,2978 349,2

Toroide 2D 4x4 DOR RR BC FIFO s/ CV WH 642,6 0,2947 734,8

Barramento 16 nodos - RR BC FIFO s/ CV WH 376253,0 0,0312 93102

Crossbar 16 nodos Direto RR BC FIFO s/ CV WH 839,8 0,2945 749,5

Onde: * Estimado pelo desvio padrão da latência média Dimen.: Dimensão Rot.: Roteamento Arb.: Arbitragem C.F.: Controle de Fluxo Mem.: Memorização Chav.: Chaveamento Lat. Méd.: Latência Média

DOR: Dimension Order (ordenado por dimensão – XY no Toroide) RR: Round-Robin

BC: Baseado em Créditos CV: Canais Virtuais WH: Wormhole

Do quadro, é possível ressaltar que a Malha 3D apresentou menor latência média e menor desvio padrão (indicado como jitter). Pelo desvio padrão da latência média, é possível inferir sobre a dispersão das latências. Um desvio padrão menor significa que as latências experimentadas são mais próximas da média, ou seja, menor variabilidade ou flutuação. A vazão é apresentada com os valores normalizados, ou seja, na Malha 3D, a vazão foi de 29,78% da capacidade da rede, a mais alta nessas condições.

Ao considerar o caso supracitado, para responder as perguntas de pesquisa desta dissertação, é necessário indicar e quantificar o quão uma arquitetura é melhor à outra em cada métrica. Em vista

disso, a relação de desempenho das arquiteturas, do caso acima, é apresentada no Quadro 16. Nesse quadro, o dado de cada célula indica quão melhor a topologia identificada na linha é em relação à da coluna. Os valores são truncados em uma casa decimal, exceto em casos que a diferença é mínima e deve ser exibida para manter a coerência da avaliação entre as arquiteturas. Essa abordagem é seguida até o final dos experimentos. Para não mostrar a relação de quão pior uma arquitetura é em relação a outra e facilitar a visualização do quadro, em tal situação o campo é marcado com “-x-”.

Para a latência média e jitter, o resultado exposto representa quantas vezes menor é a latência média e a dispersão de uma arquitetura em relação à outra. Por exemplo, o Crossbar obteve uma latência média de 839,8 ciclos, enquanto a Malha 2D obteve uma latência de 3.123,2 ciclos. Dessa forma, no quadro, é apresentada a relação 3.123,2/839,8 = 3,7, o qual expressa que o desempenho do Crossbar é 3,7 vezes melhor que o da Malha 2D com relação à latência. De forma similar, o jitter do Crossbar é 3,2 (= 2.468,9/749,5) vezes melhor (ou seja, menor) que o da Malha 2D. Por outro lado, para o tráfego aceito (vazão), o resultado indica o percentual adicional de capacidade máxima de tráfego de uma alternativa em relação à outra. Por exemplo, para as mesmas topologias ilustradas previamente, o quadro mostra que o Crossbar aceita 1,55% = (0,2945 – 0,2790)x100 a mais de tráfego que a Malha 2D. Por fim, ressalta-se que as células sombreadas do quadro indicam qual é a melhor arquitetura em cada métrica. A Malha 3D foi a que obteve os melhores resultados em ambas as métricas (latência média e jitter menores e tráfego aceito maior).

Relação de desempenho das topologias com 16 nodos à 30 MHz sob tráfego Uniforme

Topologias Barramento Malha 2D Malha 3D Toroide 2D Crossbar Métrica

Barramento -x- -x- -x- -x- Latência Média Malha 2D 120,4 -x- -x- -x- Malha 3D 1.409,1 11,6 2,4 3,1 Toroide 2D 585,5 4,8 -x- 1,3 Crossbar 448,0 3,7 -x- -x- Barramento -x- -x- -x- -x- Tráfego Aceito Malha 2D 24,78 -x- -x- -x- Malha 3D 26,60 1,88 0,32 0,33 Toroide 2D 26,35 1,57 -x- 0,02 Crossbar 23,33 1,55 -x- -x- Barramento -x- -x- -x- -x- Jitter Malha 2D 37,7 -x- -x- -x- Malha 3D 266,6 7,0 2,1 2,1 Toroide 2D 126,7 3,3 -x- 1,02 Crossbar 124,2 3,2 -x- -x-

Considerando que nos padrões de permutação, o Barramento apresentou o pior desempenho e o Crossbar o melhor, pelos motivos já explanados, somente as outras arquiteturas serão comentadas na sequência. Os quadros com os resultados de todos os experimentos estão disponíveis no APÊNDICE E.

Nos padrões de tráfego Bit-reversal, Butterfly, Transposto e Complemento, a topologia Anel Cordal apresentou regularidade em relação à latência média a 40 MHz. Isso ocorreu devido à característica das distribuições dos destinos nesses cenários, os quais apresentam alta localidade espacial, o que faz com que o número médio de saltos seja pequeno. A topologia Toroide 2D apresenta a mesma regularidade sob a mesma frequência de operação nos mesmos cenários. Ainda sobre o Toroide 2D, no tráfego Complemento, o número de saltos é fixo de três roteadores (fonte, intermediário e destino) e a latência é mínima para todos os fluxos, pois o roteamento é de caminho mínimo e não há concorrência entre fluxos.

No controle de fluxo baseado em créditos, a latência mínima pode ser calculada conforme a Equação 1, a qual foi apresentada em trabalho anterior do autor (SILVA, 2014). Sendo assim, no tráfego Complemento, a latência mínima de 13 ciclos pode ser verificada aplicando a equação. Isso, porque o número saltos de todos os fluxos é fixo de 3 roteadores e 4 enlaces. Os enlaces entre os nodos e a rede também devem ser considerados (Nodo Fonte -[1]- Roteador Fonte -[2]- Roteador Intermediário -[3]- Roteador Destino -[4]- Nodo Destino). Restando apenas a informação do tamanho do pacote, incluindo o cabeçalho, que é de 4 flits para todos os experimentos realizados. Aplicando (1), têm-se: tCredit = 3 * 4 + 4 - 3 = 13 ciclos.

tCredit = 3 * D + N - 3 (1)

Onde: D = Número de enlaces, incluindo entre os nodos N = Número de flits do pacote, incluindo o cabeçalho

O Quadro 17 apresenta a relação de desempenho das topologias com 16 nodos sob tráfego Bit-reversal. Os demais quadros apresentam os resultados para os tráfegos Perfect Shuffle (Quadro 18), Butterfly (Quadro 19), Transposto (Quadro 20) e Complemento (Quadro 21).

Para simplificar a avaliação, sintetizar a análise e delimitar a discussão, foram utilizados dados com as redes sob operação normal (apenas uma frequência de operação, e.g. 100 MHz), não saturada, para fazer a relação da latência média e do jitter entre as topologias. Exceto no Barramento, que necessita operar sob frequência muito mais alta que as demais. Já em relação ao tráfego aceito, o valor

mais alto obtido em cada arquitetura foi utilizado, ou seja, capacidade máxima (maior vazão – i.e. frequências podem ser distintas).

Dos quadros que relacionam o desempenho de cada topologia, destaca-se que, conforme já comentado, o Barramento apresenta desempenho muito inferior às demais topologias. Já as diferenças entre o Crossbar e as demais redes é pequena, o que talvez não justifique o seu uso quando afrontado com métricas de custos (e.g. área e consumo de energia). Ainda, sob tráfego Uniforme, as redes Toroide 2D e Malha 3D apresentaram melhor desempenho quando operando próximo à saturação. Também, destaca-se que, em alguns cenários de tráfego, umas topologias são superiores a outras e em outros, essa relação inverte. Portanto, não é possível indicar uma rede que se sobressaia em todos os casos.

Relação de desempenho - topologias com 16 nodos sob tráfego Bit-reversal

Topologias Barramento Anel Cordal Malha 2D Malha 3D Toroide 2D Crossbar Métrica

Barramento -x- -x- -x- -x- -x- Latência Média Anel Cordal 15.945,2 1,3 1,2 1,1 -x- Malha 2D 11.667,2 -x- -x- -x- -x- Malha 3D 13.287,7 -x- 1,1 -x- -x- Toroide 2D 13.667,3 -x- 1,1 1,02 -x- Crossbar 34.168,4 2,1 2,9 2,5 2,5 Barramento -x- -x- -x- -x- -x- Tráfego Aceito Anel Cordal 21,87 9,37 6,25 3,12 -x- Malha 2D 12,5 -x- -x- -x- -x- Malha 3D 15,54 -x- 3,12 -x- -x- Toroide 2D 18,75 -x- 6,25 3,13 -x- Crossbar 34,38 12,51 21,88 18,76 15,63 Barramento -x- -x- -x- -x- -x- Jitter Anel Cordal 17.934,1 1,6 1,5 1,09 -x- Malha 2D 10.760,4 -x- -x- -x- -x- Malha 3D 11.604,4 -x- 1,07 -x- -x- Toroide 2D 16.439,6 -x- 1,5 1,4 -x- Crossbar 59182,7 3,3 5,5 5,1 3,6

Relação de desempenho - topologias com 16 nodos sob tráfego Perfect Shuffle

Topologias Barramento Anel Cordal Malha 2D Malha 3D Toroide 2D Crossbar Métrica

Barramento -x- -x- -x- -x- -x- Latência Média Anel Cordal 13.874,9 -x- -x- -x- -x- Malha 2D 18.028 1,2 -x- -x- -x- Malha 3D 19.065,6 1,3 1,05 1,0 -x- Toroide 2D 19.065,6 1,3 1,05 1,0 -x- Crossbar 37.858,8 2,7 2,1 1,9 1,9 Barramento -x- -x- -x- -x- -x- Tráfego Aceito Anel Cordal 12,50 -x- -x- -x- -x- Malha 2D 28,12 15,62 -x- -x- -x- Malha 3D 40,62 28,12 12,5 0,0 0,0 Toroide 2D 40,62 28,12 12,5 0,0 0,0 Crossbar 40,62 28,12 12,5 0,0 0,0 Barramento -x- -x- -x- -x- -x- Jitter Anel Cordal 11.114,4 -x- -x- -x- -x- Malha 2D 16.814,1 1,5 -x- -x- -x- Malha 3D 31.226,4 2,8 1,8 1,4 -x- Toroide 2D 21.153,3 1,9 1,2 -x- -x- Crossbar 65575,3 5,9 3,9 2,1 3,1

Relação de desempenho - topologias com 16 nodos sob tráfego Butterfly

Topologias Barramento Anel Cordal Malha 2D Malha 3D Toroide 2D Crossbar Métrica

Barramento -x- -x- -x- -x- -x- Latência Média Anel Cordal 11.443,8 1,3 1,0 1,3 -x- Malha 2D 8.501,1 -x- -x- 1,0 -x- Malha 3D 11.443,8 1,0 1,3 1,3 -x- Toroide 2D 8.501,1 -x- 1,0 -x- -x- Crossbar 21.252,7 1,8 2,5 1,8 2,5 Barramento -x- -x- -x- -x- -x- Tráfego Aceito

Documentos relacionados