Particionamento - Sistemas Embutidos

1.1 Sistemas Embutidos

1.1.4 Particionamento

Um SoC é definido pelos seus diferentes núcleos ou cores e estes interagem para a realiza¸cão de tarefas espec´ıficas. Para obter o funcionamento correto, o projetista do SoC precisa definir o conjunto de componentes que será utilizado na implementa¸cão e distribuir as tarefas que devem ser executadas pelo SoC entre esses componentes. O conjunto de componentes selecionados para integrar o SoC assim com a opera¸cão de sele¸cão são chamados de aloca¸cão e o resultado da distribui¸cão de tarefas é chamada de parti¸cão mas a opera¸cão de distribui¸cão é chamada de particionamento. A aloca¸cão e o particionamento devem ser efetuados de modo que a implementa¸cão satisfa¸ca restri¸cões do projeto, tais como, custo, desempenho, tamanho e consumo de energia (GAJSKI et al., 1994). Existem duas técnicas bem distintas de particionamento, denominadas de particionamento estrutural e particionamento funcional.

1.1.4.1 Particionamento estrutural

No particionamento estrutural, inicialmente é definida a estrutura de hardware do projeto, compreendendo componentes de hardware e suas conexões. Os componentes de hardware podem ser simples portas lógicas ou unidades complexas de cálculo e microprocessadores. Em seguida, a estrutura é particionada. O particionamento agrupa os componentes em grupos onde cada um representa um componente macro do sistema. O particionamento estrutural possui a vantagem de estimar diretamente o tamanho da implementa¸cão final do CI assim como a quantidade de pinos. O tamanho é estimado pela soma dos tamanhos dos componentes de cada grupo e o número de pinos é estimado pelo número de conexões entre um grupo e outro (GAJSKI et al.,

1994). As trˆes maiores desvantagens do particionamento estrutural s˜ao:

• Dif´ıcil balan¸co entre tamanho e desempenho - Como a defini¸cão da estrutura é feita antes do particionamento, esta segunda etapa pode acabar anulando a primeira. No caso do projetista optar por uma estrutura de hardware m´ınima, na etapa de particionamento tarefas iguais e sequenciais podem ser atribu´ıdas a grupos diferentes, gerando uma perda de desempenho. No caso contrário, onde o projetista opta por utilizar mais hardware e na etapa de particionamento o máximo de tarefas iguais e sequenciais é atribu´ıda ao mesmo grupo, isto gera um desperd´ıcio de área.

• Quantidade de componentes - Os algoritmos utilizados para particionamento não estão evoluindo na mesma velocidade que os sistemas estão crescendo e a quantidade de componentes em um único CI aumenta. Sistemas muito grandes tendem a um particionamento ruim.

1.1 Sistemas Embutidos 19

• Solu¸cões apenas de hardware - O particionamento estrutural é limitado apenas à parte de hardware do projeto e não ao funcionamento do sistema por completo. Partes do sistema que podem ser implementadas em software, assim como o software que governa o funcionamento do sistema, são ignorados.

A medida que os projetos de SoCs se tornam mais complexos e os CIs acomodam cada vez mais transistores, as desvantagens do particionamento estrutural tornam-se mais evidentes

(GAJSKI et al., 1994).

1.1.4.2 Particionamento funcional

No particionamento funcional, inicialmente o sistema é dividido em fun¸cões indivis´ıveis, chama- das de objetos funcionais. Em seguida é feito o particionamento que consiste em implementar cada objeto funcional através de hardware ou software. As três maiores vantagens do particionamento funcional em rela¸cão ao particionamento estrutural são:

• Balan¸co entre tamanho e desempenho - Na etapa de implementa¸cão estrutural, sub- sequente ao particionamento funcional, a utiliza¸cão dos componentes pode ser otimizada ao máximo, maximizando o desempenho e minimizando a área ocupada.

• Quantidade de componentes - Menor quantidade de componentes a ser particionada, já que a quantidade de objetos funcionais é menor do que a quantidade objetos em n´ıvel de hardware. Com menos objetos, o desempenho dos algoritmos de particionamento é melhor e o projetista pode tomar decisões com mais facilidade.

• Solu¸cão hardware/software - A maior vantagem do particionamento funcional é que ele permite um particionamento de hardware e software. Isso é poss´ıvel porque os objetos particionados são funcionais e não estruturais. Objetos funcionais podem ser implementados em um processador na forma de um conjunto de instru¸cões ou como componentes de hardware. Como a maioria dos sistemas baseados em SoCs possuem partes de hardware e software, a capacidade de particionar entre estas duas plataformas é indispensável para qualquer sistema de particionamento.

Como visto anteriormente, o projeto baseado em plataforma ´e composto de bibliotecas de hardware, na forma de IPs, e de softwares. Estas duas partes da plataforma, respectiva- mente, formam a plataforma de hardware e a plataforma de software. Estas duas plataformas podem ser implementadas separadamente nas ferramentas de projeto mais modernas, como EDK (Embedded Development Kit) da Xilinx.

1.1 Sistemas Embutidos 20

1.1.5 Plataforma de hardware

Reutiliza¸cão é a palavra chave para reduzir custos nos projetos de SoCs e dispositivos móveis em geral. Acredita-se que estes dispositivos representarão a maioria dos dispositivos eletrônicos em breve. Como os projetistas de SoCs implementam cada vez mais fun¸cões em software, é necessária uma arquitetura m´ınima de hardware que possa ser facilmente alterada e reutilizada por diferentes aplica¸cões. Esta arquitetura m´ınima de hardware é chamada de plataforma de hardware (KEUTZER et al., 2000).

As restri¸cões impostas pela aplica¸cão, em termos de desempenho influenciam na defini- ¸cão da plataforma de hardware. Para implementar um conjunto de funcionalidades, é necessário um microprocessador com um conjunto m´ınimo de microinstru¸cões e uma memória com uma quantidade m´ınima de bytes (TANENBAUM, 2005). Como cada projeto é caracterizado por um conjunto diferente de funcionalidades, as restri¸cões de cada projeto definem os IPs, que em conjunto com o microprocessador, serão responsáveis por tarefas espec´ıficas e garantirão o desempenho desejado. Além das restri¸cões impostas pela aplica¸cão também existem as próprias restri¸cões de hardware em termos de custo, consumo de energia, área e outros. A intercessão entre as restri¸cões do dom´ınios da aplica¸cão e as restri¸cões do dom´ınio de hardware definem a plataforma de hardware que será utilizada no produto final (KEUTZER et al., 2000).

1.1.6 Plataforma de software

A plataforma de hardware por si só não é suficiente para atingir o n´ıvel de reutiliza¸cão de software desejado. Para ser reaproveitável, a plataforma de hardware precisa ser abstrata para o software em execu¸cão. O software precisa “enxergar”uma interface de alto-n´ıvel acima da camada de hardware. Esta interface de alto n´ıvel é chamada de API (Application Program Interface). A API constitui a plataforma de software que encapsula a plataforma de hardware possibilitando a abstra¸cão desejada dos componentes de hardware.

A camada de software é constitu´ıda por drivers que controlam os dispositivos de E/S, por um protocolo de comunica¸cão que controla a comunica¸cão entre os componentes do SoC e um sistema operacional de tempo real, comumente chamado de RTOS (Real Time Operating System). Algumas literaturas denominam a plataforma de software como RTOS, incluindo os drivers de E/S e o protocolo de comunica¸cão. A Figura 6 mostra a estrutura da camada de software e as demais camadas de um projeto baseado em plataforma (KEUTZER et al., 2000).

Um n´ıvel acima da plataforma de software está o software programado para executar as funcionalidades do projeto, representando o n´ıvel mais alto de abstra¸cão. Atualiza¸cões do

1.2 Redes Embutidas 21

Interface de

Sa´ıda Interface deEntrada

Plataforma de Hardware Plataforma de Software Software de Aplica¸c˜ao R T O S P ro to co lo d e C om u n ic a¸c ˜ao BIOS Drivers Plataforma de software

Figura 6: Camadas de um projeto baseado em plataforma

projeto podem ser feitas diretamente na camada mais alta, reduzindo consideravelmente o custo e tempo de lan¸camento de um novo produto no mercado. No entanto, ainda existe o entrave da compatibilidade. Os programas de alto n´ıvel devem ser desenvolvidos para uma plataforma de software ou um RTOS espec´ıfico. Para maximizar a capacidade de reutiliza¸cão de projetos é necessária a padroniza¸cão da plataforma de software. Atualmente cada fabricante desenvolve o seu próprio RTOS ou então adota um sistema existente no mercado.

1.2 Redes Embutidas

No ano de 2002 pesquisadores do ITRS (International Technology Roadmap for Semiconduc- tors) fizeram a previsão de que até o final da década, SoCs seriam fabricados com 4 bilhões de transistores na ordem de 50nm cada, operando abaixo de 1V e operando com uma frequência de 10Ghz. Talvez não cheguemos a tantos transistores em um CI e nem a frequência de 10Ghz até o final desta década, mas os números atuais já representam um desafio no projeto de SoCs. A grande quantidade de conexões dos componentes internos representa um fator limitador de desempenho e gera alto consumo de energia (BENINI; MICHELI, 2002).

Além da grande quantidade de conexões internas, existe o problema de sincroniza¸cão, que será muito dif´ıcil, senão imposs´ıvel, de ser resolvido à medida que a quantidade de componentes e a frequência de opera¸cão aumentam. Uma poss´ıvel solu¸cão para o problema de sincroniza¸cão consiste em utilizar diferentes sinais de clocks, gerando um sistema globalmente ass´ıncrono e localmente s´ıncrono. Na ausência de uma única frequência de opera¸cão de referên- cia, um SoC se transforma em um sistema distribu´ıdo embutido em um único CI. O controle global do sistema se torna mais dif´ıcil porque é preciso monitorar cada um dos subsistemas formados. O controle de comunica¸cão entre os múltiplos dom´ınios de frequência de opera¸cão pode ser muito custoso e até mesmo inviável (BENINI; MICHELI, 2002).

1.2 Redes Embutidas 22

A baixa tensão de alimenta¸cão, a grande quantidade de barramentos em diferentes frequências de opera¸cão e o reduzido tamanho dos CIs, pode tornar os dispositivos mais sus- cept´ıveis a interferência eletromagnética, crosstalk e a inje¸cão de cargas induzidas (BENINI;

MICHELI, 2002), ocasionando erros na transmiss˜ao de dados. A transmiss˜ao de dados digitais

em tais condi¸cões seria não determin´ıstica e talvez impraticável.

O projeto de SoCs depende fortemente de uma plataforma modular, tanto para software quanto para hardware. O uso de métricas probabil´ısticas, como desempenho e consumo de energia, para a avalia¸cão de projeto, leva a uma mudan¸ca de metodologia no projeto de SoCs. Com base no fato que a comunica¸cão será o maior limitador no projeto de SoCs, uma nova metodologia de comunica¸cão inspirada nas infra-estruturas de redes de computadores foi desenvolvida para os SoCs. Esta nova metodologia aproveita o conhecimento de engenharia consolidado no projeto de grandes redes de computadores e utiliza-o no projeto de SoCs, dando origem às redes embutidas, ou simplesmente NoCs (Networks-on-Chip).

A arquitetura NoC, além de eliminar os problemas de interferência citados anteriormente, pode ser empregada em SoCs com múltiplos processadores, os MPSoCs (PANDE et al., 2005). A tendencia natural é que os projetos de SoCs utilizem múltiplos processadores, cri- ando um ambiente de computa¸cão paralela dentro de um CI. Para viabilizar a comunica¸cão entre os processadores e os demais dispositivos do CI, é desejável que a comunica¸cão interna se assemelhe a comunica¸cão de computadores por meio de uma rede de dados. Projetos baseados em arquitetura NoC atendem aos requisitos de comunica¸cão impostos atualmente nos projetos de SoCs e MPSoCs.

Embora a arquitetura NoC esteja baseada na arquitetura de comunica¸cão de computadores, um conjunto significativo de restri¸cões separa estas duas arquiteturas. Em rela¸cão ao desempenho, o alto throughput e a baixa latência são caracter´ısticas desejadas em ambos os dom´ınios. Contudo, na perspectiva de NoCs, a energia dissipada para realizar a comunica- ¸cão pode ser significativa comparada com a energia total do sistema. A área utilizada pelos componentes de comunica¸cão é então uma outra caracter´ıstica importante que deve ser obser- vada durante o projeto. Esta metodologia permite um alto n´ıvel de abstra¸cão do modelo de comunica¸cão (PANDE et al., 2005).

1.2.1 Arquitetura interna

Uma importante caracter´ıstica na metodologia baseada em NoC consiste na separa¸cão entre componentes de comunica¸cão e aqueles de processamento. A comunica¸cão entre os componen-

1.2 Redes Embutidas 23

S S S

rni rni rni rni rni rni rni rni rni

m m m m m c d c p c m re c re c d c m d c m p fp c m p

Figura 7: NoC de tipo malha com nove recursos

tes de processamento é responsabilidade da plataforma de rede enquanto que os componentes da plataforma de hardware ou de processamento ficam dedicados apenas para a execu¸cão das funcionalidades da aplica¸cão propriamente ditas. Neste contexto, os elementos da plataforma de hardware são geralmente chamados de recursos. Cada recurso é um meio f´ısico onde IPs podem ser implementados, gerando assim um core (ou núcleo) da rede. Os componentes da plataforma de rede são os canais, os switches e as interfaces de rede. Os canais são barramentos por onde os dados trafegam e permitem a interliga¸cão dos switches. Os switches são responsáveis pela lógica de roteamento e chaveamento da rede. As interfaces de rede ou RNIs (Resource Network Interface) implementam as liga¸cões entre switches e recursos. Cada recurso deve possuir sua própria interface de rede para que possa se comunicar com o restante dos recursos da plataforma de hardware. A Figura 7 apresenta uma estrutura de NoC em malha

(KUMAR et al., 2002) denominada de CLICH´E (Chip-Level Integration of Communicating He-

terogeneous Elements), onde diferentes blocos IPs estão implementados nos recursos e as siglas utilizadas significam: C – memória cache, D – bloco DSP, FP – unidade de ponto flutuante, M – memória, P – processador, Re – bloco reconfigurável e RNI – interface de rede.

No caso de uma implementa¸cão em um CI, qualquer IP pode ser implementado em um recurso desde que o recurso disponha de área de hardware suficiente. No caso de implementa¸cões em hardware reconfigurável, como uma FPGA, a implementa¸cão do IP dependerá dos recursos básicos dispon´ıveis na FPGA, como flip-flops e lookup tables. Qualquer recurso dotado de uma interface de rede, que esteja ligada a um switch, pode estabelecer comunica¸cão com qualquer outro recurso da NoC que apresente as mesmas condi¸cões. A interface de rede identifica cada recurso com um endere¸co f´ısico. Qualquer recurso conectado a rede é visto como um sistema embutido independente. A rede inteira pode ser considerada como um sistema distribu´ıdo,

1.2 Redes Embutidas 24

onde os componentes da plataforma de rede disponibilizam servi¸cos de comunica¸c˜ao (SOININEN;

HEUSALA, 2003).

A arquitetura do switch depende do esquema de roteamento utilizado na NoC. As duas principais categorias de roteamento são: determin´ıstica e adaptativa. Algoritmos de roteamento determin´ısticos sempre tra¸cam o mesmo caminho entre um recurso origem e um recurso des- tino. Algoritmos adaptativos utilizam a informa¸cão do trafego nos canais da rede para evitar congestionamento ou falha no envio de mensagens. Em uma NoC com roteamento determi- n´ıstico, os switches são mais rápidos e mais compactos. No caso de roteamento adaptativo, o switch precisa de mais área de hardware para implementar o processamento necessário que permite avaliar as condi¸cões da rede (PANDE et al., 2005). Outro fator de impacto no tamanho e desempenho dos switches é o tamanho dos buffers de entrada e sa´ıda. A Figura 8 mostra a arquitetura de um switch constitu´ıdo basicamente de buffers de E/S, multiplexadores e de um bloco de lógica de roteamento. Este switch possui 5 pares de canais de E/S, o que possibilita o envio e recebimento de dados dos quatro switches vizinhos (Norte, Sul, Leste, Oeste) e do recurso local da plataforma ao qual o switch é conectado, simultaneamente, garantindo assim um alto throughput durante a comunica¸cão.

mux ns lo r* rni Buffers s Buffers mux n s* l o r l Buffers m u x n s l * o r n Buffers mux n* s l o r o Buffers m u x n s l o * r RoteamentoL´ogica de

Figura 8: Arquitetura interna de um switch

A próxima se¸cão apresenta o Modelo de Referência OSI adotado para identificar o papel exercido por cada elemento de rede em uma rede de computadores e em uma NoC.

1.2 Redes Embutidas 25

No documento Dissertação (páginas 34-41)