Barramento Wishbone - Cap´ıtulo 2 - Um Sistema Integrado Baseado no Processador OpenRISC

Cap´ıtulo 2

2.1.2 Barramento Wishbone

A interface de barramento Wishbone [10] éhardware open source, permite a comunicação entre vários núcleos dentro de um SoC. Esta interface é bastante utilizada em CPUs e periféricos open source,

onde se destacam muitos dos projectos da comunidade OpenCores, sendo recomendado que todos os núcleos tenham dispon´ıvel uma interface Wishbone. O barramento Wishbone foi desenvolvido pela Silicore Corporation em 1999 e disponibilizado para o dom´ınio público numa biblioteca VDHL. A partir de 2002 a comunidade OpenCores tornou-se também patrocinadora do Wishbone, tendo uma página dedicada à interface onde estão dispon´ıveis novas revisões.

A interface Wishbone pode utilizar-se em quatro tipos de arquitectura, como mostrado na figura 2.2.

A interligação ponto a ponto (figura 2.2(a)) permite apenas a ligação a um periférico. Este tipo de ligação não é normalmente utilizada num SoC, uma vez que habitualmente estes são constitu´ıdos por vários periféricos. A interface de barramento partilhado (figura 2.2(b)) permite a utilização de vários mestres e vários escravos visto que o barramento é partilhado, ou seja, quando um mestre utiliza o barramento, os outros mestres têm de aguardar que este fique dispon´ıvel. O controlo é feito por um árbitro que decide qual o mestre que controla o barramento num dado momento. por exemplo, o comutador de barra (figura 2.2(c)) é utilizado numa tipologia multi-núcleo. Este permite que dois mestres comuniquem com escravos diferentes em simultâneo, sendo semelhante ao barramento partilhado mas com uma maior taxa de transferência de dados. Por último apresenta-se a interligação de fluxo de dados (figura 2.2(d)), onde a informação flui de periférico para periférico, e em que todos os periféricos têm de ter uma interface de escravo e outra de mestre.

(a) Interligação ponto a ponto (b) Interligação de barramento partilhado

(c) Interligação comutador de barra(crossbar switch) (d) Interligação de fluxo de dados Figura 2.2:Interfaces Wishbone

A interligac¸˜ao utilizada no desenvolvimento de um SoC com apenas uma unidade de processamento

é o barramento partilhado, porque tem vários periféricos dispon´ıveis e por ser de simples implementação (figura 2.3). Toda a gestão da interface Wishbone é feita no módulo Intercon, sendo este constitu´ıdo por vários elementos como multiplexadores e árbitros Wishbone. Como se pode ver na figura 2.3, os módulos Wishbone de dados e de instruções do processador, mencionados na figura 2.1, estão ligados a gestores de acessos. O Wishbone de dados encontra-se ligado a um multiplexer que envia os dados para o periférico correspondente conforme o endereço atribu´ıdo a cada periférico. Um árbitro faz o

controlo de acesso à memória principal entre o acesso de dados e das instruções. Como o SoC só tem dispon´ıvel uma memória, esta é utilizada para guardar dados e também para guardar instruções.

Para adicionar um novo periférico ao SoC, a interface do escravo é ligada ao multiplexer de Wishbone de dados e, à semelhança dos outros periféricos da figura 2.3, tem de ser atribu´ıdo ao periférico um conjunto de endereços dispon´ıveis, para que o multiplexer saiba a que periférico corresponde aquele pedido.

Figura 2.3:Diagrama de blocos da arquitectura Wishbone.

A interface Wishbone é constitu´ıda por 12 sinais distintos que se encontram descritos na tabela 2.1, sendo que a maior parte dos sinais, com excepção de wbm adr i, wbm dat i, wbm dat o e wbm sel i, são de apenas um bit. A tabela indica a direcção dos sinais observada do lado do periférico.

Nome Direcção Largura(bits) Descrição

wbm cki i Input 1 Clock do sistema para a interface Wishbone.

wbm rst i Input 1 Sinal deReset(activo com valor l´ogico ’1’).

wbm cyc i Input 1 Validação da informação noBus.

wbm adr i Input 32 Enderec¸o para escrita ou leitura no perif´erico.

wbm dat i Input 32 Dados enviados para o perif´erico.

wbm dat o Output 32 Dados enviados pelo perif´erico.

wbm sel i Input 4 Selecciona Byte para escrever ou ler.

wbm ack o Output 1 Sinal deAcknowledge(ACK).

wbm err o Output 1 Indica um ciclo anormal: ocorreu um encerramento.

wbm we i Input 1 Sinal de leitura ou escrita, valor l´ogico ’1’ escreve.

wbm stb i Input 1 Valida os dados transmitidos.

wbm rty 0 Output 1 Indica se a interface n˜ao est´a pronta pra receber ou enviar dados.

Tabela 2.1:Tabela dos sinais da interface Wishbone.

A interface Wishbone mestre é controlada pelas caches de dados ou instruções, como mostrado na figura 2.1, dependendo se se trata da interface de dados ou de instruções respectivamente. As leituras e as escritas podem ser simples – leitura de apenas uma posição de memória – ou burst – em que são feitos quatro acessos sequenciais. Isto é definido no código e corresponde ao tamanho daMemory Management Unit(MMU). Na figura 2.4 podem ser observados vários diagramas temporais de leituras e escritas na memória feitas pelas caches.

As figuras 2.4(a) e 2.4(b) correspondem a diagramas temporais referentes ao m´odulo Data Cache,

em que o sinal dcfsm burst acciona uma leitura ou escrita em burst. Na primeira figura temos uma leitura simples: como se pode ver o sinal de burst está com o valor lógico de ’0’ e o sinal biu we i também se encontra com o valor lógico de ’0’, indicando que é uma leitura. Também se pode ver que o sinal biu sel i é o primeiro a ser definido e tem o valor 4 em hexadecimal, indicando que é para ser lido apenas o segundo byte mais significativo do sinal biu dat o.

Na figura 2.4(b) temos uma escrita simples. Neste caso ainda temos o sinal dcfsm burst com o valor lógico de ’0’, mas o sinal biu we i já tem o valor lógico de ’1’, accionado ao mesmo tempo que os sinais de validação biu cyc i e biu stb i. Já neste caso o sinal biu sel i com o valor F em hexadecimal indica que todos os bytes de biu dat i são para ser escritos.

Por último na figura 2.4(c) é apresentado um diagrama temporal referente à cache de instruções, onde é representada uma leitura emburst. Neste caso podemos ver que o sinal icfsm burst tem o valor lógico ’1’, e que no sinal biu adr i o endereço se mantém até receber o primeiro ACK. A partir da´ı este é incrementado de quatro em quatro posições de memória (organizada ao byte) em cada flanco ascendente.

(a) Diagrama temporal do ciclo de leitura simples

Clock

(b) Diagrama temporal do ciclo de escrita simples

Clock icfsm_burst biu_dat_i

biu_adr_i 0000D650 0000D654 0000D658 0000D65C

biu_cyc_i

2.1.3 Toolchain

Umatoolchain [11] é um conjunto de ferramentas de programação que permite criar programas. Nor-malmente, uma toolchain simples disponibiliza um compilador, um linker para fazer a montagem do código compilado num programa executável, bibliotecas que fornecem uma interface com o sistema operativo e umdebugger. Uma dastoolchainsmais utilizadas para desenvolver programas em C é a toolchainda GNU, sendo vital para o desenvolvimento de Linux, sistemas operativosBerkeley Software Distribution(BSD) esoftware para sistemas embebidos. Atoolchain da GNU disponibiliza mais algu-mas ferramentas adicionais, como por exemplo a ferramenta para compilação automática vulgarmente

conhecida porMake.

Por ser bastante utilizada em desenvolvimento desoftware, várias comunidades utilizam atoolchain da GNU. No entanto, o processador da comunidade OpenRISC ainda não é suportado oficialmente pela toolchainda GNU. Por essa razão a comunidade adicionou o seu processador a duas bibliotecas de C:

a Newlib e a uClibc. A Newlib [12] é uma biblioteca já testada e utilizada desde a versão 1.18.0, com suporte de placas, sendo pequena, simples e a melhor para o desenvolvimento de aplicações em bare-metal, ou seja, sem sistema operativo. A uClibc [13] é uma biblioteca de C para sistemas embebidos donde foram removidas algumas partes do padrão C, mas ainda dispõe de todas as funcionalidades necessárias a um sistema operativo, e é ideal para sistemas embebidos suportando processadores ARM, amd64 e i386.

A biblioteca Newlib é utilizada no desenvolvimento de aplicações em bare-metal por isso é ne-cessário indicar ao compilador para fazer alinkagempara uma placa espec´ıfica utilizando aflag -mbo-ard”. Existem já algumasplacaspredefinidas como or1ksim (simulador or1ksim sem UART), or1ksim-UART (simulador or1ksim com or1ksim-UART), e a placa de FPGA de0 nano da Terasic. Quando indicamos com a flag qual é a placa que utilizamos, o compilador usa um ficheiro com o mesmo nome, já pré-compilado, que contém informações importantes sobre a placa como a frequência de relógio, endereço base e tamanho da memória principal, endereço base ebaud rateda UART e o número IRQ (número do pedido de interrupçao) da UART. É poss´ıvel criar um ficheiro com as propriedades da placa que pretendemos através da criação de um ficheiro com o nome da placa e com a extensão (.S).

2.1.4 OrpSoc

A comunidade OpenRISC apercebeu-se da necessidade de uma plataforma para facilitar o desen-volvimento e a modelação de um SoC. Por esse motivo desenvolveram a plataformaOpenRISC Refe-rence Platform System-on-Chip(ORPSoC) [14], destinada ao desenvolvimento e verificação de núcleos Intellectual Property (IP) para o SoC. Para além destes objectivos teria de ser simples de usar, tanto por utilizadores experientes como por utilizadores sem qualquer experiência, permitindo assim simular e sintetizar o hardwarefacilmente. A plataforma encontra-se separada do repositório onde se encon-tram os SoC’s e os núcleos, permitindo assim que a mesma seja utilizada por outras identidades que pretendam desenvolver um SoC.

O repositório onde se encontram os sistemas e os núcleos apresenta a organização ilustrada na figura 2.5, sendo que no caso do OpenRISC o repositório tem o nome de OrpSoc-cores. Dentro deste repositório existem duas pastas: cores e systems.

Dentro da pasta systems estão todos os SoC’s desenvolvidos ou em desenvolvimento, cada um com a sua pasta espec´ıfica. Dentro de cada SoC existem vários ficheiros onde dois deles são bas-tante imporbas-tantes e têm de ter o nome do sistema com as extensões .core e .system. Por exemplo, de0 nano.core e de0 nano.system, caso seja a placa sistema de0 nano. O ficheiro .system tem a descrição do sistema e a localização dos ficheiros necessários para sintetizá-lo para uma determinada FPGA. Já o ficheiro .core contém todas as dependências do sistema em relação aos núcleos, tendo

também uma secção com as várias ferramentas de simulação. Para cada uma descriminam-se as informações necessárias para a compilação, tal como o ficheiro de topo do SoC, ficheiros detestbench e as flags de compilação.

A pasta cores contém os vários núcleos, cada um numa pasta, onde é obrigatório ter o ficheiro com a extensão .core que contém uma descrição do núcleo, a dependência de outros núcleos e o nome dos ficheiros de descrição do núcleo. É poss´ıvel que os ficheiros de descrição não estejam no repositório. Nesse caso, o ficheiro também contém uma secção que indica a localização e número de revisão dos ficheiros no servidor deSubversion(programa de controlo de versões) da comunidade. A plataforma ORPSoC utiliza esta informação para automaticamente descarregar os ficheiros dos núcleos da Internet, no caso de não estarem presentes no repositório.

Figura 2.5:Organização do sistemas e núcleos da OpenRISC.

Cada sistema que se encontra na pasta systems é constitu´ıdo por vários núcleos que se encontram na pasta cores, e cada núcleo pode depender ou não de um ou mais núcleos. Um núcleo descreve um núcleo, tal como um processador ou um periférico. Um sistema descreve como esses núcleos estão interligados entre si, tornando a criação de novos sistemas mais simples, não sendo necessário ter código replicado de cada núcleo para cada sistema, sendo assim mais fácil manter todos os núcleos actualizados.

A figura 2.6 representa o sistema de ficheiros criado pela plataforma ORPSoC, o qual se encontra di-vidido por utilidade. Na pasta ORPSoC encontram-se ficheiros que disponibilizam utilitários básicos, na pasta Build encontram-se as ferramentas para sintetizar o SoC e na pasta Simulator estão dispon´ıveis os procedimentos para a execução em alguns simuladores. A pasta provider destina-se a descarregar os núcleos necessários para o SoC que ainda não se encontrem dispon´ıveis localmente.

Durante o desenvolvimento desta tese a comunidade OpenRISC ponderou que esta ferramenta poderia ser utilizada para o desenvolvimento de outros SoC’s, sem especificamente envolver processa-dores OpenRISC. Desta forma a ferramenta tornou-se independente da comunidade sendo o seu nome alterado para FuseSoC.

2.2 Ferramentas

No desenvolvimento de software espec´ıfico para um SoC, quando este ainda não se encontra dispon´ıvel fisicamente, é importante dispor de várias ferramentas de simulação e/ou emulação, pois torna-se dis-pendioso e demorado criar um SoC e só posteriormente testar a aplicação.

Figura 2.6:Diagrama de ficheiros do ORPSoC.

2.2.1 Or1ksim

O Or1ksim [15, 16] ´e um simulador de um SoC com arquitectura OpenRISC 1000 desenvolvido em C.

Pretende-se que este simulador seja autónomo, permita uma simulação rápida facilitando a análise do correcto funcionamento do código e a avaliação de desempenho do SoC, seja de fácil configuração permitindo alterar o processador e o tamanho das memórias, permita a adição de novos periféricos e a utilização dodebuggerremoto. O Or1ksim não simula o que está descrito no sistema ORPSoC; quando se faz uma alteração no SoC essa alteração tem de ser feita posteriormente na configuração Or1ksim.

Mas é óptimo para testarsoftwareem desenvolvimento por ser bastante rápido a executar.

2.2.2 Verilator

O Verilator [17] ´e uma ferramenta que converte o c´odigo Verilog que descreve o SoC em SystemC [18]

ou num objecto em C++. Esse objecto necessita de ser instanciado numa testbench que pode ser escrita em C++ ou SystemC, de acordo como foi convertido anteriormente. A testbench controla o sinal de rel´ogio, podendo tamb´em excitar os sinais de entrada e efectuar a leitura nos sinais de sa´ıda, bem como em qualquer sinal no interior do SoC, tal como se pode ver na figura 2.7. O Verilator

é um simulador que só suporta dois estados nos sinais: valor lógico ’1’ ou valor lógico ’0’. Este é bastante mais lento que o Or1ksim (ver a secção 2.2.1), mas apesar dessa desvantagem disponibiliza um ficheiro que permite visualizar o estado de todos os sinais dentro do SoC em todos os instantes da simulação, permitindo assim encontrar erros na arquitectura dehardware do SoC. Como é efectuada uma conversão a partir dos ficheiros descritivos do SoC, estes testes são efectuados num sistema idêntico ao que será fabricado, se não tivermos em conta a existência de outros estados nos sinais.

Figura 2.7:Diagrama do simulador Verilator.

No documento Um Sistema Integrado Baseado no Processador OpenRISC (páginas 26-33)