Aspectos Construtivos da FPGA

2.4 ALGORITMO CORDIC

2.5.1 Aspectos Construtivos da FPGA

As FPGAs s ão baseadas em unidades l ógicas elementares b ásicas, ou (BLE) Basic Logic Elements, dentro de uma hierarquia de interconex ões reconfigur áveis que permitem que os BLEs sejam fisicamente conectados uns aos outros de diferentes formas, criando uma enorme variedade de componentes digitais. A arquitetura das FPGAs modernas s ão constitu´ıdas, basicamente, por conjunto de mem órias de

2.5 FPGA 45

armazenamento em massa SRAM (Static Random Access Memory ), Portas de Entra- da/Sa´ıda, blocos l ´ogicos configur ´aveis (CLB) e sistema de roteamento, como pode ser visto na Figura (13) (MOORE, 2007, p. 5).

Figura 13: Arquitetura Tipica de uma FPGA Fonte: Adaptado Meyer-Baese (2007, p. 6)

Os CLB s ão blocos realizam operaç ões l ógicas b ásicas e armazenam pequenos volumes de dados. Comumente as operaç ões complexas, necess árias para o processamento de uma aplicaç ão, s ão divididas em processos mais simples para cada uma das CLBs selecionadas, de modo que a soma das tarefas de cada CLB seja equivalente a operaç ão complexa, em uma estrat égia de divis ão e conquista. Para realizar operaç ões l ógicas b ásicas e ainda armazenar pequenos volumes de dados, os CLBs tecnicamente poderiam ser apenas um pequeno circuito de transistores (granularidade fina), ou at é mesmo um processador completo (granularidade grosseira). Se os CLBs fossem granularidade fina, para realizar tarefas complexas seria necess ário

2.5 FPGA 46

um grande n úmero de CLBs e um sistema de roteamento complexo para interconecta- los, o que resultaria em uma FPGA de baixo desempenho e um elevado consumo energ ético. Por outro lado, se as CLBs forem de uma granularidade mais grosseira, seria um desperd´ıcio de recurso utiliz á-los em operaç ões mais simples (FAROOQ et al.,

2012, p. 11). Assim a escolha do n´ıvel de complexabilidade, ou granulaç ão, das CLBs de uma FPGA é um compromisso de otimizaç ão de recursos.

Segundo Farooq et al. (2012, p. 11), dentro da gama de granulaç ão das CLBs, algumas arquiteturas incluem o uso de portas NAND, interconex ão de multi- plexadores e tabelas de busca LUT (Lookup Table). Em especial, fabricantes como a Xilinx utilizam CLBs baseadas em LUTs, j á que CLBs baseadas em LUT oferecem uma boa relaç ão de granulaç ão, otimizando os recursos da FPGA para aplicaç ões simples at é as mais complexas. Esse tipo de CLB pode incluir uma único BLE, ou mesmo um cluster de BLEs interconectados, como mostrado na Figura (14).

Figura 14: Arquitetura de uma CLB com 4 BLEs

Fonte: Adaptado Farooq et al. (2012, p. 13)

Segundo Farooq et al. (2012, p. 11), um BLE mais simples consiste basicamente de um LUT e um Flip-Flop tipo D, como pode ser visto na Figura (15). Um LUT com k entradas pode implementar k funç ões booleanas utilizando os espaços de mem ória SRAM dentro da LUT. O exemplo apresentado na Figura (15) utiliza 16 bits

2.5 FPGA 47

de mem ória SRAM, os quais s ão conectadas a entrada do multiplexador que possui 4 bits de seleç ão, e cuja sa´ıda é ligada ao flip-flop. Essa configuraç ão permite que a LUT tenha 2k _{combinaç ões das k operaç ões booleanas.}

Figura 15: Arquitetura de uma BLE (Basic Logic Element)

Fonte: Adaptado Farooq et al. (2012, p. 13)

Um único BLE é capaz de realizar algumas operaç ões booleanas b ásicas, por ém em clusters as combinaç ões de operaç ões aumentam. FPGAs modernas ti- picamente cont ém de 4 a 10 BLEs em um único cluster. Por ém, essas FPGAs n ão possui apenas BLEs id ênticas, na verdade h á uma grande heterogenia de blocos, sendo muitos deles desenvolvidos para prop ósitos espec´ıficos. Entre esses blocos de prop ósito espec´ıfico est ão multiplicadores, somadores, mem órias e DSPs (Digital Sig- nal Processor ), entre outros. Esses blocos s ão desenvolvidos para otimizar o espaço, processamento, roteamento e demais recursos de hardware que seriam necess ários para implementar as mesmas funç ões em BLEs comuns, sendo essenciais em certas aplicaç ões Farooq et al. (2012, p. 10).

A implementaç ão de qualquer circuito l ógico é feita pela associaç ão de diferentes blocos l ógicos e pelas portas de entrada e sa´ıda da FPGA, os quais s ão conectados uns aos outros por meio da rede de roteamento program ável, ou PLN (Programmable Logic Network ). Na Figura (13) a PLN é representada pela Matriz Program ável de Interconex ões e pelos Canais de Roteamento. Para que a FPGA possa implementar qualquer circuito digital, as interconex ões de roteamento devem ser flex´ıveis para suportar a grande variedade de conex ões demandada, otimizando

2.5 FPGA 48

sempre as dist âncias das conex ões e reduzindo a lat ência dos sinais. Portanto, ao projetar um circuito a ser implementado na FPGA deve ser ter especial atenç ão a forma como o roteamento do blocos l ógicos é feito, buscando flexibilidade e efici ência Farooq et al. (2012, p. 13).

Nas FPGAs modernas, al ém da unidades de armazenamento de Dados SRAM contido dentro das BLEs, mais especificamente nas LUTs, existe ainda gran- des blocos SRAM isolados das BLEs, destinados a funcionar como o armazenamento de dados em massa. Esses blocos s ão importantes em aplicaç ões digitais aonde é necess ário armazenar, como por exemplo, dados de amostragem ou mesmo dados que devem aguardar para serem passados para uma pr óxima etapa de processamento, ou mesmo transmitidos para fora da FPGA pelas portas de entrada e sa´ıda de dados. Esses blocos de mem ória é apresentada na Figura (13) como parte integrante da arquitetura tipica de uma FPGA.

A FPGA é uma boa escolha para a implementaç ão do algoritmo da FFT devido a grande variedade de recursos de hardware sintetiz áveis, al ém de possuir recursos de programaç ão paralela que permite o processamento paralelo de sinais, conferindo assim uma maior rapidez na execuç ão do algoritmo (IBRAHIM et al., 2016). Como afirma Meyer-Baese (2007, Pref ácio), muitos algoritmos de processamento de sinais, como FFT (Fast Fourier Transform) e os filtros FIR ou IIR, implementados ante- riormente em Circuitos Integrados de Aplicaç ão Especifica ou ASIC (Application Spe- cific Integrated Circuits), agora est ão sendo implementados em FPGAs.

3 MATERIAIS E M ´ETODOS

Este cap´ıtulo destina-se a apresentaç ão dos dispositivos e programas, bem como os algoritmos, funç ões e metodologias utilizadas para projetar e implementar os circuitos de c álculo da FFT. Todos os passos apresentados aqui foram embasados na teoria apresentada no Cap´ıtulo (2).

O desenvolvimento de um hardware para c álculo de uma FFT em FPGA, abrindo m ão de IPs prontas e blocos de DSPs, utilizando apenas as bibliotecas padr ão de componentes, como a IEEE 1164 e a UNISIM, disponibilizadas pelo fabricante, é uma tarefa que exige um projeto e implementaç ão eficiente. Para o projeto da arquitetura da FFT, é necess ário ter conhecimento de toda a base matem ática, tanto da Transformada de Fourier, quanto do algoritmo CORDIC e de suas variantes, para que se possa tirar o m áximo proveito das simplificaç ões e otimizaç ões matem áticas poss´ıveis. Na implementaç ão do algoritmo, um design eficiente dos diferentes componentes que formam o hardware, al ém de reduzir a lat ência dos sinais, tamb ém reduz o consumo de Flip-Flops, LUTs, Muxes e blocos de mem ória. Tornando, assim, poss´ıvel a implementaç ão de um hardware mais eficiente dentro das restriç ões de recursos da FPGA.

Para que fosse poss´ıvel testar as funcionalidades e o desempenho ap ós a implementaç ão, desde o in´ıcio do projeto da FFT, fora elaborado o diagrama da Figura (16). ZynqBerry Interface AXI - Slave UART / TTL FFT AXI Cortex-A9 PL PS F( ) f(t)

Figura 16: Diagrama Geral do Sistema Implementado Fonte: Autoria Pr ´opria

No documento Implementação do algoritmo Radix-2 para cálculo da FFT em FPGA (páginas 46-52)