分布式運(yùn)算單元的原理及其實(shí)現(xiàn)方法
將圖4(a)與圖3進(jìn)行比較后就可以發(fā)現(xiàn),圖3中的DA查找表由16個(gè)輸入變量的同一位進(jìn)行尋址,而圖4(a)中的DA查找表的尋址是由16個(gè)輸入變量的連續(xù)兩位進(jìn)行的,即尋址的位數(shù)由16位變成了32位。這樣,查找表的內(nèi)容也需要相應(yīng)的改變;而且完成一次運(yùn)算也由原來(lái)的B個(gè)時(shí)鐘周期變成了需要B/2+1個(gè)時(shí)鐘周期。
下面介紹一種更易于理解的串并行混合設(shè)計(jì)方法。
將式(5)改寫成如下形式:本文引用地址:http://m.butianyuan.cn/article/191941.htm
從式(9)得到流程圖如圖4(b)所示。
實(shí)現(xiàn)過(guò)程中應(yīng)該注意DA查找表的內(nèi)容,累加之前要乘2-1,注意進(jìn)位等。
從以上給出的兩種串并行結(jié)合的設(shè)計(jì)方法可以看到,只要將式(5)進(jìn)行適當(dāng)?shù)淖儞Q,還有其它的硬件實(shí)現(xiàn)方法,這里就不一一敘述了。
下面給出在K=8、B=16的情況下,不同的DA查找表所占用的資源。Xilinx公司的XC4000系列FPGA的一個(gè)CLB可以實(shí)現(xiàn)32×1大小的RAM,在圖4(a)中所描述的DA查找表占用2,048個(gè)CLB,而在圖4(b)中所描述的兩個(gè)DA查找表只占用256個(gè)CLB。用一片XC4025即可完成后者,其數(shù)據(jù)率可達(dá)到16MHz。
綜上所述,由于分布式運(yùn)算單元的應(yīng)用,改變了傳統(tǒng)的設(shè)計(jì)觀念,為基于FPGA的DSP設(shè)計(jì)提出了新的思路,必將在高速的FIR濾波器設(shè)計(jì)、高速FFT設(shè)計(jì)中得到廣泛的應(yīng)用。隨著FPGA集成規(guī)模的不斷提高(Xilinx公司Virtex系列已經(jīng)達(dá)到了百萬(wàn)門級(jí)),許多復(fù)雜的數(shù)學(xué)運(yùn)算已經(jīng)可以由FPGA來(lái)實(shí)現(xiàn),單片F(xiàn)PGA實(shí)現(xiàn)系統(tǒng)的設(shè)想即將變?yōu)楝F(xiàn)實(shí)。
評(píng)論