基于Nios的FFT算法軟硬件協(xié)同設(shè)計(jì)
圖2為按頻率抽取法的蝶形運(yùn)算流程圖符號,這樣,就把1個(gè)N點(diǎn)DFT按k的奇偶分解為2個(gè)N/2點(diǎn)的DFT了。本文引用地址:http://m.butianyuan.cn/article/191448.htm
由以上分析可知,FFT算法中最核心的是蝶形運(yùn)算單元。而一個(gè)蝶形運(yùn)算單元主要由一次復(fù)數(shù)乘法,兩次復(fù)數(shù)加法構(gòu)成。為此整個(gè)FFT算法中,復(fù)數(shù)乘法和復(fù)數(shù)加法是最為核心的運(yùn)算單元。
2 FFT算法軟硬件協(xié)同設(shè)計(jì)
軟硬件協(xié)同設(shè)計(jì)指對系統(tǒng)中的軟硬件部分使用統(tǒng)一的描述和工具進(jìn)行集成開發(fā),完成全系統(tǒng)的設(shè)計(jì)驗(yàn)證并跨越軟硬件界面進(jìn)行系統(tǒng)優(yōu)化。其基本的設(shè)計(jì)流程是先用 VHDL語言和C語言進(jìn)行系統(tǒng)描述并進(jìn)行模擬仿真和系統(tǒng)功能驗(yàn)證;然后對軟硬件實(shí)現(xiàn)進(jìn)行功能劃分,分別用語言進(jìn)行設(shè)計(jì)并將其綜合起來進(jìn)行功能驗(yàn)證和性能預(yù) 測等仿真確認(rèn)(協(xié)調(diào)模擬仿真);其次進(jìn)行軟件和硬件詳細(xì)設(shè)計(jì);最后進(jìn)行系統(tǒng)測試。
根據(jù)上面的分析可知,F(xiàn)FT算法中最核心的是蝶形運(yùn)算單元,而復(fù)數(shù)乘法和復(fù)數(shù)加法又是蝶形運(yùn)算單元的核心,因此可以采取Nios的自定義指令功能,定制一條復(fù)數(shù)乘法指令和一條復(fù)數(shù)加法指令,以便完成一次蝶形運(yùn)算。
2.1 建立NiosⅡ嵌入式處理器系統(tǒng)
首先,利用QuartusⅡ建立項(xiàng)目工程,選用的目標(biāo)器件為CycloneⅡEP2C5Q:再用SOPCBuider創(chuàng)建NiosⅡ組件 模型,生成硬件描述文件,鎖定引腳后進(jìn)行綜合與適配,生成NiosⅡ硬件系統(tǒng)下載文件;然后建立NiosⅡ嵌入式系統(tǒng),從SOPC Builder組件欄中加入所需的組件(如NiosⅡCPU核、定時(shí)器Timer、JTAG_UART、Avalon三態(tài)總線橋、鍵輸入I/O口和 Flash等)。另外,為了實(shí)現(xiàn)NiosⅡ處理器對EPCS Flash存儲器的讀寫訪問,還要加入EPCS Serial FlashController組件。通過此控制器將用于FPGA配置的SOF文件和CPU運(yùn)行的軟件一并存于EPCS器件中,以便大大簡化硬件系統(tǒng)組成 結(jié)構(gòu)。為了保證所有組件的地址安排是合法的,要對各組件地址實(shí)行自動(dòng)分配;最后進(jìn)行全程編譯(即分析、綜合、適配和輸出文件裝配),完成NiosⅡ硬件系 統(tǒng)的設(shè)計(jì)。
2.2 利用DSP Builder生成復(fù)數(shù)乘法模塊
使用DSP Builder在FPGA上進(jìn)行DSP模塊的設(shè)計(jì),可實(shí)現(xiàn)高速DSP處理。但是,在實(shí)際應(yīng)用中,除了要求DSP高速外,由于DSP處理的算法往往比較復(fù) 雜,如果單純使用DSPBuilder來實(shí)現(xiàn)純硬件的DSP模塊,會耗費(fèi)過多的硬件資源,因此有時(shí)也無法完成許多算法復(fù)雜的模型。而NiosⅡ則是一個(gè)建 立在FPGA上的嵌入式微處理器軟核,它有一個(gè)重要的特性是具有自定制指令。在DSP算法中會反復(fù)出現(xiàn)一些運(yùn)算(如復(fù)數(shù)乘法器、整數(shù)乘法器、浮點(diǎn)乘法器 等),而在通用的CPU中都沒有專門用于復(fù)數(shù)乘法計(jì)算和浮點(diǎn)乘法計(jì)算的相關(guān)指令。在系統(tǒng)設(shè)計(jì)中,利用MA-TLAB、DSP Builder或者VHDL設(shè)計(jì)并生成復(fù)數(shù)乘法器、整數(shù)乘法器、浮點(diǎn)乘法器等硬件模塊。在QuartusⅡ環(huán)境中對上述文件做一些修正后,在SOPC Builder窗口中將它們定制為相應(yīng)的指令,并可設(shè)定或修改執(zhí)行該指令的時(shí)鐘周期。在進(jìn)行DSP算法運(yùn)算時(shí),可通過匯編或C語言,甚至C++語言來運(yùn)用 這些自定義指令進(jìn)行嵌入式程序設(shè)計(jì)。
根據(jù)復(fù)數(shù)運(yùn)算,設(shè)2個(gè)復(fù)數(shù)為a+bj和c+dj,則乘法表述為:
在MATLAB/Simulink下建立如圖3所示的復(fù)數(shù)乘法模型,圖中的Dataal、Databl和Resultl是DSP Builder中SOPCLibrary中Custom Ins-truction中的模塊,分別對應(yīng)Nios內(nèi)部ALU的2個(gè)輸入信號dataa和datab,以及ALU的輸出信號result。 Datareal、DataImag、DatbReal、Da-thlmag是一個(gè)總線位轉(zhuǎn)換模塊;BusConeatenation是總線復(fù)合模塊。 Dataa toComplex和Datab to Complex是一個(gè)實(shí)數(shù)轉(zhuǎn)復(fù)數(shù)的模塊,Com-plex Product是復(fù)數(shù)乘法模塊,Real Result是復(fù)數(shù)解出實(shí)部和虛部的模塊。
該模型完成了1個(gè)16位的復(fù)數(shù)乘法。在這個(gè)設(shè)計(jì)中,利用Nios32的32位數(shù)據(jù)位寬,把32位分成2部分,分別放入復(fù)數(shù)的實(shí)部和虛部,實(shí)部、虛部的位寬 都是16位,正好構(gòu)成1個(gè)32位數(shù),兩個(gè)16位復(fù)數(shù)進(jìn)行運(yùn)算后,把結(jié)果設(shè)為16位復(fù)數(shù),也用32位表示。設(shè)此模型的文件名為co-mplex.mdl。并 點(diǎn)擊Signalcompiler,對complex.mdl進(jìn)行轉(zhuǎn)換,在轉(zhuǎn)換窗口中分別作如下選擇:器件選擇CycloneⅡ;綜合器選擇Quart- usⅡ;“SOPC Info”的generate SOPC Builder PTF File項(xiàng)要選擇打勾。分別單擊轉(zhuǎn)換按鈕1-Convert和綜合按鈕2-Synthesis即可將其轉(zhuǎn)換成標(biāo)準(zhǔn)的VHDL語言。
2.3 在Nios中加入復(fù)數(shù)乘法指令
在已建立的SOPC設(shè)計(jì)中,雙擊CPU項(xiàng),點(diǎn)擊“Import”按紐,點(diǎn)擊“ADD按紐,打開Complex_ei.vhd,再點(diǎn)擊 “Readport-list from files按紐,點(diǎn)擊“ADD to System”按紐,加入該設(shè)計(jì)作為指令執(zhí)行模塊。最后再將整個(gè)項(xiàng)目重新編譯一次,鎖定引腳后,再下載到目標(biāo)器件中。為此即在Nios指令中定制了一條名 為COMP的復(fù)數(shù)乘法指令,在進(jìn)行C語言編程時(shí),其調(diào)用格式為z=nm_comp(x,y),其中x和y為兩個(gè)復(fù)數(shù),其運(yùn)算結(jié)果放在z中。用同樣的方法, 可以建立復(fù)數(shù)加法指令和復(fù)數(shù)減法指令。由此可見,利用DSP Builder很容易地實(shí)現(xiàn)了FFT算法中的復(fù)數(shù)運(yùn)算指令的定制。同時(shí)在定制指令時(shí),對于浮點(diǎn)數(shù)的處理,采用統(tǒng)一為幾位二進(jìn)制有效數(shù)字的辦法來解決的,比 如說:小數(shù)位數(shù)固定為4位,整數(shù)位數(shù)固定為6位,那么可以定義一個(gè)向量signal num:std_logic_vector(9down to 0);在做運(yùn)算的時(shí)候,注意高6位是整數(shù)、低4位是小數(shù),就可以達(dá)到實(shí)型數(shù)據(jù)的處理。
評論