FPGA將成為傳統(tǒng)DSP的有力挑戰(zhàn)
寬帶革命
市場(chǎng)環(huán)境的變化將會(huì)改變未來(lái)幾年內(nèi)DSP實(shí)現(xiàn)的方式。最顯著地,寬帶革命將帶來(lái)最大的挑戰(zhàn)。
寬帶革命是由傳統(tǒng)上分別屬于不同領(lǐng)域的許多技術(shù)的融合所引發(fā)。其中包括計(jì)算、電信/無(wú)線、視頻、圖像和網(wǎng)絡(luò)等。圖1突出了由這一融合而新產(chǎn)生的一些新應(yīng)用。
此類新興應(yīng)用需要處理的模擬和數(shù)字?jǐn)?shù)據(jù)量呈指數(shù)型增長(zhǎng)。這又進(jìn)一步加大了對(duì)更快的DSP的需求。雖然摩爾定律仍適用于目前最快的DSP,但在所需要的性能水平與實(shí)際DSP器件所提供性能水平間的差距仍在不斷增大(參看圖2)。因此很明顯,DSP要滿足寬帶革命所提出的挑戰(zhàn)必須尋求新的數(shù)據(jù)處理方法。
此外,今天快速變化的市場(chǎng)上,產(chǎn)品上市時(shí)間縮短。同時(shí)由于競(jìng)爭(zhēng)產(chǎn)品跟上的速度更快,因此產(chǎn)品量產(chǎn)階段更短。所以,上市時(shí)間變得更為關(guān)鍵,F(xiàn)PGA供應(yīng)商很早就意識(shí)到了這一點(diǎn)。過(guò)去上市晚僅僅是利潤(rùn)少一些,今天則意味著根本沒(méi)有利潤(rùn),甚至某些情況下是生意徹底失?。?br>
這意味著DSP需要足夠靈活以滿足不斷縮短的上市時(shí)間要求。
采用FPGA實(shí)現(xiàn)高性能DSP
主流制造商,如TI、ADI和Motorola,生產(chǎn)的傳統(tǒng)DSP有通用產(chǎn)品或特殊應(yīng)用標(biāo)準(zhǔn)產(chǎn)品(ASSP)。通用DSP的優(yōu)點(diǎn)是通過(guò)編程可以應(yīng)用在廣泛的產(chǎn)品中。而特殊應(yīng)用產(chǎn)品則是針對(duì)特定的應(yīng)用而開(kāi)發(fā)的,如ADSL調(diào)制解調(diào)器(帶DSP核心的ASSP),或針對(duì)特定客戶而開(kāi)發(fā)(帶DSP核心的ASIC)。在性能要求較低的應(yīng)用中,甚至也可利用微處理器作為DSP。
傳統(tǒng)通用DSP采用馮-諾依曼(Von Neumann)結(jié)構(gòu),或某種類型的擴(kuò)展。此類結(jié)構(gòu)本質(zhì)上是串行的,因此性能受到一定的限制。傳統(tǒng)DSP中的乘法和累加(MAC)部件通常是共享資源的。
FIR濾波器對(duì)輸入信號(hào)進(jìn)行濾波,其方法是將每一輸入信號(hào)數(shù)據(jù)樣本與幾個(gè)恒定數(shù)值(系統(tǒng))相乘,然后對(duì)結(jié)果進(jìn)行累加。加到輸入信號(hào)上的MAC操作越多,濾波器越精確。例如,256階FIR濾波器中對(duì)每個(gè)數(shù)據(jù)樣本需要進(jìn)行256次MAC操作,然后才能處理下一個(gè)樣本。
FPGA供應(yīng)商在其產(chǎn)品中也提供了DSP功能。例如,世界上的許多手機(jī)基站產(chǎn)品采用了Xilinx公司Virtex-E FPGA。為了建立大量的連接,手機(jī)基站需要處理大量的數(shù)據(jù),其中大部分是采用某種DSP實(shí)現(xiàn)的。
FPGA提供的DSP性能已超過(guò)1280億MAC每秒,大大高于目前主流供應(yīng)商所能提供的傳統(tǒng)DSP的性能。Virtex-II可以提供6千億MAC每秒的性能。為達(dá)到這樣的性能,F(xiàn)PGA采用了多路并行結(jié)構(gòu)處理輸入信號(hào)(參看圖3)。
采用這種并行結(jié)構(gòu),256階FIR濾波器中的每個(gè)樣本可以在一個(gè)時(shí)鐘周期內(nèi)處理完,因此極大地改善了DSP的性能和效率。
PLD中嵌入DSP
很多PLD廠商開(kāi)始采取行動(dòng)。Xilinx作為世界可編程邏輯器件的領(lǐng)導(dǎo)廠商,擁有先進(jìn)的FPGA技術(shù)以及先進(jìn)的開(kāi)發(fā)工具。2000年11月,推出DSP行動(dòng),試圖進(jìn)入這一市場(chǎng)。
Xilinx XtremeDSP行動(dòng)的目標(biāo)是希望滿足寬帶革命的高性能挑戰(zhàn)。其它特性還包括根據(jù)如芯片面積(相應(yīng)于使用的資源)和系統(tǒng)頻率來(lái)優(yōu)化DSP設(shè)計(jì)。XtremeDSP行動(dòng)還推出了一些開(kāi)發(fā)工具可彌補(bǔ)傳統(tǒng)上在DSP和FPGA設(shè)計(jì)方法間存在的差距。
Virtex-II提供的性能包括:
·千萬(wàn)門(mén)FPGA結(jié)構(gòu)允許實(shí)現(xiàn)大量的并行處理。
·最多達(dá)192(18×18)個(gè)嵌入式乘法器,工作頻率依字大小不同最高可達(dá)250MHz,可在最小的芯片面積上實(shí)現(xiàn)快速無(wú)延遲乘法操作。
·最多3.5M位完全雙口塊RAM,可優(yōu)化數(shù)據(jù)緩沖和存儲(chǔ)。
新的Virtex-II系列的增強(qiáng)結(jié)構(gòu)使其在實(shí)現(xiàn)需要計(jì)算的算法時(shí)具有獨(dú)特的優(yōu)勢(shì)。Xilinx提供的測(cè)試數(shù)據(jù)表明,Xilinx FPGA比業(yè)界最快的DSP運(yùn)行要快100倍。因此,單個(gè)FPGA即可代替?zhèn)鹘y(tǒng)上所謂的DSP處理器陣列。
傳統(tǒng)上基于SRAM的FPGA具有現(xiàn)場(chǎng)容易改變和升級(jí)的靈活性,除此以外,XtremeDSP還增加了如下性能。
兩個(gè)這樣的新性能即是分布式資源和分段布線(segmented routing)。
·分布式DSP資源——這使設(shè)計(jì)者可以根據(jù)算法和性能要求改變DSP結(jié)構(gòu),從而達(dá)到面積/成本或性能/系統(tǒng)頻率最優(yōu)的設(shè)計(jì)。
·分段布線(采用動(dòng)態(tài)互連)——可保證與器件大小和集成到FPGA中的其它系統(tǒng)功能無(wú)關(guān),始終達(dá)到最高的性能。
Xilinx XtremeDSP計(jì)劃中最令人心動(dòng)的方面可能就是能夠提高生產(chǎn)率。XtremeDSP計(jì)劃縮短了FPGA DSP設(shè)計(jì)周期。將主要通過(guò)配合Simulink使用的MathWorks系統(tǒng)生成器和濾波器生成器來(lái)實(shí)現(xiàn)。
·Simulink系統(tǒng)生成器——傳統(tǒng)上FPGA和DSP的設(shè)計(jì)流程非常不同。利用與MathWorks的伙伴關(guān)系,Xilinx開(kāi)發(fā)的系統(tǒng)生成器填補(bǔ)了FPGA和傳統(tǒng)DSP設(shè)計(jì)流程間的差距。
·濾波器生成器——如前面所述,數(shù)字濾波器是DSP最經(jīng)常的用途。一系列DSP供應(yīng)商提供了濾波器生成器以加快漫長(zhǎng)的濾波器設(shè)計(jì)過(guò)程。然而,目前市面的FPGA濾波器生成器要么只能生成完全串行(即生成芯片面積最小但性能最低的實(shí)施方案)的濾波器或完全并行(生成性能最高但芯片面積效率最低的實(shí)施方案)的濾波器。然后,多數(shù)的DSP設(shè)計(jì)并不是需要完全串行或完全并行的實(shí)施方案,而是介于其中的混合方案。Xilinx濾波器生成器是約束條件驅(qū)動(dòng)的,可以根據(jù)給定的性能級(jí)別或并行程度生成占用資源最優(yōu)的實(shí)施方案。
評(píng)論