FPGA為傳統(tǒng)DSP應(yīng)用提供靈活的可重配置解決方案
這些設(shè)備中有許多是采用DSP實現(xiàn)的。雖然DSP可以通過軟件進行編程,但DSP硬件架構(gòu)很不靈活。DSP的性能受很多固定硬件架構(gòu)的限制,如總線性能瓶頸、固定數(shù)量的乘法累加(MAC)模塊、固定存儲器、固定硬件加速模塊和固定數(shù)據(jù)帶寬等。因此DSP的這種固定硬件架構(gòu)對于許多要求定制DSP功能實現(xiàn)的應(yīng)用來說并不適用。
FPGA可以為實現(xiàn)傳統(tǒng)DSP應(yīng)用提供可重配置解決方案,并能比DSP提供更高的吞吐量和原始數(shù)據(jù)處理能力。由于FPGA的硬件是可配置的,因此它能在提供完整的硬件定制功能的同時實現(xiàn)各種DSP應(yīng)用。用FPGA實現(xiàn)的DSP系統(tǒng)可以具有定制的架構(gòu)、定制的總線結(jié)構(gòu)、定制的存儲器、定制的硬件加速模塊和可變數(shù)量的MAC模塊。
自從新千年伊始,F(xiàn)PGA就已經(jīng)擁有了專用數(shù)字信號處理(DSP)功能。過去六年來,F(xiàn)PGA提供的DSP性能已經(jīng)提高了16倍之多,達到每秒500千兆次乘法-累加操作(GMACS)。在相同時期內(nèi),數(shù)字信號處理器的性能只從1.6GMACS提高到了目前的8GMACS。許多設(shè)備只需要少量的DSP性能,相當(dāng)于類似Altera公司Cyclone II的FPGA提供的性能。不過,對于要求許多數(shù)字信號處理器的高性能設(shè)備來說,單個Altera Stratix III FPGA也能替代這些處理器,從而不僅能夠提供超過等效的DSP性能,還能顯著地減少系統(tǒng)功耗、以及電路板面積和成本。
對高性能DSP需求的關(guān)鍵驅(qū)動力來自無線通信基礎(chǔ)設(shè)施、視頻廣播設(shè)備、醫(yī)療成像和軍事應(yīng)用。FPGA已經(jīng)成為能夠滿足這些要求的首選可編程DSP平臺。
第三代通信基站平臺是需要使用大量DSP的系統(tǒng)之一,它包括了一塊射頻卡和一塊通道卡以及兩個主處理區(qū)。第三代無線通信產(chǎn)品大部分是寬帶產(chǎn)品,因此其射頻元件通常工作在線性范圍之外。先進的算法有助于滿足遠高于傳統(tǒng)數(shù)字信號處理器能力的處理要求。無線基礎(chǔ)設(shè)施中的主要設(shè)備現(xiàn)主要依靠FPGA實現(xiàn)射頻線性化處理。
圖1:近年來FPGA與DSP性能的演變情況。
FPGA成為首選處理平臺的另外一個領(lǐng)域是WiMAX基帶處理設(shè)備,它所采用的正交頻分復(fù)用(OFDM)技術(shù)的巨大運算要求只能用特殊應(yīng)用集成電路(ASIC)或FPGA才能滿足。由于ASIC太貴,開發(fā)風(fēng)險很大,因此FPGA成為了WiMAX市場的贏家。
使FPGA成為DSP領(lǐng)域理想解決方案的關(guān)鍵性能是什么?大量的乘法器、高的片上存儲器帶寬、大量I/O帶寬以及由于可編程邏輯帶來的獨特且完全靈活的FPGA架構(gòu)都確保了沒有其它可編程技術(shù)可以提供相同的DSP性能。與其它半導(dǎo)體解決方案相比,F(xiàn)PGA可以在更低的功耗下提供最高性能的可編程DSP功能,同時還能降低系統(tǒng)成本和減小電路板面積。
系統(tǒng)設(shè)計師可以用一片或幾片F(xiàn)PGA開發(fā)出一塊原本要數(shù)十塊DSP和可能多塊電路板才能實現(xiàn)的電路板。因為FPGA支持在相同封裝內(nèi)的縱向移植,因此可以在無需多電路板設(shè)計的條件下很容易將單板和系統(tǒng)設(shè)計從低端功能升級到最高功能。這種靈活性是很大的優(yōu)勢,因為它能減小產(chǎn)品線工程設(shè)計和驗證成本。
圖2. 第三代通信基站處理架構(gòu)方框圖。
FPGA DSP有哪些新功能呢?隨著Stratix III FPGA系列器件的推出,DSP功能也有了新的發(fā)展,比如密度翻倍、性能顯著提升、功耗顯著降低,I/O性能也得到了增強,DSP模塊有了重大創(chuàng)新。
增加DSP模塊中的片上乘法器數(shù)量(最多是896個18×18乘法器)是重大的創(chuàng)舉。它允許在更少的硅片面積中封裝更多的乘法器,同時能降低功耗。DSP模塊通常是針對性能、靈活性和低功率做過優(yōu)化的硬模塊。DSP硅模塊有兩種物理約束:外設(shè)數(shù)量和使用面積大小。
DSP模塊的外圍有144根輸入線和144根輸出線,還有一些控制信號。DSP模塊的面積可以實現(xiàn)4個18×18的乘法器以及相應(yīng)總的輸入輸出信號。對DSP模塊如何發(fā)展的芯片級和系統(tǒng)級研究的依據(jù)是那些特殊應(yīng)用需求以及向65nm工藝技術(shù)轉(zhuǎn)移所產(chǎn)生的后果。
在芯片級,改變外設(shè)與DSP模塊面積的比例可以形成更多的I/O或更多的模塊級邏輯。在系統(tǒng)級,對DSP算法的調(diào)查表明乘法器邏輯的主要使用者是濾波和變換算法,它們都依賴于乘法累加操作來滿足大部分處理要求。在需要時通過優(yōu)化DSP模塊的內(nèi)核面積可以增加一倍的乘法累加操作次數(shù),從而降低相對于總體運算的外圍I/O要求。通過在一個DSP模塊中完成更多的DSP算法,總的芯片效率就能有顯著的提高。
帶8個18×18乘法器和相關(guān)寄存器、累加器以及取舍電路的DSP模塊如圖3所示。乘法器的使用限制于DSP模塊的輸出線,而非邏輯面積。與競爭性架構(gòu)相比,這種架構(gòu)可以使硅片效率約提高50%。
圖3:Stratix III DSP模塊架構(gòu)。
模塊的總體DSP功能減少了使用乘法累加操作的標(biāo)準(zhǔn)算法,如有限脈沖響應(yīng)(FIR)濾波器或復(fù)雜乘法器,同時由于不需要使用可編程邏輯矩陣而減少了總體功率和資源消耗。當(dāng)乘法累加操作作為算法的一部分被包含時,可以極大地增加18×18乘法器的數(shù)量。
對許多系統(tǒng)架構(gòu)來說,F(xiàn)PGA的一個突出優(yōu)點是封裝的縱向移植性。縱向移植可以使單塊電路板設(shè)計無需重做就能支持靈活的處理性能和成本。系統(tǒng)架構(gòu)師可以運用這一功能開發(fā)出具有各種價位和性能的產(chǎn)品,卻不會顯著影響開發(fā)成本或庫存。另外,隨著Altera’s HardCopy結(jié)構(gòu)化ASIC的推出,當(dāng)需要考慮大批量和高性價比結(jié)構(gòu)時可以獲得額外的性價比。
無線基礎(chǔ)架構(gòu)應(yīng)用是如何運用這種靈活性的一個很好例子。在靈活的通道單元盤中使用的FPGA支持各種標(biāo)準(zhǔn),通過縱向移植還能支持各種通道密度。一個基站可以被配置為最少的通道數(shù),也可以使用相同的基礎(chǔ)架構(gòu)對通道進行大擴容,只需改變專門的FPGA選擇。在許多發(fā)展中國家,注意力往往放在更靈活、可升級和業(yè)務(wù)豐富的設(shè)備上,這些設(shè)備就需要FPGA的這種靈活性。在這些對價格特別敏感的地區(qū),同一產(chǎn)品中非常標(biāo)準(zhǔn)化的功能可以使用HardCopy結(jié)構(gòu)化ASIC以更低的成本來實現(xiàn)。采用這種解決方案的供應(yīng)商將擁有強大的技術(shù)優(yōu)勢,無需增加工程成本就能提高業(yè)務(wù)的靈活性。
FPGA的I/O帶寬比DSP的帶寬要大得多。I/O帶寬是滿足系統(tǒng)處理要求的關(guān)鍵要素,而帶寬又受數(shù)據(jù)輸入輸出以及片外數(shù)據(jù)存儲器的影響。在對存儲器有很高要求的應(yīng)用場合,Stratix III存儲器接口支持400MHz的DDR3存儲器,這個外部存儲器帶寬要比目前最先進的DSP高16倍。
因為系統(tǒng)級開發(fā)工具可以幫助系統(tǒng)架構(gòu)師實現(xiàn)靈活性、可發(fā)展性、可維修性和高性能信號處理及控制架構(gòu),因此FPGA在過去幾年中發(fā)展非常迅速。這些工具包括DSP系統(tǒng)建模工具、系統(tǒng)綜合工具、控制處理IP、自動的C語言到硬件加速和DSP優(yōu)化的應(yīng)用IP。設(shè)計師利用這些工具可以快速建立真正得到優(yōu)化以滿足系統(tǒng)要求的高性能架構(gòu)。在縱向移植和HardCopy結(jié)構(gòu)化ASIC的支持下,系統(tǒng)架構(gòu)師可以根據(jù)產(chǎn)品線要求實現(xiàn)可擴展性能,實現(xiàn)各種產(chǎn)品以滿足不同市場要求,同時實現(xiàn)實質(zhì)性的生產(chǎn)效益。
目前已經(jīng)有完整開發(fā)FPGA中架構(gòu)所必需的工具和IP,但系統(tǒng)架構(gòu)中為何需要標(biāo)準(zhǔn)的第三方處理器還有其它原因。當(dāng)?shù)谌教幚砥髋cFPGA一起使用時,它能通過一種被稱為FPGA協(xié)處理的架構(gòu)技術(shù)顯著地提高系統(tǒng)性能,同時降低系統(tǒng)成本、功耗和電路板面積。在FPGA協(xié)處理過程中,F(xiàn)PGA可以從第三方處理器卸載處理任務(wù)繁重的算法。許多系統(tǒng)使用控制處理器、數(shù)字信號處理器和一個或多個FPGA(在FPGA中執(zhí)行主要的處理負(fù)載),其中控制和DSP用于滿足傳統(tǒng)軟件、操作系統(tǒng)要求或針對最終應(yīng)用(如Windows GUI控制)的處理適用性。
高性能系統(tǒng)的核心信號處理將越來越多地轉(zhuǎn)向FPGA。FPGA可以提供其他任何半導(dǎo)體器件無法提供的最高的可編程DSP性能,在加上縱向移植以及面向低成本器件的HardCopy技術(shù),目前沒有那種比此更靈活的系統(tǒng)架構(gòu)解決方案能更好地滿足性能、低功耗、低成本和產(chǎn)品廣度及壽命要求。
作者:Paul Ekas
高級產(chǎn)品經(jīng)理
Altera公司
評論