FPGA為傳統(tǒng)DSP應用提供靈活的可重配置解決方案
這些設備中有許多是采用DSP實現(xiàn)的。雖然DSP可以通過軟件進行編程,但DSP硬件架構很不靈活。DSP的性能受很多固定硬件架構的限制,如總線性能瓶頸、固定數(shù)量的乘法累加(MAC)模塊、固定存儲器、固定硬件加速模塊和固定數(shù)據(jù)帶寬等。因此DSP的這種固定硬件架構對于許多要求定制DSP功能實現(xiàn)的應用來說并不適用。
FPGA可以為實現(xiàn)傳統(tǒng)DSP應用提供可重配置解決方案,并能比DSP提供更高的吞吐量和原始數(shù)據(jù)處理能力。由于FPGA的硬件是可配置的,因此它能在提供完整的硬件定制功能的同時實現(xiàn)各種DSP應用。用FPGA實現(xiàn)的DSP系統(tǒng)可以具有定制的架構、定制的總線結構、定制的存儲器、定制的硬件加速模塊和可變數(shù)量的MAC模塊。
自從新千年伊始,F(xiàn)PGA就已經擁有了專用數(shù)字信號處理(DSP)功能。過去六年來,F(xiàn)PGA提供的DSP性能已經提高了16倍之多,達到每秒500千兆次乘法-累加操作(GMACS)。在相同時期內,數(shù)字信號處理器的性能只從1.6GMACS提高到了目前的8GMACS。許多設備只需要少量的DSP性能,相當于類似Altera公司Cyclone II的FPGA提供的性能。不過,對于要求許多數(shù)字信號處理器的高性能設備來說,單個Altera Stratix III FPGA也能替代這些處理器,從而不僅能夠提供超過等效的DSP性能,還能顯著地減少系統(tǒng)功耗、以及電路板面積和成本。
對高性能DSP需求的關鍵驅動力來自無線通信基礎設施、視頻廣播設備、醫(yī)療成像和軍事應用。FPGA已經成為能夠滿足這些要求的首選可編程DSP平臺。
第三代通信基站平臺是需要使用大量DSP的系統(tǒng)之一,它包括了一塊射頻卡和一塊通道卡以及兩個主處理區(qū)。第三代無線通信產品大部分是寬帶產品,因此其射頻元件通常工作在線性范圍之外。先進的算法有助于滿足遠高于傳統(tǒng)數(shù)字信號處理器能力的處理要求。無線基礎設施中的主要設備現(xiàn)主要依靠FPGA實現(xiàn)射頻線性化處理。
圖1:近年來FPGA與DSP性能的演變情況。
FPGA成為首選處理平臺的另外一個領域是WiMAX基帶處理設備,它所采用的正交頻分復用(OFDM)技術的巨大運算要求只能用特殊應用集成電路(ASIC)或FPGA才能滿足。由于ASIC太貴,開發(fā)風險很大,因此FPGA成為了WiMAX市場的贏家。
使FPGA成為DSP領域理想解決方案的關鍵性能是什么?大量的乘法器、高的片上存儲器帶寬、大量I/O帶寬以及由于可編程邏輯帶來的獨特且完全靈活的FPGA架構都確保了沒有其它可編程技術可以提供相同的DSP性能。與其它半導體解決方案相比,F(xiàn)PGA可以在更低的功耗下提供最高性能的可編程DSP功能,同時還能降低系統(tǒng)成本和減小電路板面積。
系統(tǒng)設計師可以用一片或幾片F(xiàn)PGA開發(fā)出一塊原本要數(shù)十塊DSP和可能多塊電路板才能實現(xiàn)的電路板。因為FPGA支持在相同封裝內的縱向移植,因此可以在無需多電路板設計的條件下很容易將單板和系統(tǒng)設計從低端功能升級到最高功能。這種靈活性是很大的優(yōu)勢,因為它能減小產品線工程設計和驗證成本。
圖2. 第三代通信基站處理架構方框圖。
FPGA DSP有哪些新功能呢?隨著Stratix III FPGA系列器件的推出,DSP功能也有了新的發(fā)展,比如密度翻倍、性能顯著提升、功耗顯著降低,I/O性能也得到了增強,DSP模塊有了重大創(chuàng)新。
增加DSP模塊中的片上乘法器數(shù)量(最多是896個18×18乘法器)是重大的創(chuàng)舉。它允許在更少的硅片面積中封裝更多的乘法器,同時能降低功耗。DSP模塊通常是針對性能、靈活性和低功率做過優(yōu)化的硬模塊。DSP硅模塊有兩種物理約束:外設數(shù)量和使用面積大小。
DSP模塊的外圍有144根輸入線和144根輸出線,還有一些控制信號。DSP模塊的面積可以實現(xiàn)4個18×18的乘法器以及相應總的輸入輸出信號。對DSP模塊如何發(fā)展的芯片級和系統(tǒng)級研究的依據(jù)是那些特殊應用需求以及向65nm工藝技術轉移所產生的后果。
在芯片級,改變外設與DSP模塊面積的比例可以形成更多的I/O或更多的模塊級邏輯。在系統(tǒng)級,對DSP算法的調查表明乘法器邏輯的主要使用者是濾波和變換算法,它們都依賴于乘法累加操作來滿足大部分處理要求。在需要時通過優(yōu)化DSP模塊的內核面積可以增加一倍的乘法累加操作次數(shù),從而降低相對于總體運算的外圍I/O要求。通過在一個DSP模塊中完成更多的DSP算法,總的芯片效率就能有顯著的提高。
帶8個18×18乘法器和相關寄存器、累加器以及取舍電路的DSP模塊如圖3所示。乘法器的使用限制于DSP模塊的輸出線,而非邏輯面積。與競爭性架構相比,這種架構可以使硅片效率約提高50%。
圖3:Stratix III DSP模塊架構。
模塊的總體DSP功能減少了使用乘法累加操作的標準算法,如有限脈沖響應(FIR)濾波器或復雜乘法器,同時由于不需要使用可編程邏輯矩陣而減少了總體功率和資源消耗。當乘法累加操作作為算法的一部分被包含時,可以極大地增加18×18乘法器的數(shù)量。
對許多系統(tǒng)架構來說,F(xiàn)PGA的一個突出優(yōu)點是封裝的縱向移植性??v向移植可以使單塊電路板設計無需重做就能支持靈活的處理性能和成本。系統(tǒng)架構師可以運用這一功能開發(fā)出具有各種價位和性能的產品,卻不會顯著影響開發(fā)成本或庫存。另外,隨著Altera’s HardCopy結構化ASIC的推出,當需要考慮大批量和高性價比結構時可以獲得額外的性價比。
無線基礎架構應用是如何運用這種靈活性的一個很好例子。在靈活的通道單元盤中使用的FPGA支持各種標準,通過縱向移植還能支持各種通道密度。一個基站可以被配置為最少的通道數(shù),也可以使用相同的基礎架構對通道進行大擴容,只需改變專門的FPGA選擇。在許多發(fā)展中國家,注意力往往放在更靈活、可升級和業(yè)務豐富的設備上,這些設備就需要FPGA的這種靈活性。在這些對價格特別敏感的地區(qū),同一產品中非常標準化的功能可以使用HardCopy結構化ASIC以更低的成本來實現(xiàn)。采用這種解決方案的供應商將擁有強大的技術優(yōu)勢,無需增加工程成本就能提高業(yè)務的靈活性。
FPGA的I/O帶寬比DSP的帶寬要大得多。I/O帶寬是滿足系統(tǒng)處理要求的關鍵要素,而帶寬又受數(shù)據(jù)輸入輸出以及片外數(shù)據(jù)存儲器的影響。在對存儲器有很高要求的應用場合,Stratix III存儲器接口支持400MHz的DDR3存儲器,這個外部存儲器帶寬要比目前最先進的DSP高16倍。
因為系統(tǒng)級開發(fā)工具可以幫助系統(tǒng)架構師實現(xiàn)靈活性、可發(fā)展性、可維修性和高性能信號處理及控制架構,因此FPGA在過去幾年中發(fā)展非常迅速。這些工具包括DSP系統(tǒng)建模工具、系統(tǒng)綜合工具、控制處理IP、自動的C語言到硬件加速和DSP優(yōu)化的應用IP。設計師利用這些工具可以快速建立真正得到優(yōu)化以滿足系統(tǒng)要求的高性能架構。在縱向移植和HardCopy結構化ASIC的支持下,系統(tǒng)架構師可以根據(jù)產品線要求實現(xiàn)可擴展性能,實現(xiàn)各種產品以滿足不同市場要求,同時實現(xiàn)實質性的生產效益。
目前已經有完整開發(fā)FPGA中架構所必需的工具和IP,但系統(tǒng)架構中為何需要標準的第三方處理器還有其它原因。當?shù)谌教幚砥髋cFPGA一起使用時,它能通過一種被稱為FPGA協(xié)處理的架構技術顯著地提高系統(tǒng)性能,同時降低系統(tǒng)成本、功耗和電路板面積。在FPGA協(xié)處理過程中,F(xiàn)PGA可以從第三方處理器卸載處理任務繁重的算法。許多系統(tǒng)使用控制處理器、數(shù)字信號處理器和一個或多個FPGA(在FPGA中執(zhí)行主要的處理負載),其中控制和DSP用于滿足傳統(tǒng)軟件、操作系統(tǒng)要求或針對最終應用(如Windows GUI控制)的處理適用性。
高性能系統(tǒng)的核心信號處理將越來越多地轉向FPGA。FPGA可以提供其他任何半導體器件無法提供的最高的可編程DSP性能,在加上縱向移植以及面向低成本器件的HardCopy技術,目前沒有那種比此更靈活的系統(tǒng)架構解決方案能更好地滿足性能、低功耗、低成本和產品廣度及壽命要求。
作者:Paul Ekas
高級產品經理
Altera公司
評論