基于FPGA協(xié)處理的無(wú)線子系統(tǒng)分析
子系統(tǒng)劃分選擇方案
本文引用地址:http://m.butianyuan.cn/article/149085.htmFPGA可與DSP處理器一起使用,作為獨(dú)立的預(yù)處理器(有時(shí)是后處理器)器件,或者作為協(xié)處理器。在預(yù)處理架構(gòu)中,FPGA直接位于數(shù)據(jù)通路中負(fù)責(zé)信號(hào)預(yù)處理,預(yù)處理后的信號(hào)可以高效又經(jīng)濟(jì)地移交給DSP處理器進(jìn)行速率較低的后續(xù)處理。
在協(xié)處理架構(gòu)中,FPGA與DSP并列而置,后者將特定算法函數(shù)卸載給FPGA,以便實(shí)現(xiàn)比單獨(dú)采用DSP處理器能達(dá)到的速度更高的處理速度。FPGA的處理結(jié)果傳回DSP,或者送至其他器件進(jìn)一步進(jìn)行處理、傳輸或存儲(chǔ)(圖1)。
選擇預(yù)處理、后處理還是協(xié)處理,常常取決于在處理器和FPGA之間移動(dòng)數(shù)據(jù)所需的時(shí)序余量及其對(duì)整體延遲的影響。雖然協(xié)處理解決方案是設(shè)計(jì)人員最??紤]的拓?fù)浣Y(jié)構(gòu)(主要是因?yàn)镈SP可以更直接地控制數(shù)據(jù)移交過(guò)程),但這并不一定總是最佳的總體策略。
例如,最新的3G LTE規(guī)范將傳輸時(shí)間間隔(TTI)從HSDPA的2ms和WCDMA的10ms縮短到了1ms。這實(shí)質(zhì)上是要求從接收器一直到MAC層輸出之間的數(shù)據(jù)處理時(shí)間短于1,000?sec。
圖1:FPGA 用作預(yù)處理器和協(xié)處理器的解決方案
如圖2所示,在運(yùn)行速度為3.125Gbps的DSP上使用SRIO端口(使用8b/10b編碼,Turbo解碼功能需要200比特的額外開(kāi)銷)會(huì)造成230?sec的DSP到FPGA傳輸延遲(也就是說(shuō)TTI時(shí)段中有將近四分之一僅用來(lái)傳輸數(shù)據(jù))。加之其他可預(yù)見(jiàn)的延遲,為滿足這些系統(tǒng)時(shí)序,當(dāng)用戶為50個(gè)時(shí),所需的Turbo編解碼器性能就是高達(dá)75.8Mbps。
圖2:協(xié)處理數(shù)據(jù)傳輸延遲問(wèn)題的 LTE 示例
使用FPGA將Turbo編解碼器作為基本上獨(dú)立的后處理器來(lái)處理,不僅可消除DSP延遲,還能節(jié)省時(shí)間,因?yàn)椴恍枰愿邘捲贒SP和FPGA之間傳輸數(shù)據(jù)。這樣做可將Turbo解碼器的吞吐量降至47Mbps,因而可選用更多比較經(jīng)濟(jì)的器件,并且可以減少系統(tǒng)功耗。
另一項(xiàng)考慮是在XilinxFPGA上是否使用軟嵌入式或硬嵌入式處理器IP來(lái)卸載某些系統(tǒng)處理任務(wù),進(jìn)而可能進(jìn)一步減少成本、功耗和占用空間。有了如此大量的信號(hào)處理資源,就可以在DSP處理器、FPGA可配置邏輯塊(CLB)、嵌入式FPGA DSP模塊和FPGA嵌入式處理器之間更好地分配各種復(fù)雜功能(如基帶處理中的復(fù)雜功能)。Xilinx提供了兩種類型的嵌入式處理器:MicroBlaze軟核處理器(常用于系統(tǒng)控制)和性能更高的PowerPC硬核嵌入式處理器(用于更復(fù)雜的任務(wù))。
FPGA嵌入式處理器提供的有利條件允許將所有非關(guān)鍵性操作都合并到在嵌入式處理器上運(yùn)行的軟件中,從而盡量減少整體系統(tǒng)所需的硬件資源總量。
軟件和IP的重要性
關(guān)鍵問(wèn)題是如何將這種潛在能力全部釋放出來(lái)。必須考慮需要用哪些軟件對(duì)問(wèn)題的復(fù)雜性進(jìn)行抽象以及可以使用哪些IP,應(yīng)該考慮利用FPGA為關(guān)鍵部分提供最佳解決方案。
評(píng)論