TI 全新TMS320C66x 定點(diǎn)與浮點(diǎn)DSP內(nèi)核成功挑戰(zhàn)速度極限
4
部分應(yīng)用采用定點(diǎn)技術(shù)的隱性成本盡管與浮點(diǎn)處理相比,DSP 能夠?qū)崿F(xiàn)更快的定點(diǎn)處理,但卻不得不為特定算法在開發(fā)時(shí)間方面相付出代價(jià)。通信系統(tǒng)典型的設(shè)計(jì)流程是首先基于計(jì)算機(jī)模型開發(fā)相應(yīng)算法,然后再將這些算法用在初始系統(tǒng)部署中。隨著部署及應(yīng)用范圍的不斷擴(kuò)大,工程師便可將收集到的現(xiàn)實(shí)世界的數(shù)據(jù)帶回實(shí)驗(yàn)室,以通過對(duì)算法的校正、調(diào)優(yōu)提升系統(tǒng)性能。通常可使用 Matlab 或其他固有的浮點(diǎn)工具開發(fā)新的算法。接下來面臨的挑戰(zhàn)是如何在保持算法和系統(tǒng)性能的同時(shí),將這些浮點(diǎn)算法轉(zhuǎn)換為定點(diǎn)算法。復(fù)雜拙劣的算法會(huì)占用大量系統(tǒng)資源,從而導(dǎo)致系統(tǒng)的整體性能下降。在需要用到復(fù)雜處理的情況下,將 Matlab 中的代碼移植到真實(shí)系統(tǒng)中就算耗費(fèi)數(shù)周乃至數(shù)月的時(shí)間也不是什么罕見的現(xiàn)象。TI 最新架構(gòu)具有原生浮點(diǎn)支持,從而使從浮點(diǎn)到定點(diǎn)的整個(gè)轉(zhuǎn)換過程變得毫無必要。通過在 C66x DSP 上使用浮點(diǎn)指令,可輕松將代碼從 Matlab 等工具中進(jìn)行移植,并直接編譯至 TI 的 DSP 中,如圖 3 所示。
圖 3 - 浮點(diǎn)功能可大幅加速產(chǎn)品上市進(jìn)程
浮點(diǎn)技術(shù)在 4G 基站中的重要作用無線電話正不斷演進(jìn)發(fā)展成為需要高數(shù)據(jù)量傳輸以支持視頻流和其他高寬帶應(yīng)用的復(fù)雜媒體平臺(tái)。為了充分滿足這些需求,無線行業(yè)需要在基站中部署 WiMax 和 LTE 等最新的 4G 技術(shù),力爭(zhēng)為終端用戶提供更高的數(shù)據(jù)吞吐量。這些 4G 基站利用多天線信號(hào)處理及 MIMO、Beamforming 等算法來提高其性能。通常情況下,這些算法會(huì)依賴本身易于量化和縮放與定點(diǎn)處理相關(guān)的問題的矩陣反演技術(shù)。采用浮點(diǎn)實(shí)施這些算法可進(jìn)一步提高系統(tǒng)的速度及精確度,從而獲得更高性能,并最終為移動(dòng)電話用戶帶來更精彩的體驗(yàn)。本文引用地址:http://m.butianyuan.cn/article/150339.htm
5
不斷增長(zhǎng)、層出不窮的高性能應(yīng)用亟需浮點(diǎn)運(yùn)算功能之前我們已經(jīng)討論過,由于執(zhí)行每個(gè)基本算術(shù)運(yùn)算需要較長(zhǎng)時(shí)間,所以浮點(diǎn)處理是很耗時(shí)的,但這種情況在當(dāng)算法需要很大動(dòng)態(tài)范圍操作時(shí)則不然。在 4G 處理的矩陣反轉(zhuǎn)操作中,由于沒有簡(jiǎn)單可行的定點(diǎn)操作方法,因此算法雖然運(yùn)行于定點(diǎn)處理器(無原生浮點(diǎn)支持)中,但基本還是被迫對(duì)浮點(diǎn)運(yùn)算進(jìn)行仿真。由于處理器沒有獲得定點(diǎn)功能的優(yōu)勢(shì),因而在與使用支持浮點(diǎn)運(yùn)算的處理器運(yùn)行時(shí),這些算法的運(yùn)行速度要慢很多。C66x DSP 自身支持浮點(diǎn)功能,所以消除了這種性能瓶頸。例如,C66x DSP 內(nèi)核運(yùn)行 MIMO 及其他關(guān)鍵的多天線信號(hào)處理算法比在 C64x+ DSP 上運(yùn)行定點(diǎn)功能的相同算法整整快 4 倍。
在國(guó)防、公共安全基礎(chǔ)設(shè)施及航空電子設(shè)備等各種任務(wù)關(guān)鍵型應(yīng)用領(lǐng)域,浮點(diǎn)功能不僅可簡(jiǎn)化開發(fā),同時(shí)還能大幅提高性能。由于能夠直接使用 MATLAB 中的代碼,浮點(diǎn)不僅能夠顯著縮短開發(fā)周期,并且與大型 FFT 等定點(diǎn)代碼相比,眾多算法的浮點(diǎn)實(shí)施也會(huì)占用更少的執(zhí)行周期。例如,雷達(dá)、導(dǎo)航與制導(dǎo)系統(tǒng)會(huì)處理通過傳感器陣列獲取的據(jù)量。眾多傳感器組件的各種不同能源模式可提供與目標(biāo)的跟蹤和定位相關(guān)的信息。這組數(shù)據(jù)必須通過線性方程組處理才能提取到所需信息。解決辦法包括矩陣反演、分解與自適應(yīng)濾波等數(shù)學(xué)函數(shù)。對(duì)更高輸出精度與更大動(dòng)態(tài)范圍的需求促使這些功能在諸如C66x 等 1.25GHz 浮點(diǎn)引擎上實(shí)現(xiàn)出眾的表現(xiàn)。另外,C66x 擁有的 SIMD 增強(qiáng)以及每周期定點(diǎn)能力高達(dá) 1.25GHz 32 MAC 的卓越性能,也為設(shè)計(jì)人員在選擇適合其應(yīng)用的浮點(diǎn)與定點(diǎn)組合方面提供了極大的靈活性。
除機(jī)器視覺、工業(yè)自動(dòng)化應(yīng)用外,超聲波等用于醫(yī)療影像的影像識(shí)別也需要非常高的計(jì)算準(zhǔn)確度,這些均可從浮點(diǎn)功能獲益匪淺。在進(jìn)行超聲波檢查時(shí),必須對(duì)聲源發(fā)出的信號(hào)進(jìn)行定義和處理,才能創(chuàng)建可提供實(shí)用診斷信息的輸出影像。對(duì)于用戶而言,C66x ISA 提供的更高精度可使影像系統(tǒng)達(dá)到更高的分辨率和識(shí)別率。
浮點(diǎn)應(yīng)用眾所周知的領(lǐng)域便是語音處理,其不僅需要嚴(yán)格的時(shí)延,同時(shí)還需要超高的采樣率,這些都會(huì)極度依賴浮點(diǎn)功能提供的更高計(jì)算精度和更大的動(dòng)態(tài)可變范圍來適應(yīng)濾波及其他降噪算法。此外,機(jī)器人設(shè)計(jì)也會(huì)考慮寬動(dòng)態(tài)范圍。因?yàn)檠b配線上也許會(huì)發(fā)生難以預(yù)料的事件。浮點(diǎn) DSP 的寬動(dòng)態(tài)范圍可確保機(jī)器人控制電路以可預(yù)知的形式處理不可預(yù)知的狀況。
結(jié)論TI 最新的 C66x 內(nèi)核催生了基于 DSP 的嵌入式處理器及SoCs 的創(chuàng)新類別,因而您無需再在定點(diǎn)處理器還是浮點(diǎn)處理器之間進(jìn)行利弊權(quán)衡。這一革命性的進(jìn)步將從根本上改變實(shí)時(shí)系統(tǒng)算法的設(shè)計(jì)與開發(fā)方式,從而使得系統(tǒng)開發(fā)人員能夠輕松而快速地構(gòu)建極具差異化功能的全新解決方案。
評(píng)論