TI 全新TMS320C66x 定點(diǎn)與浮點(diǎn)DSP內(nèi)核成功挑戰(zhàn)速度極限
圖 2 所示的 TI 最新 C66x 內(nèi)核具有同 C64x+ 內(nèi)核相同的基本 A B 結(jié)構(gòu)。請(qǐng)注意,.M 單元的 16 位乘法器已增至每個(gè)功能單元 16 個(gè),從而實(shí)現(xiàn)內(nèi)核原始計(jì)算能力提升 4 倍。C66x DSP 實(shí)現(xiàn)的突破性創(chuàng)新使得由 4 個(gè)乘法器組成的各群集可協(xié)同工作以實(shí)施單精度浮點(diǎn)乘法運(yùn)算。
圖 2 - TI 最新 C66x DSP 內(nèi)核
C66x DSP 內(nèi)核可同時(shí)運(yùn)行多達(dá)八項(xiàng)浮點(diǎn)乘法運(yùn)算,加之高達(dá) 1.25 GHz 的時(shí)鐘頻率,使其當(dāng)之無(wú)愧地成為市場(chǎng)上性能最高的浮點(diǎn) DSP。將多個(gè) C66x DSP 內(nèi)核進(jìn)行完美整合,即可創(chuàng)建出具有出眾性能的多內(nèi)核片上系統(tǒng) (SoC) 設(shè)備。
浮點(diǎn)技術(shù)的成本為使定點(diǎn)與浮點(diǎn)組件都能同時(shí)實(shí)現(xiàn)最佳性能,TI 專為該款最新的 C66x 內(nèi)核開發(fā)了全新的浮點(diǎn)與定點(diǎn)指令,所有這些都對(duì)實(shí)現(xiàn)高效率的無(wú)線信號(hào)處理至關(guān)重要。由于采用浮點(diǎn)符號(hào)會(huì)帶來(lái)額外的計(jì)算復(fù)雜度,從而導(dǎo)致了定點(diǎn)與浮點(diǎn)處理器“分庭抗禮”的局面。在定點(diǎn)運(yùn)算情況下,加法、乘法等基本操作簡(jiǎn)單易行,但在浮點(diǎn)運(yùn)算情況下,這些基本操作需要做更多工作量。比如兩個(gè)浮點(diǎn)數(shù)相乘的情形:
請(qǐng)注意,指數(shù)需要相加操作,尾數(shù)則需要相乘操作。然后,最終 (M1×M2) 值需調(diào)整成 23 位的表示形式,這可能需要對(duì)指數(shù)的值也作更改。使用浮點(diǎn)技術(shù)進(jìn)行所有基本運(yùn)算時(shí)將需要很多額外的操作。
浮點(diǎn)計(jì)算帶來(lái)的額外復(fù)雜度恰好說(shuō)明了眾多算法僅采用定點(diǎn)表示數(shù)和定點(diǎn)運(yùn)算的原因。嵌入式處理器能夠更快地運(yùn)行定點(diǎn)運(yùn)算,并且在眾多情況下,只需要定點(diǎn)算法即可。例如,C66x DSP 內(nèi)核在每個(gè)周期內(nèi)都能執(zhí)行 16 項(xiàng)定點(diǎn)乘法運(yùn)算或者是 4 項(xiàng)浮點(diǎn)乘法運(yùn)算。為使定點(diǎn)和浮點(diǎn)組件都能同時(shí)實(shí)現(xiàn)最佳性能,TI 為該款最新的 C66x DSP 內(nèi)核開發(fā)了定點(diǎn)與浮點(diǎn)運(yùn)算指令,所有這些都對(duì)實(shí)現(xiàn)高效率的無(wú)線基站信號(hào)處理至關(guān)重要。浮點(diǎn)指令 FPi 包括:
1. 單精度復(fù)數(shù)乘法
2. 矢量乘法
3. 單精度矢量加減法
4. 單精度浮點(diǎn)-整數(shù)之間的矢量變換
5. 支持雙精度浮點(diǎn)算術(shù)運(yùn)算(加、減、乘、除及與整數(shù)間的轉(zhuǎn)換)并且完全為管線式
最新定點(diǎn)指令可實(shí)現(xiàn)最佳的矢量信號(hào)處理 (VSPi),其中包括:
1. 復(fù)數(shù)矢量和矩陣乘法,諸如針對(duì)矢量的 DCMPY,以及針對(duì)矩陣乘法的CMATMPYR1
2. 實(shí)矢量乘法
3. 增強(qiáng)型點(diǎn)積計(jì)算
4. 矢量加減法
5. 矢量位移
6. 矢量比較
7. 矢量打包與拆包
評(píng)論