新聞中心

EEPW首頁 > 模擬技術(shù) > 設(shè)計應(yīng)用 > 基于矩陣乘法器的MP3解碼優(yōu)化設(shè)計

基于矩陣乘法器的MP3解碼優(yōu)化設(shè)計

作者: 時間:2011-02-10 來源:網(wǎng)絡(luò) 收藏


2.2 基于的快速DCT算法優(yōu)化
3×3由觸發(fā)器和乘累加器組成,是高性能DSP處理器的重要部件,也是實時處理的核心,其速度直接影響DSP處理器的速度。的實現(xiàn)有很多種,基本上都基于并行計算原則。由于每列結(jié)果與其他列不相關(guān),因此可以通過增加乘法器多列同時計算,經(jīng)過n次乘累加就可以得到最后結(jié)果。圖3給出矩陣乘法器的結(jié)構(gòu)。

本文引用地址:http://m.butianyuan.cn/article/187628.htm


顯然,這種結(jié)構(gòu)的計算速度很快,但是使用乘法器會因矩陣維數(shù)n的增加而快速增加,使用的觸發(fā)器也很多。在很多場合下,只要滿足處理速度的要求,完全沒有必要浪費這么多硬件資源,而是只要1個乘累加單元流水作業(yè),分步計算每1列結(jié)果既可。在做乘累加計算1個元素時候,準(zhǔn)備下一組參與運算的數(shù)據(jù),如此循環(huán),同樣可以獲得較高的處理速度。
在該設(shè)計中,由于B矩陣是1×n的一維向量輸入數(shù)據(jù),A矩陣為DCT系數(shù)矩陣,A矩陣中的元素為n個系數(shù)的線性組合,因此整個矩陣乘法器需要2組n個觸發(fā)器分別存放輸入數(shù)據(jù)和n個系數(shù),1個乘累加單元。輸入數(shù)據(jù)X[0:n],從X[O]到X[n]循環(huán)n次進(jìn)入乘法器,使用選擇信號Assi-gn[0:n]選擇系數(shù)C[0:n],另外系數(shù)符號由Sign信號軟件控制,基本結(jié)構(gòu)如圖4所示。


由于DCT計算本質(zhì)上就是n×n矩陣乘法運算,而n×n矩陣乘法器是在通用乘法器的基礎(chǔ)上增加2組分別存放系數(shù)矩陣的系數(shù)C(n)和輸入X(n)的n個寄存器,使之實現(xiàn)長度為n的乘累加功能,同時還需保存上次乘法結(jié)果。其中,DCT中的系數(shù)是一組n維基的n種線性組合。只需1次輸入n個系數(shù),使用軟件進(jìn)行選擇和符號控制就可實現(xiàn)這些不同系數(shù)組合,無需反復(fù)往寄存器中置數(shù),大大提高了取數(shù)/置數(shù)的效率,節(jié)省了整個DCT的運算時間。
因此在計算32點的DCT,可將32點DCT分解為2個16點的DCT計算,計算量也減少1倍??梢允褂?組16×16的矩陣乘法器并行計算,使得計算時間大幅減少。表2是通過增加矩陣乘法器優(yōu)化處理后,子帶綜合濾波使用不同實現(xiàn)方式所需要的時間。


結(jié)果表明,第2.1節(jié)中使用快速32點DCT算法改進(jìn)子帶綜合濾波計算是有效的,直接減少59%的計算時間。在采用并行2個16×16矩陣乘法器加速快速32點DCT的計算,可以取得明顯的效果:使得計算時間比原算法減少了約91.4%,而且硬件上只增加1個乘法器和30個數(shù)據(jù)鎖存器,以及部分控制電路。使用軟硬件協(xié)同操作就可以獲得子帶綜合濾波計算速度上的大幅度上升。

3 結(jié)語
該設(shè)計面向SoC實現(xiàn)了利用增加矩陣乘法器就可加快基于32點快速DCT算法的中子帶綜合濾波的處理速度,大大緩解了系統(tǒng)的頸瓶,使得采用系統(tǒng)主頻比較低(fs≤100 MHz)的SoC平臺進(jìn)行成為可能。

電源濾波器相關(guān)文章:電源濾波器原理



上一頁 1 2 下一頁

關(guān)鍵詞: MP3 矩陣 乘法器 解碼

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉