新聞中心

DSP的匯編程序優(yōu)化

作者: 時(shí)間:2010-08-24 來源:網(wǎng)絡(luò) 收藏

  xr4=[j4+:1];;

  xeomp(r4,r2);;

  if xah;do,xr4=0;;

  ifnxah;do,xr4=xr2;;

  [j5+=1]=xr4;;

  內(nèi)循環(huán)結(jié)束*/

  _Pieture_Segment_Inner_Loop_End:

  if nlele,jump_Picture_Segment Inner Loop(p);;

  外循環(huán)結(jié)束*/

  _Picture_segment_Outter_Loop_End:

  if nleoe,jump_Pieture_Segment_Outter_Loop(p);;

  實(shí)例3:

  lcO=xr0;;

  xrl=lshifi r0 by一1;;_

  _Picture_Segment_Outter_Loop:

  lcl=xrl;;

  _Picture_Segment_Inner_Loop:

  xr3=[j4+=l];;

  xeomp(r3,r2);xr4=[j4+=1];;(1)

  ifxalt;do,xr3=0;;

  if nxalt;do,xr3=xr2;;

  [j5+=l]=xr3;xcomp(r4,r2);;(2)

  /*循環(huán)擴(kuò)展部分*/

  if xalt;do,xr4:0;;

  ifnxah;do,xr4=xr2;;

  [j5+=1]=xr4;;

  _Picture_Segment_Inner_Loop_End:

  if nlele,jump_Pieture_Segmem Inner Loop(p);;

  _Picture segment_Outter_Loop_End:

  if nleoe,jump_Picture_Segment_Outter_Loop(p);;

  如實(shí)例3中的(1)、(2)所示,下一循環(huán)的取數(shù)和與閾值比較語(yǔ)句同上一循環(huán)中的指令達(dá)到了并行。分別運(yùn)行實(shí)例1與實(shí)例3并計(jì)算其每個(gè)像素所花費(fèi)的時(shí)間,可知實(shí)例1中平均每個(gè)像素花費(fèi)7.12個(gè)時(shí)鐘周期,而實(shí)例3中平均每個(gè)像素花費(fèi)5.12個(gè)時(shí)鐘周期,比前少用了差不多2個(gè)時(shí)鐘周期。

  (2)提前取數(shù)達(dá)到并行

  在循環(huán)外提前取數(shù),徹底打破循環(huán)中各指令間時(shí)間的先后順序,增強(qiáng)其獨(dú)立性并最終達(dá)到并行的目的,這也是一種常用的方法。實(shí)例4利用此種方法,在實(shí)例3的基礎(chǔ)上對(duì)實(shí)例1的代碼段做了進(jìn)一步的與精簡(jiǎn)。

  如實(shí)例4中所示,(1)在循環(huán)外提前進(jìn)行了取數(shù),并在(2)達(dá)到了并行,(3)、(4)對(duì)由于提前取數(shù)造成的指針移位和額外的賦值進(jìn)行了修正。但是,在使用此方法進(jìn)行精簡(jiǎn)時(shí)要特別注意循環(huán)結(jié)束后對(duì)指針的修正。經(jīng)計(jì)算。實(shí)例4平均每個(gè)像素所花費(fèi)的時(shí)間為4.18個(gè)指令周期。

  實(shí)例4:

  lcO=xrO::

  xrl=lshifi rO by-1;;

  _Picture_Segment_Outter_Loop:

  lcl=xrl::

  xr3=[j4=1];; (1)

  _Picture_Segment_Inner_Loop:



關(guān)鍵詞: 優(yōu)化 程序 匯編 DSP

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉