XC166單片機(jī)的DSP程序優(yōu)化方法
1.4 指令流水線(xiàn)重排
指令流水線(xiàn)重排的意思是通過(guò)軟件程序中的指令重排來(lái)改變指令流水線(xiàn),以此來(lái)排除由于硬件引起的指令堵塞,從而加快程序的運(yùn)行時(shí)間。這種優(yōu)化操作通常用在匯編程序中,指令流水線(xiàn)重排是一個(gè)一般的優(yōu)化原理,把這個(gè)原理用于不同類(lèi)型的單片機(jī)可以導(dǎo)出不同的與單片機(jī)硬件相關(guān)的優(yōu)化方法。下面介紹的基于XC166單片機(jī)的優(yōu)化方法主要是應(yīng)用這個(gè)優(yōu)化原理得到的。
2 與芯片相關(guān)的優(yōu)化技術(shù)
2.1 XC166指令流水線(xiàn)
XC166單片機(jī)指令流水線(xiàn)共有7級(jí),前兩級(jí)為取指令流水線(xiàn),后5級(jí)為執(zhí)行流水線(xiàn),所有指令都必須經(jīng)過(guò)5級(jí)執(zhí)行流水線(xiàn)的每一級(jí)。
第1級(jí)--指令預(yù)取。這一級(jí)根據(jù)預(yù)測(cè)順序,把指令從程序管理單元(PMU)取出,取出的指令在跳轉(zhuǎn)檢測(cè)單元進(jìn)行前期處理,以檢測(cè)是否有跳轉(zhuǎn),預(yù)測(cè)邏輯決定是否接收轉(zhuǎn)移。
第2級(jí)--取指令。根據(jù)轉(zhuǎn)移預(yù)測(cè)規(guī)則計(jì)算出下一條被取指令的指針。對(duì)于零機(jī)器周期轉(zhuǎn)移,轉(zhuǎn)移合并單元先預(yù)處理,并將檢測(cè)到的轉(zhuǎn)移與正在執(zhí)行的指令結(jié)合起來(lái)。預(yù)取出的指令存在FIFO緩存器中,同時(shí),下一條要執(zhí)行的指令輸出FIFO緩存器,進(jìn)入執(zhí)行流水線(xiàn)。
第3級(jí)--譯碼。指令被譯碼,如需要,在間接尋址模式中,寄存器文件將被訪問(wèn),以讀取通用寄存器GPR。
第4級(jí)--尋址。計(jì)算所有操作數(shù)地址,對(duì)于所有隱含訪問(wèn)系統(tǒng)堆棧的指令,堆棧指針遞減或增加。
第5級(jí)--存儲(chǔ)。所有需要的操作數(shù)被取出。
第6級(jí)--執(zhí)行。使用已取出的操作數(shù)進(jìn)行MAC單元操作。對(duì)于非MAC單元指令,在這一級(jí)中,指令將由算術(shù)邏輯單元(ALU)執(zhí)行。條件標(biāo)志被更新,執(zhí)行所有直接對(duì)CPU特殊功能寄存器CPU_SFRs進(jìn)行寫(xiě)操作的指令,在間接尋址時(shí),作為地址指針的GPRs自動(dòng)遞減或增加。
第7級(jí)--寫(xiě)回。所有外部操作數(shù)以及剩余的,在內(nèi)部DPRAM空間內(nèi)的操作器被寫(xiě)回。定位在內(nèi)部SRAM中的操作數(shù)進(jìn)入寫(xiě)回緩沖區(qū)。
下面給出一個(gè)具體例子:
上面程序的指令流水線(xiàn)如表1所列,(Tn表示機(jī)器周期)
2.2 數(shù)據(jù)相關(guān)性排除
在XC166的CPU中,由于指令流水線(xiàn)的設(shè)計(jì)要求,在使用通用寄存器(GPRs)的指令之間存在一些數(shù)據(jù)相互依賴(lài)的情況,盡管XC166單片機(jī)已經(jīng)使用了專(zhuān)用硬件來(lái)檢測(cè)及解決數(shù)據(jù)相關(guān)性,但仍然有一些不可避免的數(shù)據(jù)相關(guān)性。在編程時(shí),可以充分利用數(shù)據(jù)相關(guān)性來(lái)達(dá)到程序優(yōu)化的目的,比如,在用GPR作為間接尋址指針時(shí),如果PGR中的地址值被改變,間接尋址操作必須等待2個(gè)機(jī)器指令周期后,才能使用GPR作為地址指針尋址。在這種情況下,可以在這2個(gè)等待機(jī)器周期內(nèi)插入2條其他單機(jī)器周期指令,充分利用這2個(gè)周期的等待時(shí)間以便程序更優(yōu)化。
下面舉一個(gè)例子:
另外一種數(shù)據(jù)相關(guān)性發(fā)生在間接尋址訪問(wèn)內(nèi)存時(shí),XC166單片機(jī)中的地址產(chǎn)生單元使用推測(cè)原理,在地址譯碼前,數(shù)據(jù)的讀取路經(jīng)將根據(jù)歷史記錄表中選出;在歷史記錄表中,每個(gè)GPR都有一個(gè)入口。這些入口記錄了用相應(yīng)GPR所訪問(wèn)的內(nèi)存空間情況。如果這種預(yù)測(cè)發(fā)生錯(cuò)誤,讀取操作必須重新開(kāi)始。
因此,如果用GPR作為間接尋址,GPR最好能指向相同內(nèi)存空間。如果更新后的GPR指向不同內(nèi)存空間,下一個(gè)操作將出現(xiàn)訪問(wèn)錯(cuò)誤,讀操作必須重復(fù),這就產(chǎn)生了指令流水線(xiàn)堵塞。例如:
評(píng)論