從MOV PC,PC;看ARM的三級流水線過程
原因是PC寄存器中存儲的是當(dāng)前指令的地址+8,當(dāng)人為改變PC寄存器的值之后,程序會跳轉(zhuǎn)執(zhí)行,這樣,這條命令之后,假設(shè)這條命令的地址為X,那么PC在執(zhí)行這條命令之后為X+8,
本文引用地址:http://m.butianyuan.cn/article/201611/319532.htm之后周期開始fetch X+8,
下一個周期開始decode X+8同時fetch X+12,
再一個周期開始excute X+8,同時decode X+12,同時fetch X+16,
這時候PC的值已經(jīng)變成X+16, 也就是正在執(zhí)行的X+8再加上8,如此繼續(xù)。。。
實(shí)現(xiàn)同樣目的的還有 ADD PC,PC,#0;當(dāng)然B PC也可以,但是沒有前者來的快速。
請高手看看這樣理解是否正確?
+======以下為轉(zhuǎn)載==========
看到匯編中很多關(guān)于程序返回與中斷返回時處理地址都很特別,仔細(xì)想想原來是流水線作用的效果。所以,決定總結(jié)學(xué)習(xí)下ARM流水線。
ARM7處理器采用3級流水線來增加處理器指令流的速度,能提供0.9MIPS/MHz的指令處理速度。
PS:
MIPS(Million Instruction Per Second)表示每秒多少百萬條指令。比如0.9MIPS,表示每秒九十萬條指令。
MIPS/MHz表示CPU在每MHz的運(yùn)行速度下可以執(zhí)行多少個MIPS,如0.9MIPS/MHz則表示如果CPU運(yùn)行在1MHz的頻率下,每秒可執(zhí)行90萬條指令。
如果CPU在20MHz的頻率下,每秒可運(yùn)行1800萬條指令。MIPS/MHz可以很好的反映CPU的速度。
3級流水線如上圖所示(PC為程序計數(shù)器),流水線使用3個階段,因此指令分3個階段執(zhí)行。
⑴ 取指從存儲器裝載一條指令
⑵ 譯碼識別將要被執(zhí)行的指令
⑶ 執(zhí)行處理指令并將結(jié)果寫會寄存器
以前學(xué)過的51單片機(jī),因?yàn)楸容^簡單,所以它的處理器只能完成一條指令的讀取和執(zhí)行后,才會執(zhí)行下一條指令。這樣,PC始終指向的正在“執(zhí)行”的指令。
而對于ARM7來說因?yàn)槭?級流水線,所以把指令的處理分為了上面所述的3個階段。
所以處理時實(shí)際是這樣的:ARM正在執(zhí)行第1條指令的同時對第2條指令進(jìn)行譯碼,并將第3條指令從存儲器中取出。
所以,ARM7流水線只有在取第4條指令時,第1條指令才算完成執(zhí)行。
下圖生動形象的說明了3級流水線的處理機(jī)制
下面一句話很關(guān)鍵:無論處理器處于何種狀態(tài),程序計數(shù)器R15(PC)總是指向“正在取指”的指令,而不是指向“正在執(zhí)行”的指令或者正在“譯碼”的指令。
人們一般會習(xí)慣性的將正在執(zhí)行的指令作為參考點(diǎn),即當(dāng)前第1條指令。
所以,PC總是指向第3條指令,
或者說PC總是指向當(dāng)前正在執(zhí)行的指令地址再加2條指令的地址。
處理器處于ARM狀態(tài)時,每條指令為4個字節(jié),所以PC值為正在執(zhí)行的指令地址加8字節(jié),即是:
PC值 = 當(dāng)前程序執(zhí)行位置 + 8字節(jié)
處理器處于Thumb狀態(tài)時,每條指令為2字節(jié),所以PC值為正在執(zhí)行的指令地址加4字節(jié),即是:
PC值 = 當(dāng)前程序執(zhí)行位置 + 4字節(jié)
下面一個例子就很好的說明了這個問題。
- 0x4000 ADDPC,PC,#4 ;正在被執(zhí)行的指令,將地址值PC+4寫入PC
- 0x4004 ...;正在被譯碼的指令
- 0x4008 ...;正在被取指的指令,PC=0x4008
- 0x400C ...;PC+4=0x400C
另外補(bǔ)充說明就是根據(jù)以上描述,流水線只有被指令填滿時才能發(fā)揮最大效能,即每時鐘周期完成一條指令的執(zhí)行(僅單周期指令)。
如果程序發(fā)生跳轉(zhuǎn),流水線會被清空,這將需要幾個時鐘才能使流水線被再次填滿。因此,盡量地少使用跳轉(zhuǎn)指令可以提高程序的執(zhí)行效率
評論