新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > ARM架構(gòu)與體系學(xué)習(xí)(二)——3級流水線

ARM架構(gòu)與體系學(xué)習(xí)(二)——3級流水線

作者: 時間:2016-11-21 來源:網(wǎng)絡(luò) 收藏
看到匯編中很多關(guān)于程序返回與中斷返回時處理地址都很特別,仔細想想原來是流水線作用的效果。所以,決定總結(jié)學(xué)習(xí)下ARM流水線。

ARM7處理器采用3級流水線來增加處理器指令流的速度,能提供0.9MIPS/MHz的指令處理速度。

本文引用地址:http://m.butianyuan.cn/article/201611/319112.htm

PS:

MIPS(Million Instruction Per Second)表示每秒多少百萬條指令。比如0.9MIPS,表示每秒九十萬條指令。

MIPS/MHz表示CPU在每MHz的運行速度下可以執(zhí)行多少個MIPS,如0.9MIPS/MHz則表示如果CPU運行在1MHz的頻率下,每秒可執(zhí)行90萬條指令。

如果CPU在20MHz的頻率下,每秒可運行1800萬條指令。MIPS/MHz可以很好的反映CPU的速度。

3級流水線如上圖所示(PC為程序計數(shù)器),流水線使用3個階段,因此指令分3個階段執(zhí)行。

⑴ 取指從存儲器裝載一條指令

⑵ 譯碼識別將要被執(zhí)行的指令

⑶ 執(zhí)行處理指令并將結(jié)果寫會寄存器

以前學(xué)過的51單片機,因為比較簡單,所以它的處理器只能完成一條指令的讀取和執(zhí)行后,才會執(zhí)行下一條指令。這樣,PC始終指向的正在“執(zhí)行”的指令。

而對于ARM7來說因為是3級流水線,所以把指令的處理分為了上面所述的3個階段。

所以處理時實際是這樣的:ARM正在執(zhí)行第1條指令的同時對第2條指令進行譯碼,并將第3條指令從存儲器中取出。

所以,ARM7流水線只有在取第4條指令時,第1條指令才算完成執(zhí)行。

下圖生動形象的說明了3級流水線的處理機制

下面一句話很關(guān)鍵:無論處理器處于何種狀態(tài),程序計數(shù)器R15(PC)總是指向“正在取指”的指令,而不是指向“正在執(zhí)行”的指令或者正在“譯碼”的指令。

人們一般會習(xí)慣性的將正在執(zhí)行的指令作為參考點,即當前第1條指令。

所以,PC總是指向第3條指令,

或者說PC總是指向當前正在執(zhí)行的指令地址再加2條指令的地址。

處理器處于ARM狀態(tài)時,每條指令為4個字節(jié),所以PC值為正在執(zhí)行的指令地址加8字節(jié),即是:

PC值 = 當前程序執(zhí)行位置 + 8字節(jié)

處理器處于Thumb狀態(tài)時,每條指令為2字節(jié),所以PC值為正在執(zhí)行的指令地址加4字節(jié),即是:

PC值 = 當前程序執(zhí)行位置 + 4字節(jié)

下面一個例子就很好的說明了這個問題。

[plain]view plaincopy
print?
  1. 0x4000ADDPC,PC,#4;正在被執(zhí)行的指令,將地址值PC+4寫入PC
  2. 0x4004...;正在被譯碼的指令
  3. 0x4008...;正在被取指的指令,PC=0x4008
  4. 0x400C...;PC+4=0x400C

另外補充說明就是根據(jù)以上描述,流水線只有被指令填滿時才能發(fā)揮最大效能,即每時鐘周期完成一條指令的執(zhí)行(僅單周期指令)。

如果程序發(fā)生跳轉(zhuǎn),流水線會被清空,這將需要幾個時鐘才能使流水線被再次填滿。因此,盡量地少使用跳轉(zhuǎn)指令可以提高程序的執(zhí)行效率。

以上就是對ARM73級流水線的一個總的認識,參考來自學(xué)習(xí)ARM時的教材——《ARM嵌入式系統(tǒng)基礎(chǔ)教程(第二版)》。



評論


技術(shù)專區(qū)

關(guān)閉