新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計(jì)應(yīng)用 > ARM處理器關(guān)于非對(duì)齊存儲(chǔ)的訪問規(guī)則

ARM處理器關(guān)于非對(duì)齊存儲(chǔ)的訪問規(guī)則

作者: 時(shí)間:2016-11-09 來源:網(wǎng)絡(luò) 收藏
ARM 系列處理器是 RISC (Reducded Instruction Set Computing)處理器。很多基于ARM的高效代碼的程序設(shè)計(jì)策略都源于RISC 處理器。和很多 RISC 處理器一樣,ARM 系列處理器的內(nèi)存訪問,也要求數(shù)據(jù)對(duì)齊,即存取“字(Word)”數(shù)據(jù)時(shí)要求四字節(jié)對(duì)齊,地址的bits[1:0]==0b00;存取“半字(Halfwords)”時(shí)要求兩字節(jié)對(duì)齊,地址的bit[0]==0b0;存取“字節(jié)(Byte)”數(shù)據(jù)時(shí)要求該數(shù)據(jù)按其自然尺寸邊界(Natural Size Boundary)定位。

  ARM 編譯程序通常將全局變量對(duì)齊到自然尺寸邊界上,以便通過使用 LDR和 STR 指令有效地存取這些變量。這種內(nèi)存訪問方式與多數(shù) CISC (Complex Instruction Set Computing)體系結(jié)構(gòu)不同,在CISC體系結(jié)構(gòu)下,指令直接存取未對(duì)齊的數(shù)據(jù)。因而,當(dāng)需要將代碼從CISC 體系結(jié)構(gòu)向 ARM 處理器移植時(shí),內(nèi)存訪問的地址對(duì)齊問題必須予以注意。在RISC體系結(jié)構(gòu)下,存取未對(duì)齊數(shù)據(jù)無論在代碼尺寸或是程序執(zhí)行效率上,都將付出非常大的代價(jià)。
  本文將從以下幾個(gè)方面討論在ARM體系結(jié)構(gòu)下的程序設(shè)計(jì)問題。
  未對(duì)齊的數(shù)據(jù)指針
  C和C++編程標(biāo)準(zhǔn)規(guī)定,指向某一數(shù)據(jù)類型的指針,必須和該類型的數(shù)據(jù)地址對(duì)齊方式一致,所以ARM 編譯器期望程序中的 C 指針指向存儲(chǔ)器中字對(duì)齊地址,因?yàn)檫@可使編譯器生成更高效的代碼。
  比如,如果定義一個(gè)指向 int 數(shù)據(jù)類型的指針,用該指針讀取一個(gè)字,ARM 編譯器將使用LDR 指令來完成此操作。如果讀取的地址為四的倍數(shù)(即在一個(gè)字的邊界)即能正確讀取。但是,如果該地址不是四的倍數(shù),那么,一條 LDR 指令返回一個(gè)循環(huán)移位結(jié)果,而不是執(zhí)行真正的未對(duì)齊字載入。循環(huán)移位結(jié)果取決于該地址向?qū)τ谧值倪吔绲钠屏亢拖到y(tǒng)所使用的端序(Endianness)。例如,如果代碼要求從指針指向的地址 0x8006 載入數(shù)據(jù),即要載入 0x8006、0x8007、0x8008 和 0x8009 四字節(jié)的內(nèi)容。但是,在 ARM 處理器上,這個(gè)存取操作載入了0x8004、0x8005、0x8006 和 0x8007 字節(jié)的內(nèi)容。這就是在未對(duì)齊的地址上使用指針存取所得到的循環(huán)移位結(jié)果。
  因而,如果想將指針定義到一個(gè)指定地址(即該地址為非自然邊界對(duì)齊),那么在定義該指針時(shí),必須使用 __packed 限定符來定義指針: 例如,
  __packed int *pi; // 指針指向一個(gè)非字對(duì)其內(nèi)存地址
  使用了_packed限定符限定之后,ARM 編譯器將產(chǎn)生字節(jié)存取命令(LDRB或STRB指令)來存取內(nèi)存,這樣就不必考慮指針對(duì)齊問題。所生成的代碼是字節(jié)存取的一個(gè)序列,或者取決于編譯選項(xiàng)、跟變量對(duì)齊相關(guān)的移位和屏蔽。但這會(huì)導(dǎo)致系統(tǒng)性能和代碼密度的損失。
  值得注意的是,不能使用 __packed 限定的指針來存取存儲(chǔ)器映射的外圍寄存器,因?yàn)?ARM 編譯程序可使用多個(gè)存儲(chǔ)器存取來獲取數(shù)據(jù)。因而,可能對(duì)實(shí)際存取地址附近的位置進(jìn)行存取,而這些附近的位置可能對(duì)應(yīng)于其它外部寄存器。當(dāng)使用了位字段(Bitfield)時(shí), ARM 程序?qū)⒃L問整個(gè)結(jié)構(gòu)體,而非指定字段。

本文引用地址:http://m.butianyuan.cn/article/201611/317751.htm

在ARM中,通常希望字單元的地址是字對(duì)齊的(地址的低兩位為0b00),半字單元的地址是半字對(duì)齊的(地址的最低為0b0).在存儲(chǔ)訪問操作中,如果存儲(chǔ)單元的地址沒有遵守上述的對(duì)齊規(guī)則,則稱為非對(duì)齊(unaligned)的存儲(chǔ)訪問操作.

轉(zhuǎn)載自:ARM開發(fā)板|嵌入式開發(fā)http://armdmc.woku.com/article/5018028.html

———————————————— END ————————————————

1.非對(duì)齊指令的預(yù)取操作
當(dāng)處理器處于ARM狀態(tài)器件,如果寫入到寄存器PC中的值是非字對(duì)齊的(低兩位不為0b00),要么指令執(zhí)行的結(jié)果不可預(yù)知,要么地址值中最低兩位被忽略;
當(dāng)處理器處于Thumb狀態(tài)器件,如果寫入到寄存器PC中的值是非半字對(duì)齊的(最低位不為0b0),要么指令執(zhí)行的結(jié)果不可預(yù)知,要么的重地值中最低位被忽略.
如果系統(tǒng)中指定,當(dāng)發(fā)生非對(duì)齊的指令預(yù)取操作時(shí),忽略地址值中相應(yīng)的位,則有存儲(chǔ)系統(tǒng)實(shí)現(xiàn)這種”忽略”.也就是說,這時(shí)該地址值原封不動(dòng)的送到存儲(chǔ)系統(tǒng).
2.非對(duì)齊的數(shù)據(jù)訪問操作
對(duì)于Load/Store操作,如果是非對(duì)齊的數(shù)據(jù)訪問操作,系統(tǒng)定義了下面3種可能的結(jié)果.
<1>執(zhí)行的結(jié)果不可預(yù)知.
<2>忽略字單元地址的低兩位,即訪問地址為(address _and 0xffffffc)的字單元;忽略半字單元地址的最低位的值,即訪問地址位(address _and 0xffffffe)的半字單元.
<3>忽略字單元地址值種的低兩位的值;忽略半字單元地址的最低位的值.有存儲(chǔ)體統(tǒng)實(shí)現(xiàn)這種”忽略”.也就是說,這時(shí)該地址值原封不動(dòng)的送到存儲(chǔ)系統(tǒng).arm開發(fā)板
當(dāng)發(fā)生非對(duì)齊的數(shù)據(jù)訪問時(shí),到底采用上述3種處理方法種的哪一種,是有各指令指定的.
arm指令預(yù)取和自修改代碼
在ARM中允許指令預(yù)取.在CPU執(zhí)行當(dāng)前指令的同時(shí),可以從存儲(chǔ)器種預(yù)取出若干條指令,具體預(yù)取多少條指令,不同的ARM實(shí)現(xiàn)種有不同的數(shù)值.
預(yù)取的指令并不一定能得到執(zhí)行。比如當(dāng)前指令完成后,如果發(fā)生了異常中斷,程序?qū)?huì)跳轉(zhuǎn)到異常中斷處理程序處執(zhí)行,當(dāng)前預(yù)取的指令將被拋棄.或者如果執(zhí)行了跳轉(zhuǎn)指令,則當(dāng)前預(yù)取的指令也將被拋棄.
正如在不同的ARM嵌入式開發(fā)實(shí)現(xiàn)預(yù)取的指令條數(shù)可能不同,當(dāng)發(fā)生程序跳轉(zhuǎn)是,不同的ARM實(shí)現(xiàn)種采用的跳轉(zhuǎn)預(yù)測(cè)算法也可能不同.

自修改代碼指的是代碼在執(zhí)行過程種可能修改自身.對(duì)于支持指令預(yù)取的ARM系統(tǒng),自修改代碼可能帶來潛在的問題.當(dāng)指令被預(yù)取后,在該指令被執(zhí)行前,如果有數(shù)據(jù)訪問指令修改了位于主存種的該指令,這是被預(yù)取的指令和主存種對(duì)應(yīng)的指令不同,從而可能使執(zhí)行的結(jié)果發(fā)生錯(cuò)誤.




評(píng)論


技術(shù)專區(qū)

關(guān)閉