詳解大端模式和小端模式

作者：時(shí)間：2016-11-23 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢(xún)

一、大端模式和小端模式的起源

關(guān)于大端小端名詞的由來(lái)，有一個(gè)有趣的故事，來(lái)自于Jonathan Swift的《格利佛游記》：Lilliput和Blefuscu這兩個(gè)強(qiáng)國(guó)在過(guò)去的36個(gè)月中一直在苦戰(zhàn)。戰(zhàn)爭(zhēng)的原因：大家都知道，吃雞蛋的時(shí)候，原始的方法是打破雞蛋較大的一端，可以那時(shí)的皇帝的祖父由于小時(shí)侯吃雞蛋，按這種方法把手指弄破了，因此他的父親，就下令，命令所有的子民吃雞蛋的時(shí)候，必須先打破雞蛋較小的一端，違令者重罰。然后老百姓對(duì)此法令極為反感，期間發(fā)生了多次叛亂，其中一個(gè)皇帝因此送命，另一個(gè)丟了王位，產(chǎn)生叛亂的原因就是另一個(gè)國(guó)家Blefuscu的國(guó)王大臣煽動(dòng)起來(lái)的，叛亂平息后，就逃到這個(gè)帝國(guó)避難。據(jù)估計(jì)，先后幾次有11000余人情愿死也不肯去打破雞蛋較小的端吃雞蛋。這個(gè)其實(shí)諷刺當(dāng)時(shí)英國(guó)和法國(guó)之間持續(xù)的沖突。Danny Cohen一位網(wǎng)絡(luò)協(xié)議的開(kāi)創(chuàng)者，第一次使用這兩個(gè)術(shù)語(yǔ)指代字節(jié)順序，后來(lái)就被大家廣泛接受。

二、什么是大端和小端

Big-Endian和Little-Endian的定義如下：
1) Little-Endian就是低位字節(jié)排放在內(nèi)存的低地址端，高位字節(jié)排放在內(nèi)存的高地址端。
2) Big-Endian就是高位字節(jié)排放在內(nèi)存的低地址端，低位字節(jié)排放在內(nèi)存的高地址端。
舉一個(gè)例子，比如數(shù)字0x12 34 56 78在內(nèi)存中的表示形式為：

1)大端模式：

本文引用地址：http://m.butianyuan.cn/article/201611/320459.htm低地址 -----------------> 高地址
0x12 | 0x34 | 0x56 | 0x78

2)小端模式：

低地址 ------------------> 高地址
0x78 | 0x56 | 0x34 | 0x12

可見(jiàn)，大端模式和字符串的存儲(chǔ)模式類(lèi)似。

3)下面是兩個(gè)具體例子：

16bit寬的數(shù)0x1234在Little-endian模式（以及Big-endian模式）CPU內(nèi)存中的存放方式（假設(shè)從地址0x4000開(kāi)始存放）為：

內(nèi)存地址	小端模式存放內(nèi)容	大端模式存放內(nèi)容
0x4000	0x34	0x12
0x4001	0x12	0x34

32bit寬的數(shù)0x12345678在Little-endian模式以及Big-endian模式）CPU內(nèi)存中的存放方式（假設(shè)從地址0x4000開(kāi)始存放）為：

內(nèi)存地址	小端模式存放內(nèi)容	大端模式存放內(nèi)容
0x4000	0x78	0x12
0x4001	0x56	0x34
0x4002	0x34	0x56
0x4003	0x12	0x78

4)大端小端沒(méi)有誰(shuí)優(yōu)誰(shuí)劣，各自?xún)?yōu)勢(shì)便是對(duì)方劣勢(shì)：

小端模式：強(qiáng)制轉(zhuǎn)換數(shù)據(jù)不需要調(diào)整字節(jié)內(nèi)容，1、2、4字節(jié)的存儲(chǔ)方式一樣。
大端模式：符號(hào)位的判定固定為第一個(gè)字節(jié)，容易判斷正負(fù)。

三、數(shù)組在大端小端情況下的存儲(chǔ)：

　　以u(píng)nsigned int value = 0x12345678為例，分別看看在兩種字節(jié)序下其存儲(chǔ)情況，我們可以用unsigned char buf[4]來(lái)表示value：
　　Big-Endian: 低地址存放高位，如下：
高地址
---------------
buf[3] (0x78) -- 低位
buf[2] (0x56)
buf[1] (0x34)
buf[0] (0x12) -- 高位
---------------
低地址
Little-Endian: 低地址存放低位，如下：
高地址
---------------
buf[3] (0x12) -- 高位
buf[2] (0x34)
buf[1] (0x56)
buf[0] (0x78) -- 低位
--------------
低地址

四、為什么會(huì)有大小端模式之分呢？

這是因?yàn)樵谟?jì)算機(jī)系統(tǒng)中，我們是以字節(jié)為單位的，每個(gè)地址單元都對(duì)應(yīng)著一個(gè)字節(jié)，一個(gè)字節(jié)為8bit。但是在C語(yǔ)言中除了8bit的char之外，還有16bit的short型，32bit的long型（要看具體的編譯器），另外，對(duì)于位數(shù)大于8位的處理器，例如16位或者32位的處理器，由于寄存器寬度大于一個(gè)字節(jié)，那么必然存在著一個(gè)如果將多個(gè)字節(jié)安排的問(wèn)題。因此就導(dǎo)致了大端存儲(chǔ)模式和小端存儲(chǔ)模式。例如一個(gè)16bit的short型x，在內(nèi)存中的地址為0x0010，x的值為0x1122，那么0x11為高字節(jié)，0x22為低字節(jié)。對(duì)于大端模式，就將0x11放在低地址中，即0x0010中，0x22放在高地址中，即0x0011中。小端模式，剛好相反。我們常用的X86結(jié)構(gòu)是小端模式，而KEIL C51則為大端模式。很多的ARM，DSP都為小端模式。有些ARM處理器還可以由硬件來(lái)選擇是大端模式還是小端模式。

五、如何判斷機(jī)器的字節(jié)序

可以編寫(xiě)一個(gè)小的測(cè)試程序來(lái)判斷機(jī)器的字節(jié)序：

[cpp]view plaincopy

BOOLIsBigEndian()
{
inta=0x1234;
charb=*(char*)&a;//通過(guò)將int強(qiáng)制類(lèi)型轉(zhuǎn)換成char單字節(jié)，通過(guò)判斷起始存儲(chǔ)位置。即等于取b等于a的低地址部分
if(b==0x12)
{
returnTRUE;
}
returnFALSE;
}

聯(lián)合體union的存放順序是所有成員都從低地址開(kāi)始存放，利用該特性可以輕松地獲得了CPU對(duì)內(nèi)存采用Little-endian還是Big-endian模式讀寫(xiě)：

[cpp]view plaincopy

BOOLIsBigEndian()
{
unionNUM
{
inta;
charb;
}num;
num.a=0x1234;
if(num.b==0x12)
{
returnTRUE;
}
returnFALSE;
}

六、常見(jiàn)的字節(jié)序

一般操作系統(tǒng)都是小端，而通訊協(xié)議是大端的。

4.1 常見(jiàn)CPU的字節(jié)序

Big Endian : PowerPC、IBM、Sun
Little Endian : x86、DEC
ARM既可以工作在大端模式，也可以工作在小端模式。

4.2 常見(jiàn)文件的字節(jié)序

Adobe PS – Big Endian
BMP – Little Endian
DXF(AutoCAD) – Variable
GIF – Little Endian
JPEG – Big Endian
MacPaint – Big Endian
RTF – Little Endian

另外，Java和所有的網(wǎng)絡(luò)通訊協(xié)議都是使用Big-Endian的編碼。

七、如何進(jìn)行轉(zhuǎn)換

對(duì)于字?jǐn)?shù)據(jù)（16位）：

[cpp]view plaincopy

#defineBigtoLittle16(A)((((uint16)(A)&0xff00)>>8)|
(((uint16)(A)&0x00ff)<<8))

對(duì)于雙字?jǐn)?shù)據(jù)（32位）：

[cpp]view plaincopy

#defineBigtoLittle32(A)((((uint32)(A)&0xff000000)>>24)|
(((uint32)(A)&0x00ff0000)>>8)|
(((uint32)(A)&0x0000ff00)<<8)|
(((uint32)(A)&0x000000ff)<<24))

八、從軟件的角度理解端模式

從軟件的角度上，不同端模式的處理器進(jìn)行數(shù)據(jù)傳遞時(shí)必須要考慮端模式的不同。如進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)傳遞時(shí)，必須要考慮端模式的轉(zhuǎn)換。在Socket接口編程中，以下幾個(gè)函數(shù)用于大小端字節(jié)序的轉(zhuǎn)換。

[cpp]view plaincopy

#definentohs(n)//16位數(shù)據(jù)類(lèi)型網(wǎng)絡(luò)字節(jié)順序到主機(jī)字節(jié)順序的轉(zhuǎn)換
#definehtons(n)//16位數(shù)據(jù)類(lèi)型主機(jī)字節(jié)順序到網(wǎng)絡(luò)字節(jié)順序的轉(zhuǎn)換
#definentohl(n)//32位數(shù)據(jù)類(lèi)型網(wǎng)絡(luò)字節(jié)順序到主機(jī)字節(jié)順序的轉(zhuǎn)換
#definehtonl(n)//32位數(shù)據(jù)類(lèi)型主機(jī)字節(jié)順序到網(wǎng)絡(luò)字節(jié)順序的轉(zhuǎn)換

其中互聯(lián)網(wǎng)使用的網(wǎng)絡(luò)字節(jié)順序采用大端模式進(jìn)行編址，而主機(jī)字節(jié)順序根據(jù)處理器的不同而不同，如PowerPC處理器使用大端模式，而Pentuim處理器使用小端模式。
大端模式處理器的字節(jié)序到網(wǎng)絡(luò)字節(jié)序不需要轉(zhuǎn)換，此時(shí)ntohs(n)=n，ntohl = n；而小端模式處理器的字節(jié)序到網(wǎng)絡(luò)字節(jié)必須要進(jìn)行轉(zhuǎn)換，此時(shí)ntohs(n) = __swab16(n)，ntohl = __swab32(n)。__swab16與__swab32函數(shù)定義如下所示。

[cpp]view plaincopy

#define___swab16(x)
{
__u16__x=(x);
((__u16)(
(((__u16)(__x)&(__u16)0x00ffU)<<8)|
(((__u16)(__x)&(__u16)0xff00U)>>8)));
}
#define___swab32(x)
{
__u32__x=(x);
((__u32)(
(((__u32)(__x)&(__u32)0x000000ffUL)<<24)|
(((__u32)(__x)&(__u32)0x0000ff00UL)<<8)|
(((__u32)(__x)&(__u32)0x00ff0000UL)>>8)|
(((__u32)(__x)&(__u32)0xff000000UL)>>24)));
}

PowerPC處理器提供了lwbrx，lhbrx，stwbrx，sthbrx四條指令用于處理字節(jié)序的轉(zhuǎn)換以?xún)?yōu)化__swab16和__swap32這類(lèi)函數(shù)。此外PowerPC處理器中的rlwimi指令也可以用來(lái)實(shí)現(xiàn)__swab16和__swap32這類(lèi)函數(shù)。

在對(duì)普通文件進(jìn)行處理也需要考慮端模式問(wèn)題。在大端模式的處理器下對(duì)文件的32，16位讀寫(xiě)操作所得到的結(jié)果與小端模式的處理器不同。單純從軟件的角度理解上遠(yuǎn)遠(yuǎn)不能真正理解大小端模式的區(qū)別。事實(shí)上，真正的理解大小端模式的區(qū)別，必須要從系統(tǒng)的角度，從指令集，寄存器和數(shù)據(jù)總線(xiàn)上深入理解，大小端模式的區(qū)別。

九、從系統(tǒng)的角度理解端模式

先補(bǔ)充兩個(gè)關(guān)鍵詞，MSB和LSB：
　　MSB:MoST Significant Bit ------- 最高有效位
LSB:Least Significant Bit ------- 最低有效位

處理器在硬件上由于端模式問(wèn)題在設(shè)計(jì)中有所不同。從系統(tǒng)的角度上看，端模式問(wèn)題對(duì)軟件和硬件的設(shè)計(jì)帶來(lái)了不同的影響，當(dāng)一個(gè)處理器系統(tǒng)中大小端模式同時(shí)存在時(shí)，必須要對(duì)這些不同端模式的訪(fǎng)問(wèn)進(jìn)行特殊的處理。
PowerPC處理器主導(dǎo)網(wǎng)絡(luò)市場(chǎng)，可以說(shuō)絕大多數(shù)的通信設(shè)備都使用PowerPC處理器進(jìn)行協(xié)議處理和其他控制信息的處理，這也可能也是在網(wǎng)絡(luò)上的絕大多數(shù)協(xié)議都采用大端編址方式的原因。因此在有關(guān)網(wǎng)絡(luò)協(xié)議的軟件設(shè)計(jì)中，使用小端方式的處理器需要在軟件中處理端模式的轉(zhuǎn)變。而Pentium主導(dǎo)個(gè)人機(jī)市場(chǎng)，因此多數(shù)用于個(gè)人機(jī)的外設(shè)都采用小端模式，包括一些在網(wǎng)絡(luò)設(shè)備中使用的PCI總線(xiàn)，F(xiàn)lash等設(shè)備，這也要求在硬件設(shè)計(jì)中注意端模式的轉(zhuǎn)換。
本文提到的小端外設(shè)是指這種外設(shè)中的寄存器以小端方式進(jìn)行存儲(chǔ)，如PCI設(shè)備的配置空間，NOR FLASH中的寄存器等等。對(duì)于有些設(shè)備，如DDR顆粒，沒(méi)有以小端方式存儲(chǔ)的寄存器，因此從邏輯上講并不需要對(duì)端模式進(jìn)行轉(zhuǎn)換。在設(shè)計(jì)中，只需要將雙方數(shù)據(jù)總線(xiàn)進(jìn)行一一對(duì)應(yīng)的互連，而不需要進(jìn)行數(shù)據(jù)總線(xiàn)的轉(zhuǎn)換。
如果從實(shí)際應(yīng)用的角度說(shuō)，采用小端模式的處理器需要在軟件中處理端模式的轉(zhuǎn)換，因?yàn)椴捎眯《四Ｊ降奶幚砥髟谂c小端外設(shè)互連時(shí)，不需要任何轉(zhuǎn)換。而采用大端模式的處理器需要在硬件設(shè)計(jì)時(shí)處理端模式的轉(zhuǎn)換。大端模式處理器需要在寄存器，指令集，數(shù)據(jù)總線(xiàn)及數(shù)據(jù)總線(xiàn)與小端外設(shè)的連接等等多個(gè)方面進(jìn)行處理，以解決與小端外設(shè)連接時(shí)的端模式轉(zhuǎn)換問(wèn)題。在寄存器和數(shù)據(jù)總線(xiàn)的位序定義上，基于大小端模式的處理器有所不同。
一個(gè)采用大端模式的32位處理器，如基于E500內(nèi)核的MPC8541，將其寄存器的最高位msb（most significant bit）定義為0，最低位lsb（lease significant bit）定義為31；而小端模式的32位處理器，將其寄存器的最高位定義為31，低位地址定義為0。與此向?qū)?yīng)，采用大端模式的32位處理器數(shù)據(jù)總線(xiàn)的最高位為0，最高位為31；采用小端模式的32位處理器的數(shù)據(jù)總線(xiàn)的最高位為31，最低位為0。
大小端模式處理器外部總線(xiàn)的位序也遵循著同樣的規(guī)律，根據(jù)所采用的數(shù)據(jù)總線(xiàn)是32位，16位和8位，大小端處理器外部總線(xiàn)的位序有所不同。大端模式下32位數(shù)據(jù)總線(xiàn)的msb是第0位，MSB是數(shù)據(jù)總線(xiàn)的第0~7的字段；而lsb是第31位，LSB是第24~31字段。小端模式下32位總線(xiàn)的msb是第31位，MSB是數(shù)據(jù)總線(xiàn)的第31~24位，lsb是第0位，LSB是7~0字段。大端模式下16位數(shù)據(jù)總線(xiàn)的msb是第0位，MSB是數(shù)據(jù)總線(xiàn)的第0~7的字段；而lsb是第15位，LSB是第8~15字段。小端模式下16位總線(xiàn)的msb是第15位，MSB是數(shù)據(jù)總線(xiàn)的第15~7位，lsb是第0位，LSB是7~0字段。大端模式下8位數(shù)據(jù)總線(xiàn)的msb是第0位，MSB是數(shù)據(jù)總線(xiàn)的第0~7的字段；而lsb是第7位，LSB是第0~7字段。小端模式下8位總線(xiàn)的msb是第7位，MSB是數(shù)據(jù)總線(xiàn)的第7~0位，lsb是第0位，LSB是7~0字段。
由上分析，我們可以得知對(duì)于8位，16位和32位寬度的數(shù)據(jù)總線(xiàn)，采用大端模式時(shí)數(shù)據(jù)總線(xiàn)的msb和MSB的位置都不會(huì)發(fā)生變化，而采用小端模式時(shí)數(shù)據(jù)總線(xiàn)的lsb和LSB位置也不會(huì)發(fā)生變化。
為此，大端模式的處理器對(duì)8位，16位和32位的內(nèi)存訪(fǎng)問(wèn)（包括外設(shè)的訪(fǎng)問(wèn)）一般都包含第0~7字段，即MSB。小端模式的處理器對(duì)8位，16位和32位的內(nèi)存訪(fǎng)問(wèn)都包含第7~0位，小端方式的第7~0字段，即LSB。由于大小端處理器的數(shù)據(jù)總線(xiàn)其8位，16位和32位寬度的數(shù)據(jù)總線(xiàn)的定義不同，因此需要分別進(jìn)行討論在系統(tǒng)級(jí)別上如何處理端模式轉(zhuǎn)換。在一個(gè)大端處理器系統(tǒng)中，需要處理大端處理器對(duì)小端外設(shè)的訪(fǎng)問(wèn)。

十、實(shí)際中的例子

雖然很多時(shí)候，字節(jié)序的工作已由編譯器完成了，但是在一些小的細(xì)節(jié)上，仍然需要去仔細(xì)揣摩考慮，尤其是在以太網(wǎng)通訊、MODBUS通訊、軟件移植性方面。這里，舉一個(gè)MODBUS通訊的例子。在MODBUS中，數(shù)據(jù)需要組織成數(shù)據(jù)報(bào)文，該報(bào)文中的數(shù)據(jù)都是大端模式，即低地址存高位，高地址存低位。假設(shè)有一16位緩沖區(qū)m_RegMW[256]，因?yàn)槭窃趚86平臺(tái)上，所以?xún)?nèi)存中的數(shù)據(jù)為小端模式：m_RegMW[0].low、m_RegMW[0].high、m_RegMW[1].low、m_RegMW[1].high……
為了方便討論，假設(shè)m_RegMW[0] = 0x3456; 在內(nèi)存中為0x56、0x34。

現(xiàn)要將該數(shù)據(jù)發(fā)出，如果不進(jìn)行數(shù)據(jù)轉(zhuǎn)換直接發(fā)送，此時(shí)發(fā)送的數(shù)據(jù)為0x56,0x34。而Modbus是大端的，會(huì)將該數(shù)據(jù)解釋為0x5634而非原數(shù)據(jù)0x3456，此時(shí)就會(huì)發(fā)生災(zāi)難性的錯(cuò)誤。所以，在此之前，需要將小端數(shù)據(jù)轉(zhuǎn)換成大端的，即進(jìn)行高字節(jié)和低字節(jié)的交換，此時(shí)可以調(diào)用步驟五中的函數(shù)BigtoLittle16(m_RegMW[0])，之后再進(jìn)行發(fā)送才可以得到正確的數(shù)據(jù)。

附面試題一道：（詳見(jiàn)：http://tieba.baidu.com/p/3145609121）

unsigned long res=0;
unsigned long array ={0x01020304，0x05060708};
char *p= (char *)&array[0];
p+=2;
res = (unsigned long )*p; //原題此處錯(cuò)了，否則結(jié)果是2，應(yīng)該這樣寫(xiě) res=*( (unsigned long)p )
res=?求最后res的值是多少。運(yùn)行環(huán)境是win32

解析：我們常用的X86結(jié)構(gòu)是小端模式，而KEILC51則為大端模式。很多的ARM，DSP都為小端模式。有些ARM處理器還可以由硬件來(lái)選擇是大端模式還是小端模式。大小端的最低單位是字節(jié)。

圖畫(huà)的不知道對(duì)不對(duì)，如果錯(cuò)誤請(qǐng)指正，謝謝~~

小端CPU下（低位地址存低位數(shù)據(jù)）：
請(qǐng)注意這里：res = (unsigned long )*p;
那么現(xiàn)在res的內(nèi)存從低到高情況： 02 01 08 07
因?yàn)槭切《薈PU模式，還需要將內(nèi)存存儲(chǔ)狀況轉(zhuǎn)換回來(lái)，即：res=0x07080102

大端CPU模式（低位地址存高位數(shù)據(jù)）：
res的內(nèi)存情況： 03 04 05 06
大端模式下，無(wú)需轉(zhuǎn)換，即：res=0x03040506

下面有這么一個(gè)驗(yàn)證：

新聞中心

詳解大端模式和小端模式

一、大端模式和小端模式的起源

二、什么是大端和小端

三、數(shù)組在大端小端情況下的存儲(chǔ)：

四、為什么會(huì)有大小端模式之分呢？

五、如何判斷機(jī)器的字節(jié)序

六、常見(jiàn)的字節(jié)序

4.1 常見(jiàn)CPU的字節(jié)序

4.2 常見(jiàn)文件的字節(jié)序

七、如何進(jìn)行轉(zhuǎn)換

八、從軟件的角度理解端模式

九、從系統(tǒng)的角度理解端模式

十、實(shí)際中的例子

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

新聞中心

詳解大端模式和小端模式

一、大端模式和小端模式的起源

二、什么是大端和小端

三、數(shù)組在大端小端情況下的存儲(chǔ)：

四、為什么會(huì)有大小端模式之分呢？

五、如何判斷機(jī)器的字節(jié)序

六、常見(jiàn)的字節(jié)序

4.1 常見(jiàn)CPU的字節(jié)序

4.2 常見(jiàn)文件的字節(jié)序

七、如何進(jìn)行轉(zhuǎn)換

八、從軟件的角度理解端模式

九、從系統(tǒng)的角度理解端模式

十、實(shí)際中的例子

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)

二、什么是大端和小端

四、為什么會(huì)有大小端模式之分呢？

五、如何判斷機(jī)器的字節(jié)序

六、常見(jiàn)的字節(jié)序

七、如何進(jìn)行轉(zhuǎn)換

十、實(shí)際中的例子