嵌入式C中volatile的用法
根據(jù)c/c++語法,const可以出現(xiàn)的地方,volatile幾乎也都可以出現(xiàn)。但是,const修飾的對(duì)象其值不能改變,而volatile修飾的對(duì)象其值可以隨意地改變,也就是說,volatile對(duì)象值可能會(huì)改變,即使沒有任何代碼去改變它。在這一點(diǎn)上,最典型的例子就是內(nèi)存映射的設(shè)備寄存器和多線程中的共享對(duì)象。懂得使用volatile也是一門小小的藝術(shù)。使用volatile約束符可以阻止編譯器對(duì)代碼過分優(yōu)化防止出現(xiàn)一些你意想不到的情況,達(dá)不到預(yù)期的結(jié)果;過頻地使用volatile很可能會(huì)增加代碼尺寸和降低性能。下面舉個(gè)例子來說明volatile在優(yōu)化中的微妙作用。
本文引用地址:http://m.butianyuan.cn/article/201610/305642.htm1.阻止編譯器優(yōu)化
ARM Evaluator-7T模擬單機(jī)板使用基于內(nèi)存映射的設(shè)備寄存器叫特殊寄存器,用來
控制和交互外圍設(shè)備。CPU對(duì)內(nèi)存的操作可以做到按位進(jìn)行,而特殊寄存器是4字節(jié)對(duì)齊并占四個(gè)字節(jié)。你可以象unsigned int變量一樣操作特殊寄存器(有些人可能更喜歡uint32_t,認(rèn)為這樣體現(xiàn)寄存器占用4個(gè)字節(jié)的特點(diǎn)。uint32_t在C99 頭文件中有定義)。而這里,為了體現(xiàn)寄存器本身作為寄存器的含義而非它的物理意義的,我們做如下定義:
typedef uint32_t special_register;
Evaluator-7T板子上有一個(gè)按鈕(可以認(rèn)為是外設(shè)之一)。按下該按鈕可以對(duì)IOPDATA寄存器第8位置1,相反,釋放按鈕會(huì)將該位重新清0。我們使用枚舉方法為IOPDATA寄存器的第8位置定義一個(gè)掩碼mask:
enum { button = 0x100 };
IOPDATA寄存器對(duì)應(yīng)的地址為0x3FF5008,我們可以用宏形象地定義IOPDATA:
#define IOPDATA (*(special_register *)0x03FF5008)
有了這個(gè)定義,我們執(zhí)行下面的循環(huán)就可以使CPU一直等待該按鈕被按下:
while ((IOPDATA button) == 0)
;
然而這個(gè)期望必須建立在編譯器不對(duì)代碼進(jìn)行優(yōu)化的前提假設(shè)之上。如果編譯器優(yōu)化這段代碼,那么它會(huì)認(rèn)為在這個(gè)循環(huán)中沒有什么會(huì)改變 IOPDATA而且認(rèn)為條件判斷結(jié)果總是真或假,最終優(yōu)化的結(jié)果是只對(duì)(IOPDATA button)==0判斷一次,之后的循環(huán)都不在對(duì)其進(jìn)行判斷,其等同于:
if ((IOPDATA button) == 0)
for (;;)
;
顯然,如果條件判斷結(jié)果為真(那么之后都會(huì)認(rèn)為是真),那么這段代碼將會(huì)陷入死循環(huán)。如果判斷為假,那么循環(huán)就此結(jié)束??梢钥闯觯瑑?yōu)化的代碼效率更高,因?yàn)槊看窝h(huán)相比原來的執(zhí)行時(shí)間要短。不幸的是,這段優(yōu)化代碼使得它根本就不能響應(yīng)按鈕的每次動(dòng)作。那么,如何解決這個(gè)問題呢?解決的關(guān)鍵就是不要讓編譯器優(yōu)化這段代碼,使用volatile就可以辦到這一點(diǎn)。我們修改前面關(guān)于IOPDATA的宏定義:
#define IOPDATA (*(special_register volatile *)0x03FF5008)
這個(gè)定義將IOPDATA 定義為volatile類型的寄存器。volatile隱含地告訴編譯器特殊寄存器可能會(huì)改變內(nèi)容,即使沒有任何顯式地代碼去改變它的內(nèi)容。這樣一來,編譯器就不對(duì)IOPDATA作優(yōu)化,而是每次都去訪問IOPDATA,這其實(shí)正是我們所期望的。
2.無意中降低了效率
有時(shí)候,如果不注意的話,使用volatile會(huì)無意中降低代碼效率。舉個(gè)例子。Evaluator-7T有一個(gè)七段數(shù)碼顯示器見下圖:
在IOPDATA 寄存器中第10到16位用來控制顯示器的每一段。比如第10位就是用來控制頂部的那段顯示,置1則點(diǎn)亮它,清0則熄滅它。我們可以定義一個(gè)掩碼mask來覆蓋從第10到16的所有位:
enum { display = 0x1FC00 };
假設(shè)變量b用來控制這7段顯示器的每一段顯示,并且b的值已經(jīng)你想要設(shè)置值(準(zhǔn)備用來顯示哪幾段和熄滅哪幾段,其它無關(guān)的位均為0)。那么你想要改變?cè)O(shè)置新的顯示方式的操作就是:
IOPDATA = b;
但是這種賦值可能會(huì)改變第10到16位之外的其它位,這是我們不期望的。所以,采用下面的方法更好:
IOPDATA |= b
但是,使用 |= 并不能熄滅那些已經(jīng)點(diǎn)亮的顯示段(1 | 0 -> 1),所以我們可以用下面的函數(shù)達(dá)到目的:
void display_put(uint32_t b)
{
IOPDATA = ~display;
IOPDATA |= b;
}
不過,可能沒想到的是這樣的操作在無意中降低了代碼效率。因?yàn)槲覀兌xIOPDATA為
volatile類型,它阻止了編譯器對(duì)代碼的優(yōu)化,要求任何讀寫IOPDATA的操作都死死板板地進(jìn)行。IOPDATA = ~display的等價(jià)表現(xiàn)為IOPDATA = IOPDATA ~display,也就是先從IOPDATA讀出內(nèi)容然后與上~display,最后又回寫IOPDATA。同理,IOPDATA |=b也有相似的過程。整個(gè)過程分別有2次讀IOPDATA和2次寫IOPDATA的操作。如果IOPDATA不使用volatile,那么編譯器會(huì)要求將IOPDATA ~display的結(jié)果放在CPU寄存器中,直到完成IOPDATA |= b操作才寫回特殊寄存器IOPDATA。顯然后者較之前者分別省掉了1次讀IOPDATA和1次I寫OPDATA的耗時(shí)操作(外設(shè)操作是最耗時(shí)的),效率要高很多。如果你想使用volatile但又能使能優(yōu)化功能,你可以將函數(shù)作如下的修改:
void display_put(uint32_t b)
{
register uint32_t temp = IOPDATA;
temp = ~display;
temp |= b;
IOPDATA = temp;
}
這樣做有點(diǎn)煩瑣,下面的等效方法更簡(jiǎn)單:
void display_put(uint32_t b)
{
IOPDATA = (IOPDATA ~display) | b;
}
結(jié)論:從該例子看出,它并不鼓勵(lì)使用volatile,即使要用也要很小心,因?yàn)関olatile可能在無意中降低了代碼效率,而你卻無法察覺。但是,我們說,不鼓勵(lì)并不是說就不能或不要用,而是要懂得何時(shí)用,怎么用好它。其所謂智用了。
評(píng)論