GCC使用入門
——
除了上面講的之外,GCC除了支持C語言外,還支持多種其他語言,例如C++、Ada、Java、Objective-C、FORTRAN、Pascal等。
本系列文章中,我們不僅介紹GCC的基本功能,還涉及到一些諸如優(yōu)化之類的高級功能。另外,我們還考察GCC的一些映像操作工具,如size和objcopy等,這將在后續(xù)的文章中加以介紹。
二、程序的編譯過程
對于GUN編譯器來說,程序的編譯要經歷預處理、編譯、匯編、連接四個階段,如下圖所示:
從功能上分,預處理、編譯、匯編是三個不同的階段,但GCC的實際操作上,它可以把這三個步驟合并為一個步驟來執(zhí)行。下面我們以C語言為例來談一下不同階段的輸入和輸出情況。
在預處理階段,輸入的是C語言的源文件,通常為*.c。它們通常帶有.h之類頭文件的包含文件。這個階段主要處理源文件中的#ifdef、 #include和#define命令。該階段會生成一個中間文件*.i,但實際工作中通常不用專門生成這種文件,因為基本上用不到;若非要生成這種文件不可,可以利用下面的示例命令:
gcc -E test.c -o test.i
在編譯階段,輸入的是中間文件*.i,編譯后生成匯編語言文件*.s 。這個階段對應的GCC命令如下所示:
GCC -S test.i -o test.s
在匯編階段,將輸入的匯編文件*.s轉換成機器語言*.o。這個階段對應的GCC命令如下所示:
GCC -c test.s -o test.o
最后,在連接階段將輸入的機器代碼文件*.s(與其它的機器代碼文件和庫文件)匯集成一個可執(zhí)行的二進制代碼文件。這一步驟,可以利用下面的示例命令完成:
GCC test.o -o test
上面介紹了GCC編譯過程的四個階段以及相應的命令。下面我們進一步介紹常用的GCC的模式。
三、GCC常用模式
這里介紹GCC追常用的兩種模式:編譯模式和編譯連接模式。下面以一個例子來說明各種模式的使用方法。為簡單起見,假設我們全部的源代碼都在一個文件test.c中,要想把這個源文件直接編譯成可執(zhí)行程序,可以使用以下命令:
$ GCC -o test
這里test.c是源文件,生成的可執(zhí)行代碼存放在一個名為test 的文件中(該文件是機器代碼并且可執(zhí)行)。-o 是生成可執(zhí)行文件的輸出選項。如果我們只想讓源文件生成目標文件(給文件雖然也是機器代碼但不可執(zhí)行),可以使用標記-c ,詳細命令如下所示:
$ GCC -c test.c
默認情況下,生成的目標文件被命名為test.o,但我們也可以為輸出文件指定名稱,如下所示:
$ GCC -c test.c -o
上面這條命令將編譯后的目標文件命名為mytest.o,而不是默認的test.o。
迄今為止,我們談論的程序僅涉及到一個源文件;現實中,一個程序的源代碼通常包含在多個源文件之中,這該怎么辦?沒關系,即使這樣,用GCC處理起來也并不復雜,見下例:
$ GCC -o test first.c second.c third.c
該命令將同時編譯三個源文件,即first.c、second.c和 third.c,然后將它們連接成一個可執(zhí)行程序,名為test。
需要注意的是,要生成可執(zhí)行程序時,一個程序無論有有一個源文件還是多個源文件,所有被編譯和連接的源文件中必須有且僅有一個main函數,因為main函數是該程序的入口點(換句話說,當系統(tǒng)調用該程序時,首先將控制權授予程序的main函數)。但如果僅僅是把源文件編譯成目標文件的時候,因為不會進行連接,所以main函數不是必需的。
四、常用選項
許多情況下,頭文件和源文件會單獨存放在不同的目錄中。例如,假設存放源文件的子目錄名為./src,而包含文件則放在層次的其他目錄下,如./inc。當我們在./src 目錄下進行編譯工作時,如何告訴GCC到哪里找頭文件呢?方法如下所示:
$ gcc test.c –I../inc -o test
上面的命令告訴GCC包含文件存放在./inc 目錄下,在當前目錄的上一級。如果在編譯時需要的包含文件存放在多個目錄下,可以使用多個-I 來指定各個目錄:
$ gcc test.c –I../inc –I../../inc2 -o test
這里指出了另一個包含子目錄inc2,較之前目錄它還要在再上兩級才能找到。
另外,我們還可以在編譯命令行中定義符號常量。為此,我們可以簡單的在命令行中使用-D選項即可,如下例所示:
$ gcc -DTEST_CONFIGURATION test.c -o test
上面的命令與在源文件中加入下列命令是等效的:
#define TEST_CONFIGURATION
在編譯命令行中定義符號常量的好處是,不必修改源文件就能改變由符號常量控制的行為。
五、警告功能
當GCC在編譯過程中檢查出錯誤的話,它就會中止編譯;但檢測到警告時卻能繼續(xù)編譯生成可執(zhí)行程序,因為警告只是針對程序結構的診斷信息,它不能說明程序一定有錯誤,而是存在風險,或者可能存在錯誤。雖然GCC提供了非常豐富的警告,但前提是你已經啟用了它們,否則它不會報告這些檢測到的警告。
在眾多的警告選項之中,最常用的就是-Wall選項。該選項能發(fā)現程序中一系列的常見錯誤警告,該選項用法舉例如下:
$ gcc -Wall test.c -o test
該選項相當于同時使用了下列所有的選項:
◆unused-function:遇到僅聲明過但尚未定義的靜態(tài)函數時發(fā)出警告。
◆unused-label:遇到聲明過但不使用的標號的警告。
◆unused-parameter:從未用過的函數參數的警告。
◆unused-variable:在本地聲明但從未用過的變量的警告。
◆unused-value:僅計算但從未用過的值得警告。
◆Format:檢查對printf和scanf等函數的調用,確認各個參數類型和格式串中的一致。
◆implicit-int:警告沒有規(guī)定類型的聲明。
◆implicit-function-:在函數在未經聲明就使用時給予警告。
◆char-subscripts:警告把char類型作為數組下標。這是常見錯誤,程序員經常忘記在某些機器上char有符號。
◆missing-braces:聚合初始化兩邊缺少大括號。
◆Parentheses:在某些情況下如果忽略了括號,編譯器就發(fā)出警告。
◆return-type:如果函數定義了返回類型,而默認類型是int型,編譯器就發(fā)出警告。同時警告那些不帶返回值的 return語句,如果他們所屬的函數并非void類型。
◆sequence-point:出現可疑的代碼元素時,發(fā)出報警。
◆Switch:如果某條switch語句的參數屬于枚舉類型,但是沒有對應的case語句使用枚舉元素,編譯器就發(fā)出警告(在switch語句中使用default分支能夠防止這個警告)。超出枚舉范圍的case語句同樣會導致這個警告。
◆strict-aliasing:對變量別名進行最嚴格的檢查。
◆unknown-pragmas:使用了不允許的#pragma。
◆Uninitialized:在初始化之前就使用自動變量。
需要注意的是,各警告選項既然能使之生效,當然也能使之關閉。比如假設我們想要使用-Wall來啟用個選項,同時又要關閉unused警告,利益通過下面的命令來達到目的:
$ gcc -Wall -Wno-unused test.c -o test
下面是使用-Wall選項的時候沒有生效的一些警告項:
◆cast-align:一旦某個指針類型強制轉換時,會導致目標所需的地址對齊邊界擴展,編譯器就發(fā)出警告。例如,某些機器上只能在2或4字節(jié)邊界上訪問整數,如果在這種機型上把char *強制轉換成int *類型, 編譯器就發(fā)出警告。
◆sign-compare:將有符號類型和無符號類型數據進行比較時發(fā)出警告。
◆missing-prototypes :如果沒有預先聲明函數原形就定義了全局函數,編譯器就發(fā)出警告。即使函數定義自身提供了函數原形也會產生這個警告。這樣做的目的是檢查沒有在頭文件中聲明的全局函數。
◆Packed:當結構體帶有packed屬性但實際并沒有出現緊縮式給出警告。
◆Padded:如果結構體通過充填進行對齊則給出警告。
◆unreachable-code:如果發(fā)現從未執(zhí)行的代碼時給出警告。
◆Inline:如果某函數不能內嵌(inline),無論是聲明為inline或者是指定了-finline-functions 選項,編譯器都將發(fā)出警告。
◆disabled-optimization:當需要太長時間或過多資源而導致不能完成某項優(yōu)化時給出警告。
上面是使用-Wall選項時沒有生效,但又比較常用的一些警告選項。本文中要介紹的最后一個常用警告選項是-Werror。使用該選項后,GCC發(fā)現可疑之處時不會簡單的發(fā)出警告就算完事,而是將警告作為一個錯誤而中斷編譯過程。該選項在希望得到高質量代碼時非常有用。
六、小結
本文介紹了GCC的基本編譯過程和編譯模式,并詳細闡述了GCC的一些常用選項以及警告功能。這些是在利用GCC進行應用編程時最基本也最常用的一些內容,我們會在后續(xù)文章中繼續(xù)介紹GCC的調試和優(yōu)化技術。
評論