圖像屏幕尺寸綿放的C程序優(yōu)化技巧
引 言
嵌入式系統(tǒng)的核心部件是嵌入式處理器。在眾多的處理器中,ARM是專為嵌入式應(yīng)用而設(shè)計的處理器,由于其低功耗、高性價比和易擴(kuò)展性等特點,在嵌入式系統(tǒng)中得到了最為廣泛的應(yīng)用。在許多成功的32位嵌入式系統(tǒng)中,ARM處理器都是其核心組成部分。ARM內(nèi)核已被廣泛應(yīng)用于移動電話、掌上設(shè)備以及種類繁多的便攜式消費類產(chǎn)品中。隨著ARM處理器越來越廣泛的應(yīng)用,如何提高代碼的執(zhí)行效率已成為工程師關(guān)注的問題,同時如何在實時嵌入式應(yīng)用中,通過代碼優(yōu)化以減少消耗過多的CPU運行時間已成為人們關(guān)注的焦點。軟件開發(fā)中,常用的代碼優(yōu)化技巧有“循環(huán)展開”、“減少外存訪問”、“考慮CPU帶寬”、“循環(huán)減計數(shù)”、“循環(huán)變量數(shù)據(jù)類型”、“使用SWITCH取代條件判斷”等。而圖像在不同屏幕尺寸之間縮放的程序是嵌入式領(lǐng)域常常用到的功能。這里就以實現(xiàn)這樣一個常見功能的程序為例,說明程序優(yōu)化的技巧。
1 實例分析
程序的目標(biāo)是將一個長寬為240×160,格式為RGB565的顯示緩沖區(qū)的內(nèi)容映射到長寬為320×240,格式也為RGB565的顯示緩沖區(qū)內(nèi)。因為源數(shù)據(jù)寬度是240點,所以,放大到目的區(qū)域的時候,就需要每3個源數(shù)據(jù)點中,重復(fù)1點的數(shù)據(jù),變成4點,放到目的顯示緩沖區(qū)中。同樣,每2行源數(shù)據(jù)也要重復(fù)1行,變成3行,放到目的顯示緩沖區(qū)中。源數(shù)據(jù)和目的數(shù)據(jù)分別定義如下(保證源顯示緩沖區(qū)和目的顯示緩沖區(qū)都是4字節(jié)對齊起始的):
注:以下所有程序均是使用ADS1.1編譯,CPU主頻為100 MHz,使用ARM7EJ-S為目標(biāo)處理器,小端編譯方式,測試的時間是以所有的程序和數(shù)據(jù)均是Cache全命中為前提測試得到的。
2 原始程序
下面這段程序是沒有經(jīng)過任何優(yōu)化的程序,僅僅實現(xiàn)了相應(yīng)的功能要求,運行時間為10 ms。
評論