內(nèi)存網(wǎng)格關(guān)鍵技術(shù)探析
摘要:內(nèi)存網(wǎng)格的出現(xiàn)主要借鑒了傳統(tǒng)的網(wǎng)格計(jì)算技術(shù)和集群內(nèi)存共享技術(shù)。本文從動(dòng)態(tài)函數(shù)截獲,緩存數(shù)據(jù)組織與管理和異步緩存數(shù)據(jù)寫入三方面探討了內(nèi)存網(wǎng)格系統(tǒng)的關(guān)鍵技術(shù)。
本文引用地址:http://m.butianyuan.cn/article/202242.htm關(guān)鍵詞:內(nèi)存網(wǎng)格;動(dòng)態(tài)函數(shù)截獲;異步緩存數(shù)據(jù)
一 引言
隨著計(jì)算機(jī)技術(shù)的發(fā)展,CPU和系統(tǒng)主存的性能得到了極大的提高。然而由于IO設(shè)備的發(fā)展相對(duì)滯后,磁盤性能逐漸成為了影響計(jì)算機(jī)整體性能的瓶頸。對(duì)于具有頻繁、隨機(jī)磁盤10的數(shù)據(jù)密集型應(yīng)用,如web服務(wù)器和數(shù)據(jù)庫(kù)系統(tǒng),磁盤訪問的巨大延遲將嚴(yán)重影響應(yīng)用程序的性能。為了提高系統(tǒng)10性能,提出了內(nèi)存網(wǎng)格的概念,為共享和利用互聯(lián)網(wǎng)中豐富的內(nèi)存資源來解決內(nèi)存密集型應(yīng)用的性能問題提供了理論支持。本文結(jié)合已有的內(nèi)存網(wǎng)格理論,對(duì)其關(guān)鍵技術(shù)進(jìn)行了系統(tǒng)研究。
二 動(dòng)態(tài)函數(shù)截獲技術(shù)
(一)內(nèi)核模塊
Linux內(nèi)核是單一平面結(jié)構(gòu)(monolithic),也就是說它是一個(gè)獨(dú)立的大程序,所有的內(nèi)核功能構(gòu)件均可訪問任一個(gè)內(nèi)部數(shù)據(jù)結(jié)構(gòu)和例程。為了方便使用同時(shí)又提供了模塊化的機(jī)制,這就是內(nèi)核模塊。內(nèi)核模塊是可以按照需要?jiǎng)討B(tài)載入內(nèi)核和從內(nèi)核中卸載的代碼。內(nèi)核模塊可以不需要重起系統(tǒng)擴(kuò)展內(nèi)核的功能。對(duì)于Linux內(nèi)核模塊,可以用insmod或rmmod命令顯式載入或卸載,或者由內(nèi)核在需要時(shí)調(diào)用內(nèi)核守護(hù)程序(kerneld)自動(dòng)載入和卸載。內(nèi)核模塊運(yùn)行在Linux內(nèi)核空間,可以方便地使用內(nèi)核提供的系統(tǒng)函數(shù)和變量。從模塊程序鏈接的方式來看,它并不能自由地使用用戶空間里定義的函數(shù)庫(kù),只能使用內(nèi)核空間中定義的、資源受到限制的函數(shù)。內(nèi)核在內(nèi)核符號(hào)表中維護(hù)了一個(gè)模塊的鏈表,每個(gè)符號(hào)表對(duì)應(yīng)一個(gè)模塊,模塊加載進(jìn)內(nèi)核時(shí)正確地對(duì)其進(jìn)行解釋,并將模塊作為內(nèi)核的一部分來執(zhí)行:加載進(jìn)內(nèi)核的模塊具有所有的內(nèi)核權(quán)限。模塊可以在系統(tǒng)啟動(dòng)時(shí)加載到系統(tǒng)中,也可以在系統(tǒng)運(yùn)行時(shí)加載:在不需要時(shí),可以將模塊動(dòng)態(tài)卸載,這樣就不用每次修改系統(tǒng)的配置時(shí)都要重新編譯內(nèi)核了。一般來說,內(nèi)核模塊可以應(yīng)用于設(shè)備驅(qū)動(dòng)、文件系統(tǒng)驅(qū)動(dòng)程序、網(wǎng)絡(luò)驅(qū)動(dòng)、可執(zhí)行文件解釋器和系統(tǒng)調(diào)用等方面。
(二)函數(shù)截獲
內(nèi)存網(wǎng)格系統(tǒng)中利用了函數(shù)截獲(APIHooking)的方法來動(dòng)態(tài)改變系統(tǒng)函數(shù)執(zhí)行流程。所謂動(dòng)態(tài)改變,就是指在不修改程序源代碼和不覆蓋程序在磁盤的存儲(chǔ)映像前提下,對(duì)程序行為進(jìn)行修改。
函數(shù)截獲(API Hooking)是獲取指定執(zhí)行代碼控制權(quán)的基本方法[44,45]。它提供了一種在不修改程序源代碼的前提下,動(dòng)態(tài)改變操作系統(tǒng)行為的便捷方法。在眾多現(xiàn)代操作系統(tǒng)中,使用函數(shù)截獲方法的間諜軟件(Spying Software)大量利用了系統(tǒng)中存在的窗口程序來部署自己的特殊應(yīng)用。一般說來,使用函數(shù)截獲方法具有如下優(yōu)點(diǎn):
1、便于API函數(shù)的監(jiān)控
具備控制API函數(shù)調(diào)用的能力是非常有用的。它能夠使程序開發(fā)者追蹤一些發(fā)生在API調(diào)用過程中、通常對(duì)外部應(yīng)用“不可見”的系統(tǒng)行為。這種方法主要用于特定環(huán)境下對(duì)函數(shù)參數(shù)的驗(yàn)證和檢查。比如,在某些情況下,監(jiān)控與內(nèi)存相關(guān)的API調(diào)用可以有效的捕獲內(nèi)存資源泄漏的問題。
2、便于調(diào)試與逆向工程
基于函數(shù)截獲的調(diào)試方法一直在調(diào)試技術(shù)中占據(jù)重要的地位。許多程序開發(fā)者使用函數(shù)截獲方法來確定程序部件的實(shí)現(xiàn)和相互關(guān)聯(lián)。API截獲(APlinterception是獲取二進(jìn)制執(zhí)行文件信息的重要方法。
3、便于窺視系統(tǒng)內(nèi)部實(shí)現(xiàn)
許多程序開發(fā)者希望對(duì)非開源操作系統(tǒng)有深層次的了解。函數(shù)截獲方法是一種有效的探索API內(nèi)部細(xì)節(jié)的方法。
4、便于擴(kuò)展函數(shù)的功能
為了能夠改變或擴(kuò)展模塊功能,通常使用函數(shù)截獲的方法對(duì)程序的正常執(zhí)行流進(jìn)行重新定向。比如,許多第三方軟件產(chǎn)品有時(shí)候無法滿足具體的安全要求,因此不得不對(duì)其進(jìn)行一些調(diào)整。為了解決這種問題,應(yīng)用程序開發(fā)者可以利用函數(shù)截獲方法對(duì)原函數(shù)添加一些額外的前置和后置處理過程。這種方法對(duì)改變一些已經(jīng)編譯后的代碼行為極為有用。
對(duì)于一個(gè)需要利用函數(shù)截獲的系統(tǒng)來說,通常需要依據(jù)函數(shù)截獲的目標(biāo)和使用環(huán)境來決定具體采用何種函數(shù)截獲方法。首先,我們需要考慮設(shè)計(jì)目標(biāo)是只針對(duì)單一應(yīng)用進(jìn)行截獲還是需要構(gòu)建一個(gè)系統(tǒng)級(jí)的截獲方案。比如,如果只需要監(jiān)控一個(gè)特定應(yīng)用,那么就不需要對(duì)一個(gè)系統(tǒng)級(jí)的函數(shù)進(jìn)行截獲。
一個(gè)截獲系統(tǒng)(Hook System)通常由至少兩個(gè)部分組成,即一個(gè)截獲服務(wù)器
CHook Server)和一個(gè)截獲驅(qū)動(dòng)器(HookDriver)。截獲驅(qū)動(dòng)器主要完成實(shí)際的截獲功能,截獲服務(wù)器則負(fù)責(zé)將截獲驅(qū)動(dòng)器在特定時(shí)刻注入(inject到目標(biāo)進(jìn)程。截獲服務(wù)器同時(shí)管理驅(qū)動(dòng)器并且選擇性的接受來自驅(qū)動(dòng)器的信息。
三 緩存數(shù)據(jù)組織與管理
(一)模型設(shè)計(jì)
內(nèi)存網(wǎng)格系統(tǒng)擴(kuò)展了傳統(tǒng)的系統(tǒng)存儲(chǔ)層次結(jié)構(gòu),在主存和磁盤之間添加了內(nèi)存網(wǎng)格層。內(nèi)存網(wǎng)格層主要由內(nèi)存服務(wù)節(jié)點(diǎn)提供的空閑內(nèi)存空間構(gòu)成,內(nèi)存客戶節(jié)點(diǎn)通過利用這些空閑內(nèi)存作為本地磁疵緩存的擴(kuò)展,從而加速系統(tǒng)磁盤10的性能。但是對(duì)于內(nèi)存服務(wù)節(jié)點(diǎn)提供的空閑內(nèi)存空間,如何有效的對(duì)其進(jìn)行組織和管理就成為了一個(gè)關(guān)鍵問題。
在基于協(xié)作緩存的改進(jìn)模型中,內(nèi)存網(wǎng)格的內(nèi)存客戶節(jié)點(diǎn)和提供其服務(wù)的內(nèi)存服務(wù)節(jié)點(diǎn)比例為1:n。因此我們采用了基數(shù)樹和LRU鏈相結(jié)合的方式來解決查找和定位的問題,基數(shù)樹用于解決緩存數(shù)據(jù)的定位問題而存在于內(nèi)存客戶節(jié)點(diǎn)中,LRU鏈用于對(duì)緩存數(shù)據(jù)的更新和替換存在于內(nèi)存服務(wù)節(jié)點(diǎn)中。
在RAM Grid原型系統(tǒng)的最初設(shè)計(jì)過程中,為了簡(jiǎn)化管理過程,我們規(guī)定一個(gè)內(nèi)存客戶節(jié)點(diǎn)在某一時(shí)刻有且盡可能使用一個(gè)內(nèi)存服務(wù)節(jié)點(diǎn)的服務(wù)。為了能夠?qū)?nèi)存服務(wù)節(jié)點(diǎn)中的空閑內(nèi)存資源進(jìn)行有效管理,內(nèi)存網(wǎng)格系統(tǒng)選擇在內(nèi)存客戶節(jié)點(diǎn)中實(shí)現(xiàn)了緩存數(shù)據(jù)組織和管理模塊。緩存數(shù)據(jù)組織和管理模塊對(duì)緩存數(shù)據(jù)進(jìn)行本地管理,管理信息包括內(nèi)存客戶節(jié)點(diǎn)所使用的內(nèi)存服務(wù)節(jié)點(diǎn)上數(shù)據(jù)頁(yè)幀的狀態(tài)信息、存儲(chǔ)位置等。為了能夠達(dá)到這些目標(biāo),我們改變了模型中的緩存方案,使用了基于LRU和Hash雙鏈的數(shù)據(jù)組織和管理方法。
LRU鏈和Hash鏈的雙鏈管理結(jié)構(gòu)在操作系統(tǒng)設(shè)計(jì)中由來已久。在開源操作系統(tǒng)Linux的早期版本中,對(duì)于數(shù)據(jù)結(jié)構(gòu)的管理與組織就大量的使用了這種經(jīng)典的雙鏈結(jié)構(gòu)。其中,LRU鏈主要對(duì)數(shù)據(jù)結(jié)構(gòu)進(jìn)行更新和替換:Hash鏈主要用于數(shù)據(jù)結(jié)構(gòu)的快速查找和定位。通過雙鏈結(jié)構(gòu)的管理和組織,當(dāng)內(nèi)存客戶節(jié)點(diǎn)通過本地文件系統(tǒng)進(jìn)行磁盤10操作時(shí),則可以利用遠(yuǎn)地內(nèi)存服務(wù)節(jié)點(diǎn)的內(nèi)存來獲取數(shù)據(jù),從而減小內(nèi)存客戶節(jié)點(diǎn)磁盤開銷,提升系統(tǒng)性能。
評(píng)論