新聞中心

EEPW首頁 > 手機(jī)與無線通信 > 設(shè)計應(yīng)用 > 走近Caneland服務(wù)器平臺

走近Caneland服務(wù)器平臺

——
作者: 時間:2007-09-17 來源:中計在線 收藏
全球同步發(fā)布代碼名為的高端4路平臺是英特爾在2007年的重大事件,它意味著英特爾在4路處理器產(chǎn)品上完成了向酷睿微架構(gòu)的轉(zhuǎn)換,并將會同合作伙伴在多路市場上有更多建樹。在英特爾平臺面世前一周,本報記者來到位于上海紫竹科學(xué)園的英特爾測試實(shí)驗室,與英特爾技術(shù)專家交流了新平臺的技術(shù)實(shí)現(xiàn)及第二代I/OAT(I/O加速技術(shù))、虛擬化和能效評測等方面的相關(guān)細(xì)節(jié)。

接棒Truland

這并非是英特爾首次推出4核至強(qiáng)處理器。此前,英特爾曾推出基于單路和2路的4核處理器。9月6日推出的Caneland平臺包括的Xeon 7300系列處理器則是業(yè)界推出的首款面向多路的4核處理器。從Xeon 7300系列開始,英特爾未來的所有服務(wù)器處理器都將采用更高能效的酷睿微架構(gòu),從而支持更高密度的數(shù)據(jù)中心部署,

Caneland正式接替Truland。

英特爾產(chǎn)品技術(shù)工程師黃菁介紹,Caneland平臺不僅實(shí)現(xiàn)了微架構(gòu)遷移,還從平臺層面融合了一系列最新的前沿技術(shù),以便能夠應(yīng)對對數(shù)據(jù)要求苛刻的企業(yè)應(yīng)用和虛擬環(huán)境中的服務(wù)器整合。依然采用mPGA604封裝的Xeon 7300系列由兩個原生2核組合封裝而成,采用內(nèi)部總線傳輸數(shù)據(jù)并共享二級緩存。據(jù)英特爾內(nèi)部測試,相比Xeon 7100系列,Xeon 7300系列的能效表現(xiàn)提升了125%,同時還進(jìn)一步控制了能耗:用于刀片服務(wù)器的處理器TDP(熱設(shè)計功耗)為50瓦,機(jī)架式服務(wù)器處理器TDP為80瓦,性能優(yōu)化型處理器的TDP為130瓦。

與上一代平臺采用的TwinCastle芯片組相比,Caneland平臺采用的Clarksboro北橋芯片的前端總線變化明顯。Clarksboro芯片改為在每顆4核芯片與芯片組之間使用專用的連接通道,提供了4條1066MT/s的前端總線,即系統(tǒng)中的每顆處理器都有獨(dú)立的高速總線。這改變了以往雙獨(dú)立總線架構(gòu)要求每兩顆處理器共享芯片組連接,造成帶寬不足的弊端。

Clarksboro芯片組還整合了容量為64MB的探聽過濾器。它可以看作是包含處理器所有數(shù)據(jù)信息的特別緩沖器。要確保多核處理器緩存的一致性,Caneland平臺的單顆2核處理器必須注意另一顆2核處理器的總線情況,探聽過濾器就是要減少處理器總線發(fā)生數(shù)據(jù)堵塞的情況。出現(xiàn)高速緩存未中時,探聽過濾器將攔截探聽,如果讀取請求同一總線上的另一個處理器得到滿足,則取消探聽過濾器訪問;如果沒有得到滿足,訪問結(jié)果將確定是否進(jìn)行下一操作。經(jīng)內(nèi)部測試,與以往的使用轉(zhuǎn)發(fā)器相比,探聽過濾器在4路系統(tǒng)上可以提升10%~15%的性能。

配置FB-DIMM內(nèi)存也非常值得關(guān)注,這項新技術(shù)能夠同時增強(qiáng)內(nèi)存吞吐率、帶寬、容量和可靠性。與采用DDR2-400內(nèi)存的前代E7520芯片組平臺相比,F(xiàn)B-DIMM技術(shù)能提供4倍的內(nèi)存容量(64GB)和3倍的最高帶寬(采用1333MHz系統(tǒng)總線,速度為21GB/s)。當(dāng)安裝8GB DIMM模組時,Caneland平臺最高可配置256GB內(nèi)存。

I/OAT技術(shù)進(jìn)化

近幾年迅速發(fā)展,語音、視頻、游戲等應(yīng)用導(dǎo)致I/O負(fù)載壓力急速增大。伴隨著虛擬化應(yīng)用日益普遍,據(jù)統(tǒng)計,20%的服務(wù)器都開始采用虛擬化技術(shù)。當(dāng)我們在虛擬機(jī)上同時部署多個應(yīng)用時,勢必會給I/O造成越來越大的壓力。

英特爾在2006年推出Bensley平臺時,便推出了I/OAT解決方案。它的出現(xiàn),就是為了解決I/O負(fù)載量過大的問題。從技術(shù)實(shí)現(xiàn)的角度來看,I/OAT是如何工作,解決與基于TCP/IP的通信相關(guān)的系統(tǒng)級瓶頸問題呢?英特爾產(chǎn)品技術(shù)工程師鄧立向記者做出了如下解釋。

與數(shù)據(jù)傳輸?shù)穆窂较嗤?,I/OAT是從網(wǎng)卡到芯片組、CPU的平臺化解決方案。在采用這一技術(shù)的網(wǎng)卡部分,可以實(shí)現(xiàn)數(shù)據(jù)到達(dá)后的分塊以及頭部的分離與處理,以此來實(shí)現(xiàn)數(shù)據(jù)加速的過程。芯片組則內(nèi)嵌了一個DMA(直接內(nèi)存存取)數(shù)據(jù)加速引擎,數(shù)據(jù)可以不通過CPU而直接進(jìn)行數(shù)據(jù)打包、卸載以及內(nèi)存提取。DMA引擎幫助芯片組直接承擔(dān)起網(wǎng)卡和內(nèi)存數(shù)據(jù)交換的重任,這樣就減輕了CPU不必要的負(fù)擔(dān),可更快地移動數(shù)據(jù)。處理器加速,也主要是針對七層協(xié)議,如TCP打包、封裝等操作進(jìn)行的,這部分加速提供了為英特爾架構(gòu)優(yōu)化的協(xié)議堆棧,以改進(jìn)數(shù)據(jù)訪問。以上三者共同構(gòu)成英特爾的數(shù)據(jù)加速技術(shù)。BIOS和操作系統(tǒng)也已經(jīng)充分釋放了I/OAT的能力。

在Caneland平臺上,I/OAT發(fā)展到了第二代—I/OAT2,并將在后續(xù)推出的其他平臺也裝備。新技術(shù)有益于增強(qiáng)數(shù)據(jù)中心I/O的性能,主要從多端口10GbE、虛擬化、網(wǎng)絡(luò)存儲、應(yīng)用快速響應(yīng)、附加協(xié)議等方面來實(shí)現(xiàn)。

I/OA T2在原有基礎(chǔ)上增加了直接DCA(高級緩存訪問)的工作模式,這是一項快速響應(yīng)、增強(qiáng)性能的新特性。通過網(wǎng)卡傳送進(jìn)來的數(shù)據(jù)包如果是小包,DCA將直接把這些包送到緩存當(dāng)中;如果是大包,DCA無法直接提取,它將協(xié)同DMA工作,一起把數(shù)據(jù)包傳送到高速緩存。DCA的意義在于,數(shù)據(jù)包盡可能采用最近最快的途徑,進(jìn)入CPU的高速緩存中被優(yōu)先訪問,這將極大降低CPU的數(shù)據(jù)存取延遲。

為了給服務(wù)器整合及虛擬化提供高性能I/O,I/OAT2也做出了重大改進(jìn),目的就在于破除VMM軟件層軟交換機(jī)在數(shù)據(jù)交換時帶來的瓶頸,減少網(wǎng)絡(luò)擁塞和延時。這就是英特爾在新一代網(wǎng)卡中推出的另一項技術(shù)VMDq(虛擬機(jī)設(shè)備排列)。從網(wǎng)絡(luò)上傳送過來的數(shù)據(jù)包是雜亂無章的,沒有VMDq之前,這些包是直接通過網(wǎng)卡到達(dá)軟交換機(jī),經(jīng)分別整理處理后送到虛擬機(jī)。這就給給軟交換機(jī)造成了非常大的負(fù)載壓力。采用了VMDq后,數(shù)據(jù)包在送達(dá)軟交換機(jī)之前,已經(jīng)被依照虛擬機(jī)的需求分別排列成不同的組,只需要軟交換機(jī)簡單處理后就直接傳送,極大提高了數(shù)據(jù)傳輸?shù)男省?/P>

虛擬化支持提速

英特爾是虛擬化堅定的推動者。通過這項技術(shù),用戶的IT環(huán)境可以被改造成更強(qiáng)大、更具彈性的架構(gòu)。

數(shù)年前,x86平臺還沒有硬件支持虛擬化,甚至連指令集都不是為虛擬化而設(shè)計,這時主要靠純軟件來實(shí)現(xiàn)虛擬化。這就遇到了一些難題,比如CPU的優(yōu)先級問題、設(shè)備管理問題等等。軟件廠商當(dāng)時只能通過代碼轉(zhuǎn)換等技術(shù)手段去繞開這些麻煩,無形中降低了虛擬化的運(yùn)行性能。直到英特爾推出虛擬化技術(shù),將虛擬環(huán)境中的復(fù)雜軟件操作融入到硬件層面。

英特爾產(chǎn)品工程師南波向記者展示了英特爾虛擬化技術(shù)的發(fā)展路線圖。從軟件層面進(jìn)行虛擬化部署之后,英特爾首先在處理器層面支持虛擬化(至強(qiáng)VT-x和安騰VT-i),并逐漸擴(kuò)展到其他設(shè)備,虛擬化也就從純軟件逐漸深入到處理器級,再到平臺級乃至I/O級。對于關(guān)注I/O性能的企業(yè)級應(yīng)用而言,完成了處理器虛擬化和I/O虛擬化,整個平臺的虛擬化過程就基本完成了。

這里最值得注意的是將在Caneland平臺I/O級上運(yùn)用到的核心技術(shù)VT-d。這是一種基于北橋芯片的硬件輔助虛擬化技術(shù),通過在北橋中內(nèi)置提供DMA虛擬化和IRQ虛擬化硬件,實(shí)現(xiàn)了新型的I/O虛擬化方式。

=I/O虛擬化的關(guān)鍵在于解決I/O設(shè)備與虛擬機(jī)數(shù)據(jù)交換的問題,而這部分主要相關(guān)的是DMA及IRQ中斷請求。成功的I/O虛擬化需要解決好這兩方面的隔離、保護(hù)及性能問題。I/O虛擬化需要正確分離這些I/O設(shè)備產(chǎn)生的中斷請求,并送到不同的虛擬機(jī)上。傳統(tǒng)設(shè)備的通過DMA寫請求直接發(fā)送出去的MSI(消息中斷),需要在請求內(nèi)嵌入目標(biāo)內(nèi)存地址,完全訪問所有的內(nèi)存地址并不能實(shí)現(xiàn)中斷隔離。VT-d通過重新定義MSI格式解決了這個問題。新的MSI形式不變,但用消息ID取代了目標(biāo)內(nèi)存地址,通過維護(hù)表結(jié)構(gòu),硬件可以通過不同的消息ID辨認(rèn)不同的虛擬機(jī)區(qū)域。

VT-d最終體現(xiàn)到虛擬化模型上,就是新增了虛擬機(jī)直接分配物理I/O設(shè)備給虛擬機(jī)以及I/O設(shè)備共享兩種設(shè)備虛擬化方式,以此來代替?zhèn)鹘y(tǒng)的設(shè)備模擬/額外設(shè)備接口方式,從而提升了虛擬化的I/O性能。

交換機(jī)相關(guān)文章:交換機(jī)工作原理




評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉