新聞中心

EEPW首頁 > 新品快遞 > 騰訊云:服務(wù)器資源池化技術(shù)發(fā)展趨勢

騰訊云:服務(wù)器資源池化技術(shù)發(fā)展趨勢

作者: 時間:2015-04-23 來源:飛象網(wǎng) 收藏

海量數(shù)據(jù)正以前所未有的增長趨勢沖擊著整個數(shù)據(jù)中心行業(yè),數(shù)據(jù)中心建設(shè)者們不得不以一種新的思考方式去重新審視IT系統(tǒng)架構(gòu)。服務(wù)器作為數(shù)據(jù)中心的核心部件之一,為了適應(yīng)未來大規(guī)模業(yè)務(wù)增長的需求,也需要對其架構(gòu)進(jìn)行優(yōu)化和重構(gòu)。

本文引用地址:http://m.butianyuan.cn/article/273056.htm

服務(wù)器的硬件重構(gòu)關(guān)乎大規(guī)模數(shù)據(jù)中心的效率和成本問題,目標(biāo)是降低服務(wù)器硬件購置成本、提高服務(wù)器硬件資源的利用率、降低服務(wù)器運維成本,降低綜合TCO。

騰訊作為服務(wù)器"天蝎標(biāo)準(zhǔn)"的引領(lǐng)者,一直在服務(wù)器領(lǐng)域深耕細(xì)作,精細(xì)化運營。尤其在新技術(shù)領(lǐng)域敢為人先,那么對于服務(wù)器資源池化技術(shù),騰訊又是怎么看怎么做的呢?請跟隨小編去一步步探討。

資源池化?

騰訊的現(xiàn)役服務(wù)器超過數(shù)十萬臺,其中傳統(tǒng)的機架式服務(wù)器占比超過90%。傳統(tǒng)的機架式服務(wù)器計算、存儲、網(wǎng)絡(luò)資源配比較為均衡,具有很好的通用性,是比較典型的"One size fits all"方案。所以,在騰訊十多年服務(wù)器發(fā)展歷程中,機架式服務(wù)器承擔(dān)著非常重要的奠基石作用。但是,隨著騰訊的單體業(yè)務(wù)的規(guī)模膨脹,傳統(tǒng)機架式服務(wù)器在應(yīng)對大規(guī)模業(yè)務(wù)模型時,顯露出些絲疲態(tài),在運行某一種資源密集型的應(yīng)用,效率不夠高,還影響密度。譬如:

計算密集型應(yīng)用,空著的內(nèi)存插槽、驅(qū)動器倉、擴展槽位都影響計算密度;

內(nèi)存密集型應(yīng)用,驅(qū)動器倉和擴展槽位可能是浪費空間;

存儲密集型應(yīng)用,CPU 和內(nèi)存的設(shè)計配置過高了……

為此,我們付出的代價是:定制不同型號的服務(wù)器。目前騰訊現(xiàn)役機型超過百種,新采購機型超過數(shù)十種。服務(wù)類型的增加,不僅給服務(wù)器的資源管理帶來了困難,也給服務(wù)器的運營增加了很多困難和成本。

傳統(tǒng)機架式服務(wù)器應(yīng)對大規(guī)模數(shù)據(jù)中心暴露出來的問題,不僅僅是騰訊一家,業(yè)界很多互聯(lián)網(wǎng)企業(yè)、云服務(wù)提供商都面臨著這個問題。數(shù)據(jù)中心的負(fù)責(zé)是多樣性的,下圖很形象的展示了數(shù)據(jù)中心不同負(fù)載對CPU、MEM、IO的需求:

數(shù)據(jù)中心工作負(fù)載的多樣性,橫軸是I/O 密集程度,縱軸是CPU 和內(nèi)存密集程度,可見一個計算和存儲等資源配比相對均衡的系統(tǒng),是很難做到對多種不同應(yīng)用優(yōu)化的。

另外,不同類型資源之間也存在生命周期不同步的問題。譬如,CPU 是發(fā)展速度最快的,每兩三年就性能翻倍,然而存儲的技術(shù)發(fā)展相對緩慢,從而會造成CPU性能和功耗的浪費。

服務(wù)器資源池化技術(shù),除了能夠帶來靈活、彈性的資源部署,提高資源利用率這個優(yōu)勢,還能夠更有效的提高服務(wù)器的故障修復(fù)能力,提升服務(wù)器運營效率。綜合騰訊十多年的運營數(shù)據(jù),硬盤是故障率最高的部件之一,在實現(xiàn)存儲池化技術(shù)后,多盤存儲資源池為單體硬盤提供了很好的冗余設(shè)計能力。當(dāng)單個硬盤出現(xiàn)故障后,可以及時使用其他硬盤資源進(jìn)行無損恢復(fù),無需立即現(xiàn)場更換硬盤。

誰在研究服務(wù)器資源池化?

為了解決這個問題,業(yè)界以Intel、Google為首的多家公司著手研究新型的服務(wù)器架構(gòu)。

Intel提出了RSA(Rack Scale Architecture)架構(gòu)、Google攜手伯克利大學(xué)提出了WSC(Warehouse Scale Computer)的概念。Intel的RSA架構(gòu)已經(jīng)有了清晰的架構(gòu)設(shè)計和路標(biāo),目前原型機已經(jīng)面世。而Google的WSC仍在概念階段,只有簡單的時間表,2020年。

服務(wù)器資源池化的挑戰(zhàn)?

在這里,我們以Intel的RSA為范例,簡單介紹一下服務(wù)器資源池化技術(shù)。用一句形象的話來比喻RSA:Rack As a Server,即一個機柜就像是一臺大型服務(wù)器。Intel RSA(Rack Scale Architecture) 架構(gòu)提供了一種機架重構(gòu)的方案,其思想是將幾種重要的資源池化:CPU 池、內(nèi)存池、存儲池,池化的RSA 模型可以很方便地進(jìn)行管理和擴展,并降低運行維護(hù)成本。業(yè)務(wù)軟件或者OS的視角看到的還是一臺傳統(tǒng)的服務(wù)器,有CPU、內(nèi)存、硬盤、網(wǎng)卡等,如下圖所示:

服務(wù)器重構(gòu)并資源池化后,面臨的最大的挑戰(zhàn)就是,挑戰(zhàn)一:互連與時延(拓?fù)浣Y(jié)構(gòu)與接口);挑戰(zhàn)二:配置與管理(協(xié)議與監(jiān)控)。

挑戰(zhàn)一:互連與時延。資源池之間的網(wǎng)絡(luò)互連,在鏈路層協(xié)議上,可以有很多種,Intel RSA采用的是以太網(wǎng),行業(yè)上還有其他公司采用PCIe、SAS、Fabric等。不同的網(wǎng)絡(luò)互連協(xié)議,各具優(yōu)缺點,我們也期待著各種技術(shù)的探索成果。但是在物理層上,各家的觀點殊途同歸:硅光技術(shù)。硅光技術(shù)不僅繼承了光纖傳輸?shù)母咚?、低時延的特點,同時也大幅提升了接口密度。

挑戰(zhàn)二:配置與管理。服務(wù)器的部件資源池化后,需要對部件資源進(jìn)行發(fā)現(xiàn)、記錄、分配、回收,以及對邏輯服務(wù)器進(jìn)行組裝、卸載等,需要定義一套新的管理軟件和協(xié)議。目前Intel定義了一套RSA管理軟件,提供對服務(wù)器資源池的發(fā)現(xiàn)、配置和管理。

RSA管理軟件不僅僅實現(xiàn)對內(nèi)部池化資源的配置管理,同樣對上提供管理接口,對接OpenStack或VMware等管理軟件。服務(wù)器資源池化后,產(chǎn)生了大量的配置管理的數(shù)據(jù),傳統(tǒng)使用I2C總線的IPMI接口和協(xié)議,由于傳輸速率低、協(xié)議承載信息量小,無法滿足資源池化的配置管理需求。此前,Intel聯(lián)合HP、Dell建立了一套新的數(shù)據(jù)中心管理軟件協(xié)議Redfish,也被Intel導(dǎo)入RSA軟件架構(gòu),用于優(yōu)化資源池化管理。

業(yè)務(wù)軟件的同事可能比較關(guān)心,服務(wù)器資源池化后,對業(yè)務(wù)軟件會有什么影響嗎?答案是,不會。服務(wù)器資源池化,是從硬件角度對服務(wù)器硬件資源進(jìn)行優(yōu)化重構(gòu);從軟件層面來看,是透明的。創(chuàng)建了邏輯服務(wù)器后,軟件和OS看到的與傳統(tǒng)服務(wù)器的硬件部件沒有區(qū)別。

服務(wù)器資源池化能力如何助力云服務(wù)?

目前虛擬化技術(shù)和云服務(wù)都是基于虛擬化技術(shù),將單個服務(wù)器硬件虛擬成多個虛擬機VM,其目的也是在于提高服務(wù)器資源的利用率。但是,由于單個服務(wù)器的CPU、內(nèi)存、硬盤資源顆粒度較小,因此在虛擬化應(yīng)用中,經(jīng)常出現(xiàn)資源配置空洞,要么是CPU核數(shù)沒有分配完,要么是內(nèi)存沒有分配完,更多的情況是硬盤容量存在大量空閑。

而服務(wù)器資源池化可以更好的解決上述問題。據(jù)了解,現(xiàn)在騰訊云的虛擬化服務(wù)是一虛多的能力,而未來將借助服務(wù)器資源池化技術(shù)逐步實現(xiàn)多虛多的能力。

這樣一來,騰訊云通過軟件層面提供的虛擬化服務(wù),同時利用服務(wù)器資源池化在硬件層面提供的虛擬化能力,能夠為用戶提供更加靈活的云服務(wù)。服務(wù)器資源池化后,創(chuàng)建出來的邏輯服務(wù)器上,可以繼續(xù)運行虛擬化和云服務(wù)器軟件,再創(chuàng)建出虛擬機給用戶使用。服務(wù)器資源池化后,可以進(jìn)一步減少云服務(wù)產(chǎn)生的資源配置空洞,進(jìn)一步提高硬件資源的利用率,減少TCO成本。

騰訊目前在服務(wù)器資源池化上的研究進(jìn)展

2014年騰訊服務(wù)器平臺中心基于資源池化的概念,進(jìn)行了存儲池化的技術(shù)預(yù)研和POC驗證。使用現(xiàn)有的傳統(tǒng)機架服務(wù)器,搭建了一套存儲池化的簡易POC模型,如下圖所示:

將20臺騰訊的B/C類服務(wù)器去除硬盤后,組成計算資源池,使用1臺TSx存儲服務(wù)器作為存儲資源池,然后基于萬兆網(wǎng)絡(luò)完成存儲池與計算池的互連。資源配置方面,將存儲池的硬盤劃分成20個LUN,用于分配給20個Bx/Cx計算節(jié)點的啟動盤。

實驗中,騰訊實現(xiàn)了20臺邏輯服務(wù)器的組裝,實現(xiàn)了服務(wù)器的批量自動部署、遠(yuǎn)程網(wǎng)絡(luò)啟動、邏輯服務(wù)器復(fù)位后自組裝啟動等功能,證實了啟動盤存儲池化的可行性設(shè)計。性能數(shù)據(jù)方面,通過多次測試和數(shù)據(jù)捕捉,發(fā)現(xiàn)單臺TSx的磁盤性能基本能夠滿足20臺Bx/Cx的同時啟動的數(shù)據(jù)讀取需求;網(wǎng)絡(luò)端口的流量上,10GE網(wǎng)卡剛剛能夠滿足20臺Bx/Cx的數(shù)據(jù)吞吐量要求,而且網(wǎng)絡(luò)吞吐量與啟動節(jié)點數(shù)成正比,如下圖:

整體數(shù)據(jù)表明,存儲池化技術(shù)是可以滿足多計算節(jié)點共享啟動盤的需求的。這為服務(wù)器彈性部署和擴展提供了強有力的數(shù)據(jù)支撐。為騰訊下一步在服務(wù)器資源池化的研究奠定了堅實的基礎(chǔ)。

前文也提到過資源池化在故障運維上帶來的優(yōu)勢,為此,騰訊在2014年的POC驗證中,也設(shè)計并驗證了單體硬盤故障的無損恢復(fù)功能。

在POC設(shè)計上,存儲池采用全局RAID設(shè)計,當(dāng)單個物理硬件出現(xiàn)故障時,不影響業(yè)務(wù)使用。單個資源的故障可在線使用備用資源實時無損修復(fù),無需人工立即到現(xiàn)場進(jìn)行磁盤更換修復(fù)。

綜述

服務(wù)器資源池化技術(shù)在靈活彈性部署、故障冗余能力、降低TCO等方面都具備優(yōu)勢,但是在技術(shù)細(xì)節(jié)上還存在很多疑問有待探索。騰訊正持續(xù)跟進(jìn)行業(yè)最新的資源池化技術(shù)動態(tài),保持與合作伙伴的密切合作,設(shè)計T-Rack3.0,并把T-Rack3.0(Tencent Rack3.0)中標(biāo)準(zhǔn)化的、共性的設(shè)計開放到天蝎3.0標(biāo)準(zhǔn)中,優(yōu)化行業(yè)整體實力。

相信未來騰訊在云計算、大數(shù)據(jù)領(lǐng)域會給整個行業(yè)帶來更具競爭力的服務(wù)器解決方案。




關(guān)鍵詞: WHY服務(wù)器

評論


技術(shù)專區(qū)

關(guān)閉