Facebook透露為AI和VR打造硬件的原因
新的設(shè)計提升了處理器和處理器之間、處理器和內(nèi)存之間的通信效率。
本文引用地址:http://m.butianyuan.cn/article/201604/289905.htm「我們將CPU簡化至正好能滿足我們要求,」這兩位工程師表示,「我們移除了QPI鏈接,縮減了英特爾的成本??紤]到我們的服務(wù)器將基于同一的插槽,這也解決了我們NUMA問題。我們將其設(shè)計為整合芯片集的系統(tǒng)芯片,更加簡單。這種接口一致的CPU散熱設(shè)計功耗(TDP)更低。與此同時,我們重新設(shè)計的服務(wù)器基礎(chǔ)設(shè)施,在同等電源條件下,容納每個機(jī)架雙倍的CPUs數(shù)量?!?/p>
這使得Facebook制造出一個可以在每個機(jī)架上獲得更高性能的服務(wù)器體系結(jié)構(gòu),同時確保每個機(jī)柜能量消耗密度保持在11千瓦以下。
強(qiáng)大的人工智能數(shù)據(jù)分析服務(wù)器
Facebook 在會上還分享了GPUs最新進(jìn)展,近年來,GPU在高性能計算中發(fā)揮了重要作用。GPUs 最初是用于提升桌面PC性能,處理圖形運(yùn)算,但是現(xiàn)在卻幫助提升全球一些性能最強(qiáng)大的超級計算機(jī)。
Facebook 使用GPUs給人工智能和機(jī)器學(xué)習(xí)數(shù)據(jù)分析帶來更強(qiáng)大的計算能力。其人工智能實驗室訓(xùn)練神經(jīng)網(wǎng)絡(luò)去解決新問題。這就需要強(qiáng)大的計算能力。
「我們已經(jīng)在人工智能技術(shù)方面投入了很多?!笷acebook 工程和基礎(chǔ)設(shè)施(Engineering and Infrastructure)部門 全球老大Jay Parikh說,「目前,人工智能應(yīng)用于Facebook的Newsfeed,幫助我們提供更好的廣告服務(wù)。也能幫助用戶在日常生活中更安全地使用Facebook?!?/p>
△ Facebook 的 Big Sur
Big Sur 系統(tǒng)使用了英偉達(dá)Tesla 加速計算平臺,擁有8個高性能GPUs,每個功率達(dá)300瓦特,在多個PCI-e連接之間靈活配置。Facebook已經(jīng)優(yōu)化了這些新型服務(wù)器的發(fā)熱和功耗控制,使其可以與數(shù)據(jù)中心中配備標(biāo)準(zhǔn)CPU的服務(wù)器協(xié)同工作。
Big Sur 系統(tǒng)優(yōu)化了性能和反應(yīng)時間,幫助Facebook處理更多的數(shù)據(jù),極大地縮短了其訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時間。
「性能有了極大的提升,」Parikh說,「我們在數(shù)月間就部署了數(shù)千臺這種機(jī)器。使得我們有能力將該技術(shù)應(yīng)用于公司更多的產(chǎn)品實例?!?/p>
存儲:Just a buch of Flash
多年來,F(xiàn)acebook已經(jīng)在用閃存來加速服務(wù)器引導(dǎo)驅(qū)動,提升緩存效率。隨著公司基礎(chǔ)設(shè)備進(jìn)一步擴(kuò)大規(guī)模,F(xiàn)acebook創(chuàng)造了一種新型「模塊」,在服務(wù)器運(yùn)算中整合更多的閃存。Facebook已經(jīng)改進(jìn)了初代開放計算機(jī)——即Knox——的存儲驅(qū)動器,使用固態(tài)硬盤(SSDs)取代存儲硬盤存儲(HDDs),存儲單元從磁盤簇(JBOD)轉(zhuǎn)到了閃存簇(JBOF)。
Facebook和英特爾合作開發(fā)這種新型的閃存簇單元,稱之為Lighting,反應(yīng)了使用NVMe帶來了速度提升,NVMe是為SSDs優(yōu)化的高速PCI總線接口。下面我們通過Parikh 在開放計算峰會上展示的幻燈片來看看具體的參數(shù)。
△ 參數(shù)
作為一個分散式(disaggregated)存儲設(shè)備,Lightning 支持各種不同的應(yīng)用?!高@為我們正在開發(fā)的應(yīng)用帶來了一個高性能存儲式的新型建造模塊。」Parikh說。Parikh表示將來會有更多存儲方面的創(chuàng)新,尤其是創(chuàng)新地使用非易失性存儲器(NVM)。
評論