芯片背后的故事:為高通量計(jì)算打造的Sierra Forest
Don Soltis在向妻子描述自己的工作時(shí),把自己定位為“一名CPU狂熱者”。當(dāng)然,他的實(shí)際職稱(chēng)會(huì)更為正式一些——他是英特爾至強(qiáng)能效核(E-core)的高級(jí)首席工程師兼首席架構(gòu)師。如果你問(wèn)他本人,他會(huì)告訴你他在38年的職業(yè)生涯里,致力于開(kāi)發(fā)一些“最酷、最好的處理器”,其中包括英特爾安騰處理器,彼時(shí)英特爾與惠普通力合作,旨在提供超高效的64位處理器,不過(guò)在安騰輸給x86后,Soltis便轉(zhuǎn)向了至強(qiáng)。
本文引用地址:http://m.butianyuan.cn/article/202310/451325.htm目前,他正在領(lǐng)導(dǎo)代號(hào)為Sierra Forest的下一代至強(qiáng)處理器的開(kāi)發(fā)。
Sierra Forest將于2024年上半年推出,這將是英特爾首次同時(shí)推出兩款至強(qiáng)處理器。對(duì)于Soltis來(lái)說(shuō),這是一個(gè)熟悉的領(lǐng)域,他已在其中耕耘多年。Soltis參與過(guò)大約20款處理器的開(kāi)發(fā),每一款都用于數(shù)據(jù)中心,在Sierra Forest之前,他曾參與打造英特爾凌動(dòng)C3000系列處理器。此前研發(fā)代號(hào)為Denverton的基于凌動(dòng)處理器的服務(wù)器解決方案,最高可提供16核,具有行業(yè)領(lǐng)先的每瓦性能、熱設(shè)計(jì)功耗(TDP)以及大量可配置的高I/O吞吐性能。Denverton所面向的,是網(wǎng)絡(luò)、存儲(chǔ)、物聯(lián)網(wǎng)(IoT)、可擴(kuò)展解決方案,以及邊緣領(lǐng)域。
Soltis表示:“這是我們這段時(shí)間以來(lái)一直在努力做的事情?!泵鎸?duì)市場(chǎng)既有需求和激烈的競(jìng)爭(zhēng)態(tài)勢(shì),秉承不斷創(chuàng)新的理念,Sierra Forest將與Granite Rapids一起‘并肩’于至強(qiáng)路線圖中,其中,Granite Rapids是英特爾即將推出的成熟性能核產(chǎn)品?!皵?shù)據(jù)中心市場(chǎng)對(duì)于性能要求的廣度在不斷增長(zhǎng)?!盨oltis展示了一張他于Hot Chips活動(dòng)上演示的幻燈片,可以看出,并非每個(gè)客戶都追求所有工作負(fù)載的原始性能,相反,它是一個(gè)XY軸,其中,核心性能位于垂直的Y軸,而核心密度則位于水平的X軸上。
英特爾計(jì)劃于2024年推出的下一代服務(wù)器平臺(tái),為關(guān)鍵工作負(fù)載提供強(qiáng)大的性能和能效
“Taylor Swift是向大家解釋這一點(diǎn)的最佳方式,”他解釋道。
在性能和能效之間找到平衡
Soltis表示,這是用來(lái)解釋為什么客戶可能需要大量更小、節(jié)能的內(nèi)核而不是最強(qiáng)大的解決方案的最簡(jiǎn)單的例子。
去年年底,數(shù)百萬(wàn)人涌入Ticketmaster購(gòu)買(mǎi)Taylor Swift "Eras"世界巡回演唱會(huì)的門(mén)票,而該公司的系統(tǒng)卻難以跟上??偣灿?50萬(wàn)預(yù)先注冊(cè)的粉絲,還有成群結(jié)隊(duì)的機(jī)器人和未注冊(cè)的粉絲,他們都在爭(zhēng)奪同樣的東西。Ticketmaster表示,它收到了35億個(gè)系統(tǒng)請(qǐng)求,是之前峰值的四倍。
通量計(jì)算(例如為數(shù)百萬(wàn)絕望的粉絲提供同一頁(yè)面)需要大量的核心,并且這些核心需要盡可能地節(jié)能,以防止成本失控。人工智能等更復(fù)雜的工作負(fù)載可以通過(guò)更少、更強(qiáng)大但運(yùn)行成本更高的核心來(lái)更好地提供服務(wù)。Sierra Forest和更強(qiáng)大的Granite Rapids使用相同的平臺(tái),這不僅使其具備更強(qiáng)的靈活性,也將為客戶帶來(lái)更多益處。
平衡性能和能效并不是一個(gè)新概念。這就是為什么每一代英特爾至強(qiáng)都包含針對(duì)不同工作負(fù)載(從電話通信到人工智能)的多種選項(xiàng),也是為什么您會(huì)在從辦公室柜子里的IT服務(wù)器到世界上最強(qiáng)大的超級(jí)計(jì)算機(jī)等諸多產(chǎn)品中都能找到至強(qiáng)芯片。但Sierra Forest和Granite Rapids的不同之處主要在于以下幾個(gè)方面。
首先,基于能效核的Sierra Forest和基于性能核的Granite Rapids之間有共通性。這為客戶在選擇合適的芯片時(shí)提供了額外的選項(xiàng)——根據(jù)工作負(fù)載,他們可能想要Granite Rapids芯片或Sierra Forest芯片。兩者支持相同的軟件堆棧,并且是平臺(tái)兼容的,可以為每個(gè)客戶提供正確的組合。與之前的至強(qiáng)處理器相比,Sierra Forest的吞吐量計(jì)算性能更好。上個(gè)月,英特爾透露,Sierra Forest的機(jī)架密度和每瓦性能分別是Sapphire Rapids的2.5倍和2.4倍,其TDP低至205瓦1。
“當(dāng)面對(duì)諸多不同的SKU時(shí),客戶時(shí)常會(huì)做出與過(guò)去相同的決定,但我們的能效核解決方案在性能和每瓦性能方面均優(yōu)于我們之前用于通量計(jì)算的SKU?!盨oltis解釋道。“對(duì)于云服務(wù)提供商等客戶來(lái)說(shuō),更高的性能和更好的每瓦性能非常重要——他們?yōu)榇酥Ц兜碾娰M(fèi)是總體擁有成本中的很大一部分。”
眼見(jiàn)為實(shí)
Soltis表示,“與英特爾的客戶端處理器不同,英特爾不計(jì)劃在混合芯片上整合能效核和性能核的部分原因:能效核和性能核的配比組合很多,各種組合要求都有可能被客戶要求。設(shè)計(jì)時(shí)過(guò)量配置某一種計(jì)算資源是不明智的,尤其是芯片資源如此珍貴的情況下。要滿足客戶的多元化需求。相比在SoC層級(jí)上進(jìn)行配置,在服務(wù)器上進(jìn)行配置會(huì)更加靈活。如果客戶A想要80/20的分配,而客戶B想要60/40的分配,很容易實(shí)現(xiàn)?!?/p>
在8月的Hot Chips活動(dòng)上,Soltis在演講中詳細(xì)介紹了英特爾至強(qiáng)能效核,以及能讓Sierra Forest和Granite Rapids成為極具動(dòng)態(tài)性組合的通用平臺(tái)。其中,共享的知識(shí)產(chǎn)權(quán)(IP)、固件和操作系統(tǒng)軟件堆棧從多維度帶來(lái)了諸多優(yōu)勢(shì)。Soltis指出,“我們?cè)谠O(shè)計(jì)和驗(yàn)證方面節(jié)省了諸多成本。擁有相同的I/O晶片使我們具備了相同的硬件兼容性和與平臺(tái)的軟件兼容性,而這也有助于我們獲得那些需要親自見(jiàn)證的客戶的信心。”
他說(shuō):“我始終銘記密蘇里州非官方的州座右銘——展示之州。在很大程度上,我認(rèn)為我們所有的客戶都需要親眼見(jiàn)證,展示給他們看到底有什么不同??蛻粢膊⒎遣幌嘈?,他們只是更相信眼見(jiàn)為實(shí)。而我們不僅可以做到與眾不同,也有能力向客戶展示出來(lái),讓客戶親自見(jiàn)證并相信?!?/p>
Soltis指出,“聽(tīng)起來(lái)很簡(jiǎn)單,但要達(dá)到這一點(diǎn)則需要很多事情都順利進(jìn)行。而能做到這一點(diǎn)真的非常復(fù)雜。我們必須拼盡全力,才能確保1000億個(gè)晶體管連接得完美無(wú)缺。”
打造Sierra Forest的團(tuán)隊(duì)并不是由經(jīng)驗(yàn)豐富的至強(qiáng)“老兵”組成。然而,盡管團(tuán)隊(duì)面臨Soltis所稱(chēng)的實(shí)現(xiàn)“英特爾最重要的路線圖”的巨大挑戰(zhàn),但他們依然興致勃勃。但同時(shí),也正因?yàn)閳F(tuán)隊(duì)并不完全了解過(guò)往的決策,所以他們可以“輕裝上陣”。
“在我參與過(guò)的20個(gè)處理器的工作過(guò)程中,這是其中一個(gè)最令人愉快的經(jīng)歷,因?yàn)槊總€(gè)人都對(duì)著手打造下一個(gè)酷炫的事物充滿熱情。我們所做的每一件事都是一種挑戰(zhàn),但挑戰(zhàn)也是樂(lè)趣的一部分?!?/p>
1 基于截至 2023 年 8 月 21 日的架構(gòu)預(yù)測(cè),相對(duì)于第四代英特爾至強(qiáng)處理器。 結(jié)果可能會(huì)有所不同。
評(píng)論