Nvidia探索將多GPU封裝到一塊：輕松打破舊架構(gòu)極限

作者：時(shí)間：2017-07-06 來源：cnBeta

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　商業(yè)計(jì)算、可選研究、以及 4K 多屏游戲等需求，不斷推升著對(duì)現(xiàn)代 GPU 的性能需求。根據(jù)一份近期的研究報(bào)告，Nvidia 認(rèn)為正在迅速接近當(dāng)前 GPU 架構(gòu)模型的極限，因此需要尋找新的方法去攻堅(jiān)。當(dāng)前這個(gè)想法仍處于模擬階段，但文中提到的“多芯片模塊 GPU”(MCM-GPU)的概念，有望最終將多顆 GPU 模塊整合到一處。

本文引用地址：http://m.butianyuan.cn/article/201707/361436.htm

　　在意識(shí)到 Nvidia 將很快難以通過當(dāng)前架構(gòu)榨取 GPU 性能之后，亞利桑那州立大學(xué)、英偉達(dá)、德州大學(xué)奧斯汀分校、以及巴塞羅那超算中心攜手展開了研究。

　　此前，廠商還可以通過在每次制程迭代時(shí)堆積更多的流處理器來提升 GPU 性能。但遺憾的是，在單一模塊中塞入更多晶體管的方法，已經(jīng)變得越來越困難。

　　以 Nvidia V100 GPU 為例，其已經(jīng)需要代工廠商(臺(tái)積電)將制程推到 12nm 的極限。此外，制造規(guī)模越來越大的模塊，其成本和相關(guān)問題也不可忽視(比如因制造錯(cuò)誤遇到的數(shù)量減少)。

　　雖然 Nvidia 可以通過將多顆 GPU 裝在一塊 PCB 上的方式來提升顯卡性能(比如 Tesla K10 和 K80)，但當(dāng)前仍有一些未能解決的問題 —— 比如跨多 GPU 的任務(wù)分配就需要編程來提升硬件效率。

　　于是研究人員們另辟蹊徑，決定在封裝技術(shù)上尋找新方法，讓 Nvidia 可以將多個(gè) GPU 模塊(GPMs)封裝到一塊。這些 GPMs 比當(dāng)代 GPU 要小一些，制造起來也更容易和便宜。

　　盡管人們對(duì)其性能仍有疑問，但研究人員聲稱近期基板技術(shù)的發(fā)展(PDF)已經(jīng)能夠幫助其部署一種快速、強(qiáng)健的模塊通信互聯(lián)架構(gòu)。從理論上來講，其帶寬可達(dá)數(shù) TB/s 。

　　在 Nvidia 內(nèi)部 GPU 模擬中，研究團(tuán)隊(duì)將 MCM-GPU 堆到了 256 組 SMs，而 Pascal 架構(gòu)僅為 56 組 SMs 。然后團(tuán)隊(duì)基于當(dāng)前架構(gòu)進(jìn)行了預(yù)測(cè)，結(jié)果顯示 MCM-GPU 可提速 45.5% 。

　　此外，在同一板子上進(jìn)行的多 GPU 性能對(duì)比表明，MCM-GPU 有 26.8% 的領(lǐng)先優(yōu)勢(shì)。最后，有消息稱 AMD 公司也有類似的點(diǎn)子(基于 Navi GPU)。

新聞中心

Nvidia探索將多GPU封裝到一塊：輕松打破舊架構(gòu)極限

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)