數(shù)據(jù)大爆炸時(shí)代計(jì)算的將來屬于GPU

作者：時(shí)間：2017-04-06 來源：雷鋒網(wǎng)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

　　有許多原因使 2016 稱得上是 GPU 之年。但事實(shí)上，除了在核心領(lǐng)域(深度學(xué)習(xí)、VR、自動(dòng)駕駛)，為什么把 GPU 用于通用計(jì)算仍然很模糊。

本文引用地址：http://m.butianyuan.cn/article/201704/346213.htm

　　英偉達(dá)在 2016 年的強(qiáng)勢(shì)崛起，GPGPU (GPU 通用計(jì)算)功不可沒。

　　搞清楚 GPU 的作用，要先從 CPU 開始。大多數(shù)人對(duì)計(jì)算機(jī) CPU 并不陌生，這可能要?dú)w功于英特爾——作為在事實(shí)上壟斷了 PC、服務(wù)器平臺(tái) CPU 近十年的供應(yīng)商，英特爾的巨幅廣告支出，直接導(dǎo)致每個(gè)人都或多或少聽說過英特爾從筆記本到超算的各層級(jí)產(chǎn)品。

　　CPU 的設(shè)計(jì)用途，是對(duì)多種應(yīng)用進(jìn)行低延遲處理。CPU 非常適合用于多功能任務(wù)，比如電子表格、文字處理、 Web 應(yīng)用等等。于是，傳統(tǒng)上 CPU 是絕大多數(shù)企業(yè)的首選計(jì)算方案。

　　過去，當(dāng)公司的 IT 部門經(jīng)理說要訂購更多計(jì)算設(shè)備、服務(wù)器，或者增強(qiáng)云端的性能，他們一般想的是 CPU。

　　雖是個(gè)多面手，一枚 CPU 芯片能承載的核心數(shù)量卻有很大限制。大多數(shù)消費(fèi)級(jí)芯片只有八核。至于英特爾的企業(yè)級(jí)產(chǎn)品線，除了為并行計(jì)算而設(shè)計(jì)的 Xeon Phi 這個(gè)“怪胎”，主流至強(qiáng)產(chǎn)品(E3、E5、E7 系列)最多只有 22 核。

　　CPU 從單核發(fā)展到今天的多核用了幾十年。對(duì) CPU 這么復(fù)雜的芯片進(jìn)行擴(kuò)展有極高的技術(shù)難度，并且需要綜合多個(gè)方面：比如縮小晶體管體積、降低發(fā)熱和優(yōu)化功耗等。今天的 CPU 在性能上所取得的成績(jī)，很大程度上要?dú)w功于英特爾和 AMD 工程師的多年努力探索。而至今全球未有第三家足以與其競(jìng)爭(zhēng)的 PC CPU 供應(yīng)商，在側(cè)面說明了他們的技術(shù)積累，以及研發(fā) CPU 的技術(shù)難度。

　　GPU 才是摩爾定律的寵兒?

　　用 FLOPS 來衡量，CPU 每年大約有 20% 的性能提升(注：此處有爭(zhēng)議)。而這是對(duì)于高度優(yōu)化的代碼而言。

　　隨著 CPU 性能提升的放緩(注：尤其近幾年來芯片制程工藝進(jìn)步緩慢。硅基芯片的極限大約在 7nm，而替代硅的新技術(shù)尚未成熟)，其數(shù)據(jù)處理能力越來越跟不上數(shù)據(jù)增長(zhǎng)的速度。做個(gè)簡(jiǎn)單對(duì)比：IDC 估算，全世界數(shù)據(jù)增長(zhǎng)的速度大約是 40%，并在不斷加快。

　　簡(jiǎn)單來說，摩爾定律目前已終結(jié)，而數(shù)據(jù)卻在指數(shù)級(jí)增長(zhǎng)。

　　英特爾 Skylake、Kabylake、Coffelake 路線圖

　　數(shù)據(jù)增長(zhǎng)速度超過 CPU 性能提升速度帶來的后果是：人們不得不利用各種技巧來避免計(jì)算性能瓶頸，比如降采樣、索引(indexing)，或者采用昂貴的 scale-out 戰(zhàn)術(shù)來避免長(zhǎng)時(shí)間等待系統(tǒng)回應(yīng)。

　　我們現(xiàn)在面對(duì)的數(shù)據(jù)單位是 exabytes，并正在邁向 zetabytes。而曾經(jīng)顯得無比龐大的 TB，在消費(fèi)者領(lǐng)域已經(jīng)十分常見。企業(yè)級(jí) Terabyte 存儲(chǔ)的定價(jià)已降到個(gè)位數(shù)(美元)。

　　在這個(gè)價(jià)格，企業(yè)把所有獲取的數(shù)據(jù)保存起來，這過程中，我們生成了足以淹沒 CPU 級(jí)別數(shù)據(jù)處理能力的工作集。

　　這跟 GPU 有什么關(guān)系呢?

　　GPU 的架構(gòu)與 CPU 很不一樣。首先，GPU 并不具備多功能性。其次，與消費(fèi)級(jí) CPU 個(gè)位數(shù)的核心數(shù)目不同，消費(fèi)級(jí)的 GPU 通常有上千個(gè)核心——特別適合處理大型數(shù)據(jù)集。由于 GPU 在設(shè)計(jì)之初有且只有一個(gè)目的：最大化并行計(jì)算。每一代制程縮減直接帶來更多的核心數(shù)量(摩爾定律對(duì)于 GPU 更明顯)，意味著 GPU 每年有大約 40% 的性能提升——目前來看，它們尚能跟上數(shù)據(jù)大爆炸的腳步。