中國(guó)芯片與摩爾定律
本周二,拜登政府收緊了對(duì)銷往中國(guó)的先進(jìn)人工智能(AI)芯片的出口管制;主要目標(biāo)是英偉達(dá)(Nvidia)的 H800 和 A800 芯片,這些芯片是專門為規(guī)避去年實(shí)施的控制而設(shè)計(jì)的。H800/A800 和 H100/A100 之間的主要區(qū)別在于它們的通信帶寬:A100 具有 600 Gb/s 的速度(H100 具有 900GB/s),這恰好是去年出口管制所禁止的限制,A800 和 H800 的通信速度僅限于 400 Gb/s。
本文引用地址:http://m.butianyuan.cn/article/202310/451870.htm通信速度之所以重要,與 Nvidia 首席執(zhí)行官黃仁勛 (Jensen Huang) 的論點(diǎn)「摩爾定律已死」有關(guān)。摩爾定律最初于 1965 年提出,指出集成電路中晶體管的數(shù)量每年都會(huì)增加一倍。十年后,戈登·摩爾將他的預(yù)測(cè)修正為每?jī)赡攴环?,直到過去十年左右,這一預(yù)測(cè)才放緩至大約每三年翻一番。
但在實(shí)踐中,摩爾定律已經(jīng)變得更類似于科技行業(yè)的基本法則:隨著時(shí)間的推移,計(jì)算能力將會(huì)增加,而且會(huì)變得更便宜。這一原則與戈登·摩爾的技術(shù)預(yù)測(cè)相關(guān):較小的晶體管可以更快地切換,并且在切換時(shí)使用更少的能量,即使更多的晶體管可以集成在單個(gè)晶圓上;這意味著您可以在每個(gè)晶圓上獲得更多芯片或更大的芯片,從而降低價(jià)格或以相同的價(jià)格提高功率。在實(shí)踐中我們兩者都得到了。
至關(guān)重要的是,科技行業(yè)的其它公司不需要了解摩爾定律的技術(shù)或經(jīng)濟(jì)細(xì)節(jié):60 年來,簡(jiǎn)單地假設(shè)計(jì)算機(jī)會(huì)變得更快是安全的,這意味著最佳方法始終是專為尖端或超越而構(gòu)建,并相信處理器速度能夠趕上您的使用案例。
摩爾定律終結(jié)?
近幾年,英偉達(dá)首席執(zhí)行官黃仁勛一再宣稱摩爾定律已死。從技術(shù)角度來看,速度確實(shí)放緩了,但密度在持續(xù)增加。以下是臺(tái)積電按制程節(jié)點(diǎn)尺寸劃分的晶體管密度,以每個(gè)節(jié)點(diǎn)尺寸的第一代工藝為例。
請(qǐng)記住,成本很重要,以下是臺(tái)積電每晶圓介紹價(jià)格的同一張表,以及每十億個(gè)晶體管的價(jià)格:
請(qǐng)注意右下角的數(shù)字:采用臺(tái)積電的 5 nm 工藝,每個(gè)晶體管的價(jià)格上漲了,而且上漲了很多 (20%)。原因很明顯:5nm 是第一個(gè)需要 ASML 極紫外 (EUV) 光刻技術(shù)的工藝,而 EUV 機(jī)器非常昂貴——每臺(tái)約 1.5 億美元。換句話說,雖然摩爾定律的技術(shù)定義將繼續(xù)存在,但芯片總是變得更快、更便宜的原則卻不會(huì)繼續(xù)存在。
GPU 和令人尷尬的并行性
需要明確的是,黃仁勛的論點(diǎn)并不僅僅基于 5nm 芯片的成本,摩爾定律涉及速度和成本,而事實(shí)是,隨著能源成為從移動(dòng)設(shè)備到個(gè)人電腦再到數(shù)據(jù)中心的所有設(shè)備的限制,許多密度增益主要用于提高電源效率。黃仁勛多年來的論點(diǎn)是,Nvidia 擁有提高計(jì)算速度的解決方案:使用 GPU。
GPU 比 CPU 簡(jiǎn)單得多;這意味著它們可以更快地執(zhí)行指令,但這些指令必須更簡(jiǎn)單,可以同時(shí)運(yùn)行許多它們以獲得巨大的結(jié)果。不出所料,圖形是最明顯的例子:每個(gè)「著色器」——GPU 的主要處理組件——計(jì)算將在屏幕的單個(gè)部分上顯示的內(nèi)容,該部分的大小是可用著色器數(shù)量的函數(shù)。如果您有 1024 個(gè)著色器,則每個(gè)著色器繪制屏幕的 1/1024。因此,如果您有 2048 個(gè)著色器,則繪制屏幕的速度可以提高兩倍。圖形性能是「令人尷尬的并行」,也就是說它隨著解決問題的處理器數(shù)量而變化。
這種「令人尷尬的并行性」是 GPU 相對(duì)于 CPU 具有超強(qiáng)性能的關(guān)鍵,但挑戰(zhàn)在于并非所有軟件問題都可以輕松并行化;Nvidia 的 CUDA 生態(tài)系統(tǒng)旨在提供工具來構(gòu)建可以利用 GPU 并行性的軟件應(yīng)用程序,并且是鞏固 Nvidia 主導(dǎo)地位的主要護(hù)城河之一,但大多數(shù)軟件應(yīng)用程序仍然需要 CPU 才能運(yùn)行。
事實(shí)證明,無(wú)論是在訓(xùn)練模型還是在推理模型方面,人工智能都是一個(gè)令人尷尬的并行應(yīng)用程序。此外,最佳的可擴(kuò)展性遠(yuǎn)遠(yuǎn)超出了計(jì)算機(jī)顯示器顯示圖形的范圍。這就是為什么 Nvidia AI 芯片具有芯片禁令所提到的高速互連功能:AI 應(yīng)用程序同時(shí)在多個(gè) AI 芯片上運(yùn)行,但確保這些 GPU 繁忙的關(guān)鍵是向它們提供數(shù)據(jù),而這需要那些高速互連。
話雖如此,我對(duì)傳統(tǒng)數(shù)據(jù)中心應(yīng)用程序大規(guī)模轉(zhuǎn)向 GPU 持懷疑態(tài)度。
基于 CPU 的應(yīng)用程序不僅更容易開發(fā),而且大多已經(jīng)構(gòu)建完成。我很難想象哪些公司會(huì)花費(fèi)時(shí)間和精力將已經(jīng)在 CPU 上運(yùn)行的東西移植到 GPU 上;歸根結(jié)底,在云中運(yùn)行的應(yīng)用程序是由提供云資源需求的客戶決定的,而不是尋求優(yōu)化 FLOP/rack 的云提供商。
認(rèn)為傳統(tǒng) CPU 仍有一定生命力的另一個(gè)原因是:事實(shí)證明摩爾定律可能又回到了正軌。
EUV 和摩爾定律
上文所示表格只跑到 5nm,iPhone 15 Pro 采用的是 N3 芯片,以下為相應(yīng)的價(jià)格/晶體管表。
雖然我之前只給出了每個(gè)節(jié)點(diǎn)的第一個(gè)版本,但用于 iPhone A17 Pro 芯片的 N3B 工藝是一個(gè)死胡同;臺(tái)積電改變了 N3E 的做法,這將成為未來 N3 系列的基礎(chǔ)。這也使得 N3 在每晶體管價(jià)格方面的飛躍更加令人印象深刻:N3B 消除了 5nm 的倒退,N3E 比 7nm 有了顯著的改進(jìn)。
此外,EUV 機(jī)器成本很高,但摩爾定律中的價(jià)格下降并不是設(shè)備變得更便宜的結(jié)果。請(qǐng)注意,每片晶圓的價(jià)格一直在不斷上漲。相反,不斷下降的價(jià)格/晶體管是摩爾定律的函數(shù),也就是說,EUV 等新設(shè)備讓我們「將更多元件填充到集成電路上」。
5nm 發(fā)生的情況與 20nm 每晶體管價(jià)格上漲的情況類似:那是臺(tái)積電開始使用雙圖案化的節(jié)點(diǎn),這意味著他們必須將每個(gè)光刻步驟進(jìn)行兩次;這既使每片晶圓的光刻設(shè)備利用率增加了一倍,同時(shí)也降低了產(chǎn)量。至少對(duì)于該節(jié)點(diǎn)來說,制造更小的晶體管所帶來的收益超過了成本。然而一年后,臺(tái)積電推出了 16nm 節(jié)點(diǎn)。這正是 3nm 所發(fā)生的情況——EUV 的收益現(xiàn)在明顯超過成本——而有關(guān) 2nm 密度和價(jià)格點(diǎn)的早期傳言表明,另一個(gè)節(jié)點(diǎn)的收益應(yīng)該會(huì)持續(xù)下去。
芯片禁令
考慮到華盛頓特區(qū)對(duì)華為最近推出的配備 7nm 芯片的智能手機(jī)感到焦慮,這似乎是對(duì)出口管制的蔑視。
簡(jiǎn)而言之,芯片禁令的問題在于在 10nm 上劃定界限:這條界限是任意的,因?yàn)橹圃?10 nm 芯片所需的設(shè)備已經(jīng)被證明能夠生產(chǎn) 7 nm 芯片。
真正重要的是 5nm,換句話說,真正限制中國(guó)大陸長(zhǎng)期發(fā)展的出口管制是 EUV。前些年,特朗普政府已經(jīng)說服荷蘭不允許出口 EUV 設(shè)備,拜登政府通過芯片禁令以及與荷蘭的進(jìn)一步協(xié)調(diào)進(jìn)一步鎖定了 EUV 的出口?,F(xiàn)實(shí)情況是,很多芯片制造設(shè)備都是「多節(jié)點(diǎn)」的;許多機(jī)器可以在多個(gè)節(jié)點(diǎn)上使用,但您必須擁有 EUV 設(shè)備才能延續(xù)摩爾定律,因?yàn)樗球?qū)動(dòng)摩爾定律的關(guān)鍵技術(shù)。
H800 是臺(tái)積電第三代 5nm 工藝(容易混淆的 N4)制造的,也就是說它是用 EUV 制造的;通信速度限制是有意義的,并且會(huì)使人工智能開發(fā)速度更慢、成本更高。
這引出了進(jìn)一步的觀點(diǎn):芯片禁令的回報(bào)不會(huì)立即顯現(xiàn)。整個(gè)想法有意義的唯一方法是摩爾定律是否繼續(xù)存在,因?yàn)檫@意味著五年或十年后可用的芯片將比現(xiàn)在存在的芯片更快、更便宜,從而擴(kuò)大差距。同時(shí),這個(gè)想法也取決于認(rèn)真對(duì)待黃的論點(diǎn),因?yàn)槿斯ぶ悄懿粌H需要力量,還需要規(guī)模。幸運(yùn)的是,兩條戰(zhàn)線的進(jìn)展都朝著正確的方向發(fā)展。
反對(duì)芯片禁令也存在很好的論據(jù),包括一個(gè)明顯的事實(shí),即中國(guó)大陸受到強(qiáng)烈激勵(lì)從頭開始建立替代品。也許在 20 年內(nèi),美國(guó)不僅會(huì)失去最有力的杠桿點(diǎn),而且還將看到其最前沿的公司被中國(guó)的競(jìng)爭(zhēng)削弱。
評(píng)論