博客專欄

EEPW首頁 > 博客 > 英偉達(dá)對華“特供”的H20、RTX4090D將受限?

英偉達(dá)對華“特供”的H20、RTX4090D將受限?

發(fā)布人:芯智訊 時間:2024-04-17 來源:工程師 發(fā)布文章
image.png


近年來,美方持續(xù)升級相關(guān)AI芯片的對華出口,即便是AI芯片龍頭英偉達(dá)推出符合要求的針對中國市場的“特供版”產(chǎn)品,也是一再遭到限制。

早在2022年10月,美國首次正式推出限制AI芯片對華出口的政策,要求ECCN 3A090、4A090類目下的高性能計算設(shè)備、芯片及組件,如果“同時滿足以下兩個條件的即為受管制的高性能計算芯片:(1)芯片的I/O帶寬傳輸速率大于或等于600 Gbyte/s;(2)數(shù)字處理單元/原始計算單元每次操作的比特長度乘以TOPS 計算出的算力之和大于或等于4800TOPS?!?/p>

此舉,直接導(dǎo)致了英偉達(dá)的A100、H100等高性能AI芯片無法對華出口。隨后,英偉達(dá)為了挽回中國市場,針對中國市場推出了符合美國限制政策的AI芯片:A100和A800,主要是降低了互聯(lián)速率。

但是,在2023年10月17日,美國政府又推出了新的限制規(guī)則,進(jìn)一步收緊了限制范圍:

(1)ECCN 3A090a針對最高性能芯片,集成電路中包含一個或多個處理單元達(dá)到以下任一標(biāo)準(zhǔn):a) 綜合運(yùn)算性能(Total Processing Performance,TPP)達(dá)到4800,或b) 綜合運(yùn)算性能達(dá)到1600,同時“性能密度”(Performance Density,PD)達(dá)到5.92。

2)ECCN 3A090b針對次高性能芯片,集成電路中包含一個或多個處理單元達(dá)到以下任一標(biāo)準(zhǔn):a) 綜合運(yùn)算性能達(dá)到2400但低于4800,性能密度達(dá)到1.6但低于5.92;b) 綜合運(yùn)算性能達(dá)到1600,性能密度達(dá)到3.2但低于5.92。

但凡只要在上述兩項性能標(biāo)準(zhǔn)范圍內(nèi)的美國芯片都將會受到限制。這也直接導(dǎo)致了英偉達(dá)針對中國市場推出的A800和H800芯片的對華出口受限,英偉達(dá)在A800和H800這兩款芯片上的投資也是損失不小。此外,英偉達(dá)L40S、高端顯卡RTX 4090等產(chǎn)品也受到了限制。

不過,英偉達(dá)依舊不甘心放棄中國這個龐大的AI芯片市場。于是在去年四季度,英偉達(dá)又針對中國市場開發(fā)出了符合美國最新限制政策的四款A(yù)I芯片,包括 HGX H20、L20 PCle 和 L2 PCle。同時還開發(fā)了符合新規(guī)的高端顯卡RTX 4090 D。

image.png


從公布的參數(shù)來看,其中最強(qiáng)的H20的FP16、INT8等主要算力參數(shù)僅為A100的不足1/2,更是僅為H100的約1/7;L20的主要算力參數(shù)則相較于之前的L40、L40S分別下降約1/3、2/3。此前NVIDIA內(nèi)部人士在訪談中也承認(rèn),H20單卡算力僅有H100的20%,相比某國產(chǎn)芯片,其性能也只有其60%多。

此外,RTX 4090 D的核心數(shù)量相較RTX 4090也減少約11%,整體性能或降低了10%!

顯然,英偉達(dá)這些最新針對中國市場定制的產(chǎn)品性能被大幅閹割,使得市場大多對其性能表現(xiàn)、性價比持悲觀或懷疑態(tài)度。

不過,即便如此,美國方面似乎還是不放心。

近日,美國又公布了將于今年4月4日生效的新的限制規(guī)則,4A003類目下 “數(shù)字計算機(jī)”、“電子組件”及其相關(guān)設(shè)備和“組件”,對于所有目的地(除EAR第740部分第1號補(bǔ)充文件國家組E:1或E:2中的國家外),“調(diào)整后峰值性能”(“APP”)超過70 Weighted TeraFLOPS(WT,每秒計算萬億次浮點運(yùn)算,主要針對GPU性能,CPU和NPU主要提供定點/整數(shù)算力)的計算機(jī)和4A003.c中所述的“電子組件”都需要許可證(NLR)。

image.png


這里需要補(bǔ)充說明的是,在AI訓(xùn)練方面,通常使用浮點格式FP16和FP32,因為它們具有足夠高的精度。而在AI推理方面則通常使用整數(shù)數(shù)據(jù)格式INT8和INT4。

也就是說,現(xiàn)有的美國廠商的計算機(jī)產(chǎn)品或組件,如果其綜合浮點算力超過70 TFLOPS,則需要申請許可證才能出口。而這似乎是針對的是英偉達(dá)此前針對中國市場新推出的RTX 4090-D以及H20。數(shù)據(jù)顯示,RTX 4090-D的FP16/FP32算力為74TFLOPS,H20的TF32算力為74 TFLOPS(L20的FP32/16算力為60TFLOPS不到)。這也意味著,英偉達(dá)RTX 4090-D以及H20對華出口可能需要申請許可,至于是否能夠獲批,則可能需要“逐案審查”(case-by-case review)。

雖然也有國內(nèi)媒體報道稱,該政策可能將會限制到高性能的AI PC產(chǎn)品。但是,芯智訊認(rèn)為,目前AMD、英特爾、高通、蘋果等廠商所推出的集成了AI內(nèi)核的面向AI PC的處理器,其浮點運(yùn)算能力目前仍比較有限,更多還是提升整數(shù)運(yùn)算能力,并不會受到新規(guī)限制。比如英特爾在去年底推出的Meteor Lake芯片(Core Ultra) 基于其AI引擎、NPU、CPU和GPU,可提供34TOPS(注意不是FLOPS)的算力。

不過,以上只是筆者對于該規(guī)則的解讀。目前英偉達(dá)官方面尚未有相關(guān)信息公布。芯智訊也有咨詢英偉達(dá)中國區(qū)相關(guān)負(fù)責(zé)人,但對方并未對此進(jìn)行回應(yīng)。

值得注意的是,美國商務(wù)部長雷蒙多在12月2日舉辦的“里根國防論壇”(Reagan National Defense Forum)上曾表示,即便會讓企業(yè)難做,美國政府仍將持續(xù)修改(change constantly)先進(jìn)芯片的出口管制,因為“科技會變、對手也會變,我們必須跟上”。

雷蒙多指出,就算業(yè)者重新設(shè)計出一款能規(guī)避現(xiàn)有法令的芯片,只要被關(guān)注國家將之用來發(fā)展AI,“我第二天就會立刻出手控管”(I’m going to control it the very next day)。

針對雷蒙多發(fā)言,英偉達(dá)CEO黃仁勛(Jensen Huang)曾于12月6日在新加坡召開的記者會上表示,英偉達(dá)一直都在積極配合美國政府,打造符合法規(guī)的產(chǎn)品?!拔覀兇蛩憷^續(xù)配合美國政府,開發(fā)符合新規(guī)定的全新系列產(chǎn)品”。

黃仁勛之前還曾表示,美國對華半導(dǎo)體出口的限制,也進(jìn)一步刺激了中國努力發(fā)展半導(dǎo)體產(chǎn)業(yè)的決心,中國大陸目前已有數(shù)十家公司正在開發(fā)可與英偉達(dá)產(chǎn)品競爭的技術(shù),這對英偉達(dá)在中國市場的發(fā)展也很不利。過去多年來,中國市場約占英偉達(dá)營收的20%。

編輯:芯智訊-浪客劍


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 英偉達(dá)

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉