問: 英偉達(dá)(NVDA)近期上攻$1000的高位后,多空分歧開始劇烈,不少人拿出當(dāng)年互聯(lián)網(wǎng)泡沫時(shí)Cisco的尖峰圖做對比。 您怎么看?答: 但在大多數(shù)情況下,用舊數(shù)據(jù)來短期預(yù)測股市是意義不大的:因?yàn)樽兞刻啵闆r完全復(fù)刻的概率極低。但是,分析科技股一定是要分析其未來數(shù)十年的發(fā)展邏輯,而且這個(gè)邏輯是相通的。問: 但是,市面上就沒幾個(gè)人把英偉達(dá)的邏輯說清楚的。至少我沒看到。答: 看清英偉達(dá)的邏輯確實(shí)相對門檻比較高,它至少有三層:- 總AI市場需求(TAM)夠不夠大?這個(gè)生意能賺多少年?
- 英偉達(dá)現(xiàn)在爆好的業(yè)務(wù)會不會曇花一現(xiàn)?大廠們完成硬件軍備競賽完成后不再需要采購了?
- 英偉達(dá)的護(hù)城河夠深嗎?未來競爭對手能搶走多少份額?
問: 我知道科技股巨頭絕大多數(shù)有個(gè)特點(diǎn),就是有所謂的“護(hù)城河”。但英偉達(dá)這個(gè)護(hù)城河是怎么回事,道上各種神仙妖魔經(jīng)常是亂吹一氣,實(shí)在不知道應(yīng)該聽誰的。答: 我一直這樣認(rèn)為,科技公司的護(hù)城河,大多是軟硬一體的,這樣就可以持續(xù)半個(gè)世紀(jì)以上。純軟件或純硬件成功的公司肯定也有,但不影響我的核心觀點(diǎn)。問: 您能給出一些例子嗎?答: 我從過去50年每個(gè)十年分別找出個(gè)例子,來做一下說明。 1970年代最重要的軟件技術(shù)是關(guān)系型數(shù)據(jù)庫,我們簡稱SQL吧。SQL使得企業(yè)的信息化啟動了,手寫帳變成了電子賬,帶來第一個(gè)萬億級賽道。我們要提的這家軟硬一體公司,就是IBM。IBM的工作,簡單說,就是給企業(yè)用上SQL,配上IBM的主機(jī)。1980年代,大家都聽過神奇CEO帶著IBM大象跳舞,其實(shí)主要是職業(yè)經(jīng)理人的自我吹噓。所謂跳舞就是砍掉硬件轉(zhuǎn)型服務(wù),而事實(shí)是主機(jī)是IBM真正的護(hù)城河,它根本沒被砍,裝SQL的“服務(wù)”業(yè)務(wù)是市場爆炸需求,也不是職業(yè)經(jīng)理人發(fā)明的。IBM主機(jī)業(yè)務(wù)50年經(jīng)久不衰,我們大家的存款大多還是IBM主機(jī)管著。雖然很多人都以為IBM已經(jīng)完蛋了,但它的股價(jià)其實(shí)現(xiàn)在是創(chuàng)新高的。 1980年代最重要的軟件技術(shù)是圖形界面,我們簡稱GUI吧。GUI使得PC爆發(fā)增長成為每個(gè)人的工具,這里的代表公司是WINTEL。微軟和英特爾確實(shí)是兩家公司,但由于兩家是事實(shí)上PC標(biāo)準(zhǔn)的制定者而軟硬件深度綁定。他們的成功也持續(xù)至今,雖然英特爾近幾年碰到不少問題但在PC領(lǐng)域仍是領(lǐng)頭羊。 1990年代最重要的軟件技術(shù)是萬維網(wǎng),我們簡稱WWW吧。WWW中最重要的軟硬件一體公司是思科(CSCO),思科從那時(shí)至今仍是互聯(lián)網(wǎng)后臺最重要的公司,我們?nèi)绻?000年泡沫的尖峰,思科的股價(jià)其實(shí)也是穩(wěn)步向上的狀態(tài)。也就是說,和IBM類似,思科的核心生意從那時(shí)開始一直賺錢至今,只是這個(gè)生意沒大家想象的那么大,換機(jī)頻率比較低。思科曾有個(gè)巨大的失誤,就是其終端路由器WRT54G錯(cuò)誤地選用了Linux,因GPL協(xié)議的原因被迫公布了源代碼,這導(dǎo)致所有公司一下子都會做普通路由器了。如果思科當(dāng)時(shí)像蘋果MacOS那樣選FreeBSD,這個(gè)軟硬一體恐怕還能多賺很多錢。 2000年代最重要的軟件技術(shù)是虛擬化,也叫Hypervisor。這里面最出名的公司是VMWare,它的最核心產(chǎn)品其實(shí)是服務(wù)器底層(Bare-Metal)操作系統(tǒng)。VMWare的軟件非常非常優(yōu)秀,但它缺乏深度的硬件綁定自身難以成為超級巨頭,反而被硬件公司買來賣去的。最終成功應(yīng)用虛擬化做到軟硬一體的公司,是亞馬遜、谷歌和微軟,他們使得互聯(lián)網(wǎng)變成工作生活必須的基礎(chǔ)設(shè)施,給你提供各種信息和商品。 2010年代最重要的軟件技術(shù)是移動操作系統(tǒng),iOS和Android。蘋果做到iOS軟硬件一體而賺走了手機(jī)業(yè)90%的利潤,這里不用多講吧。 2020年代最重要的軟件技術(shù)顯然是大語言模型,我們簡稱LLM。問: 您之前列的那些軟硬件一體,都是奔著持續(xù)掙50年大錢的,我承認(rèn)。但是LLM真的能和那些前輩相提并論嗎?答: 答案是肯定的。這就是看多英偉達(dá)的第一層,而且我相信華爾街也達(dá)成了共識,所以才會瘋狂追捧。 Hinton說,GenAI(LLM)標(biāo)志了仿生智能(連接派)在與符號邏輯智能(符號派)的競爭中勝出。而這個(gè)勝出一下子為后面AI代替人的幾乎所有事情畫清了路線圖,甚至人無法做的那些事機(jī)器如何做也都有了眉目。 黃仁勛說,人的DNA序列也是個(gè)語言,我們還不知道它是什么意思,形成的各種蛋白作用是什么,但LLM未來大概率可以告訴我們。這為未來的醫(yī)學(xué)打開了一扇巨大的門。 簡單說,過不了幾年LLM就是任何人不可缺少的隨身伴侶,普通人花十幾年的巨額代價(jià)學(xué)外語學(xué)數(shù)理化都將變得沒有意義。問: 停!你吹了半天LLM,可英偉達(dá)不是做LLM的呀,你不是說軟硬件一體么,而且訓(xùn)練LLM的GPU,好多家都能做呢。另外,英偉達(dá)這幾個(gè)季度業(yè)績超預(yù)期,是各個(gè)大廠抓緊采購的結(jié)果,他們急需AI平臺煉丹來追趕OpenAI等公司。等他們都采購一圈了,數(shù)據(jù)中心也建好了,英偉達(dá)的業(yè)績也就不行了吧?答: 確實(shí),目前是AI屆的軍備競賽,先買夠裝備再說。從分析師給出的數(shù)據(jù)看,前兩家大廠采購量最大,其它家還遠(yuǎn)遠(yuǎn)沒到呢。目前暫時(shí)無法判斷需求已經(jīng)見頂,從英偉達(dá)指引看交貨還成問題,這個(gè)軍備競賽至少還要持續(xù)一年。等到這輪軍備到位了,更新?lián)Q代也該到來了。因?yàn)槟壳暗挠布€是存在明顯的性能問題,我們看到煉GPT-4這種丹需要超過一年的時(shí)間。按黃老板的估計(jì),未來十年AI算力會增加100萬倍,這個(gè)有意思了,逼著大廠們不停地更新?lián)Q代啊。這也就是黃老板說的,英偉達(dá)自己將和自己競爭。問: 那第二層我明白了,我們看第三層。這些算力的增長可不一定是英偉達(dá)獨(dú)吞呀,英偉達(dá)的護(hù)城河到底有多深?我看CUDA被吹到天上去了,不就是些軟件庫么,我看競爭對手都有競品了呀。AMD有ROCm,英特爾有oneAPI。答: 你有沒有發(fā)現(xiàn),你在網(wǎng)上很難找到真正對比評測的內(nèi)容。為什么呢?因?yàn)樗麄兒陀ミ_(dá)的差距比你的認(rèn)知大得多的多。問: 我看到英特爾CEO Pat Gelsinger說:“我們認(rèn)為CUDA護(hù)城河又淺又小?!惫柘扇薐im Keller說,“CUDA就是沼澤地,不是護(hù)城河?!边@些大咖明顯看不上CUDA的嘛。答: 我得承認(rèn),你看到這些評論后,一定會產(chǎn)生CUDA沒什么了不起的感覺。但事實(shí)上,他們正是用含糊的語氣故意讓你產(chǎn)生這種錯(cuò)覺。Gelsinger其實(shí)加了點(diǎn)解釋,他認(rèn)為CUDA只是訓(xùn)練有用,推理時(shí)就可以不用了,推理可以用英特爾AI處理器。Jim Keller說的沼澤地什么意思他沒認(rèn)真解釋,他認(rèn)為X86也是沼澤地。事實(shí)上,正是積累了超過十年的沼澤地,讓競爭對手根本沒辦法抄。你知道怎么鋪柏油路,但你不知道怎么搭建一片一模一樣的沼澤地。就像微軟的Office,設(shè)計(jì)和代碼一團(tuán)亂麻,但就是一種能前后兼容的沼澤地。問: 你說的還是不夠清楚,像AMD這樣已經(jīng)有強(qiáng)大GPGPU的廠商,不需要抄CUDA,自己重新搞一套標(biāo)準(zhǔn)庫不就好了,像新鋪一個(gè)柏油路。答: 這就說到什么是英偉達(dá)的軟硬一體了。事實(shí)上,15年前廠商們就在一起搞了一個(gè)叫OpenCL的計(jì)算框架,但因?yàn)槭袌鎏「骷矣滞伯悏?,有bug又長期不解決,導(dǎo)致它現(xiàn)在半死不活。AMD搞CUDA的競爭平臺ROCm也不是一天兩天了,是七年多了,但是同樣投入資源不夠,各種問題拖到用戶崩潰,導(dǎo)致用戶基本都流失了。而英偉達(dá),黃老板自稱是個(gè)軟件公司,軟件工程師比硬件工程師多。問: 那也就是CUDA沒有像樣的競爭對手了? 英特爾正是看到OpenCL和ROCm都深陷泥潭,決定抽身出來新鋪一個(gè)路,這就是oneAPI??陀^地說,oneAPI確實(shí)志向高遠(yuǎn),它試圖囊括所有家的GPU,CPU,F(xiàn)PGA等做個(gè)高級抽象平臺。問: 沒聽太明白。人家AMD一種硬件都搞不定,你搞各種硬件反而能搞定?答: 類比一下吧,英特爾搞的這個(gè)東西,有點(diǎn)像谷歌搞的安卓用Java,在各種廠商的不同硬件上都能跑;而CUDA像iOS只能在英偉達(dá)GPU上跑,但性能最優(yōu)。英特爾收購了一家叫Codeplay的挺厲害的公司,目標(biāo)是通過SYCL語言實(shí)現(xiàn)跨平臺和各種可移植的庫。但其挑戰(zhàn)是,SYCL遠(yuǎn)不像當(dāng)年Java那么流行而且有極其豐富的程序員資源。問: 明白了,那CUDA算是遇到挑戰(zhàn)者了?答: 還遠(yuǎn)遠(yuǎn)沒有。高性能計(jì)算需要完善的硬件層、驅(qū)動、集群、底層庫和上層應(yīng)用(PyTorch,編譯器等)的深度綁定,CUDA沒有一個(gè)短板。而其競爭對手除了最基本的GPU芯片性能類似,別的部分都遙遙落后,單一個(gè)驅(qū)動程序都bug百出。AMD的MI300雖然單機(jī)性能強(qiáng),但并沒有那么大的實(shí)戰(zhàn)意義。這就是黃老板說的,他們的硬件白送,搞出LLM的成本都比英偉達(dá)高,因?yàn)楦鞣N錯(cuò)誤時(shí)間耗不起。問: 你說的集群是什么意思?答: 煉丹超大型LLM,需要千顆以上的GPU協(xié)同工作,這種量級針對LLM的集群軟硬件生態(tài),目前只有英偉達(dá)獨(dú)此一家。即使說到幾顆GPU的小集合,英偉達(dá)都是遙遙領(lǐng)先,這就是我們看到的Hopper架構(gòu),GPU之間連接的NVLink和NVSwitch是英偉達(dá)私有技術(shù),AMD用的PCIe并不能與之抗衡。H200首家采用的HBM3e,有恐怖的4.8TB/s帶寬來有效突破內(nèi)存墻。再過兩天英偉達(dá)開GTC,不知道還會有什么東西拿出來嚇人。問: 你真是英偉達(dá)吹啊。難道它就沒什么弱點(diǎn)可以擊破嗎?答: 在美國的H1B工簽抽簽環(huán)境下,程序員是非常稀缺的資源。加上美國互聯(lián)網(wǎng)業(yè)發(fā)達(dá)和基礎(chǔ)教育薄弱,其程序員的缺口巨大。驅(qū)動程序和計(jì)算庫這種低性價(jià)比的東西,美國程序員大多是不愛做的。 和美國形成鮮明對照的是中國,基礎(chǔ)教育卷到發(fā)指,程序員資源如滔滔江水。我們看到,由于中美高技術(shù)脫鉤,中國必然全力發(fā)展自己的新質(zhì)生產(chǎn)力。那些AMD和英特爾正在苦苦掙扎的庫都是開源的,我們只要投入足夠、力出一孔,必然可以大幅度縮短和英偉達(dá)CUDA的差距。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。