買(mǎi)一萬(wàn)張芯片,造一個(gè)新帝國(guó)
馬斯克曾與其他業(yè)界大佬共同發(fā)出暫停 GPT-4 以上的大型語(yǔ)言人工智能模型的開(kāi)發(fā)聲明,但隨后卻成立了新的 AI 公司,并采購(gòu)了上萬(wàn)張 NVIDIA 最新的 AI 加速卡,開(kāi)始發(fā)展自己的 GPT 人工智能模型。這讓人們感到困惑,不知道馬斯克在想什么。甚至被業(yè)界質(zhì)疑是不是想要拖慢 OpenAI 的發(fā)展腳步好讓自己可以取而代之?
本文引用地址:http://m.butianyuan.cn/article/202304/446027.htm基本上,馬斯克發(fā)展的 AI 都是為了服務(wù)人類(lèi)的創(chuàng)意,并取代重復(fù)的人類(lèi)工作,但隨著 ChatGPT 的推出,創(chuàng)意和邏輯這塊很快就被 AI 取代了一大部分,馬斯克在這時(shí)創(chuàng)立 X.AI,并且要推出「真實(shí)」的 GPT 模型,也讓人懷疑,馬斯克這是在打臉自己?然而事情并不是那么單純…
當(dāng)然,馬斯克與 OpenAI 之間的恩怨已經(jīng)有很多人談過(guò),他們之間的是非對(duì)錯(cuò)其實(shí)也很難三言兩語(yǔ)就解釋清楚,因此我們這次就來(lái)了解馬斯克在 AI 這條路上做了什么,以及以后他藉由 X.AI 來(lái)做什么,然后來(lái)嘗試解答馬斯克創(chuàng)立 X.AI 公司的目的。
廣被誤解的自動(dòng)駕駛
先從馬斯克的 AI 發(fā)展歷程稍微回顧一下,馬斯克最早投入 AI 議題是從自動(dòng)駕駛技術(shù)開(kāi)始,早在 2014 年時(shí),特斯拉開(kāi)始在其 Model S 上引入最早的一代 Autopilot 技術(shù),隨后也推廣至 Model X 車(chē)種,當(dāng)時(shí)這個(gè)系統(tǒng)雖然號(hào)稱自動(dòng)駕駛,但實(shí)際上汽車(chē)無(wú)法自行決定路線、方向,也無(wú)法判斷路況,只能進(jìn)行簡(jiǎn)單的車(chē)道置中以及變換車(chē)道,雖好于目前的 L2 駕駛輔助,但仍遠(yuǎn)遠(yuǎn)談不上自動(dòng)駕駛。
當(dāng)然,自動(dòng)駕駛被誤解其實(shí)也是中文翻譯的問(wèn)題,比如說(shuō)飛機(jī)上的 AutoPilot 其實(shí)也是翻譯成自動(dòng)駕駛,但實(shí)際上,飛機(jī)的自動(dòng)駕駛也只是在固定的高度維持飛行,而不是可以從起飛、航線變換到降落都可以交給飛機(jī)。不過(guò)當(dāng)時(shí)的汽車(chē)產(chǎn)業(yè)界對(duì)其所謂自動(dòng)駕駛的定義非??燎?,認(rèn)為以特斯拉當(dāng)時(shí)的 AutoPilot 功能,根本稱不上自動(dòng),特斯拉也因此飽受責(zé)難。
加上當(dāng)時(shí)選用的硬件是基于 Mobileye 的 ASIC 方案,性能非常弱,即便后續(xù)更新軟件,也沒(méi)辦法滿足消費(fèi)者的需求。
因此,馬斯克后來(lái)在 2016 年結(jié)束語(yǔ) Mobileye 的合作,轉(zhuǎn)而與 NVIDIA 進(jìn)行合作。眾所周知,NVIDIA 在 2010 年左右開(kāi)始發(fā)展其 CUDA 與 GPGPU 生態(tài),并借此推動(dòng)人工智能的發(fā)展,隨后也以 Tegra 方案為基礎(chǔ)推出自動(dòng)駕駛方案。
NVIDIA 的自動(dòng)駕駛方案的確強(qiáng)大許多,但仍遠(yuǎn)不及馬斯克心中的想像,加上后續(xù)的中國(guó)電動(dòng)車(chē)企業(yè)小鵬爆發(fā)用 AutoPilot 原始碼并與 NVIDIA 進(jìn)行合作的爭(zhēng)議之后,特斯拉隨即結(jié)束與 NVIDIA 的合作關(guān)系,并轉(zhuǎn)而自行研發(fā)真正的自動(dòng)駕駛平臺(tái)。
而馬斯克也重新定義自動(dòng)駕駛的英文名稱,將其稱為 FSD(Full Self Drive),不在名稱上走擦邊球,馬斯克信心滿滿,覺(jué)得在 2020 年就能推出全功能的 FSD 正式版,但截至目前為止,F(xiàn)SD 仍處在測(cè)試版階段,目前最新版本是 Beta 11.4。
FSD Beta 徹底翻轉(zhuǎn)以往自駕車(chē)邏輯,采用新空間占量概念(Occupancy Network),不再以連續(xù)單張圖片為基礎(chǔ),而是以物體體積的影片為基礎(chǔ)運(yùn)算,克服許多自駕技術(shù)困難,無(wú)需光達(dá)、雷達(dá)和高精地圖,以純視覺(jué)就能做到極接近人類(lèi)駕駛的程度。雖然還有些小瑕疵,但在業(yè)界也已經(jīng)是表現(xiàn)最好的自動(dòng)駕駛系統(tǒng)。
那么 FSD 是如何被打造出來(lái)的?我們可以分為兩個(gè)部分來(lái)看,一個(gè)是汽車(chē)上的推理核心,負(fù)責(zé)現(xiàn)場(chǎng)駕駛行為的判斷與執(zhí)行,另一個(gè)是云端的訓(xùn)練工作,負(fù)責(zé)從個(gè)別的特斯拉汽車(chē)收集駕駛資訊,并以之訓(xùn)練精進(jìn) FSD 的駕駛模型。
汽車(chē)上的推理芯片由特斯拉自行研發(fā),命名為 Hardware x.0,目前版號(hào)已經(jīng)到 4.0,由三星代工生產(chǎn),基于 Exynos 手機(jī)芯片架構(gòu)改造??傔\(yùn)算性能達(dá)到 490TOPS,超越 NVIDIA 最新自動(dòng)駕駛平臺(tái) Driver Orin 的 254TOPS。
而云端的部分也有不小的變革。原本特斯拉是采用 NVIDIA 的 GPU 來(lái)打造自有的超級(jí)電腦,并以之訓(xùn)練自動(dòng)駕駛模型,該超級(jí)電腦使用了 7360 顆 NVIDIA 的 A100 運(yùn)算芯片,在 2022 年底可以排上全球第七強(qiáng)超級(jí)電腦。
透過(guò)此超級(jí)電腦,特斯拉已經(jīng)可以做到道路物件的標(biāo)記完全自動(dòng)化,并且能夠更快的基于特斯拉回傳的駕駛資訊訓(xùn)練改進(jìn)駕駛模型。然后馬斯克也就辭退了之前為特斯拉工作的 800 名標(biāo)記師。
不過(guò) NVIDIA 的方案顯然還是無(wú)法滿足特斯拉,同樣是在 2022 年,特斯拉在 AI Day 上公布了 Dojo 計(jì)劃,包含 Dojo 視覺(jué)訓(xùn)練芯片以及超級(jí)電腦叢集 ExaPod,預(yù)計(jì)在 2023 年上線,屆時(shí)將是性能高達(dá) 1.1 EFLOP 的恐怖怪物級(jí)超級(jí)電腦,性能是現(xiàn)有基于 GPU 架構(gòu)超級(jí)電腦的 4 倍以上。
超級(jí)工廠與 AI
除了特斯拉電動(dòng)車(chē)以外,用來(lái)造車(chē)的超級(jí)工廠也同樣高度 AI 化,尤其大型產(chǎn)線機(jī)器人,幾乎都已經(jīng)全面自動(dòng)化,這些機(jī)器人可以執(zhí)行復(fù)雜的操作,甚至在有需要時(shí)可以自動(dòng)變換工具來(lái)執(zhí)行不同的組裝任務(wù),因此,特斯拉的產(chǎn)能不斷獲得提升,成本也不斷下降。
特斯拉表示,超級(jí)工廠雖然還有數(shù)千名員工,但整合 AI 機(jī)器人之后,工作流程可以由軟件定義、訓(xùn)練、最佳化,極大的改善了制造流程。
而超級(jí)工廠下一步,則是要引進(jìn)在 2022 年發(fā)表的特斯拉 Optimus 人形機(jī)器人,透過(guò)這個(gè)機(jī)器人,可以大量取代需要使用到人工的重復(fù)性工作。該機(jī)器人基本上就是一個(gè)人形化的特斯拉汽車(chē),其處理器、電池還有許多電機(jī)技術(shù),都是來(lái)自特斯拉。
充電一次就可以工作一整天。馬斯克表示,最快在 2023 年內(nèi)進(jìn)行量產(chǎn),并引進(jìn)超級(jí)工廠。馬斯克表示,就如同特斯拉的自動(dòng)駕駛系統(tǒng)是要用來(lái)代替人類(lèi)執(zhí)行重復(fù)且無(wú)聊的駕駛工作,Optimus 也是要用來(lái)代替人類(lèi)進(jìn)行日常購(gòu)物、清掃、搬運(yùn)等重復(fù)性工作。
新公司 X.AI 回歸 NVIDIA
既然特斯拉已經(jīng)有能力發(fā)展自己的超級(jí)電腦芯片與超級(jí)電腦叢集,那為何馬斯克的新 AI 公司仍采購(gòu)近萬(wàn)顆 NVIDIA 最新的 H100 芯片來(lái)建立資料中心?答案其實(shí)很簡(jiǎn)單,那就是特斯拉自有的 Dojo 芯片主要是針對(duì)視覺(jué)處理工作而設(shè)計(jì),軟件框架較為固定,沒(méi)有辦法像 NVIDIA 在提供高彈性的同時(shí),也具備高性能。
同時(shí),X.AI 公司要發(fā)展的是類(lèi)似 OpenAI 的 ChatGPT,這類(lèi)大型自然語(yǔ)言模型的訓(xùn)練工作還是 NVIDIA 的強(qiáng)項(xiàng)。完整版 H100 芯片能達(dá)到 60TFLOPS 的 FP32 運(yùn)算能力,D1 則僅為 22TFLOPS,不過(guò) D1 支援特斯拉自訂的 CFP8 浮點(diǎn)格式,比較擅長(zhǎng)用于自家的駕駛模型訓(xùn)練工作。
而如果根據(jù)新聞?dòng)嵪ⅲ琗.AI 采購(gòu)了一萬(wàn)張 H100 演算卡,那么初期 X.AI 的運(yùn)算能力是超越算出 GPT4 的 OpenAI 所使用的上萬(wàn)張 A100,因?yàn)榫图兇庑阅?,H100 是 A100 的 4 倍以上。
也就是說(shuō),如果馬斯克要訓(xùn)練出一個(gè) GPT4 等級(jí)的 AI 模型,那么理論上性能是綽綽有余的。不過(guò) OpenAI 背后還有微軟這個(gè)大金主存在,OpenAI 除了自身?yè)碛袃?nèi)建上萬(wàn)張 A100 的超級(jí)電腦以外,還有微軟 Azure 具備的運(yùn)算力,包含超過(guò)一萬(wàn)張基于 A100 加速卡的超級(jí)電腦叢集,專門(mén)服務(wù) ChatGPT,以及已經(jīng)采購(gòu)的超過(guò) 7000 張的 H100,將會(huì)用來(lái)建立新的演算力來(lái)服務(wù) GPT4 或未來(lái)的 GPT5,OpenAI 負(fù)責(zé)訓(xùn)練,而微軟這邊則是主要提供讓 ChatGPT 可以連接到微軟旗下應(yīng)用的龐大推理能力,當(dāng)然,微軟也有可能出借部分運(yùn)算能力給 OpenAI 以供其訓(xùn)練模型之用。
馬斯克的目的是什么?
那么回過(guò)頭來(lái)看,馬斯克的 X.AI 想要服務(wù)的是哪些客戶?想要達(dá)到的是哪些目的?從過(guò)去馬斯克的作法來(lái)看,他一直利用 AI 來(lái)取代偏勞力類(lèi)型的人類(lèi)工作,但是 ChatGPT 是要取代人類(lèi)的部分思想與思考能力,讓人腦專注于創(chuàng)意以及設(shè)定工作目標(biāo),專業(yè)知識(shí)與工作流程則是由 ChatGPT 來(lái)代勞,所以馬斯克也要學(xué) OpenAI +微軟,開(kāi)始要搶某些白領(lǐng)工作了?
不過(guò)馬斯克強(qiáng)調(diào),他的模型將會(huì)專注于真相的傳達(dá),不要有偏見(jiàn),也不要有限制。然而沒(méi)有限制的 AI 聽(tīng)起來(lái)似乎更危險(xiǎn)?完全中立似乎也是另外一種偏見(jiàn)?
對(duì)此,由馬斯克所招募,擔(dān)任 X.AI 核心技術(shù)研發(fā)與管理的前 DeepMind 與 OpenAI 研發(fā)工程師伊戈?duì)枴ぐ筒际步穑↖gor Babuschkin)表示,他們更重視語(yǔ)言模型的推理能力與真實(shí)性,比如說(shuō) GPT3.5/4 都會(huì)在某些程度上虛構(gòu)答案,而且這些模型還無(wú)法解釋為什么要給出特定的答案,因?yàn)檫壿嫸疾卦?AI 模型的黑盒子中。
如果 X.AI 所研發(fā)的模型能夠具備更好的邏輯推論與分辨事實(shí)的能力,那是不是也要將人類(lèi)目前所能擔(dān)任的指示、監(jiān)督與核實(shí) AI 所產(chǎn)生的內(nèi)容的工作也剝奪走,未來(lái)的 AI 將可以全自動(dòng)根據(jù)其觀察到的現(xiàn)況設(shè)定目標(biāo)、解決問(wèn)題,不需要人類(lèi)插手,而且也不用怕會(huì)像 GPT3.5/4 一樣會(huì)自欺欺人,造成潛在的災(zāi)難?
那不是比 ChatGPT 更危險(xiǎn)嗎?對(duì)此,馬斯克其實(shí)還留有一手,他認(rèn)為,如果打不過(guò) AI,那么就加入它,讓大腦透過(guò) NeuraLink 連接電腦/ AI,一起協(xié)同工作,透過(guò)強(qiáng)化人類(lèi)大腦,來(lái)讓 AI 無(wú)法取代,或者,讓大腦本身變成 AI 的一部份。
Neuralink 目前還在實(shí)驗(yàn)階段,但是進(jìn)展相當(dāng)快速,根據(jù)實(shí)驗(yàn)結(jié)果,已經(jīng)能夠讓猴子進(jìn)行超越人類(lèi)反應(yīng)的電腦操作。不過(guò) Neuralink 目前還有不少包括倫理上的爭(zhēng)議,以及技術(shù)上的困難,要普及恐怕有點(diǎn)困難,但等到大型語(yǔ)言模型普及,甚至可以完全自主的 AI 模型出現(xiàn),屆時(shí)人類(lèi)可能也沒(méi)有太多選擇了?
評(píng)論