博客專欄

EEPW首頁 > 博客 > 大咖說丨云計算:數(shù)字世界的“中樞神經(jīng)”

大咖說丨云計算:數(shù)字世界的“中樞神經(jīng)”

發(fā)布人:天翼云開發(fā)者 時間:2023-04-07 來源:工程師 發(fā)布文章

隨著數(shù)字化轉(zhuǎn)型進(jìn)程加速,云計算作為重塑商業(yè)模式、加速數(shù)字經(jīng)濟(jì)發(fā)展的關(guān)鍵引擎,其重要性愈發(fā)凸顯。未來已來,身處數(shù)字宇宙中,云計算的角色又將如何轉(zhuǎn)變?近日,中國信息通信研究院云計算與大數(shù)據(jù)研究所副所長栗蔚,分享了她對于云計算與數(shù)字原生新實體的獨到見解:

 

數(shù)字化時代,云計算本質(zhì)已經(jīng)發(fā)生根本改變,實現(xiàn)了由最初的虛擬化技術(shù)向數(shù)字世界的中樞神經(jīng)演升,從以服務(wù)化資源交付向云原生化價值賦能轉(zhuǎn)變。云計算正在成為數(shù)字生命體的中樞神經(jīng),成為企業(yè)數(shù)字化轉(zhuǎn)型的胎生力量。

 

image.png 

 

只有腦區(qū)而沒有中樞神經(jīng)的智能是靜止的智能。傳統(tǒng)人工智能側(cè)重模型算法創(chuàng)新,卻忽略了智能是一個復(fù)雜的系統(tǒng)化工程,就像人的智慧是建立在完善的中樞神經(jīng)之上的。模型算法實現(xiàn)的是機(jī)器學(xué)習(xí)能力,相當(dāng)于人類大腦的認(rèn)知腦區(qū)(腦力功能區(qū)的簡稱),人類有600多個腦區(qū),但人類整體的智能應(yīng)該包括腦區(qū)部分和中樞神經(jīng),中樞神經(jīng)是由腦和脊髓組成(腦和脊髓是各種反射弧的中樞部分),比起早期腔體動物和節(jié)肢動物只能處理單維信息的中樞神經(jīng)不同,人類的中樞神經(jīng)可以同時、分布式傳遞和處理所有來自“眼耳鼻舌身意”的超高量信息至不同的認(rèn)知腦區(qū),并相互連接他們,促進(jìn)腦區(qū)不斷發(fā)育。

 

模型算法和云計算恰好分別扮演了腦區(qū)和中樞神經(jīng)的角色。OpenAI與云計算的聯(lián)姻,充分釋放出以云計算為中樞構(gòu)建的數(shù)字生命體的競爭力,大多企業(yè)和用戶在聚焦模型算法優(yōu)化改良時,不可忽略云計算作為中樞神經(jīng)的作用。ChatGPT是構(gòu)建在云上的人工智能,就像生物的進(jìn)化一樣,是腦區(qū)與中樞神經(jīng)系統(tǒng)關(guān)系在數(shù)字世界的成功演繹。

 

ChatGPT的兩個被津津樂道的創(chuàng)新是系統(tǒng)化工程的創(chuàng)新,這其中云計算功不可沒,一是情景學(xué)習(xí)模式以及多模態(tài)(文本、代碼、圖片等多維度信息)輸入;二是人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式。這兩個創(chuàng)新中云計算的應(yīng)用部署和離混部技術(shù)發(fā)揮了重要作用。

 

image.png 

 

云計算作為中樞神經(jīng),作用有三:

 

01/ 數(shù)字世界腦區(qū)(應(yīng)用)調(diào)度算力的系統(tǒng)

云計算分布式調(diào)度超高量異構(gòu)高性能計算GPU和通用計算CPU資源,支持ChatGPT模型的1750億參數(shù),對于異構(gòu)的計算資源,云計算屏蔽了復(fù)雜的部署框架,給大規(guī)模參數(shù)一個標(biāo)準(zhǔn)化計算環(huán)境,可以高效使用異構(gòu)算力,降低了大量開發(fā)的開銷和運行的成本,提高了效率。

 

02/ 數(shù)字世界多維腦區(qū)(多維應(yīng)用)接入、部署和連接的基礎(chǔ)環(huán)境

云計算實現(xiàn)了多維模型參數(shù)的標(biāo)準(zhǔn)化部署,使得ChatGPT可以圍繞某個主題同時學(xué)習(xí)多維(圖像、語音、文本等)信息,大部分傳統(tǒng)人工智能就像早期腔體動物只有一個腦區(qū),只能學(xué)習(xí)訓(xùn)練單一維度參數(shù),云計算可以將不同應(yīng)用參數(shù)通過云原生容器等技術(shù)標(biāo)準(zhǔn)化部署在不同節(jié)點,并相互連接處理,通過云原生數(shù)據(jù)庫等實現(xiàn)多維數(shù)據(jù)的統(tǒng)一處理,就像人類的大腦中樞神經(jīng)一樣連接處理不同層級和不同維度的腦區(qū)。

 

03/ 數(shù)字世界實現(xiàn)存儲記憶(離線訓(xùn)練)和各個腦區(qū)反饋(在線提示引導(dǎo))的機(jī)制

通過云原生離線混部技術(shù)支持ChatGPT離線訓(xùn)練,在線提示引導(dǎo)的算法實現(xiàn),就像人類中樞神經(jīng)會不斷傳遞經(jīng)驗和現(xiàn)實信息給大腦進(jìn)行大腦信息修正,在用戶看來ChatGPT可以根據(jù)交流調(diào)整答案,非常智能。

 

ChatGPT是“數(shù)字原生”人工智能,云原生理念和技術(shù)是其勝出的重要因素之一

 

ChatGPT是長在云計算上的“數(shù)字原生”人工智能,就像生物進(jìn)化先進(jìn)化中樞神經(jīng)一樣,ChatGPT天生擁有中樞神經(jīng)、多維腦區(qū)、開放學(xué)習(xí)能力和智慧創(chuàng)新的四位一體的智慧能力。云原生是中樞神經(jīng)整體實現(xiàn)的關(guān)鍵技術(shù)內(nèi)核,容器在其中就像上千上億的神經(jīng)元承擔(dān)了不同應(yīng)用計算能力和信息傳遞能力,算法在計算時將前端后端的神經(jīng)元部署在不同的容器上,去進(jìn)行每一個計算、傳遞和通信。

 

01/ 云原生技術(shù)為ChatGPT提供超大規(guī)模并行計算的統(tǒng)一調(diào)度分發(fā)服務(wù)能力,顯著降低ChatGPT訓(xùn)練成本

GPT走大規(guī)模訓(xùn)練路線,GPU只負(fù)責(zé)提供底層算力,而云原生則負(fù)責(zé)實現(xiàn)中間的分布式。GPT有1750億個參數(shù),這1750億個參數(shù)在底層進(jìn)行運算和計算時,使用Ray的訓(xùn)練框架。底層基于云原生K8S服務(wù)將1750億的參數(shù)模型根據(jù)不同的維度分布成超高量級節(jié)點的調(diào)度,進(jìn)行分布式的節(jié)點計算,如果沒有云原生,異構(gòu)算力調(diào)度存在壁壘,GPU池化受阻,支撐千億參數(shù)模型訓(xùn)練的多機(jī)多卡分布式訓(xùn)練環(huán)境無法高效打通,網(wǎng)絡(luò)、存儲、計算、通信能力下降,ChatGPT每次訓(xùn)練時間將被一再拉長。

 

另一方面,人工智能模型計算所需要消耗的計算資源每3~4個月就要翻一倍,資金也需要通過指數(shù)級增長獲得匹配,而運用云計算后過去兩年半,GPT-3等模型的訓(xùn)練成本下降了80%以上,從首次訓(xùn)練開銷1200萬美元降至140萬美元。如果沒有云原生發(fā)揮極致彈性能力,時間成本和經(jīng)濟(jì)成本雙向上升。

 

02/ 云原生技術(shù)能夠?qū)崿F(xiàn)多維應(yīng)用部署

云原生容器是數(shù)字生命體的神經(jīng)元,承載著模型參數(shù)類型以及調(diào)度連接的容器節(jié)點,具有標(biāo)準(zhǔn)化部署多維應(yīng)用的能力,對“眼耳鼻舌身意”多維信息部署處理,加速數(shù)字大腦,也就是人工智能算法的進(jìn)化,使ChatGPT更具智慧。如果沒有云原生,多元異構(gòu)數(shù)據(jù)難以標(biāo)準(zhǔn)化接入,單一維度應(yīng)用難以標(biāo)準(zhǔn)化統(tǒng)一部署,模型的信息集成、處理效率、計算精度、能力輸出將大打折扣,缺乏組合能力的ChatGPT的成功概率會大幅下降。

 

03/ 云原生離混部技術(shù)實現(xiàn)離散訓(xùn)練,在線微調(diào)

ChatGPT基于大量優(yōu)質(zhì)的數(shù)據(jù)語料訓(xùn)練,實現(xiàn)對話意圖識別和內(nèi)容生成能力的突破,這主要由于ChatGPT具有強(qiáng)大的智能算法學(xué)習(xí)和記憶調(diào)用基礎(chǔ),通過云原生離線混部和極致彈性調(diào)用機(jī)制,離線訓(xùn)練千億級別的超大規(guī)模參數(shù),形成了ChatGPT的存儲記憶資源池,通過在線補(bǔ)充完成人類反饋強(qiáng)化學(xué)習(xí)(RLHF)的微調(diào)訓(xùn)練機(jī)制和提示導(dǎo)引模式,模擬各個腦功能區(qū)的反饋,實現(xiàn)多任務(wù)單詞、句子、圖片之間關(guān)系的小規(guī)模反饋下的自我監(jiān)督學(xué)習(xí)。ChatGPT模型訓(xùn)練需要消耗超大規(guī)模計算資源,基于K8s的資源隔離和資源調(diào)度實現(xiàn)的在離線混部技術(shù),極大的提升資源利用率,節(jié)約模型訓(xùn)練成本。

 

04/ 云原生+AI原生開啟全新商業(yè)模式形成良性生態(tài)循環(huán)

開發(fā)側(cè),ChatGPT 生長在云上, 依賴于云計算服務(wù),多年來OpenAI共收到了上百億的投資,這些資金幫助 OpenAI 在平臺上運行和訓(xùn)練其模型;產(chǎn)品側(cè),OpenAI 基于Cloud Native進(jìn)行應(yīng)用開發(fā),基于云計算提供的便捷高性能計算運算模型和打磨算法,并對外銷售產(chǎn)品和 API;而投資方基于 AI Native 來提升搜索、繪畫等產(chǎn)品,未來會在Office、Teams甚至操作系統(tǒng)等產(chǎn)品中用到 OpenAI 提供的能力。

 

以上關(guān)于ChatGPT與云計算的關(guān)系,也得到了ChatGPT本身回答的驗證?!癈hatGPT,你的底層有沒有用到云原生技術(shù)?”ChatGPT的答案是肯定的,“底層基于離線混布技術(shù),離線負(fù)責(zé)預(yù)訓(xùn)練,在線處理微調(diào)。”“云原生發(fā)揮了什么功能”?“分布式計算?!薄胺植际接嬎愕墓?jié)點是什么?”“規(guī)模太大了,無法告訴你,是一個超高量級的。”

 

云計算同樣是數(shù)字經(jīng)濟(jì)時代企業(yè)的中樞神經(jīng),希望其意義被更廣泛認(rèn)知

 

根據(jù)信通院調(diào)研,當(dāng)下企業(yè)上云率總體較低,在30%左右,行業(yè)上云用云呈現(xiàn)階梯狀特征,金融、電信、互聯(lián)網(wǎng)等行業(yè)到達(dá)努力實現(xiàn)用好云、管好云的階段,傳統(tǒng)的制造業(yè)、農(nóng)業(yè)、醫(yī)療衛(wèi)生等行業(yè)還處在努力實現(xiàn)上好云的階段。大部分企業(yè)對于云計算的認(rèn)識仍停留在資源集約方面,沒有認(rèn)識到云計算中樞神經(jīng)的作用。未來,企業(yè)對云計算的認(rèn)知需要超越資源層面,云計算作為企業(yè)中樞神經(jīng)的意義應(yīng)該被更廣泛認(rèn)知。

 

就像云計算實現(xiàn)了ChatGPT多維信息綜合處理,異構(gòu)算力資源一體化調(diào)度,作為企業(yè)中樞神經(jīng)的云計算,能夠打通從上游采購到下游客戶的全流程業(yè)務(wù)鏈條,打破煙囪式流程,實現(xiàn)采購、生產(chǎn)、銷售、渠道、用戶消費、人財物等全業(yè)務(wù)流程再造和創(chuàng)新,以及各環(huán)節(jié)數(shù)據(jù)統(tǒng)一匯聚和處理。云計算結(jié)合人工智能、大數(shù)據(jù)等技術(shù),幫助企業(yè)成為擁有“中樞神經(jīng)”和“大腦”的完整智能體,即轉(zhuǎn)型升級為“數(shù)字原生新實體”。數(shù)字原生新實體是技術(shù)和思想的跨越,是企業(yè)數(shù)字原力的覺醒。

 

認(rèn)知之上,需要針對不同行業(yè)、規(guī)模、類型的企業(yè)分類施策,以充分發(fā)揮云計算中樞神經(jīng)的作用。對于中小企業(yè),云廠商供給即插即用云計算中樞神經(jīng)能力;對于大企業(yè),建立自己的云計算中樞神經(jīng)。第三方通過建立全方位標(biāo)準(zhǔn)體系指引,和供給方共同打造高質(zhì)量有針對性的云原生產(chǎn)品生態(tài),中國信通院已經(jīng)建立定位企業(yè)數(shù)字化轉(zhuǎn)型成熟度IOMM和云原生成熟度CNMM的評估體系,未來將同業(yè)界伙伴共同推進(jìn)、持續(xù)完善。

 


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: 云計算

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉