一場(chǎng)腦機(jī)接口的大賽,看到時(shí)代需要的「AI超級(jí)底座」
「AI 超級(jí)底座」有什么價(jià)值?小到一場(chǎng)競(jìng)賽,大到整個(gè)產(chǎn)業(yè)。從 2022 年開(kāi)始,大模型就成為了最熱門(mén)的技術(shù)關(guān)鍵詞,這種熱度顯然輻射到了多個(gè)相關(guān)領(lǐng)域。比如,在近日召開(kāi)的 2023 世界機(jī)器人大會(huì)上,「大模型 + 機(jī)器人」就成為現(xiàn)場(chǎng)討論最多的話(huà)題。這幾天,不管是后空翻的四足機(jī)器狗,還是吟詩(shī)互動(dòng)的人形機(jī)器人,都給到場(chǎng)的觀(guān)眾留下了深刻的印象。如果你也在現(xiàn)場(chǎng),一定還會(huì)關(guān)注到這場(chǎng)「熱火朝天」的技術(shù)大賽:戴上腦電帽,雙手平放只靠「意念」打字、控制機(jī)械臂,甚至指揮無(wú)人機(jī),即使是在這場(chǎng)「黑科技」眾多的機(jī)器人盛會(huì)中也格外吸睛。
這是「世界機(jī)器人大賽 —BCI 腦控機(jī)器人大賽」連續(xù)舉辦的第七年。很多人可能不知道,在 2022 年之前,由于賽事系統(tǒng)只能同時(shí)支撐十幾支隊(duì)伍本地參賽,所以比賽的舉辦規(guī)模一直受到限制。
而從去年開(kāi)始,比賽報(bào)名、賽題發(fā)布、數(shù)據(jù)建模、算法訓(xùn)練、算法驗(yàn)證等流程成功上云,使得報(bào)名規(guī)模一下子提升了超過(guò) 50%。今年,大家的參賽熱情不減:共有 67 所高校的 200 + 支隊(duì)伍參與,其中,來(lái)自機(jī)械科學(xué)、人工智能、計(jì)算機(jī)科學(xué)專(zhuān)業(yè)的參賽者數(shù)量最多。
在賽事上云之前,選手們無(wú)法在賽場(chǎng)上使用需要 GPU 算力進(jìn)行深度學(xué)習(xí)訓(xùn)練與推理的創(chuàng)新算法。但現(xiàn)在,每一位參賽選手都擁有充足的計(jì)算資源在比賽中去驗(yàn)證自己的技術(shù)設(shè)想。
這幾百支隊(duì)伍的每一次算法更改、調(diào)試,背后都是騰訊云在提供算力支持。
支撐一場(chǎng) 200 支隊(duì)伍的賽事需要怎樣的云端算力?
腦機(jī)接口是通過(guò)生物電信號(hào)實(shí)現(xiàn)直接人機(jī)交互的方法,是一門(mén)涉及計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)的前沿技術(shù),在醫(yī)療、養(yǎng)老、助殘、康復(fù)等領(lǐng)域具備巨大前景和廣闊市場(chǎng)應(yīng)用基礎(chǔ)。比如,醫(yī)院可通過(guò)腦機(jī)接口識(shí)別情緒后即時(shí)提供心理健康建議、殘疾人士可利用腦機(jī)接口控制輪椅完成意念打字進(jìn)行日常交流等。
在這些方向上,也已經(jīng)出現(xiàn)了一些產(chǎn)業(yè)化落地的探索。比如馬斯克成立的 Neuralink 就希望借助這項(xiàng)技術(shù)幫助視障和行動(dòng)不便人士,恢復(fù)視力和行動(dòng)能力。今年 5 月,Neuralink 獲準(zhǔn)進(jìn)行腦機(jī)接口人體試驗(yàn),意味著腦機(jī)接口技術(shù)進(jìn)入了一個(gè)新的階段。
不過(guò),目前的腦機(jī)接口技術(shù)進(jìn)展距離大規(guī)模產(chǎn)業(yè)化仍有一定距離。很多實(shí)驗(yàn)室都在投入腦機(jī)接口項(xiàng)目的研究,但暫時(shí)僅用于基礎(chǔ)科研。中國(guó)十分注重腦機(jī)接口的產(chǎn)業(yè)化發(fā)展,2023 年 5 月底,工信部宣布,將把腦機(jī)接口作為培育未來(lái)產(chǎn)業(yè)發(fā)展的重要方向,加強(qiáng)腦機(jī)接口應(yīng)用場(chǎng)景探索,加速推動(dòng)腦機(jī)接口產(chǎn)業(yè)發(fā)展。
想要推動(dòng)這項(xiàng)技術(shù)的產(chǎn)業(yè)化落地,除了政策上的重視之外,培養(yǎng)腦機(jī)接口人才也是重要的途徑之一。這也是「BCI 腦控機(jī)器人大賽技術(shù)賽」舉辦的初衷。
今年,大賽以腦機(jī)接口實(shí)用系統(tǒng)為背景,圍繞 SSVEP、P300、運(yùn)動(dòng)想象三個(gè)主要范式及腦機(jī)接口技術(shù)應(yīng)用方向設(shè)置了技術(shù)賽及技能賽,希望從準(zhǔn)確度、速度、實(shí)用性、技術(shù)性等多維度提高腦機(jī)接口技術(shù)在信號(hào)識(shí)別、醫(yī)療康復(fù)、心理健康等各領(lǐng)域的技術(shù)與產(chǎn)業(yè)發(fā)展。
經(jīng)過(guò)激烈比拼,來(lái)自香港大學(xué)和澳門(mén)大學(xué)的港澳聯(lián)隊(duì)獲得了本次 BCI 腦控機(jī)器人大賽「騰訊云杯」技術(shù)賽枕葉腦機(jī)賽題、腦機(jī)對(duì)抗安全賽題等的多項(xiàng)冠軍。
「比賽中對(duì)于算力的需求是動(dòng)態(tài)的,線(xiàn)上賽階段對(duì)算法的時(shí)間要求比較寬泛,而線(xiàn)下賽階段需要對(duì)數(shù)據(jù)做實(shí)時(shí)處理,所以我們對(duì)高性能算力有很強(qiáng)的需求,有很多深度學(xué)習(xí)的模型都非常消耗算力?!箶孬@多項(xiàng)賽題冠軍的港澳聯(lián)隊(duì)表示。
在賽事中,騰訊云異構(gòu)計(jì)算所提供的公有云服務(wù) ,讓參賽者們感覺(jué)「如虎添翼」。騰訊云為比賽提供了強(qiáng)大穩(wěn)定的算力支持,選手能夠使用基于 GPU 算力的深度學(xué)習(xí)算法對(duì)比賽中的大量數(shù)據(jù)進(jìn)行訓(xùn)練。
想要探索場(chǎng)景應(yīng)用,還需要真實(shí)的場(chǎng)景數(shù)據(jù)。有賴(lài)于騰訊云的加持,2023BCI 腦控機(jī)器人大賽中首次引入了真實(shí)病人腦電科研數(shù)據(jù),讓參賽者們能夠真正接觸到大量科研級(jí)別的數(shù)據(jù)資源。
正在這樣的支持下,很多參賽隊(duì)員能夠?qū)⒏邉?chuàng)意的想法在比賽中嘗試去實(shí)現(xiàn),「BCI 腦控機(jī)器人大賽技術(shù)賽」也從一場(chǎng)十幾支隊(duì)伍的小規(guī)模比賽走向了大平臺(tái)模式,實(shí)現(xiàn)了對(duì)接科研與產(chǎn)業(yè)的價(jià)值。腦機(jī)接口技術(shù)的上云,進(jìn)一步降低了科研與產(chǎn)業(yè)融合的門(mén)檻,未來(lái)將極大推動(dòng)在醫(yī)療、養(yǎng)老、助殘、康復(fù)等領(lǐng)域的產(chǎn)業(yè)應(yīng)用。
另外,這一次的官方競(jìng)賽數(shù)據(jù)將作為我國(guó)腦機(jī)接口領(lǐng)域重要研究成果全程保留記錄,技術(shù)賽的決賽數(shù)據(jù)和有關(guān)算法分析文章也將收錄在清華大學(xué)的 Brain Science Advances 專(zhuān)刊中,推動(dòng)腦機(jī)接口技術(shù)未來(lái)通過(guò)高性能云服務(wù)在醫(yī)療場(chǎng)景甚至日常生活中更快地實(shí)現(xiàn)應(yīng)用轉(zhuǎn)化。
競(jìng)賽同期還舉辦了 2023 世界機(jī)器人大會(huì)腦控機(jī)器人挑戰(zhàn)活動(dòng),并創(chuàng)造了本年度的腦控打字、腦控?zé)o人機(jī)賽會(huì)紀(jì)錄。來(lái)自天津大學(xué)的選手實(shí)現(xiàn)了 10.049bits/min 的鍵盤(pán)手控?zé)o人機(jī)效率,與手控?zé)o人機(jī)效率相當(dāng);來(lái)自清華大學(xué)的選手在觸屏 - 腦機(jī)輸入速度桃戰(zhàn)中獲得了平均 1.43 字符 / 秒的成績(jī),接近現(xiàn)場(chǎng)觀(guān)眾手機(jī)觸屏打字速度。
大算力時(shí)代,需要怎樣的 AI 超級(jí)底座?
像這樣為一場(chǎng)兩百支隊(duì)伍規(guī)模的機(jī)器人比賽提供服務(wù),僅是騰訊云的眾多「微型實(shí)踐」之一。
在 IDC 近日發(fā)布的《中國(guó)人工智能公有云服務(wù)市場(chǎng)份額 2022》報(bào)告中,騰訊云憑借其 2022 年在計(jì)算機(jī)視覺(jué)、對(duì)話(huà)式 AI 等領(lǐng)域的領(lǐng)先優(yōu)勢(shì),營(yíng)收增速達(dá)到 124.6%,成為國(guó)內(nèi)收入增速最快的公有云廠(chǎng)商。
同時(shí),作為擁有產(chǎn)品品類(lèi)最多的云服務(wù)商之一,騰訊云所提供計(jì)算服務(wù)的客戶(hù)目前已遍布全球。與一線(xiàn)客戶(hù)群體需求的密切接觸,讓騰訊云更早洞察到云計(jì)算服務(wù)領(lǐng)域的每一個(gè)變化趨勢(shì)。
顯然,變化的速度近年來(lái)不斷加快:通用大模型時(shí)代到來(lái)了,AI 正在從 1.0 時(shí)代過(guò)渡到 2.0 時(shí)代。大模型的共同特點(diǎn)是:數(shù)據(jù)量巨大,模型參數(shù)量巨大,所需算力也是巨大的。當(dāng) AI 產(chǎn)業(yè)落地大規(guī)模鋪開(kāi),這對(duì)傳統(tǒng)的云計(jì)算基礎(chǔ)設(shè)施是不可回避的考驗(yàn)。
眾所周知的 AI 三要素中,算力平臺(tái)是核心基礎(chǔ)。幾年前,單卡或者單機(jī)就能完成模型的訓(xùn)練,但在今天,大模型的參數(shù)動(dòng)輒幾十上百億,訓(xùn)練大模型的算力標(biāo)配是千卡甚至萬(wàn)卡,很多人只能感嘆一句「玩不起」。同時(shí),單體服務(wù)器提供的算力也很有限,大規(guī)模、分布式的高性能計(jì)算集群成為「剛需」。
另一方面,在大模型技術(shù)的推動(dòng)下,數(shù)據(jù)量呈爆炸式增長(zhǎng),然而很多數(shù)據(jù)都是非結(jié)構(gòu)化的,想要高效率、低成本地處理數(shù)據(jù),面臨著很多困難。
曾經(jīng)的云計(jì)算,重視的是單機(jī)單卡的性能、標(biāo)量數(shù)據(jù)的結(jié)構(gòu)化精準(zhǔn)檢索以及云原生帶來(lái)的自動(dòng)調(diào)度。今后,關(guān)注點(diǎn)已經(jīng)轉(zhuǎn)移到了集群性能的提升、向量數(shù)據(jù)的存儲(chǔ)與檢索以及自動(dòng)容錯(cuò)能力。
在這樣的需求下,云基礎(chǔ)設(shè)施底座的設(shè)計(jì)范式必須隨之進(jìn)化。
全球的科技公司都在加碼布局新一代的算力基礎(chǔ)設(shè)施,騰訊云的技術(shù)底座也在不斷升級(jí)和變革。大模型時(shí)代,數(shù)據(jù)、網(wǎng)絡(luò)、算力構(gòu)成了底層基礎(chǔ)設(shè)施的三要素,而 HCC 高性能計(jì)算集群、星脈高性能計(jì)算網(wǎng)絡(luò)以及向量數(shù)據(jù)庫(kù),就組成了騰訊云的「AI 超級(jí)底座」。
首先就是打造云上算力集群的問(wèn)題。今年 4 月,騰訊云正式推出了高性能計(jì)算集群產(chǎn)品 HCC。該集群采用騰訊云星星海自研服務(wù)器,搭載最新代次 GPU,服務(wù)器之間采用 3.2T 互聯(lián)帶寬,通過(guò)對(duì)單機(jī)算力、網(wǎng)絡(luò)架構(gòu)和存儲(chǔ)性能進(jìn)行協(xié)同優(yōu)化,提供高性能、高帶寬和低延遲的集群算力。
在非稀疏規(guī)格條件下,新一代集群?jiǎn)?GPU 卡支持輸出最高 495 TFlops(TF32)、989 TFlops (FP16/BF16)、1979 TFlops(FP8)的算力。
實(shí)測(cè)顯示,騰訊云新一代集群的算力性能較前代提升高達(dá) 3 倍。去年 10 月,騰訊完成了萬(wàn)億參數(shù)混元 NLP 大模型的訓(xùn)練,在同等數(shù)據(jù)集下,上一代騰訊云 HCC 集群將訓(xùn)練時(shí)間由 50 天縮短到了 11 天。如果是在基于新一代集群的情況下,訓(xùn)練時(shí)間將進(jìn)一步縮短至 4 天。
隨著集群規(guī)模擴(kuò)大,通信性能會(huì)直接影響訓(xùn)練效率。特別是參數(shù)達(dá)到千億、萬(wàn)億級(jí)別的 AI 大模型,需要大帶寬、高利用率、無(wú)損的網(wǎng)絡(luò)來(lái)幫助其高效地完成訓(xùn)練任務(wù)。
騰訊自研的星脈高性能計(jì)算網(wǎng)絡(luò)利用自研交換機(jī)構(gòu)建了超大規(guī)模網(wǎng)絡(luò)架構(gòu),具備業(yè)界最高的 3.2T 通信帶寬,能提升 40% 的 GPU 利用率,節(jié)省 30%~60% 的模型訓(xùn)練成本,為 AI 大模型帶來(lái) 10 倍通信性能提升?;隍v訊云新一代算力集群 HCC,可支持 10 萬(wàn)卡的超大計(jì)算規(guī)模。
實(shí)測(cè)結(jié)果顯示,搭載同樣的 GPU,最新的 3.2T 星脈網(wǎng)絡(luò)相較 1.6T 網(wǎng)絡(luò),能讓集群整體算力提升 20%。
此外,今年 7 月,騰訊云推出了向量數(shù)據(jù)庫(kù) ( Tencent Cloud VectorDB),這是國(guó)內(nèi)首個(gè)從接入層、計(jì)算層、到存儲(chǔ)層提供全生命周期 AI 化的向量數(shù)據(jù)庫(kù)。
隨著人工智能技術(shù)的快速發(fā)展,傳統(tǒng)的關(guān)系型數(shù)據(jù)庫(kù)在處理向量數(shù)據(jù)時(shí)存在一些瓶頸,而向量數(shù)據(jù)庫(kù)則能夠更好地滿(mǎn)足這些應(yīng)用的需求。騰訊云向量數(shù)據(jù)庫(kù)具備強(qiáng)大的性能和規(guī)模優(yōu)勢(shì):不僅支持高達(dá) 10 億級(jí)的向量檢索規(guī)模,并將延遲控制在毫秒級(jí),相比傳統(tǒng)的單機(jī)插件式數(shù)據(jù)庫(kù)檢索規(guī)模提升了 10 倍。同時(shí),騰訊云向量數(shù)據(jù)庫(kù)還具備百萬(wàn)級(jí)每秒查詢(xún)(QPS)的峰值能力。經(jīng)過(guò)騰訊內(nèi)部海量場(chǎng)景的實(shí)踐,數(shù)據(jù)接入 AI 的效率也比傳統(tǒng)方案提升 10 倍,運(yùn)行穩(wěn)定性高達(dá) 99.99%。
從前沿科技到真正的生產(chǎn)力
很多科技廠(chǎng)商都選擇從 MaaS(Model-as-a-Service)模式切入大模型之戰(zhàn),這也是騰訊云選擇的道路。在「AI 超級(jí)底座」之上,騰訊云搭建了行業(yè)大模型 MaaS 服務(wù),包括金融、政府、文旅、傳媒、教育等。基于這些基礎(chǔ)模型,騰訊云的客戶(hù)只要加入自己的場(chǎng)景數(shù)據(jù),就可以生成契合自身業(yè)務(wù)需要的專(zhuān)屬模型。
與其造出自己的大模型,對(duì)于很多廠(chǎng)商來(lái)說(shuō),不如構(gòu)建一套自上而下的大模型生態(tài)工具,助力行業(yè)用戶(hù)釋放大模型的生產(chǎn)力,加速產(chǎn)業(yè)落地。MaaS 可以幫助更多中小客戶(hù)更輕松地接入大模型,并在此基礎(chǔ)上發(fā)揮自身長(zhǎng)處,從實(shí)際需求出發(fā)高效利用大模型能力。
正如這場(chǎng)比賽,腦機(jī)接口是一門(mén)關(guān)于計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)的前沿技術(shù),研究成果很容易被限于實(shí)驗(yàn)室之內(nèi),但在上云之后,一些創(chuàng)意和靈感就能真正轉(zhuǎn)化為大規(guī)模的醫(yī)療、養(yǎng)老、助殘、康復(fù)等領(lǐng)域的產(chǎn)業(yè)應(yīng)用。
騰訊云的「AI 超級(jí)底座」所提供的大模型高性能計(jì)算集群、計(jì)算網(wǎng)絡(luò)以及向量數(shù)據(jù)庫(kù),都是技術(shù)轉(zhuǎn)化為生產(chǎn)力的基礎(chǔ)。
或許在不久的將來(lái),我們就能在騰訊云的服務(wù)中看到來(lái)自這場(chǎng)比賽的算法成果。腦機(jī)接口走進(jìn)普通人生活,還會(huì)遠(yuǎn)嗎?
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀(guān)點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。