【導(dǎo)讀】近期,面壁智能聯(lián)合來自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個(gè)基于交互式網(wǎng)頁搜索的問答開源模型WebCPM,這一創(chuàng)舉填補(bǔ)了國產(chǎn)大模型該領(lǐng)域的空白。面壁智能自研工具學(xué)習(xí)引擎BMTools也因此被成功實(shí)踐。
最近,一個(gè)被稱為「ChatGPT Plugins國產(chǎn)替代系統(tǒng)」的開源項(xiàng)目在GitHub上星標(biāo)猛增。
這個(gè)項(xiàng)目就是BMTools,面壁智能自研的大模型工具學(xué)習(xí)引擎。
項(xiàng)目地址:https://github.com/OpenBMB/BMTools
深耕前沿,快速嵌入大模型工具學(xué)習(xí)
首先,是最重要的問題,BMTools到底厲害在哪里?作為基于語言模型的開源可擴(kuò)展工具學(xué)習(xí)平臺(tái),面壁研發(fā)團(tuán)隊(duì)將各種各樣的工具調(diào)用流程都統(tǒng)一到了BMTools框架上,使整個(gè)工具調(diào)用流程標(biāo)準(zhǔn)化、自動(dòng)化。目前,BMTools支持的插件,涵蓋娛樂,學(xué)術(shù),生活等多方面,包括douban-film(豆瓣電影)、search(必應(yīng)搜索)、Klarna(購物)等。開發(fā)者可以通過BMTools,使用給定的模型(比如ChatGPT、GPT-4)調(diào)用多種多樣的工具接口,以實(shí)現(xiàn)特定功能。此外,BMTools工具包也已集成最近爆火的Auto-GPT與BabyAGI。那么,這種工具學(xué)習(xí)對大模型又有何作用?
盡管大模型在很多方面取得了顯著的成果,但在特定領(lǐng)域的任務(wù)上,仍然存在一定的局限性。這些任務(wù)往往需要專業(yè)化的工具或領(lǐng)域知識(shí)才能有效解決。因此,就像智能手機(jī)需要下載App才有更好的使用體驗(yàn),大模型需要具備調(diào)用各種專業(yè)化工具的能力,這樣才能為現(xiàn)實(shí)世界任務(wù)提供更為全面的支持。大模型新范式工具學(xué)習(xí)(Tool Learning)應(yīng)運(yùn)而生。這一范式的核心在于將專業(yè)工具與基礎(chǔ)模型的優(yōu)勢相融合,以在問題解決方面達(dá)到更高的準(zhǔn)確性、效率和自主性。大模型與外部工具的有機(jī)結(jié)合成功彌補(bǔ)了此前能力的諸多短板,工具學(xué)習(xí)極大地釋放了大模型的潛力。
論文地址:https://arxiv.org/abs/2304.083542023年3月23日,OpenAI宣布推出插件系統(tǒng)(Plugins),這個(gè)插件的能力就是我們所說的工具學(xué)習(xí)。在工具學(xué)習(xí)的加持下,Plugins能夠支持ChatGPT連接瀏覽器、數(shù)學(xué)計(jì)算等外部工具,能力大幅增強(qiáng)。ChatGPT Plugins的出現(xiàn)補(bǔ)充了ChatGPT最后的短板,使其可以支持連網(wǎng)、解決數(shù)學(xué)計(jì)算,被稱為OpenAI的「App Store」時(shí)刻。然而直到現(xiàn)在,它僅支持OpenAI Plus用戶,大多數(shù)開發(fā)者仍然無法使用。面壁為什么能在ChatGPT Plugins發(fā)布后僅十天就推出BMTools?面壁智能一直潛心研發(fā)大模型全流程高效計(jì)算工具,研發(fā)團(tuán)隊(duì)從2022年就開始持續(xù)開展工具學(xué)習(xí)新范式的研究,嘗試將現(xiàn)有語言模型與搜索引擎、知識(shí)庫等工具結(jié)合,取得了較好的實(shí)驗(yàn)效果。團(tuán)隊(duì)還在工具學(xué)習(xí)前沿研究領(lǐng)域進(jìn)行了卓有成效的探索。為滿足眾多開發(fā)者對OpenAI Plugins能力的熱切期盼,在前期積累的基礎(chǔ)上,團(tuán)隊(duì)快速將相關(guān)研究成果工具化,積累整理成工具包BMTools,將工具學(xué)習(xí)嵌入面壁智能大模型能力體系,正式加入OpenBMB大模型工具體系「全家桶」。工具學(xué)習(xí)也是面壁智能繼高效訓(xùn)練、微調(diào)、推理、壓縮套件后推出的又一大力作。BMTools工具包 :https://github.com/OpenBMB/BMTools引領(lǐng)破壁,首發(fā)聯(lián)網(wǎng)支持中文問答模型
近期,面壁智能聯(lián)合來自清華、人大、騰訊的研究人員共同發(fā)布了中文領(lǐng)域首個(gè)基于交互式網(wǎng)頁搜索的問答開源模型框架WebCPM,這一創(chuàng)舉填補(bǔ)了國產(chǎn)大模型該領(lǐng)域的空白。而WebCPM正是BMTools的成功實(shí)踐。目前,WebCPM相關(guān)工作已錄用于自然語言處理頂級會(huì)議ACL 2023。WebCPM論文鏈接:https://arxiv.org/abs/2305.06849WebCPM數(shù)據(jù)與代碼鏈接:https://github.com/thunlp/WebCPM可以說,自從ChatGPT爆火之后,國內(nèi)各家各派的大模型雨后春筍般涌現(xiàn),但大部分模型都沒有聯(lián)網(wǎng)。而沒有聯(lián)網(wǎng)的大模型無法獲取最新的信息,生成的內(nèi)容基于陳舊的數(shù)據(jù)集,存在一定的局限性。WebCPM的特點(diǎn)在于其信息檢索基于交互式網(wǎng)頁搜索,能夠像人類一樣與搜索引擎交互從而收集回答問題所需要的事實(shí)性知識(shí)并生成答案。換言之,大模型在聯(lián)網(wǎng)功能的加持下,回答問題的實(shí)時(shí)性和準(zhǔn)確性都得到了飛躍式增強(qiáng)。WebCPM模型框架WebCPM對標(biāo)的是WebGPT , WebGPT也正是微軟近期推出的New Bing背后的新一代搜索技術(shù)。同WebGPT一樣,WebCPM克服了傳統(tǒng)的LFQA( Long-form Question Answering)長文本開放問答范式的缺陷:依賴于非交互式的檢索方法,即僅使用原始問題作為查詢語句來檢索信息。在WebCPM框架下,模型能夠像人類一樣通過與搜索引擎實(shí)時(shí)交互來進(jìn)行網(wǎng)頁搜索而篩選高質(zhì)量信息。不僅如此,遇到復(fù)雜問題,模型也像人類一般將其分解成多個(gè)子問題并依次提問。而且,通過識(shí)別和瀏覽相關(guān)信息,模型還會(huì)逐漸完善對原問題的理解,并不斷查詢新問題來搜索更多樣的信息。
WebCPM搜索交互界面未來,面壁智能也將進(jìn)一步促進(jìn)該科研成果的應(yīng)用轉(zhuǎn)化,努力推進(jìn)WebCPM大模型在相應(yīng)領(lǐng)域落地生根。高屋建瓴,致力打造國產(chǎn)大模型系統(tǒng)
面壁智能始終努力引領(lǐng)大模型原始創(chuàng)新,致力于構(gòu)建智能時(shí)代大模型基礎(chǔ)設(shè)施和打造國產(chǎn)大模型系統(tǒng),以期最終實(shí)現(xiàn)「讓大模型飛入千家萬戶」。面壁智能的成果有目共睹,且獲得了業(yè)界肯定。知乎首席技術(shù)官李大海曾評價(jià)面壁智能:「面壁智能團(tuán)隊(duì)是國內(nèi)最早開展大規(guī)模語言模型研究的團(tuán)隊(duì)。公司儲(chǔ)備大模型研究和應(yīng)用的全棧技術(shù)能力,包括微調(diào)技術(shù)和加速技術(shù)等,研發(fā)能力處于行業(yè)領(lǐng)先地位?!怪醣硎?,相信面壁智能能成長為中國大模型領(lǐng)域基礎(chǔ)設(shè)施核心廠商,為中國大模型事業(yè)貢獻(xiàn)力量。
面壁智能全景圖依托工具平臺(tái)和大模型庫,公司推出ModelForce模力大模型系統(tǒng)和CPM企業(yè)級大模型。基于大模型的AI生產(chǎn)力平臺(tái)ModelForce內(nèi)置大模型訓(xùn)練、微調(diào)、壓縮、推理全流程高效計(jì)算工具體系。平臺(tái)基于大模型少樣本、零樣本通用能力,使用大模型標(biāo)準(zhǔn)化微調(diào)方式、打造零代碼微調(diào)客戶端,能夠大幅降低AI研發(fā)過程中的數(shù)據(jù)標(biāo)注成本、算力成本、人力成本。CPM大模型企業(yè)版針對開源版模型進(jìn)行了能力升級,具有多能力融合、增量微調(diào)靈活適配、多場景應(yīng)用等特點(diǎn)。基于CPM企業(yè)級大模型與ModelForce大模型系統(tǒng),面壁智能與知乎的合作訓(xùn)練了「知海圖AI」大模型。「知海圖AI」大模型應(yīng)用到了知乎熱榜,能夠快速進(jìn)行要素抽取、觀點(diǎn)梳理和內(nèi)容聚合,于4月23日在知乎發(fā)現(xiàn)大會(huì)上發(fā)布。不止于此。事實(shí)上,面壁智能站位高遠(yuǎn),成功打造了一個(gè)「三位一體」的大模型產(chǎn)學(xué)研生態(tài)格局,通過整合頂尖高校學(xué)術(shù)研究力量并持續(xù)打造運(yùn)營大模型開源社區(qū)OpenBMB,面壁智能搭建起業(yè)界需求、算法開源和產(chǎn)業(yè)落地三者的閉環(huán)通道,竭力促進(jìn)國產(chǎn)大模型領(lǐng)域的前沿研究、應(yīng)用研發(fā)和產(chǎn)業(yè)發(fā)展。為建設(shè)國內(nèi)大模型開源生態(tài)貢獻(xiàn)力量,發(fā)布了包括OpenPrompt、OpenDelta、BMInf、BMcook、BMTrain、BMTools等一系列大模型全流程開源工具包,并且在知乎、B站等平臺(tái)推出了大模型全民公開課。
作為在高校中一騎絕塵的研究力量,成立于上世紀(jì)70年代,是國內(nèi)開展NLP研究最早、深具影響力的科研單位,多名知名學(xué)者和科學(xué)家坐鎮(zhèn),在語言大模型領(lǐng)域的研究工作十分突出。
致力于大模型在人工智能典型場景與領(lǐng)域的應(yīng)用與落地,CPM大模型是面壁團(tuán)隊(duì)根據(jù)多年的大模型訓(xùn)練經(jīng)驗(yàn)自研的預(yù)訓(xùn)練語言大模型。公司目前已完成數(shù)千萬元天使輪融資,并多家知名機(jī)構(gòu)與公司達(dá)成戰(zhàn)略合作。
在努力打造國產(chǎn)大模型系統(tǒng)的征程中,面壁智能的愿景始終是讓大模型落地賦能更多產(chǎn)業(yè)、惠及更多的企業(yè)和個(gè)人。星火已燎原,我們期待大模型在更多領(lǐng)域釋放潛能,展現(xiàn)令人驚喜的應(yīng)用價(jià)值。
來源:新智元