堅(jiān)持做行業(yè)大模型，竹間智能給大模型造了一座「模型工廠」（2）

發(fā)布人：機(jī)器之心時間：2023-07-03 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

總之，Model factory、Benchmark System 加上 Chat Search，一個大模型驅(qū)動的語義搜索引擎，三大要素緊密聯(lián)動，使 EmotiBrain 可敏捷應(yīng)用于復(fù)雜及多變的場景中，并給予強(qiáng)大靈活的支持。

「EmotiBrain 可以在幾天甚至幾個小時內(nèi)幫你選出最適合的大模型，通常需要一個模型工程師花好幾個月才能做到，甚至因缺少人才或 know-how 都無法完成可用的模型，白白浪費(fèi)的資源?！购喨寿t說。

另外，EmotiBrain 還有一個非常好用的 GPU 資源調(diào)度功能，自動幫你調(diào)度云資源或本地 GPU 資源。這樣，一般不懂IT業(yè)務(wù)的人員也可以用這個微調(diào)平臺來訓(xùn)練自己的模型，「他只要需要知道數(shù)據(jù)從哪來的?！?nbsp;

三、如何可控？四步應(yīng)對模型幻覺

可定制化實(shí)現(xiàn)后，還有一個問題。許多創(chuàng)始人對在他們的產(chǎn)品和工作流程中實(shí)施大模型持謹(jǐn)慎態(tài)度，因?yàn)檫@些模型有時就像小孩子——會編造事情，對幻想與現(xiàn)實(shí)沒有牢固的把握。有媒體報(bào)道，美國律師使用 ChatGPT 提交法庭簡報(bào)，結(jié)果引用的6個案例都是 ChatGPT 編造的虛假案例。

「產(chǎn)生幻覺，其實(shí)是生成式 AI 的一個特點(diǎn)?！购喨寿t認(rèn)為，創(chuàng)造力是知識生成的一個主要來源，如果百分百避免幻覺，模型也會失去創(chuàng)造力。不過，EmotiBrain 也有辦法幫助企業(yè)更好控制模型的輸出。

例如，在模型推理階段，用戶可以根據(jù)不同業(yè)務(wù)需求，調(diào)整「temperature」的數(shù)值，低溫度可以生成更加專注、保守和一致的回答。這種方式在營銷人員需要準(zhǔn)確、精確的答案或者遵循特定格式或品牌指南的信息時非常有用。

中溫度的話，能夠在創(chuàng)造力和一致性之間取得平衡。這種設(shè)置非常適用于一般內(nèi)容生成，因?yàn)樾枰獪?zhǔn)確性和創(chuàng)新的結(jié)合。高溫度可以生成更具創(chuàng)意、多樣化和出人意料的輸出。營銷人員可能會在頭腦風(fēng)暴創(chuàng)新的活動想法、制作引人入勝的社交媒體內(nèi)容或?qū)で髮δ硞€主題的新鮮視角時更喜歡使用這種設(shè)置。

除此之外，模型可控能不能做到100%還取決于微調(diào)過程。

就企業(yè)私域問答部分來說，完全可以做到可控。企業(yè)可以花大量精力做好知識準(zhǔn)備、知識清洗和審核。訓(xùn)練后，還可以用人類對齊（alignment ）的方式控制輸出質(zhì)量。

比如，你可以給輸出的答案做標(biāo)注，告訴模型哪個是對的、哪個是錯的，用基于人類反饋的強(qiáng)化學(xué)習(xí)的方法（RLHF）進(jìn)行再訓(xùn)練，模型就知道對與錯，自動減少胡言亂語的回答，但是RLHF要做得好，對使用數(shù)據(jù)與標(biāo)準(zhǔn)數(shù)量和質(zhì)量就有要求。

值得一提的是， EmotiBrain 還提供審核機(jī)制——「用大模型去做 reflection ，把 reflection 放到大模型里」，讓大模型擁有自我檢視的能力。

「這個咖啡很難喝」，在講出這句話之前，人們會先問自己這句話對嗎？是不是符合商業(yè)規(guī)范或道德標(biāo)準(zhǔn)？有沒有人身攻擊？有沒有牽扯到政治？

「所有這些環(huán)節(jié)，一個前面的大模型反思模型、加上基于人類反饋的強(qiáng)化學(xué)習(xí)、私域數(shù)據(jù)的掌控，還有 temperature 也可以調(diào)。我們都會提供工具和評測去幫助他們做好這些控制?！购喨寿t總結(jié)道。

四、KKBot 的想象力

除了 EmotiBrain，安裝了這臺發(fā)動機(jī)四款「車型」中，最值得關(guān)注、也最具想象力的是 KKBot ，你可以將它視為國內(nèi)版本的 Office Copilot，可以存在任何地方。

它可以是一個瀏覽器插件，根據(jù)你瀏覽網(wǎng)頁的內(nèi)容，答問題、做總結(jié)，任何 web application，KKBot 都是 Copilot?！窩hrome 能用，我們現(xiàn)在準(zhǔn)備適配 IE 瀏覽器?！购喨寿t告訴我們。

它還會出現(xiàn)在常用企業(yè)軟件里（例如網(wǎng)頁版的辦公軟件、竹間智能的產(chǎn)品），根據(jù)你的 query 自動生成想要的總結(jié)、圖片、統(tǒng)計(jì)表格、數(shù)據(jù)分析等。在他看來，「傳統(tǒng)的 BI 可能會被大模型顛覆掉?！?nbsp;

它甚至可以在企業(yè) DIY 大模型過程中，充當(dāng)助手。如果企業(yè)將自己的私域數(shù)據(jù)放到 Knowledge Factory ，那么，KK bot 可以在 Knowledge Factory 的文檔與知識庫里，找出大模型生成的一些令人生疑的回答的來源。如果找不到某句回答出處，大概率是模型在亂講。

最有意思的是在 KKBot 加持下，公司最暢銷的Bot Factory 脫胎換骨，升級到 Plus。

竹間智能早在 2017 年就推出了 Bot Factory，企業(yè)客戶可以在這個工廠里做各種機(jī)器人——智能客服、對話機(jī)器人、問診機(jī)器人、故障排除機(jī)器人、專家機(jī)器人等。有些企業(yè)甚至用 Bot Factory 在企業(yè)內(nèi)部做了 1000 多個機(jī)器人。

現(xiàn)在，這些經(jīng)過行業(yè)驗(yàn)證和打磨的產(chǎn)品又成為竹間智能部署在客戶側(cè)的「尖兵」，也是接入底層大模型能力的關(guān)鍵入口。如果可以幫助企業(yè)輕松定制自己的模型并嵌入到這些入口，無需帶著新品教育市場，竹間智能就能將新的底層能力出售出去。

以前我們用小模型去訓(xùn)練可能需要花兩天的時間?，F(xiàn)在，機(jī)器人的問答跟知識全部由大模型生成，只要兩個小時，運(yùn)營成本降低了90%以上。簡仁賢解釋道。

KKBot 可以幫你生成知識，幫你對齊知識。比如，你給它輸入《保險法》，輸入完以后，它自動從《保險法》里抽出來所有的知識跟所有的問答，抽出來之后，自動訓(xùn)練 Bot Factory+ 的對話機(jī)器人，兩個小時可以回答上千個問題，95% 以上準(zhǔn)確率。

整個過程都是自動的，無需人為干預(yù)。跑完以后，再由人工測試。如果對輸出結(jié)果滿意，就能發(fā)布上線。

KKBot 作為 Copilot，還有一個很大的優(yōu)點(diǎn)。簡仁賢強(qiáng)調(diào)說，「它不是一個模型的Copilot，而是多個不同模型的 Copilot，可以跟所有模型去兼容，當(dāng)企業(yè)不同部門或項(xiàng)目組有多個模型在運(yùn)行時，KKBot 可以選擇不同模型來回答，完全不受單一模型限制?！?nbsp;

比如，可以接竹間大模型魔力寫作與 ChatLLM，華為盤古大模型的 API，海外用戶可以去接 GPT-4 或 GPT3.5 Turbo的 API，甚至包括企業(yè)自己訓(xùn)練出來放到 EmotiBrain 里的大模型。

「切換不同的大模型，展現(xiàn)出來的能力也不一樣。」

五、「租」得起：99萬包年

竹間智能的目標(biāo)是將人工智能平民化，讓所有的企業(yè)都有自己的大模型，都能負(fù)擔(dān)得起的大模型。「工廠（factory）」就是實(shí)現(xiàn)這一目標(biāo)的技術(shù)手段。

現(xiàn)在，從「工廠（factory）租金」來看，根據(jù)所需GPU的數(shù)量不同，「1+4」PaaS 年訂閱服務(wù)的費(fèi)用也有兩個檔次。

如果僅需 1-8 個GPU，一年訂閱價格 99 萬。超過 8 個 GPU，一年的套餐價格 149 萬。具體情況，依據(jù)不同行業(yè)、不同企業(yè)部門要求不同。

例如，訓(xùn)練一個比較復(fù)雜的模型，假設(shè) 330 億參數(shù)，用一塊 GPU 可能需要 1-5 天。很多時候，在預(yù)算有限的情況下，99 萬的套餐也就夠用了。當(dāng)然，如果預(yù)算比較富裕，企業(yè)也希望數(shù)小時就能訓(xùn)練好，8 個 GPU 可能不夠用，可以升級到 149 萬元的套餐。

「相比花 2000 萬買個行業(yè)大模型，還冒著走彎路的風(fēng)險，我們的產(chǎn)品用起來比較安心」，簡仁賢認(rèn)為，「你只用花 99 萬，就可以定制出適合你的模型，而且沒有限制模型數(shù)量，并可以立刻在現(xiàn)實(shí)應(yīng)用中看到它的價值，也不受云計(jì)算廠商的限制，不用綁定任何云計(jì)算資源?！?nbsp;

這些工具都是免費(fèi)升級，而且做出來的模型都屬于客戶，「我們不 own 這個模型，我們也不賣模型，我們只是把這個 PaaS 租給你用，讓人去定制模型。」他補(bǔ)充說，「也就是說，我租給你的是一個模型工廠。」

其實(shí)，OpenAI 這樣的公司只是給我們指明了一個方向。開源社區(qū)會根據(jù)這個方向做出更創(chuàng)新的東西，進(jìn)而成為企業(yè)落地大模型的主流。

簡仁賢預(yù)測，未來 6-12 個月，開源社區(qū)也會出現(xiàn)更多新的前沿訓(xùn)練和微調(diào)技術(shù)，不斷降低大模型對內(nèi)存、GPU 依賴，降低微調(diào)和訓(xùn)練成本，不斷提升訓(xùn)練速度。更新的模型框架也會出現(xiàn)，更多的具備通用能力的指令集也會問世，更多的不同語言的訓(xùn)練集也會在各國地區(qū)的努力下開源出來，全球范圍內(nèi)的大模型應(yīng)用會更加廣泛，進(jìn)而加速 Generative AI 與 LLM 技術(shù)的快速迭代。

這個大模型就是每個企業(yè)應(yīng)用的「腦」。未來，每隔一段時間，與「腦」有關(guān)的技術(shù)都會取得重要進(jìn)展，比如更好的模型、訓(xùn)練方式、更高質(zhì)量的數(shù)據(jù)。

這個時候，大模型的管理和迭代就顯得更加重要。他說，有了工廠流水線，換「腦」就變得很容易。

*博客內(nèi)容為網(wǎng)友個人發(fā)布，僅代表博主個人觀點(diǎn)，如有侵權(quán)請聯(lián)系工作人員刪除。

博客專欄

堅(jiān)持做行業(yè)大模型，竹間智能給大模型造了一座「模型工廠」（2）

相關(guān)推薦

技術(shù)專區(qū)