百度：不做大模型王者，要做AI世界的基石

作者：時間：2024-04-18 來源：頭條新聞

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

討論國產(chǎn)AI大模型，百度是繞不過的話題。作為中國AI產(chǎn)業(yè)的扛旗者，百度在AI技術(shù)上擁有足夠高的話語權(quán)，其推出的文心大模型被視作是最有機會追趕GPT的國產(chǎn)基礎(chǔ)大模型。不過從最新的發(fā)布來看，百度在AI大模型這件事上，似乎并不想過度地卷參數(shù)，而是將重心放在了落地上，給人們提供開發(fā)AI應用的工具，則是百度推動AI大模型落地的關(guān)鍵。

本文引用地址：http://m.butianyuan.cn/article/202404/457774.htm

4月16日，Create 2024 百度AI開發(fā)者大會在深圳舉行。從現(xiàn)場人流量可以看出，AI依然是科技圈頂流?，F(xiàn)場嘉賓中，有企業(yè)高管，有技術(shù)人員，有銷售人員，有高校學生……所有人都在學習AI大模型，都在尋覓AI大模型的機會。

自去年以來，諸多熱門AI大模型技術(shù)持續(xù)占據(jù)媒體頭條，對普通人來說卻遙不可及。當所有人都在仰望神壇上的AI大模型技術(shù)時，百度決定要讓AI技術(shù)走下神壇，這正是李彥宏的演講主題《人人都是開發(fā)者》所表達的愿景。

李彥宏沒有過多地介紹文心大模型的技術(shù)優(yōu)勢，而是將主題圍繞開發(fā)者，將更多時間給到了“工具”。

為什么要讓工具成為這屆開發(fā)者大會的主角？用李彥宏的話說是："大語言模型本身并不直接創(chuàng)造價值，基于大模型開發(fā)出來的AI原生應用才能滿足真實的市場需求?！备鶕?jù)過去一年的實踐，踩了無數(shù)的坑，交了高昂的學費后，百度積累了基于大模型開發(fā)AI原生應用的思路，并帶來三大AI開發(fā)神器：智能體開發(fā)工具AgentBuilder、AI原生應用開發(fā)工具AppBuilder、各種尺寸的模型定制工具ModelBuilder。

三大AI開發(fā)神器，讓“人人都是開發(fā)者”不是夢

在2023年10月，百度發(fā)布了文心大模型4.0版本。為了推動AI大模型落地，李彥宏提出了AI原生應用概念，他認為大模型技術(shù)和AI原生應用是一體兩面、共生共存：前者的理解、生成、邏輯、記憶四大能力的進步是AI原生應用不可或缺的生存土壤；反過來，如果沒有AI原生應用在各個場景的落地、普及，大模型技術(shù)也就失去了現(xiàn)實意義。

簡單地說，AI原生應用之于大模型技術(shù)，如同App之于移動互聯(lián)網(wǎng)。所有應用都值得用AI重做一遍，在AI大模型上也將長出截然不同的新應用。

然而，對于絕大多數(shù)企業(yè)與個體來說，開發(fā)App本身就是高門檻的事，基于大模型開發(fā)AI原生應用，門檻更是指數(shù)級上升：大模型技術(shù)新，人才本就奇缺，大模型技術(shù)還高度復雜、且日新月異，開發(fā)難度更高，很多學計算機類專業(yè)的程序員在未經(jīng)專業(yè)培訓時都難以掌握。

提供專門的AI原生應用開發(fā)工具就成為大模型落地的燃眉之急。2023年10月提出AI原生應用概念時，百度就意識到這一問題，且提出了要讓AI原生應用開發(fā)更敏捷的目標。隨著代碼大模型技術(shù)本身的快速升級，百度如今推出了可以讓人人成為開發(fā)者的系列AI開發(fā)工具。

1、AgentBuilder是人人可用的智能體開發(fā)工具，用戶不需掌握任何編程技術(shù)，即可用“對話式交互”的模式，用自然語言輸入指令創(chuàng)造AI原生應用。目前已有新加坡旅游局、啟德教育和索菲亞等上萬家企業(yè)、5萬多名開發(fā)者基于AgentBuilder開發(fā)智能體，最快5分鐘即可創(chuàng)建完成。

2、AppBuilder是目前最好用的AI原生應用開發(fā)工具。百度已提前將開發(fā)AI原生應用所需的組件和框架封裝在AppBuilder中，開發(fā)者最快三步就可以開發(fā)一個AI原生應用，且依然是自然語言編程。李彥宏在現(xiàn)場基于AppBuilder進行AI原生應用開發(fā)實戰(zhàn)，演示了“游樂場排隊助手”、華北電力大學“華電AI助理”和百度文庫智能漫畫生成三個AI原生應用的創(chuàng)建過程。

3、ModelBuilder是面向?qū)I(yè)開發(fā)者的模型定制工具，其預置了最全面最豐富的大模型（高達77個），包括旗艦基礎(chǔ)大模型ERNIE3.5、ERNIE4.0，百度旗下的多款輕量級大模型以及垂直模型，以及第三方主流模型。ModelBuilder可以根據(jù)開發(fā)者的需求定制任意尺寸的模型，并根據(jù)細分場景對模型進一步精調(diào)，達到更好的效果，李彥宏在現(xiàn)場展示了基于ModelBuilder開發(fā)教育行業(yè)的“作文批改助手”，不僅可以擁有更專業(yè)的老師點評思維、做到格式遵循，而且相比未精調(diào)模型，精調(diào)后的模型打分與真實的老師點評分數(shù)更為接近。

AgentBuilder、AppBuilder、ModelBuilder三大AI開發(fā)神器的底層，則是強大的代碼大模型技術(shù)。據(jù)李彥宏介紹，文心大模型快速進化，其中“代碼”是重要升級領(lǐng)域，其在代碼生成、代碼解釋、代碼優(yōu)化等通用能力方面實現(xiàn)了進一步的顯著提升，達到國際領(lǐng)先水平。

在一年多前，百度就基于文心大模型推出智能代碼助手Comate，支持100多種語言和主流IDE平臺，可推薦代碼、生成代碼注釋、進行代碼續(xù)寫、查找代碼缺陷、給出優(yōu)化方案，還可深度解讀代碼庫、關(guān)聯(lián)私域知識生成新代碼，目前已被百度自身，以及喜馬拉雅、三菱電梯、軟通動力等上萬家企業(yè)應用，生成代碼采納率達46%，百度每天新增代碼中已有27%由其生成。

在開發(fā)者大會上，李彥宏還發(fā)布了文心大模型4.0的工具版，讓開發(fā)者可在工具版上使用代碼解釋器功能，通過自然語言交互實現(xiàn)對復雜數(shù)據(jù)和文件的處理與分析，還可以生成圖表或文件，能夠快速洞察數(shù)據(jù)中的特點、分析變化趨勢。

隨著大模型在代碼領(lǐng)域的持續(xù)進階，以及AgentBuilder、AppBuilder這樣的低門檻甚至零門檻開發(fā)工具的出現(xiàn)，自然語言編程不再是夢想，每個人都可以使用自然語言來表達自己的需求、構(gòu)建需要的程序，專業(yè)程序員則可以靠ModelBuilder專業(yè)工具大幅提高效率，減少重復工作，聚焦在業(yè)務(wù)與創(chuàng)造本身。

正如李彥宏所說：“AI正在掀起一場創(chuàng)造力革命，未來開發(fā)應用就像拍個短視頻一樣簡單，人人都是開發(fā)者，人人都是創(chuàng)造者?！彼踔翗酚^地表示：“你只要會說話，就可以成為一名開發(fā)者，用自己的創(chuàng)造力改變世界?！?/p>

有了計算機就有了編程的概念。編程語言一直在進化，從最初的二進制，到后來的機器代碼，到匯編語言，再到高級語言。這些年，高級語言也在不斷革新。而編程語言不斷進階的目的，就是為了讓編程難度更低、效率更高。按照這樣的路線來看，人人都掌握的自然語言將是“編程語言”進化的終極形態(tài)。

不只是百度意識到這樣的趨勢，此前，英偉達CEO黃仁勛也曾表示，AI可以讓每個人都能編程：“編程語言可以普及成為人類的語言，現(xiàn)在世界上每個人都是程序員。這就是人工智能的奇跡?！?/p>

英雄所見略同，百度發(fā)布三大AI開發(fā)神器，讓“人人都是開發(fā)者”變?yōu)楝F(xiàn)實，讓每個人都可以更好地掌控、利用和挖掘AI紅利，創(chuàng)造更好的世界。

不卷參數(shù)卷工具，百度成為AI普及的推手

在這屆開發(fā)者大會上，李彥宏也有分享百度文心大模型的最新進展。截至目前，文心大模型已經(jīng)成為了中國最領(lǐng)先、應用最廣泛的AI基礎(chǔ)模型?；谖男拇竽Ｐ偷腁I原生爆款應用文心一言在發(fā)布一年后，用戶數(shù)已突破2億，API日均調(diào)用量也突破2億，服務(wù)客戶數(shù)達到了8.5萬，利用千帆平臺開發(fā)的AI原生應用數(shù)超過了19萬。

絲毫不難發(fā)現(xiàn)：百度絲毫沒有要卷大模型參數(shù)“堆料”的意思，它分享的核心數(shù)據(jù)均關(guān)系到大模型的應用進展，它正在進行的一切努力也圍繞著大模型落地進行。

首先是提供更全、更好、更智能的應用開發(fā)工具。

在“百模大戰(zhàn)”如火如荼且許多大模型走向開源后，當下的市場不再需要更多的基礎(chǔ)大模型。市場真正緊缺的，一個是具有世界級競爭力的頂尖大模型，這是文心大模型努力的方向；另一個則是基于AI大模型的殺手锏應用。只有形成類似于AppStore這樣的繁榮的原生AI應用生態(tài)，AI大模型技術(shù)才算真正實現(xiàn)了爆發(fā)。

然而，AI原生應用開發(fā)徹底改變了軟件開發(fā)的思路，不再是面向過程也不再是面向?qū)ο?，而是“面向智能”，開發(fā)者需要調(diào)用、組合模型的能力來創(chuàng)造應用，傳統(tǒng)的開發(fā)工具體系很難適應這樣的新型開發(fā)模式。因此，不論是從0到1的新建，抑或是對成熟應用的改造，AI原生應用的構(gòu)建都必須要有更適合的專業(yè)AI大模型應用開發(fā)工具，就像網(wǎng)站、軟件、App開發(fā)有各自的專門工具體系一樣。

于是我們發(fā)現(xiàn)，“工具”成了百度這屆AI開發(fā)者大會的最高頻的關(guān)鍵詞。

其次是不斷降低大模型成本，讓開發(fā)者愿意用、用得起、用得多。

除了降低AI原生應用開發(fā)門檻外，百度也在努力降低大模型的計算成本。從“囤卡現(xiàn)象”，到“電力短缺”，諸多與大模型相關(guān)的新聞均表明AI大模型應用成本高昂務(wù)必。然而，技術(shù)普及的關(guān)鍵就在于成本降低。從飛機到5G網(wǎng)絡(luò)到電動車再到智能駕駛，每一個技術(shù)走向爆發(fā)都會經(jīng)歷一個進化曲線：隨著技術(shù)不斷發(fā)展，產(chǎn)品化與商用化加速促進成本降低，到達一個奇點時，成本出現(xiàn)質(zhì)變，走向大規(guī)模普及。

推動大模型經(jīng)濟成本降低，百度雙管齊下：

一方面是技術(shù)降本。在芯片、框架、模型、應用這四層架構(gòu)上有著全棧的布局，具備端到端這一模式的先天優(yōu)勢，基于此可不斷地將模型成本打下來，讓更多人都可以高效、低價地用大模型來做AI應用，且不斷提高文心大模型和文心一言的效率。

另一方面是規(guī)模降本。在GPT出圈以前的2019年，百度就已布局大模型技術(shù)并推動落地。大模型用得越多越智能，也越便宜。隨著百度大模型技術(shù)的規(guī)?；涞?，技術(shù)持續(xù)進化的同時成本不斷降低，飛輪效應已然形成。據(jù)李彥宏介紹，“相比一年前，文心大模型的算法訓練效率提升到了原來的5.1倍，周均訓練有效率達到98.8%，推理性能提升了105倍，推理的成本降到了原來的1%。也就是說，客戶原來一天調(diào)用1萬次，同樣成本現(xiàn)在一天可以調(diào)用100萬次?！?/p>

最后、建立AI大模型生態(tài)，鼓勵AI原生應用創(chuàng)新。

在這屆開發(fā)者大會上，李彥宏宣布，第二屆“文心杯”創(chuàng)業(yè)大賽正式啟動，這是一個鼓勵開發(fā)者基于大模型開發(fā)AI原生應用的大賽。2023年5月百度首次啟動“文心杯”創(chuàng)業(yè)大賽，一共給15支優(yōu)勝團隊提供了數(shù)千萬元的資金支持。今年百度“文心杯”創(chuàng)業(yè)大賽力度更大，首次設(shè)立‘特別大獎’，特別優(yōu)秀的項目，將有機會獲得5000萬人民幣的現(xiàn)金和資源支持。

不論是WEB時代的網(wǎng)站，抑或是移動時代的App，任何應用生態(tài)的繁榮都來自于開發(fā)者的創(chuàng)新。在AI原生應用生態(tài)中，百度一方面提供更強的基礎(chǔ)大模型技術(shù)基石，和更成熟的配套開發(fā)工具支持，另一方面則營造良好的創(chuàng)新生態(tài)，降低開發(fā)門檻，吸聚開發(fā)者，發(fā)揮中國創(chuàng)業(yè)者善于做應用落地的優(yōu)勢，推動大模型上更早長出更多成功的AI原生應用。

李彥宏多年來一直扮演著“AI布道師”角色，自深度學習時代起就一直為AI產(chǎn)業(yè)化搖旗吶喊，致力于讓全社會理解AI、重視AI、用好AI。在演講的最后，李彥宏動情地表示：“今天的中國，有10億互聯(lián)網(wǎng)用戶，有強大的基礎(chǔ)大模型，有足夠多的AI應用場景，有全球最完備的產(chǎn)業(yè)體系，國家也在大力鼓勵和支持‘人工智能+’行動，每一個人，每一家企業(yè)，只需要充分利用這些工具，就可以釋放無限的創(chuàng)造力和生產(chǎn)力?！?/p>

百度AI的落地范式，行業(yè)的游戲規(guī)則

2023年，大模型就已成為科技產(chǎn)業(yè)的頭等大事，中國興起了如火如荼的“百模大戰(zhàn)”。然而迄今為止，真正讓用戶有感知的AI大模型應用仍是鳳毛麟角。雖然時不時會有類似于Sora、Suno這樣的AI大模型爆款應用或者技術(shù)刷屏，但它們大都僅限于“娛樂”，且往往會“曇花一現(xiàn)”，因為無法真正解決用戶生活中面臨的問題，或者沒有給企業(yè)帶來任何實質(zhì)性價值。

由此可見，“落地”依然是大模型以及AI發(fā)展的重中之重。行業(yè)亟待殺手锏應用的出現(xiàn)，亟待能跑通商業(yè)模式的大模型應用，亟待更繁榮的AI應用生態(tài)。在這樣的關(guān)鍵窗口期，百度旗幟鮮明展現(xiàn)出的AI觀，正是行業(yè)需要的AI觀。

當行業(yè)在卷開源“重復造輪子”，或者圍繞“比大更大”的參數(shù)進行軍備競賽時，百度公然“唱反調(diào)”，只做有價值的大模型，號召開發(fā)者使用更合適（而不是更大）的模型，讓行業(yè)回到理性發(fā)展的軌道。

在開發(fā)者大會上，李彥宏甚至直言，“開源模型會越來越落后?！痹诎俣瓤磥?，未來絕大多數(shù)AI原生應用都是MoE的，即大小模型的混用，不依賴一個模型來解決所有問題；小模型推理成本低，響應速度快，在一些特定場景中，經(jīng)過精調(diào)后的小模型，它的使用效果可以比美大模型?；诖?，開發(fā)者可在強大的基礎(chǔ)模型文心4.0之上，根據(jù)需要，兼顧效果、相應速度，推理成本等各種考慮，剪裁出適合各種場景的更小尺寸模型，并且支持精調(diào)和post pretrain。這樣通過降維剪裁出來的模型，比直接用開源模型調(diào)出來的模型，同等尺寸下，效果明顯更好；同等效果下，成本明顯更低?！八蚤_源模型會越來越落后。”

在大模型基座研發(fā)上，百度在確保文心大模型自主可控、技術(shù)領(lǐng)先的同時，強化中文等獨特優(yōu)勢。同時，圍繞多模態(tài)大模型等垂直場景構(gòu)筑長板優(yōu)勢，李彥宏在開發(fā)者大會上表示：“視覺大模型最大的應用場景是自動駕駛。百度在這個方向上是最好的，是自動駕駛的全球領(lǐng)導者，我們不只訓練AI如何生成視頻，更訓練AI理解真實世界發(fā)生的事情并預測未來?！边@一點馬斯克也曾發(fā)出同樣的感慨，在Sora發(fā)布后他在X上直言：特斯拉的視頻生成技術(shù)是世界上最好的，甚至超過OpenAI的Sora，原因在于特斯拉擁有強大的自動駕駛技術(shù)。

更重要的是，百度將“落地”視作發(fā)展大模型AI的頭等大事。技術(shù)只有落地才有價值，大模型只有轉(zhuǎn)化成AI應用才能為人類所用。不論是提出AI原生應用的暢想，抑或是推出成套的AI開發(fā)神器，都表明百度在力所能及地推動AI大模型落地。

作為技術(shù)領(lǐng)先者的百度，已然成為AI大模型落地的關(guān)鍵推手，其AI觀已成為行業(yè)游戲規(guī)則，將讓AI大模型健康發(fā)展，讓AI大模型的普惠時刻更早來臨。

大模型落地不需要“大炮打蚊子”。“適合的才是最好的?！卑俣纫詣?wù)實的態(tài)度，構(gòu)建基礎(chǔ)大模型和垂直大模型技術(shù)基座，同時提供工具鏈支持，讓每個人都有機會挖掘到AI紅利。

毫無疑問，百度走在正確的道路上。