博客專欄

EEPW首頁 > 博客 > 李彥宏10年花了1000多億!500萬開發(fā)者撐起中國最大深度學習框架

李彥宏10年花了1000多億!500萬開發(fā)者撐起中國最大深度學習框架

發(fā)布人:傳感器技術 時間:2023-01-11 來源:工程師 發(fā)布文章
【導讀】一年一度的百度Create大會又來了,還是一如既往地酷炫、硬核!


當你仰望星空時,你在想些什么?

有執(zhí)著的發(fā)問,就會有不曾想象的回音。


從方寸之間到寰宇之外,創(chuàng)造新宇宙的人,相信永遠看不到天花板。


堅定的人,不會因為到達而停下,他們用創(chuàng)造的腳步丈量未知。


百度CREATE 2022大會,為我們展示了人類設計師和AIGC共同創(chuàng)意制作的繪畫。

而就像這些繪畫所描述的場景,百度,也不曾停下創(chuàng)新的腳步。

在大會開始,李彥宏就提出了一個令人深思的觀點:第四次科技革命的標志,就是深度學習算法。與深度學習相關的重大創(chuàng)新,會像汽車、互聯(lián)網(wǎng)一樣,對我們的社會產(chǎn)生重大的影響。

圖片

真正的實踐中,沒有導航地圖,只有指南針。而百度,也是摸準大致方向后,基于實踐一步步迭代,才跑出了有價值的創(chuàng)新。

在大會上,李彥宏展示了這樣一幅畫。這幅畫是他以「危機和希望」為關鍵詞,在百度AI作畫平臺一格上生成的。


這幅畫,很好地代表了人工智能面臨的現(xiàn)狀——經(jīng)歷起起落落,但充滿希望。

是的,李彥宏依然堅持去年的觀點——創(chuàng)造者們將迎來屬于人工智能的黃金十年。

AIGC元年,來了

2022,AIGC全面爆發(fā)。

DALL·E2讓文本生成圖片火爆一整年,隨后的Stable Diffussion、Midjourney,更是啟發(fā)了無數(shù)人的藝術靈感,甚至讓不少畫手感到震驚。

而DALL·E2和谷歌發(fā)布的Imagen的模型,也吸引了許多AI學者參與研究。

ChatGPT雖然到了年末才壓軸出場,但「強化學習」賦予它的魔力,讓它在全民狂歡中再次掀起AIGC的風暴。

圖片

其實,在2022年初,百度研究院早已預測到了AIGC在這一年的火爆。

超大規(guī)模預訓練模型呈現(xiàn)知識增強、跨模態(tài)統(tǒng)一建模、多學習方式共同演進的趨勢,并逐漸實用化。


例如AIGC (AI generated content,人工智能創(chuàng)造內(nèi)容),借助大模型的跨模態(tài)綜合技術能力,可以激發(fā)創(chuàng)意,提升內(nèi)容多樣性,降低制作成本,將會實現(xiàn)大規(guī)模應用。

而且,這已經(jīng)不是百度研究院第一次做出神預測了。2020年,它預測的NLP模型在GPT-3上得到應驗,而在2021年,它押中的數(shù)字人全面大爆。

而這次,百度對于AIGC領域的趨勢,可謂是胸有成竹。

三個天才創(chuàng)作者,一鍵圓你導演夢

在Create 2022大會上,百度幾乎將AIGC深入應用到了每一個環(huán)節(jié)。歌曲、場景、演講腦圖的創(chuàng)作,這些環(huán)節(jié)中,全都有AI的參與。

???

而李彥宏以「危機和希望」為主題生成的繪畫,背后就是文心知識增強跨模態(tài)大模型一格,它就是接下來要出場的三位天才創(chuàng)作者的其中一位。

這次Create大會上,百度技術委員會主席吳華為我們介紹了三位能力超群的天才創(chuàng)作者。

它們分別是天才編劇——文心ERNIE3.0Zeus,天才插畫師——文心ERNIE-ViLG 2.0,剪輯和動畫大師——VIMER-TCIR。

圖片

有了這三位天才創(chuàng)作者,再配上自己設計的虛擬人演員,你也可以當上導演,拍出自己的影視大作了!

文心ERNIE 3.0 Zeus語言大模型,陪你聊到天荒地老!

作為ERNIE 3.0系列模型的最新升級,ERNIE 3.0 Zeus除了對無標注數(shù)據(jù)和知識圖譜的學習之外,還通過持續(xù)學習對百余種不同形式的任務數(shù)據(jù)實現(xiàn)了全面掌握。

在對通用知識和專門知識「雙管齊下」后,模型的泛化能力顯著提升,不管是多語言理解,還是生成任務,都能輕松搞定,名副其實的「通才」了屬于是。

無論是自主創(chuàng)作、自由回答,還是命題對話、情感分析,100多個層次化Prompt,ERNIE 3.0 Zeus都能順利應對。

圖片

文心ERNIE-ViLG 2.0圖像生成大模型,天才畫師了解一下?

如果說文心ERNIE 3.0 Zeus是語言大師,ERNIE-ViLG 2.0就是作畫大師。它能根據(jù)一句話或者一段描述文本,生成一幅精美的畫作。

圖片

中文提示,想要什么畫,直接開口說就行,只有你想不到的,沒有ta畫不出來的,看看這艘青花瓷戰(zhàn)艦,像不像一尊精美的藝術品?就是不知道真的打起來,會不會被一炮干碎......

而要達成這個目標,離不開模型本身背后知識增強的擴散模型。

一句話或幾句話的提示中,哪些是核心要素,需要在畫作中突出展現(xiàn),哪些是修飾要素,作用就是錦上添花,還不能喧賓奪主,這里邊就有學問了。

圖片

為了盡可能實現(xiàn)精準作畫,在學習過程中,ERNIE ViLG 2.0引入了語言、視覺等多源知識,引導模型更加關注文本和圖像中的核心語義元素,實現(xiàn)精準的細粒度語義控制。

此外,ERNIE ViLG 2.0還可以針對不同階段,選擇不同網(wǎng)絡(比如降噪)建模的框架,有效解決了不同階段對模型能力要求不一致的問題,減少了降噪任務的互相干擾,提升了圖像生成的質量。

圖片

無論是寫實風、中國風、還是國潮、國畫風,ERNIE-ViLG 2.0都能根據(jù)簡短的中文提示生成切題、風格各異、且生動逼真的圖像。

圖片

舉個例子,比如下面這段艷麗飄逸的「天宮盛宴」:

基于ERNIE-ViLG 2.0的文心·一格,交出了可以說是面面俱到的作業(yè),整體畫風色調(diào)明艷,不失古代情調(diào)。


現(xiàn)在,我們只需要在百度「文心·一格」平臺上輸入幾個關鍵詞,也能分分鐘得到風格獨特的畫作。

除了語言和圖像外,在視頻內(nèi)容生成與編輯上,也是文心大模型大展身手的地方。

在視覺內(nèi)容生成方面,視頻生成大模型可以根據(jù)用戶提供的一段描述文本,或者一幅圖像,自動地生成高清、流暢的視頻。

圖片

在視覺編輯方面,VIMER-TCIR多任務大模型,則可以利用對超分辨率、去噪、去模糊、去壓縮等多任務的聯(lián)合預訓練,同時實現(xiàn)對多種不同情況的修復和編輯。

目前,VIMER-TCIR已經(jīng)在老電影修復等場景實現(xiàn)落地,而且大幅提升了運行效率,每天單機就可修復視頻28.5萬幀,解決了絕大部分老電影畫面的修復問題。

圖片

AIGC的浪潮已經(jīng)到來,在未來,可以預見的是,AI作畫、AI創(chuàng)作視頻等等,很快就會變得像手機拍照一樣簡單。

隨著技術的不斷突破,AIGC將很有可能顛覆現(xiàn)有內(nèi)容生產(chǎn)模式,實現(xiàn)以十分之一的成本,以百倍千倍的生產(chǎn)速度,創(chuàng)造出有獨特價值和獨立視角的內(nèi)容。

研發(fā)資金拉滿:10年投入超1000億

為了讓大模型達到如此酷炫的效果,百度在研發(fā)方面,可謂是毫不吝嗇。

十年間累計投入了超過1000億元,其中核心研發(fā)投入占核心收入比例連續(xù)8個季度超過了20%。

據(jù)統(tǒng)計,百度在2020年的研發(fā)投入強度為18.22%,位列民營企業(yè)500強第一。2021年為20.03%,位列民營企業(yè)500強第二。

圖片

順便一提的是,如此「豪橫」的投入,也讓百度在人工智能的底層技術方面,取得了領先優(yōu)勢。

畢竟,****脖子要緊,基礎軟件卡脖子也一樣要緊。

早在2016年,百度就開始研發(fā)被稱為「人工智能操作系統(tǒng)」的深度學習框架——飛槳。

目前,已經(jīng)凝聚了535萬開發(fā)者,創(chuàng)建了67萬個模型,構建起一個繁榮的深度學習生態(tài)。

基于飛槳的大模型也可以有效集成自然語言處理、計算機視覺等多模態(tài)能力,并聯(lián)合多種行業(yè)務場景進行調(diào)優(yōu);而開發(fā)者也能像搭積木一樣構建AI應用,大大降低AI的應用門檻。

圖片

李彥宏:人工智能的黃金十年

文章開頭我們已經(jīng)提到,李彥宏認為,與深度學習相關的重大創(chuàng)新,包括自動駕駛、水電能等領域的智能調(diào)度系統(tǒng)等,會產(chǎn)生重大社會影響。

創(chuàng)新本身是從何而來呢?在李彥宏看來,創(chuàng)新,是由反饋驅動的。

百度在經(jīng)營發(fā)展中,就有很多「反饋驅動創(chuàng)新」的實踐經(jīng)驗。比如,百度昆侖芯片之所以在AI芯片中擁有領先的性能,正是因為它已經(jīng)為百度的搜索服務優(yōu)化了十年。

百度的搜索服務,每天響應幾十億次真實的用戶使用需求,每天進行1萬億次深度語義推理與匹配,能夠提供最真實、最及時的反饋,從而倒逼大模型、深度學習框架和芯片的優(yōu)化。

現(xiàn)在,百度是全球為數(shù)不多的、進行全棧布局的人工智能公司(芯片層、框架層、模型層和應用層)。


從高端芯片昆侖,到飛槳深度學習框架,再到文心預訓練大模型,各個層面都有關鍵自研技術,每一層之間都有很多反饋,通過不斷獲得反饋,實現(xiàn)端到端優(yōu)化。

每一層的技術架構,都是越往下越通用,越往上越專用。

而人工智能越專用,就越能深入產(chǎn)業(yè),賦能實體經(jīng)濟發(fā)展。

去年的Create大會上,李彥宏曾預言:「隨著技術應用門檻不斷降低,創(chuàng)造者們將迎來屬于人工智能的黃金10年?!谷缃?,他依舊這樣認為。


李彥宏剛剛創(chuàng)業(yè)時,互聯(lián)網(wǎng)泡沫破裂,全世界蒸發(fā)8萬億市值,而后不久,互聯(lián)網(wǎng)再次進入黃金十年,而人工智能,也會經(jīng)歷同樣的起起落落。

而百度,將一如既往為社會、為產(chǎn)業(yè)培養(yǎng)AI人才,投入更多資源,與各位開發(fā)者們一道,為中國AI的發(fā)展盡最大的努力。

彩蛋

Create大會最后,虛擬人樂隊成員們再次登場。

圖片主唱/吉他:希加加,鼓手:度曉曉,貝斯:葉悠悠,鍵盤:林開開

希加加表示,自己的畫能在大會開場被展示,實在是太開心了!

而林開開過了把當制作人的癮,他開心自夸道,自己還挺有編曲天賦的~

葉悠悠說,自己的設計居然長在大家的審美點上,這讓她相當滿意。那么,哪個環(huán)節(jié)的設計是她做的呢?


度曉曉猜對了:是「知一」和「千流」環(huán)節(jié)。


而度曉曉表示,自己早已寫好了發(fā)布會的傳播稿。


在四位成員的共同頭腦風暴中,稿件的標題火熱出爐——《震驚!這是一場人和機器一起辦的大會》。

圖片

對此小編表示:新媒體文章標題的精髓,被你們拿捏了圖片。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。

土壤濕度傳感器相關文章:土壤濕度傳感器原理


關鍵詞: 李彥宏

技術專區(qū)

關閉