新聞中心

EEPW首頁 > 業(yè)界動態(tài) > 人工智能專題報告:生成式AI,人工智能新范式,重新定義生產(chǎn)力

人工智能專題報告:生成式AI,人工智能新范式,重新定義生產(chǎn)力

作者:電子產(chǎn)品世界 時間:2023-09-21 來源:未來智庫 收藏

:從判別決策到創(chuàng)造生成

:決策式與生成式AI對比

本文引用地址:http://m.butianyuan.cn/article/202309/450856.htm

AI模型可大致分為決策式/分析式AI(Discriminant/Analytical AI)和生成式AI (Generative AI)兩類。決策式AI:學(xué)習(xí)數(shù)據(jù)中的條件概率分布,根據(jù)已有數(shù)據(jù)進行分析、判斷、預(yù)測,主要應(yīng)用模型有用于推薦系 統(tǒng)和風(fēng)控系統(tǒng)的輔助決策、用于自動駕駛和機器人的決策智能體。 生成式AI:學(xué)習(xí)數(shù)據(jù)中的聯(lián)合概率分布,并非簡單分析已有數(shù)據(jù)而是學(xué)習(xí)歸納已有數(shù)據(jù)后進行演技創(chuàng)造,基 于歷史進行模仿式、縫合式創(chuàng)作,生成了全新的內(nèi)容,也能解決判別問題。

決策式AI:推薦系統(tǒng)、圖像識別等已創(chuàng)造巨大市場

2016年,技術(shù)全面爆發(fā),決策式AI開始大規(guī)模應(yīng)用,包括推薦系統(tǒng)、計算機視覺、自然語言處理等。 全球市場規(guī)模從2016年的約600億美元發(fā)展到2021年的近3000億美元,在推薦系統(tǒng)、計算機視覺、自 然語言處理等技術(shù)加持下,亞馬遜、字節(jié)、商湯、特斯拉等公司快速發(fā)展。 我們認(rèn)為,生成式AI經(jīng)過前期技術(shù)積累進入爆發(fā)期,隨著技術(shù)與應(yīng)用的進一步成熟,后續(xù)市場空間更為廣闊。

決策式AI應(yīng)用:推薦系統(tǒng)助力電商、視頻等行業(yè)快速發(fā)展

電商推薦:深度挖掘用戶和物品的關(guān)聯(lián)關(guān)系,將商品、店鋪精準(zhǔn)推送給用戶。2003年,亞馬遜將協(xié)同過濾推薦 算法應(yīng)用到電商行業(yè),憑借推薦商品與用戶需求精準(zhǔn)匹配、大幅降低用戶檢索用時,推薦算法在電商交易中心逐 漸成為資源配置的核心。 推薦系統(tǒng)顯著提升電商平臺銷售額。2006年,據(jù)VentureBeat,亞馬遜的個性化推薦系統(tǒng)為其貢獻了35%以 上的銷售額;2015年,京東基于大數(shù)據(jù)個性化推薦算法的訂單占到總訂單的10%。 新聞、音樂、視頻等推薦:分析用戶長期興趣和短期興趣,根據(jù)興趣標(biāo)簽將內(nèi)容實時推送給用戶。推薦算法通 過對用戶觀看、停留、點贊等行為的實時分析,精準(zhǔn)刻畫用戶畫像,將用戶可能感興趣的內(nèi)容推薦給用戶,降低 人工運營規(guī)則的攝入,顯著提高了用戶粘性。

決策式AI應(yīng)用:圖像識別推動自動駕駛市場快速增長

自動駕駛:AI智能分析、識別路況,滲透率不斷提升。借助決策式AI,自動駕駛汽車可分析判別各種路況,并可 對多種物體進行識別與跟蹤,從而提高行車的安全性,例如行人、空曠行駛空間、地上標(biāo)注、紅綠燈、車輛等。 目前自動駕駛市場規(guī)模快速增長,據(jù)Research And Markets,2021年全球無人駕駛汽車的市場規(guī)模約273億美 元,2026年全球無人駕駛汽車市場規(guī)模將達到594億美元,年復(fù)合增長率為16.84%。

帶動產(chǎn)業(yè)鏈發(fā)展,多環(huán)節(jié)均有高市值上市公司及高估值公司。判別式AI為自動駕駛汽車提供核心技術(shù)支持,自動 駕駛汽車的銷售則帶動整個相關(guān)產(chǎn)業(yè)鏈的發(fā)展,如車用無線通信技術(shù)V2X、高精度地圖、激光雷達、芯片、 ADAS駕駛輔助系統(tǒng)、智能車解決方案等。多個產(chǎn)業(yè)鏈環(huán)節(jié)均有高估值、大市值公司誕生,例如蔚來汽車(造 車)、商湯科技(激光雷達、V2X、ADAS等)、Momenta(高精度地圖)等。

生成式AI:范式升級,應(yīng)用多元

生成式AI VS Web 3.0 :不僅是web3.0的生產(chǎn)工具,更是的新范式

生成式AI可以作為Web3.0的生產(chǎn)工具,但Web3.0中的應(yīng)用僅是其應(yīng)用的冰山一角。 Web3.0圍繞去中心化的理念展開,結(jié)合區(qū)塊鏈、智能合約、加密貨幣等技術(shù),核心是產(chǎn)生的數(shù)據(jù)由用戶擁有, 能夠改變用戶數(shù)據(jù)及原創(chuàng)內(nèi)容等均由互聯(lián)網(wǎng)中心化實體控制的現(xiàn)狀,在創(chuàng)作者經(jīng)濟中取得更好的平衡從而提 升用戶創(chuàng)作內(nèi)容的積極性。生成式AI在內(nèi)容領(lǐng)域的應(yīng)用能夠滿足用戶不斷提升的創(chuàng)作需求,但這僅是其應(yīng)用的 冰山一角。 生成式AI在廣大垂直領(lǐng)域的應(yīng)用帶來的是AI用途的結(jié)構(gòu)性改變以及生產(chǎn)力的進一步提高,未來可能創(chuàng)造巨大 的市場價值。

生成式AI VS Web 3.0 :不追求生產(chǎn)關(guān)系的重塑,但將大幅度提升和創(chuàng)造生產(chǎn)力

創(chuàng)造是生成式AI的核心,本質(zhì)是對生產(chǎn)力的大幅度提升和創(chuàng)造。生成式AI通過從數(shù)據(jù)中學(xué)習(xí)要素,進而生成 全新的、原創(chuàng)的內(nèi)容或產(chǎn)品,不僅能夠?qū)崿F(xiàn)傳統(tǒng)AI的分析、判斷、決策功能,還能夠?qū)崿F(xiàn)傳統(tǒng)AI力所不及的創(chuàng) 造性功能。生成式AI已催生了營銷、設(shè)計、建筑和內(nèi)容領(lǐng)域的創(chuàng)造性工作,并開始在生命科學(xué)、醫(yī)療、制造、 材料科學(xué)、媒體、娛樂、汽車、航空航天進行初步應(yīng)用,為各個領(lǐng)域帶來巨大的生產(chǎn)力提升。

生成式AI將促進生產(chǎn)關(guān)系高效發(fā)展,而不是像Web3.0重塑生產(chǎn)關(guān)系。Web3.0通過底層的分布式與去中心化、 密碼學(xué)的應(yīng)用、加密貨幣的結(jié)算方式,為集體協(xié)作、分工、收益提供了更好的結(jié)算方式,去中心化自治組織 (Decentralized Autonomous Organization,DAO)將是常見的組織形態(tài),打破了原有的生產(chǎn)關(guān)系。生成式 AI不是打破傳統(tǒng)的生產(chǎn)關(guān)系,而是通過提高生產(chǎn)力促進現(xiàn)有生產(chǎn)關(guān)系高效發(fā)展。

資本:海外一級投資涌入

多家生成式AI公司進入Madrona、高盛、微軟、亞馬遜網(wǎng)絡(luò)服務(wù)和 PitchBook聯(lián)合發(fā)布的2022年智能應(yīng)用前40 名榜單(Intelligent Applications 40,IA40)。IA40招募了來自40多家頂級風(fēng)險投資和投資公司的50多名風(fēng)險 投資人,提名并投票選出塑造智能應(yīng)用未來的頂級公司,這些公司自成立以來募資超160億美元,今年募資超過 50億美元,其中包括Runway、Jasper、Copy.ai在內(nèi)的14家生成式AI相關(guān)公司,占比達35%。

技術(shù):模型迭代

變分自編碼器(Variational Autoencoder,VAE):2013年由Diederik P. Kingma和Max Welling提出,編碼器 將原始高維輸入轉(zhuǎn)換為對潛在空間的概率分布描述,從中采樣輸入解碼器,得到新生成的結(jié)果,可用于圖像生成、 語音合成等,生成的圖像較為模糊。

生成式對抗網(wǎng)絡(luò)(Generative Adversarial Nets,GAN):2014年由Ian J. Goodfellow等人提出,模型由生成 器和判別器組成,以圖像生成為例,生成器輸入訓(xùn)練噪聲后生成圖像,判別器用來判斷圖像是真實的還是由生成 器生成的,隨著訓(xùn)練不斷進行,生成器水平提升,判別器不再分辨圖像真?zhèn)?,固定生成器對判別器進行馴良,直 到判別器能夠分辨圖像真?zhèn)?,固定判別器再次訓(xùn)練生成器,不斷循環(huán),獲得生成效果好的生成器。GAN模型能夠 生成圖像、3D模型甚至視頻,但對輸出結(jié)果控制較弱,易產(chǎn)生隨機結(jié)果。

生成式AI應(yīng)用:內(nèi)容制作,從輔助人到“替代”人

生成式AI應(yīng)用:娛樂媒體內(nèi)容制作

當(dāng)前階段生成式AI最常見的應(yīng)用場景為娛樂媒體內(nèi)容的輔助生產(chǎn)。以文字續(xù)寫或糾錯、文字轉(zhuǎn)語音、文字生成語 音、圖像智能編輯、視頻智能剪輯等方式替代既有創(chuàng)意產(chǎn)生后的專業(yè)性機械勞動,同時通過內(nèi)容生成滿足用戶的 娛樂需求或者為其提供創(chuàng)作靈感。

隨著生成式AI的不斷成熟,部分專業(yè)內(nèi)容生產(chǎn)者將被替代。數(shù)據(jù)、算力的進一步提升將帶來具有更強生成效果的 AI,能夠根據(jù)用戶需求生成個性化定制內(nèi)容終稿,并且AI生成內(nèi)容達到專業(yè)內(nèi)容生產(chǎn)者水平且具有獨特新穎的創(chuàng) 意,從而替代部分文字作者、翻譯人員、插畫創(chuàng)作者、配音人員、音樂制作人、視頻編輯人員等等。

AIGC:生成式AI在娛樂媒體領(lǐng)域的應(yīng)用

AIGC(AI-Generated Content)指利用人工智能技術(shù)自動生成的內(nèi)容,是繼專業(yè)生成內(nèi)容(PGC)和用戶生成 內(nèi)容(UGC)之后一種新型生成內(nèi)容的方式。國際上被稱為人工智能合成媒體(AI-generated Media或Synthetic media),是通過人工智能算法對數(shù)據(jù)或媒體進行生產(chǎn)、操作和修改的統(tǒng)稱。

AI繪畫作品出圈、一級投資活躍,2022年AIGC爆發(fā)式發(fā)展。2022年8月,在美國科羅拉多州舉辦的新興數(shù)字藝 術(shù)家競賽中,參賽者提交AIGC繪畫作品《太空歌劇院》獲得了此次比賽“數(shù)字藝術(shù)/數(shù)字修飾照片”類別一等獎, 而參賽者沒有繪畫基礎(chǔ),通過AI繪圖軟件MidJourney耗時80個小時創(chuàng)作了該作品。AI繪畫技術(shù)發(fā)展快速,從年初 的技藝生疏到目前能夠生成專業(yè)級別的圖像僅過去幾個月的時間,目前國外已有Stable Diffusion Midjourney等多 個成熟的AIGC平臺。其中技術(shù)領(lǐng)先的AI公司Open AI當(dāng)前估值或達290億美元,Stable Diffusion背后的Stability AI 估值也達到10億美元。

文本生成:對話機器人、新聞稿撰寫廣泛應(yīng)用

文本生成是生成式AI最早應(yīng)用的領(lǐng)域之一,已經(jīng)在對話機器人、內(nèi)容續(xù)寫、新聞稿撰寫、詩歌小說創(chuàng)作等領(lǐng)域具 有廣泛的應(yīng)用。 對話機器人:包括問答型機器人、閑聊型機器人、任務(wù)型機器人、知識圖譜型機器人、多輪對話機器人,在智能 客服場景中能夠顯著降低企業(yè)人力成本。 新聞稿撰寫:在全球范圍具有廣泛的應(yīng)用,很多新聞機構(gòu)使用AI生成稿件,尤其是體育、天氣、股市交易變動、 公司業(yè)績報道等結(jié)構(gòu)性新聞報道。自然語言生成公司Automated Insights僅在2014年就產(chǎn)生了10億篇新聞文章, 每秒可撰寫多達2000篇新聞報道,用戶包括雅虎、美聯(lián)社等。

音頻生成:語音生成廣泛應(yīng)用,大廠均有布局

自動語音生成:將文本轉(zhuǎn)化為語音,廣泛應(yīng)用于新聞閱讀、有聲書、出行導(dǎo)航、通知播報、視頻配音等領(lǐng)域。目 前,谷歌、微軟、亞馬遜、騰訊、阿里、百度、科大訊飛等均推出了相關(guān)平臺,支持在不同場景下將文本轉(zhuǎn)化為 流暢逼真的語音。 谷歌Text-to-Speech:谷歌基于DeepMind 的語音合成專業(yè)技術(shù)打造,支持40多種語言、220多種語音和參數(shù) 調(diào)整,并且支持用戶上傳自己錄制的音頻來訓(xùn)練自定義語音模型。 科大訊飛在線語音合成:提供了100+發(fā)音人,支持多語種、多方言和中英混合,可靈活配置音頻參數(shù),只需 用戶上傳15分鐘錄音便能夠生成專屬聲音。

生成式AI應(yīng)用:多行業(yè)垂直應(yīng)用

代碼生成:大廠廣泛布局,極大提升編程效率

代碼生成:生成式AI將自然語言翻譯成代碼,極大提升了計算機編程的智能化、自動化,使得程序員能夠在相 同時間內(nèi)編寫更多的代碼,同時提高debug的效率。目前,OpenAI、微軟、谷歌、亞馬遜、華為等均在AI代碼 生成領(lǐng)域有所布局。

Codex:2021年8月由OpenAI基于GPT-3推出,精通Python、JavaScript、Go、Perl、PHP、Ruby、Swift、 TypeScript、SQL甚至 Shell 等十幾種編程語言,其中最為擅長Python。具有將注釋變成代碼、為代碼生成 注釋、代碼自動補全、查找可用庫或API、代碼檢查、代碼重構(gòu)、代碼語言轉(zhuǎn)換等功能,是Github Copilot的 底層支持,目前免費開放,需要通過API或 Playground 訪問。

代碼生成:ChatGPT調(diào)試代碼表現(xiàn)優(yōu)于傳統(tǒng)搜索引擎

ChatGPT:2022年11月由OpenAI推出,是一個對話語言模型,但在代碼生成領(lǐng)域具有優(yōu)秀的表現(xiàn),能夠?qū)?自然語言轉(zhuǎn)為代碼、找出代碼的問題并給出修改意見,且支持用戶和AI連續(xù)對話,在調(diào)試代碼過程中的使用 體驗優(yōu)于傳統(tǒng)的搜索引擎。

代碼生成:Github Copilot每年節(jié)約開發(fā)人員成本或達百億美元

Github Copilot:2021年6月由微軟旗下GitHub推出,由OpenAI Codex 提供支持,可以集成到Neovim, JetBrains IDEs, Visual Studio, and Visual Studio Code等編輯器中,支持 Python、JavaScript、TypeScript、 Java、Ruby 和 Go 等編程語言??梢愿鶕?jù)上下文自動寫代碼,包括文檔字符串、注釋、函數(shù)名稱、代碼, 只要用戶給出提示,就可以寫出完整的函數(shù)。

Github Copilot每年節(jié)約開發(fā)人員成本或達百億美元。在2021年6月-2022年6月中,超過120萬開發(fā)者注冊 使用 GitHub Copilot 預(yù)覽版,在啟用的文件中,有近 40% 的代碼是由 Copilot 編寫的。以使用人數(shù)120萬、 開發(fā)人員時薪20-200美元,Copilot每年可節(jié)省開發(fā)成本48-1920億美元。

海內(nèi)外發(fā)展:多家科技巨頭、初創(chuàng)公司積極布局

創(chuàng)業(yè)公司嶄露頭角,科技巨頭積極布局

國外多家生成式AI創(chuàng)業(yè)公司獲得大筆融資且擁有較高估值。主要包括OpenAI、 Stability AI、 Midjourney、 Jasper等,其中OpenAI技術(shù)積累最強,發(fā)布了多款生成式AI底層算法,估值或達290億美元。 國內(nèi)外科技巨頭在生成式AI領(lǐng)域多有布局。國內(nèi)公司百度、騰訊、阿里、字節(jié)、網(wǎng)易等及國外公司谷歌、Meta、 微軟等均推出了生成式AI的應(yīng)用產(chǎn)品,其中谷歌通過谷歌大腦、旗下Deepmind布局最為豐富。

Open AI:提供底層算法,開發(fā)水平強、算法通用性高的AI技術(shù)公司

OpenAI是一家大型人工智能研究公司。公司AI開發(fā)水平處于第一梯隊,研發(fā)人員包括世界著名AI專家,2022年 6月,量子計算專家、ACM計算獎得主Scott Aaronson宣布將加盟公司。公司以實現(xiàn)安全的通用人工智能(AGI) 為核心宗旨。 2015年成立之初,公司為一家非營利性研究機構(gòu),2019年接受微軟10億美元的注資,由非營利性機構(gòu)轉(zhuǎn)為盈利 性公司。公司的投資者包括微軟 、Reid Hoffman’s charitable foundation和 Khosla Ventures。The Information稱公司2021年估值已經(jīng)達200億美元。 據(jù)Semafor報道,微軟正商談以 290 億美元估值,向 OpenAI 投資 100 億美元,這筆投資還將引入其他風(fēng)投公司。 2022年公司收入約2500萬-4000萬美元,以290億美元的估值測算,市銷率達725-1160倍。




關(guān)鍵詞: 人工智能 AI

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉