不只OpenAI，這些公司手上也握著AIGC下個(gè)十年的船票

發(fā)布人：硅星人時(shí)間：2023-04-01 來(lái)源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

AI時(shí)代，他們已經(jīng)搶跑

文|Frank Chen 編輯| VickyXiao

自從去年11月ChatGPT正式發(fā)布、OpenAI開啟了AI新時(shí)代以來(lái)，生成式AI領(lǐng)域就開始如火如荼：巨頭殺紅了眼，創(chuàng)業(yè)公司也在力求突破。

從OpenAI背后的金主微軟，到趕鴨子上架發(fā)布了Bard的谷歌，再到OpenAI出走自立門戶的Anthropic等……目前，在生成式AI模型這個(gè)赤手可熱的風(fēng)口上，硅谷還有哪些公司在摩拳擦掌，準(zhǔn)備大干一場(chǎng)呢？

Meta：另辟蹊徑，不做聊天做開源

押注元宇宙的Meta也在悄悄趕上這波生成式AI的浪潮。

不久前，Meta在宣布發(fā)布了自己的大語(yǔ)言模型LLaMa, 其全名為L(zhǎng)arge Language Model Meta AI。在Facebook社交媒體上，F(xiàn)acebook的CEO Mark Zuckerberg宣布LLaMa“將在生成文本、對(duì)話、總結(jié)寫作材料，和更多諸如解決數(shù)學(xué)問(wèn)題和預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等復(fù)雜的任務(wù)中展示新的希望”。

Meta 的發(fā)布也很引人注目，部分原因是它避開了AI聊天機(jī)器人這一當(dāng)下最熱門也最擁擠的領(lǐng)域。其實(shí)Meta過(guò)去曾經(jīng)發(fā)布過(guò)自己的用戶側(cè)AI 聊天機(jī)器人，包括廣受批評(píng)的BlenderBot，和因?yàn)椴煌５刂圃炜茖W(xué)廢話才三天就被下線 Galactica的機(jī)器人。不過(guò)在一篇研究論文中，Meta 聲稱 LLaMA 模型的第二小版本 LLaMA-13B“在大多數(shù)基準(zhǔn)測(cè)試中”比 OpenAI的GPT-3模型表現(xiàn)更好。

但與Open AI的ChatGPT不同，Meta發(fā)布的LLaMa并不致力于制作出用戶側(cè)的對(duì)話工具。

作為Meta對(duì)開放科學(xué)承諾的一部分，LLaMa旨在幫助研究人員推進(jìn)他們?cè)?AI 子領(lǐng)域的工作。Meta特意強(qiáng)調(diào)了這款模型的非商用性，“為了保持完整性并防止濫用，我們將根據(jù)專注于研究用例的非商業(yè)許可發(fā)布我們的模型。將根據(jù)具體情況授予隸屬于政府、民間社會(huì)和學(xué)術(shù)界組織的人員和世界各地的行業(yè)研究實(shí)驗(yàn)室相關(guān)的權(quán)限?！?/span>

Meta認(rèn)為，在大型語(yǔ)言模型空間中訓(xùn)練像 LLaMA 這樣的小型基礎(chǔ)模型是可取的，因?yàn)樗枰俚挠?jì)算能力和資源來(lái)測(cè)試新方法、驗(yàn)證他人的工作和探索新的用例?；A(chǔ)模型在大量未標(biāo)記數(shù)據(jù)上進(jìn)行訓(xùn)練，這使得它們非常適合對(duì)各種任務(wù)進(jìn)行微調(diào)。

針對(duì)大型語(yǔ)言模型中的偏見(jiàn)、有毒評(píng)論和作假的風(fēng)險(xiǎn)，Meta希望通過(guò)共享 LLaMA 的代碼，讓其他研究人員可以更輕松地限制或消除大型語(yǔ)言模型中這些問(wèn)題。Meta還在LLaMa的論文中提供了一組語(yǔ)言評(píng)估模型的標(biāo)準(zhǔn)，支持在這一關(guān)鍵領(lǐng)域的進(jìn)一步研究。

OpenAI叛將：自立門戶，卻加入谷歌陣營(yíng)

來(lái)自O(shè)pen AI背景的研發(fā)人員成立了Anthropic。Anthropic是一家AI研究公司，由Open AI前員工于2021年創(chuàng)立。

該公司推出了名為Claude的類似ChatGPT的對(duì)話軟服務(wù)。該公司使用一種稱為Constitutional AI(條約型AI) 的方法開發(fā)了聊天機(jī)器人。針對(duì)該框架，其研發(fā)團(tuán)隊(duì)有一篇完整的論文，但簡(jiǎn)而言之，Claude使用一組大約 10 條“自然語(yǔ)言指令或原則”來(lái)訓(xùn)練語(yǔ)言模型，用于自動(dòng)修改它的回答。根據(jù) Anthropic 的說(shuō)法，該系統(tǒng)的目標(biāo)是在不結(jié)合人類反饋的情況下“訓(xùn)練更好、更無(wú)害的人工智能助手”。

Anthropic的論文中的Constitutional AI的介紹，圖片來(lái)自網(wǎng)絡(luò)

他們目前提供兩個(gè)版本的 Claude：Claude 和 Claude Instant。Claude 是最先進(jìn)的高性能模型，而 Claude Instant 是更輕、更便宜、更快的選擇。Claude 可通過(guò)開發(fā)人員控制臺(tái)中的聊天界面和 API 進(jìn)行訪問(wèn)，可以幫助處理總結(jié)、搜索、創(chuàng)意和協(xié)作寫作、問(wèn)答、編碼等用例。

目前，AI 數(shù)據(jù)平臺(tái) Scale 獲得了訪問(wèn) Claude 的權(quán)限，Scale的相關(guān)人士認(rèn)為，Claude與可作為ChatGPT強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手，并且該機(jī)器人“更傾向于拒絕不適當(dāng)?shù)恼?qǐng)求”。然而，相比之下Claude容易犯事實(shí)數(shù)學(xué)上錯(cuò)誤。谷歌也于去年年底向Anthropic注資了3億美元。

創(chuàng)業(yè)公司：開放第三方整合，沖得更快

You.com 是一家由兩名前 Salesforce 員工創(chuàng)建的公司，自稱是“你控制的搜索引擎”。乍一看，它可能看起來(lái)像是典型的搜索引擎，但它帶有一個(gè)人工智能驅(qū)動(dòng)的“聊天”工具，其工作方式與微軟在 Bing 上的試點(diǎn)非常相似。

You.com 于 2022 年 12 月首次推出了名為 YouChat 的聊天機(jī)器人，并表示它建立在公司的 C-A-L 模型之上，就像微軟的 AI 一樣，YouChat 可以為各種類型的查詢提供帶注釋的答案、創(chuàng)建來(lái)自網(wǎng)絡(luò)的文章摘要、生成代碼、撰寫論文等等。

除此之外，You.com 最近還添加了內(nèi)置人工智能圖像生成器模型，包括 Stable Diffusion 1.5、Stable Diffusion 2.1 和 Open Journey，用戶可以使用這些模型根據(jù)書面描述生成圖像。該引擎還會(huì)對(duì) Reddit、TripAdvisor、Wikipedia 和 YouTube 等網(wǎng)站上的相關(guān)結(jié)果進(jìn)行分解，得到用戶更想要的答案。

You.com生成的猴子踢球的照片，該圖片來(lái)自網(wǎng)絡(luò)

微軟 VS 谷歌：

當(dāng)然，還是必須得說(shuō)回目前聲勢(shì)最浩大的谷歌和微軟。

首當(dāng)其沖的是微軟。微軟作為Open AI的最大投資人和技術(shù)集成者，通過(guò)將ChatGPT的技術(shù)整合進(jìn)他的網(wǎng)絡(luò)搜索引擎Bing中，并將新的Bing提供給測(cè)試用戶。測(cè)試用戶可以問(wèn)出像“你能推薦巴黎的景點(diǎn)嗎？”或者想要像小紅書那樣的食譜推薦。然后收到Bing的機(jī)器人的“優(yōu)秀答卷” – 包括帶注釋的景點(diǎn)回復(fù)，或者是概述食譜中的配料和步驟。不過(guò)目前用戶還是發(fā)現(xiàn)了一些可以“玩”的漏洞，比如說(shuō)一個(gè)“已經(jīng)禁用”的提示，該提示會(huì)觸發(fā)Bing機(jī)器人泄露其內(nèi)部昵稱Sydney, 以及其開發(fā)人員為其行為設(shè)置的一些參數(shù)。盡管微軟限定了5個(gè)回答和50個(gè)問(wèn)題的上限來(lái)作為這種漏洞觸發(fā)的限制，但又由于用戶的投訴放寬了這個(gè)限制。

此外，微軟還正式把OpenAI的GPT-4模型裝進(jìn)了Office套件，推出了全新的AI功能Copilot。

Bing的Chat交互界面，該圖片來(lái)自網(wǎng)絡(luò)

而相較之下，谷歌的發(fā)布略顯急促。搜索業(yè)務(wù)是谷歌的核心護(hù)城河，因此當(dāng)ChatGPT問(wèn)世時(shí)，谷歌也匆匆忙忙地發(fā)布了他們的對(duì)話型人工智能服務(wù) – Bard。根據(jù)谷歌的CEO Sundar Pichai的描述，谷歌使用了公司內(nèi)部生成的大型語(yǔ)言模型LaMDA來(lái)為對(duì)話式人工智能服務(wù)提供支持，該服務(wù)“利用網(wǎng)絡(luò)信息提供新鮮、高質(zhì)量的回復(fù)。

Bard的官方介紹，圖片來(lái)自谷歌

上周Bard開啟了公測(cè)?？傮w來(lái)看，谷歌的Bard跟New Bing的使用模式和功能基本一致。此次Bard也為用戶提供了一個(gè)單獨(dú)的聊天界面，戶可以在文本框中進(jìn)行提問(wèn)和搜索，比如讓Bard幫你寫一個(gè)計(jì)劃、列一個(gè)食譜、幫你搜索一個(gè)冷知識(shí)等。但在定位上，谷歌強(qiáng)調(diào) Bard 并不是其搜索引擎的替代品，而是“搜索的補(bǔ)充”, Bard自稱為“你具有創(chuàng)造力的得力協(xié)作者（Collaborator）“。

谷歌其實(shí)也宣布了一系列關(guān)于在自家產(chǎn)品線中集成AI功能的重磅更新：旗下包括包括Gmail以及Google Doc、Sheets、Slides等所有Workspace辦公組件將上線生成式AI功能，同時(shí)還開放了自家的大語(yǔ)言模型PaLM的 API。

推演和猜想：不可錯(cuò)過(guò)的未來(lái)

那么，為什么各大公司都在狂熱地入場(chǎng)ChatGPT這樣的生成式語(yǔ)言技術(shù), 即使非常匆忙，甚至在技術(shù)尚未成熟時(shí)也要分一杯羹呢？

生成式AI無(wú)論是對(duì)企業(yè)，還是對(duì)用戶來(lái)說(shuō)，可能都將帶來(lái)一系列的變革。首先，在當(dāng)今的世界中，很多人都會(huì)使用手機(jī)、電腦等設(shè)備來(lái)進(jìn)行內(nèi)容的生產(chǎn)、創(chuàng)作和消費(fèi)。這些內(nèi)容覆蓋各行各業(yè)或者各種消費(fèi)場(chǎng)景，比如說(shuō)客戶服務(wù)、語(yǔ)言翻譯、市場(chǎng)分析、發(fā)郵件、電商購(gòu)物甚至是寫代碼。生成式AI可以幫助人們提高內(nèi)容產(chǎn)生的效率，并且為人們提供更有趣的交互場(chǎng)景。從企業(yè)視角來(lái)說(shuō)，生成式AI有助于各職能的職場(chǎng)人提高工作效率，也有助于企業(yè)內(nèi)部流程更加智能和自動(dòng)化，從而節(jié)約人力成本。從用戶視角來(lái)說(shuō)，各家公司更加智能化定制化的服務(wù)體系也能改善用戶在平臺(tái)上的體驗(yàn)，從而提升用戶在平臺(tái)上的留存和購(gòu)買力。

在企業(yè)競(jìng)爭(zhēng)的維度上，由于泛用戶側(cè)的互聯(lián)網(wǎng)的滲透已經(jīng)達(dá)到一個(gè)平緩的階段，使用互聯(lián)網(wǎng)用戶的規(guī)模和一天當(dāng)中的使用時(shí)長(zhǎng)相對(duì)已經(jīng)固定。優(yōu)先有效利用生成式AI創(chuàng)造多種業(yè)務(wù)場(chǎng)景和落地模式的公司更容易在用戶側(cè)的競(jìng)爭(zhēng)中占據(jù)一席之地，對(duì)用戶的APP使用時(shí)長(zhǎng)和使用場(chǎng)景進(jìn)行再分配，甚至進(jìn)一步增加用戶更多場(chǎng)景的滲透空間。

從行業(yè)版圖上看，生成式AI最終可以落地在什么場(chǎng)景，最終會(huì)形成什么樣的競(jìng)爭(zhēng)格局，又會(huì)普惠什么樣的人群呢？

我們做一些推演和猜想。

美國(guó)信息服務(wù)公司Gartner曾經(jīng)做過(guò)一個(gè)技術(shù)成熟度曲線，非常適用于近兩年諸如元宇宙和生成式AI風(fēng)口的客觀規(guī)律。當(dāng)前，生成式AI處在了技術(shù)萌芽期(Technology Trigger)，并隨著ChatGPT的注冊(cè)用戶數(shù)暴漲而暴露在媒體的聚光燈下。于是各大擁有算力并做過(guò)一些早期AI研發(fā)的巨頭公司開始借助這波趨勢(shì)嘗試深化和商用。但從各公司的技術(shù)成熟度上看，生成式AI還擁有諸多使用時(shí)暴露出的漏洞，既沒(méi)有找到合適的商用模式，又會(huì)面臨各國(guó)政策和隱私法律的阻礙。因此這項(xiàng)技術(shù)很有可能同自動(dòng)駕駛或者元宇宙一樣，面臨著期望膨脹期后的泡沫破裂期。而企業(yè)競(jìng)爭(zhēng)的幸存者會(huì)將讓他們受益的實(shí)例具體化，在復(fù)蘇期推出更加成熟的產(chǎn)品，最終在生產(chǎn)成熟期獲得廣泛的采用和更明確的生存能力標(biāo)準(zhǔn)。

Gartner的技術(shù)成熟度曲線，該圖片來(lái)自網(wǎng)絡(luò)

對(duì)于最終將會(huì)實(shí)現(xiàn)第一階段落地的商用場(chǎng)景，筆者認(rèn)為會(huì)有如下的幾個(gè)方向：

1. 搜索引擎的智能化：人們?cè)谒阉饕嫔匣ㄙM(fèi)的時(shí)間可能會(huì)變長(zhǎng)，這是由于人們可能期待更智能化的搜索答案，諸如春節(jié)的拜年****、學(xué)生論文的模版和一些相關(guān)資料的有效聚合；能實(shí)現(xiàn)這一結(jié)果的搜索引擎將能迎來(lái)用戶更強(qiáng)的接受率；

2. 企業(yè)的內(nèi)容生產(chǎn)提效化：這包括市場(chǎng)數(shù)據(jù)的自動(dòng)化收集和語(yǔ)義理解，還有企業(yè)員工與生產(chǎn)工具的交互從打字式走向?qū)υ捠降鹊龋?/span>

3. 客服系統(tǒng)場(chǎng)景深化：諸如金融(比如銀行和投資管理)、電商平臺(tái)的后臺(tái)客服系統(tǒng)將因?yàn)樯墒紸I而更加智能化和場(chǎng)景深化，并且可以幫助企業(yè)有效節(jié)約人力成本。

*參考資料：

注：封面圖來(lái)自于Pexels，版權(quán)屬于原作者。如果不同意使用，請(qǐng)盡快聯(lián)系我們，我們會(huì)立即刪除。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

博客專欄

不只OpenAI，這些公司手上也握著AIGC下個(gè)十年的船票

相關(guān)推薦

技術(shù)專區(qū)