不只OpenAI,這些公司手上也握著AIGC下個(gè)十年的船票
AI時(shí)代,他們已經(jīng)搶跑
文|Frank Chen 編輯| VickyXiao
自從去年11月ChatGPT正式發(fā)布、OpenAI開啟了AI新時(shí)代以來(lái),生成式AI領(lǐng)域就開始如火如荼:巨頭殺紅了眼,創(chuàng)業(yè)公司也在力求突破。
從OpenAI背后的金主微軟,到趕鴨子上架發(fā)布了Bard的谷歌,再到OpenAI出走自立門戶的Anthropic等……目前,在生成式AI模型這個(gè)赤手可熱的風(fēng)口上,硅谷還有哪些公司在摩拳擦掌,準(zhǔn)備大干一場(chǎng)呢?
Meta:另辟蹊徑,不做聊天做開源
押注元宇宙的Meta也在悄悄趕上這波生成式AI的浪潮。
不久前,Meta在宣布發(fā)布了自己的大語(yǔ)言模型LLaMa, 其全名為L(zhǎng)arge Language Model Meta AI。在Facebook社交媒體上,F(xiàn)acebook的CEO Mark Zuckerberg宣布LLaMa“將在生成文本、對(duì)話、總結(jié)寫作材料,和更多諸如解決數(shù)學(xué)問(wèn)題和預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)等復(fù)雜的任務(wù)中展示新的希望”。
Meta 的發(fā)布也很引人注目,部分原因是它避開了AI聊天機(jī)器人這一當(dāng)下最熱門也最擁擠的領(lǐng)域。其實(shí)Meta過(guò)去曾經(jīng)發(fā)布過(guò)自己的用戶側(cè)AI 聊天機(jī)器人,包括廣受批評(píng)的BlenderBot,和因?yàn)椴煌5刂圃炜茖W(xué)廢話才三天就被下線 Galactica的機(jī)器人。不過(guò)在一篇研究論文中,Meta 聲稱 LLaMA 模型的第二小版本 LLaMA-13B“在大多數(shù)基準(zhǔn)測(cè)試中”比 OpenAI的GPT-3模型表現(xiàn)更好。
但與Open AI的ChatGPT不同,Meta發(fā)布的LLaMa并不致力于制作出用戶側(cè)的對(duì)話工具。
作為Meta對(duì)開放科學(xué)承諾的一部分,LLaMa旨在幫助研究人員推進(jìn)他們?cè)?AI 子領(lǐng)域的工作。Meta特意強(qiáng)調(diào)了這款模型的非商用性,“為了保持完整性并防止濫用,我們將根據(jù)專注于研究用例的非商業(yè)許可發(fā)布我們的模型。將根據(jù)具體情況授予隸屬于政府、民間社會(huì)和學(xué)術(shù)界組織的人員和世界各地的行業(yè)研究實(shí)驗(yàn)室相關(guān)的權(quán)限?!?/span>
Meta認(rèn)為,在大型語(yǔ)言模型空間中訓(xùn)練像 LLaMA 這樣的小型基礎(chǔ)模型是可取的,因?yàn)樗枰俚挠?jì)算能力和資源來(lái)測(cè)試新方法、驗(yàn)證他人的工作和探索新的用例?;A(chǔ)模型在大量未標(biāo)記數(shù)據(jù)上進(jìn)行訓(xùn)練,這使得它們非常適合對(duì)各種任務(wù)進(jìn)行微調(diào)。
針對(duì)大型語(yǔ)言模型中的偏見(jiàn)、有毒評(píng)論和作假的風(fēng)險(xiǎn),Meta希望通過(guò)共享 LLaMA 的代碼,讓其他研究人員可以更輕松地限制或消除大型語(yǔ)言模型中這些問(wèn)題。Meta還在LLaMa的論文中提供了一組語(yǔ)言評(píng)估模型的標(biāo)準(zhǔn),支持在這一關(guān)鍵領(lǐng)域的進(jìn)一步研究。
OpenAI叛將:自立門戶,卻加入谷歌陣營(yíng)
來(lái)自O(shè)pen AI背景的研發(fā)人員成立了Anthropic。Anthropic是一家AI研究公司,由Open AI前員工于2021年創(chuàng)立。
該公司推出了名為Claude的類似ChatGPT的對(duì)話軟服務(wù)。該公司使用一種稱為Constitutional AI(條約型AI) 的方法開發(fā)了聊天機(jī)器人。針對(duì)該框架,其研發(fā)團(tuán)隊(duì)有一篇完整的論文,但簡(jiǎn)而言之,Claude使用一組大約 10 條“自然語(yǔ)言指令或原則”來(lái)訓(xùn)練語(yǔ)言模型,用于自動(dòng)修改它的回答。 根據(jù) Anthropic 的說(shuō)法,該系統(tǒng)的目標(biāo)是在不結(jié)合人類反饋的情況下“訓(xùn)練更好、更無(wú)害的人工智能助手”。
Anthropic的論文中的Constitutional AI的介紹,圖片來(lái)自網(wǎng)絡(luò)
他們目前提供兩個(gè)版本的 Claude:Claude 和 Claude Instant。Claude 是最先進(jìn)的高性能模型,而 Claude Instant 是更輕、更便宜、更快的選擇。Claude 可通過(guò)開發(fā)人員控制臺(tái)中的聊天界面和 API 進(jìn)行訪問(wèn),可以幫助處理總結(jié)、搜索、創(chuàng)意和協(xié)作寫作、問(wèn)答、編碼等用例。
目前,AI 數(shù)據(jù)平臺(tái) Scale 獲得了訪問(wèn) Claude 的權(quán)限,Scale的相關(guān)人士認(rèn)為,Claude與可作為ChatGPT強(qiáng)勁的競(jìng)爭(zhēng)對(duì)手,并且該機(jī)器人“更傾向于拒絕不適當(dāng)?shù)恼?qǐng)求”。 然而,相比之下Claude容易犯事實(shí)數(shù)學(xué)上錯(cuò)誤。 谷歌也于去年年底向Anthropic注資了3億美元。
創(chuàng)業(yè)公司:開放第三方整合,沖得更快
You.com 是一家由兩名前 Salesforce 員工創(chuàng)建的公司,自稱是“你控制的搜索引擎”。 乍一看,它可能看起來(lái)像是典型的搜索引擎,但它帶有一個(gè)人工智能驅(qū)動(dòng)的“聊天”工具,其工作方式與微軟在 Bing 上的試點(diǎn)非常相似。
You.com 于 2022 年 12 月首次推出了名為 YouChat 的聊天機(jī)器人,并表示它建立在公司的 C-A-L 模型之上,就像微軟的 AI 一樣,YouChat 可以為各種類型的查詢提供帶注釋的答案、創(chuàng)建來(lái)自網(wǎng)絡(luò)的文章摘要、生成代碼、撰寫論文等等。
除此之外,You.com 最近還添加了內(nèi)置人工智能圖像生成器模型,包括 Stable Diffusion 1.5、Stable Diffusion 2.1 和 Open Journey,用戶可以使用這些模型根據(jù)書面描述生成圖像。 該引擎還會(huì)對(duì) Reddit、TripAdvisor、Wikipedia 和 YouTube 等網(wǎng)站上的相關(guān)結(jié)果進(jìn)行分解,得到用戶更想要的答案。
You.com生成的猴子踢球的照片,該圖片來(lái)自網(wǎng)絡(luò)
微軟 VS 谷歌:
當(dāng)然,還是必須得說(shuō)回目前聲勢(shì)最浩大的谷歌和微軟。
首當(dāng)其沖的是微軟。微軟作為Open AI的最大投資人和技術(shù)集成者,通過(guò)將ChatGPT的技術(shù)整合進(jìn)他的網(wǎng)絡(luò)搜索引擎Bing中,并將新的Bing提供給測(cè)試用戶。測(cè)試用戶可以問(wèn)出像“你能推薦巴黎的景點(diǎn)嗎?”或者想要像小紅書那樣的食譜推薦。然后收到Bing的機(jī)器人的“優(yōu)秀答卷” – 包括帶注釋的景點(diǎn)回復(fù),或者是概述食譜中的配料和步驟。不過(guò)目前用戶還是發(fā)現(xiàn)了一些可以“玩”的漏洞,比如說(shuō)一個(gè)“已經(jīng)禁用”的提示,該提示會(huì)觸發(fā)Bing機(jī)器人泄露其內(nèi)部昵稱Sydney, 以及其開發(fā)人員為其行為設(shè)置的一些參數(shù)。盡管微軟限定了5個(gè)回答和50個(gè)問(wèn)題的上限來(lái)作為這種漏洞觸發(fā)的限制,但又由于用戶的投訴放寬了這個(gè)限制。
此外,微軟還正式把OpenAI的GPT-4模型裝進(jìn)了Office套件,推出了全新的AI功能Copilot。
Bing的Chat交互界面,該圖片來(lái)自網(wǎng)絡(luò)
而相較之下,谷歌的發(fā)布略顯急促。搜索業(yè)務(wù)是谷歌的核心護(hù)城河,因此當(dāng)ChatGPT問(wèn)世時(shí),谷歌也匆匆忙忙地發(fā)布了他們的對(duì)話型人工智能服務(wù) – Bard。根據(jù)谷歌的CEO Sundar Pichai的描述,谷歌使用了公司內(nèi)部生成的大型語(yǔ)言模型LaMDA來(lái)為對(duì)話式人工智能服務(wù)提供支持,該服務(wù)“利用網(wǎng)絡(luò)信息提供新鮮、高質(zhì)量的回復(fù)。
Bard的官方介紹,圖片來(lái)自谷歌
上周Bard開啟了公測(cè)??傮w來(lái)看,谷歌的Bard跟New Bing的使用模式和功能基本一致。此次Bard也為用戶提供了一個(gè)單獨(dú)的聊天界面,戶可以在文本框中進(jìn)行提問(wèn)和搜索,比如讓Bard幫你寫一個(gè)計(jì)劃、列一個(gè)食譜、幫你搜索一個(gè)冷知識(shí)等。但在定位上,谷歌強(qiáng)調(diào) Bard 并不是其搜索引擎的替代品,而是“搜索的補(bǔ)充”, Bard自稱為“你具有創(chuàng)造力的得力協(xié)作者(Collaborator)“。
谷歌其實(shí)也宣布了一系列關(guān)于在自家產(chǎn)品線中集成AI功能的重磅更新:旗下包括包括Gmail以及Google Doc、Sheets、Slides等所有Workspace辦公組件將上線生成式AI功能,同時(shí)還開放了自家的大語(yǔ)言模型PaLM的 API。
推演和猜想:不可錯(cuò)過(guò)的未來(lái)
那么,為什么各大公司都在狂熱地入場(chǎng)ChatGPT這樣的生成式語(yǔ)言技術(shù), 即使非常匆忙,甚至在技術(shù)尚未成熟時(shí)也要分一杯羹呢?
生成式AI無(wú)論是對(duì)企業(yè),還是對(duì)用戶來(lái)說(shuō),可能都將帶來(lái)一系列的變革。首先,在當(dāng)今的世界中,很多人都會(huì)使用手機(jī)、電腦等設(shè)備來(lái)進(jìn)行內(nèi)容的生產(chǎn)、創(chuàng)作和消費(fèi)。這些內(nèi)容覆蓋各行各業(yè)或者各種消費(fèi)場(chǎng)景,比如說(shuō)客戶服務(wù)、語(yǔ)言翻譯、市場(chǎng)分析、發(fā)郵件、電商購(gòu)物甚至是寫代碼。生成式AI可以幫助人們提高內(nèi)容產(chǎn)生的效率,并且為人們提供更有趣的交互場(chǎng)景。從企業(yè)視角來(lái)說(shuō),生成式AI有助于各職能的職場(chǎng)人提高工作效率,也有助于企業(yè)內(nèi)部流程更加智能和自動(dòng)化,從而節(jié)約人力成本。從用戶視角來(lái)說(shuō),各家公司更加智能化定制化的服務(wù)體系也能改善用戶在平臺(tái)上的體驗(yàn),從而提升用戶在平臺(tái)上的留存和購(gòu)買力。
在企業(yè)競(jìng)爭(zhēng)的維度上,由于泛用戶側(cè)的互聯(lián)網(wǎng)的滲透已經(jīng)達(dá)到一個(gè)平緩的階段,使用互聯(lián)網(wǎng)用戶的規(guī)模和一天當(dāng)中的使用時(shí)長(zhǎng)相對(duì)已經(jīng)固定。優(yōu)先有效利用生成式AI創(chuàng)造多種業(yè)務(wù)場(chǎng)景和落地模式的公司更容易在用戶側(cè)的競(jìng)爭(zhēng)中占據(jù)一席之地,對(duì)用戶的APP使用時(shí)長(zhǎng)和使用場(chǎng)景進(jìn)行再分配,甚至進(jìn)一步增加用戶更多場(chǎng)景的滲透空間。
從行業(yè)版圖上看,生成式AI最終可以落地在什么場(chǎng)景,最終會(huì)形成什么樣的競(jìng)爭(zhēng)格局,又會(huì)普惠什么樣的人群呢?
我們做一些推演和猜想。
美國(guó)信息服務(wù)公司Gartner曾經(jīng)做過(guò)一個(gè)技術(shù)成熟度曲線,非常適用于近兩年諸如元宇宙和生成式AI風(fēng)口的客觀規(guī)律。當(dāng)前,生成式AI處在了技術(shù)萌芽期(Technology Trigger),并隨著ChatGPT的注冊(cè)用戶數(shù)暴漲而暴露在媒體的聚光燈下。于是各大擁有算力并做過(guò)一些早期AI研發(fā)的巨頭公司開始借助這波趨勢(shì)嘗試深化和商用。但從各公司的技術(shù)成熟度上看,生成式AI還擁有諸多使用時(shí)暴露出的漏洞,既沒(méi)有找到合適的商用模式,又會(huì)面臨各國(guó)政策和隱私法律的阻礙。因此這項(xiàng)技術(shù)很有可能同自動(dòng)駕駛或者元宇宙一樣,面臨著期望膨脹期后的泡沫破裂期。而企業(yè)競(jìng)爭(zhēng)的幸存者會(huì)將讓他們受益的實(shí)例具體化,在復(fù)蘇期推出更加成熟的產(chǎn)品,最終在生產(chǎn)成熟期獲得廣泛的采用和更明確的生存能力標(biāo)準(zhǔn)。
Gartner的技術(shù)成熟度曲線,該圖片來(lái)自網(wǎng)絡(luò)
對(duì)于最終將會(huì)實(shí)現(xiàn)第一階段落地的商用場(chǎng)景,筆者認(rèn)為會(huì)有如下的幾個(gè)方向:
1. 搜索引擎的智能化:人們?cè)谒阉饕嫔匣ㄙM(fèi)的時(shí)間可能會(huì)變長(zhǎng),這是由于人們可能期待更智能化的搜索答案,諸如春節(jié)的拜年****、學(xué)生論文的模版和一些相關(guān)資料的有效聚合;能實(shí)現(xiàn)這一結(jié)果的搜索引擎將能迎來(lái)用戶更強(qiáng)的接受率;
2. 企業(yè)的內(nèi)容生產(chǎn)提效化:這包括市場(chǎng)數(shù)據(jù)的自動(dòng)化收集和語(yǔ)義理解,還有企業(yè)員工與生產(chǎn)工具的交互從打字式走向?qū)υ捠降鹊龋?/span>
3. 客服系統(tǒng)場(chǎng)景深化:諸如金融(比如銀行和投資管理)、電商平臺(tái)的后臺(tái)客服系統(tǒng)將因?yàn)樯墒紸I而更加智能化和場(chǎng)景深化,并且可以幫助企業(yè)有效節(jié)約人力成本。
*參考資料:
注:封面圖來(lái)自于Pexels,版權(quán)屬于原作者。如果不同意使用,請(qǐng)盡快聯(lián)系我們,我們會(huì)立即刪除。*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。