AI的“安卓時(shí)刻”：開源大模型正在追上谷歌和ChatGPT

作者：時(shí)間：2023-05-23 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

一位計(jì)算機(jī)科學(xué)教授表示，免費(fèi)的AI 模型現(xiàn)在在性能上“相當(dāng)接近”谷歌和ChatGPT開發(fā)商OpenAI的專有模型，大多數(shù)軟件開發(fā)人員最終將選擇使用免費(fèi)的模型。

本文引用地址：http://m.butianyuan.cn/article/202305/446834.htm

今年2月，Meta發(fā)布開源大語言模型LLaMA，開啟AI“安卓時(shí)刻”。

幾周之內(nèi)，學(xué)術(shù)界的一些學(xué)者就將這些模型轉(zhuǎn)化為開源軟件，為ChatGPT和其他專有人工智能軟件的免費(fèi)替代品提供動(dòng)力。

據(jù)The Information周一報(bào)道，加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授Ion Stoica表示，免費(fèi)的AI模型現(xiàn)在在性能上“相當(dāng)接近”谷歌和ChatGPT開發(fā)商OpenAI的專有模型，大多數(shù)軟件開發(fā)人員最終將選擇使用免費(fèi)的模型。據(jù)悉，Stoica利用Meta的技術(shù)幫助開發(fā)了一個(gè)關(guān)鍵的AI開源模型。

捕獲.PNG

這讓人想起不久前谷歌的一份泄密文件，谷歌研究員在這份泄密文件中坦言，谷歌沒有護(hù)城河，OpenAI也是如此，與開源AI競(jìng)爭(zhēng)將難以占據(jù)優(yōu)勢(shì)。

文件中提到：

“雖然我們的模型在質(zhì)量上仍有一點(diǎn)優(yōu)勢(shì)，但差距正在以令人驚訝的速度迅速縮小。開源模型訓(xùn)練速度更快，可定制性更強(qiáng)，更私密，而且比同類產(chǎn)品能力更出色。他們正在用100美元和130億的參數(shù)做一些谷歌1000萬美元和540億的參數(shù)難以企及的事情，而且在短短幾周內(nèi)就能做到，而不是幾個(gè)月?！?/span>

這也就是說，如果以上都為真，開源人工智能可能會(huì)顛覆谷歌、OpenAI、微軟和其他出售專有模型使用權(quán)的公司的商業(yè)模式。

分析稱，開源人工智能可以讓任何人以低廉的成本獲得強(qiáng)大的人工智能工具，Meta也可從中獲得回報(bào)。

專注于專有模型可能會(huì)落后

Stoica是使用Meta的研究開發(fā)Vicuna的學(xué)者之一，Vicuna是一種開源語言理解模型，于今年3月發(fā)布。Vicuna的質(zhì)量和開源AI的快速發(fā)展促使谷歌高級(jí)工程師Luke Sernau在泄密文件中警告同事，他們的公司在追趕OpenAI的過程中專注于專有模型可能會(huì)落后。

他說，對(duì)于用戶而言，如果有一個(gè)沒有使用限制、免費(fèi)、高質(zhì)量的替代品，誰還會(huì)為谷歌的產(chǎn)品付費(fèi)呢？他還說，開源AI的開發(fā)正在“掠奪我們”，并補(bǔ)充說“谷歌應(yīng)該讓自己成為開源社區(qū)的領(lǐng)導(dǎo)者”，并“放棄對(duì)我們模型的一些控制權(quán)”。

這份泄密文件引起了整個(gè)行業(yè)的共鳴，包括一些谷歌員工，盡管該文件的論點(diǎn)可能夸大了開源人工智能的能力，低估了它的成本和其他風(fēng)險(xiǎn)，但大多數(shù)AI從業(yè)者都同意泄密文件的結(jié)論之一，即Meta將從發(fā)布其模型中獲益。Meta在內(nèi)部使用AI模型進(jìn)行內(nèi)容推薦和廣告定位，隨著開發(fā)人員改進(jìn)Meta發(fā)布的模型，Meta將能夠?qū)⑦@些改進(jìn)整合到其內(nèi)部AI中。

谷歌并沒有對(duì)AI軟件采取完全專有的方法。早在ChatGPT出現(xiàn)之前的2020年，它就發(fā)布了一個(gè)開源語言模型T5，使開發(fā)人員能夠構(gòu)建可以完成翻譯和摘要等任務(wù)的軟件。谷歌隨后還發(fā)布了一個(gè)更高級(jí)的版本，F(xiàn)lan-T5。但據(jù)Stoica和其他從業(yè)人員說，Meta發(fā)布的軟件使谷歌的模型得到了重大改進(jìn)，這使得工程師們更有可能選擇基于Meta軟件的模型。

報(bào)道：OpenAI的開源語言模型也要來

據(jù)一位知情人士透露，不止是Meta，谷歌的主要AI競(jìng)爭(zhēng)對(duì)手OpenAI也正準(zhǔn)備向公眾發(fā)布一種新的開源語言模型，該計(jì)劃此前從未被報(bào)道過。

目前尚不清楚OpenAI即將推出的開源軟件，是否會(huì)搶走使用Meta模型開發(fā)的軟件的風(fēng)頭。但分析稱，它不太可能發(fā)布一款能與它正在銷售的專有模型GPT競(jìng)爭(zhēng)的模型。OpenAI 270億美元的私人估值取決于未來，盡管GPT的前兩個(gè)版本是開源的，但GPT4不是開源的。

像Vicuna這樣的開源模型訓(xùn)練成本低至幾百美元，讓用戶可以選擇避免向軟件提供商支付昂貴的費(fèi)用。結(jié)果是，最近幾周，開源替代品激增。

除了基于Meta軟件的Vicuna等模型外，工程師還可以從德國非營利組織LAION以及Databricks和Stability AI等初創(chuàng)公司中選擇其他模型。Stoica創(chuàng)建了一個(gè)網(wǎng)站，試圖評(píng)估那些開源模型與專有模型(如OpenAI的GPT-4)的質(zhì)量。

Stoica說，與開源軟件相比，谷歌仍然有兩個(gè)優(yōu)勢(shì)。1、如果谷歌利用其大量的用戶數(shù)據(jù)，它的模型可以更好地用于某些特殊目的，例如內(nèi)容推薦。2、谷歌在管理大型計(jì)算機(jī)基礎(chǔ)設(shè)施方面的專業(yè)知識(shí)意味著它將能夠以更低的成本運(yùn)行AI軟件模型，包括用于其云客戶。

與此同時(shí)，OpenAI在從數(shù)百萬人與ChatGPT交互的方式中收集數(shù)據(jù)方面取得了領(lǐng)先，這無疑有助于它改進(jìn)AI軟件，而且OpenAI與微軟達(dá)成了一項(xiàng)私下協(xié)議，可以使用微軟的計(jì)算基礎(chǔ)設(shè)施。

捕獲.PNG

但開源AI模型將允許更多公司使用專有數(shù)據(jù)自行解決問題。Stoica說，例如，一家航空公司可以使用其數(shù)百萬客戶服務(wù)電話的數(shù)據(jù)來創(chuàng)建自動(dòng)響應(yīng)。彭博社在3月份宣布，該媒體使用其數(shù)據(jù)來訓(xùn)練一種更善于理解金融信息的機(jī)器學(xué)習(xí)模型。

新聞中心

AI的“安卓時(shí)刻”：開源大模型正在追上谷歌和ChatGPT

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)