AI的“安卓時刻”:開源大模型正在追上谷歌和ChatGPT
一位計算機科學(xué)教授表示,免費的AI模型現(xiàn)在在性能上“相當接近”谷歌和ChatGPT開發(fā)商OpenAI的專有模型,大多數(shù)軟件開發(fā)人員最終將選擇使用免費的模型。
本文引用地址:http://m.butianyuan.cn/article/202305/446834.htm今年2月,Meta發(fā)布開源大語言模型LLaMA,開啟AI“安卓時刻”。
幾周之內(nèi),學(xué)術(shù)界的一些學(xué)者就將這些模型轉(zhuǎn)化為開源軟件,為ChatGPT和其他專有人工智能軟件的免費替代品提供動力。
據(jù)The Information周一報道,加州大學(xué)伯克利分校計算機科學(xué)教授Ion Stoica表示,免費的AI模型現(xiàn)在在性能上“相當接近”谷歌和ChatGPT開發(fā)商OpenAI的專有模型,大多數(shù)軟件開發(fā)人員最終將選擇使用免費的模型。據(jù)悉,Stoica利用Meta的技術(shù)幫助開發(fā)了一個關(guān)鍵的AI開源模型。
這讓人想起不久前谷歌的一份泄密文件,谷歌研究員在這份泄密文件中坦言,谷歌沒有護城河,OpenAI也是如此,與開源AI競爭將難以占據(jù)優(yōu)勢。
文件中提到:
“雖然我們的模型在質(zhì)量上仍有一點優(yōu)勢,但差距正在以令人驚訝的速度迅速縮小。開源模型訓(xùn)練速度更快,可定制性更強,更私密,而且比同類產(chǎn)品能力更出色。他們正在用100美元和130億的參數(shù)做一些谷歌1000萬美元和540億的參數(shù)難以企及的事情,而且在短短幾周內(nèi)就能做到,而不是幾個月?!?/span>
這也就是說,如果以上都為真,開源人工智能可能會顛覆谷歌、OpenAI、微軟和其他出售專有模型使用權(quán)的公司的商業(yè)模式。
分析稱,開源人工智能可以讓任何人以低廉的成本獲得強大的人工智能工具,Meta也可從中獲得回報。
專注于專有模型可能會落后
Stoica是使用Meta的研究開發(fā)Vicuna的學(xué)者之一,Vicuna是一種開源語言理解模型,于今年3月發(fā)布。Vicuna的質(zhì)量和開源AI的快速發(fā)展促使谷歌高級工程師Luke Sernau在泄密文件中警告同事,他們的公司在追趕OpenAI的過程中專注于專有模型可能會落后。
他說,對于用戶而言,如果有一個沒有使用限制、免費、高質(zhì)量的替代品,誰還會為谷歌的產(chǎn)品付費呢?他還說,開源AI的開發(fā)正在“掠奪我們”,并補充說“谷歌應(yīng)該讓自己成為開源社區(qū)的領(lǐng)導(dǎo)者”,并“放棄對我們模型的一些控制權(quán)”。
這份泄密文件引起了整個行業(yè)的共鳴,包括一些谷歌員工,盡管該文件的論點可能夸大了開源人工智能的能力,低估了它的成本和其他風(fēng)險,但大多數(shù)AI從業(yè)者都同意泄密文件的結(jié)論之一,即Meta將從發(fā)布其模型中獲益。Meta在內(nèi)部使用AI模型進行內(nèi)容推薦和廣告定位,隨著開發(fā)人員改進Meta發(fā)布的模型,Meta將能夠?qū)⑦@些改進整合到其內(nèi)部AI中。
谷歌并沒有對AI軟件采取完全專有的方法。早在ChatGPT出現(xiàn)之前的2020年,它就發(fā)布了一個開源語言模型T5,使開發(fā)人員能夠構(gòu)建可以完成翻譯和摘要等任務(wù)的軟件。谷歌隨后還發(fā)布了一個更高級的版本,F(xiàn)lan-T5。但據(jù)Stoica和其他從業(yè)人員說,Meta發(fā)布的軟件使谷歌的模型得到了重大改進,這使得工程師們更有可能選擇基于Meta軟件的模型。
報道:OpenAI的開源語言模型也要來
據(jù)一位知情人士透露,不止是Meta,谷歌的主要AI競爭對手OpenAI也正準備向公眾發(fā)布一種新的開源語言模型,該計劃此前從未被報道過。
目前尚不清楚OpenAI即將推出的開源軟件,是否會搶走使用Meta模型開發(fā)的軟件的風(fēng)頭。但分析稱,它不太可能發(fā)布一款能與它正在銷售的專有模型GPT競爭的模型。OpenAI 270億美元的私人估值取決于未來,盡管GPT的前兩個版本是開源的,但GPT4不是開源的。
像Vicuna這樣的開源模型訓(xùn)練成本低至幾百美元,讓用戶可以選擇避免向軟件提供商支付昂貴的費用。結(jié)果是,最近幾周,開源替代品激增。
除了基于Meta軟件的Vicuna等模型外,工程師還可以從德國非營利組織LAION以及Databricks和Stability AI等初創(chuàng)公司中選擇其他模型。Stoica創(chuàng)建了一個網(wǎng)站,試圖評估那些開源模型與專有模型(如OpenAI的GPT-4)的質(zhì)量。
Stoica說,與開源軟件相比,谷歌仍然有兩個優(yōu)勢。1、如果谷歌利用其大量的用戶數(shù)據(jù),它的模型可以更好地用于某些特殊目的,例如內(nèi)容推薦。2、谷歌在管理大型計算機基礎(chǔ)設(shè)施方面的專業(yè)知識意味著它將能夠以更低的成本運行AI軟件模型,包括用于其云客戶。
與此同時,OpenAI在從數(shù)百萬人與ChatGPT交互的方式中收集數(shù)據(jù)方面取得了領(lǐng)先,這無疑有助于它改進AI軟件,而且OpenAI與微軟達成了一項私下協(xié)議,可以使用微軟的計算基礎(chǔ)設(shè)施。
但開源AI模型將允許更多公司使用專有數(shù)據(jù)自行解決問題。Stoica說,例如,一家航空公司可以使用其數(shù)百萬客戶服務(wù)電話的數(shù)據(jù)來創(chuàng)建自動響應(yīng)。彭博社在3月份宣布,該媒體使用其數(shù)據(jù)來訓(xùn)練一種更善于理解金融信息的機器學(xué)習(xí)模型。
評論