AI的“安卓時(shí)刻”:開(kāi)源大模型正在追上谷歌和ChatGPT
一位計(jì)算機(jī)科學(xué)教授表示,免費(fèi)的AI模型現(xiàn)在在性能上“相當(dāng)接近”谷歌和ChatGPT開(kāi)發(fā)商O(píng)penAI的專(zhuān)有模型,大多數(shù)軟件開(kāi)發(fā)人員最終將選擇使用免費(fèi)的模型。
本文引用地址:http://m.butianyuan.cn/article/202305/446834.htm今年2月,Meta發(fā)布開(kāi)源大語(yǔ)言模型LLaMA,開(kāi)啟AI“安卓時(shí)刻”。
幾周之內(nèi),學(xué)術(shù)界的一些學(xué)者就將這些模型轉(zhuǎn)化為開(kāi)源軟件,為ChatGPT和其他專(zhuān)有人工智能軟件的免費(fèi)替代品提供動(dòng)力。
據(jù)The Information周一報(bào)道,加州大學(xué)伯克利分校計(jì)算機(jī)科學(xué)教授Ion Stoica表示,免費(fèi)的AI模型現(xiàn)在在性能上“相當(dāng)接近”谷歌和ChatGPT開(kāi)發(fā)商O(píng)penAI的專(zhuān)有模型,大多數(shù)軟件開(kāi)發(fā)人員最終將選擇使用免費(fèi)的模型。據(jù)悉,Stoica利用Meta的技術(shù)幫助開(kāi)發(fā)了一個(gè)關(guān)鍵的AI開(kāi)源模型。
這讓人想起不久前谷歌的一份泄密文件,谷歌研究員在這份泄密文件中坦言,谷歌沒(méi)有護(hù)城河,OpenAI也是如此,與開(kāi)源AI競(jìng)爭(zhēng)將難以占據(jù)優(yōu)勢(shì)。
文件中提到:
“雖然我們的模型在質(zhì)量上仍有一點(diǎn)優(yōu)勢(shì),但差距正在以令人驚訝的速度迅速縮小。開(kāi)源模型訓(xùn)練速度更快,可定制性更強(qiáng),更私密,而且比同類(lèi)產(chǎn)品能力更出色。他們正在用100美元和130億的參數(shù)做一些谷歌1000萬(wàn)美元和540億的參數(shù)難以企及的事情,而且在短短幾周內(nèi)就能做到,而不是幾個(gè)月?!?/span>
這也就是說(shuō),如果以上都為真,開(kāi)源人工智能可能會(huì)顛覆谷歌、OpenAI、微軟和其他出售專(zhuān)有模型使用權(quán)的公司的商業(yè)模式。
分析稱(chēng),開(kāi)源人工智能可以讓任何人以低廉的成本獲得強(qiáng)大的人工智能工具,Meta也可從中獲得回報(bào)。
專(zhuān)注于專(zhuān)有模型可能會(huì)落后
Stoica是使用Meta的研究開(kāi)發(fā)Vicuna的學(xué)者之一,Vicuna是一種開(kāi)源語(yǔ)言理解模型,于今年3月發(fā)布。Vicuna的質(zhì)量和開(kāi)源AI的快速發(fā)展促使谷歌高級(jí)工程師Luke Sernau在泄密文件中警告同事,他們的公司在追趕OpenAI的過(guò)程中專(zhuān)注于專(zhuān)有模型可能會(huì)落后。
他說(shuō),對(duì)于用戶(hù)而言,如果有一個(gè)沒(méi)有使用限制、免費(fèi)、高質(zhì)量的替代品,誰(shuí)還會(huì)為谷歌的產(chǎn)品付費(fèi)呢?他還說(shuō),開(kāi)源AI的開(kāi)發(fā)正在“掠奪我們”,并補(bǔ)充說(shuō)“谷歌應(yīng)該讓自己成為開(kāi)源社區(qū)的領(lǐng)導(dǎo)者”,并“放棄對(duì)我們模型的一些控制權(quán)”。
這份泄密文件引起了整個(gè)行業(yè)的共鳴,包括一些谷歌員工,盡管該文件的論點(diǎn)可能夸大了開(kāi)源人工智能的能力,低估了它的成本和其他風(fēng)險(xiǎn),但大多數(shù)AI從業(yè)者都同意泄密文件的結(jié)論之一,即Meta將從發(fā)布其模型中獲益。Meta在內(nèi)部使用AI模型進(jìn)行內(nèi)容推薦和廣告定位,隨著開(kāi)發(fā)人員改進(jìn)Meta發(fā)布的模型,Meta將能夠?qū)⑦@些改進(jìn)整合到其內(nèi)部AI中。
谷歌并沒(méi)有對(duì)AI軟件采取完全專(zhuān)有的方法。早在ChatGPT出現(xiàn)之前的2020年,它就發(fā)布了一個(gè)開(kāi)源語(yǔ)言模型T5,使開(kāi)發(fā)人員能夠構(gòu)建可以完成翻譯和摘要等任務(wù)的軟件。谷歌隨后還發(fā)布了一個(gè)更高級(jí)的版本,F(xiàn)lan-T5。但據(jù)Stoica和其他從業(yè)人員說(shuō),Meta發(fā)布的軟件使谷歌的模型得到了重大改進(jìn),這使得工程師們更有可能選擇基于Meta軟件的模型。
報(bào)道:OpenAI的開(kāi)源語(yǔ)言模型也要來(lái)
據(jù)一位知情人士透露,不止是Meta,谷歌的主要AI競(jìng)爭(zhēng)對(duì)手OpenAI也正準(zhǔn)備向公眾發(fā)布一種新的開(kāi)源語(yǔ)言模型,該計(jì)劃此前從未被報(bào)道過(guò)。
目前尚不清楚OpenAI即將推出的開(kāi)源軟件,是否會(huì)搶走使用Meta模型開(kāi)發(fā)的軟件的風(fēng)頭。但分析稱(chēng),它不太可能發(fā)布一款能與它正在銷(xiāo)售的專(zhuān)有模型GPT競(jìng)爭(zhēng)的模型。OpenAI 270億美元的私人估值取決于未來(lái),盡管GPT的前兩個(gè)版本是開(kāi)源的,但GPT4不是開(kāi)源的。
像Vicuna這樣的開(kāi)源模型訓(xùn)練成本低至幾百美元,讓用戶(hù)可以選擇避免向軟件提供商支付昂貴的費(fèi)用。結(jié)果是,最近幾周,開(kāi)源替代品激增。
除了基于Meta軟件的Vicuna等模型外,工程師還可以從德國(guó)非營(yíng)利組織LAION以及Databricks和Stability AI等初創(chuàng)公司中選擇其他模型。Stoica創(chuàng)建了一個(gè)網(wǎng)站,試圖評(píng)估那些開(kāi)源模型與專(zhuān)有模型(如OpenAI的GPT-4)的質(zhì)量。
Stoica說(shuō),與開(kāi)源軟件相比,谷歌仍然有兩個(gè)優(yōu)勢(shì)。1、如果谷歌利用其大量的用戶(hù)數(shù)據(jù),它的模型可以更好地用于某些特殊目的,例如內(nèi)容推薦。2、谷歌在管理大型計(jì)算機(jī)基礎(chǔ)設(shè)施方面的專(zhuān)業(yè)知識(shí)意味著它將能夠以更低的成本運(yùn)行AI軟件模型,包括用于其云客戶(hù)。
與此同時(shí),OpenAI在從數(shù)百萬(wàn)人與ChatGPT交互的方式中收集數(shù)據(jù)方面取得了領(lǐng)先,這無(wú)疑有助于它改進(jìn)AI軟件,而且OpenAI與微軟達(dá)成了一項(xiàng)私下協(xié)議,可以使用微軟的計(jì)算基礎(chǔ)設(shè)施。
但開(kāi)源AI模型將允許更多公司使用專(zhuān)有數(shù)據(jù)自行解決問(wèn)題。Stoica說(shuō),例如,一家航空公司可以使用其數(shù)百萬(wàn)客戶(hù)服務(wù)電話(huà)的數(shù)據(jù)來(lái)創(chuàng)建自動(dòng)響應(yīng)。彭博社在3月份宣布,該媒體使用其數(shù)據(jù)來(lái)訓(xùn)練一種更善于理解金融信息的機(jī)器學(xué)習(xí)模型。
評(píng)論