谷歌 Bard 被曝剽竊 ChatGPT ?BERT 一作跳槽 OpenAI ,揭驚天內(nèi)幕
谷歌有大麻煩了!外媒爆料說,Bard 的訓(xùn)練數(shù)據(jù)部分來自 ChatGPT。谷歌可能跳到黃河里也洗不清了。
本文引用地址:http://m.butianyuan.cn/article/202303/445158.htm3 月 29 日,外媒 The Information 曝出了一個驚天大瓜!
谷歌的離職員工、已跳槽 OpenAI 的頂級研究員竟然曝出 ——Bard 竟是用 ChatGPT 的數(shù)據(jù)訓(xùn)練的!
如果事情為真,這可真算得上是谷歌的頂級丑聞了。
對抗 ChatGPT 的 AI,竟然用的是 ChatGPT 的訓(xùn)練數(shù)據(jù),這可太諷刺了。
并且,這也明顯違反了 OpenAI 的服務(wù)條款 —— 要知道,微軟擁有將 ChatGPT 用于商業(yè)目的的獨(dú)家許可,谷歌因此很可能要吃官司。
訓(xùn)練 Bard,谷歌竟「借用」了 ChatGPT 的數(shù)據(jù)?
Jacob Devlin 這個名字,可謂如雷貫耳。谷歌在 2018 年發(fā)表的 BERT 模型的論文,Devlin 就是一作。
正是這篇論文,引發(fā)學(xué)術(shù)界 AI 研究的熱潮。而 Devlin 的研究,可以說為谷歌和 OpenAI 的語言模型奠定了很大的基礎(chǔ)。
論文地址:https://arxiv.org/ pdf / 1810.04805.pdf
雖然 Devlin 跳槽到 OpenAI,是今年 1 月的事,我們很早就知道了。
但是 Bard 用 ChatGPT 數(shù)據(jù)訓(xùn)練的事,卻是最近才曝出。
根據(jù) The Information 的報道,Devlin 從谷歌離職的原因之一,就是他發(fā)現(xiàn)谷歌用于對抗 ChatGPT 的種子選手 ——Bard 在訓(xùn)練時,用的正是 ChatGPT 的數(shù)據(jù)。
他警告了 CEO 劈柴和其他高管,告訴他們 Bard 團(tuán)隊(duì)正在使用來自 ShareGPT 的信息訓(xùn)練,隨后辭職。
爆料一發(fā)出,業(yè)界人士們都炸了。
有網(wǎng)友評論道:「這可是業(yè)內(nèi)大忌啊。」
而當(dāng)事人之一、ShareGPT 的創(chuàng)建人 Steven Tey 表示,其實(shí)自己早就知道這個事了,并且此事早就在谷歌內(nèi)部傳開,許多員工對此很不滿,很擔(dān)憂。
隨后,他又發(fā)帖說,這下,貓可從口袋里跑出來了吧。(諺語,指無意間泄密)
這也是為什么我們上周關(guān)閉了 ShareGPT 的 Explore 頁面,其中有超 112k 的共享對話數(shù)據(jù)。
太瘋狂了!
其實(shí)是個「套殼」ChatGPT?
ShareGPT,是 Steven Tey 和 Dom Eccleston 在 2022 年 12 月共同創(chuàng)建的一個 Chrome 擴(kuò)展,能夠捕捉和分享人們在 ChatGPT 中的對話內(nèi)容。
通過捕獲他人與 ChatGPT 的完整對話,ShareGPT 能生成一個 URL。通過這個擴(kuò)展,人們可以直接分享 URL,省去了截取多個對話截圖的時間。
也就是說,如果用 ShareGPT 的信息訓(xùn)練 Bard,很可能把 Bard 訓(xùn)練成一個「翻版 ChatGPT」。
據(jù)內(nèi)部人士透露,Devlin 發(fā)出警告后,谷歌立馬停止了利用這些數(shù)據(jù)來訓(xùn)練 Bard。
但在外媒 The Verge 就該事件詢問谷歌發(fā)言人 Chris Pappas 時,他卻否認(rèn)了。
他很肯定地說,「Bard 的訓(xùn)練沒有使用任何來自 ShareGPT 或 ChatGPT 的數(shù)據(jù)?!?/p>
到底用沒用呢?此事目前還是個羅生門。
有意思是,OpenAI 此前就經(jīng)常陷入爭議,許多網(wǎng)站和藝術(shù)家指控 ChatGPT 是從自己這里竊取的數(shù)據(jù)。
而今天,這是第一次有人指控別的公司從 ChatGPT 竊取數(shù)據(jù)。
就是說,貴圈真的是個圈。
谷歌的反擊,有些狼狽
此前,大火的 ChatGPT 整合進(jìn)必應(yīng)中,已經(jīng)導(dǎo)致了谷歌的股價下跌。
搜索巨頭地位被撼動的谷歌,正在不顧一切地迎頭追趕。
結(jié)果 Bard 在發(fā)布會上當(dāng)場出錯,讓谷歌淪為笑柄,市值蒸發(fā) 1000 億。
遮遮掩掩了一個多月,Bard 終于正式開放。大家使用后發(fā)現(xiàn),Bard 正確率不算高,寫代碼也不太行,比起 ChatGPT 來,要更拉跨一些。
而最關(guān)鍵的問題其實(shí)是,Bard 已經(jīng)晚了一步。即使正式發(fā)布,媒體和坊間都反響了了,似乎無人在意。
而 Devlin 離職谷歌、加入 OpenAI 的選擇,更是寓意深刻 —— 既然谷歌如此嚴(yán)重依賴 ShareGPT,那大神就干脆加入 OpenAI,不用中間商。
而更嚴(yán)重的是,微軟擁有將 ChatGPT 用于商業(yè)目的的獨(dú)家許可。
因此,Devlin 擔(dān)心谷歌以這種方式使用數(shù)據(jù),違反了 OpenAI 的服務(wù)條款。如果此事得到證實(shí),谷歌很可能面臨訴訟。
當(dāng)然,OpenAI 也并不清白。訓(xùn)練 ChatGPT 的數(shù)據(jù),也是從公共互聯(lián)網(wǎng)上「借用」的。這些內(nèi)容,其實(shí)也未經(jīng)藝術(shù)家、作家、攝像師等人類創(chuàng)作者的許可。
雖然微軟最近確實(shí)宣布了一些補(bǔ)償計(jì)劃,要補(bǔ)償為 Bing Chat 的答案做出貢獻(xiàn)的內(nèi)容創(chuàng)作者。
但說到底,無論是谷歌還是微軟,它們唯一真正關(guān)心的事情,還是股東的利潤。
谷歌大腦和 DeepMind 聯(lián)姻
而 The Information 的報道中除了有上面那個大瓜,還有另一個瓜。
ChatGPT 自去年 11 月 ChatGPT 爆火之后,谷歌和 OpenAI 之間的軍備競賽,就日益劍拔弩張。
現(xiàn)在,為了對抗 ChatGPT,谷歌的兩個最強(qiáng)「大腦」——DeepMind 和 Google Brain,已經(jīng)選擇了強(qiáng)強(qiáng)聯(lián)手。
據(jù)兩位知情人士透露,DeepMind 和 Google Brain 最近幾周正在開發(fā)與 OpenAI 競爭的另一產(chǎn)品,內(nèi)部代號為 Gemini(雙子座)。
Sundar Pichai、Demis Hassabis 和 Jef Dean(從左起)
自谷歌 2014 年收購 DeepMind 以來,DeepMind 先后發(fā)布了幾款令人世人驚艷的人工智能,比如 AlphaGO、AlphaCode、AlphaFold??梢哉f,風(fēng)頭遠(yuǎn)遠(yuǎn)超過了谷歌。
自 ChatGPT 發(fā)布后,谷歌大腦時不時更新一些進(jìn)展,然而 DeepMind 一直還公布近來的大動作。
而現(xiàn)在,Alphabet 這兩個人工智能實(shí)驗(yàn)室的員工都認(rèn)為,OpenAI 已經(jīng)遠(yuǎn)遠(yuǎn)超越了他們。再加上,許多關(guān)鍵工程師和研究人員紛紛流向 OpenAI,讓谷歌內(nèi)部人士紛紛堪憂。
加上上周 Bard 向部分用戶開放后,表現(xiàn)又比不上 ChatGPT。
眼看自己親手培養(yǎng)的孩子 Bard 不如人意,谷歌研究人員干脆再要一個,目標(biāo)是要能與 GPT-4 一戰(zhàn)。
由此看來,Gemini(雙子座)重要性不言而喻。
其中一位知情人士表示,谷歌大腦的負(fù)責(zé)人、谷歌資深人工智能研究主管 Jef Dean 已經(jīng)在該項(xiàng)目中都自己手動敲代碼了。
可以說,Gemini 的誕生是被迫聯(lián)姻的孩子。因?yàn)椋饲?DeepMind 和 Google Brain 這兩個實(shí)驗(yàn)室很少相互合作或共享計(jì)算機(jī)代碼。
一位知情人士表示,但現(xiàn)在,由于雙方都希望開發(fā)自己的機(jī)器學(xué)習(xí)模型,以與 OpenAI 競爭,而且需要大量的計(jì)算能力。因此他們別無選擇,只能合作。
如今,這一努力讓谷歌在搜索和云方面等無數(shù)團(tuán)隊(duì)的產(chǎn)品路線,因 ChatGPT 的競爭而受到了動搖。
沒錢賺,Google Assistant 重組
這不,就在近日,Google Assistant 部門面臨重組,以專注研發(fā) Bard。
在給員工的一份備忘錄「Changes to Assistant and Bard teams」中,列出了許多高管變動。
一位 Google Assistant 工程副總裁 Amar Subramanya 現(xiàn)在將領(lǐng)導(dǎo) Bard。而另一位工程副總毛建昌「因個人原因」離開了谷歌,谷歌商務(wù)部門副總裁 Peeyush Ranjan 成為了接盤者。
Google Assistant 業(yè)務(wù)部門副總裁兼負(fù)責(zé)人 Sissie Hsiao 在這份備忘錄中稱,「鑒于 Bard 團(tuán)隊(duì)的不懈努力,我們希望繼續(xù)支持并執(zhí)行未來研究項(xiàng)目。」
這聽起來像 Assistant 團(tuán)隊(duì)現(xiàn)在支持谷歌以對抗 ChatGPT「紅色代碼」的戰(zhàn)斗。
Google Assistant 注定是失敗了嗎?其實(shí),越來越多的證據(jù)表明該部門正在走下坡路:
從 2016 年到 2021 年,Google Assistant 在五年內(nèi)發(fā)布了八個主要的揚(yáng)聲器 / 智能顯示器硬件,但硬件發(fā)布似乎已經(jīng)停止。上一次硬件發(fā)布是在 2021 年 3 月。那是整整兩年前的事了。
2022 年,谷歌從兩個內(nèi)部產(chǎn)品線中移除了 Assistant 支持:Nest Wi-Fi 和 Fitbit 可穿戴設(shè)備。
2022 年還看到了 The Information 的一份報告,該報告稱谷歌希望「減少投資開發(fā)其用于汽車和非谷歌制造的設(shè)備的 Google Assistant 語音輔助搜索」。
Google Assistant 的駕駛模式于 2022 年關(guān)閉。
Google Assistant 的「Duplex on the web」功能也于 2022 年關(guān)閉。
Google Assistant 的一項(xiàng)核心獨(dú)特功能 Reminders 即將被關(guān)閉,取而代之的是 Google Task Reminders。
Google Assistant 從來沒有賺錢過。硬件以成本價出售,沒有廣告,而且沒有人支付月費(fèi)來使用 Google 助理。處理所有這些語音命令的服務(wù)器成本也很高,盡管一些較新的設(shè)備已經(jīng)以隱蔽的成本削減舉措轉(zhuǎn)移到設(shè)備上處理。Assistant 最大的競爭對手亞馬遜 Alexa 也處于同一條船上,每年虧損 100 億美元。
從 Google Assistant 這些年的發(fā)展也可以看出,谷歌的運(yùn)作方式真的太封建了。
這家公司似乎有一種約定俗成的觀點(diǎn),即讓項(xiàng)目在現(xiàn)有產(chǎn)品(如地圖或助手)的支持下運(yùn)轉(zhuǎn),才是一種可靠的掙錢方式。
因此,盡管公司里已經(jīng)囤積了許多世界上最優(yōu)秀的 AI 研究人員,但他們的才能似乎只能受困于企業(yè)戰(zhàn)略的軌道。
在 Bard 之前,谷歌這些年在 AI 市場化上的進(jìn)步,無非就是不斷改進(jìn) Google Assistant 等一些小玩意,用 AI 做一些邊角料。
這樣一個巨頭,本應(yīng)是順應(yīng)趨勢、推動潮流、攪動世界的。
網(wǎng)友評論
此事一出,已經(jīng)有網(wǎng)友放言:那咱們都算是谷歌 Bard 的聯(lián)合創(chuàng)始人了,趕緊寫到簡歷里。
「這一場公關(guān)戰(zhàn),谷歌是真的輸了……」
評論