博客專欄

EEPW首頁 > 博客 > 谷歌全面反攻 ChatGPT!PaLM 2、Gemini 雙殺,Bard 正式開放(1)

谷歌全面反攻 ChatGPT!PaLM 2、Gemini 雙殺,Bard 正式開放(1)

發(fā)布人:AI科技大本營 時(shí)間:2023-05-22 來源:工程師 發(fā)布文章

前幾日,在 Google 官方發(fā)布的文章中提到,「自 2008 年 Google 首次舉辦 I/O 大會(huì),已經(jīng)過去了整整十五年。」

在過去的十五年中,Google 作為全球一直領(lǐng)先的科技公司,深刻影響了全世界互聯(lián)網(wǎng)產(chǎn)業(yè)的格局與發(fā)展方向。每年一度 I/O 大會(huì)(除 2020 年因疫情取消),更是成為 Google 大秀肌肉、推陳出新的舞臺(tái)。

直到近期 OpenAI 連續(xù)發(fā)布多個(gè)劃時(shí)代意義的產(chǎn)品與技術(shù),提前推進(jìn)了 AIGC 時(shí)代的進(jìn)度條。隨后微軟快速采取了各種行動(dòng),將 GPT 能力集成進(jìn)瀏覽器、搜索引擎,甚至辦公套件,讓微軟在人工智能賽道上探出身位。人們開始好奇移動(dòng)開發(fā)時(shí)代的絕對(duì)霸主—— Google,將如何通過本次 I/O 的技術(shù)發(fā)布,重回技術(shù)領(lǐng)導(dǎo)地位。

今天凌晨 2023 Google I/O 大會(huì)的主題演講環(huán)節(jié),Google and Alphabet CEO Sundar Pichai 及數(shù)位技術(shù)、產(chǎn)品負(fù)責(zé)人,從 AI、移動(dòng)開發(fā)、云服務(wù)和消費(fèi)者產(chǎn)品幾個(gè)方面,快速介紹了多項(xiàng)重要的更新:

  • 正式發(fā)布 5400 億參數(shù)大模型 PaLM 2,已為 Google 旗下產(chǎn)品 25 項(xiàng)產(chǎn)品賦能。同時(shí)宣告了多模態(tài)基礎(chǔ)模型 Gemini,Google 所有產(chǎn)品都將基于它們,包括 Google Bard、搜索、云。

圖片

Google 產(chǎn)品一覽圖,圖源:Jedi Lu(基于 CC 共享協(xié)議引用)

  • Google 對(duì)標(biāo) ChatGPT 的智能聊天機(jī)器人 Bard 也迎來了新進(jìn)展,正式面向 180 個(gè)國家/地區(qū)開放使用,目前支持英語、日語、韓語交互,近期將擴(kuò)展其他 40 種語言。

  • Android 14 新增 Magic Compose 功能,可幫助用戶智能回復(fù)文本信息。

  • Google 官方的折疊機(jī)來了!推出首款折疊屏手機(jī) Pixel Fold 售價(jià) 1799 美金,及配有智能支架的平板電腦 Pixel Tablet,售價(jià) 499 美金、以及中端系列手機(jī) Pixel 7A,售價(jià) 499 美金。不知蘋果在今年是否會(huì)緊隨發(fā)布折疊機(jī)。

  • Google 辦公套件 Workspace 推出 AIGC 工具包—Duet AI,現(xiàn)開放試用。

  • Google 搜索推出 Perspectives 功能,利用 AI 能力,優(yōu)化搜索體驗(yàn)。

  • Wear OS 4 即將發(fā)布,將延長電池壽命,完善與智能家居的交互使用。


圖片

PaLM 2 發(fā)布,能力滲透 Google 全線產(chǎn)品


在正式發(fā)布 PaLM 2 前, Pichai 先通過發(fā)布 Gmail、Google Map、Google Photo 三個(gè)產(chǎn)品中的新功能,展現(xiàn)其實(shí)際應(yīng)用能力。現(xiàn)場介紹了 Gmail 產(chǎn)品中基于 PaLM 2 實(shí)現(xiàn)的三項(xiàng)新能力:Help me write 幫我寫、Smart Compose 智能補(bǔ)全、Smart Reply 智能回復(fù)。并且據(jù)統(tǒng)計(jì)過去一年中,智能寫作的相關(guān)功能已經(jīng)穩(wěn)定為用戶了 1800 億次服務(wù)。同樣的 AI 能力還應(yīng)用在了 Google Map 中,提供了沉浸式的導(dǎo)航路線視圖,這項(xiàng)功能將在不久后開放,在今年年底前支持第一批城市。同樣,在 Google Photo 中引入 AI 能力后,也為用戶提供了強(qiáng)大的圖片編輯能力。

Pichai 嚴(yán)肅強(qiáng)調(diào)了 Google 的使命是:整合全球信息以供大眾使用,并讓人人受益(Organize the world's information and make it universally accessible and useful.)。這句強(qiáng)調(diào)不禁聯(lián)想到,本屆 I/O 大會(huì)前一周,圖靈獎(jiǎng)得主、人工智能學(xué)界泰斗、Google 前人工智能專家 Geoffrey Hinton 辭去谷歌工作,并表示了對(duì)人工智能技術(shù)快速發(fā)展的擔(dān)憂。

PaLM 2(Pathway Language Model)也是本次大會(huì) AI 板塊最重大的發(fā)布之一,這是 Google 開發(fā)的 5400 億參數(shù)的大型語言模型(LLM),在本次發(fā)布的 PaLM 2 預(yù)覽版中,重點(diǎn)改進(jìn)了模型的多語言翻譯、數(shù)學(xué)、程序語言、推理和自然語言生成能力。

其中多語言翻譯能力的提升,來源于 PaLM 2 基于 100 多種語言中文本的訓(xùn)練。這使得模型在理解、生成和翻譯細(xì)微差別的文本(如成語、詩歌和謎語)的能力都有了顯著提高。

在推理方面,PaLM 2 的數(shù)據(jù)集包括科學(xué)論文、大量涵蓋數(shù)學(xué)公式的各類網(wǎng)頁,提高了模型的邏輯、常識(shí)推理和數(shù)學(xué)能力。

在程序語言方面,PaLM 2 在海量開源代碼的基礎(chǔ)上進(jìn)行了預(yù)訓(xùn)練。除了 Python 和 JavaScript 這類流行語言,這還包括 Prolog、Fortran 和 Verilog 這類語言。另外,Google 在 PaLM 2 的基礎(chǔ)上訓(xùn)練了用于編程和調(diào)試的專業(yè)模型 Codey,安全知識(shí)模型 Sec-PaLM 以及醫(yī)學(xué)知識(shí)模型 Med-PaLM 2 。

圖片

目前 PaLM 2 提供四個(gè)大小版本,適用于不同的使用場景,每種規(guī)格并以動(dòng)物名,從最小到最大:Gecko 壁虎、Otter 水獺、Bison 野牛和 Unicorn 獨(dú)角獸。其中 Gecko 非常輕巧,可以在移動(dòng)設(shè)備上工作,并且速度足夠快,即使在離線時(shí)也能在設(shè)備上穩(wěn)定運(yùn)行。

值得一提的還有,Google 公布了其下一代多模態(tài)基礎(chǔ)模型 Gemini,由 DeepMind 仍然還在訓(xùn)練過程中,支持多種輸入方式,包含高效的工具,能夠讓開發(fā)者實(shí)現(xiàn) API 集成。

圖片

而 Google 做模型和微軟等不一樣的地方可能就是對(duì)于社會(huì)責(zé)任的體現(xiàn)。如何判別 AIGC 生成的內(nèi)容?Google 帶來了兩項(xiàng)工具——嵌入水印和嵌入元數(shù)據(jù)(meta data)。


圖片

Bard 取消試用制,用來寫代碼更順暢了!


作為直接對(duì)標(biāo) ChatGPT 的產(chǎn)品,Bard (https://bard.google.com/)一直被寄予厚望。在這次大會(huì)上,Bard 正式取消了排隊(duì)試用機(jī)制,180 多個(gè)國家和地區(qū)目前可以直接使用 Bard,但中國地區(qū)訪問仍然受限。目前版本的 Bard 僅支持英語、日語、韓語內(nèi)容,并承諾在未來盡快支持其他 40+種語言。

在本次的演示中,升級(jí)后的 Bard 更適合生成代碼,包括 20 多種語言的代碼生成、調(diào)試、編寫注釋。在 Bard 演示的環(huán)節(jié)強(qiáng)調(diào)了其可擴(kuò)展性,例如使用 Bard 寫代碼可以一鍵拖拽至 Colab 直接運(yùn)行。除此之外,如果使用 Bard 生成了比如郵件內(nèi)容、表格之類的,也可以直接拖拽進(jìn) Gmail、以及 Google 云端硬盤的文件中。

圖片

除了 Colab,Bard 還將與包括 Adobe Firefly 在內(nèi)的更多合作伙伴進(jìn)一步合作,未來可以使用 Bard 直接生成代碼,在各個(gè)軟件工具平臺(tái)上使用。

在現(xiàn)場的展示中,Bard 可以在其回答中顯示圖像,比如用戶正在尋找有關(guān)旅游目的地的信息,Bard 可以在回復(fù)框中輸出圖片,展示熱門景點(diǎn)的圖片。就目前展示和線上試用的效果而言,這些能力對(duì)比當(dāng)前 ChatGPT ,Bard 僅僅做到了追趕,少部分功能的實(shí)用性讓人眼前一亮。



*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉