博客專欄

EEPW首頁 > 博客 > ChatGPT開啟了一場新的人工智能競賽——讓文本框再次變得很酷

ChatGPT開啟了一場新的人工智能競賽——讓文本框再次變得很酷

發(fā)布人:12345zhi 時間:2023-03-27 來源:工程師 發(fā)布文章

By David Pierce

Mar 26, 2023, 9:00 PM GMT+8

很明顯,沒有人預見到ChatGPT的到來。甚至OpenAI也沒有。從某種程度上說,ChatGPT還沒有成為歷史上增長最快的消費應(yīng)用,還沒有把“生成式預訓練變形金剛”變成俗語,還沒有你能想到的每一家公司都在競相采用它的基礎(chǔ)模型,ChatGPT于去年11月作為“研究預覽”發(fā)布。

這篇宣布ChatGPT的博客文章現(xiàn)在成了一個關(guān)于低價拋售的搞笑案例。ChatGPT是InstructGPT的兄弟模型,后者經(jīng)過訓練,可以遵循提示中的指令并提供詳細的響應(yīng)。我們很高興引入ChatGPT,以獲得用戶的反饋,并了解其優(yōu)缺點。”就是這樣!這就是整個宣傳!沒有像詩歌一樣,從根本上改變我們與技術(shù)互動的本質(zhì),甚至沒有一句關(guān)于它有多酷的歌詞。這只是一個研究預習。

但現(xiàn)在,僅僅四個月后,ChatGPT似乎真的要改變我們對技術(shù)的看法了。或者,更準確地說,把它變回來。因為從我們的發(fā)展方向來看,技術(shù)的未來并不是神奇的界面或元宇宙。它是“在計算機上的文本框中輸入命令”。命令行又回來了——它現(xiàn)在聰明多了。

實際上,生成式AI正同時朝著兩個方向發(fā)展。第一個是更多的基礎(chǔ)設(shè)施,為您已經(jīng)使用的東西添加新的工具和功能。像GPT-4和谷歌的LaMDA這樣的大型語言模型可以幫助你寫電子郵件和備忘錄;他們會自動整理你的幻燈片,并糾正你電子表格中的錯誤;他們會比你更好地編輯你的照片;他們會幫你寫代碼,在很多情況下只是為你做。

Three screenshots of Pizza Hut’s chatbot

還記得所有人,甚至是必勝客,都在用聊天機器人嗎?

這大概是人工智能多年來一直在走的道路,對吧?在過去的幾年里,谷歌一直在將各種人工智能集成到其產(chǎn)品中,甚至像Salesforce這樣的公司也建立了強大的人工智能研究項目。這些模型創(chuàng)建成本高,訓練成本高,查詢成本高,并且可能會改變企業(yè)生產(chǎn)力的游戲規(guī)則。在你已經(jīng)使用的產(chǎn)品中增強人工智能是一項大業(yè)務(wù)——或者,至少正在投資于一項大業(yè)務(wù)——而且會持續(xù)很長一段時間。

另一個AI方向,即與AI互動成為一種消費產(chǎn)品,是一個不太明顯的發(fā)展。當然,現(xiàn)在這是有道理的:誰不想和一個知道所有電影、食譜以及在東京可以做什么的機器人聊天呢?如果我說得對,它可能會完全偏離軌道,試圖和你親熱呢?但在ChatGPT席卷全球之前,在Bing和Bard都采納了這個想法并嘗試基于它構(gòu)建自己的產(chǎn)品之前,我當然不會打****在聊天窗口中輸入會是用戶界面的下一個大事件。

在某種程度上,這是一個非常古老的想法的回歸。多年來,大多數(shù)用戶只能通過在空白屏幕上輸入來與計算機交互——命令行就是你告訴機器該做什么的方式。(是的,ChatGPT是很多機器,它們不在你的桌子上,但你知道的。)

但隨后,有趣的事情發(fā)生了:我們發(fā)明了更好的界面!命令行的問題在于,您需要確切地知道輸入什么以及以何種順序使計算機運行。指向和點擊大圖標要簡單得多,而且通過圖片和圖標告訴人們計算機能做什么也容易得多。命令行讓位于圖形用戶界面,GUI仍然占據(jù)主導地位。

不過,開發(fā)人員從未停止過讓聊天UI工作的嘗試。WhatsApp就是一個很好的例子:該公司花了數(shù)年時間試圖弄清楚用戶如何使用聊天與企業(yè)互動。Allo是谷歌眾多失敗的消息應(yīng)用之一,它希望你可以在與朋友的聊天中與人工智能助手互動。聊天機器人的第一輪炒作大約發(fā)生在2016年,當時有很多非常聰明的人認為即時通訊應(yīng)用程序是一切的未來。

消息傳遞界面,也就是“對話式AI”有一些誘人之處。首先,我們都知道如何使用它;即時通訊應(yīng)用是我們與最關(guān)心的人保持聯(lián)系的方式,這意味著我們在這些應(yīng)用上花費了大量的時間和精力。你可能不知道如何瀏覽優(yōu)步(Uber)應(yīng)用,也不知道如何在西南航空(Southwest)的應(yīng)用中找到你的常旅客號碼,但“把這些話發(fā)往這個號碼”幾乎是每個人都能理解的行為。在一個人們不想下載應(yīng)用程序和手機網(wǎng)站的市場中,****可以在很大程度上簡化用戶體驗。

A screenshot of the new Bing chatbot.

必應(yīng)(Bing)(以及其他所有公司)正在使用聊天界面。 圖片:微軟

此外,雖然消息傳遞不是最先進的接口,但它可能是最可擴展的接口。以Slack為例:你可能認為它是一個聊天應(yīng)用程序,但在這個來回交互的界面中,你可以嵌入鏈接、可編輯文檔、交互式投****、信息機器人等等。微信是著名的一個完整的平臺——基本上是整個互聯(lián)網(wǎng)——整合成一個消息應(yīng)用程序。你可以從消息開始,去很多地方。

但這些工具中有很多都以同樣的方式出錯。對于快速交換信息,比如工作時間,聊天是完美的——提出一個問題,然后得到答案。但是將瀏覽目錄作為一系列消息呢?不,謝謝。用上千條來回的****買機****?很難通過。它和語音助手沒有什么不同,如果你曾經(jīng)嘗試用Alexa買簡單的東西,上帝會幫助你。(“對Charmin來說,說‘三’?!?對于大多數(shù)復雜的事情,一個可視化的專用UI遠比一個消息窗口好得多。

當涉及到ChatGPT、Bard、Bing和其他東西時,事情很快就變得復雜起來。這些模型是聰明的和協(xié)作的,但你仍然必須確切地知道要什么,以什么方式,以什么順序來得到你想要的東西?!疤崾竟こ處煛钡南敕ǎ茨愀跺X讓他們知道如何從Stable Diffusion中獲得完美的圖像或讓ChatGPT生成正確的Javascript,看起來很荒謬,但實際上是等式中完全必要的一部分。這與早期計算機時代沒有什么不同,當時只有少數(shù)人知道如何告訴計算機該做什么?,F(xiàn)在已經(jīng)有了市場,你可以在上面購買和出售非常棒的提示;有關(guān)于提示的專家和書籍;我想斯坦福大學已經(jīng)開始開設(shè)快速工程專業(yè)了,大家很快就會開始學習。

生成式AI的非凡之處在于,它感覺上幾乎可以做任何事情。這也是整個問題所在。當你什么都能做的時候,你會做什么?你從哪里開始呢?你如何學習如何使用它,當你唯一的窗口,它的可能性是一個閃爍的光標?最終,這些公司可能會開發(fā)出更可視化、更具互動性的工具,幫助人們真正理解他們能做什么以及它是如何工作的。(這是關(guān)注ChatGPT新插件系統(tǒng)的一個原因,它目前非常簡單,但可以迅速擴展你在聊天窗口中可以做的事情。)現(xiàn)在,他們所能想到的最好的辦法就是就你可能輸入的內(nèi)容提供一些建議。

人工智能將成為一個特色。現(xiàn)在是乘積。這意味著文本框回來了。消息傳遞也是接口。

文章來源:https://www.theverge.com/2023/3/26/23655456/chatgpt-bard-bing-ai-race-text-boxes

*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: ChatGPT 人工智能

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉