博客專欄

EEPW首頁 > 博客 > 字節(jié)跳動類ChatGPT產(chǎn)品「豆包」邀測,我們先試了一下

字節(jié)跳動類ChatGPT產(chǎn)品「豆包」邀測,我們先試了一下

發(fā)布人:機器之心 時間:2023-08-19 來源:工程師 發(fā)布文章

還在測試,名字很 Q。

ChatGPT 問世以后,這大半年的時間,科技領(lǐng)域整個被大模型洗禮了一遍。


在國內(nèi),由百度、阿里代表中國科技企業(yè)率先發(fā)布了大模型對話平臺文心一言、通義千問,騰訊、京東在行業(yè)大模型上也已經(jīng)出手,華為探索了,同時也有一批創(chuàng)業(yè)公司積極參與這場科技競賽。


你是不是也好奇加期待,字節(jié)跳動的大模型在哪里?


如今,它終于露相了。


昨天,字節(jié)跳動大模型對話產(chǎn)品「豆包」邀測,用戶可通過網(wǎng)頁或者下載 App 體驗這一人工智能助手。


圖片


「豆包」鏈接:https://www.doubao.com/


「豆包」有哪些能力?體驗起來效果如何?機器之心首先下口,嘗了「豆包」。


「豆包」初體驗


我們對「豆包」基本問答、常識問答、寫作能力和數(shù)學(xué)能力四個方面進行了簡單測試。


基本問答


先讓「豆包」做個自我介紹:


圖片


從「豆包」的回答中,我們發(fā)現(xiàn)它主要具備自然語言處理、知識回答、語言翻譯、文本摘要、情感分析幾大能力:


圖片



對大型語言模型(LLM)來說,訓(xùn)練數(shù)據(jù)非常重要,直接影響模型掌握的信息和生成結(jié)果的質(zhì)量?!付拱贡硎酒溆?xùn)練數(shù)據(jù)截止到 2023 年:


圖片


為了驗證這一點,我們詢問它是否知道 2023 年 3 月 OpenAI 推出的大型語言模型 GPT-4,顯然,它知道。


圖片


常識問答


我們進一步詢問一些應(yīng)用型問題,比如「你知道機器之心嗎」,「豆包」的回答可以說是非常準確詳盡了:


圖片


如果我們想擬一個招聘文案,招聘要求里應(yīng)該闡明哪些工作能力呢,「豆包」給出了答案:


圖片


我們又問了一個與英語學(xué)習(xí)相關(guān)的問題:如何提高英語寫作能力,「豆包」的回答從讀寫練習(xí)、詞匯語法、寫作技巧、尋求反饋等方面給出了合理建議,條理清晰:


圖片


寫作能力


除了對話問答,文本寫作也是大模型的一個重要任務(wù),具有廣泛的應(yīng)用前景。為了測試「豆包」的寫作能力,我們讓它編寫了一個關(guān)于「未來人工智能」的科幻故事:


圖片


整個故事以人工智能的飛速發(fā)展為背景展開,故事過程完整、有趣味性,可見「豆包」具備一定的寫作能力。


數(shù)學(xué)能力


眾所周知,數(shù)學(xué)問題對大模型來說極具挑戰(zhàn)性,因為解決數(shù)學(xué)問題需要嚴密的邏輯和推理。我們用經(jīng)典的「雞兔同籠」問題測試了一下「豆包」的數(shù)學(xué)能力,它用二元一次方程組準確、快捷地回答了這個問題,這也是「雞兔同籠」問題的常見解法。


圖片


再測試一下「豆包」的基本計算能力和分數(shù)化簡能力:


圖片


圖片


看了這些問題與回答,你初步感覺如何?


字節(jié)跳動「豆包」項目團隊成員告訴機器之心,「豆包」還處于早期開發(fā)驗證階段,這次只是小范圍的邀請制測試。目前測試期的「豆包」還存在較多局限,生成的內(nèi)容也可能不準確,歡迎測試用戶提供反饋意見,研發(fā)團隊將持續(xù)改進產(chǎn)品。


值得一提的是,在進入「豆包」的對話頁面后,我們發(fā)現(xiàn)除了「豆包」,字節(jié)跳動還開發(fā)了多個面向不同應(yīng)用場景的對話平臺,如「小寧」、英語學(xué)習(xí)助手、全能寫作助手。看來字節(jié)跳動也在下一盤大模型應(yīng)用的大棋,我們拭目以待。


圖片



*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: AI

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉