字節(jié)跳動類ChatGPT產(chǎn)品「豆包」邀測,我們先試了一下
還在測試,名字很 Q。
ChatGPT 問世以后,這大半年的時間,科技領(lǐng)域整個被大模型洗禮了一遍。
在國內(nèi),由百度、阿里代表中國科技企業(yè)率先發(fā)布了大模型對話平臺文心一言、通義千問,騰訊、京東在行業(yè)大模型上也已經(jīng)出手,華為探索了,同時也有一批創(chuàng)業(yè)公司積極參與這場科技競賽。
你是不是也好奇加期待,字節(jié)跳動的大模型在哪里?
如今,它終于露相了。
昨天,字節(jié)跳動大模型對話產(chǎn)品「豆包」邀測,用戶可通過網(wǎng)頁或者下載 App 體驗這一人工智能助手。
「豆包」鏈接:https://www.doubao.com/
「豆包」有哪些能力?體驗起來效果如何?機器之心首先下口,嘗了「豆包」。
「豆包」初體驗
我們對「豆包」基本問答、常識問答、寫作能力和數(shù)學(xué)能力四個方面進行了簡單測試。
基本問答
先讓「豆包」做個自我介紹:
從「豆包」的回答中,我們發(fā)現(xiàn)它主要具備自然語言處理、知識回答、語言翻譯、文本摘要、情感分析幾大能力:
對大型語言模型(LLM)來說,訓(xùn)練數(shù)據(jù)非常重要,直接影響模型掌握的信息和生成結(jié)果的質(zhì)量?!付拱贡硎酒溆?xùn)練數(shù)據(jù)截止到 2023 年:
為了驗證這一點,我們詢問它是否知道 2023 年 3 月 OpenAI 推出的大型語言模型 GPT-4,顯然,它知道。
常識問答
我們進一步詢問一些應(yīng)用型問題,比如「你知道機器之心嗎」,「豆包」的回答可以說是非常準確詳盡了:
如果我們想擬一個招聘文案,招聘要求里應(yīng)該闡明哪些工作能力呢,「豆包」給出了答案:
我們又問了一個與英語學(xué)習(xí)相關(guān)的問題:如何提高英語寫作能力,「豆包」的回答從讀寫練習(xí)、詞匯語法、寫作技巧、尋求反饋等方面給出了合理建議,條理清晰:
寫作能力
除了對話問答,文本寫作也是大模型的一個重要任務(wù),具有廣泛的應(yīng)用前景。為了測試「豆包」的寫作能力,我們讓它編寫了一個關(guān)于「未來人工智能」的科幻故事:
整個故事以人工智能的飛速發(fā)展為背景展開,故事過程完整、有趣味性,可見「豆包」具備一定的寫作能力。
數(shù)學(xué)能力
眾所周知,數(shù)學(xué)問題對大模型來說極具挑戰(zhàn)性,因為解決數(shù)學(xué)問題需要嚴密的邏輯和推理。我們用經(jīng)典的「雞兔同籠」問題測試了一下「豆包」的數(shù)學(xué)能力,它用二元一次方程組準確、快捷地回答了這個問題,這也是「雞兔同籠」問題的常見解法。
再測試一下「豆包」的基本計算能力和分數(shù)化簡能力:
看了這些問題與回答,你初步感覺如何?
字節(jié)跳動「豆包」項目團隊成員告訴機器之心,「豆包」還處于早期開發(fā)驗證階段,這次只是小范圍的邀請制測試。目前測試期的「豆包」還存在較多局限,生成的內(nèi)容也可能不準確,歡迎測試用戶提供反饋意見,研發(fā)團隊將持續(xù)改進產(chǎn)品。
值得一提的是,在進入「豆包」的對話頁面后,我們發(fā)現(xiàn)除了「豆包」,字節(jié)跳動還開發(fā)了多個面向不同應(yīng)用場景的對話平臺,如「小寧」、英語學(xué)習(xí)助手、全能寫作助手。看來字節(jié)跳動也在下一盤大模型應(yīng)用的大棋,我們拭目以待。
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。