深言科技聯(lián)合清華大學(xué)開(kāi)源 LingoWhale-8B 模型:免費(fèi)商用,號(hào)稱性能超 GPT-3.5 Turbo
IT之家 11 月 3 日消息,據(jù)深言科技官方公眾號(hào)消息,由深言科技與清華大學(xué) NLP 實(shí)驗(yàn)室共同研發(fā)的語(yǔ)鯨 LingoWhale-8B 模型目前已面向社會(huì)開(kāi)源,對(duì)學(xué)術(shù)研究完全開(kāi)放,允許免費(fèi)商用。
本文引用地址:http://m.butianyuan.cn/article/202311/452462.htmIT之家經(jīng)過(guò)查詢得知,LingoWhale-8B 模型是擁有約 80 億參數(shù)的中英雙語(yǔ)大語(yǔ)言模型,在 C-Eval、MMLU、CMMLU 等多個(gè)權(quán)威的公開(kāi)評(píng)測(cè)基準(zhǔn)上,在 10B 以下開(kāi)源模型據(jù)稱“達(dá)到領(lǐng)先效果”。
不過(guò)官方同時(shí)聲稱,受模型參數(shù)量影響,大模型固有的幻覺(jué)問(wèn)題、數(shù)學(xué)計(jì)算能力相對(duì)較弱、生成內(nèi)容有無(wú)法預(yù)見(jiàn)性等問(wèn)題在 LingoWhale-8B 模型中仍然存在。
在性能方面,截至 10 月 24 日,在中文領(lǐng)域權(quán)威評(píng)測(cè) C-Eval 中,LingoWhale-8B 模型的性能僅次于 GPT-4。在 C-Eval、CMMLU、GAOKAO 測(cè)評(píng)中,性能超過(guò) GPT-3.5Turbo,在 10B 以下尺寸模型中性能處于領(lǐng)先位置。
官方給予了一些典型示例,以介紹 LingoWhale-8B 模型的特點(diǎn)。
官方據(jù)此表示,LingoWhale-8B 模型具有一定數(shù)學(xué)運(yùn)算能力。
在以上示例中,LingoWhale-8B 模型能夠根據(jù)上文正確地列式并進(jìn)行運(yùn)算,包括函數(shù)求導(dǎo)、函數(shù)值計(jì)算、切線方程計(jì)算等操作,并最終得到結(jié)果。
而在代碼聲稱方面,官方也同時(shí)提供了一些演示:
LingoWhale-8B 具有強(qiáng)大的代碼理解與生成能力,能夠更好地生成代碼并解決具體的問(wèn)題。在本示例中,LingoWhale-8B 模型生成了詳細(xì)的 python 代碼以及注釋信息,幫助用戶更好地理解并使用生成的代碼。
在邏輯方面,官方也同樣進(jìn)行了舉例:
LingoWhale-8B 模型具有解決復(fù)雜邏輯推理任務(wù)的能力。在以上的例子中,LingoWhale-8B 將復(fù)雜的邏輯問(wèn)題進(jìn)行拆解,按步驟進(jìn)行分析并解決問(wèn)題。
上下文對(duì)話
樣例:
在以上示例中,LingoWhale-8B 模型表現(xiàn)出了較強(qiáng)的角色扮演、方案設(shè)計(jì)、長(zhǎng)文本理解以及多輪對(duì)話能力,能夠根據(jù)用戶需求制定方案并組織結(jié)構(gòu)化的輸出,應(yīng)對(duì)更加復(fù)雜的任務(wù)場(chǎng)景。
知識(shí)百科
樣例 1:
官方表示,在上面兩個(gè)例子中,相較于 GPT-3.5,LingoWhale-8B 模型生成的結(jié)果更加準(zhǔn)確詳實(shí)。
經(jīng)過(guò)在大規(guī)模高質(zhì)量語(yǔ)料上的預(yù)訓(xùn)練,LingoWhale-8B 模型掌握了多個(gè)領(lǐng)域的知識(shí),包括科學(xué)、歷史、文學(xué)、藝術(shù)等,能夠理解并回答各種知識(shí)相關(guān)問(wèn)題,提供準(zhǔn)確詳細(xì)的答案。
IT之家的小伙伴們可以在官方 GitHub 頁(yè)面中獲取更多詳細(xì)信息:點(diǎn)此訪問(wèn)
評(píng)論