新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > Meta發(fā)布人工智能模型,支持幾十種語言語音互譯

Meta發(fā)布人工智能模型,支持幾十種語言語音互譯

作者: 時間:2023-08-23 來源:網(wǎng)易科技 收藏

8月23日消息,F(xiàn)acebook母公司 Platforms于周二發(fā)布了一款模型,能夠在數(shù)十種語言之間進行語音翻譯和轉(zhuǎn)錄,為跨語言交流提供了潛在的基礎(chǔ)工具。

本文引用地址:http://m.butianyuan.cn/article/202308/449862.htm

公司在一篇博客文章中表示,其SeamlessM4T模型可以支持近100種語言的文本和語音之間的翻譯,以及35種語言的語音互譯。該模型整合了之前只能在不同模型中使用的技術(shù)。

首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)曾表示,他設(shè)想這樣的工具可以促進來自全球各地的用戶在元宇宙中進行互動,元宇宙是他押注公司未來的一組相互連接的虛擬世界。

稱,該模型對非商業(yè)用途的公眾開放。

作為全球最大的社交媒體公司,Meta今年發(fā)布了一系列主要免費的模型,其中包括一個名為Llama的大型語言模型,對微軟支持的OpenAI和谷歌旗下的Alphabet的專有模型帶來了巨大挑戰(zhàn)。扎克伯格表示,對Meta來說,開放的生態(tài)系統(tǒng)更有利,因為公司通過有效地集思廣益地開發(fā)面向社交平臺的消費者工具,比起收費訪問模型,能獲得更多利益。

然而,Meta面臨與該行業(yè)其他公司相似的法律問題,涉及用于訓練模型的數(shù)據(jù)來源。

今年7月,喜劇演員莎拉·西爾弗曼(Sarah Silverman)和其他兩位作者對Meta和OpenAI提起了侵權(quán)訴訟,指控這兩家公司未經(jīng)許可使用他們的書籍作為訓練數(shù)據(jù)。

對于SeamlessM4T模型,Meta的研究人員在一篇研究論文中表示,他們從400萬小時的“來自公開可用的網(wǎng)絡(luò)數(shù)據(jù)存儲庫的原始音頻”中收集了音頻訓練數(shù)據(jù),但沒有具體說明是哪個存儲庫。

Meta的發(fā)言人未回答關(guān)于音頻數(shù)據(jù)來源的問題。

研究報告稱,文本數(shù)據(jù)則來自去年創(chuàng)建的數(shù)據(jù)集,這些數(shù)據(jù)集從維基百科和相關(guān)網(wǎng)站上抓取內(nèi)容。




關(guān)鍵詞: Meta 人工智能

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉