Meta發(fā)布人工智能模型,支持幾十種語(yǔ)言語(yǔ)音互譯

作者：時(shí)間：2023-08-23 來(lái)源：網(wǎng)易科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

8月23日消息，F(xiàn)acebook母公司Meta Platforms于周二發(fā)布了一款人工智能模型，能夠在數(shù)十種語(yǔ)言之間進(jìn)行語(yǔ)音翻譯和轉(zhuǎn)錄，為跨語(yǔ)言交流提供了潛在的基礎(chǔ)工具。

本文引用地址：http://m.butianyuan.cn/article/202308/449862.htm

Meta公司在一篇博客文章中表示，其SeamlessM4T模型可以支持近100種語(yǔ)言的文本和語(yǔ)音之間的翻譯，以及35種語(yǔ)言的語(yǔ)音互譯。該模型整合了之前只能在不同模型中使用的技術(shù)。

首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)曾表示，他設(shè)想這樣的工具可以促進(jìn)來(lái)自全球各地的用戶在元宇宙中進(jìn)行互動(dòng)，元宇宙是他押注公司未來(lái)的一組相互連接的虛擬世界。

Meta稱(chēng)，該模型對(duì)非商業(yè)用途的公眾開(kāi)放。

作為全球最大的社交媒體公司，Meta今年發(fā)布了一系列主要免費(fèi)的人工智能模型，其中包括一個(gè)名為L(zhǎng)lama的大型語(yǔ)言模型，對(duì)微軟支持的OpenAI和谷歌旗下的Alphabet的專(zhuān)有模型帶來(lái)了巨大挑戰(zhàn)。扎克伯格表示，對(duì)Meta來(lái)說(shuō)，開(kāi)放的人工智能生態(tài)系統(tǒng)更有利，因?yàn)楣就ㄟ^(guò)有效地集思廣益地開(kāi)發(fā)面向社交平臺(tái)的消費(fèi)者工具，比起收費(fèi)訪問(wèn)模型，能獲得更多利益。

然而，Meta面臨與該行業(yè)其他公司相似的法律問(wèn)題，涉及用于訓(xùn)練模型的數(shù)據(jù)來(lái)源。

今年7月，喜劇演員莎拉·西爾弗曼(Sarah Silverman)和其他兩位作者對(duì)Meta和OpenAI提起了侵權(quán)訴訟，指控這兩家公司未經(jīng)許可使用他們的書(shū)籍作為訓(xùn)練數(shù)據(jù)。

對(duì)于SeamlessM4T模型，Meta的研究人員在一篇研究論文中表示，他們從400萬(wàn)小時(shí)的“來(lái)自公開(kāi)可用的網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)庫(kù)的原始音頻”中收集了音頻訓(xùn)練數(shù)據(jù)，但沒(méi)有具體說(shuō)明是哪個(gè)存儲(chǔ)庫(kù)。

Meta的發(fā)言人未回答關(guān)于音頻數(shù)據(jù)來(lái)源的問(wèn)題。

研究報(bào)告稱(chēng)，文本數(shù)據(jù)則來(lái)自去年創(chuàng)建的數(shù)據(jù)集，這些數(shù)據(jù)集從維基百科和相關(guān)網(wǎng)站上抓取內(nèi)容。

新聞中心

Meta發(fā)布人工智能模型,支持幾十種語(yǔ)言語(yǔ)音互譯

評(píng)論

相關(guān)推薦

技術(shù)專(zhuān)區(qū)