Meta計劃推出全球通用語音翻譯軟件,并開源相關(guān)技術(shù)代碼及文檔
Meta 的 CEO 馬克·扎克伯格(Mark Zuckerberg)稱,“能夠用任何語言與任何人交流是人類永遠的夢想,人工智能將在我們的有生之年實現(xiàn)這一點。”
現(xiàn)在,市面上出現(xiàn)的翻譯軟件已滿足了英語、中文和西班牙語等國際常用語言的需求,但還有許多小眾語言被排除在外。有數(shù)十億人無法通過母語與外部世界溝通,也不能自由訪問互聯(lián)網(wǎng)上的許多信息。
原因在于,雖然機器翻譯(Machine Translation,MT)系統(tǒng)正不斷進步,但它們始終依賴于包含大量文本數(shù)據(jù)的訓練語庫。對于鮮少被使用到的小眾語言來說,機器翻譯系統(tǒng)很難獲得訓練所需且易于訪問的書面文本語庫,甚至得不到標準化的書寫規(guī)則。
Meta 表示,“我們希望通過在兩個特定項目中部署新的機器學習技術(shù)來改善這種情況。”這兩個特定項目,一個是"不讓語言掉隊"(No Language Left Behind),Meta 將致力于建立依靠少量訓練示例就可完成語言翻譯工作的人工智能模型;另一個是通用語音翻譯器(Universal Speech Translator)項目,該公司希望開發(fā)出無需經(jīng)過書面文本就能實時翻譯語音的系統(tǒng)。
目前,Meta 尚未表露進行這兩個項目的具體時間。不過,他們指出了通用語言翻譯的理想化情況。
他們表示,"消除語言障礙將是深遠的,會使數(shù)十億人能夠以他們的母語或首選語言在線訪問信息。機器翻譯系統(tǒng)的進步不僅會幫助那些不會說當今互聯(lián)網(wǎng)上占主導地位語言的人,還將從根本上改變世界上人們聯(lián)系和分享想法的方式?!?br />
Meta 認為,通用翻譯技術(shù)將惠及該公司遍布全球的產(chǎn)品,不僅會使產(chǎn)品覆蓋得更廣,還將推動這些產(chǎn)品成為數(shù)百萬人不可或缺的通信工具。
此外,該公司指出,“通用翻譯軟件將成為未來可穿戴設(shè)備中的殺手級應(yīng)用(killer App),并將突破 VR、AR 技術(shù)的界限?!?br />
例如,不同母語的人們可以運用智能手機、手表及眼鏡等設(shè)備進行實時交互,全球所有人都可以用他們的母語訪問互聯(lián)網(wǎng)上的多媒體內(nèi)容,人們可以與在任何地方的任何人一起參與讀書俱樂部或者合作開展工作項目。
這樣看來,推出通用語音翻譯軟件既富有人道主義精神,又能夠為 Meta 等公司帶來良好的商業(yè)效益。
Meta 稱,“要為世界各地的每個人提供真正通用的語音翻譯工具,還需要做更多的工作。但我們認為,現(xiàn)在的努力是向前邁出的重要一步。”
未來,Meta 還將對外公開其技術(shù)細節(jié)并開源所使用的源代碼和文檔,這意味著其他有能力的技術(shù)人員可以在他們的工作基礎(chǔ)上開展進一步研究。
需要注意的是,雖然機器翻譯的速度和準確性隨機器學習的進步得到一定提升,但機器翻譯的底層技術(shù)仍存在一定問題。
有人指出,當前的機器翻譯忽略了人類在說話時微小但關(guān)鍵的地方,并輸出了有性別偏見的表述,還會出現(xiàn)一些只有計算機才能做出的意想不到的錯誤。
此外,有一些使用小眾語言的人表示,如果語言翻譯能力掌握在科技巨頭手中,那么他們可能會失去對其母語和文化的控制。
對于擁有 Facebook 和 Instagram 等大型社交平臺的 Meta 來說,其更需要認真看待這些問題。
一直以來,Meta 希望將其產(chǎn)品服務(wù)擴展至全球市場,但目前他們的產(chǎn)品仍只覆蓋到部分國家和地區(qū)。根據(jù)該公司的官方文件,其正在努力減少語言翻譯中所出現(xiàn)的仇恨言論及濫用行為,這些言論或行為都可能產(chǎn)生令人難以置信的可怕后果。
2017 年,有一名用戶在 Facebook 上發(fā)布了一條內(nèi)容帖子,隨后被警方誤抓。真實情況是這名男子輸入了阿拉伯語的"早安",而 Facebook 平臺卻將內(nèi)容翻譯為希伯來語的"攻擊他們"和英語的"傷害他們"。直到今天,涉及可疑翻譯的類似案件仍大量堆積在 Meta 的監(jiān)督委員會。
因此,除技術(shù)上的突破外,Meta 還需做到公平公正地運用通用語音翻譯軟件的研究成果。
-End-
參考:
https://www.theverge.com/2022/2/23/22947368/meta-facebook-ai-universal-speech-translation-project
https://ai.facebook.com/blog/teaching-ai-to-translate-100s-of-spoken-and-written-languages-in-real-time
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。