博鰲開幕,為何再次引發(fā)AI替代人類的虛驚
機(jī)器翻譯產(chǎn)品早在 2010 年就開始出現(xiàn),但更多的應(yīng)用主要是在旅游、社交、商業(yè)等 C 端場景,而會(huì)議同傳仍然是該領(lǐng)域的至高挑戰(zhàn)。
本文引用地址:http://m.butianyuan.cn/article/201804/378216.htm創(chuàng)立了 17 年的博鰲亞洲論壇第一次使用 AI 同傳,不僅是這個(gè)年度國際頂尖論壇所做出的重要改變,也是“騰訊同傳”一次不小的考驗(yàn)。以至于馬化騰在朋友圈也對(duì)準(zhǔn)備上崗博鰲的騰訊同傳不無關(guān)切,“新嘗試,多包涵?!?/p>
據(jù)騰訊公司 QQ 瀏覽器及“騰訊翻譯君”負(fù)責(zé)人李學(xué)朝接受知曉程序?qū)TL時(shí)介紹,從 4 月 9 日,騰訊同傳正式投入使用于博鰲亞洲論壇開幕前各場分論壇的情況來看,騰訊同傳可以在嘉賓自由多語發(fā)言切換的情況下,完成翻譯結(jié)果;使用過程中也發(fā)現(xiàn)一些壞的例子,團(tuán)隊(duì)已及時(shí)進(jìn)行修復(fù),符合對(duì) AI 同傳的預(yù)期。
然而,此前的小試牛刀之后,也會(huì)在今天迎來大考。博鰲亞洲論壇今天上午正式舉行開幕儀式,作為開幕式同傳支持之一,騰訊同傳將與人工同傳一起,為會(huì)議提供雙語紀(jì)要服務(wù)。
李學(xué)朝告訴知曉程序,此次騰訊同傳主要采用“現(xiàn)場投屏”、“小程序”2 種模式?,F(xiàn)場參會(huì)的他國領(lǐng)導(dǎo)人、政要以及國際友人可以通過會(huì)場大屏幕實(shí)時(shí)觀看演講文字版;而遠(yuǎn)程觀看這場開幕式的用戶,則可以掃描騰訊同傳小程序碼,獲取會(huì)議的中英文雙語演講內(nèi)容,并可“點(diǎn)擊聽譯文”收聽演講。
銜枚疾走的“騰訊翻譯君”
騰訊人工智能同聲傳譯解決方案由 2 個(gè)部分組成:“騰訊翻譯君”+“微信智聆”。
李學(xué)朝介紹說,博鰲亞洲論壇上實(shí)際的同傳實(shí)現(xiàn)原理是,微信智聆把人聲識(shí)別為文字,騰訊翻譯君再把文本翻譯成目標(biāo)語言,再通過語音合成進(jìn)行播報(bào)。
其中“微信智聆”團(tuán)隊(duì)早在 2011 年就開始成立;相較而言,“騰訊翻譯君”要晚的多,這個(gè)由 MIG 內(nèi)部孵化的團(tuán)隊(duì)成立時(shí)間為 2016 年。騰訊翻譯君與微信智聆合體為騰訊同傳則是在 2017 年。
伴隨著騰訊的潛心布局,翻譯領(lǐng)域的技術(shù)變革也正迅疾發(fā)生。2016 年初,騰訊開始研發(fā) AI 翻譯產(chǎn)品,當(dāng)時(shí)整個(gè)行業(yè)都在采用的是 SMT 的統(tǒng)計(jì)機(jī)器翻譯技術(shù),其背后的核心算法是基于短語的機(jī)器翻譯,錯(cuò)誤率較高。
技術(shù)的奇點(diǎn)出現(xiàn)在 2016 年底。谷歌在機(jī)器翻譯方面取得重大突破,所發(fā)布的神經(jīng)網(wǎng)路機(jī)器翻譯系統(tǒng)(Google Neural Machine Translation),簡稱 GNMT,實(shí)現(xiàn)了迄今為止機(jī)器翻譯質(zhì)量的最大提升。
正是看到這一突破,騰訊翻譯君團(tuán)隊(duì)很快調(diào)轉(zhuǎn)走向,采用了 NMT 技術(shù)。翻譯君團(tuán)隊(duì)基于神經(jīng)網(wǎng)絡(luò)算法和騰訊的數(shù)據(jù)開發(fā)了 TNMT 算法。不僅在騰訊內(nèi)部勝出,也很快確立了自己的核心優(yōu)勢。
如今,“騰訊翻譯君”已經(jīng)支持 15 個(gè)語種,每天翻譯請(qǐng)求超過 4 億。而在博鰲亞洲論壇之前,騰訊同傳已經(jīng)有近百場的實(shí)戰(zhàn),其中包括 VMWARE 中國女性發(fā)展論壇、2018 年騰訊年會(huì)、2018 微信公開課 Pro、騰訊媒體 + 峰會(huì)等。會(huì)議現(xiàn)場中文語音識(shí)別準(zhǔn)確率平均可達(dá) 97%,翻譯可接受度超過 92%。
一直以來,同聲傳譯的難點(diǎn)已經(jīng)被行業(yè)所共知。李學(xué)朝對(duì)知曉程序說,在大型會(huì)議之前,騰訊是不能拿到發(fā)言稿的,這需要騰訊同傳完全擬人化地應(yīng)對(duì)現(xiàn)場的各種狀況。
比如說,在 2018 年年初騰訊年會(huì)上,馬化騰就臨場決定使用沒有經(jīng)過準(zhǔn)備的騰訊同傳?!暗褂媒Y(jié)果出來后,大家對(duì)翻譯君和微信智聆這套同傳方案更有了底氣?!崩顚W(xué)朝說。
不過到了博鰲亞洲論壇,現(xiàn)場情況的復(fù)雜性對(duì)騰訊同傳又提出了更高要求。針對(duì)論壇專業(yè)度高、覆蓋度廣的特殊場景,騰訊翻譯君還通過定制化術(shù)語支持、領(lǐng)域自適應(yīng)等技術(shù)進(jìn)一步優(yōu)化翻譯結(jié)果。微信智聆也專門針對(duì)博鰲論壇嘉賓的國家、地區(qū)語言特征進(jìn)行專項(xiàng)優(yōu)化訓(xùn)練,并通過工程優(yōu)化實(shí)現(xiàn)多人、多語種會(huì)話的并行識(shí)別,保證現(xiàn)場的識(shí)別準(zhǔn)確率。
不過,李學(xué)朝告訴知曉程序,雖然騰訊翻譯君已經(jīng)支持 15 個(gè)語種,但此次博鰲亞洲論壇還僅使用中英雙語翻譯。
“騰訊同傳”的進(jìn)擊之道
在博鰲,騰訊成為業(yè)界首個(gè)創(chuàng)新支持同傳雙語內(nèi)容多渠道查看和回放的 AI 同傳服務(wù),包括會(huì)議現(xiàn)場投屏、小程序查看、語音收聽、會(huì)議紀(jì)要回放等。
而騰訊同傳小程序也是在本屆論壇初次亮相。
李學(xué)朝說,在翻譯君上線之初,主要的切入點(diǎn)是旅游場景下的個(gè)人用戶市場。為個(gè)人消費(fèi)者提供文本翻譯、語音翻譯、拍照翻譯、口語跟讀測評(píng)等多類型翻譯服務(wù),并能通過手機(jī) App、微信公眾號(hào)、微信小程序、PC 網(wǎng)頁版等渠道使用。
隨著機(jī)器翻譯和翻譯需求的井噴,越來越多的領(lǐng)域開始浮現(xiàn)出對(duì)在線化、智能化、效率化的翻譯要求。翻譯君從剛開始的口語、旅游等,逐漸擴(kuò)展到微信、QQ、“王者榮耀海外版”(Arena of Valor)等社交領(lǐng)域,以及 QQ 瀏覽器、QQ 郵箱,甚至延伸到金融、教育、硬件等各個(gè)行業(yè)。
相比較其他產(chǎn)品,騰訊翻譯君的快速拓展,仍然體現(xiàn)了騰訊的平臺(tái)優(yōu)勢,以及騰訊團(tuán)隊(duì)對(duì)于線上場景的理解。“擁有過硬的技術(shù)產(chǎn)品之后,我們也充分利用好騰訊強(qiáng)大的平臺(tái),公司有很多用戶場景和需求可以滲透進(jìn)去。所以,我們能夠不斷地從平臺(tái)接入騰訊翻譯,因?yàn)槲覀儤I(yè)務(wù)在出海,可以逐漸找到更多落地的場景?!崩顚W(xué)朝表示。
而對(duì)于最重要的兩個(gè)移動(dòng)平臺(tái),App 與小程序,騰訊翻譯君采取了分別不同的運(yùn)營策略。比如,口語跟讀是時(shí)下翻譯應(yīng)用很重要的使用場景,騰訊翻譯君觀察到這點(diǎn)后,在 app 內(nèi)設(shè)置雙語海報(bào)、口語學(xué)習(xí)等功能內(nèi)容,從而提高了玩家黏性。
至于小程序,更多是在微信生態(tài)內(nèi),以其無需下載、即用即走的特點(diǎn)為翻譯君帶來更大的訪問量、更多的體驗(yàn)用戶,主要突出最核心的實(shí)用功能——翻譯。李學(xué)朝告訴知曉程序,目前,騰訊翻譯君小程序主要為個(gè)人用戶所使用;而在博鰲亞洲論壇正式啟動(dòng)上線的騰訊同傳小程序,則服務(wù)于會(huì)議需求,對(duì)接給 B 端,并提供給對(duì)會(huì)議感興趣的參會(huì)者與遠(yuǎn)程參會(huì)者。
而在企業(yè)級(jí)客戶服務(wù)對(duì)接方面,李學(xué)朝也表示,騰訊同傳現(xiàn)在主要有兩種方式。第一種是線下服務(wù)器的模式,采取專門 VIP 式的服務(wù),由翻譯君團(tuán)隊(duì)和微信團(tuán)隊(duì)的技術(shù)人員到現(xiàn)場支持。第二種是云服務(wù),聯(lián)合騰訊云共同提供。當(dāng)用戶和公司有需求的時(shí)候,通過騰訊云可以體驗(yàn)和滿足。
AI 與人工同傳,是交戰(zhàn)還是交融?
事實(shí)上,伴隨著騰訊同傳在博鰲亞洲論壇的首日亮相,有關(guān)翻譯準(zhǔn)確率的問題也引發(fā)了行業(yè)關(guān)注。對(duì)此,騰訊方面回應(yīng)稱,由于各種“新奇”的語料知識(shí)、專業(yè)名詞、五湖四海的英語流派熔于一爐,再加上話筒噪聲、回聲等環(huán)境音的干擾,的確對(duì)騰訊同傳構(gòu)成較大挑戰(zhàn)。
“騰訊同傳還在學(xué)習(xí)和成長之中,對(duì)于一些專有名詞倒裝句,以及中英文流利切換的嘉賓演講,還需要繼續(xù)加強(qiáng)學(xué)習(xí)?!彬v訊同傳不是做替代者,而是行業(yè)的賦能者。
至于網(wǎng)傳由于現(xiàn)場翻譯效果不佳, 4 月 9 日下午,騰訊在海淀希格瑪大廈緊急招募人工同傳補(bǔ)位的消息,知曉程序向騰訊同傳求證,得到回應(yīng)稱,這完全是一個(gè)烏龍。
騰訊同傳告訴知曉程序,所謂的邀請(qǐng)人工同傳,并非為騰訊同傳團(tuán)隊(duì)用于現(xiàn)場 AI 同傳,而是服務(wù)于騰訊新聞團(tuán)隊(duì)做閉門采訪等專業(yè)報(bào)道。而且,本次會(huì)議的多數(shù)場次本來就采用了 AI 同傳與人工同傳互相配合的形式,并無再次邀請(qǐng)的必要。
李學(xué)朝也認(rèn)為,“語言是一種交流工具,機(jī)器翻譯與人工翻譯各有其擅長的應(yīng)用場景和服務(wù)?!北热?,機(jī)器翻譯可以每天提供億級(jí)翻譯次數(shù)、有對(duì)新領(lǐng)域的定制術(shù)語快速掌握的能力,這是人工翻譯難以復(fù)制的;而翻譯員所能整合的人際了解、模糊語義的掌握等,這些是機(jī)器翻譯短期內(nèi)不容易達(dá)到的。
畢竟,AI 所習(xí)得的僅僅是“智能”,而人類擁有的卻是“智慧”。
評(píng)論