當(dāng)AI遇到世界杯:梅西的封神之路,多了一些特殊觀眾
大數(shù)據(jù)文摘授權(quán)轉(zhuǎn)載自學(xué)術(shù)頭條
梅西圓夢了。
每屆世界杯都會(huì)造就英雄,但也會(huì)有人率先離場。然而,足球場上滾動(dòng)的,不僅有球員們的汗水,觀眾的歡呼,也有歷屆世界杯所迭代的科技。
自1904年FIFA國際足聯(lián)成立后,世界杯走進(jìn)了人們的視線。但直至上世紀(jì)50年代,隨著電視轉(zhuǎn)播技術(shù)的出現(xiàn),它才真正走向了千家萬戶。1998年的法國世界杯,電視轉(zhuǎn)播觀眾人數(shù)達(dá)到40億人次。然而,時(shí)至今日,依舊有一些人需要這樣的“聲音”。
距離卡塔爾6000多公里外,身穿紅色連衣裙、扎著馬尾辮的“主播”弋瑭,開始了她繁忙的一天,不斷向全世界傳遞著這樣的“聲音”。
圖|“主播”弋瑭為世界杯進(jìn)行手語播報(bào)
從“奧運(yùn)會(huì)”走向“世界杯”
來自世界衛(wèi)生組織(WHO)的數(shù)據(jù)顯示,截至 2021 年 4 月 1 日,全球約有 15 億人罹患某種程度的聽力損失,其中約有 4.3 億人需要針對聽力損失的康復(fù)服務(wù);到 2050 年,預(yù)計(jì)將有近 25 億人存在某種程度的聽力損失,至少 7 億人需要聽力康復(fù)。因此,由AI技術(shù)驅(qū)動(dòng)的手語數(shù)字人屆時(shí)或?qū)⒊霈F(xiàn)在各種各樣的實(shí)際場景中,是聽障人士在試圖認(rèn)識(shí)世界、感受世界時(shí)必不可少的幫手。
早在今年的北京冬奧會(huì)、北京冬殘奧會(huì)上,一個(gè)同樣身穿紅色西裝的AI手語數(shù)字人,就在北京衛(wèi)視《北京您早》節(jié)目中對“冬奧賽事集錦”和“一起看冬奧”進(jìn)行了手語播報(bào),不僅降低了播報(bào)工作的運(yùn)營成本,還為聽障人士收看冬奧賽事提供了便利。她便是第一代手語數(shù)字人“華同學(xué)”。她源于北京市科委科技冬奧專項(xiàng)支持的“冬奧手語播報(bào)數(shù)字人系統(tǒng)”課題技術(shù)成果,經(jīng)北京冬奧會(huì)、冬殘奧會(huì)期間實(shí)踐應(yīng)用改進(jìn)提升而來。
圖|“華同學(xué)”助力冬奧會(huì)現(xiàn)場
AI手語數(shù)字人華同學(xué)的數(shù)據(jù)基礎(chǔ)以《國家通用手語》為標(biāo)準(zhǔn),采集大量動(dòng)態(tài)數(shù)據(jù),構(gòu)建了符合國家通用手語規(guī)范的國內(nèi)最大規(guī)模多模態(tài)手語語料庫。智譜AI的研發(fā)團(tuán)隊(duì)基于大規(guī)模預(yù)訓(xùn)練模型構(gòu)建手語數(shù)字腦,通過語義蒸餾算法與手語翻譯模型,生成和原文語義高度接近、語義精簡且符合手語表達(dá)習(xí)慣的手語詞序列。最后,通過跨模態(tài)擬人生產(chǎn)算法,驅(qū)動(dòng)AI手語數(shù)字人華同學(xué)能夠以連貫、精準(zhǔn)的手勢動(dòng)作、表情、口型,為觀眾朋友提供專業(yè)、準(zhǔn)確的手語體育賽事解說。
而在這個(gè)冬天,華同學(xué)“學(xué)會(huì)”了更多的新知識(shí)?;诙瑠W手語數(shù)字人科研成果,她新學(xué)了足球相關(guān)手語詞90個(gè),提取了2018年世界杯8場比賽近1000分鐘的語音解說文本,進(jìn)行手語翻譯詞序列的語料標(biāo)注,補(bǔ)充12場比賽14個(gè)球隊(duì)365名球員的手語表達(dá)方式。然后,她走向了“世界杯”。
“華同學(xué)”賦能“弋瑭”
升級(jí)后的“華同學(xué)”不僅能夠?yàn)橘愂绿峁└舆B貫精準(zhǔn)的手勢、表情以及口型動(dòng)作,還能賦能給其他的數(shù)字人。此次世界杯,她便賦能“弋瑭”,倆人一同出場。她們超有感染力流暢的實(shí)時(shí)解說,帶給了觀眾們新奇的體驗(yàn)。
圖|“華同學(xué)”賦能“弋瑭”聯(lián)袂播報(bào)
世界杯期間咪咕推出智能手語主播弋瑭,由智譜AI與凌云光提供技術(shù)支持。那么, “華同學(xué)”是如何賦能給“弋瑭”的呢?主要包括以下三點(diǎn)原因:
新增手語詞手勢數(shù)據(jù):依據(jù)《體育和律動(dòng)常用詞通用手語》以及世界杯解說高頻詞語,新增足球、足球項(xiàng)目裁判手勢、足球聯(lián)賽等相關(guān)手語詞,共計(jì)90個(gè)。
補(bǔ)充語料:為提升手語翻譯引擎在世界杯解說中的表現(xiàn),項(xiàng)目組提取2018年俄羅斯世界杯,8場比賽近1000分鐘的語音解說文本,進(jìn)行手語翻譯詞序列的語料標(biāo)注。并根據(jù)手語數(shù)智人解說場次,補(bǔ)充12場比賽14個(gè)球隊(duì)365名球員的手語表達(dá)方式。
手語翻譯算法:足球領(lǐng)域?qū)儆谔囟I(lǐng)域,通用領(lǐng)域的知識(shí)難以直接滿足特定的業(yè)務(wù)場景,基于這點(diǎn),智譜AI選擇使用原始模型加上少量的領(lǐng)域數(shù)據(jù)對來獲取一個(gè)面向特定領(lǐng)域的手語翻譯模型。為了提高模型的泛化能力以及領(lǐng)域適配性,他們采用了一種新穎的正負(fù)樣本生成的對比學(xué)習(xí)方法,以區(qū)分正確的輸出和正確輸出。
讓“世界”更有“愛(AI)”
此次為世界杯加油助力的數(shù)字人技術(shù),是借助基于深度神經(jīng)網(wǎng)絡(luò)的自然語言處理、高逼真度3D渲染、行業(yè)手語語料庫、融合手語知識(shí)的翻譯模型等技術(shù),讓更多人感受到了綠茵場上的賽事激情。
但AI技術(shù)需要持續(xù)不斷地發(fā)展,不能在賽事之后變?yōu)椤凹澎o的森林”。智譜AI也將繼續(xù)秉承著MaaS(Model as A Service/模型即服務(wù))的理念,提供模型共訓(xùn)服務(wù)、模型授權(quán)服務(wù),以及API開放平臺(tái),圍繞平臺(tái)形成人工智能的應(yīng)用生態(tài)。在數(shù)字人技術(shù)方面,智譜AI也將持續(xù)研發(fā)技術(shù),開放多層次的應(yīng)用,包括手語播報(bào)、手語翻譯以及AI手語詞典,為殘障人士平等參與社會(huì)生活創(chuàng)造無障礙環(huán)境,切實(shí)提高大家的社會(huì)參與感和生活幸福指數(shù)。
讓科技服務(wù)公益,讓世界更有愛(AI)。
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。