騰訊會(huì)議又一黑科技，屏蔽超過 200 種會(huì)議噪聲是如何做到的？

發(fā)布人：AI科技大本營時(shí)間：2021-07-16 來源：工程師

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

遠(yuǎn)程會(huì)議已成為我們常規(guī)的工作溝通方式，在線交流打破時(shí)間、空間的限制，給予我們便利之際，也屢遭尷尬：

忘記靜音，一邊聽會(huì)一邊敲鍵盤，被對(duì)方提醒：“XX，麻煩靜下音”；

自己正在講話呢，身旁人走來走去有噪音，影響會(huì)議收聽效果，你恨不得馬上轉(zhuǎn)移開會(huì)陣地……

后疫情時(shí)代，遠(yuǎn)程會(huì)議有以下發(fā)展趨勢：遠(yuǎn)程協(xié)作占員工的工作時(shí)間50-80%，線上線下混合會(huì)議將超過90%，視頻會(huì)議功能將成為大部分會(huì)議的標(biāo)配。因此提高遠(yuǎn)程會(huì)議的交互體驗(yàn)已成為廠商迫在眉睫的事。

為了應(yīng)對(duì)以上會(huì)議室各種復(fù)雜聲學(xué)場景下的開會(huì)難題，騰訊會(huì)議旗下天籟實(shí)驗(yàn)室推出天籟語音模組方案，由騰訊AILab 技術(shù)加持，實(shí)現(xiàn)12米超長距離拾音，消除超過200種會(huì)議噪聲，在雙講、回聲消除等方面實(shí)現(xiàn)突破性升級(jí)。

天籟語音模組加持，立即開啟自動(dòng)“屏蔽雜音”模式

天籟語音模組能消除超過 200 種會(huì)議噪聲是怎樣的概念？

騰訊天籟實(shí)驗(yàn)室資深研究員劉成做了以下演示：在頂端裝有天籟模組的屏幕那頭用力敲打鍵盤、做桌椅碰撞，筆者與之實(shí)時(shí)連線，并沒有聽到鍵盤噪音，宛如開啟了“噪聲靜音”模式。

劉成表示，還有空調(diào)噪聲、翻紙張、塑料瓶、水杯、雨打在窗戶上、外面馬路施工、腳步等 200 多種聲音，可通過 AI 算法降噪處理。同時(shí)天籟語音模組基于深度學(xué)習(xí)模型，也能將空調(diào)聲、風(fēng)扇聲等平穩(wěn)噪聲消除。

劉成嘗試在距離屏幕 2 米和 8 米的位置講話，收聽效果變化不大。這是因?yàn)樘旎[模組是全面 180 度拾音，不管講話人從左邊、右邊、前面、后面走動(dòng)變化，聲音變化不大。在雙講測試?yán)?，劉成和另一人同時(shí)發(fā)聲，兩者聲音均能清晰聽到，并無剪切感或回聲泄露情況。

據(jù)劉成介紹，天籟語音模組結(jié)合房間聲場感知、采集和空間聲場重建技術(shù)，遠(yuǎn)場多人音頻通信、多講話人實(shí)時(shí)追蹤、多人自動(dòng)取景等實(shí)時(shí)音視頻技術(shù)難題，幫助企業(yè)和用戶實(shí)現(xiàn)在遠(yuǎn)場復(fù)雜物理空間下通信體驗(yàn)的突破性提升。

例如針對(duì)講話者離屏幕較遠(yuǎn)時(shí)，可能存在聽不清、聲音小的情況，天籟語音模組方案將多個(gè) MEMS 麥克風(fēng)板嵌入到會(huì)議大屏中，結(jié)合音頻處理器，能夠?qū)崿F(xiàn) 180 度廣角、12 米超長距離拾音，讓參會(huì)者可以像面對(duì)面交流般清晰、自然，并給與參會(huì)者更靈活的活動(dòng)空間。

基于 20 多年音視頻技術(shù)經(jīng)驗(yàn)，打造“軟硬一體”的云視頻會(huì)議生態(tài)

去年 9 月，騰訊會(huì)議發(fā)布企業(yè)版、會(huì)議室連接器以及新一代云視頻會(huì)議室解決方案“騰訊會(huì)議Rooms”，據(jù)了解，天籟語音模組將應(yīng)用于騰訊會(huì)議 Rooms 專款機(jī)型上，還開放給騰訊會(huì)議Rooms專款硬件合作伙伴，助力打造會(huì)議室場景高清、純凈、流暢的開會(huì)體驗(yàn)。

與此同時(shí)，不做硬件的騰訊會(huì)議，還通過開放音視頻認(rèn)證標(biāo)準(zhǔn)，聯(lián)合硬件設(shè)備廠商，共同為企業(yè)量身打造“軟硬一體”的云視頻會(huì)議解決方案。

騰訊會(huì)議天籟實(shí)驗(yàn)室技術(shù)研發(fā)專家余濤介紹“軟硬一體”方案背后的幾點(diǎn)思考：

一是從商業(yè)上，為硬件廠商集成一體化方案提供便利，可快速形成產(chǎn)品能力。

二是從技術(shù)上，由于遠(yuǎn)程語音、噪音等語音的復(fù)雜性，僅靠幾個(gè)算法，即使在深度學(xué)習(xí)模組加持下，想要較好地解決遠(yuǎn)場語音問題還是較難的。

自 QQ 推出語音通話開始，騰訊已有 20 年音視頻技術(shù)的積累。去年成立專注于新一代實(shí)時(shí)音頻技術(shù)的天籟實(shí)驗(yàn)室，并結(jié)合騰訊AI Lab 技術(shù)的加持，天籟模組從多維度、多角度、多模態(tài)出發(fā)，在提升遠(yuǎn)場拾音能力上擁有天時(shí)地利的技術(shù)優(yōu)勢。

目前天籟模組將首先服務(wù)于騰訊會(huì)議 Rooms，相信未來天籟模組可應(yīng)用在小型會(huì)議室、中型會(huì)議室、大型會(huì)議室、超大型會(huì)議室、開放空間等。最后，據(jù)余濤透露，與硬件廠商合作的具備天籟音頻模組的產(chǎn)品，正在量產(chǎn)中。

*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布，僅代表博主個(gè)人觀點(diǎn)，如有侵權(quán)請(qǐng)聯(lián)系工作人員刪除。

電度表相關(guān)文章:電度表原理

博客專欄

騰訊會(huì)議又一黑科技，屏蔽超過 200 種會(huì)議噪聲是如何做到的？

相關(guān)推薦

技術(shù)專區(qū)

博客專欄

騰訊會(huì)議又一黑科技，屏蔽超過 200 種會(huì)議噪聲是如何做到的？

相關(guān)推薦

技術(shù)專區(qū)

騰訊會(huì)議又一黑科技，屏蔽超過 200 種會(huì)議噪聲是如何做到的？