博客專欄

EEPW首頁 > 博客 > 騰訊自研芯片“滄?!弊钚逻M展:斬獲8項全球第一,已量產(chǎn)投用數(shù)萬片

騰訊自研芯片“滄?!弊钚逻M展:斬獲8項全球第一,已量產(chǎn)投用數(shù)萬片

發(fā)布人:芯智訊 時間:2023-04-20 來源:工程師 發(fā)布文章

近日,騰訊對外披露了其自研編解碼芯片“滄?!钡淖钚逻M展。在莫斯科國立大學舉辦的MSU硬件視頻編碼比賽中,騰訊“滄?!毙酒鼣埩怂鶇⒓拥膬蓚€賽道8項評分的全部第一。據(jù)了解,滄海芯片已在業(yè)務場景中投用數(shù)萬片,服務騰訊自研業(yè)務及公有云客戶。

圖片

圖片

△MSU硬件視頻編碼比賽部分成績

具體來看,在SSIM (結構相似性)、PSNR(峰值信噪比)和VMAF(視頻多方法評估融合) 等多項評價指標省,滄海芯片大幅領先行業(yè)GPU等標品硬件。

據(jù)了解,MSU是視頻壓縮領域最具影響力的頂級賽事,迄今已連續(xù)舉辦了十七屆,吸引了包括亞馬遜、英偉達、英特爾、字節(jié)、快手、阿里和騰訊在內(nèi)的國內(nèi)外知名企業(yè)參與。

2021年11月,騰訊在數(shù)字生態(tài)大會上公開發(fā)布了自主研制的三款芯片:AI 推理芯片“紫霄”、視頻轉碼芯片“滄?!焙椭悄芫W(wǎng)卡芯片“玄靈”。其中,滄海定位視頻轉碼芯片,具備靈活的多核擴展架構、高性能編碼流水線、層級化內(nèi)存布局,優(yōu)點為超前的軟件編碼器碼率控制技術、高精度運動搜索、全功率失真優(yōu)化、高效自適應量化,壓縮率相比業(yè)界提升 30%以上。

圖片

據(jù)悉,早在2019年初,騰訊蓬萊實驗室、香農(nóng)實驗室聯(lián)合啟動了編解碼芯片”滄?!把邪l(fā)。對硬件編解碼的算法、架構和工程進行深度攻關,向高畫質(zhì)、低延遲、低成本的“不可能三角”發(fā)起挑戰(zhàn)。

基于自身在底層軟硬件架構和音視頻領域的多年積累,研發(fā)團隊對每個模塊的計算任務都作了并行拆解。通過分配不同的計算單元,從而疊加大量處理任務;為滄海芯片內(nèi)置視頻編碼加速專用功能模塊,讓流水控制邏輯更純粹,減少重復計算和分支判斷,帶來更低的功耗和成本。

滄海芯片的編碼器設計中完整實現(xiàn)了高精度運動搜索、全率失真優(yōu)化、高效自適應量化等所有主流編碼工具,并融合騰訊云軟件編碼器碼率控制等方面的領先技術,壓縮率高于市面標品35%以上。

在硬件架構上,通過將視頻預分析計算單元進一步卸載到硬件中,滄海芯片大幅減少了高密度轉碼場景下任務對CPU性能的依賴,將轉碼性能提升到更強。通過靈活的多核擴展架構、高性能編碼流水線、層級化Memory布局,滄海芯片能滿足高吞吐、低時延和實時性要求。

根據(jù)MSU實測數(shù)據(jù)顯示,從各項指標看,在同碼率下,相較于業(yè)界GPU等標品硬件,滄海能大幅改善畫面質(zhì)量;在120fps的高幀率檔位上,同等質(zhì)量下,滄海比行業(yè)領先水平進一步節(jié)省10%以上的碼率。另外,滄海芯片的單幀1080p的編碼耗時僅4毫秒,吞吐性能幾乎不受到編碼參數(shù)、視頻類型的影響。

資料顯示,滄海芯片在去年3月已順利“點亮”,目前已經(jīng)量產(chǎn)并投用數(shù)萬片,在云游戲、直點播等場景中,面向騰訊自研業(yè)務和公有云客戶提供服務。

在直播平臺中,觀看人數(shù)小于200人的中長尾直播是主體,滄海芯片能幫助節(jié)省大量計算成本;在4K/8K超高清、高幀率場景中,相對軟件編碼,滄海芯片能實現(xiàn)低延時的高質(zhì)量轉碼。

騰訊豐富的多媒體應用場景,提供了充分的分析和驗證條件,讓滄海芯片迭代出更有針對性的場景解決方案。

例如,針對云游戲場景,滄海芯片的瑤池板卡,可以靈活配比不同廠商GPU。針對視頻轉碼場景,滄海芯片提供單機1024 路的高密轉碼能力,將轉碼成本降至最低。

軟硬件的聯(lián)合調(diào)優(yōu),也為騰訊云媒體處理(MPS)帶來了領先的產(chǎn)品優(yōu)勢?,F(xiàn)在,騰訊云能提供音畫質(zhì)增強、云原生錄制、實時特效渲染、智能編輯、內(nèi)容分析理解等服務,為用戶提供更低成本、更低延時、更極致壓縮的處理效果。


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。



關鍵詞: AI

相關推薦

技術專區(qū)

關閉