新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > C2采用1個CPU+3個DSP架構(gòu)實現(xiàn)網(wǎng)絡(luò)化多媒體平

C2采用1個CPU+3個DSP架構(gòu)實現(xiàn)網(wǎng)絡(luò)化多媒體平

作者: 時間:2016-12-21 來源:網(wǎng)絡(luò) 收藏

  如何搭建一種架構(gòu),能夠高效地處理各種多媒體數(shù)據(jù),并且專門針對音頻、視頻進行優(yōu)化?

本文引用地址:http://m.butianyuan.cn/article/201612/332429.htm


  產(chǎn)品定義與芯片選型——搭建基于網(wǎng)絡(luò)的多媒體平臺,但排除ASIC、X86和通用DSP編程方式

  網(wǎng)絡(luò)向我們提供日益豐富的內(nèi)容(包括:文本、圖像、視頻和音頻),這些內(nèi)容的表現(xiàn)形式多種多樣,僅視頻和音頻就有幾十種格式。傳統(tǒng)的ASIC芯片最大缺點是缺乏靈活性和通用性,例如DVD解碼芯片通常只支持MPEG-2,MPGE-4和MP3標準,如果要處理更多的格式還需要設(shè)計新的芯片,因此ASIC類的芯片不適合網(wǎng)絡(luò)功能的消費類電子產(chǎn)品應(yīng)用。X86架構(gòu)是針對數(shù)據(jù)處理而設(shè)計,可以高效的處理32位或64位整型數(shù)字流,但視頻數(shù)據(jù)流的變長數(shù)據(jù)(不是32位或64位對齊的整型數(shù)據(jù))處理和位運算量很大,由此,X86架構(gòu)不能高效地處理各種媒體應(yīng)用,而且成本也不適合消費電子產(chǎn)品。


  像ADI的Blackfin處理器和TI的DaVinci技術(shù)(采用ARM+通用DSP架構(gòu))都采用可編程DSP SoC芯片,因為通用DSP的體系結(jié)構(gòu)加入長指令,針對乘法累加等運算優(yōu)化,其效率比X86提高很多。通用DSP架構(gòu)針對所有數(shù)字信號處理,強調(diào)

通用性,應(yīng)用范圍包括醫(yī)療、勘測和音/視頻。但這種架構(gòu)并沒有專門針對音頻、視頻進行優(yōu)化,這導(dǎo)致用于音視頻處理的DSP主頻通常很高,價格也較貴。那么,是否有一種架構(gòu),能夠處理所有數(shù)字多媒體數(shù)據(jù),并且專門針對視頻和音頻進行優(yōu)化?專注于通信(Communication)與消費(Consumer)融合的北京希圖視鼎科技有限公司(C2 Microsytems)向我們介紹了一種低成本、高性能的可編程平臺CC1100,它可滿足“網(wǎng)絡(luò)化娛樂”的要求。該平臺從形態(tài)上講是DSP類型的可編程SoC,它是一個完整的編解碼器,完全軟件可編程性使它適合處理一切音、視頻數(shù)據(jù)。目前C2自己開發(fā)了基于CC1100平臺的MPEG-2、MPEG-4、H.264、Real Media、Flash和AAC、MP3、AC-3等的編解碼算法。

  結(jié)構(gòu)特點:1個CPU作主控,3個DSP分別為三類關(guān)鍵運算優(yōu)化

  CC1100平臺(見圖1)采用C2公司自主設(shè)計的1個CPU+3個DSP架構(gòu),其中CPU是精簡指令集計算機(RSIC)CPU,3個DSP分別針對三類計算進行優(yōu)化。這三類計算分別是:1,運動估計,這是視頻處理中最耗費時間的一類計算,塊匹配和運動向量搜索都有專有的指令做運算加速;2,熵編碼,這也是圖像處理中使用頻率很高的計算;3,向量處理,圖像是二維數(shù)據(jù),對于8×8的圖像塊,一行像素或者一列像素都視作一個向量進行處理,向量之間的運算在圖像處理中也非常常用,另外,這部分也可以兼作音頻數(shù)據(jù)的處理。除了CPU本身固化的加減乘除等指令外,C2公司將上述三類運算量最大的計算抽出來固化為指令庫,通過CPU調(diào)用這些指令庫中的指令,可大大提高運算效率。

  需要特別指出的是,在音頻數(shù)據(jù)處理方面一般采用24位整數(shù)DSP處理(例如Blackfin),而CC1100平臺集成了256位的向量處理器,支持浮點處理,可以支持7.1聲道解碼和添加復(fù)雜的音效處理。該平臺架構(gòu)對視頻流碼率并不敏感:已驗證過15Mbps MPEG-2碼流和8Mbps MPEG-4碼流。CC1100單芯片支持網(wǎng)絡(luò)接口和USB,SATA等存儲接口,適用于公共場所網(wǎng)絡(luò)監(jiān)控設(shè)備、流媒體電視、時移電視、硬盤媒體播放機、IPTV等數(shù)字家庭娛樂設(shè)備以及個人娛樂(例如PMP)和汽車娛樂。關(guān)于CC1100是否能應(yīng)用到手機上,C2公司總裁兼執(zhí)行官劉錦湘指出,雖然手機也可以處理多媒體的需求,但手機和數(shù)字家庭娛樂設(shè)備對芯片的規(guī)格要求還是有差異的,比如手機芯片多集成基帶處理器,功耗要求更低。手機應(yīng)用不是CC1100的設(shè)計目標市場。C2的下一代平臺CC1200將采用90nm設(shè)計,能夠支持所有視頻格式的高清解碼,并且能夠支持WinCE和Linux雙系統(tǒng),可以應(yīng)用在更廣泛的行業(yè)市場。CC1100芯片目前采用0.15mm工藝設(shè)計,在臺積電(TSMC)制造流片。

  經(jīng)驗借鑒:找準軟件和硬件實現(xiàn)的結(jié)合點

  CC1100平臺最大的特點是實現(xiàn)了一種全新的處理架構(gòu),很好地平衡了硬件加速和軟件可編程的靈活性。芯片運行在350MHz,視頻編解碼的性能可以超過700MHz的通用DSP SoC。軟件可編程性的優(yōu)點是使產(chǎn)品保持高度的靈活性、可重用和新產(chǎn)品面世時間短。硬件實現(xiàn)的優(yōu)點是高性能、低功耗和小尺寸,其中的關(guān)鍵在于采用何種層次的實現(xiàn),從而達到性能和靈活度的最佳結(jié)合。C2公司市場經(jīng)理劉明璋分析了下一代平臺的發(fā)展方向:除了降低功耗之外,CC1200平臺一個主要的改進是增加一顆ARM CPU,以支持Window CE操作系統(tǒng),這樣原有CPU的處理負擔可以減輕很多;另外,CC1200采用90nm工藝制造,而且適于處理高清1080p分辨率的視頻應(yīng)用。

  附文:C2 Micro的DSPSoC核心架構(gòu)(見圖1),多處理器設(shè)計,能夠并行運行Linux應(yīng)用程序和音、視

頻處理算法。其中:ME Engine是一個可編程子處理器,其體系架構(gòu)可以高效率地執(zhí)行視頻壓縮運算中的塊搜索和運動補償算法;Entropy Engine也是完全可編程的變長位運算處理器,其架構(gòu)可以高效地解析處理MPEG-2, MPEG-4, H.264, VC-1和JPEG等位串碼流數(shù)據(jù)中的語法元素,它還可以高效地運行CABAC/CAVLC等熵編碼的壓縮和解壓縮算法;Vector子處理器支持專為音、視頻處理而優(yōu)化SIMD指令集,它內(nèi)置64個256位的超寬向量寄存器,支持整點和浮點運算;RISC主處理器是一個超級標量處理器,支持硬件雙線程技術(shù),一個指令周期最多運行4條指令,可以運行Linux操作系統(tǒng);片內(nèi)集成指令和數(shù)據(jù)cache;HUBS/DMA控制器可以在子處理器和DDR內(nèi)存之間建立高速數(shù)據(jù)交換的直接通道,不需要主處理器的干預(yù)和占用其它系統(tǒng)資源。



評論


技術(shù)專區(qū)

關(guān)閉