DSP 在數(shù)字視頻處理技術(shù)中的應(yīng)用
數(shù)字?jǐn)z錄機(jī)/數(shù)碼相機(jī)
這兩領(lǐng)域是消費(fèi)類數(shù)字圖像的典型應(yīng)用,一般來(lái)講,前者強(qiáng)調(diào)移動(dòng)圖像的攝錄,后者追求靜止圖像的高質(zhì)量。如果處理芯片的可編程性足夠強(qiáng),這兩者完全可以兼顧。這可以帶來(lái)兩個(gè)好處,第一,可以開(kāi)發(fā)出平衡這兩方面需求的產(chǎn)品,既可以錄像又可以拍出高質(zhì)量的照片;第二,考慮到成本的影響,仍然開(kāi)發(fā)不同的產(chǎn)品,但可以共用一套圖像處理方案,這樣便減少了開(kāi)發(fā)的重復(fù)投資。
除了可編程性,這兩應(yīng)用對(duì)芯片的要求就是低功耗,因?yàn)樗鼈兌际潜銛y式的。其它的要求就是對(duì)移動(dòng)存儲(chǔ)的支持。
個(gè)人數(shù)字視頻播放器_隨身看/點(diǎn)播機(jī)
這類設(shè)備都是完成視頻解碼,前者更強(qiáng)調(diào)便攜性而后者則強(qiáng)調(diào)節(jié)目源的豐富。
在這里處理性能并不是第一位要考慮的,整個(gè)系統(tǒng)的能耗顯得更加關(guān)鍵。另一方面,要求芯片的接口比較豐富以支持LCD顯示屏,CFC或其它存儲(chǔ)卡,或者硬盤接口。
這些視頻應(yīng)用總體上可以分為兩大類:一類是高性能,要求多通道處理或多編碼制式,或追求高圖像質(zhì)量,同時(shí)由于技術(shù)的不斷發(fā)展,它又需要較強(qiáng)的可編程性支持未來(lái)的技術(shù)發(fā)展;另一類是可便攜應(yīng)用,強(qiáng)調(diào)的是小型化,低功耗,支持多種移動(dòng)存儲(chǔ)接口以及USB, 1394或其它高速總線。
針對(duì)應(yīng)用選擇合適的芯片
上文已提到,這些應(yīng)用大致上可以分為兩類,高性能和可便攜。TI針對(duì)這些市場(chǎng)都有相應(yīng)的產(chǎn)品。
首先我們看一下高性能的應(yīng)用。
高性能視頻應(yīng)用
在這類市場(chǎng)里,通常數(shù)據(jù)運(yùn)算量極大,比如僅考慮這類圖像運(yùn)算中最基本的運(yùn)算離散余弦轉(zhuǎn)換(DCT),對(duì)于單通道30幀的VGA視頻,它就需要每秒大約6千萬(wàn)次的乘加運(yùn)算。這還僅是其中非常一小部分。
要完成這么艱巨的任務(wù),我們就不得不看一看TI的單核性能最強(qiáng)的DSP核C64x,一個(gè)主頻可以達(dá)到720MHz,峰值運(yùn)算能力達(dá)到5760MIPS的32位DSP。除了這些無(wú)與倫比的主頻和通用乘加性能,C64的核更增強(qiáng)了對(duì)8位和16位操作的支持,而圖像領(lǐng)域絕大多數(shù)運(yùn)算是在8位的基礎(chǔ)上。例如,C64x增加了很多專用指令,如SUBABS4,同一機(jī)器周期里可同時(shí)完成四次減法和求絕對(duì)值, 還有諸如BITC4,AVGx,MPYHLx,DOTP2等等。這些增強(qiáng)使得運(yùn)動(dòng)補(bǔ)償平均提升達(dá)七倍,而四重8位運(yùn)算則使得每時(shí)鐘周期運(yùn)動(dòng)估計(jì)的8x8最小絕對(duì)差(MAD)的計(jì)算能力提高到7.6倍。這些都使以C64x為核心的DSP成為高性能視頻應(yīng)用的選擇。
我們來(lái)具體看一下,例如上文提到的視頻局端設(shè)備,由于它是一局端設(shè)備,挑戰(zhàn)在于多路多碼率以及多制式,因而要求片上內(nèi)存要大已放下足夠的多路數(shù)據(jù)和各種譯碼器,同時(shí)也需要與控制主機(jī)相連。由此TMS320C6415就是一個(gè)不二的選擇。它主頻可以跑到720MHz,有8兆位的片上內(nèi)存,有PCI接口。圖一就是一個(gè)C6415為核心的局端設(shè)備框圖。
圖一,視頻局端設(shè)備
相類似的應(yīng)用還有無(wú)線媒體網(wǎng)關(guān)。
對(duì)于客戶端設(shè)備,用TMS320C6415就不是那么合適了。例如IP視頻網(wǎng)絡(luò)電話,它通常是單路的,因而不需要太大的片上內(nèi)存,但它的接口卻要求很多。例如他們一般都是直接視頻輸入輸出,或從有線電視或從攝像頭到LCD,又要求接以太網(wǎng)。這里,我們就需要一個(gè)內(nèi)存夠用(因而便宜),支持通用視頻標(biāo)準(zhǔn)如BT656,還帶有以太網(wǎng)口的處理芯片TMS320DM642。
TMS320DM642是針對(duì)這類客戶端市場(chǎng)的數(shù)字信號(hào)處理芯片,TI 出了一系列類似的處理芯片,成為數(shù)字媒體(Digital Media)處理器。DM642帶有三個(gè)視頻口,均可輸入或輸出,支持BT656,百兆以太網(wǎng)口,多路音頻串口,66MHz PCI等等,可支持四路D1圖像30幀的MPEG-2的實(shí)時(shí)壓縮。以它為中心的IP視頻電話結(jié)構(gòu)非常簡(jiǎn)潔,如圖二
圖二 IP視頻電話方案
相類似的高性能視頻應(yīng)用還有機(jī)頂盒、數(shù)字視頻播放器/點(diǎn)播機(jī)和網(wǎng)絡(luò)相機(jī)/監(jiān)控系統(tǒng),它們都可以以DM642為中心將上各自特需的硬件,形成不同的應(yīng)用。這也最大程度上發(fā)揮了開(kāi)發(fā)投資的價(jià)值,一套方案上的經(jīng)驗(yàn)可以為其它所有方案利用。
可便攜設(shè)備的視頻應(yīng)用
這類設(shè)備中最典型的應(yīng)用就是數(shù)字?jǐn)z錄機(jī)/數(shù)碼相機(jī),除了共有的視頻圖像處理外,它們最大的考慮就是功耗。這些都是電池驅(qū)動(dòng)的,因而能量消耗必須有所限制。這種情況下C64x核的處理芯片就很不合適,如一顆C6415跑在600MHz時(shí)功耗超過(guò)1瓦。
幸好TI在功耗上很有研究,她的C5000是專門針對(duì)低功耗計(jì)算市場(chǎng)的,特別是C55x,創(chuàng)造了業(yè)界耗電最低紀(jì)錄,0.22mW每MIPS!C55x功耗低,性能也不差,它具有雙MAC雙ALU結(jié)構(gòu),200MHz的主頻可以達(dá)到400MIPS的處理能力!低功耗高性能使得C55x系列DSP成為便攜式消費(fèi)類電子的最佳選擇。
對(duì)于我們今天談到的視頻圖像應(yīng)用更重要的是TI 有系列專門針對(duì)便攜媒體市場(chǎng)的處理芯片。
TMS320DSC21/DSC25/DM270/DM310,這系列芯片的共同特點(diǎn)都是雙核結(jié)構(gòu)RISC的MCU核加上C5000的DSP核。運(yùn)算主要有DSP完成,同時(shí)針對(duì)圖像處理使用了硬件加速。所有這些芯片都有圖像擴(kuò)展協(xié)處理器iMX 和變長(zhǎng)編解碼協(xié)處理器VLCD,除了DSC21外都有量化反量化協(xié)處理器QIQ。其中iMX是多個(gè)并行乘加器來(lái)加速那些運(yùn)算量極大的圖像處理算法,例如DCT運(yùn)算。VLCD是用來(lái)進(jìn)行Huffman編解碼的,它DSP從不停的跳轉(zhuǎn)中解脫出來(lái)。QIQ則是進(jìn)行量化和反量化,由于量化是執(zhí)行除法運(yùn)算,DSP沒(méi)有專門的除法指令,只能用移位指令實(shí)現(xiàn),相當(dāng)耗資源。
有了這些協(xié)處理器,DM系列芯片的處理能力也向當(dāng)?shù)貜?qiáng),例如DM310可以實(shí)現(xiàn)D1圖像(720x480)30幀每秒的實(shí)時(shí)MPEG-4編解碼。
圖三,數(shù)碼相機(jī)
圖三即為一個(gè)DM310為基礎(chǔ)的系統(tǒng)。
芯片之外
看到這里,大家可以看到,這些應(yīng)用都有一些共同點(diǎn),也會(huì)自然而然地想到,不同的客戶用同一套芯片開(kāi)發(fā)同一種應(yīng)用會(huì)不會(huì)造出同樣的東西?這點(diǎn)勿須擔(dān)心,DSP充分的可編程性是差異化的保證。同時(shí)為了更好地集中于差異化,那些標(biāo)準(zhǔn)件,如各種碼制的編解碼器,也可以同第三方獲得。TI圍繞DSP完備而成熟的開(kāi)發(fā)環(huán)境也是縮短開(kāi)發(fā)周期迅速占領(lǐng)市場(chǎng)的保證。
評(píng)論