基于四核DSP的視頻交通檢測系統(tǒng)設(shè)計(jì)
1視頻檢測系統(tǒng)整體方案
目前交通信息視頻檢測系統(tǒng)較為復(fù)雜,而且穩(wěn)定性不高、價(jià)格昂貴、實(shí)時(shí)性不強(qiáng),需要專人管理,操作較為繁瑣。本設(shè)計(jì)系統(tǒng)框圖如圖1所示采用4核DSP結(jié)構(gòu),通過4個系統(tǒng)單元間通信接口的連接,將4個數(shù)字信號處理器DSP相結(jié)合,體現(xiàn)了4微處理器系統(tǒng)的優(yōu)勢。系統(tǒng)單元實(shí)現(xiàn)檢測算法并與外部設(shè)備交換數(shù)據(jù)。系統(tǒng)工作時(shí),CCD攝像頭采集車流圖像信號經(jīng)模數(shù)轉(zhuǎn)換得到數(shù)字視頻數(shù)據(jù),數(shù)字視頻數(shù)據(jù)存入視頻緩沖器FIFO中,存滿一行后向4×DSP系統(tǒng)發(fā)出中斷請求信號;DSP中斷CPU,將數(shù)字視頻數(shù)據(jù)傳輸?shù)絻?nèi)部存儲器SDRAM中,完成數(shù)字視頻圖像的采集和YUV變量分離,合成一幀完整的數(shù)字圖像數(shù)據(jù);然后產(chǎn)生中斷通知算法處理程序?qū)D像進(jìn)行處理,結(jié)果存儲在DSP地址空間約定好的緩沖區(qū)里,等待外部設(shè)備取走檢測結(jié)果,以作后續(xù)處理。
本文引用地址:http://m.butianyuan.cn/article/188545.htm
2 DSP簡介
DSP(數(shù)字信號處理器)自從1982年誕生以來,獲得了飛速的發(fā)展。本文采用4顆TI(Texas Instrument)公司高端DSP-TMS320C6416所設(shè)計(jì),具有主頻高、雙套外部地址和數(shù)據(jù)總線等特點(diǎn),非常適用于圖像處理等領(lǐng)域。有關(guān)該芯片的特點(diǎn)如下,詳細(xì)資料可見參考文獻(xiàn)[3]。
(1) DSP內(nèi)核采用超長指令字(VLIW)體系結(jié)構(gòu),有8個功能單元、64個32 bit通用寄存器。一個時(shí)鐘周期同時(shí)執(zhí)行8條指令,運(yùn)算能力可達(dá)到 4800MIPS(每秒百萬條指令),支持8/16/32/64 bit的數(shù)據(jù)類型。兩個乘法累加單元一個時(shí)鐘周期可同時(shí)執(zhí)行4組16×16 bit乘法或8 組8×8bit乘法,每個功能單元在硬件上都增加了附加功能,增強(qiáng)了指令集的正交性。除此之外還增加了一些指令用以削減代碼長度和增加寄存器的靈活性;
(2)為使數(shù)據(jù)能保持對超快速DSP內(nèi)核的供給,TMS320C6416采用了兩級超高速緩存器,即16 KB的一級數(shù)據(jù)Cache、16 KB的一級程序Cache和1 024 KB的數(shù)據(jù)和程序統(tǒng)一內(nèi)存。為了達(dá)到更大的擴(kuò)展,1 024 KB內(nèi)存中的256 KB存儲空間可設(shè)置用作二級Cache;
(3)TMS320C6416的存儲器接口提供了到SDRAM、SBSRAM、異步器件如SRAM/ROM等存儲器的無終端接口,也可連接到外部I/O器件;
(4)在TMS320C6416 中,增加了一個PCI接口,支持32bit寬的地址和數(shù)據(jù)復(fù)用總線,工作頻率最高為33MHz;
(5)DSP器件比通用CPU家族的動輒幾十瓦而言,其功耗一般在數(shù)瓦甚至毫瓦量級,這在各種功耗敏感場合顯示出獨(dú)特的優(yōu)勢,同時(shí)省去了繁雜的散熱系統(tǒng)。本文采用C6416,I/O電壓為3.3 V,內(nèi)核電壓為1.2 V。當(dāng)時(shí)鐘頻率為600 MHz時(shí),DSP的最大功耗小于1.6 W。
2.1 4×DSP的并行圖像處理系統(tǒng)
使用4個TI公司高端數(shù)字信號處理器TMS320C6416構(gòu)建一種新型的并行圖像處理系統(tǒng)。該系統(tǒng)通過一個同步4口SRAM和系統(tǒng)總線構(gòu)成互連結(jié)構(gòu),兼有緊耦合并行系統(tǒng)和松耦合并行系統(tǒng)的優(yōu)點(diǎn)[4]。
2.2 4×DSP并行系統(tǒng)結(jié)構(gòu)
圖像處理算法靈活多樣,而且還在不斷地迅速發(fā)展,為滿足日益復(fù)雜的圖像處理算法和逐漸變大的圖像規(guī)模,出于通用性考慮,系統(tǒng)中處理器之間需要靈活的、高帶寬的通信和握手機(jī)制。圖2給出了所設(shè)計(jì)的并行系統(tǒng)框圖,采用4顆TMS320C6416芯片,能較快完成以前一臺計(jì)算機(jī)需要長時(shí)間才能完成的任務(wù)。
從圖2可以看出,該系統(tǒng)以緊耦合系統(tǒng)和松耦合系統(tǒng)為基礎(chǔ)構(gòu)架而設(shè)計(jì)的,結(jié)合了兩者的優(yōu)點(diǎn)。緊耦合系統(tǒng)通過共享的存儲器來實(shí)現(xiàn)處理器之間的通信,處理器之間的聯(lián)系比較緊密。松耦合系統(tǒng)中每個處理器節(jié)點(diǎn)帶有存儲器[5],處理器之間通過消息傳遞的方式來相互通信。該系統(tǒng)每個節(jié)點(diǎn)即是一臺完整的DSP處理器并且?guī)в蠸DRAM存儲器,屬于松耦合系統(tǒng);而所有節(jié)點(diǎn)共享一個同步4口SRAM存儲器,構(gòu)成的整體是一個單一計(jì)算資源,屬于緊耦合系統(tǒng)。因此,該系統(tǒng)具有緊耦合系統(tǒng)和松耦合系統(tǒng)的優(yōu)點(diǎn),相比于前面兩者具有增強(qiáng)的可用性和更好的性能。
評論