基于PCI總線的嵌入式實(shí)時(shí)DSP圖像采集系統(tǒng) 作者: 時(shí)間:2007-03-09 來(lái)源:網(wǎng)絡(luò) 加入技術(shù)交流群 掃碼加入和技術(shù)大咖面對(duì)面交流海量資料庫(kù)查詢(xún) 收藏 摘要:以交通十字路口實(shí)時(shí)DSP圖像采集系統(tǒng)為例,說(shuō)明了基于PCI總線的DSP圖像采集系統(tǒng)的優(yōu)點(diǎn),并詳細(xì)闡明了系統(tǒng)的硬件結(jié)構(gòu)和基于VxWorks操作平臺(tái)的軟件實(shí)現(xiàn),最后介紹了系統(tǒng)實(shí)現(xiàn)的效果。關(guān)鍵詞:PCI總線 DSP VxWorks操作系統(tǒng) 圖像采集系統(tǒng) 本文從實(shí)時(shí)性和大容量?jī)煞矫娼榻B了在通用計(jì)算機(jī)上加入DSP加速卡實(shí)現(xiàn)的圖像采集系統(tǒng)。利用DSP芯片的高速處理特性完成大部分的圖像處理工作,上位機(jī)只完成輔助操作和存儲(chǔ)系統(tǒng)。這種方法發(fā)揮了DSP的高速性能又具有相當(dāng)大的靈活性,而且開(kāi)發(fā)工具比較完善。 實(shí)時(shí)性要求足夠的傳輸速度,PCI總線速度最高可達(dá)528MB/s(66MHz、64位)。這是其他總線無(wú)法比擬的速度,如ISA總線速度只有5MB/s。另外,系統(tǒng)中DSP的可擴(kuò)展存儲(chǔ)空間高達(dá)1GB。這完全可以滿(mǎn)足一般圖像處理系統(tǒng)的需要。 1 基于PCI總線的DSP圖像采集系統(tǒng) 本系統(tǒng)主要用于路口違章車(chē)輛抓拍,包括闖紅燈抓拍、超速行駛抓拍等。通過(guò)攝像頭對(duì)車(chē)流進(jìn)行監(jiān)測(cè),當(dāng)有車(chē)輛在紅燈期間越過(guò)停止線或在限速地段超速行駛,系統(tǒng)拍下車(chē)輛的行為并把數(shù)據(jù)傳送到DSP進(jìn)行處理,然后經(jīng)PCI總線把處理后的數(shù)據(jù)上傳到上位機(jī)。當(dāng)然這套系統(tǒng)也可用于其他的監(jiān)控系統(tǒng),如樓宇監(jiān)控等,其硬件系統(tǒng)基本一致,只是軟件功能有所區(qū)別。本系統(tǒng)采用TI公司C6000系列DSP中的TMS320C6211作為系統(tǒng)的CPU。圖像數(shù)據(jù)通過(guò)攝像機(jī)采集并輸出模擬圖像信號(hào)。這些信號(hào)經(jīng)視頻解碼芯片轉(zhuǎn)換為數(shù)字信號(hào);再經(jīng)FIFO輸入DSP進(jìn)行圖像的增強(qiáng)、分割、特征提取和數(shù)據(jù)壓縮等;然后輸出信號(hào)經(jīng)PCI解碼芯片轉(zhuǎn)換為符合PCI總線規(guī)范的標(biāo)準(zhǔn)信號(hào),通過(guò)PCI總線接口傳到上位機(jī)。系統(tǒng)的控制邏輯由EPLD(Erasable Programmable Logic Device)控制器實(shí)現(xiàn)。系統(tǒng)結(jié)構(gòu)圖如圖1。 (1)視頻解碼芯片 系統(tǒng)中采集的圖像信號(hào)采用Philips公司的SAA7111A完成A/D轉(zhuǎn)換。SAA7111A允許四路模擬視頻輸入,具有兩個(gè)模擬處理通道,支持四路CVBS模擬信號(hào)或二路Y/C模擬信號(hào)或二路CVBS信號(hào)和一路Y/C信號(hào)。SAA7111A對(duì)攝像頭輸入的標(biāo)準(zhǔn)PAL格式的模擬圖像信號(hào)進(jìn)行A/D轉(zhuǎn)換,然后輸出符合CCIR601格式的4:2:2的16位YUV?jǐn)?shù)據(jù)到FIFO。其中亮度信號(hào)Y為8位、色度信號(hào)Cr和Cb合為8位數(shù)據(jù)。FIFO采用IDT公司的IDT72V215LB芯片,FIFO的深度為512%26;#215;18bit,支持STANDARD(標(biāo)準(zhǔn))和FWFT(First Word Fall-Through,首字直接通過(guò))兩種工作模式。按照CCIR601格式,YUV圖像分辨率為720%26;#215;576象素,當(dāng)按行輸出時(shí),SAA7111A輸出數(shù)據(jù)流大小為:720%26;#215;16=1440bit。因?yàn)椋模樱型ㄟ^(guò)32位的SBSRAM接口與FIFO通信,故YUV?jǐn)?shù)據(jù)寫(xiě)入FIFO時(shí)需要在FIFO之間實(shí)現(xiàn)乒乓切換。這時(shí)一行720%26;#215;16bit的數(shù)據(jù)在兩片FIFO中存儲(chǔ)變?yōu)椋常叮?26;#215;32bit。兩片FIFO可以滿(mǎn)足上述要求。FIFO的初始化及時(shí)序由EPLD實(shí)現(xiàn)。(2)DSP圖像處理模塊 TMS320C6211是TI公司發(fā)布的面向視頻處理領(lǐng)域的新款高速數(shù)字處理芯片,適用于移動(dòng)通信基站、圖像監(jiān)控、雷達(dá)系統(tǒng)等對(duì)速度要求高和高度智能化的應(yīng)用領(lǐng)域。存儲(chǔ)空間分兩部分:運(yùn)行過(guò)程的臨時(shí)數(shù)據(jù)存在Winbond公司的兩片128Mbit的W981216BH中;系統(tǒng)程序則固化在FLASH存儲(chǔ)器中,該存儲(chǔ)器選用AMD公司生產(chǎn)的8Mbit的AM29LV800B。Flash存儲(chǔ)器具有在線重寫(xiě)入功能。這對(duì)系統(tǒng)啟動(dòng)程序的修改和升級(jí)都帶來(lái)了很大的方便。DSP處理模塊結(jié)構(gòu)如圖2所示。圖2中的HPI(Host Port Interface)為主機(jī)口;EMIF(External Memory Interface)為外部存儲(chǔ)器接口,兼容同步/異步傳輸方式。 TMS320C6211 DSP的高速性能主要體現(xiàn)在以下方面:①TMS320C6211的存儲(chǔ)空間最大可擴(kuò)展到1GB,完全可以滿(mǎn)足各種圖像處理系統(tǒng)所需的內(nèi)存空間,而且其最高時(shí)鐘可達(dá)200MHz,峰值性能可達(dá)1600MIPS(百萬(wàn)條指令/秒)、2400MOPS(百萬(wàn)次操作/秒)。②并行處理結(jié)構(gòu)。TMS320C6211芯片內(nèi)有8?jìng)€(gè)并行處理單元,分為相同的兩組,并行結(jié)構(gòu)大大提高芯片的性能。③芯片體系采用VelociTI結(jié)構(gòu)。VelociTI是一種高性能的甚長(zhǎng)指令字(VLIW)結(jié)構(gòu),單指令字字長(zhǎng)為32bit,8?jìng)€(gè)指令組成一個(gè)指令包,總字長(zhǎng)為256bit。即每秒鐘可以執(zhí)行8條指令。VelociTI結(jié)構(gòu)大大提高了DSP芯片的性能。④采用流水線操作實(shí)現(xiàn)高速度、高效率。TMS320C6211只有在流水線充分發(fā)揮作用的情況下,才能達(dá)到最高的峰值性能。與其他系列DSP相比,優(yōu)勢(shì)在于簡(jiǎn)化了流水線的控制以消除流水線互鎖,并增加流水線的深度來(lái)消除傳統(tǒng)流水線的取指、數(shù)據(jù)訪問(wèn)和乘法操作上的瓶頸。 本系統(tǒng)DSP主要完成從FIFO讀出數(shù)據(jù)的處理以及壓縮等。數(shù)據(jù)處理由自行編寫(xiě)的算法實(shí)現(xiàn),數(shù)據(jù)壓縮算法采用JPEG(Joint Photographic Expert Group)標(biāo)準(zhǔn)。當(dāng)攝像頭采集速度為每秒25幀圖像時(shí),它留給DSP處理的時(shí)間最多為每幀40ms。如果考慮系統(tǒng)有一定的延時(shí)以及處理后圖像的存儲(chǔ)時(shí)間,那么DSP處理一幅圖像時(shí)間不能超過(guò)30ms。按照C6211的處理速度,在30ms內(nèi)可以處理48M(0.03%26;#215;1600MIPS)條指令。DSP讀出FIFO中的行數(shù)據(jù)并存入SDRAM,一幀圖像有576行,在最后一行時(shí)會(huì)收到系統(tǒng)的幀中斷,這時(shí)SDRAM中的圖像數(shù)據(jù)總共有1440%26;#215;576=810KB。讓?zhuān)茫叮玻保庇茫常叮蜅l指令周期的時(shí)間處理810KB的數(shù)據(jù)顯然綽綽有余。粗略的計(jì)算過(guò)程如下: 系統(tǒng)采用快速DCT(離散余弦變換),每8%26;#215;8矩陣需要11次乘法、29次加法,因此一幀圖像的FDCT,共需要(11+29)%26;#215;720%26;#215;576%26;#215;2/64=518400個(gè)指令周期;對(duì)于量化模塊,每8%26;#215;8矩陣需要64個(gè)量化指令周期,一幀需要64%26;#215;720%26;#215;576%26;#215;2/64=829440個(gè)指令周期;對(duì)于編碼部分,假設(shè)編碼后非0元素占25%,對(duì)每8%26;#215;8矩陣進(jìn)行Zig-Zag掃描、編碼估計(jì)需要120個(gè)指令周期,則共需120%26;#215;720%26;#215;576%26;#215;2/64=1555200個(gè)指令周期。按以上計(jì)算,在系統(tǒng)中進(jìn)行JPEG編碼大約需要2903040個(gè)指令周期,耗時(shí)19.3536ms(TMS320C6211工作在150MHz時(shí))??梢钥闯?,實(shí)際需要的指令遠(yuǎn)小于36M條,而時(shí)間也遠(yuǎn)小于30ms,DSP完全可以實(shí)時(shí)處理從FIFO傳過(guò)來(lái)的數(shù)據(jù)。 (3)PCI總線模塊 PCI總線規(guī)范吸引人的地方不僅是其高速度,更在于它適應(yīng)了現(xiàn)代I/O設(shè)備對(duì)系統(tǒng)的要求,對(duì)PCI擴(kuò)展卡及器件能進(jìn)行全自動(dòng)配置,并且只需很少的接口邏輯就可以實(shí)現(xiàn)并支持其他總線系統(tǒng)。 TMS320C6211的HPI口不支持PCI總線的無(wú)縫接口。本系統(tǒng)采用TI公司的PCI2040實(shí)現(xiàn)DSP的HPI與PCI總線的連接。DSP處理后的數(shù)據(jù)經(jīng)HPI口輸出到PCI2040進(jìn)行解碼,然后輸出到PCI總線上。其邏輯結(jié)構(gòu)如圖3所示。 PCI2040是TI公司設(shè)計(jì)的專(zhuān)門(mén)用來(lái)完成C5000系列和C6000系列DSP與PCI總線進(jìn)行接口的專(zhuān)用芯片。PCI2040符合PCI局部總線2.2規(guī)范,能夠方便地實(shí)現(xiàn)PCI總線與TMS320C54X或TMS320C6X DSP的HPI接口的無(wú)縫連接。PCI2040可以兼容3.3V和5V,以適應(yīng)不同的PCI總線電壓。PCI2040與C6211之間不需要信號(hào)的電平轉(zhuǎn)換,也不需要額外的控制邏輯電路,接口電路十分簡(jiǎn)單。 在本系統(tǒng)中,PCI2040上存在兩種電壓:5V和3.3V。其中3.3V是HPI口電壓,5V是PCI總線電壓。PCI2040啟動(dòng)時(shí)需要對(duì)其PCI總線寄存器和HPI寄存器參數(shù)進(jìn)行預(yù)加載。系統(tǒng)中PCI解碼模塊包括一塊配置ROM——AT24C08A,屬于EEPROM型ROM,便于對(duì)配置參數(shù)修改和升級(jí)。當(dāng)系統(tǒng)啟動(dòng)時(shí),存儲(chǔ)在AT24C08A的數(shù)據(jù)下載到PCI2040的寄存器中并進(jìn)行配置。 圖3中HINT[3:0]、HCS[3:0]、HRDY[3:0]、HRST[3:0]分別與四片DSP中的相應(yīng)信號(hào)相連。即PCI2040可以同時(shí)與四片DSP接口。 2 系統(tǒng)的軟件設(shè)計(jì) 本軟件系統(tǒng)包括兩部分,即底層軟件和系統(tǒng)軟件。 底層軟件主要是DSP圖像處理算法以及啟動(dòng)等運(yùn)行程序。這些程序主要在CCS環(huán)境下由C語(yǔ)言編寫(xiě)并進(jìn)行匯編優(yōu)化。CCS即Code Composer Studio,是TI公司發(fā)布的DSP軟件運(yùn)行環(huán)境。 在系統(tǒng)軟件方面,基于PCI總線的圖像處理系統(tǒng)面臨的難點(diǎn)頗多,其中難度最大的是PCI驅(qū)動(dòng)問(wèn)題。當(dāng)然這對(duì)于不同的系統(tǒng)軟件可能難度各異。若在Windows操作系統(tǒng)下,可以充分利用Windows的窗口特性:一方面,因?yàn)椋祝椋睿洌铮鳎蠹夹g(shù)成熟,軟件編寫(xiě)相對(duì)比較簡(jiǎn)單;另一方面,在Windows平臺(tái)下,PCI驅(qū)動(dòng)無(wú)需開(kāi)發(fā),可以直接利用Windows的PCI驅(qū)動(dòng)程序?qū)崿F(xiàn)圖像卡的驅(qū)動(dòng)。但是Windows操作系統(tǒng)比較龐大,而且無(wú)法依照系統(tǒng)的需要進(jìn)行自由裁減,不適合做成嵌入式系統(tǒng)。這里主要闡述在VxWorks操作系統(tǒng)下的軟件設(shè)計(jì)方法。 相對(duì)于Windows操作系統(tǒng),VxWorks的優(yōu)點(diǎn)表現(xiàn)在:①VxWorks系統(tǒng)具有較好的可裁減性,可裁剪的組件超過(guò)80個(gè),用戶(hù)可根據(jù)自己系統(tǒng)的功能目標(biāo)通過(guò)交叉開(kāi)發(fā)環(huán)境方便地配置;②VxWorks支持應(yīng)用程序的動(dòng)態(tài)鏈接和動(dòng)態(tài)下載,開(kāi)發(fā)者省去了每次調(diào)試都將應(yīng)用程序與操作系統(tǒng)內(nèi)核進(jìn)行鏈接和下載的步驟,縮短了編輯/調(diào)試周期;③VxWorks具有較好的兼容性,它是最早兼容POSIX1003.1b標(biāo)準(zhǔn)的嵌入式實(shí)時(shí)操作系統(tǒng)之一;④VxWorks具有很高的可靠性和穩(wěn)定性;⑤VxWorks具有很好的實(shí)時(shí)性,實(shí)時(shí)性的強(qiáng)弱以完成規(guī)定功能和做出響應(yīng)時(shí)間的長(zhǎng)短來(lái)衡量。VxWorks的多任務(wù)機(jī)制對(duì)任務(wù)的控制采用了優(yōu)先級(jí)搶占(Preemptive Priority Scheduling)和輪轉(zhuǎn)調(diào)度(Round-Robin Scheduling)機(jī)制。這充分保證了可靠的實(shí)時(shí)性,使同樣的硬件配置能滿(mǎn)足更強(qiáng)的實(shí)時(shí)性要求,為應(yīng)用的開(kāi)發(fā)留下更大的余地。 為闡明如何在VxWorks操作系統(tǒng)下實(shí)現(xiàn)PCI總線的驅(qū)動(dòng),還需了解PCI設(shè)備的配置空間。PCI設(shè)備有三種物理存儲(chǔ)空間:配置空間、存儲(chǔ)器空間和I/O空間。配置空間是長(zhǎng)度為256字節(jié)的一段連續(xù)空間,空間的定義如圖4?眼1?演。在配置空間中只讀空間有設(shè)備標(biāo)識(shí)、供應(yīng)商代碼、修改版本、分類(lèi)代碼以及頭標(biāo)類(lèi)型。其中供應(yīng)商代碼用來(lái)標(biāo)識(shí)設(shè)備供應(yīng)商的代碼;設(shè)備標(biāo)識(shí)用來(lái)標(biāo)識(shí)某一特殊的設(shè)備;修改版本標(biāo)識(shí)設(shè)備的版本號(hào);分類(lèi)代碼用來(lái)標(biāo)識(shí)設(shè)備的種類(lèi);而頭標(biāo)類(lèi)型用來(lái)標(biāo)識(shí)頭類(lèi)型以及是否為多功能設(shè)備。除供應(yīng)商代碼之外,其他字段的值由供應(yīng)商分配。 基地址寄存器最重要的功能是分配PCI設(shè)備的系統(tǒng)地址空間。在基地址寄存器中bit0(最低位)用來(lái)標(biāo)識(shí)存儲(chǔ)器空間還是I/O地址空間,基地址寄存器映射到存儲(chǔ)器空間時(shí)bit0為“0”,映射到I/O地址空間時(shí)bit0為“1”。PCI設(shè)備的驅(qū)動(dòng)過(guò)程主要包括下面幾個(gè)步驟: 首先,PCI設(shè)備的查找。在嵌入式操作系統(tǒng)中一般提供相應(yīng)的API函數(shù)查找。在VxWorks操作系統(tǒng)中通過(guò)函數(shù)pciFindDevice(PCI_VENDOR_ID,PCI_DEVICE,index, &pciBus, &pciDevice,&pciFunc_可以找到供應(yīng)商代碼為PCI_VENDOR_ID、設(shè)備標(biāo)識(shí)為PCI_DEVICE的第n(index+1)個(gè)設(shè)備,并且返回總線號(hào)、設(shè)備號(hào)以及功能號(hào),分別保存于&pciBus、&pciDevice、&pciFunc中。 其次,PCI設(shè)備的配置。通過(guò)操作系統(tǒng)提供的API函數(shù)訪問(wèn)PCI設(shè)備的配置空間,配置PCI設(shè)備基址寄存器的配置、中斷配置、ROM基地址寄存器的配置等,這樣可以得到PCI的存儲(chǔ)器空間和I/O地址空間映射、設(shè)備的中斷號(hào)等。在VxWorks操作系統(tǒng)中訪問(wèn)PCI設(shè)備配置空間的API函數(shù)有pciConfigOutLong、pciConfigInLong等,它們分別完成對(duì)PCI設(shè)備配置空間的讀寫(xiě)操作。 然后,根據(jù)PCI設(shè)備的配置參數(shù),對(duì)不同的設(shè)備編寫(xiě)初始化程序、中斷服務(wù)程序以及對(duì)PCI設(shè)備存儲(chǔ)空間的訪問(wèn)程序。 很顯然,用VxWorks操作系統(tǒng)實(shí)現(xiàn)雖然有一定的難度,但是系統(tǒng)具有很大的靈活性,系統(tǒng)比較小、適應(yīng)性強(qiáng),并且可以在工業(yè)控制計(jì)算機(jī)上運(yùn)行。 圖像采集系統(tǒng)的關(guān)鍵在于如何對(duì)大容量的信息進(jìn)行暫存、壓縮和傳輸?shù)葐?wèn)題進(jìn)行處理。本系統(tǒng)很好地解決了這三個(gè)難題。在圖像信息暫存方面充分利用了DSP存儲(chǔ)空間的可擴(kuò)展性,保證了系統(tǒng)可暫存的信息量足夠大;信息壓縮是DSP最擅長(zhǎng)做的事情,可以在很短的時(shí)間內(nèi)完成大量的信息壓縮工作;PCI總線的引入保證了信息在足夠的帶寬下進(jìn)行快速傳輸。采用嵌入式VxWorks操作系統(tǒng)實(shí)現(xiàn)使得系統(tǒng)具有良好的靈活性和適應(yīng)性,并大大降低了系統(tǒng)的成本。 linux操作系統(tǒng)文章專(zhuān)題:linux操作系統(tǒng)詳解(linux不再難懂)
評(píng)論