DSP鏈路口在并行處理系統(tǒng)中的應(yīng)用與設(shè)計
本文根據(jù)筆者在工程中應(yīng)用和調(diào)試ADSP2106X器件的經(jīng)驗,著重討論鏈路口的適用場合、使用方法,并對使用過程中常見問題進行分析,給出解決方法。
1 ADSP2106X及其鏈路口的特點和功能
ADSP2106X采用超級哈佛結(jié)構(gòu),具有體積小、速度高、內(nèi)存大、訪問靈活等特點,適用于構(gòu)成各種不同的并行多處理器系統(tǒng),完成各種實時信號的處理功能,特別適用于雷達信號處理和聲納信號處理。
ADSP2106X提供了6個鏈路口,每個鏈路口包括4位數(shù)據(jù)線、一個雙向時鐘信號、一個雙向確認信號。鏈路握手信號包括LxCLK和LxACK,鏈路口以四位碼一組的方式傳送32位或48位字。發(fā)送方在時鐘LxCLK的上升沿送出4位碼,接收方利用時鐘下降沿鎖存4位碼,并且使LxACK有效,表示已準備接收下一個字。在每個字開始發(fā)送時,發(fā)送方如果看到LxACK無效,將使LxCLK變高,并等待LxACK有效后發(fā)送新字。當(dāng)發(fā)送緩存為空時,LxCLK將保持低。如果接收時鐘不超過主時鐘(40MHz),LCOM寄存器的LCLKX2x位應(yīng)設(shè)為0;若接收時鐘為主時鐘的2倍,則置為1。兩個用于數(shù)據(jù)通信的鏈路口之間的連接關(guān)系如圖1所示。
每個鏈路口還可以按2倍時鐘頻率的速率進行數(shù)據(jù)傳輸。
鏈路口有以下功能和特點:
⑴各鏈路口可以獨立工作或同時工作;
?、峭獠恐鳈C可以直接訪問鏈路口;
?、染哂须p緩沖的發(fā)送和接收寄存器;
?、世面溌愤B接可以組成一維到多維的各種形式處理器網(wǎng)絡(luò)。
鏈路口有三種中斷形式:
?、臘MA使能時,DMA完成后將產(chǎn)生一個可屏蔽中斷;
?、艱MA禁止時,處理器核可以對存儲器映射的LBUF進行讀寫,當(dāng)接收緩沖不空或發(fā)送緩沖不滿時,可產(chǎn)生可屏蔽中斷;
?、钱?dāng)外部設(shè)備訪問一個未指定的鏈路口,或者訪問一個已指定但對應(yīng)LBUF被禁止的鏈路口時,將產(chǎn)生可屏蔽的LSRQ中斷。
鏈路口有三個重要的寄存器:LAR寄存器、LCTL寄存器、LCOM寄存器,它們都是32位寄存器。LAR寄存器(3x~3x+2位)代表了LBUFx的指定鏈路口,x取0~5,其它位保留。LCTL寄存器主要用來對各個LBUF進行設(shè)置(是否使能、是否用DMA方式、是否用鏈式DMA、發(fā)送還是接收數(shù)據(jù))。LCOM寄存器包含每個LBUF的狀態(tài)位(空還是滿),設(shè)置各LBUF傳送數(shù)據(jù)的速率以及其它功能。
ADSP2106X有6個獨立的鏈路緩沖LBUF5~0,每個LBUF由一個內(nèi)部寄存器和一個外部寄存器組成的2級FIFO構(gòu)成。當(dāng)LBUF用于發(fā)送時,內(nèi)部寄存器接收片內(nèi)存儲器送來的數(shù)據(jù),外部寄存器將數(shù)據(jù)字展開成4位碼,并且最高位先發(fā)送。當(dāng)DMA或處理核送來的數(shù)據(jù)占滿這2級FIFO時,將送出一個“滿”標志。每當(dāng)一個字展開發(fā)送后,F(xiàn)IFO中將空出一個位置并發(fā)出一個DMA請求。當(dāng)FIFO空時,LxCLK無效。當(dāng)LBUF用于接收時,外部寄存器用于數(shù)據(jù)打包,然后數(shù)據(jù)經(jīng)內(nèi)部寄存器以DMA方式送到片內(nèi)存儲器。通過鏈路指定寄存器LAR確定LBUF5~0與LINK5~0的連接關(guān)系。存儲器之間傳送數(shù)據(jù)時可以把一個LINK指定給兩個LBUF,利用DMA通信。
直接數(shù)據(jù)傳輸(DMA)可以承擔(dān)數(shù)據(jù)傳輸任務(wù)而無需運算控制單元干預(yù),從而提高了程序執(zhí)行效率。ADSP2106X提供了10條DMA通道,其中只有LBUF0~3支持二維DMA(即以行主模式訪問一個二維陣列元素)。LBUF5~0與6個DMA通道的對應(yīng)關(guān)系如下:
DMA通道1 鏈路緩沖LBUF0(與串口1接收共享)
DMA通道3 鏈路緩沖LBUF1(與串口1發(fā)送共享)
DMA通道4 鏈路緩沖LBUF2
DMA通道5 鏈路緩沖LBUF3
DMA通道6 鏈路緩沖LBUF4(與外部口0 EPB0共享)
DMA通道7 鏈路緩沖LBUF5(與外部口1 EPB1共享)
2 鏈路口的設(shè)置及應(yīng)用中需要注意的問題
如果傳輸?shù)臄?shù)據(jù)在內(nèi)存中不是一段數(shù)據(jù),而是多段數(shù)據(jù),就可以利用鏈式DMA。先禁止鏈路口所要指定的LBUF,對LAR指定,依次設(shè)置LCOM和LCTL(置LxCHEN位為1),向CP寄存器寫入DMA控制塊(每個控制塊包含了相應(yīng)收/發(fā)數(shù)據(jù)段的信息)在內(nèi)存中的首地址,就可啟動鏈式DMA;而向CP寫入0則禁止鏈式DMA。當(dāng)前DMA完成后,由DMA控制器自動裝入下一套參數(shù),放在存儲器中的(DMA)參數(shù)寄存器,建立下一個DMA。CP的位17為1時表示當(dāng)前DMA完成后產(chǎn)生一個中斷請求。DMA參數(shù)有4個:
IIx 地址(存儲器起始地址)
IMx 地址修改量
Cx 計數(shù)指針
CPx 鏈指針
它們在內(nèi)存中的位置關(guān)系如圖2所示。
鏈式DMA方式只是對同一個LBUF口而言,多個LBUF不存在相互之間的鏈式DMA的情況。
如果兩個鏈路口之間是單次傳輸數(shù)據(jù),那么先設(shè)置接收方DMA還是先設(shè)置發(fā)送方DMA都沒關(guān)系;但是,如果是多次循環(huán)的收發(fā)數(shù)據(jù),一定要保證接收方的DMA設(shè)置早于發(fā)送方DMA,否則每次傳輸數(shù)據(jù)時都會丟掉前兩個32位字。這是因為發(fā)送方一旦準備好,就往接收方的緩存預(yù)先打入兩個32位字。而當(dāng)接收方設(shè)置DMA接收數(shù)據(jù)時,首先要清除這個將要用到的緩存,因此這兩個32位字就丟掉了。在實際DMA傳輸數(shù)據(jù)過程中,一定不能對正在用的LBUF進行其它操作。
當(dāng)鏈路口禁止時,其數(shù)據(jù)線LxDAT3~0及LxCLK、LxACK都是三態(tài)。為了允許收發(fā)雙方在被使能的時間上有先后,在鏈路口禁止時要對LPDPD清0,以使LxDAT3~0及LxCLK、LxACK被內(nèi)部下拉(50kΩ)。要注意的是,這些信號線如果懸空,則必須用內(nèi)部或外部下拉電阻。
通過LINK口對DSP進行程序加載,一般用host(主機)或EPROM加載模式。
3 鏈路口應(yīng)用實例分析
筆者在實際工作中曾用到某型雷達信號處理系統(tǒng)。該系統(tǒng)包括4塊運算板和一塊后處理板,這5塊板子結(jié)構(gòu)完全相同。單塊DSP板包括20片ADSP2106X,同時處理同一個周期的4個通道(和通道、輔助通道1、輔助通道2和差通道)的數(shù)據(jù),每5片處理一個通道,4個通道連線關(guān)系原則上基本相同。實際工作中根據(jù)重頻來改變運算板的個數(shù),運算板處理完數(shù)據(jù)通過鏈路口分時向后處理板傳送數(shù)據(jù)。因為在實際中將出現(xiàn)多個鏈路口同時工作,為了避免各鏈路口工作時之間的高頻干擾,對印制板設(shè)計的要求非常高。限于篇幅,下面只給出和通道的原理框圖,如圖3所示。
LINK0和LINK3分別接收輔助通道的數(shù)據(jù),LINK2和LINK5把處理后的數(shù)據(jù)傳送到后處理板,4塊板子分時向后處理板匯總數(shù)據(jù)。通過調(diào)試發(fā)現(xiàn),在同一塊運算板內(nèi)部,各鏈路口之間的數(shù)據(jù)以80MHz的速率傳送(系統(tǒng)時鐘工作頻率為40MHz)時,同時工作,相互之間幾乎沒有干擾,可以保證數(shù)據(jù)傳送的準確性,大大提高了并行傳輸?shù)哪芰?。而?塊運算板和后處理板之間傳送數(shù)據(jù)(即板子之間傳送數(shù)據(jù)),如果采取80MHz的速率同時傳送,則相互之間干擾比較大,很難保證傳輸?shù)恼_性;用1倍速(40MHz)的速率傳送就可減少干擾,而且在接收板(即后處理板)鏈路口的握手信號上采取加濾波電容或下拉電阻的措施可以減少信號中的毛刺。本系統(tǒng)本來設(shè)計為同時由和通道、輔助通道1和差通道向后處理板傳送數(shù)據(jù),但實際工作中為了保證數(shù)據(jù)的正確性,在滿足要求的情況下,把輔助1通道的數(shù)據(jù)通過鏈路口傳送到和通道,再由和通道把數(shù)據(jù)發(fā)送出去,這樣減少了用于傳送數(shù)據(jù)的鏈路口的個數(shù),數(shù)據(jù)可以正確地傳輸。鏈路口之間握手信號線采用電纜連接(一般用雙絞線)。目前本系統(tǒng)已在某型雷達中得到了很好的應(yīng)用。
工程實踐表明,并行多DSP系統(tǒng)中充分利用鏈路口,可在保證數(shù)據(jù)傳輸可靠性的同時,克服多處理器之間占用總線的瓶頸問題,增強了處理器之間的通信能力。
評論