總線實現片內硬件調試支持單元設計
片上系統(tǒng)的出現使得芯片可以實現更加復雜的功能,獲取更高的性能,但同時其內部信號也變得越來越難以觀察和控制,相應的測試和調試工作也遇到了難以克服的時間復雜性困難。國際半導體技術路線圖( Internat io nal Technolo gy Roadmap for Semico nducto rs,IT RS) 指出,調試和定位問題所需要的時間將會隨著工藝的進步呈指數型增長。由于測試和調試工作的復雜性,其費用往往比設計費用還要高,大約要占整個SoC 總設計成本的1/ 3 以上。在整個SoC 的硬件設計過程中,從第一次投片到最后成功的實現所有功能,硬件調試的時間已經接近整個時間的35%,而且這個數字隨著集成度的提高還會增加。
本文引用地址:http://m.butianyuan.cn/article/150345.htm 在整個片上系統(tǒng)中,微處理器是核心,也是最復雜的模塊,所以各個處理器內核的提供商也都投入了大量的研發(fā)力量,在其內核中集成了豐富的調試功能。當今流行的調試技術大多采用復用JT AG 的調試方案,但是這種方法一般都是在目標系統(tǒng)內部插入掃描鏈,當處理器高速工作的時候,難免會限制處理器性能的提高。
為此,該設計提出一種新的調試結構,它不依賴JTA G接口且需要較少的引腳開銷,通過掛接在片上高速總線上來實時監(jiān)測片內通信狀況,同時它直接與處理器進行交互,能夠在不影響處理器正常工作的情況下控制處理器以及訪問所有片上存儲單元,用戶可以通過專用的數據輸出鏈路進行遠程調試,發(fā)布調試指令以及獲取反饋信息。結合以上特點,該設計將以文獻[ 3]中提出的一個良好調試結構所需具備的三個基本特征作為設計出發(fā)點: 調試的可觀察性; 調試的可控制性; 高效的通信效率; 低入侵性。
1 調試系統(tǒng)構成
以硬件調試模塊DSU 為核心,AMBA 2. 0 總線為構架,專用UART 為調試鏈路接口的系統(tǒng)結構如圖1所示。
圖1 調試系統(tǒng)結構圖
調試主機通過總線接口U ART 對調試單元發(fā)出調試指令; 調試單元將控制系統(tǒng)的調試狀態(tài),在滿足觸發(fā)條件時將通過與處理器的直接通信來掛起處理器,用戶可以利用調試主機通過調試接口訪問片上所有存儲單元,獲取系統(tǒng)狀態(tài)信息; 總線追蹤緩存可以工作在兩種模式下,在正常模式下通過DSU 實時記錄總線通信狀態(tài),而在調試模式下,將由調試主機對其進行訪問,尋找問題發(fā)生的根源; 指令追蹤緩存處于微處理器內部,用來存儲執(zhí)行過的指令; 調試接口UART 將為調試主機和總線之間提供協(xié)議轉換服務,實現串行數據與并行數據的相互轉化。
1. 1 AHB 總線
在SoC 設計中,芯片內部總線的設計往往決定了芯片的性能、功耗與各模塊的復雜度。通常依據以下兩個方面選取總線: 一是芯片設計流程其內在的需求,二是對交換帶寬、延時和效率靈活性的需求。該設計采用ARM 公司提出的一種片內高速總線協(xié)議AHB,它具有以下特點: 支持突發(fā)傳輸; 支持分塊傳輸; 單周期總線控制權移交; 單時鐘沿操作; 非三態(tài)執(zhí)行; 寬數據總線架構; 數據和地址流水重疊。此外,該協(xié)議還支持靜態(tài)時序分析以及友好的測試插入。
該系統(tǒng)設計的AHB 結構如圖2 所示,由主從模塊、仲裁器以及地址譯碼器構成,采用中央多路選擇器的互聯方式。作為核心部件,仲裁器接收最多16 個主設備的總線請求,為實現 可配置!的設計初衷,采用基于分治的仲裁策略,實現了固定與輪詢兩種優(yōu)先級算法,可以供用戶靈活選用。AHB 采用的集中式地址譯碼機制,有利于提高外圍設備的可移植性,中央譯碼器根據地址總線發(fā)來的地址以及各個從機的身份信息進行譯碼以選擇從設備,該設計為減少運算邏輯和降低功耗,僅對地址的高端位進行判別。整個AHB 系統(tǒng)由多路選擇器連接起來,避免了采用三態(tài)總線帶來的功耗、速度以及可測性方面的問題,系統(tǒng)所需的控制信號和地址數據將由多路選擇器路由到相應的目的設備,而根據路由的方向可將多路選擇器分為主模塊到從模塊多路選擇器和從模塊到主模塊的多路選擇器。此外,為了解決在沒有主機請求總線時的總線??? bus parking ) 問題,此系統(tǒng)還設計了一個缺省主設備( default master) ,其選擇??康闹鳈C號依賴選取的仲裁算法。split 傳送是AHB 的一個顯著特點,它在防止系統(tǒng)死鎖和充分利用總線方面起到了積極作用,這里為了解決分塊鎖定( split lo cked) 這一矛盾以及地址未命中問題,設計實現了一個虛擬從設備( dummy slave) ,當以上問題出現時,將由虛擬從設備代為發(fā)送回應信號。
圖2 AH B 總線系統(tǒng)互聯結構
1. 2 T race Buf fer
為了實現引言中提到的調試的可觀察性,本系統(tǒng)中就必須具備能夠記錄總線通信信息以及指令執(zhí)行情況的模塊。AHB T race Buf fer 就是一個循環(huán)緩沖存儲體,被用來存儲AHB 上通信的所有信息。AHB 總線上的地址、數據和各種控制信號存儲在其中,并且可以在以后的分析中讀出; 同時在需要調試寫入的時候也可以通過AHB 寫總線寫入數據。本模塊因每個周期需記錄的信息位寬為128 b,所以設計的AHB TraceBuf fer 存儲器將采用4 個位寬為32 b 的同步SRAM構成,深度可配置。若整個Buffer 的容量為1 KB,則每一個SRAM 大小為64 × 32 b,若容量為2 KB,則每一個SRAM 大小為128 × 32 b,依次類推。
在正常總線通信中,每一筆AHB 傳輸將被循環(huán)存儲到Buffer 中,在處理器進入調試模式后,AHB TraceBuf fer 被暫時掛起,這時可由外部調試設備利用AHB總線訪問Buffer ,通過地址譯碼控制4 塊SRAM 各自的使能信號,進而完成讀/ 寫操作。Buffer 的數據輸入端為128 b,包含的有地址、數據、控制信號和控制寄存器值等,詳細見表1。
同樣在微處理器內部實現一個指令T race Buf fer,用來存儲執(zhí)行過的指令。該部件同樣循環(huán)存儲,位寬128 b,利用4 塊SRAM 構成。該存儲器中將記錄指令執(zhí)行過程中指令運行狀態(tài),操作碼、操作數和操作結果,以及PC 指針等值,用以方便以后讀出進行診斷定位。
兩塊Buf fer 在系統(tǒng)正常運轉時記錄數據,所以為了保證其內容的正確性,僅允許系統(tǒng)進入調試模式時對其進行讀寫訪問,而正常狀態(tài)下將禁止對其訪問。
表1 AHB Trace Buffer 數據分配表
1. 3 DSU 單元
對于嵌入式系統(tǒng)而言,其內部的大部分信號與微處理器的工作狀態(tài)對于開發(fā)者都是不可見的,本設計就是通過提高在系統(tǒng)開發(fā)過程中用戶對系統(tǒng)的可觀察性和可控制性從而幫助開發(fā)者更為有效的定位設計中的錯誤,從而加速開發(fā)周期。為此,本系統(tǒng)必須在片上集成單獨的調試單元用于監(jiān)測系統(tǒng)運轉并能接管處于異常狀態(tài)時的微處理器。
借鑒CPU中程序狀態(tài)字的作用,DSU 中首先需要一些寄存器能夠控制與管理整個調試單元的行為,它應該能接收來自調試主機發(fā)布的調試命令,同時也能夠對系統(tǒng)內部斷點等觸發(fā)行為做出實時響應以及在任何時刻都能被調試主機所訪問,為此,該調試單元設計了如圖3 所示的部分關鍵寄存器。
圖3 DSU 內部寄存器
圖3( a) 為AHB T race Buf fer 控制寄存器。其中EN 位將控制AHB Trace Buffer 的使能; DM 位表示Buf fer 處于延遲計數模式,設計這種模式是為了方便觀察斷點發(fā)生前后定長時間內系統(tǒng)的運轉狀態(tài); BR 位則表示AHB 斷點命中; 高16 位DCNT 表示在延遲計數模式下的延遲計數值。AHB 斷點寄存器有兩路,可寫入30 位的精確斷點地址,當AHB 地址總線上廣播的地址與該斷點地址相吻合時,將會立即凍結AHBTr ace Buf fer,同時清除AHB 控制寄存器的使能位。
評論