基于FPGA的SRAM自測(cè)試研究
引言
SRAM有高速和不用刷新等優(yōu)點(diǎn),被廣泛用于高性能的計(jì)算機(jī)系統(tǒng)。由于半導(dǎo)體工藝技術(shù)的提高以及存儲(chǔ)系統(tǒng)多方面的需要,存儲(chǔ)器件日益向高速、高集成方向發(fā)展,在使系統(tǒng)功能強(qiáng)大的同時(shí),也增加了系統(tǒng)的復(fù)雜性,給電路的故障診斷帶來(lái)了不小的困難[12]。由于存儲(chǔ)器功能和結(jié)構(gòu)的復(fù)雜性,設(shè)計(jì)者為了正確地處理數(shù)據(jù)和正常地運(yùn)行用戶的程序,必須保證SRAM單元的尋址、取指令以及計(jì)算正確,對(duì)程序或數(shù)據(jù)存儲(chǔ)單元的正確操作是很重要的方面,因此保證存儲(chǔ)器的正常、穩(wěn)定工作是系統(tǒng)穩(wěn)定工作的前提。本文主要是通過(guò)對(duì)常見(jiàn)的SRAM故障問(wèn)題的分析,運(yùn)用March C算法,以FPGA構(gòu)建成的SRAM自檢測(cè)試電路對(duì)SRAM系統(tǒng)進(jìn)行故障檢測(cè)與修復(fù)。
1 故障模型
所謂故障模型,是指為了研究故障對(duì)電路或系統(tǒng)的影響,診斷(定位)故障的位置,對(duì)故障作一些分類并選擇最典型故障的過(guò)程。SRAM系統(tǒng)可抽象為一組互聯(lián)的功能模塊,故障在各個(gè)模塊均可發(fā)生。Van de Goor等人[3]將其簡(jiǎn)化為地址譯碼器、讀寫(xiě)邏輯、存儲(chǔ)器單元陣列3部分,并證明前兩者與后者的故障在功能上是等價(jià)的,所以只需要檢測(cè)存儲(chǔ)單元陣列故障。常見(jiàn)的SRAM故障模型主要分為以下幾個(gè)類型[4]:
① 固定故障(StuckAt Faults, SAF)。陣列中的一個(gè)或多個(gè)單元的一位或多位固定為0或固定為1。
② 開(kāi)路故障(Open Faults, OF)。陣列中的一個(gè)或多個(gè)單元開(kāi)路到0或開(kāi)路到1。
③ 耦合故障(Coupling Faults, CF)。存儲(chǔ)單元中某些位的跳變導(dǎo)致其他位的邏輯值發(fā)生非預(yù)期的變化,既可以發(fā)生在不同單元之間。也可以發(fā)生在同一單元的不同位之間。將發(fā)生在兩個(gè)不同單元之間的耦合故障記為第一類耦合故障,將發(fā)生在同一單元不同位之間的耦合故障記為第二類耦合故障。
第一類耦合故障又可分為翻轉(zhuǎn)耦合故障、冪等耦合故障以及狀態(tài)耦合故障等。翻轉(zhuǎn)耦合故障是存儲(chǔ)器Ci單元(稱耦合單元)中的跳變引起被耦合單元Cj中的邏輯值發(fā)生翻轉(zhuǎn)的故障。若用“”表示邏輯值(0→1)的跳變,用“ ”表示邏輯值(1→0)的跳變,而用“ ”表示邏輯值的翻轉(zhuǎn),則這類故障可描述為眩華>或裕華>;冪等耦合故障是指在Ci中的值跳變時(shí)將Cj中的值固定為0或1,可描述為;0>、眩1>或裕0>、裕1>[5];而狀態(tài)耦合故障則是在耦合單元處于一特定狀態(tài)時(shí),被耦合單元被迫處于0或1,即0;0>、0;1>或1;0>、1;1>狀態(tài)。
第二類耦合故障即同一單元不同位間的耦合也有類似的情況,但當(dāng)寫(xiě)信號(hào)很強(qiáng)時(shí),同一單元不同位間的耦合就可能被淹沒(méi),只呈現(xiàn)出寫(xiě)入的信息。
④ 跳變故障(Transition Faults,TF)。陣列中的一個(gè)或多個(gè)單元的一位或多位無(wú)法在預(yù)期的時(shí)間內(nèi)完成數(shù)據(jù)從0到1或從1到0的跳變,記為;0>或;1>。這種故障看似可歸為固定故障,實(shí)質(zhì)則有所不同。它的狀態(tài)并非任何時(shí)刻都不跳變,當(dāng)有翻轉(zhuǎn)耦合故障影響它時(shí)就會(huì)完成原本不能完成的跳變。
⑤ 由地址譯碼錯(cuò)誤引起的單元陣列故障(Address Decoder Fault,AF)。它包括某地址不能訪問(wèn)任何單元、某單元不能被任何地址訪問(wèn)、某個(gè)地址可以訪問(wèn)多個(gè)單元、某個(gè)單元可被多個(gè)地址訪問(wèn)。
2 SRAM測(cè)試方法
SRAM的測(cè)試方法主要有以下3種。
(1) 直接存取測(cè)試
直接存取測(cè)試是產(chǎn)生一種測(cè)試結(jié)構(gòu)來(lái)允許對(duì)SRAM陣列的直接訪問(wèn)。它通常利用自動(dòng)測(cè)試設(shè)備進(jìn)行測(cè)試,可以從封裝引腳直接對(duì)嵌入式存儲(chǔ)器進(jìn)行訪問(wèn),或者可以從封裝引腳對(duì)測(cè)試狀態(tài)邏輯以及對(duì)一些為存儲(chǔ)器提供數(shù)據(jù)的流水線結(jié)構(gòu)中的串行狀態(tài)進(jìn)行訪問(wèn),能夠輕易實(shí)現(xiàn)多種高質(zhì)量測(cè)試算法。其缺點(diǎn)是:在ATE機(jī)上實(shí)現(xiàn)的算法越復(fù)雜,對(duì)ATE機(jī)存儲(chǔ)器的容量要求越高;在ATE機(jī)上不易實(shí)現(xiàn)對(duì)嵌入式存儲(chǔ)器的“全速”測(cè)試,測(cè)試時(shí)鐘的工作頻率越高,測(cè)試成本越高;由于芯片外圍引腳的限制,對(duì)芯片內(nèi)大容量SRAM進(jìn)行直接測(cè)試往往不大現(xiàn)實(shí)。
(2) 利用嵌入微處理器來(lái)間接測(cè)試存儲(chǔ)器
在這種測(cè)試方法中,通過(guò)嵌入式微處理器對(duì)存儲(chǔ)器進(jìn)行讀/寫(xiě)操作,測(cè)試向量是一系列微處理器的程序代碼。這些代碼可以放在程序存儲(chǔ)器中,在嵌入式芯片接口處施加代碼,測(cè)試存儲(chǔ)器的過(guò)程就是微處理器執(zhí)行測(cè)試程序的過(guò)程。其優(yōu)點(diǎn)是不需要對(duì)硬件設(shè)計(jì)做任何修改,而且測(cè)試算法的修改與實(shí)現(xiàn)可以通過(guò)靈活修改微處理器代碼予以完成。
(3) 存儲(chǔ)器內(nèi)建自測(cè)試(MBIST)
存儲(chǔ)器內(nèi)建自測(cè)試技術(shù)(Memory BuildIn Self Test, MBIST)的工作原理是在存儲(chǔ)器外圍產(chǎn)生一整套控制電路,包括數(shù)據(jù)發(fā)生、地址發(fā)生、控制產(chǎn)生以及結(jié)果比較等電路,實(shí)現(xiàn)芯片內(nèi)置存儲(chǔ)器測(cè)試模式的自動(dòng)產(chǎn)生以及測(cè)試結(jié)果的自動(dòng)判別。芯片外部的控制可以讓芯片自動(dòng)進(jìn)入內(nèi)部存儲(chǔ)器測(cè)試模式,MBIST不僅可以自動(dòng)產(chǎn)生內(nèi)部測(cè)試模式,而且也可以實(shí)現(xiàn)并行測(cè)試。由于需要增加額外的邏輯電路,所以MBIST技術(shù)的缺點(diǎn)在于增加了芯片面積,并有可能影響芯片的時(shí)序特性。對(duì)于不同容量的存儲(chǔ)器,MBIST電路的規(guī)?;鞠嗤R虼耍S著存儲(chǔ)器容量的增加,這種方法所增加的芯片面積所占的比例相對(duì)較小,而且這種測(cè)試技術(shù)還有很多其他技術(shù)優(yōu)勢(shì)。
本文研究的是計(jì)算機(jī)內(nèi)的SRAM測(cè)試方法,由于待測(cè)SRAM位于計(jì)算機(jī)系統(tǒng)內(nèi)部,是該系統(tǒng)的關(guān)鍵部分,因此本文采用FPGA作為計(jì)算機(jī)系統(tǒng)與SRAM之間通信的橋梁,通過(guò)接收計(jì)算機(jī)發(fā)出的控制信號(hào),自動(dòng)產(chǎn)生一套SRAM自測(cè)試電路。
3 March C算法
針對(duì)存儲(chǔ)器中的各種故障模型開(kāi)發(fā)了多種存儲(chǔ)器測(cè)試算法,如March算法、Walking算法、Galloping算法等。其中March算法是較簡(jiǎn)單的測(cè)試算法之一,具有較高的故障覆蓋率和較小的時(shí)間復(fù)雜度,所以March算法是最常用的存儲(chǔ)器測(cè)試算法。該算法經(jīng)過(guò)多次改進(jìn),出現(xiàn)了很多變種,如MATS、MATS+、March X、March C、March C等算法[6]。
March C算法是由March元素構(gòu)成的序列,其基本原理是利用有限狀態(tài)機(jī),反復(fù)對(duì)每一個(gè)地址進(jìn)行讀/寫(xiě)0或1操作,保證每?jī)蓚€(gè)字節(jié)之間的測(cè)試碼出現(xiàn)00、01、10、11四種情況,至少各一次;并且為了檢查高低地址讀/寫(xiě)順序故障,分別進(jìn)行地址遞增和地址遞減兩種操作。通過(guò)對(duì)存儲(chǔ)器不斷地讀寫(xiě),能夠檢測(cè)幾乎所有的存儲(chǔ)器故障。
在諸多的March C算法中,綜合考慮算法的故障覆蓋率及測(cè)試成本等因素,本文選用能夠有效檢測(cè)大多數(shù)存儲(chǔ)器簡(jiǎn)化故障的March C算法。March C算法的具體描述如下[7]:
其中,“”表示地址的升序,“”表示地址的降序,“ ”表示兩種順序都可以;r0、w0、r1和w1分別表示讀0、寫(xiě)0、讀1和寫(xiě)1。M0~M5分別表示一個(gè)March單元,March C算法能夠有效檢測(cè)出 SAF、TF、CF、AF等故障。其中,SAF故障可由 M0、M1單元和 M1、M2單元檢測(cè)出;TF故障中0→1故障可由M3、M4單元檢測(cè)出,1→0故障可由M2、M3單元檢測(cè)出;在CF故障中,1→0故障可由M2、M3單元和M4、M5單元檢測(cè)出,0→1故障可由M1、M2單元和M3、M4單元檢測(cè)出,置1故障可由M2、M3單元和M4、M5單元檢測(cè)出,置0故障可由M1、M2單元和M2、M3單元檢測(cè)出;AF故障可以在March單元的連續(xù)升序/降序中得到檢測(cè)。
評(píng)論