基于FPGA的星載計算機(jī)自檢EDAC電路設(shè)計
SEU造成的RAM單元1比特錯誤如果不定時清除,就會產(chǎn)生累積,使計算機(jī)由此處理的結(jié) 果產(chǎn)生出2比特甚至更多比特錯誤,這種情況下將無法采用EDAC功能進(jìn)行數(shù)據(jù)糾錯,導(dǎo)致系 統(tǒng)錯誤操作甚至任務(wù)失敗。因此定時對RAM存儲單元進(jìn)行更新是必要的,但在傳統(tǒng)EDAC電路 設(shè)計下,對RAM存儲單元的更新只能由計算機(jī)的CPU(單片機(jī))進(jìn)行,其操作流程如下:
(1) 從存儲單元讀出數(shù)據(jù);
(2) 將讀出數(shù)據(jù)重寫入;
(3) 重復(fù)(1)~(2),直至全部單元更新完。
以航天計算機(jī)常用的80C32單片機(jī)為例,CPU對外部存儲單元的讀或?qū)懖僮餍枰?個指令 周期,讀完再寫入需要4個指令周期,每個指令周期包含12個時鐘。假設(shè)CPU時鐘為20MHz, 更新1M個RAM存儲單元需要的CPU時間為:4×12×1M 20MHz = 2.4s。
對于星上非常緊張的CPU資源來說,這是難以接受的,大大增加了星上CPU軟件的設(shè)計難 度。這種方法的另一個大的缺點是無法獲得數(shù)據(jù)錯誤信息,因為CPU直接讀取的是糾錯后的 數(shù)據(jù),所以無法對星上SEU造成RAM單元出錯的概率和錯誤模式進(jìn)行統(tǒng)計。
3.1 功能分析
由于FPGA的內(nèi)部大量的邏輯資源,使EDAC電路設(shè)計可以實現(xiàn)更加復(fù)雜的功能。在星載計 算機(jī)中,為了提高效率并節(jié)省CPU資源,一個理想的EDAC電路設(shè)計,應(yīng)具有以下三部分功能:
(1)數(shù)據(jù)讀寫功能。在CPU寫操作時,對原始數(shù)據(jù)進(jìn)行編碼,生成校驗碼,并將原始數(shù) 據(jù)和校驗碼存儲;在CPU讀操作時,從存儲器中取出原始數(shù)據(jù)和校驗碼,進(jìn)行計算,如有錯 誤,將錯誤糾正后輸出,如無錯誤,直接將原始數(shù)據(jù)輸出。
(2)自檢、自糾錯功能。在CPU控制要求下,可自動對所有EDAC保護(hù)的RAM存儲區(qū)進(jìn)行 順序讀取和校驗,檢測出錯誤數(shù)據(jù)或校驗碼。在自檢狀態(tài)下,如果由CPU配置為自糾錯狀態(tài), 當(dāng)某一RAM單元檢測出單比特錯誤后,自動將正確數(shù)據(jù)和校驗碼重新寫入該RAM單元。該項功 能的實施,基本上可保證SEU對計算機(jī)RAM區(qū)造成的影響及時得到修復(fù)。
(3)錯誤信息處理功能。在CPU讀操作或者自檢狀態(tài)下,通過輸出錯誤標(biāo)志信號,對CPU 產(chǎn)生中斷,對產(chǎn)生的錯誤進(jìn)行相應(yīng)處理。在CPU讀操作或者自檢狀態(tài)下,如果檢測出錯誤, 將出錯的地址、原始數(shù)據(jù)和校驗碼進(jìn)行暫存,可由CPU讀取,進(jìn)行相應(yīng)處理。
3.2 設(shè)計與實現(xiàn)
根據(jù)以上分析,筆者設(shè)計了如圖2所示的自檢EDAC電路,EDAC的功能主要由FPGA來實現(xiàn)。 到目前為止,具有航天等級的FPGA芯片已經(jīng)具有內(nèi)置的CPU硬核以及高達(dá)2.5Mbit的RAM資源, 因此該設(shè)計中的CPU和RAM模塊均可以是FPGA內(nèi)部資源,當(dāng)內(nèi)部資源無法滿足設(shè)計要求時,也 可以采用外置CPU芯片或外置RAM芯片。
評論