CAN協(xié)議的錯幀漏檢率改進
當數(shù)據(jù)在傳送中出錯,且錯幀被漏檢時,就意味著錯誤的數(shù)據(jù)被送到應用層,除非應用層有額外的數(shù)據(jù)識別措施,這個數(shù)據(jù)就可能引起不可預測的結(jié)果。CAN協(xié)議聲稱有很低的錯幀漏檢率(4.7×10-11×出錯率)[1],有的宣傳材料在一定條件下推出要1000年才有1次漏檢,這是不正確的。錯幀漏檢率是一個十分重要的指標,很多應用就是看到Bosch CAN2.0規(guī)范上的說明才選用CAN的。但是對這個指標的來源僅有極少的公開資料[2],以及很少的討論[3],使用戶很難對它確認或驗證,這給用戶帶來風險。本文采用了重構(gòu)出錯漏檢實例的方法,導出了CAN的漏檢錯幀概率下限,它比CAN聲稱的要大幾個數(shù)量級。在許多應用中,CAN已是可靠性和價格平衡下的不二選擇,或者已被長期生產(chǎn)和使用,面對這個新發(fā)現(xiàn)的問題,在CAN本身未作改進之前,迫切需要一種“補丁”來加以改善。由于篇幅有限,所以只能摘要介紹錯幀漏檢率的推導過程,重點在提供解決方案。
本文引用地址:http://m.butianyuan.cn/article/196170.htm1 關(guān)于CAN漏檢錯幀概率文獻的討論
Bosch CAN2.0規(guī)范[1]說它的漏檢錯幀概率小于錯幀率(message error rate)×4.7×10-11。它的來源見參考文獻[2],其中沒有提供產(chǎn)生漏檢的分析算法,僅提到用大量仿真得到了公式。要判斷一個幀出錯后是否會漏檢,至少要計算2次CRC,對每一bit僅就匯編語言也需要幾條指令,以該文考慮的80~90 bit的幀,CRC覆蓋58~66 bit就要循環(huán)58~66次,以1989年時常用的PDP11或VAX機,一條機器指令要0.1 μs左右,一幀的判斷要0.07 ms,即使不停機做一年,能作2.20×1011幀,考慮58 bit可構(gòu)成258=2.88×1017種不同的幀,再加有58×57種不同的加入2位bit錯的位置組合,所以能作的仿真只是可能情況的微乎其微的一部分(百萬分之一)。由于樣本太小,歸納的公式也就很難把影響因素考慮完整。
1999年Tran[3]對錯幀漏檢率也作了研究,鑒于分析困難,他也采用計算機大量仿真的辦法,針對11位ID 、8字節(jié)數(shù)據(jù)幀,他用的是600 MB的Alpha服務器。與上述討論一樣,雖然仿真量很大,仍然是可能情況的極小部分。
CAN有關(guān)的另一個標準CANopen Draft Standard 304 (2005)給出的錯幀漏檢率是(7.2×10-9)[4]。同樣來自CAN自動化協(xié)會的不同數(shù)據(jù),使人無可適從。
2 新錯幀漏檢率的導出
本文的研究方法是構(gòu)造出漏檢的實例,確定該種實例占可能的幀的概率,乘以與該實例相應的出多位錯的概率,然后求出所有可能的實例,得到CAN的錯幀漏檢率。本文對最有可能造成漏檢的二位錯情況進行分析,然后擴大為有多位錯。數(shù)據(jù)域取8字節(jié),并假定錯都發(fā)生在數(shù)據(jù)域內(nèi)。它并沒有將超過CRC校驗能力時的分散的多bit錯漏檢率考慮進去,所以得到的是漏檢錯幀概率的下界。
2.1 CAN位填充中有錯時的位序錯開
在有可能產(chǎn)生填充的位流中有bit錯時,就有可能造成發(fā)送方與接收方只有一方執(zhí)行填充規(guī)則,造成填充位與信息位理解的錯亂。圖1(a)的第3位傳送中出錯,結(jié)果發(fā)送方的填充位1被接收方誤讀為數(shù)據(jù)1,整個接收數(shù)據(jù)比發(fā)送數(shù)據(jù)長了1位。圖1(b)的第3位傳送中的錯使接收方產(chǎn)生了刪除填充位的條件,因此它把發(fā)送的數(shù)據(jù)1刪去,接收數(shù)據(jù)流短了1位。
圖1 CAN的位填充規(guī)則使出錯后接收位流變化
從位流變化可以知道,如果發(fā)生的2個bit錯正好一次是圖1(a)的類型,一次是圖1(b)的類型,那么發(fā)送數(shù)據(jù)流和接收數(shù)據(jù)流的長度將仍然相等,如果2個錯都發(fā)生在數(shù)據(jù)域,CAN的其他檢驗是發(fā)現(xiàn)不了它們的。
2.2 發(fā)生漏檢的條件
發(fā)送的位流與接收的位流可寫為多項式形式Tx(x)和Rx(x),CRC檢驗就是用CAN的生成多項式G(x)除這2個式子,得到的余數(shù)稱為CRC值,如果2個余數(shù)相同,CRC檢驗通過。當發(fā)生傳送錯誤,Rx (x)= Tx(x)+U(x)×G(x)時,對Tx(x)和Rx(x)求到的余數(shù)是相同的,這時就發(fā)生了錯幀的漏檢。因此只要找到U(x),就可以構(gòu)造出漏檢的實例。
2.3 由Ec(x)尾部確定漏錯多項式U(x)
為了使讀者了解推導過程的合理性,以下是舉例。在前面已經(jīng)發(fā)生過圖1(b)的錯后,Tx的i位被Rx收到為第i-1位。尾部發(fā)生的錯對應圖1(a)的情況如圖2所示。圖中Tx的這6位構(gòu)成漏檢實例的尾部,第1位1用于隔離前面位值的影響,使后面5位0后一定產(chǎn)生填充位。由于傳送中有錯,Rx不再有連續(xù)5位0。Tx的填充位被Rx視為數(shù)據(jù)位,Rx和Tx就對齊,在此以后的傳送不再有位序錯。由bit錯發(fā)生位置的不同,Rx也不同,錯誤序列Ec也不同。這個Ec也是整個錯誤序列的尾部,用Ec,t表示。由圖2可以看到,共有5種不同的錯誤序列尾部。顯然,將Tx中的0/1取反并不改變錯誤序列尾部Ec,t的形式。
圖2 第2個傳送錯造成填充位誤讀為信息位的5種漏檢錯序列尾部形式
在已知錯誤序列尾部形式Ec,t后便可以求出滿足它的漏錯多項式尾部Ut。將各多項式的系數(shù)表示為:
為滿足Ec,t=G×Ut的尾部,那么系數(shù)有如下關(guān)系:
實際上將Ec,t、G均作逆序排列:
類似于求CRC值時的方法,將Ec,tR×x5除以GR就可以得到Ut的逆序系數(shù),也就得到了Ut。由CAN生成多項式G的系數(shù)(1100,0101,1001,1001)以及Ec,t系數(shù)便得到了滿足錯誤序列尾部形式的漏錯多項式Ut,如表1所列。
評論