CAN協(xié)議的錯幀漏檢率改進

作者：時間：2013-01-23 來源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

當數(shù)據(jù)在傳送中出錯，且錯幀被漏檢時，就意味著錯誤的數(shù)據(jù)被送到應(yīng)用層，除非應(yīng)用層有額外的數(shù)據(jù)識別措施，這個數(shù)據(jù)就可能引起不可預(yù)測的結(jié)果。CAN協(xié)議聲稱有很低的錯幀漏檢率(4.7×10-11×出錯率)[1]，有的宣傳材料在一定條件下推出要1000年才有1次漏檢，這是不正確的。錯幀漏檢率是一個十分重要的指標，很多應(yīng)用就是看到Bosch CAN2.0規(guī)范上的說明才選用CAN的。但是對這個指標的來源僅有極少的公開資料[2]，以及很少的討論[3]，使用戶很難對它確認或驗證，這給用戶帶來風險。本文采用了重構(gòu)出錯漏檢實例的方法，導(dǎo)出了CAN的漏檢錯幀概率下限，它比CAN聲稱的要大幾個數(shù)量級。在許多應(yīng)用中，CAN已是可靠性和價格平衡下的不二選擇，或者已被長期生產(chǎn)和使用，面對這個新發(fā)現(xiàn)的問題，在CAN本身未作改進之前，迫切需要一種“補丁”來加以改善。由于篇幅有限，所以只能摘要介紹錯幀漏檢率的推導(dǎo)過程，重點在提供解決方案。

本文引用地址：http://2s4d.com/article/196170.htm

1 關(guān)于CAN漏檢錯幀概率文獻的討論

Bosch CAN2.0規(guī)范[1]說它的漏檢錯幀概率小于錯幀率(message error rate)×4.7×10-11。它的來源見參考文獻[2]，其中沒有提供產(chǎn)生漏檢的分析算法，僅提到用大量仿真得到了公式。要判斷一個幀出錯后是否會漏檢，至少要計算2次CRC，對每一bit僅就匯編語言也需要幾條指令，以該文考慮的80～90 bit的幀，CRC覆蓋58～66 bit就要循環(huán)58～66次，以1989年時常用的PDP11或VAX機，一條機器指令要0.1 μs左右，一幀的判斷要0.07 ms，即使不停機做一年，能作2.20×1011幀，考慮58 bit可構(gòu)成258=2.88×1017種不同的幀，再加有58×57種不同的加入2位bit錯的位置組合，所以能作的仿真只是可能情況的微乎其微的一部分(百萬分之一)。由于樣本太小，歸納的公式也就很難把影響因素考慮完整。

1999年Tran[3]對錯幀漏檢率也作了研究，鑒于分析困難，他也采用計算機大量仿真的辦法，針對11位ID 、8字節(jié)數(shù)據(jù)幀，他用的是600 MB的Alpha服務(wù)器。與上述討論一樣，雖然仿真量很大，仍然是可能情況的極小部分。

CAN有關(guān)的另一個標準CANopen Draft Standard 304 (2005)給出的錯幀漏檢率是(7.2×10-9)[4]。同樣來自CAN自動化協(xié)會的不同數(shù)據(jù)，使人無可適從。

2 新錯幀漏檢率的導(dǎo)出

本文的研究方法是構(gòu)造出漏檢的實例，確定該種實例占可能的幀的概率，乘以與該實例相應(yīng)的出多位錯的概率，然后求出所有可能的實例，得到CAN的錯幀漏檢率。本文對最有可能造成漏檢的二位錯情況進行分析，然后擴大為有多位錯。數(shù)據(jù)域取8字節(jié)，并假定錯都發(fā)生在數(shù)據(jù)域內(nèi)。它并沒有將超過CRC校驗?zāi)芰r的分散的多bit錯漏檢率考慮進去，所以得到的是漏檢錯幀概率的下界。

2.1 CAN位填充中有錯時的位序錯開

在有可能產(chǎn)生填充的位流中有bit錯時，就有可能造成發(fā)送方與接收方只有一方執(zhí)行填充規(guī)則，造成填充位與信息位理解的錯亂。圖1(a)的第3位傳送中出錯，結(jié)果發(fā)送方的填充位1被接收方誤讀為數(shù)據(jù)1，整個接收數(shù)據(jù)比發(fā)送數(shù)據(jù)長了1位。圖1(b)的第3位傳送中的錯使接收方產(chǎn)生了刪除填充位的條件，因此它把發(fā)送的數(shù)據(jù)1刪去，接收數(shù)據(jù)流短了1位。

圖1 CAN的位填充規(guī)則使出錯后接收位流變化

從位流變化可以知道，如果發(fā)生的2個bit錯正好一次是圖1(a)的類型，一次是圖1(b)的類型，那么發(fā)送數(shù)據(jù)流和接收數(shù)據(jù)流的長度將仍然相等，如果2個錯都發(fā)生在數(shù)據(jù)域，CAN的其他檢驗是發(fā)現(xiàn)不了它們的。

2.2 發(fā)生漏檢的條件

發(fā)送的位流與接收的位流可寫為多項式形式Tx(x)和Rx(x)，CRC檢驗就是用CAN的生成多項式G(x)除這2個式子，得到的余數(shù)稱為CRC值，如果2個余數(shù)相同，CRC檢驗通過。當發(fā)生傳送錯誤，Rx (x)= Tx(x)+U(x)×G(x)時，對Tx(x)和Rx(x)求到的余數(shù)是相同的，這時就發(fā)生了錯幀的漏檢。因此只要找到U(x)，就可以構(gòu)造出漏檢的實例。

2.3 由Ec(x)尾部確定漏錯多項式U(x)

為了使讀者了解推導(dǎo)過程的合理性，以下是舉例。在前面已經(jīng)發(fā)生過圖1(b)的錯后，Tx的i位被Rx收到為第i-1位。尾部發(fā)生的錯對應(yīng)圖1(a)的情況如圖2所示。圖中Tx的這6位構(gòu)成漏檢實例的尾部，第1位1用于隔離前面位值的影響，使后面5位0后一定產(chǎn)生填充位。由于傳送中有錯，Rx不再有連續(xù)5位0。Tx的填充位被Rx視為數(shù)據(jù)位，Rx和Tx就對齊，在此以后的傳送不再有位序錯。由bit錯發(fā)生位置的不同，Rx也不同，錯誤序列Ec也不同。這個Ec也是整個錯誤序列的尾部，用Ec,t表示。由圖2可以看到，共有5種不同的錯誤序列尾部。顯然，將Tx中的0/1取反并不改變錯誤序列尾部Ec,t的形式。