CAN優(yōu)先級倒置原因與對策分析
CAN總線起始于1986年左右,至今仍廣泛應(yīng)用。現(xiàn)在人們對安全的要求已大為提高,所以要不斷仔細審視CAN的安全性能。現(xiàn)在已經(jīng)發(fā)現(xiàn)的重要的CAN問題有:在消極報錯狀態(tài)下可能出現(xiàn)等效離線,使節(jié)點不能收發(fā)的時間相當長[1];錯幀漏檢率的估計不準,特別在誤碼率高時比Bosch CAN2.0數(shù)據(jù)高多個數(shù)量級[2],在單目的地址時影響數(shù)據(jù)正確性,在多個目的地址時會影響數(shù)據(jù)一致性;標準的振蕩源精度要求偏低[3],使誤用廉價器件成為可能,影響系統(tǒng)的穩(wěn)定性;本文發(fā)現(xiàn)的優(yōu)先級倒置的可能性,使調(diào)度分析結(jié)果的可信度下降;在數(shù)據(jù)幀倒數(shù)第二位的局部錯可能引起不一致的接收重復(fù)或丟失[4]。所以在FlexRay尚未達到預(yù)定目標、無論在可靠性還是價格上能取代CAN以前,對CAN作進一步的改進仍然是非常有意義的。
CAN是一種代表性的事件觸發(fā)通信協(xié)議,同時發(fā)生的多個通信請求將按照消息的優(yōu)先級進行無損仲裁,高優(yōu)先級的勝出。按照消息的優(yōu)先級進行無損仲裁是CAN原始專利的唯一權(quán)利要求[5]。對于低優(yōu)先級的消息而言,送達時間將受到高優(yōu)先級消息的阻擾,在高優(yōu)先級消息為周期性時,最壞送達時間是可以預(yù)先計算出的[6]。如果能安排好發(fā)送消息的初始相位并作寬松的時鐘同步,這個最壞送達時間可以大為減少。事件觸發(fā)協(xié)議的優(yōu)點是總線帶寬可以得到充分利用。另一個優(yōu)點是高優(yōu)先級消息可得到迅速發(fā)送。但是由于工業(yè)環(huán)境中普遍存在的電磁干擾,總線上會有毛刺,CAN總線的標準中已考慮到應(yīng)對方法?,F(xiàn)在發(fā)現(xiàn)毛刺應(yīng)對方法可能使節(jié)點的同步受到影響,從而損及高優(yōu)先級消息的發(fā)送機會,出現(xiàn)優(yōu)先級的倒置,動搖了CAN總線的基本性能。
1 毛刺的存在
車內(nèi)電磁環(huán)境惡劣, ISO 76372/3總結(jié)出代表性的傳導(dǎo)和輻射干擾。有人專門作了輻射干擾的實驗,參考文獻[7]的實驗中用24 V蓄電池給車內(nèi)常用的繼電器供電(CAN系統(tǒng)供電是獨立的),電源線與CAN電纜靠得很近,在電纜線有屏蔽、線長為2 m時,手動開關(guān)繼電器時可以看到CAN波形上疊加的毛刺,輻射干擾實驗結(jié)果如圖1所示。
圖1 輻射干擾實驗結(jié)果
實際汽車上也見到CAN總線失效的報告[8]:豐田汽車在經(jīng)銷商產(chǎn)品報告中確認,由任何原因召回的車中發(fā)現(xiàn)丟失CAN數(shù)據(jù)的記錄有292宗。毛刺是引起CAN總線出錯的可能原因,其具體誘發(fā)過程需要仔細分析,不能掉以輕心。
2 CAN位時間與消息仲裁原理
CAN總線把位時間劃分為NBT等分的時間片,稱為Tq。CAN總線控制器按Tq對總線上的差分電平進行采樣,以決定內(nèi)部狀態(tài)。當總線上沒有通信時,稱為總線空閑,電平差在0~0.5 V,邏輯值為“1”。電平差為0.9 V以上時邏輯值為“0”。 由圖1可知,存在“0“毛刺,也存在“1“毛刺。CAN總線驅(qū)動器的特性是線與,當“1”和“0”同時發(fā)生時,總線的電平為“0”,這便是仲裁功能。一幀開始發(fā)送的第一位是“0“,稱為SOF,然后是消息的標識符ID。ID代表了消息的優(yōu)先級,每個節(jié)點通過位采樣知道總線上仲裁的結(jié)果,正常工作時如果發(fā)送“1”而讀回“0”,表示本發(fā)送節(jié)點本次ID發(fā)送失敗,需等下一次幀發(fā)送機會。
總線空閑時,一個有發(fā)送要求的節(jié)點須先觀察是否有別的節(jié)點已經(jīng)開始發(fā)送,如已開始就不能發(fā)送。正是這里,由一個“0”毛刺開始的時段可以誤解為別的節(jié)點已開始傳送SOF,毛刺阻斷了該節(jié)點的發(fā)送(不管該節(jié)點要傳送的消息優(yōu)先級有多高)。
由于傳送電纜延遲以及中間器件(如光隔離)的延遲τ,節(jié)點將見不到提前量τ以內(nèi)發(fā)送的別的節(jié)點的SOF。同理,別的節(jié)點要經(jīng)過τ以后才見到該節(jié)點發(fā)送的SOF,τ以后別的節(jié)點就因總線上已有發(fā)送而不允許發(fā)送了。這樣,在本節(jié)點請求時刻±τ內(nèi)的發(fā)送被認為是“同時”請求發(fā)送,它們將按ID仲裁。對遲于其τ的其他低優(yōu)先級幀的發(fā)送,它也是必然勝出的。
3 CAN位時間同步的有關(guān)規(guī)定
CAN的位時間分為同步段(Sync)、傳輸段(Tprop)、緩沖1段(Ph1)與緩沖2段(Ph2),位值采樣在Ph1 與Ph2之間。位值變化時將有跳變沿,只有1/0為同步用的跳變沿。跳變沿決定了相位差e,跳變沿在Ph2內(nèi)e為負,在Sync內(nèi)為0,在Tprop和Ph1內(nèi)為正。每個節(jié)點根據(jù)e實行同步,同步的修正量受同步的種類限制。同步分兩種:硬同步與重同步。硬同步對應(yīng)幀開始時的情況,重同步對應(yīng)幀內(nèi)有同步沿時的情況。對重同步而言,每次的修正量不能大于稱為重同步寬度的可預(yù)先設(shè)定的量SJW,SJW=min(Ph1,Ph2)。
有關(guān)本文討論內(nèi)容的CAN總線標準為ISO 118981(2003)[9]及ISO 16845(2004)[10],正是這些條款的規(guī)定保證了CAN總線協(xié)議在高度干擾的環(huán)境下能可靠工作。
ISO 118981第10.4.2.2款規(guī)定,節(jié)點只有在總線空閑時可以發(fā)SOF,在服務(wù)間隔第3位(I.M.3)的“0”視為SOF。
ISO 118981第12.4.2.1款規(guī)定硬同步在幀間的間隔中實行。而幀間間隔包括服務(wù)間隔和總線空閑,對上次發(fā)送的消極報錯節(jié)點還包括禁發(fā)時間。因此,在I.M.3的跳變沿也是作硬同步用的。
ISO 118981第12.4.2.4款規(guī)定,重同步的目的是校正采樣點的位置,e為“+”時延長Ph1,e為“-”時縮短Ph2。校正量在e小于或等于SJW時為e,反之為SJW。
ISO 16845第7.7.2款規(guī)定了接收節(jié)點對SOF的硬同步驗證方法意味著同步段SYNC直接同步于1/0跳變沿。
ISO 16845第8.7.2.1款規(guī)定了發(fā)送節(jié)點在I.M.3位值采樣點前有1/0沿時的硬同步驗證方法:測試設(shè)備在被測單元I.M.3采樣點前Tq加被測單元內(nèi)部處理時間前發(fā)0,要求被測單元在跳變沿1位后發(fā)ID最高位。這意味著發(fā)送節(jié)點要與I.M.3內(nèi)1/0跳變沿硬同步,0值被采樣,下一位不再發(fā)SOF而是發(fā)ID最高位。
ISO 16845第8.7.3.1款規(guī)定了發(fā)送節(jié)點在I.M.3位值采樣點后有1/0沿時的硬同步驗證方法:測試設(shè)備在被測單元I.M.3采樣點后1個被測單元內(nèi)部處理時間后發(fā)0,要求被測單元在跳變沿后1 Tq立即發(fā)SOF。這意味著發(fā)送節(jié)點是硬同步,但開始發(fā)SOF。
ISO 118981第4.18和4.16款規(guī)定了發(fā)送節(jié)點和接收節(jié)點的定義。發(fā)送節(jié)點指的是發(fā)數(shù)據(jù)幀或遠程幀的節(jié)點,其狀態(tài)維持到仲裁失敗退出或總線再度空閑,否則就是接收節(jié)點。因此總線空閑時遇到毛刺,則大家都是接收節(jié)點。
ISO 16845第7.7.9款規(guī)定了接收節(jié)點在總線空閑時對毛刺濾除的驗證方法:要確定對總線空閑時短于Tprop+Ph1-1的0不作SOF處理。也就是說硬同步后未被采樣到就不算作SOF。
評論