MAXQ環(huán)境下EEPROM的保護措施
在嵌入式微控制器應用中,通常都要用到非易失性存儲器。無論是掉電時維持需要保存的設置,還是存儲公司的重要記錄,可靠的非易失性存儲器都是現(xiàn)代微控制器領域的一個基本單元。
非易失性存儲常常采用外部串行存儲器實現(xiàn)。多年以來,該領域用到了數(shù)十億顆類似存儲器件,它們的可靠性得到了的廣泛認可。目前,存儲器可以做到幾百字節(jié)到1兆字節(jié)甚至更大的容量,在每一個需要保持設置的設備中,都能找到這樣一個緊湊、廉價的器件。
包括eeprom、閃存和旋轉式存儲器在內,所有類型的非易失性存儲器都面臨一個共同的問題:寫周期被中斷時,數(shù)據會丟失。一旦在寫周期執(zhí)行過程中掉電,那么即使再恢復電源,也很難修復損壞的數(shù)據。 本文提出了一種基于事務的提交-回退機制,用于保護一個外部串行eeprom存儲器件的內容。這些措施同樣適用于大多數(shù)maxq微控制器的內置eeprom??梢韵螺d本應用的代碼文件(zip,20.5kb)。
本文引用地址:http://2s4d.com/article/21551.htm
i2c eeprom的特點
串行存儲器件有多種接口,但最常用的接口是i2c接口。這種總線接口有很多優(yōu)點:高度標準化的接口;控制器和存儲器之間只需兩條線;而且具有靈活的時序要求,可以由軟件驅動。一個i2c主機可以驅動很多i2c從機,從而最大程度減少了主機的引腳數(shù)。
在所有eeprom器件中,寫周期都要比讀周期長的多。因為在寫周期過程中,電荷需要借助隧道效應并通過絕緣層進行轉移,而這個過程很費時間。雖然增加電壓可以加快這個過程,但是過高的電壓會導致絕緣層的介質擊穿,從而損壞器件。典型的eeprom器件寫周期持續(xù)10毫秒左右;而讀周期通常需要幾百個納秒。
為了顯著縮短寫周期的時間,許多i2c eeprom器件采用頁面模式。該模式允許將多個字節(jié)傳送到緩存中,然后將數(shù)據一次性寫入存儲區(qū)。i2c存儲器件的典型頁面尺寸為32字節(jié)。因此,可以在一個寫周期內向eeprom填入32個字節(jié)。
這一點非常重要,因為串行eeprom器件都具有特定的耐久度:即每個頁面所能承受的寫周期次數(shù)上限。典型的寫周期次數(shù)從10,000到1,000,000次。然而,即使存儲器件能夠承受1百萬次寫周期,軟件也會很快將其損耗殆盡。軟件每秒僅執(zhí)行100次寫周期,那么不到3個小時就會耗盡器件的寫周期次數(shù)。
考慮到這些基本的eeprom特性,設計者為一個嵌入式處理器設計可靠的非易失存儲系統(tǒng)時,需切記以下幾點:
不要在同一頁面上反復執(zhí)行寫操作。尤其是不要將某個頁面設置成寫入任何其它頁面時都要更新的“目錄”。
如果在寫周期過程中電源被中斷,必須提供以下機制:(1) 檢測被中斷的寫操作;(2) 完成被中斷的操作;(3) 或者將事件回退至寫操作之前的狀態(tài)。
必須通過某些數(shù)據校驗機制(校驗和、crc或消息摘要)來保證數(shù)據的完整性。
設計目標
雖然上面提到的eeprom問題可通過多種非易失文件系統(tǒng)加以解決,但這樣的文件機制對于小型嵌入式微控制器來說負擔過重。很多文件系統(tǒng)需要更多的ram,遠遠超出了小型微控制器所能提供的容量,而且對于多數(shù)應用,也不需要一個完整的文件系統(tǒng)。
考慮到這一點,下面列出了eeprom數(shù)據保護機制的設計目標:
精簡:保護機制用于存儲校驗數(shù)據的空間不應超過eeprom的10%,它應該只需要少量的計算開銷。
塊大?。罕槐Wo的塊大小,應該和eeprom的寫操作頁面大小一樣。由于eeprom器件的頁面大小通常是2的偶數(shù)次冪,因此與每個塊保留1或2個字節(jié)的做法相比,相同的尺寸大小更便于軟件編碼。
耐久性:每個保護周期不要對同一頁面進行寫操作。
可靠性:每次掉電情況下,數(shù)據都應是可恢復的。
這里提到的保護機制有6個接口函數(shù):讀、寫、提交、回退、檢查和清理。
讀函數(shù)接收一個塊編號和一個指向32字節(jié)緩存的指針。如果緩存地址和塊編號處于有效范圍內,程序就會將指定的塊數(shù)據讀入緩存,并校驗數(shù)據的有效性。它會返回如下狀態(tài):有效讀(valid read)、無效讀(invalid read)、無效緩存地址(invalid buffer address)、無效頁面編號(invalid page number)或保護失敗(protection failure)。
寫函數(shù)接收一個塊編號和一個指向填好數(shù)據的32字節(jié)緩存的指針。如果緩存地址和塊編號處于有效范圍內,程序就會將數(shù)據寫入非易失性緩存,并標記緩存狀態(tài)以準備提交。
提交和回退函數(shù),是可以在寫操作之后執(zhí)行的互補型操作。提交函數(shù)將最近被寫入的緩存數(shù)據復制到對應的存儲區(qū)最終位置,并為下一個待寫入的數(shù)據塊準備好緩存結構?;赝撕瘮?shù)實際上就是一個“取消”操作。它消除最近一次寫操作產生的效果,并為下一個寫操作準備好緩存子系統(tǒng)。 檢查函數(shù)讀取存儲器件的每個數(shù)據塊,并檢查存儲數(shù)據的有效性。該函數(shù)還檢查緩存子系統(tǒng),以確保沒有未執(zhí)行的寫操作。任何無效塊或未執(zhí)行的寫操作都會使檢查函數(shù)返回一個錯誤狀態(tài)。
清理函數(shù)修復一個數(shù)據損壞的eeprom。實際上,它將試圖找出發(fā)生的錯誤,并采取相應的解決措施。
關于這些函數(shù)的更多細節(jié),參見下面的操作詳解。
圖1. eeprom存儲器的結構。存儲器被劃分為3個區(qū)域:主存儲區(qū),包含實際用戶數(shù)據;校驗存儲區(qū),包含主存儲區(qū)每1頁的crc;緩存,包含存儲臨時寫入數(shù)據的四個緩存。 eeprom結構
參考上面圖1給出的eeprom結構。eeprom包含三個主要區(qū)域:
主存儲區(qū):eeprom的最大區(qū)域用于存儲用戶數(shù)據。在一個16kb器件內,包括512頁、每頁32字節(jié)的存儲空間。在這樣的器件中,開始的473個頁面專門用來存儲數(shù)據。
校驗存儲區(qū):eeprom的第二個部分,用于校驗主存儲區(qū)每個頁面的數(shù)據。校驗存儲區(qū)的每1頁都包含15個16位的crc值。每1頁的最后1個crc用于校驗本頁數(shù)據。校驗存儲區(qū)占用31頁(從473到503頁)。
緩存:eeprom的最后部分,包含由8個頁面構成的4個寫緩存。每個緩存包含4個域:數(shù)據域,它包含32字節(jié)數(shù)據,執(zhí)行下一個提交命令時,數(shù)據將被寫入主存儲區(qū);地址域,它表示緩存數(shù)據要寫入的頁面地址;狀態(tài)域,它表示緩存的狀態(tài)(包括可用(available)、占用(occupied)和終止(expired)狀態(tài));16位crc域,用來校驗整個寫緩存。緩存結構見圖1所示。
這種eeprom結構可以實現(xiàn)主要的設計目標。首先,由于主存儲區(qū)每1頁數(shù)據的校驗結果都存儲在另一個位置,所以頁面的所有位都用于存儲用戶數(shù)據。其次,由于主存儲區(qū)的每1頁都通過校驗存儲區(qū)的特定字來校驗,因此校驗存儲區(qū)不會有單點錯誤,并且也不會在每個寫周期中都去更新整個校驗存儲區(qū)的同一頁面。最后,使用4個寫緩存分散了寫周期帶來的損耗。
操作詳解
對于一個不帶保護功能的eeprom,具體操作非常簡單。一個讀周期簡單地將字節(jié)從所選擇的地址傳送給主機;一個寫周期將字節(jié)從主機寫入eeprom,并等待操作完成(大多數(shù)器件需要幾個毫秒的時間)。然而,在一個提供保護的eeprom環(huán)境下,讀和寫操作就比較復雜了。在以下各節(jié)中,對每個操作進行了分解,以便了解函數(shù)被調用時到底是如何操作的。
讀操作
圖2. 讀操作的流程圖 讀操作這個最簡單的接口函數(shù),也是相當復雜的。圖2給出了操作流程:
檢查頁面地址和緩存地址,以檢驗它們的有效性。如果地址無效,則就此結束操作,函數(shù)返回一個無效緩存地址或無效頁面編號錯誤代碼。
將所選頁面讀入緩存。
計算校驗頁面的地址,并將相應的校驗頁面讀入暫存區(qū)。
計算校驗頁面的crc。如果校驗頁面的數(shù)據無效,則返回一個保護失敗錯誤代碼。
計算數(shù)據緩存的crc,并將其與暫存區(qū)中對應讀取頁面的crc進行比較。如果crc匹配,則程序返回有效讀代碼;如果crc不匹配,則程序返回無效讀代碼。無論結果怎樣,實際讀取的數(shù)據都保存在返回緩存中,以供調用讀操作的程序使用。
寫操作
圖3. 寫操作的流程圖
如上所述,寫操作并不是真正將數(shù)據寫入主存儲區(qū)。實際上,寫操作是將數(shù)據寫入4個緩存之一。在這種方式下,主存儲區(qū)內原先的數(shù)據將一直保持到整個有效寫操作流程完成后為止。圖3的流程說明了以下幾點:
檢查頁面地址和緩存地址,以檢驗其有效性。如果地址無效,操作在這里結束,函數(shù)返回一個無效緩存地址或無效頁面編號錯誤代碼。
讀取每個寫緩存的狀態(tài)域。如果任何緩存處于占用狀態(tài),則操作失敗并返回寫過程(write sequence)錯誤代碼。
4個寫緩存之一應處于終止狀態(tài)。如果是這樣,激活下一個緩存。
數(shù)據被復制到寫緩存的數(shù)據域。
頁面地址被寫入地址域。計算crc校驗結果并將其寫入crc域。將狀態(tài)改為占用。將前一個緩存置為可用狀態(tài)(即更新原來的終止狀態(tài))。
需要注意,此時對新寫的頁面進行讀操作,將返回頁面原來的數(shù)值。只有等提交操作完成后,才會返回新值。
提交操作
圖4. 提交操作的流程
提交函數(shù)不需要參數(shù)。它的工作就是如實地將數(shù)據從寫緩存?zhèn)魉偷街鞔鎯^(qū),然后將寫緩存標記為終止狀態(tài)。提交函數(shù)的操作流程如圖4所示:
讀取每個寫緩存的狀態(tài)域。應該只有1個緩存標記為占用狀態(tài)。否則,函數(shù)在此結束,并返回一個寫過程錯誤代碼。
對被占用的緩存進行crc校驗。如果不匹配,則返回一個數(shù)據損壞錯誤代碼。
提取頁面地址,并將數(shù)據寫入主存儲區(qū)的指定頁面。
計算緩存的數(shù)據部分的crc。該值被保存在一個臨時寄存器中。
找到對應所選主存儲區(qū)頁面的校驗頁面,并讀取該校驗頁面的內容。
用前面計算的crc更新校驗頁面,為校驗頁面計算新的crc。
將校驗頁面數(shù)據重新寫回校驗存儲區(qū)。
將寫緩存更新為終止狀態(tài)。
回退操作
圖5. 回退操作的流程圖 如圖5所示,回退函數(shù)是最簡單的操作之一。由于主存儲區(qū)只有在完成一個提交操作后才更新數(shù)據,而不是在一個寫操作之后更新的,所以回退操作只需將寫緩存置為無效狀態(tài)即可。
讀取每個寫緩存的狀態(tài)域。應該只有一個緩存被標記為占用。否則,函數(shù)在此結束,并返回一個寫過程錯誤代碼。
將所選的寫緩存狀態(tài)域置為終止。
檢查操作
圖6. 檢查操作的流程圖
在任何上電情況下,都需要調用檢查函數(shù)以確保eeprom可以接受數(shù)據。檢查函數(shù)檢驗存儲系統(tǒng)的可用性,并報告任何發(fā)現(xiàn)的錯誤。該函數(shù)的檢查操作如圖6所示:
讀取每個寫緩存。確認只有一個緩存不是可用狀態(tài)。如果只有一個緩存含有未定義的狀態(tài)代碼,則返回一個寫操作中斷(interrupted
write)錯誤代碼。如果所有緩存均包含未定義的狀態(tài)代碼,則返回eeprom未初始化(uninitialized eeprom)錯誤代碼。
如果僅有一個緩存包含占用狀態(tài)代碼,計算此緩存的crc。如果crc不匹配,則返回一個寫操作中斷錯誤代碼。
檢查校驗存儲區(qū)的每一個頁面。如果任何頁面沒有通過crc校驗,則返回保護失敗錯誤代碼。
最后,檢查主存儲區(qū)的每一頁,并與存儲的各頁crc進行對比。如果有1頁未通過crc校驗,則返回一個提交中斷(interrupted
commit)錯誤代碼。
清理操作
圖7. 清理操作的流程 清理函數(shù)解決eeprom系統(tǒng)存在的任何問題。在清理操作退出時,無論eeprom子系統(tǒng)先前是何種狀態(tài),都應該可以繼續(xù)使用了。所有未提交的寫操作將被回退,并且完成失敗的提交操作。
圖7演示了清理操作是如何工作的:
如果檢查操作返回一個eeprom未初始化的錯誤代碼,則初始化eeprom。清除所有數(shù)據頁面,并且初始化所有校驗頁面。除最后一個寫緩存被初始化為終止狀態(tài)外,清除其它所有寫緩存并置為可用狀態(tài)。
如果檢查操作返回一個寫操作中斷錯誤代碼,則找到那個不是可用狀態(tài)的寫緩存。將它的狀態(tài)改為終止狀態(tài)。
如果檢查操作返回一個提交中斷錯誤代碼,則找到crc不匹配的主頁面。計算出它的crc并更新相關校驗頁面。
如果檢查操作返回保護失敗錯誤代碼,則表示緊隨提交操作的更新校驗頁面操作被中斷。讀出所有與錯誤校驗頁面相關的主存儲區(qū)頁面,并刷新校驗頁面。
安全性證明
要證明系統(tǒng)的安全性,需要確定寫操作過程中數(shù)據容易損壞的時刻。(讀操作從本質上來說是安全的。讀操作期間不會對eeprom頁面進行寫操作,因此數(shù)據不會被損壞。)
確定了這些易損時刻后,只需要再確定一個恢復過程。如果恢復機制涵蓋了所有可能的數(shù)據損失情況,而且如果我們假定在任何一個可能破壞eeprom寫周期的事件之后,都將首先執(zhí)行校驗/清理周期(例如上電),那么系統(tǒng)就是安全的。
在大多數(shù)串行eeprom器件中,一個寫操作首先將頁面的每位數(shù)據都置為已知值,然后將所有需要改變的位設置為需要的值。因此在掉電時,中斷的寫操作極有可能破壞該頁的所有字節(jié)。通??梢酝ㄟ^向損壞頁面寫入新數(shù)據,進而從這一失效事件中恢復出來。但這會失去原來的數(shù)據。
寫操作過程中數(shù)據容易損壞的時刻如下所述(按發(fā)生的時間順序排列):
對數(shù)據域進行寫操作:如果此時發(fā)生電源失效事件,檢查操作不會檢測到錯誤。正在被寫入的寫緩存仍顯示可用狀態(tài),但可用的緩存不包含有效的crc值。
向當前寫緩存寫入狀態(tài)信息:這個操作將狀態(tài)域改為占用狀態(tài),設定crc并為寫操作填入頁面地址。如果這個過程被中斷,可能發(fā)生如下情況:(1)
狀態(tài)無效,從而導致一個寫操作中斷錯誤;(2) 狀態(tài)有效,但crc錯誤,仍會導致一個寫操作中斷錯誤;(3) 狀態(tài)和crc域有效。在最后這種情形下,系統(tǒng)有未提交處理的寫操作??梢詸z測到這一狀態(tài),因為此時一個緩存將處于占用狀態(tài)而另一個緩存為終止狀態(tài)。如果子系統(tǒng)的其它部分檢查通過,則用戶代碼可通過發(fā)出提交或回退操作繼續(xù)執(zhí)行。無論發(fā)生何種情況,主存儲區(qū)和校驗存儲區(qū)都是安全的。
前一個緩存狀態(tài)清除為可用狀態(tài):緩存可能有損壞的狀態(tài)或crc,而下一個緩存為占用狀態(tài)。這意味著清除該緩存的狀態(tài)時操作被中斷,這種情況下可以執(zhí)行提交或回退操作。
在寫操作和提交操作之間:只有一個寫緩存將處于占用狀態(tài),并且通過了crc校驗。用戶代碼可以請求提交或回退操作。寫緩存、校驗存儲區(qū)和主存儲區(qū)都是安全的。
提交操作過程中數(shù)據容易損壞的時刻如下所述:
將數(shù)據域復制到主存儲區(qū):如果寫操作被中斷,主存儲區(qū)的1個頁面數(shù)據可能被破壞。檢查函數(shù)會檢測到兩種狀態(tài):(1) 一個有效的占用寫緩存;(2)
中斷的提交操作導致主存儲區(qū)頁面數(shù)據損壞。寫緩存和校驗存儲區(qū)是安全的。在這種情況下,清理操作會完成提交操作并返回一個干凈的系統(tǒng)。注意:即使寫操作已經完成,檢查操作仍會因為校驗存儲區(qū)的crc與計算出的crc不匹配而報錯。
更新校驗存儲區(qū)的crc:如果對校驗頁面的寫操作被中斷,則整個頁面的數(shù)據都可能被破壞。這意味著主存儲區(qū)的15個頁面都對應著無效的crc。但是由于校驗存儲區(qū)的每一頁都有自己的校驗和,而且在寫操作中斷后會產生校驗和錯誤,因此檢查程序會發(fā)現(xiàn)這一點。在這種情況下,檢查程序會返回保護失敗。修復方法如下:首先重新計算所有受影響的15個頁面的crc值。然后將這些值和該頁自身的有效crc值一起寫入校驗頁面。
更新寫緩存的狀態(tài)信息:如果當狀態(tài)變量從占用狀態(tài)變?yōu)榻K止狀態(tài)時,寫周期被中斷,那么整個寫緩存頁面的數(shù)據都可能被損壞。但是,校驗存儲區(qū)和主存儲區(qū)都是安全的。檢查操作會找到數(shù)據損壞的頁面,并返回寫操作中斷錯誤代碼。當運行清理程序時,它將復位寫緩存子系統(tǒng),并完成提交操作。
最后,在回退操作中數(shù)據容易損壞的時刻為:
更新寫緩存的狀態(tài):與提交周期的最終狀態(tài)類似,該操作只是簡單地將寫緩存的占用狀態(tài)復位至終止狀態(tài)。如果它被中斷,則檢查程序會返回寫操作中斷,并且清理程序會重新初始化所有的寫緩存區(qū)域。校驗存儲區(qū)和主存儲區(qū)仍是安全的。
可以看出,無論電源何時掉電或處理器何時被復位,存儲子系統(tǒng)都可保持數(shù)據的完整性。發(fā)生電源失效事件后,存儲子系統(tǒng)會返回到可進行讀或寫的狀態(tài)。如果一個提交操作被中斷,子系統(tǒng)會返回到可執(zhí)行提交或回退操作的狀態(tài)。
設計起步
maxq微控制器的eeprom存儲系統(tǒng)功能完備。系統(tǒng)設計者可以根據需要來增強該系統(tǒng)的功能。但需要注意以下幾點:
c封裝程序:在多數(shù)c語言標準中,與匯編語言子程序雙向傳送數(shù)據時都有一套標準的方法。例如在iar開發(fā)環(huán)境下,參數(shù)在低編號的累加器中傳入和傳出。由于參數(shù)已經傳入a[0]和a[1],為這些程序建立一個c封裝器,就像寫函數(shù)原型一樣容易。在其它c環(huán)境下,參數(shù)傳遞是通過數(shù)據棧進行的,需要一個簡單的封裝子程序。
并發(fā)處理:首先要保證寫周期的完整性,并且提供一套能夠保證完整性的機制,對于整個平臺的成敗至關重要。但很多應用都需要這樣一種機制,即可以讓一系列寫周期排隊并一次執(zhí)行完畢,從而保證全都執(zhí)行或全都不執(zhí)行。但本文討論的機制不能工作在這種方式下。如果一個系統(tǒng)存有跨越多個頁面的信息記錄,則可以中斷一個寫操作,這使得恢復之后的記錄涵蓋了包含部分新數(shù)據的頁面和包含部分舊數(shù)據的頁面。有一種方法可避免該問題,即在執(zhí)行提交操作之前允許多重寫操作。這種方法并不像聽上去那么簡單,因為一個部分提交的事務,可能同時包括新紀錄片斷、舊記錄片斷和損壞的頁面。
平均讀寫機制:平均讀寫作為閃存文件系統(tǒng)的一個特點,是指虛擬化頁面地址,使得被頻繁寫入的頁面會出現(xiàn)在存儲器的任何物理位置。但是很難找到實現(xiàn)這一目標的最佳方法。這是因為,最直接的解決方法(活動存儲塊的目錄處于固定的位置,并且每次寫操作后都要對它進行更新)會導致存儲目錄的頁面迅速損耗。所以,就像處理數(shù)據頁面那樣,還必須虛擬化和離散化目錄本身。
其它頁面尺寸:這里給出的系統(tǒng)假定采用一個16kb、每頁32字節(jié)的存儲器件。如果所選擇的器件具有更大的頁面尺寸(64字節(jié)或128字節(jié)),這些函數(shù)仍可工作,只是會伴隨一些額外的寫入損耗。(更新128字節(jié)頁面中的32字節(jié)區(qū)段時,會對整個128字節(jié)頁面執(zhí)行寫操作)。但這些函數(shù)無法對具有更小頁面尺寸的器件進行操作??梢詷嫿ㄒ粋€能夠在線確定eeprom器件特性的系統(tǒng),并可根據實際特性配置系統(tǒng)的參數(shù)。
增強的安全性:本系統(tǒng)對以下類型的錯誤提供保護:由于電源失效或不可預期的系統(tǒng)復位而造成的eeprom操作中斷。但eeprom器件偶爾也會因為其它原因出錯。例如,由于電路噪聲或致電離輻射導致的軟件錯誤?;蛘哂捎谝粋€或多個存儲單元損耗而導致硬件錯誤。
一種解決方法是計算并維護校正子(syndrome),而不是采用簡單的crc校驗字。校正子和校驗字類似,但是包含了足夠的信息以修復簡單的位錯誤。最簡單的校正子系統(tǒng)可以用log2n
+ 1個校驗位來檢驗n個數(shù)據位。因此,對于一個32字節(jié)(256位)的頁面來說,一個僅包含9位的校正子就可以修正任何1位錯誤。對數(shù)據完整性的要求更加嚴格時,可以采用更加復雜的系統(tǒng)來解決類似問題。
結語
外部串行eeprom為微控制器環(huán)境下存儲非易失數(shù)據提供了一種可靠的方法。利用本文提到的技術,即使面臨寫操作中斷的情況,串行eeprom依然能夠可靠地工作。在任何對數(shù)據完整性要求較高的應用中,設計者都可以考慮這些技術。
評論