復(fù)雜的實(shí)時(shí)嵌入式系統(tǒng)的調(diào)試

作者：ADI公司供稿時(shí)間：2008-04-15 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

　　隨著實(shí)時(shí)嵌入式系統(tǒng)的復(fù)雜程度不斷提高，低效率的調(diào)試方法的成本日益增加。鑒于當(dāng)前嵌入式應(yīng)用的復(fù)雜性還有繼續(xù)上升的趨勢(shì)，對(duì)這些系統(tǒng)的調(diào)試將成為加速產(chǎn)品上市和提供魯棒性最終產(chǎn)品的關(guān)鍵因素。隨著應(yīng)用對(duì)多線程和中斷嵌套的使用，開發(fā)商的大部分時(shí)間目前都花在調(diào)試上。應(yīng)用的實(shí)時(shí)屬性使得將伴隨同時(shí)發(fā)生多個(gè)事件的故障問題孤立起來變得更為困難。本文將討論常見的調(diào)試問題以及預(yù)防和檢查這些故障問題的一些方法。

本文引用地址：http://2s4d.com/article/81550.htm

　　從歷史角度上來看，嵌入式應(yīng)用代碼的調(diào)試流程可以分為兩類。第一類調(diào)試流程是回答 “我的代碼現(xiàn)在執(zhí)行到哪里？” 的問題。當(dāng)開發(fā)商依靠打印語(yǔ)句或者LED的閃爍來指示應(yīng)用程序執(zhí)行到某個(gè)節(jié)點(diǎn)的調(diào)試方法時(shí)，往往就屬于這種情形。如果開發(fā)工具支持這種調(diào)試方法，可以沿著應(yīng)用程序執(zhí)行的路徑插入斷點(diǎn)。第二類調(diào)試流程是幫助回答“我看到的數(shù)據(jù)是從哪里來的？”這一問題。在這種情況下，人們往往依靠寄存器顯示窗口觀察變量信息、處理器內(nèi)存的內(nèi)容。人們還可以嘗試單步執(zhí)行，并且觀察所有這些數(shù)據(jù)窗口以了解某個(gè)寄存器狀態(tài)何時(shí)出現(xiàn)錯(cuò)誤，內(nèi)存位置何時(shí)得到錯(cuò)誤的數(shù)據(jù)，抑或指針何時(shí)出現(xiàn)了誤用。

　　當(dāng)開發(fā)商寫完全部代碼后，如果無需了解網(wǎng)絡(luò)基礎(chǔ)設(shè)施，也沒有操作系統(tǒng)的任務(wù)調(diào)度需要考慮，那么就可以利用這些調(diào)試方法使一個(gè)應(yīng)用程序運(yùn)行起來。然而，現(xiàn)在的情況并非如此。嵌入式處理器以超過600 MHz的速度運(yùn)行，并且擁有可支持Ethernet和USB等協(xié)議的嵌入式外設(shè)，支持功能齊備的操作系統(tǒng)，例如mClinux，而且這些操作系統(tǒng)所調(diào)度的各種應(yīng)用程序是由數(shù)千行代碼構(gòu)成。使用打印語(yǔ)句和利用LED來調(diào)試是不現(xiàn)實(shí)的，因?yàn)楝F(xiàn)在常常有如此之多的功能在執(zhí)行是不可能的，或者它們會(huì)影響標(biāo)準(zhǔn)I/O口，從而造成處理器性能大幅度下降。

　　實(shí)時(shí)嵌入式系統(tǒng)軟件最常見的調(diào)試問題可以大致劃分為如下幾類：

　　1. 同步問題；

　　2. 內(nèi)存和寄存器訛誤；

　　3. 與中斷相關(guān)的問題；

　　4. 編譯器問題；

　　5. 異常情況。

　　下文對(duì)上述問題作簡(jiǎn)要介紹。

　　同步問題

　　在任何系統(tǒng)中，只要有多串序線程或者進(jìn)程運(yùn)行，而且是異步共享數(shù)據(jù)，則系統(tǒng)必然存在同步問題。對(duì)于共享數(shù)據(jù)的全部操作必須是順序化的，也就是說，只有在一個(gè)線程或者進(jìn)程完成對(duì)數(shù)據(jù)的操作后，其它的線程才能對(duì)數(shù)據(jù)進(jìn)行操作。

　　以圖1為例，線程A和線程B對(duì)共享變量“counter”進(jìn)行操作，A讓counter 增加，而B則讓counter減少。下方示出了線程A的counter++和線程B counter—的匯編代碼。假設(shè)線程B的優(yōu)先級(jí)要高于線程A，而線程A目前正在運(yùn)行，則線程B將被阻止。

　　舉例來說，假設(shè)初始的計(jì)數(shù)值是2，而線程A是執(zhí)行線程。則線程A讀入計(jì)數(shù)值，并送入一個(gè)寄存器，在使其增加一個(gè)增量后，再將其寫回計(jì)數(shù)器變量上。

　　在可搶先的多線程系統(tǒng)中，高優(yōu)先級(jí)的線程的執(zhí)行可以搶先于低優(yōu)先級(jí)的線程。如果數(shù)據(jù)被一個(gè)線程和中斷例程共享，也會(huì)出現(xiàn)上面的問題，因?yàn)橹袛嗟膱?zhí)行與線程的執(zhí)行之間是異步關(guān)系。

　　同步化方面的問題常常是很難進(jìn)行調(diào)試的，因?yàn)樗鼈內(nèi)Q于時(shí)序，是隨著軟件對(duì)數(shù)據(jù)的操作而隨機(jī)出現(xiàn)的。幸運(yùn)的是，大多數(shù)的實(shí)時(shí)操作系統(tǒng)可以提供同步化原語(yǔ)。開發(fā)商可以使用最適當(dāng)?shù)臋C(jī)制來保護(hù)共享數(shù)據(jù)，而不至于影響系統(tǒng)的性能。如果數(shù)據(jù)在多個(gè)線程之間共享，則開發(fā)商將有如下的選擇：

　　a. 關(guān)閉調(diào)度器以便當(dāng)前的線程永遠(yuǎn)不會(huì)被其它線程搶先；(無調(diào)度區(qū))

　　b. 使用信號(hào)量(Semaphore)或者互斥信號(hào)量(Mutex)來保護(hù)共享數(shù)據(jù)；

　　c. 利用關(guān)鍵區(qū)域來進(jìn)行保護(hù)，即屏蔽所有的中斷。

　　調(diào)試的一個(gè)小竅門就是，如果共享的數(shù)據(jù)被破壞，則編程者就應(yīng)當(dāng)首先檢查出任何一種多個(gè)線程或者中斷對(duì)共享數(shù)據(jù)同時(shí)進(jìn)行的操作。如果線程和中斷共享了數(shù)據(jù)，那么在線程代碼中必須將中斷關(guān)閉。如果數(shù)據(jù)在多個(gè)中斷例程之間共享的話，則中斷也應(yīng)當(dāng)被關(guān)閉，因?yàn)楦邇?yōu)先級(jí)的中斷可以搶先于低優(yōu)先級(jí)的中斷。

　　另外一個(gè)同步化問題則與線程優(yōu)先級(jí)的不恰當(dāng)?shù)姆峙溆嘘P(guān)。應(yīng)當(dāng)確保系統(tǒng)的初始化線程在引導(dǎo)時(shí)間內(nèi)就啟動(dòng)，并在生成其它的優(yōu)先級(jí)更高的線程之前，完成整個(gè)系統(tǒng)的初始化。

　　內(nèi)存和寄存器的數(shù)據(jù)訛誤

　　大多數(shù)的嵌入式系統(tǒng)都采用了平面化的內(nèi)存模式，也沒有內(nèi)存管理單元(MMU)，因而沒有硬件支持的內(nèi)存保護(hù)機(jī)制。即使采用能提供這種功能的處理器，也需要由開發(fā)商來實(shí)現(xiàn)對(duì)某些內(nèi)存區(qū)域的保護(hù)。進(jìn)程和線程將對(duì)其它進(jìn)程和線程的內(nèi)存空間有完全的訪問權(quán)限。這可能會(huì)造成下面所描述的、各種類型的內(nèi)存訛誤問題。

　　堆棧溢出運(yùn)行時(shí)堆棧是在函數(shù)調(diào)用進(jìn)程中所使用的一種暫存空間，用于存儲(chǔ)局部變量。硬件寄存器指針(SP)將跟蹤堆棧指針的地址。如果你在高級(jí)的語(yǔ)言中編程，如C語(yǔ)音，則編譯器所生成的代碼將使用與C語(yǔ)言運(yùn)行時(shí)間模型相一致的堆棧。運(yùn)行時(shí)間模式定義了變量是如何存儲(chǔ)在堆棧中的以及編譯器將如何使用堆棧。局部的變量被放置在當(dāng)前的堆棧中。圖2給出的例子描述在堆棧上采用的某些關(guān)鍵性的內(nèi)存。

　　當(dāng)堆棧指針超出了所指定的邊界時(shí)，就會(huì)出現(xiàn)堆棧溢出。這將造成內(nèi)存的訛誤，并最終造成系統(tǒng)的失效。在上述的實(shí)例中，如果總的堆棧內(nèi)存區(qū)不足以容納所有的局部變量，堆棧溢出就會(huì)發(fā)生。

　　調(diào)試的一個(gè)技巧就是，如果你擔(dān)心溢出，一個(gè)好的辦法就是將堆棧安排在內(nèi)存邊界上，這樣，如果在調(diào)試過程中出現(xiàn)了溢出，則仿真器將觸發(fā)一個(gè)硬件異常提示。

　　有些實(shí)時(shí)操作系統(tǒng)可能會(huì)提供調(diào)試功能，例如保護(hù)位可以形成對(duì)堆棧溢出的防護(hù)。這些操作系統(tǒng)要么記錄關(guān)于堆棧溢出的錯(cuò)誤信息，要么提交一個(gè)異常報(bào)告，以便動(dòng)態(tài)地增加堆棧。最起碼當(dāng)前的大多數(shù)實(shí)時(shí)操作系統(tǒng)都能報(bào)告堆棧以及已經(jīng)被線程和進(jìn)程所采用的堆棧的情況。
在任何中斷驅(qū)動(dòng)的系統(tǒng)中，堆棧的分配方式都必須考慮到中斷服務(wù)例程所采用的空間。如果中斷例程的設(shè)計(jì)目標(biāo)是使用當(dāng)前的執(zhí)行對(duì)象棧，則在這種情況下，每一個(gè)線程或進(jìn)程所擁有的最小的堆棧尺寸都應(yīng)大于或者等于執(zhí)行對(duì)象所要求的堆棧尺寸加上所有中斷例程累積起來所需要的最大的堆棧尺寸。

　　嵌入式系統(tǒng)開發(fā)商必須掌握各種應(yīng)用鏈接庫(kù)。例如，第三方的庫(kù)可能會(huì)認(rèn)定堆棧上為其提供了空間。

　　與中斷相關(guān)的問題

　　在嵌入式系統(tǒng)中，一般情況下，出于性能方面的考慮，中斷服務(wù)例程是以匯編形式編寫的。中斷本質(zhì)上是異步的，在應(yīng)用執(zhí)行中的任何時(shí)刻都有可能出現(xiàn)。匯編層次上的中斷例程最常見的問題，是寄存器的訛誤。在中斷服務(wù)例程中所采用的寄存器所存儲(chǔ)的數(shù)據(jù)，在寄存器被使用之前都必須被保存，而在從中斷服務(wù)例程返回之前，這些數(shù)據(jù)將被恢復(fù)。開發(fā)商必須了解狀態(tài)寄存器的情況，而任何一種ALU的操作都會(huì)改變其狀態(tài)。在這種情形下，ISR應(yīng)該保存其狀態(tài)并進(jìn)行恢復(fù)，仿佛它是一個(gè)已被使用的寄存器一般。

　　如果中斷例程是用C語(yǔ)言編寫的，它們的開發(fā)也是為了使用當(dāng)前的堆棧，則開發(fā)商就應(yīng)該針對(duì)堆棧溢出情況進(jìn)行防護(hù)，即每個(gè)線程都應(yīng)該擁有足夠多的堆棧，來滿足中斷或者嵌套的中斷堆棧的要求。最好的做法，就是讓中斷例程的規(guī)模盡可能小，推遲處理過程，交給一個(gè)線程或者優(yōu)先級(jí)較低的中斷。在開發(fā)過程中，開發(fā)商可以在中斷的開始和結(jié)束部分添加診斷功能，對(duì)基礎(chǔ)的架構(gòu)中的寄存器的狀態(tài)進(jìn)行比較。

　　中斷嵌套可以讓一個(gè)高優(yōu)先級(jí)的中斷搶先于低優(yōu)先級(jí)的中斷例程執(zhí)行。開發(fā)商應(yīng)該考慮到堆棧要求的峰值，并為其分配充足的空間(考慮最差的情況，即系統(tǒng)中的每一個(gè)中斷都被一個(gè)優(yōu)先級(jí)更高的中斷所搶先)。

　　有時(shí)，某些函數(shù)是以匯編語(yǔ)言編寫的，將被C函數(shù)所調(diào)用。如果匯編代碼并未按照C函數(shù)運(yùn)行時(shí)間調(diào)用規(guī)范來編寫，即按照編譯器所要求的那樣進(jìn)行，則會(huì)導(dǎo)致參數(shù)傳遞無效和訛誤。

　　編譯器的問題

　　編譯器的優(yōu)化，即使實(shí)現(xiàn)了邏輯上的正確性，有時(shí)也仍然會(huì)造成故障。采用低水平的設(shè)備驅(qū)動(dòng)器時(shí)，這一問題特別關(guān)鍵。重排指令是實(shí)現(xiàn)更高性能的常用方法，因?yàn)樘幚砥鞒３ＶС謫蝹€(gè)周期內(nèi)執(zhí)行多條指令。因此，編譯器將試圖調(diào)度指令，使得所有的指令時(shí)間片都得到充分的利用，即使這意味著在寄存器使用前很久就載入數(shù)據(jù)，或者在數(shù)值被計(jì)算完畢后很久，也讓內(nèi)存保持載入的數(shù)據(jù)。

　　例如，假設(shè)一個(gè)設(shè)備必須在向其發(fā)任何指令前就完成初始化。編譯器可能會(huì)移動(dòng)指令位置，以便改善性能。這可能會(huì)造成設(shè)備的故障。如果設(shè)備驅(qū)動(dòng)器調(diào)試后的版本是可行的，而采用經(jīng)過優(yōu)化的版本時(shí)會(huì)出現(xiàn)故障，那么你要查看設(shè)備的初始化中是否有被移動(dòng)的指令。

　　有時(shí)，將代碼從一個(gè)架構(gòu)移植到另一種架構(gòu)上，也會(huì)帶來某種數(shù)據(jù)類型上的問題。例如，一種架構(gòu)內(nèi)的整數(shù)是32 bit的，而其它的架構(gòu)中是48 bit或者64 bit的。這可能會(huì)導(dǎo)致數(shù)據(jù)的失效或者被截?cái)唷?/p>

　　異常情況所帶來的問題

　　如果異常是與程序的執(zhí)行相同步的，則往往是一種不當(dāng)?shù)牟僮鞯慕Y(jié)果，例如零作為除數(shù)所造成的異常，某些異常則是架構(gòu)所特有的。處理異常的最佳方法是采用缺省的異常處理器，并在出現(xiàn)異常時(shí)檢查異常出現(xiàn)的環(huán)境。異常所處的環(huán)境背景是寄存器量值的集合，包括狀態(tài)寄存器。大多數(shù)架構(gòu)將擁有一個(gè)指令地址寄存器，用來保存造成問題的指令地址。在多數(shù)情況下，要知道一個(gè)異常是如何發(fā)生的并不難，但是，是何種指令路徑可以隔離出這一失效，則是調(diào)試的難點(diǎn)。有些架構(gòu)支持跟蹤，可以看到程序順序執(zhí)行的指令的歷史。

　　不能執(zhí)行錯(cuò)誤檢驗(yàn)的代碼會(huì)造成內(nèi)存的訛誤。由于性能方面的原因，開發(fā)商可能會(huì)放棄對(duì)錯(cuò)誤的檢查。跳過錯(cuò)誤檢查將讓內(nèi)存泄漏等事件無法為人所知，而最終導(dǎo)致內(nèi)存訛誤。某些處理器架構(gòu)就容許應(yīng)用監(jiān)測(cè)數(shù)據(jù)總線的活動(dòng)，從而能抓住相應(yīng)事件。

　　探尋架構(gòu)特有的功能，大多數(shù)嵌入式處理器都支持某種層次上的調(diào)試功能。內(nèi)置的跟蹤單元就是一種得到硬件支持的跟蹤機(jī)制。例如，ADI公司的Blackfin處理器系列就具有硬件跟蹤單元，當(dāng)硬件跟蹤緩沖器充滿后，就會(huì)產(chǎn)生跟蹤異常。使用這種跟蹤單元后，人們可以構(gòu)建出完整的執(zhí)行路徑。免費(fèi)工具可從http://www.blackfin.org/網(wǎng)站下載。

　　觀察點(diǎn)可以讓你監(jiān)測(cè)特定的內(nèi)存位置或者內(nèi)存塊區(qū)正在被更改時(shí)出現(xiàn)的情況。觀察點(diǎn)可以監(jiān)測(cè)內(nèi)部的數(shù)據(jù)總線傳送，如果在觀察點(diǎn)寄存器中，發(fā)現(xiàn)任何匹配的對(duì)象，則讓處理器暫停。如果一個(gè)特定內(nèi)存位置不斷出現(xiàn)訛誤，則觀察點(diǎn)就非常有用。對(duì)內(nèi)存塊區(qū)進(jìn)行觀察以查看是否有任何正在損毀存儲(chǔ)器數(shù)據(jù)的惡意代碼。大多數(shù)當(dāng)前的調(diào)試環(huán)境都容許對(duì)內(nèi)存和寄存器的內(nèi)容進(jìn)行修改。有時(shí)，修改寄存器的內(nèi)容，可以讓我們洞察何處出現(xiàn)了故障。例如，通過更改程序計(jì)數(shù)器，你可以迫使程序在特定函數(shù)出現(xiàn)時(shí)恢復(fù)執(zhí)行。

　　結(jié)語(yǔ)

　　總之，由于調(diào)試是開發(fā)過程的最后步驟，因此它將對(duì)產(chǎn)品上市時(shí)間造成直接的影響。調(diào)試本身也是難以調(diào)度的，因?yàn)樗l(fā)現(xiàn)的問題在復(fù)雜性和可避免性方面都大相徑庭，上面所討論的是一些在嵌入式系統(tǒng)開發(fā)期間常見的問題。這些調(diào)試技巧和提示旨在著重強(qiáng)調(diào)節(jié)省時(shí)間，因此在開發(fā)復(fù)雜的嵌入式系統(tǒng)時(shí)，應(yīng)用現(xiàn)代的開發(fā)工具和擁有豐富調(diào)試功能的處理器能夠改善投資收益。

新聞中心

復(fù)雜的實(shí)時(shí)嵌入式系統(tǒng)的調(diào)試

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)