新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設計應用 > 實時嵌入式系統(tǒng)軟件調(diào)試問題分析

實時嵌入式系統(tǒng)軟件調(diào)試問題分析

作者: 時間:2010-09-29 來源:網(wǎng)絡 收藏

 本文將討論常見的以及預防和檢查這些故障的一些方法。

本文引用地址:http://2s4d.com/article/151473.htm

  從歷史角度上來看,應用代碼的流程可以分為兩類。第一類流程是回答 “我的代碼現(xiàn)在執(zhí)行到哪里?” 的。當開發(fā)商依靠打印語句或者LED的閃爍來指示應用程序執(zhí)行到某個節(jié)點的調(diào)試方法時,往往就屬于這種情形。如果開發(fā)工具支持這種調(diào)試方法,可以沿著應用應當程序應當執(zhí)行的路徑插入斷點。第二類調(diào)試流程是幫助回答“我看到的這一數(shù)值是從哪里來的?”這一問題。在這種情況下,人們往往依靠寄存器顯示窗口觀察變量信息、處理器內(nèi)存的內(nèi)容。人們還可以嘗試單步執(zhí)行,并且觀察所有這些數(shù)據(jù)窗口以了解某個寄存器狀態(tài)何時出現(xiàn)錯誤,內(nèi)存位置何時得到錯誤的數(shù)據(jù),抑或指針何時出現(xiàn)了誤用。

  當開發(fā)商寫完全部代碼后,如果無需了解網(wǎng)絡基礎設施,也沒有操作的任務調(diào)度需要考慮,那么就可以利用這些調(diào)試方法使一個應用程序運行起來。然而,現(xiàn)在的情況并非如此。處理器以超過600 MHz的速度運行,并且擁有可支持Ethernet和USB等協(xié)議的外設,它們支持功能齊備的操作,例如uClinux,而且這些操作所調(diào)度的各種應用程序是由數(shù)千行代碼構成。使用打印語句和利用LED來調(diào)試是不現(xiàn)實的,因為現(xiàn)在常常有如此之多的功能在執(zhí)行是不可能的,或者它們會影響標準I/O口,從而造成處理器性能大幅度下降。

  也可能發(fā)生這樣的情況:處理器的工作速度是如此之快,以至于LED的亮滅速度會快到人眼無法察覺。另外現(xiàn)代的嵌入式系統(tǒng)通常支持斷點的設定,但是伴隨這些處理器所運行的代碼數(shù)量,使得這種類型的斷點調(diào)試難以駕馭。中斷和多線程系統(tǒng)在代碼的任何一點上設置一個斷點,可能都無法指示系統(tǒng)的正確狀態(tài)。由于斷點設置在物理內(nèi)存的某個地址上,索引不必了解線程的狀態(tài)。如果使用寄存器顯示方法,那么局部變量窗口和內(nèi)存窗口都將有助于隔離出所載入的不恰當?shù)牧恐?,但是,由于這些是靜態(tài)化的工具,不能給出有意義的運行中的調(diào)試信息,其適用性也常常很有限。

  嵌入式系統(tǒng)最常見的調(diào)試問題可以大致劃分為如下幾類:

  1. 同步問題

  2. 內(nèi)存和寄存器訛誤(corruption)

  3. 與中斷相關的問題

  4. 硬件配置問題

  5. 異常情況

  同步問題

  在任何系統(tǒng)中,只要有多串序線程或者進程都在運行,而且是異步共享數(shù)據(jù),則系統(tǒng)必然存在同步問題。對于共享數(shù)據(jù)的全部操作必須是原子化的,也就是說,只有在一個線程或者進程完成對數(shù)據(jù)的操作后,其它的線程才能對數(shù)據(jù)進行操作。

  以圖1為例,線程A和線程B對共享變量“counter”進行操作,A讓counter 增加,而B則讓counter減少。下方示出了線程A的counter++和線程B counter—的匯編代碼。假設線程B的優(yōu)先級要高于線程A,而線程A目前正在運行,則線程B將被阻止。

  


  舉例來說,假設初始的計數(shù)值是2,而線程A是執(zhí)行線程。則線程A讀入計數(shù)值,并送入一個寄存器,在使其增加一個增量后,再將其寫回計數(shù)器變量上。

  在可搶先的多線程系統(tǒng)中,高優(yōu)先級的線程的執(zhí)行可以搶先于低優(yōu)先級的線程。例如,假定線程A執(zhí)行Reg1 = Reg1+1指令后,一個事件喚醒線程B。此時,Reg1儲存量值3?,F(xiàn)在線程B被喚醒(正如藍線所標示的那樣),并讀入計數(shù)器的量值2(它尚未被線程A刷新)并將其量值減小到1。正如棕色的線所顯示的那樣,經(jīng)過一段時間,線程A恢復運行,將Reg1寫入計數(shù)器中,而該計數(shù)器的儲存量值為3。 在這個過程中,線程B的減量操作結果被丟棄。計數(shù)器存儲的量值變?yōu)?,即線程A進行一次增量后,線程B又進行了一次減量操作。被竄改的鏈接表則是另一個例子。如果數(shù)據(jù)被一個線程和中斷例程共享,則也會出現(xiàn)上面的問題,因為中斷的執(zhí)行與線程的執(zhí)行之間是異步關系。

  同步化方面的問題常常是很難進行調(diào)試的,因為它們?nèi)Q于時序,是隨著對數(shù)據(jù)的操作而隨機出現(xiàn)的。幸運的是,這些問題可以通過恰當?shù)乇Wo任何共享數(shù)據(jù)來避免。大多數(shù)的操作系統(tǒng)可以提供同步化原語。開發(fā)商 可以使用最適當?shù)臋C制來保護共享數(shù)據(jù),而不至于影響系統(tǒng)的性能。如果數(shù)據(jù)在多個線程之間共享,則開發(fā)商將有如下的選擇:

  a. 關閉調(diào)度器以便當前的線程永遠不會被其它線程搶先。(無調(diào)度區(qū))

  b. 使用信號兩(Semaphore)或者互斥信號量(Mutex)來保護共享數(shù)據(jù)。

  c. 利用關鍵區(qū)域來進行保護,即屏蔽所有的中斷。

  

  開發(fā)商必須從性能出發(fā)來選擇恰當?shù)募夹g選項。關閉調(diào)度器,將防止任何一種環(huán)境的切換,從而使得現(xiàn)在的線程能繼續(xù)執(zhí)行,直到調(diào)度器重新打開為止。這種方法有一個負面的影響:它將阻止任何準備好運行的高優(yōu)先級的線程。這一現(xiàn)象被稱為優(yōu)先級倒置。將中斷關閉是最安全的方法,對于執(zhí)行時間短的情形來說是理想選擇。于是,最差情況的中斷延遲就是所有未發(fā)生中斷的持續(xù)時間的總和。在硬系統(tǒng)中,一般來說,一個中斷功能可以被關閉的時間存在上限。

  調(diào)試的一個小竅門就是,如果共享的數(shù)據(jù)被破壞,則編程者就應當首先檢查出任何一種多個線程或者中斷對共享數(shù)據(jù)同時進行的操作。如果線程和中斷共享了數(shù)據(jù),那么在線程代碼中必須將中斷關閉。如果數(shù)據(jù)在多個中斷例程之間共享的話,則中斷也應當被關閉,因為高優(yōu)先級的中斷可以搶先于低優(yōu)先級的中斷。

  在多線程的系統(tǒng)中,高優(yōu)先級的線程可以搶在低優(yōu)先級的線程之前執(zhí)行。因此,如果數(shù)據(jù)在多個線程間共享的話,則必須采用某種恰當?shù)臋C制來保護被共享的數(shù)據(jù)。

  另外一個同步化問題則與線程優(yōu)先級的不恰當?shù)姆峙溆嘘P。應當確保系統(tǒng)的初始化線程在引導時間內(nèi)就啟動,并在生成其它的優(yōu)先級更高的線程之前,完成整個系統(tǒng)的初始化。例如,如果一個用于配置一個器件的低優(yōu)先級現(xiàn)場被一個使用該設備的高優(yōu)先級的線程搶先后,配置可能會完成,并可能會造成設備的故障。為了避免這種情形,開發(fā)商應當使用操作系統(tǒng)所支持的信號量或者其它同步化的原語。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

上一頁 1 2 3 下一頁

評論


相關推薦

技術專區(qū)

關閉