uc-OS III 任務(wù)優(yōu)先級(jí)不當(dāng)引發(fā)的困擾
為了使STM32的生態(tài)系統(tǒng)里OS多元化,stm32系列不僅支持FreeRTOS,也支持uc-OSIII,提供給客戶更多選擇,滿足客戶日益增長(zhǎng)的需求。
這里使用stm32f429-eval平臺(tái),基于stm32cubef4中的Demostration例程,替換其中的FreeRTOS。例程中uc-OSIII系統(tǒng)里涉及的任務(wù)及其優(yōu)先級(jí)配置如下表:
Demostration 是一個(gè)綜合示例,包含了盡可能多的中間件,譬如GUI framework, STemwin,USB stack, FatFS, OS(FreeRTOS)等等。鑒于芯片內(nèi)存大小限制,在stm32f429-eval 平臺(tái)上,tcp/ipstack lwIP 并未集成進(jìn)去。
Case 1 優(yōu)先級(jí)設(shè)置不當(dāng)引發(fā)ANR(application not response)
1.1 問(wèn)題描述
在應(yīng)用中,有一個(gè)videoplayer 和audioplayer 模塊,其中有一個(gè)功能,從文件系統(tǒng)中向播放器添加文件、文件夾,這在emWinframework 中,通過(guò)控件CHOOSEFILE_Create實(shí)現(xiàn),它是一個(gè)基于窗口的模式對(duì)話框。
然而,只要點(diǎn)擊“+”按鈕或者文件夾按鈕后,彈出一個(gè)選擇文件的對(duì)話框,再點(diǎn)擊屏幕任何地方,系統(tǒng)都沒(méi)有任何反應(yīng),界面也一直停留在這個(gè)對(duì)話框。
1.2 問(wèn)題分析與定位
在uc-OSIII 中,觸摸屏事件是通過(guò)軟定時(shí)器實(shí)現(xiàn)的,軟件定時(shí)器是通過(guò)一個(gè)任務(wù)實(shí)現(xiàn)的,而當(dāng)定時(shí)器任務(wù)的優(yōu)先級(jí)比GUI任務(wù)低時(shí),當(dāng)GUI任務(wù)處于就緒狀態(tài)時(shí),定時(shí)器任務(wù)得不到任何調(diào)度,那么任何觸摸事件的更新消息無(wú)法產(chǎn)生,也無(wú)法發(fā)送給GUI任務(wù),而GUI任務(wù)在等待觸摸事件(GUI任務(wù)與觸摸模塊是通過(guò)信號(hào)量來(lái)同步的)。這樣就出現(xiàn)了deadlock,一方(消費(fèi)者)死等某個(gè)事件的產(chǎn)生,而另外一方(生產(chǎn)者)無(wú)法產(chǎn)生這個(gè)事件,系統(tǒng)就出現(xiàn)了無(wú)響應(yīng)的現(xiàn)象。
1.3 問(wèn)題解決方案
既然uc-OSIII 是搶占式調(diào)度模式(也支持round-robbin調(diào)度),那么將定時(shí)器任務(wù)優(yōu)先級(jí)調(diào)整比GUI任務(wù)優(yōu)先級(jí)高一級(jí)即可,問(wèn)題予以解決。
Case 2 優(yōu)先級(jí)設(shè)置不當(dāng)引發(fā)調(diào)試模式下,程序崩潰
2.1 問(wèn)題描述:
使用Keil5.20 版本編譯、調(diào)試、下載程序時(shí),如果程序處于運(yùn)行模式,一切正常;然而如果置于調(diào)試模式,則程序100%crash。這種情形十分罕見(jiàn),一般情況下是,運(yùn)行模式往往程序會(huì)crash,調(diào)試模式下,程序可以正常運(yùn)行。使用調(diào)試模式來(lái)troubleshootbug 的。
2.2 問(wèn)題分析&解決
幸運(yùn)的是,該問(wèn)題100%復(fù)現(xiàn)。于是竭盡全力去找尋上一次對(duì)程序的修改導(dǎo)致了此問(wèn)題,一步一步撤銷修改,恢復(fù)成代碼的初始狀態(tài)。經(jīng)過(guò)幾番努力,力爭(zhēng)追根溯源,想查明是哪一次的修改導(dǎo)致了問(wèn)題。結(jié)果,依然一無(wú)所獲。
于是,開始考慮從異常處理程序中著手,找到觸發(fā)異常的那條指令,那個(gè)函數(shù),那個(gè)任務(wù)。這里主要參考了ARM提供的應(yīng)用筆記《apnt209.pdf》。調(diào)試時(shí),通過(guò)FaultReport 知悉,此異常為busfault,而且BFARVALID和PRECISERR都置位了。按照ARM的指南,BFARVALID 對(duì)應(yīng)的地址寄存器存儲(chǔ)的是觸發(fā)busfault 的指令地址,不過(guò)這次失效了,里面的地址不在ROM地址范圍內(nèi)。
本想咨詢一下ARM的技術(shù)支持,如何解決這一問(wèn)題。因?yàn)閭€(gè)人覺(jué)得,這個(gè)問(wèn)題跟調(diào)試器有關(guān),懷疑是自己對(duì)于IDE的某些參數(shù)配置不當(dāng)才引起的??嘤跊](méi)有任何間接的、直接的來(lái)自ARM官方的關(guān)于KeilMDK 技術(shù)支持。未遂。
心痛還得心藥治,解鈴還須系鈴人??紤]系統(tǒng)存在諸多任務(wù),于是考慮通過(guò)WBS方式,一一注釋掉這些任務(wù),看看究竟是哪個(gè)任務(wù)引起的。這樣做的話,工作量比較大。退而求其次,既然調(diào)試時(shí)程序每次都crash,而且每次crash時(shí),內(nèi)核的寄存器參數(shù)的值都是一樣的(幸運(yùn)的是,該異常不是隨機(jī)產(chǎn)生的),聯(lián)想到Linux內(nèi)核里有一個(gè)當(dāng)前任務(wù)指針currenttask pointer,而uc-OSIII 中也有類似的數(shù)據(jù)結(jié)構(gòu)(其他OS如FreeRTOS也有類似數(shù)據(jù)結(jié)構(gòu)),即OSTCBCurPtr,將其置于watch窗口,發(fā)現(xiàn)其指向OSStatTaskTCB,于是在stat 任務(wù)相應(yīng)
的任務(wù)處理函數(shù)設(shè)置斷點(diǎn),單步執(zhí)行,這樣居然程序可以正常運(yùn)行!
進(jìn)一步發(fā)現(xiàn),在系統(tǒng)啟動(dòng)過(guò)程中,stat任務(wù)會(huì)統(tǒng)計(jì)每個(gè)任務(wù)占用CPU時(shí)間,比較耗費(fèi)CPU,導(dǎo)致GUI 任務(wù)不能及時(shí)執(zhí)行,從而誘發(fā)總線異常(busfault)。于是嘗試將stat任務(wù)優(yōu)先級(jí)調(diào)低,重新編譯、下載、調(diào)試,一切OK!運(yùn)行模式也OK.
OMG,原來(lái)是stat 任務(wù)優(yōu)先級(jí)設(shè)置過(guò)高導(dǎo)致了bus fault !還是任務(wù)優(yōu)先級(jí)安排不當(dāng)導(dǎo)致的問(wèn)題。
評(píng)論