微控制器的開發(fā)方案
微控制器開發(fā)團隊與編譯器開發(fā)人員的合作成果是生成的代碼效率更高,性能更好。本文介紹的是為了使ATMEL AVR微控制器系列更適合C編譯器,開發(fā)者在編譯器開發(fā)階段對微控制器架構(gòu)和指令集所進行的調(diào)整。
本文引用地址:http://2s4d.com/article/173343.htmAVR架構(gòu)的核心是一個可快速訪問RISC寄存器文件。該文件由32個8位通用寄存器構(gòu)成。微控制器可在一個單時鐘周期內(nèi)加載該文件中的任意兩個寄存器到算術邏輯單元(Arithmetic Logical Unit, ALU),完成所要求的操作,將結(jié)果寫回到任意一個寄存器。ALU支持寄存器間或某一寄存器與一個常數(shù)之間的運算和邏輯功能,單寄存器操作也是在ALU中執(zhí)行的。微控制器使用一個哈佛(Harvard)架構(gòu),在該架構(gòu)中,程序存儲器空間與數(shù)據(jù)存儲器空間是相互隔離的。程序存儲器采用單級管道訪問技術,當一條指令被執(zhí)行的同時,下一條指令已從程序存儲器中被預先提取。由于其算術和邏輯操作都真正地在單周期內(nèi)完成,因此AVR微控制器的性能達到每MHz一個MIPS。
圖1 AVR 架構(gòu)
細調(diào)微控制器
采用高級語言(High Level Languange, HLL)代替匯編語言來開發(fā)微控制器應用程序有許多優(yōu)勢,但一直都有一個重大缺點,即代碼量不斷增加。我們在開發(fā)AVR微控制器時考慮了使用C語言來開發(fā)應用,使得我們有可能為器件構(gòu)建出一個高效C編譯器。為了進一步提升這項特性,我們在AVR的架構(gòu)和指令集未完成前就開始著手C編譯器的開發(fā)。我們先讓瑞典 IAR Systems的編譯器專業(yè)開發(fā)人員對我們的AVR架構(gòu)和指令集進行評測,最后開發(fā)出非常適合運行C編譯器生成代碼的微控制器。
尋址模式
為讓編譯器生成高效的代碼,重要的是讓尋址模式匹配C語言的需要。AVR架構(gòu)原來配了兩個指針寄存器(Pointer Register)。這兩個指針可用于間接尋址、算后增量(post increment)間接尋址、算前減量(pre-decrement)間接尋址,以及帶位移(displacement)的間接尋址,能夠很好地支持指針操作。此外,還有一個用于訪問數(shù)據(jù)存儲器中變量的頁面直接尋址模式。
指針位移
帶位移的間接尋址是一種非常有用的尋址模式,即使從C編譯器的角度亦如此。例如,將指針指向某一結(jié)構(gòu)(struct)的第一個成員,就可以訪問該結(jié)構(gòu)內(nèi)位移量所允許的其他任何位置,無須變更16位指針。帶位移的間接尋址模式也常常用于訪問軟件堆棧上的變量。函數(shù)參數(shù)和autos常常放在軟件堆棧上,這樣,不用變更指針就可進行讀寫操作。位移尋址在定位數(shù)組成員(addressing elements in an array)時也非常有用。
盡管位移模式在許多情況下非常有用,但仍存在一個位移受限的問題。位移原本被限制在16個位置以內(nèi),而實際應用往往超出該數(shù)量。這樣,在位移模式無法訪問的位置,就必須加載一個新的指針。為擴展位移模式的訪問范圍,我們不得不改變指令集的其他部分,以獲得足夠的編碼空間。同時,我們還得知,C編譯器很難使用頁面直接尋址模式。于是,取消了頁面直接尋址模式,使用騰出的空間將位移模式擴展為64個位置,足以滿足大多數(shù)間接尋址的要求。原來的頁面直接尋址模式變成一個兩個字長的非頁面直接尋址模式。
存儲器指針數(shù)
AVR微控制器原來配置了兩個16位存儲器指針。如要采用C編譯器,那么其中一個指針必須專門用作軟件堆棧,這樣,就只剩一個存儲器指針。在許多情況下,需要將存儲器從一個區(qū)域復制到另一個區(qū)域。但由于只有一個指針,需要讀1字節(jié),設置指針,確定寫入目標位置,寫入這字節(jié),然后再將指針設回數(shù)據(jù)源位置。如果增加第三個存儲器指針(精簡功能),完成存儲器區(qū)域復制就不需要設置指針。如下例所示,只要使用算后增量間接尋址模式就可構(gòu)建非常高效的存儲器讀寫循環(huán)(假設:將指針Z指向源的第一字節(jié),X指向目標的第一字節(jié)):
LDI R16,0x60 ;Load byte count
loop: LD R17,Z+ ;Load byte,
increment pointer
ST X+,R17 ;Store
byte, increment pointer
SUBI R16,1;Decrement
counter
BRNE loop; Branch
if more bytes
具備指針算后增量(post increment)、算前減量(pre-decrement) (+1、-1)操作的可能性對于實現(xiàn)堆棧也非常有效。這當然也可用于軟件運行時間堆棧。
直接尋址
如在指針位移一節(jié)所述, AVR原來有一個頁面直接尋址模式,但是,對于編譯器該模式難于使用,且效率較低。由于我們需要更多的編碼空間來增加位移量,因此取消了頁面直接尋址模式。不過,如果完全沒有直接尋址模式,代碼效率也會降低,因為在有些情況下需要訪問存放在數(shù)據(jù)存儲器中的變量。尤其是處理靜態(tài)字符時,代碼開銷將會很大(達到50%),因為靜態(tài)變量必須保存在數(shù)據(jù)存儲器中,不能自動放置到寄存器中。為了克服代碼效率低下的問題,我們占用一個16位地址來增加一些非頁面直接尋址指令。這樣,就可用一條指令來完成64KB數(shù)據(jù)空間的尋址。要訪問如此大的一個存儲器區(qū)域,訪問指令必須是兩個16位字。
如果訪問的字節(jié)數(shù)少(例如讀取一個字符),使用這種尋址方式的效率高于指針方式。對于較大的區(qū)域,可能仍然是使用間接尋址比較有效(參見下面的示例)。
Loading of a character:
Indirect addressing (6 Bytes): Direct addressing (4 Bytes):
LDI R30,LOW(CHARVAR) LDS R16,CHARVAR
LDI R31,HIGH(CHARVAR)
LD R16, Z
Loading of a long integer:
Indirect addressing (12 Bytes) Direct addressing (16 Bytes)
LDI R30,LOW(LONGVAR) LDS R0,LONGVAR
LDI R31,HIGH(LONGVAR) LDS R1,LONGVAR+1
LDD R0,Z LDS R2,LONGVAR+2
LDD R1,Z+1 LDS R3,LONGVAR+3
LDD R2,Z+2
LDD R3,Z+3
零標志傳播
為實現(xiàn)條件轉(zhuǎn)移,需要使用一些指令來操作由一些標志(flag)構(gòu)成的AVR狀態(tài)寄存器。跟在這類指令之后的條件轉(zhuǎn)移指令(conditional branch instruction)是否執(zhí)行轉(zhuǎn)移,取決于這些標志的設置。使用運算指令操作這些標志,就可檢查一個數(shù)A與另一個數(shù)B之間的大小關系。當被檢查的數(shù)為8位的數(shù)時,不存在什么問題,因為所有標志都依賴一條指令設置的標志值。當被檢查的數(shù)為16位或32位的數(shù)時(這在C語言中是常有的情況),問題就有點棘手了,例如一個32位減法操作就相當于要連續(xù)進行4個8位減法操作,而每做一次8位減法,就會產(chǎn)生一組新的標志。
為傳播進位標志,大多數(shù)處理器都包含一些能處理進位標志先前設置值的指令。例如,帶進位的減法(SBC)指令;執(zhí)行SBC A,B語句就相當于將A變成進位位。但要正確完成所有的條件轉(zhuǎn)移操作,這里還有另一個標志需要傳播,即零標志。
示例:
A=R3:R2:R1:R0,
B=R7:R6:R5:R4
我們打算從A中減去B,并如果A=B就跳轉(zhuǎn)到一個指定位置。如果這個零標志只依賴于最后的運算指令,那么下面的指令將不會執(zhí)行:
SUB R0,R4
SBC R1,R5
SBC R2,R6
SBC R3,R7 ; R3=R7
=> Zero flag set
BREQ destination
這是因為BREQ指令使用的標志值只取決于最后的SBC指令設置的標志值。如果大多數(shù)高位直接相等,即便32位數(shù)不相等,零標志也將被置位,而轉(zhuǎn)移也會被執(zhí)行。這種問題也會出現(xiàn)在其他的條件轉(zhuǎn)移上。
有兩種辦法可以解決這個問題。一是保存每個指令產(chǎn)生的標志,然后在第四個減法完成后檢查所有的零標志。另一個更精細的方法是在進位指令中傳播零標志(參見下面方式):
Znew =Not(R7) AND
Not(R6) AND
...
Not(R0) AND
Zold
使用這種方式傳播零標志,所有條件轉(zhuǎn)移在最后一個減法操作完成后都會被執(zhí)行,因為參與標志(溢出和正數(shù)標志)所剩部分只取決于最高位字節(jié)。
評論