DSP編程技巧-使用代碼優(yōu)化時(shí)必須考慮的五大問(wèn)題
1. 小心使用匯編表達(dá)式
本文引用地址:http://2s4d.com/article/201612/332391.htm在C/C++代碼中,有時(shí)候一些操作難免會(huì)對(duì)某些CPU寄存器進(jìn)行操作,此時(shí)要使用內(nèi)嵌的匯編表達(dá)式,例如asm("EALLOW"),或者重置某個(gè)中斷的掩碼寄存器等。在優(yōu)化代碼時(shí),編譯器會(huì)重新調(diào)整某些代碼段的順序,自己決定使用某些寄存器(例如AR0-AR7這樣的輔助寄存器),甚至刪除某些編譯器認(rèn)為無(wú)用的變量、函數(shù)等,但是編譯器一般情況下并不會(huì)對(duì)內(nèi)嵌的匯編代碼進(jìn)行任何優(yōu)化(除非這段匯編代碼被編譯器認(rèn)為是永遠(yuǎn)不會(huì)執(zhí)行到的無(wú)用代碼),這就造成了編譯器的優(yōu)化效果在這段匯編代碼和它的上下文代碼中無(wú)法進(jìn)行有效的優(yōu)化,特別是匯編代碼和C/C++代碼直接存在變量調(diào)用的情況下。所以非必要的情況下,要盡量避免C/C++和匯編語(yǔ)句的混用,如果確實(shí)需要的,也要在編譯之后檢查生成的匯編代碼是不是保證了我們代碼原意的完整性。
2. 為必要的內(nèi)存存取使用volatile關(guān)鍵字
在C/C++代碼的編譯過(guò)程中,編譯器會(huì)分析數(shù)據(jù)流,從而盡量避免對(duì)存儲(chǔ)空間的直接存取。但是如果我們要在C/C++代碼中直接對(duì)內(nèi)存地址進(jìn)行操作的話,需要使用volatile關(guān)鍵字來(lái)定義變量,編譯器在優(yōu)化時(shí)不會(huì)對(duì)volatile類型的變量進(jìn)行優(yōu)化。
例如,在下面的代碼中,循環(huán)的結(jié)束條件為指針指向的地址為0xFF:
unsigned int *ctrl;
while (*ctrl !=0xFF);
因?yàn)?ctrl是一個(gè)不變的表達(dá)式,這個(gè)循環(huán)會(huì)被優(yōu)化為一次內(nèi)存讀取。為了正確實(shí)現(xiàn)我們的代碼意圖,需要把ctrl定義為volatile類型:
volatile unsigned int *ctrl
使用volatile類型定義的類型在調(diào)試的時(shí)候還有一個(gè)極大的優(yōu)勢(shì),就是我們可以直接在CCS的debug窗口里改變變量的值,極大地方便我們的調(diào)試。
3. 小心使用Alias變量
Alias(別名)在一個(gè)變量可以被至少兩種方式存取的時(shí)候會(huì)用到,例如,當(dāng)兩個(gè)指針指向同一塊區(qū)域或?qū)ο髸r(shí),我們稱一個(gè)指針 alias 另一個(gè)指針。Alias變量的使用要非常謹(jǐn)慎,因?yàn)闀?huì)涉及到非直接的引用,從而破壞了優(yōu)化效果。編譯器在優(yōu)化時(shí)會(huì)分析代碼來(lái)決定在哪些地方會(huì)產(chǎn)生alias引用,然后在保持代碼正確性的基礎(chǔ)上“保守”地優(yōu)化代碼。
一般情況下,編譯器會(huì)假設(shè),如果一個(gè)本地變量的地址被傳遞給某個(gè)函數(shù),則這個(gè)函數(shù)有可能會(huì)通過(guò)指針操作改變這個(gè)本地變量的內(nèi)容,但是這個(gè)函數(shù)不能在該地址被返回后仍然可以被別的指針操作所示使用,例如把這個(gè)本地變量的地址分配給一個(gè)全局變量或者返回它。如果這種假設(shè)被打破,則需要在編譯器選項(xiàng)里使用-ma強(qiáng)制編譯器按照最壞情況的別名引用來(lái)進(jìn)行一定的優(yōu)化,在這種情況下,任何非直接的引用(例如使用指針)都可以引用到這個(gè)變量。
4. 何時(shí)使用--aliased_variables選項(xiàng)?
編譯器在優(yōu)化時(shí)會(huì)假設(shè),任何變量的地址在作為參數(shù)被傳遞給某個(gè)函數(shù)時(shí),都不會(huì)在調(diào)用它的函數(shù)里被任何Alias變量修改,例如:從函數(shù)返回地址,或者把地址分配給某個(gè)全局變量。但是如果我們使用管理類似下面操作的代碼的時(shí)候,就需要使用--aliased_variables選項(xiàng)來(lái)優(yōu)化代碼:
int *glob_ptr;
g()
{
int x = 1;
int *p = f(&x);
*p = 5; /* p是x的別名 */
*glob_ptr = 10; /* glob_ptr 也是 x的別名 */
h(x);
}
int *f(int *arg)
{
glob_ptr = arg;
return arg;
}
5. 含有FPU的器件:使用restrict關(guān)鍵詞來(lái)表明指針沒(méi)有被別名操作
在含有FPU浮點(diǎn)協(xié)處理器的器件中,當(dāng)使用--opt_level=2(優(yōu)化寄存器、局部變量和全局變量的使用)的優(yōu)化級(jí)別時(shí),優(yōu)化器會(huì)分析代碼的依賴性。為了更好地幫助優(yōu)化器完成內(nèi)存的依賴關(guān)系,我們可以把指針、引用或者數(shù)組等的聲明中加入restrict關(guān)鍵詞。restrict關(guān)鍵詞是C99標(biāo)準(zhǔn)引入的,它會(huì)通知編譯器,所有修改該指針?biāo)赶騼?nèi)存中內(nèi)容的操作都必須通過(guò)該指針來(lái)修改,而不能通過(guò)其它途徑(其它變量或指針)來(lái)修改。使用這一原則能幫助編譯器優(yōu)化某些代碼段,因?yàn)閯e名信息可以被更加快速地確認(rèn)。使用restrict關(guān)鍵詞后因?yàn)榭梢詧?zhí)行更多的FPU操作,而FPU操作與CPU是并行的,所以帶來(lái)的優(yōu)化效果是提高了性能和減小了代碼尺寸。
我們可以使用下面例子中的代碼來(lái)告訴編譯器,a和b永遠(yuǎn)不會(huì)在函數(shù)foo中指向同一個(gè)地址,并且a和b的內(nèi)存地址也不會(huì)互相覆蓋(說(shuō)明它們沒(méi)有依賴性,可以并行執(zhí)行)。
void foo(float * restrict a, float * restrict b)
{
/* foo's code here */
}
或者
void foo(float c[restrict], float d[restrict])
{
/* foo's code here */
}
評(píng)論