測試響應(yīng):基準(zhǔn)測試能有效地比較能量效率嗎?
要點
功率基準(zhǔn)測量的是完成一項任務(wù)的能量,而不是能耗率。
能量效率逐漸成為區(qū)分兩個類似處理器的一種更重要的因素。
功率基準(zhǔn)測試必須使能耗與“足夠好”的性能處理有效點均衡。
現(xiàn)在還不太清楚如何能公正地采用一種一致的方法測量能量效率。
用來比較兩種可供選擇的處理器的相對性能的基準(zhǔn),嚴(yán)格說來是提高設(shè)計生產(chǎn)率的工具?;鶞?zhǔn)測試本身并不能使技術(shù)難題得以解決,但卻能縮短開發(fā)人員為某個項目挑選處理器所花的時間。也就是說,在理想情況下,標(biāo)準(zhǔn)化的基準(zhǔn)測試為開發(fā)人員提供一種方法,可以像挑選蘋果一樣快速而準(zhǔn)確地比較可供選擇的產(chǎn)品。嵌入式處理器基測試準(zhǔn)的現(xiàn)實情況是,難以提供一種簡單、快速、綜合的處理方法來對各類應(yīng)用系統(tǒng)和處理器體系結(jié)構(gòu)進行挑蘋果式的比較。除了處理器性能基準(zhǔn)之外,幾個團體目前還在研究能對處理器的功率和能量效率進行有意義的描述和比較的方法。
用來比較處理器性能的基準(zhǔn)已經(jīng)存在很多年了,這些基準(zhǔn)的核心都強調(diào)一段時間內(nèi)處理器能夠完成多少工作,而忽略或不重視達(dá)到這種性能水平所需的功率效率和成本。為了弄清楚什么樣的數(shù)據(jù)可以揭示一個系統(tǒng)在某個應(yīng)用的設(shè)計和實現(xiàn)中的工作情況,需要依賴于使用某套基準(zhǔn)的人(參考文獻(xiàn)1)。雖然市場調(diào)查資料仍然引用著指令/秒等綜合處理器性能的數(shù)據(jù),但是,由于其對處理器在特定場境下的運行情況提供的相關(guān)信息少之又少,所以這些數(shù)據(jù)對于設(shè)計人員來說通常沒有什么用處。
BDTI公司(伯克利設(shè)計技術(shù)公司)、EEMBC(EDN 嵌入式微控制器基準(zhǔn)財團)和SPEC公司(標(biāo)準(zhǔn)性能評估公司)等基準(zhǔn)團體都支持強調(diào)處理器在執(zhí)行專用任務(wù)時的性能的基準(zhǔn)集。BDTI公司和EEMBC的研究人員都在研究如何擴展其基準(zhǔn)測試集,為的是測量和比較處理器在執(zhí)行專用任務(wù)時的能量效率(附文《能量與功率》),而不是測量和比較功耗。這些任務(wù)的范圍不只是測量一種功能(如FFT)和表征較高級別任務(wù)性能(如音頻或視頻解碼器級)的地址的執(zhí)行效率。
與生成處理器性能基準(zhǔn)相比,確定并執(zhí)行有意義的能量效率基準(zhǔn)更具挑戰(zhàn)性。性能基準(zhǔn)測試目前側(cè)重于測量處理器的最大處理性能。當(dāng)開發(fā)人員試圖確定某款處理器是否能夠提供實現(xiàn)某組功能所需的性能,特別是在只有一組數(shù)目有限的候選處理器能夠滿足項目的性能要求時,這一信息是非常有用的。然而,隨著能夠滿足給定性能閾值的處理器數(shù)目不斷增加,功耗或能量效率就成為區(qū)分這些候選處理器的更重要的因素。
雖然在有源模式下,處理器功耗占總系統(tǒng)功耗的百分比很小,但是,應(yīng)用系統(tǒng)正在處理呈指數(shù)增長的計算負(fù)荷(例如在處理較大圖像時),而且更需要較好的處理器能量效率。作為一個新興的實例,供患者在家中使用的醫(yī)療設(shè)備(例如可佩戴的和植入的健康監(jiān)測裝置)除了處理不斷增加的計算負(fù)荷之外,還有尺寸上的限制,不得不使用微型電池,而這些電池必須能夠持續(xù)使用很長的時間——也許長達(dá)數(shù)年。
一個器件的功耗是其靜態(tài)功耗和動態(tài)功耗之和。在正常工作條件下,動態(tài)功率超過靜態(tài)功率。對于長期休眠或待機工作的應(yīng)用系統(tǒng)來說,靜態(tài)功耗成為決定電池壽命的一個主導(dǎo)因素。晶體管漏電是靜態(tài)功耗的最大分量。隨著柵極介質(zhì)厚度的減小,晶體管漏電反而呈指數(shù)增長。這種情況表明,隨著晶體管幾何尺寸的不斷縮小,漏電電流會增大。處理器設(shè)計師可以采用多種技術(shù)來將靜態(tài)功耗降到最低,同時要使應(yīng)用系統(tǒng)開發(fā)人員能夠降低動態(tài)功耗(參考文獻(xiàn)2)。降低靜態(tài)功耗的技術(shù)有:在非關(guān)鍵路徑的電路中使用速度較慢的晶體管;對漏電的快速晶體管進行鈍化;動態(tài)控制晶體管襯底的本體偏置。
下列公式可描述處理器的動態(tài)功耗:P=CFV2,式中,C是處理器的動態(tài)電容,F(xiàn)是時鐘頻率或開關(guān)頻率,而V是電源電壓。處理器設(shè)計師使用包括低功耗工作模式、頻率換算和電壓換算等在內(nèi)的功率管理技術(shù),來使應(yīng)用系統(tǒng)開發(fā)人員能將動態(tài)功耗降低到最小。
復(fù)雜性上升
一個系統(tǒng)的專用軟件及其使用處理器資源的方法都會對處理器的能量效率產(chǎn)生很大的影響,而這種情況使如何定義、測量和標(biāo)定一個執(zhí)行特定應(yīng)用任務(wù)的處理器的能量效率變得極其復(fù)雜(附文《反直覺的能量效率》)。采用可公用的參考代碼來進行基準(zhǔn)測試是不切實際的。首先,開發(fā)人員很可能從來不會原樣使用這一參考代碼,但會根據(jù)目標(biāo)處理器的體系結(jié)構(gòu)、資源以及任何可用的專用加速器,對該代碼進行優(yōu)化。
使用非優(yōu)化參考代碼的不合理性對于各種性能基準(zhǔn)測試來說沒有什么不同。然而,性能基準(zhǔn)測試的優(yōu)化(例如采用EEMBC公司的“full-fury”基準(zhǔn)測試)可能會不切實際地使用內(nèi)存及其它處理器資源來獲得最高的性能。功率基準(zhǔn)測試必須考慮這種情況:當(dāng)開發(fā)人員優(yōu)化參考代碼時,必須在能耗和利用該代碼得到“足夠好”性能之間保持平衡。性能基準(zhǔn)測試目前忽視了這一要求。
因此,要獲得適合于某一處理器一系列性能點的有效功率基準(zhǔn)測試,可能會涉及到使用不同算法、軟件代碼和片上資源。這一要求對設(shè)計師在不同性能點上對同一器件進行挑蘋果式比較的能力會產(chǎn)生很大的影響,更不用說這一要求在比較不同的處理器體系結(jié)構(gòu)時意味著什么了。然而,這種情況是不切實際的,原因就在于基準(zhǔn)應(yīng)該是一種提高開發(fā)生產(chǎn)率的工具,有助于設(shè)計師迅速考察候選的體系結(jié)構(gòu)和配置,并且更快地做出折衷的決策。
一種折衷方案是在多個性能點上,在多個時鐘頻率和多個電壓下執(zhí)行相同的優(yōu)化代碼,這意味著,當(dāng)處理器廠商將功率基準(zhǔn)測試應(yīng)用于處理器時,該廠商的優(yōu)化代碼應(yīng)該針對性能有效點?;鶞?zhǔn)測試數(shù)據(jù)在該有效點及其附近最適宜,而對遠(yuǎn)離該有效點的性能點則可能失去有效性。因此,處理器廠商必須標(biāo)出目標(biāo)的性能有效點;不過,對于用標(biāo)準(zhǔn)化的性能閾值進行的專用基準(zhǔn)測試來說,這一問題可能并不重要。
更多挑戰(zhàn)
EEMBC公司總裁Markus Levy說:“在硬件上運行基準(zhǔn)測試集是很容易的,但測量能耗卻是很困難的。與之相反,測量IP(知識產(chǎn)權(quán))內(nèi)核的能耗是很容易的,而在IP內(nèi)核上運行基準(zhǔn)測試集卻是很困難的?!边@種說法表明:EEMBC公司的基準(zhǔn)測試能以處理器速度在硬件上執(zhí)行,但卻要在數(shù)天的周期內(nèi)使用IP內(nèi)核的門級網(wǎng)表進行仿真。同樣地,將測量裝置連接到硬件的什么地方,在測量中應(yīng)該包含哪些系統(tǒng)子部件,測量何時開始和何時終止,這些有時是不明顯的。在進行IP內(nèi)核仿真時,獲得任何位置的數(shù)據(jù)是一件相對簡單的事情,給仿真配備儀器就是了。
評論