為什么說(shuō)Cortex-M是低功耗應(yīng)用的首選

作者：時(shí)間：2018-07-27 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

雖然Cortex-M處理器家族目標(biāo)瞄準(zhǔn)效能光譜較低端的區(qū)域，但是和大多數(shù)微控制器(MCU)采用的其他典型處理器相比，Cortex-M的效能依然算相當(dāng)強(qiáng)悍。舉例來(lái)說(shuō)，像是許多高效能微控制器所采用的Cortex-M4與Cortex-M7處理器，其最高時(shí)脈頻率就高達(dá)400MHz。

本文引用地址：http://2s4d.com/article/201807/384269.htm

當(dāng)然在選擇處理器時(shí)效能并非唯一考量的因素。在許多應(yīng)用中，低功耗與成本是顧客最關(guān)切的標(biāo)準(zhǔn)。因此，Cortex-M處理器家族納入各種類型的產(chǎn)品來(lái)因應(yīng)不同的需求(表1)。

Cortex-M和傳統(tǒng)ARM處理器(像是ARM7TDMI、ARM9)大相徑庭之處，就是大幅改造的架構(gòu)。舉例來(lái)說(shuō)：

·僅支援ARM Thumb指令，但在Thumb-2中，已延伸成能支援16位元與32位元指令。

·中斷處理任務(wù)，由名為巢狀向量中斷控制器(NVIC)的內(nèi)建中斷控制器執(zhí)行，NVIC提供自動(dòng)優(yōu)先排程、中斷遮罩與巢狀配置、以及系統(tǒng)例外處理。

·中斷處理程序(Handler)可寫(xiě)成正規(guī)的C語(yǔ)言函式以及向量化中斷處理機(jī)制，不須使用軟體去判斷該服務(wù)哪個(gè)中斷。而中斷的回應(yīng)則屬于決定性，并具有低延遲特性。

·中斷向量表方面，從分支指令改成中斷的起始位址以及系統(tǒng)例外處理程序。

·暫存器區(qū)塊(bank)以及程式開(kāi)發(fā)模式的部分細(xì)節(jié)亦有所變動(dòng)。

這些改變意謂許多針對(duì)傳統(tǒng)ARM處理器撰寫(xiě)的組合語(yǔ)言程式碼必須進(jìn)行修改，而舊的Projects檔在移植到Cortex-M時(shí)必須進(jìn)行修改與重新編譯。

指令集概述

在大多數(shù)情況中，軟體的程式碼多以C或其他高階語(yǔ)言撰寫(xiě)。不過(guò)，如果對(duì)Cortex-M處理器所支援的指令集有基本的認(rèn)識(shí)，能幫助判斷特定任務(wù)須要用到哪一種Cortex-M處理器。指令集架構(gòu)(ISA)是處理器架構(gòu)的一部分，Cortex-M處理器能區(qū)分成幾種架構(gòu)類型(表2)。

所有Cortex-M處理器都支援名為T(mén)humb的指令集。在Thumb-2技術(shù)釋出后，整個(gè)Thumb指令集就變得相當(dāng)龐大。然而，不同Cortex-M處理器支援Thumb ISA里的指令子集合也不一致，如圖1所示。

圖1 各款Cortex-M處理器支援的指令集

Cortex-M0/M0+/M1處理器以ARMv6-M架構(gòu)為基礎(chǔ)，其指令集很小，只有56個(gè)指令，其中大多數(shù)為16位元，如圖1中較小的橢圓形。不過(guò)，處理器中的暫存器以及處理的資料依然為32位元。對(duì)于大多數(shù)簡(jiǎn)單的I/O控制作業(yè)以及生成資料處理，這樣的小指令集就已經(jīng)足夠應(yīng)付。由于指令集很小，因此僅須用少量的邏輯閘就能建置處理器，像是Cortex-M0與Cortex-M0+處理器僅需1.2萬(wàn)個(gè)邏輯閘。不過(guò)，這些指令當(dāng)中有一些不能用有高位暫存器(R8到R12)，而且在即時(shí)生成資料方面的能力相當(dāng)有限。這主要是為了在超低功耗處理器設(shè)計(jì)以及效能之間作折衷。

Cortex-M3處理器是以ARMv7-M架構(gòu)為基礎(chǔ)，并支援大上許多的指令集，當(dāng)中有許多屬于32位元指令，讓系統(tǒng)能更有效率地運(yùn)用高位暫存器。此外，它還支援向量表分支指令與條件執(zhí)行(使用IT指令)、硬體除法指令、乘加(MAC)運(yùn)算、可變位元欄位作業(yè)。

具更多指令集Cortex-M3效能大提升

更多的指令能透過(guò)幾種方式提升效能。例如像32位元Thumb指令能提供較大范圍的立即資料值、分支偏移、以及立即偏移以利資料記憶體的存取。另外，它還對(duì)DSP作業(yè)提供基本支援(像是幾個(gè)MAC指令，須用幾個(gè)時(shí)脈周期，另外還有飽和調(diào)整指令)。最后，32位元指令允許滾筒移位器和多個(gè)資料處理作業(yè)在同一個(gè)指令中操作。

然而，更大的指令集，代價(jià)就是矽元件面積與耗電都增加。在典型微控制器中，Cortex-M3的邏輯閘數(shù)量會(huì)比Cortex-M0或Cortex-M0+設(shè)計(jì)的邏輯閘多兩倍以上。但由于在多數(shù)現(xiàn)代微控制器中處理器，只占一小部分的矽元件空間，因此較大的矽元件空間以及功耗產(chǎn)生的影響也變得微不足道。

Cortex-M4處理器在許多層面相當(dāng)類似Cortex-M3，包括管線與程式開(kāi)發(fā)模式。它除了支援Cortex-M3的所有功能，還額外支援DSP應(yīng)用方面的指令，像是SIMD、飽和演算法指令、以及各種能在單周期完成的MAC指令(相對(duì)于Cortex-M3的多周期指令以及有限部分)，選配的浮點(diǎn)運(yùn)算單元能支援各種單精度浮點(diǎn)運(yùn)算。

Cortex-M4的SIMD作業(yè)能同時(shí)處理兩個(gè)16位元資料或4個(gè)8位元資料。舉例來(lái)說(shuō)，圖2顯示QADD8以及QADD16作業(yè)。

圖2 SIMD指令范例：QADD8與QADD16

在某些DSP作業(yè)方面，由于計(jì)算能同時(shí)執(zhí)行，因此，SIMD能讓系統(tǒng)能更快運(yùn)算16位元與8位元資料。然而，在一般程式開(kāi)發(fā)方面，C語(yǔ)言編譯器不太可能用到SIMD功能。這也導(dǎo)致Cortex-M3與Cortex-M4會(huì)產(chǎn)生大家常見(jiàn)的效能量測(cè)結(jié)果。然后，Cortex-M4的內(nèi)部資料通道和Cortex-M3并不相同，Cortex-M3的通道在一些案例中支援更快的資料處理(像是單周期MAC，能在一個(gè)周期內(nèi)將資料寫(xiě)回兩個(gè)暫存器)。

Cortex-M7處理器的指令集支援類似Cortex-M4，另外還加入：

浮點(diǎn)運(yùn)算架構(gòu)方面，以FPv5為基礎(chǔ)而不是FPv4 (Cortex-M4所采用)，因此額外加入幾個(gè)浮點(diǎn)運(yùn)算指令。

選配雙精度浮點(diǎn)運(yùn)算指令。

支援預(yù)載資料(PLD)指令，讓系統(tǒng)預(yù)先載入快取資料。

Cortex-M7的管線和Cortex-M4有極大差異。它擁有一個(gè)6階雙發(fā)送管線，發(fā)揮更高的效能。大多數(shù)針對(duì)Cortex-M4撰寫(xiě)的軟體，都能在Cortex-M7重復(fù)使用，不過(guò)軟體必須重新編譯，才能針對(duì)管線特性的差異做最好的優(yōu)化，在一些案例中，軟體還需要一些微幅更新，才能利用像是快取在內(nèi)的新功能。

Cortex-M23處理器的指令集以ARMv8-M基線sub-profile為基礎(chǔ)，同時(shí)也是ARMv6-M的超集合。額外增加的指令包括硬體除法指令;比較與分支、以及32位元分支指令;TrustZone安全延伸的指令;互斥存取指令(通常用在旗標(biāo)作業(yè));16位元立即生成資料指令;Load acquire與store release指令(配合C11版C語(yǔ)言標(biāo)準(zhǔn)支援)。

在某些情況，這些指令集的加強(qiáng)有助于提升效能。另外，對(duì)于內(nèi)含多個(gè)處理器的SoC設(shè)計(jì)也有助益(像是互斥存取在跨處理器的旗標(biāo)傳遞相當(dāng)有用)。

由于Cortex-M33的設(shè)計(jì)有極高的設(shè)定彈性，其中一些指令也屬于選配，例如像是：

DSP指令(包括Cortex-M4與Cortex-M7處理器都有支援)都屬于選配。

單精度浮點(diǎn)運(yùn)算的支援能力屬于選配。這項(xiàng)支援以FPv5為基礎(chǔ)，比Cortex-M4浮點(diǎn)運(yùn)算支援能力多了幾項(xiàng)指令。

此外，Cortex-M33還支援ARMv8-M主線sub-profile，其中包括：

TrustZone安全延伸的指令。

Load Acquire與Store Release 指令(配合C11版C語(yǔ)言標(biāo)準(zhǔn)的支援能力)。

ISA功能比較總結(jié)

ARMv6-M、ARMv7-M、以及ARMv8-M架構(gòu)具有為數(shù)眾多的ISA特色，很難逐一詳細(xì)介紹，所以在表3匯整其中關(guān)鍵的差異。

Cortex-M處理器中ISA其中一項(xiàng)關(guān)鍵特性就是向上相容性。Cortex-M處理器所支援的指令，系為Cortex-M0/M0+/M1的超集合(Superset)。因此，理論上如果記憶體地圖相同，Cortex-M0/M0+/M1的二進(jìn)位映像檔就能直接在Cortex-M3上運(yùn)行。Cortex-M4/M7和其他Cortex-M處理器之間也存在這樣的相容性，Cortex-M0/M0+/M1/M3的指令能在Cortex-M4/M7上執(zhí)行。

雖然Cortex-M0/M0+/M1/M3/M23處理器沒(méi)有浮點(diǎn)運(yùn)算單元選項(xiàng)，但可以用軟體來(lái)執(zhí)行浮點(diǎn)運(yùn)算。另外，本身沒(méi)有浮點(diǎn)運(yùn)算單元的Cortex-M4/M7/M33也可用軟體執(zhí)行浮點(diǎn)運(yùn)算。在這些處理器中，當(dāng)使用程式處理浮點(diǎn)運(yùn)算資料，編譯程式在鏈結(jié)階段會(huì)插入所需的執(zhí)行階段函式庫(kù)函數(shù)。使用軟體來(lái)執(zhí)行浮點(diǎn)運(yùn)算，除了運(yùn)算時(shí)間變長(zhǎng)，程式碼長(zhǎng)度也會(huì)略為增長(zhǎng)。但如果沒(méi)有頻繁執(zhí)行浮點(diǎn)運(yùn)算，所開(kāi)發(fā)的應(yīng)用也適合采用這種類型的處理器。

新聞中心

為什么說(shuō)Cortex-M是低功耗應(yīng)用的首選

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)