破解超低功耗智能設(shè)備用MCU難題,ST新一代U5靠什么制勝?
隨著可穿戴、個人醫(yī)療、家庭自動化和工業(yè)傳感器等智能設(shè)備的增長,對低功耗、高性能、高安全性的MCU(微控制器)的需求日益提升。今年3月,意法半導(dǎo)體(ST)在其經(jīng)典的超低功耗L系列基礎(chǔ)上,推出了新一代產(chǎn)品線——STM32U5。其在安全方面,成為首款獲得PSA和SESIP 3級認證的MCU。
本文引用地址:http://2s4d.com/article/202110/429044.htmU5的制勝法寶是什么?不久前,ST中國區(qū)微控制器事業(yè)部市場及應(yīng)用總監(jiān)曹錦東、ST中國區(qū)微控制器產(chǎn)品市場經(jīng)理彭祖年向電子產(chǎn)品世界等媒體揭開了廬山真面目及下一步規(guī)劃。
ST中國區(qū)微控制器事業(yè)部市場及應(yīng)用總監(jiān)曹錦東(左),ST中國區(qū)微控制器產(chǎn)品市場經(jīng)理彭祖年
1 U5的3個特點
STM32U5的定義是一個低功耗旗艦級產(chǎn)品線,最大的3個特點:①超低功耗。②在超低功耗平臺上提升了性能,是基于高性能和超低功耗兩者結(jié)合的集合。③增強了安全可靠方面的功能,適合IoT應(yīng)用。
U5是在STM32L5基礎(chǔ)上發(fā)展起來的。L5是基于L4和U5中間的產(chǎn)品線(如下圖)。L5是ST第1顆基于Cortex-M33的產(chǎn)品線,采用了特殊的工藝,可謂是U5和L4之間的橋梁——確保的一些功能應(yīng)用起來。
圖 U5在STM32中的定位
今后的新產(chǎn)品會主要基于U5拓展。經(jīng)典的低功耗系列L4不會繼續(xù)發(fā)展,因為L4是基于90 nm工藝的;L0會繼續(xù)生產(chǎn),但也沒有更多的產(chǎn)品線延伸出來。但是客戶可以放心,ST官網(wǎng)承諾所有產(chǎn)品線未來10年都可以繼續(xù)供貨。
具體地,為了研制U5產(chǎn)品線,ST內(nèi)部花了漫長的時間在研發(fā),創(chuàng)新不僅在工藝(注:達到40nm),在IP還包括整個架構(gòu)的設(shè)計,使該低功耗產(chǎn)品線能夠支持到現(xiàn)在的消費電子、可穿戴以及工業(yè)控制領(lǐng)域。
2 為何功耗更低?
U5對超低功耗和高性能有很好的結(jié)合。其節(jié)能成績單如下圖。這是在第三方EEMBC ULP Benchmark上面得到的測試結(jié)果。該測試結(jié)果不僅包含了運行狀態(tài)下對性能的評估,同時也將芯片在各種模式下的功耗水平綜合體現(xiàn)出來。
圖 STM32U5 ULP BENCH節(jié)能成績單
這里糾正一個偏見:很多用戶可能會比較關(guān)注超低功耗產(chǎn)品的μA/MHz參數(shù),但該參數(shù)是在運行狀態(tài)下,以及特定場景中針對CPU耗電量的評估,并不能代表系統(tǒng)整體的功耗水平。為了實現(xiàn)低功耗,我們要看什么應(yīng)用方向,該應(yīng)用方向里它需要什么外設(shè)的工作,所需要系統(tǒng)采用的功耗模式該怎么做?例如手表,佩戴后一直在采樣數(shù)據(jù),抬手時就要顯示數(shù)據(jù),但可能平常走路時沒有抬手,就沒有顯示,CPU是睡眠的。再例如,有些表計用CPU每個月只要醒幾次就可以了,但是外設(shè)也一直在做數(shù)據(jù)的采集。所以不同模式的功耗不一樣。
所以,如何參考系統(tǒng)整體功耗水平,可以將目光轉(zhuǎn)移到ULP Benchmark的評比上,它會針對不同的測試狀況,去綜合評估系統(tǒng)的運行性能、運行功耗、休眠狀態(tài)和喚醒時的功耗。在一些測試的項目中,還會包括針對芯片外設(shè)功耗的評估。與前幾代STM32 L系列超低功耗產(chǎn)品線進行對比后,可見U5系列已經(jīng)達到了240DMIPS和651Coremark的性能評分(如下圖)。同時,為了進一步挖掘U5性能的潛力,U5上還有數(shù)學(xué)運算加速器、ART加速器等單元,以輔助和加速整個芯片內(nèi)部運算系統(tǒng)的效率。
其設(shè)計難點在于:對于STM32,從過去的L1到L0、L4、L5,①ST有最新的工藝,從過去的110nm到90nm,直到現(xiàn)在的40nm工藝,可能工藝本身也會帶來動態(tài)功耗的節(jié)約。然而,靜態(tài)功耗卻是相反的,這是兩個相悖的數(shù)據(jù)。②外設(shè)方面也做了更精確的設(shè)計,這是系統(tǒng)性的問題。
綜合以上兩點,ST一直對低功耗產(chǎn)品、對客戶的用戶體驗以及能不能達到他整個系統(tǒng)低功耗的性能還是很有信心的??梢钥吹?,U5的系統(tǒng)復(fù)雜性比以往更高,要保持同樣的主頻上,功耗要更低其實是很難的挑戰(zhàn)。
1)10年余年的超低功耗歷史
此次U5的誕生將繼續(xù)延續(xù)ST超低功耗MCU產(chǎn)品路線(如下圖)。ST超低功耗產(chǎn)品線一直以來是STM32非常重要的產(chǎn)品線,是戰(zhàn)略性的產(chǎn)品線。ST自2007年發(fā)布第一款基于Cortex-M內(nèi)核的通用單片機之后,通過2年時間的打造,將Cortex-M系列的單片機擴展到了超低功耗領(lǐng)域)。從2009年開始,ST陸續(xù)迭代推出了一代代的超低功耗的產(chǎn)品平臺,其中包括入門級的STM32L0,以及基于Cortex-M4系列的L4系列產(chǎn)品。STM32L4+是一款在中國智能運用手表市場創(chuàng)造出奇跡的一款明星級產(chǎn)品。
2)U5新的低功耗特性
● 休眠模式下仍可工作
針對低功耗,STM32U5有一個特殊的功能:低功耗后臺的自主模式。即當芯片進入低功耗模式時,CPU是需要斷電的,但產(chǎn)品外面可能還會搭載很多的傳感器。這些傳感器的數(shù)據(jù)可能會實時地輸入到主控芯片這一側(cè)。通常情況下,該傳感器的數(shù)據(jù)傳輸是需要系統(tǒng)或CPU來進行數(shù)據(jù)處理,但U5設(shè)置了一個獨特的外設(shè),可以將很多通用接口包括I2C、SPI、串口、ADC等外設(shè)上的數(shù)據(jù),在不喚醒CPU的情況下,搬運至MCU內(nèi)部一塊SRAM4,約有16kB的空間。當這些數(shù)據(jù)累計到一定數(shù)量時,ST再喚醒Cortex-M33內(nèi)核進行一次性的批處理。
這里帶來的體驗是:不需要頻繁地喚醒CPU,只使能外設(shè),其功耗是非常低的。因為從外部的傳感器獲取數(shù)據(jù),避免了中間頻繁的喚醒。ST做了大概的測試,類似于經(jīng)典數(shù)據(jù)采集以及喚醒處理的模型,大約可將CPU喚醒的次數(shù)降為原來的1/10。所以,可以看到下圖灰色虛線框,就是節(jié)省的能耗。
圖 讓功耗降低至1/10
在芯片內(nèi)部功耗管理下面,有更多靈活的功耗模式可供客戶選擇。其中一個經(jīng)典的應(yīng)用場景是Stop模式,同時保存部分SRAM或全部SRAM中的數(shù)據(jù)。這樣的狀態(tài)下,功耗是個位數(shù)的μA級。
● U5芯片上更多省電的小技巧
可以通過內(nèi)置的SMPS降低CPU的內(nèi)核供電電壓。
在不同功耗模式下切換,也可以達到μs級的切換速度。
SRAM和Flash都可以讓用戶自己去選擇究竟可以保留多少的空間,這樣用戶可以根據(jù)自己實際應(yīng)用情況來進一步避免不必要的能量損失。值得一提的是,內(nèi)部的Flash是雙bank設(shè)計的,可將不常用的bank在低功耗模式下把它斷電,這樣它的功耗可以節(jié)省40μA左右。但是當指令跳轉(zhuǎn)到被斷電的Flash Bank上時,系統(tǒng)是可以自動喚醒的,只需要等待5μs的延時?;蛘呖梢园褍?nèi)部的Flash通過損失一些讀取速度的方式去讓它進入一種低功耗的模式,大概可以減少系統(tǒng)45μA的能耗。
可見,結(jié)合多種多樣的低功耗模式的設(shè)計,以及更多的省電小技巧,只要用戶能夠去玩轉(zhuǎn)STM32U5中這些小設(shè)計,就可以將功耗管理做到極致。
圖 U5的超低功耗考慮因素
3 為何安全性達到L3級?
U5是第一款通過PSA和SESIP 3級認證的MCU。
1)如何實現(xiàn)L3級?
U5設(shè)計了層層的保護。首先,它是基于Cortex-M33的內(nèi)核,天生支持TrustZone這種隔離架構(gòu)。然而,僅有內(nèi)核的隔離/ TrustZone的支持是不夠的,U5還針對內(nèi)部的存儲、總線以及外設(shè)做了隔離配置的設(shè)計。除了隔離之外,還增加了更多的安全加密的功能,以及全程可控的多層保護狀態(tài)機。存儲保護也做了全新的更新,針對內(nèi)部存儲防篡改,增加了OTP的空間,還有更多的主動式防侵犯的active tamper的設(shè)計等。在這樣的完整的安全設(shè)計下,ST的Secure Boot安全啟動也可以讓用戶的安全架構(gòu)設(shè)計能獲得穩(wěn)定的信任根。最終,U5的產(chǎn)品可以通過PSA Level3的認證。這也是目前所有STM32產(chǎn)品中首款可以通過三級安全認證的產(chǎn)品。
U5還可以提供安全固件加載功能。很多用戶把自己的軟件設(shè)計好之后,可能不會將生產(chǎn)環(huán)節(jié)放在自己的公司里,而是授權(quán)第三方公司,在第三方公司里實現(xiàn)PCB的貼板、固件的燒錄以及最終的組裝這樣的生產(chǎn)流程。該流程下,由于授權(quán)的第三方是不在監(jiān)控范圍下的,所以無法保證固件在遠程生產(chǎn)燒錄過程中的安全性。ST通過內(nèi)部的SFI(安全固件加載)生產(chǎn)流程,可以幫助用戶在第三方的燒錄環(huán)境下,嚴格控制燒錄固件的安全和燒錄數(shù)量的控制。
2)什么樣的客戶會用到L2、L3?
L2主要針對的攻擊主要來自網(wǎng)絡(luò)的,或者產(chǎn)品聯(lián)網(wǎng)之后,通過一些軟件的方式來竊取芯片內(nèi)部的一些信息。但L3會實現(xiàn)邊界攻擊的防御(side channel attack),例如把產(chǎn)品拿到實驗室里,針對產(chǎn)品硬件周邊,但不是破壞性的,只是在產(chǎn)品工作時,通過它周邊的一些側(cè)面信息。
因為很多的應(yīng)用是基于硬件進行攻擊的,例如POS機等安全交易系統(tǒng)容易遭到外界的,例如大電流干擾,讓它的一些數(shù)據(jù)能夠流出來或者讓它整個系統(tǒng)有所崩潰。如果有很好的防外面硬件的攻擊,該系統(tǒng)會很安全。
在U5中, AES(高級加密標準)的模塊單元可以抵御邊界攻擊。但L5中,ST沿用的還是傳統(tǒng)的、普通的AES,無法抵御邊界攻擊。
現(xiàn)在在L3之上還會有更高的安全等級要求,但需要做到更多的物理隔離,包括類似防開蓋的設(shè)計在里面。通常情況下,是Security Element才能達到的級別。
4 存儲容量更大,主頻更高
作為新一代旗艦產(chǎn)品,U5在高性能方面的特點是存儲容量更大,主頻更高。
1)容量更大
作為ST超低功耗系列的旗艦產(chǎn)品,U5會覆蓋到從128Kb一直到4Mb的Flash范圍。U5家族中的第一個成員STM32U575和STM32U585基本覆蓋了512Kb以上一直到2M 的Flash需求的空間。未來還會推出更大容量版本的STM32U5系列,以及更小、更精簡的低成本U5的產(chǎn)品。
U5的規(guī)劃是,下一步很快面市4Mb Flash MCU,更多的是面向可穿戴/手表類產(chǎn)品。因為在可穿戴產(chǎn)品里,需要更多地讓客戶存儲其程序及數(shù)據(jù)等,因此要擴展更多的memory。對于一些更小的memory,未來會增加IoT相關(guān)的應(yīng)用特性,因為這些應(yīng)用的程序量沒有那么大,成本方面需要更加有有效性。
2)主頻更高
U5達到160MHz,手表用戶需要那么高的主頻嗎?實際上,從ST現(xiàn)在接觸手表客戶的反饋來看,認為160MHz還不夠,客戶對性能有很多的追求,因為他們追求的是畫面的流暢度和操作手表時的順滑度?,F(xiàn)在屏幕的分辨率越來越高,有些手表開始用視網(wǎng)膜屏了,其像素顆粒度需要非常精細,因此單位面積下的分辨率會越來越高。
與此同時,這對低功耗產(chǎn)品其實是非常大的挑戰(zhàn)。因為性能越高,功耗自然越大。今天用戶可以自己配置CPU的速度,或者μA/MHz是指系統(tǒng),例如160MHz的能力,但如果運行24MHz,從CPU功耗上可以直接看到一個線性的下降,可見較低主頻的更低功耗是完全沒有問題的。
可穿戴產(chǎn)品非常注重性能,傳統(tǒng)的做電表、水表的MCU,也不能滿足做手表的需求的。特別是U5下一代產(chǎn)品線,從性能上要兼顧至少兩個維度的,①圖形軟件引擎,有的MCU廠商用第三方的產(chǎn)品,但ST收購了一家能做屏顯示和接口的軟件公司——Draupner Graphics;②ST把客戶的部分性能需求通過特定的IP,以硬件的形式集成在MCU里。例如硬件顯示加速的效果,電腦叫GPU graphic引擎, U5增加了一個相關(guān)IP,以支持2.5D的加速器。
5 集成音頻數(shù)字濾波器、輕量級AI的用途
U5中的ADF(語音活動檢測)只做語音喚醒。當芯片處于休眠狀態(tài)下,但麥克風還是在工作的,麥克風檢測到聲音之后傳遞到該模塊來,搬運到STM32U5里去。當數(shù)據(jù)達到一定數(shù)據(jù)量之后,讓CPU重新處理一次??梢杂糜谑直?穿戴類產(chǎn)品里的語音喚醒。
圖 U5可支持的外設(shè)
但是U5做不了語音識別。語音識別要傳到云端,需要大數(shù)據(jù)支持。ST將來更多的是嵌入式端的。目標是固定范圍之內(nèi)的,例如檢測電機控制的噪聲,根據(jù)噪聲判斷電機是否正常;還有進行數(shù)字的識別,例如有的客戶在做讀表器,因為老式的水表很難改造,這時,可以在上面放了一個簡單視覺芯片,把圖形數(shù)字轉(zhuǎn)換成可識別的數(shù)字,然后上傳到云端。
因此,U5等STM32系列MCU提到的AI是輕量級的AI??赡茏霾涣藢W(xué)習(xí),需要預(yù)先訓(xùn)練好模型,之后可以用它來做處理?;旧纤峭ㄟ^服務(wù)器把模型確定好放到該MCU里來做;這部分需要通過Cube AI的工具,把程序重新轉(zhuǎn)換(因為服務(wù)器云端的AI算法、語言在MCU上不通用),這時ST的Cube AI的工具可以幫助用戶在一些音視頻系統(tǒng)預(yù)先訓(xùn)練好該模型,檢測一些文字和一些圖片。
6 未來發(fā)展方向
ST在2007年發(fā)布第1個STM32到現(xiàn)在,迄今出貨量已達20億顆。STM32一直秉承“釋放你的創(chuàng)造力”的口號,來驅(qū)動產(chǎn)品的推出,以給用戶提供更多的選擇。
回顧10多年的發(fā)展歷程,從過去STM32F系列,延展到低功耗L系列、高性能H系列,又延展到無線W系列,以及最新的G系列,即針對工業(yè)控制的主要硬件產(chǎn)品線,之后,ST發(fā)布了基于STM32的MPU,今年在L基礎(chǔ)上發(fā)布了U系列。
STM32已從高性能到低功耗以及到MPU全覆蓋。未來在無線方面還會有更多的發(fā)力,并注入AI的IP機制,讓用戶可以實現(xiàn)AI的功能或者運用AI的算法。為此,ST在2020年及2021年的大部分收購聚焦在無線產(chǎn)品以及AI相關(guān)的方面。
評論