眾廠商談邊緣AI的技術(shù)與產(chǎn)品策略
作者 / 王瑩 毛爍 《電子產(chǎn)品世界》記者
本文引用地址:http://2s4d.com/article/201811/395028.htm摘要:人工智能和物聯(lián)網(wǎng)兩股浪潮同時涌現(xiàn),兩者相互融合,相輔相成,不僅推動著技術(shù)的發(fā)展,也推動著時代的進步。各大元器件廠商對于這兩股時代浪潮也各有高見。
實時低功耗AI處理解決方案
瑞薩電子致力于為實現(xiàn)環(huán)保,智能型社會而貢獻力量,而僅通過使用云的大數(shù)據(jù)處理是無法實現(xiàn)更安全和健康的生活的。
憑借靈活且可擴展的嵌入式人工智能(e-AI)概念,瑞薩電子提供了面向未來的實時低功耗AI處理解決方案,該解決方案在業(yè)界是獨特的,它可在嵌入式端點設(shè)備中實現(xiàn)人工智能的特定需求。瑞薩正在為其智能工廠、智能家居,智能基礎(chǔ)設(shè)施和新業(yè)務(wù)部門方向努力,例如服務(wù)機器人等重點領(lǐng)域的客戶探索新的嵌入式人工智能解決方案。 瑞薩電子將繼續(xù)與客戶和合作伙伴展開合作。
通過使用由UC
Berkeley開發(fā)的Caffe或Google開發(fā)的TensorFlow,任何人都可以相對輕松地使用AI(人工智能)。DNN(深度神經(jīng)網(wǎng)絡(luò))是在各種AI專業(yè)領(lǐng)域中最常用的算法之一。DNN由兩個主要部分組成:
學(xué)習(xí)和推理。
DNN在學(xué)習(xí)和推理執(zhí)行所需的計算量方面存在很大差異,它的一個主要特征是它在推理階段可以以較低的計算能力執(zhí)行。
瑞薩電子的e-AI解決方案提議是在Cloud方面繼續(xù)學(xué)習(xí)執(zhí)行,但推理執(zhí)行轉(zhuǎn)移到MCU / MPU(如圖1)。 優(yōu)點是它可以支持更安全,可靠,快速的AI系統(tǒng)。
為了在嵌入點中執(zhí)行推理階段,嵌入式AI 方案有兩個主要挑戰(zhàn):
1.嵌入式系統(tǒng)實現(xiàn)AI的難點在于,AI系統(tǒng)和MCU / MPU的語言不同。 將AI模型轉(zhuǎn)換到MCU / MPU并不容易。 我們需要有一個有效的工具來轉(zhuǎn)換模型,然后妥善適合MCU / MPU存儲區(qū)。
(備注:Python是在許多AI模型中比較通用的語言,而MCU的控制程序通常用C / C ++。)
2.AI推理將遷移到邊緣和端點系統(tǒng),作為新的硬件架構(gòu)解決方案, 它必須真正平衡行業(yè)領(lǐng)域的要求,包括解決功率效率、市場靈活性、功能安全要求和實時響應(yīng)。瑞薩電子有相關(guān)的技術(shù)和開發(fā)環(huán)境來解決這兩個問題。
支持e-AI開發(fā)環(huán)境
瑞薩電子e-AI人工智能開發(fā)環(huán)境可以把學(xué)習(xí)后的AI模型輸入到e-AI翻譯器,并將其轉(zhuǎn)換為e2Studio C / C ++項目的可用形式。它是一種方便易用的工具,把AI功能簡單地實現(xiàn)到MCU / MPU上(如圖2)。
DRP技術(shù)實現(xiàn)低功耗AI處理
動態(tài)可重配置處理器(DRP)是一種可編程架構(gòu),可動態(tài)切換數(shù)據(jù)路徑,使高度復(fù)雜的加速器能夠在不增加功率要求的情況下運行并行指令。FPGA和DRP在邏輯中使用類似的布線結(jié)構(gòu)和并行技術(shù),但DRP由大型子組件組成,而不是像FPGA那樣的細粒度配置。這意味著DRP重新配置所需的時間比包括FPGA在內(nèi)的其他架構(gòu)要少。
DRP的可配置性允許架構(gòu)繼續(xù)適應(yīng)和支持深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的變化。DRP技術(shù)具有高速處理能力和消耗更少功率的特點在嵌入式AI系統(tǒng)擁有明顯優(yōu)勢。
面向輕型機器學(xué)習(xí),恩智浦出臺eIQ開發(fā)環(huán)境及芯片
機器學(xué)習(xí)將驅(qū)動下一波MCU增長
IoT推動了這幾年MCU的更新?lián)Q代,而下一波MCU的助推器是終端的機器學(xué)習(xí),包括家庭環(huán)境、聲音處理、手勢控制、智能感測、智能控制、多攝像頭觀察、個人資產(chǎn)、主動目標(biāo)識別、AR(增強現(xiàn)實)等。
典型的案例之一是目前發(fā)展火熱的人機界面的聲音處理,會推動下一波白電等家電應(yīng)用的需求。例如在2018年10月的Arm TechCon2018(Arm技術(shù)大會)上,恩智浦展示了聲控洗衣機,可以與洗衣機對話,例如:“打開洗衣機”。洗衣機會問:“你要怎樣洗?”可以回答:“我要標(biāo)準(zhǔn)洗”或“強力洗”。也可以告訴洗衣機洗什么樣的衣物,例如洗被子,或用什么方式洗,例如熱水洗、冷水洗等,洗衣機就自動設(shè)置好。
再例如圖形的識別,恩智浦在美國的一個DEMO(演示)是交通指示標(biāo)識識別,機器能夠識別紅綠燈、是路還是人,假設(shè)指示標(biāo)識斜著、模糊一點,機器都可以辨認(rèn)出來。
邊緣AI的芯片布局
恩智浦有全套的MCU、MPU產(chǎn)品線,從低端MCU一直到高端的四核、八核高端處理器,所有這些芯片都可以用在機器學(xué)習(xí)、邊緣計算上。客戶不僅可以在云端進行訓(xùn)練,還可以通過軟件的推理,在終端的處理器上進行應(yīng)用。
恩智浦的AI開發(fā)環(huán)境是eIQ,也是機器學(xué)習(xí)(ML)的開發(fā)環(huán)境。底端的硬件平臺有傳統(tǒng)的MCU和MPU,諸如Kinetis、LPC等Cortex-M核的MCU產(chǎn)品,還有新的i.MX RT系列跨界處理器,高端的i.MX6、7、8等處理器,以及Layerscape處理器。
硬件平臺里,運算的部分是核和硬件加速器,有Cortex-R、M和A核,GPU、DSP中放的是DSP核,未來一兩年內(nèi),恩智浦還將開發(fā)ML(機器學(xué)習(xí))的加速硬件,這不同于大型的云端硬件加速,而是可以跨平臺、跨處理器和微控制器的用于終端計算的ML加速器。
在芯片之上是硬件抽象層,諸如OpenCL,OpenVX,Arm的計算庫/ CMSIS-NN,還有恩智浦的API等。再往上是推理機(Inference Engine),有很多種,主推的有Google的TensorFlow、TF Lite等。實際上,恩智浦支持所有開發(fā)環(huán)境?,F(xiàn)在還有新的NN Compiler(編譯器),例如Facebook的GLOW等。
在基于所有的機器學(xué)習(xí)軟件硬件結(jié)合之后,恩智浦推出了全套的解決方案,包括音視頻及機械傳感器的解決方案(例如壓力、加速度傳感器的解決方案)。同時針對各種應(yīng)用,推出了應(yīng)用上的解決方案,例如ISP(圖像信號處理)、圖像加速、傳感器融合、全景環(huán)視(注:過去通常是車上用,現(xiàn)在家居方面也有很多應(yīng)用),還有前端的聲音的控制,諸如多揚聲器。
在揚聲器方面,如果是兩個揚聲器,用比較簡單便宜的MCU就足夠了,例如LPC和Kinetis系列;如果更多揚聲器,由于數(shù)據(jù)處理量很大,適合用i.MX RT跨界處理器平臺,或i.MX 7、8、8M等高端處理器。
可見根據(jù)不同的應(yīng)用,恩智浦有不同的處理器配合,這是eIQ的概念。恩智浦的目標(biāo)是讓外界主流的推理機都能運行在恩智浦的硬件上。
恩智浦也有全套的芯片,覆蓋高端到低端。其中高端的i.MX用的是GPU、DSP,未來一兩年內(nèi),恩智浦還會推出ML加速硬件,是真正的專用加速器。
賽普拉斯:物聯(lián)網(wǎng)產(chǎn)品的高性能軟硬件解決方案
隨著越來越多的物聯(lián)網(wǎng)設(shè)備接入和應(yīng)用的復(fù)雜多樣化,邊緣計算和安全越來越多地被市場討論且成為關(guān)注焦點。這些新的技術(shù)和趨勢對嵌入式芯片是機遇也是挑戰(zhàn)。
物聯(lián)網(wǎng)的部署是為了更智能、更便捷和更有效率,因此人工智能的應(yīng)用是一種必然的趨勢:通過真實世界量化后的大數(shù)據(jù)分析,由計算結(jié)果代替或者輔助執(zhí)行使得結(jié)果更優(yōu)化。這些分析和計算通常在云端進行,然后隨著對實時性的要求提升以及應(yīng)用場景的復(fù)雜程度,越來越多的應(yīng)用開始考慮把計算放在物聯(lián)網(wǎng)終端或者節(jié)點端,比如智能語音識別的本地化,比如3D人臉識別的圖像預(yù)處理本地化等。這樣的應(yīng)用要求處理器具有高性能的處理能力,同時滿足低功耗、低成本的物聯(lián)網(wǎng)設(shè)備的普遍需求,整體上提升了嵌入式芯片的處理能力和性能功耗比的門檻。
與此同時,物聯(lián)網(wǎng)安全也開始從可選項變?yōu)楸剡x項,隨著愈加成熟和詳細的行業(yè)規(guī)范的推出,比如智能門鎖,物聯(lián)網(wǎng)設(shè)備對安全的需求從簡單的數(shù)據(jù)通信加密、安全啟動防篡改,發(fā)展到需要有效和安全的硬件隔離來實現(xiàn)可信執(zhí)行環(huán)境,從而確保物聯(lián)網(wǎng)的安全服務(wù),不受其它應(yīng)用服務(wù)的更新的影響或者非安全訪問的威脅。這對嵌入式芯片的安全架構(gòu)提出了更嚴(yán)格的要求。
賽普拉斯半導(dǎo)體的PSoC 6微控制器結(jié)合了以上提到的高性能、超低功耗和高安全性特點,從系統(tǒng)架構(gòu)和工藝上一開始就考慮了邊緣計算和高安全的物聯(lián)網(wǎng)需求,是為下一代物聯(lián)網(wǎng)量身定制的處理器。同時結(jié)合賽普拉斯領(lǐng)先的Wi-Fi和藍牙無線連接技術(shù),以及結(jié)合了PSoC Creator和WICED無線應(yīng)用SDK(軟件開發(fā)包)的Modus Toolbox開發(fā)工具,為物聯(lián)網(wǎng)產(chǎn)品開發(fā)者提供了完整的高性能軟硬件解決方案。該開發(fā)套件不僅集成了本地語音處理和身份驗證等計算功能,還在PSoC 6雙核架構(gòu)基礎(chǔ)上實現(xiàn)了靈活、安全的可信執(zhí)行環(huán)境,并提供亞馬遜和阿里巴巴的安全云服務(wù)連接開發(fā)套件。賽普拉斯公司新成立的物聯(lián)網(wǎng)計算和無線部門在未來五年將繼續(xù)大力開發(fā)物聯(lián)網(wǎng)芯片、軟件和解決方案,為市場提供好的產(chǎn)品和服務(wù)。
面向AI等應(yīng)用推出自適應(yīng)加速平臺及加速卡
對于幾何級變化的數(shù)據(jù)計算時代,芯片的開發(fā)速度已經(jīng)遠遠跟不上創(chuàng)新的速度。為此,Xilinx于2018年10月推出了自適應(yīng)加速平臺——ACAP,是軟硬件可編程平臺,首款產(chǎn)品名為Versal,制程7 nm,包含F(xiàn)PGA和異構(gòu)加速等復(fù)雜結(jié)構(gòu)。為了滿足數(shù)據(jù)中心加速需要,Xilinx還推出了Alveo加速器卡,用于數(shù)據(jù)中心和AI,芯片制程16 nm。其中,Alveo U200 和 Alveo U250 由 Xilinx UltraScale+ FPGA提供動力。
靈活芯片與專用芯片的應(yīng)用比拼
那么,既然現(xiàn)有芯片已經(jīng)很難跟上數(shù)據(jù)和計算的幾何級發(fā)展,固定功能的AI芯片發(fā)展前景如何?實際上,ACAP或者Alveo產(chǎn)品不會取代所有GPU,但是人們肯定會越來越多采用靈活應(yīng)變的平臺。
相比GPU、CPU,ACAP的引爆點在哪里?GPU現(xiàn)在在深度學(xué)習(xí)訓(xùn)練這一塊應(yīng)用非常多,但是它的功耗很高。但是Xilinx并不是特別關(guān)注訓(xùn)練這個市場,而是更多關(guān)注后面的推斷這部分的市場,包括在數(shù)據(jù)中心和邊緣計算,GPU用得并不多,CPU有一定的應(yīng)用,但是性能和時延不太理想。這也是為什么Xilinx在推斷這個領(lǐng)域,包括在智慧城市、自動駕駛汽車上已經(jīng)有了很多的訂單,相比GPU、CPU更有競爭力。
反過來再看訓(xùn)練市場,現(xiàn)在GPU占據(jù)的市場份額比較多,但是這個市場基本處于飽和的狀態(tài)。而推斷這個市場仍然處于初期、快速上升期,現(xiàn)在正處于從CPU向加速卡轉(zhuǎn)換的階段,很多分析師預(yù)測未來的推斷市場比訓(xùn)練市場規(guī)模大很多,因為訓(xùn)練只需要一次,但是最終推斷可能是成百上千倍的應(yīng)用規(guī)模。
如何看待很多初創(chuàng)公司在做AI芯片?
現(xiàn)在無論是AI還是別的類型芯片,任何的先進技術(shù)要發(fā)展,如果是用16 nm、7 nm的技術(shù),所需要的投資都是巨大的,很多小企業(yè)可能沒有足夠的資金,無論是在芯片的開發(fā)還是在量產(chǎn)方面,尤其實現(xiàn)量產(chǎn)需要非常大的投資,這對于所有做AI和其他應(yīng)用的企業(yè)來說都是一大挑戰(zhàn)。
既然如此,AI初創(chuàng)公司應(yīng)該如何去創(chuàng)新?被大公司收購是出路之一,例如2018年7月,北京的深鑒科技公司被Xilinx收購。因為大公司能夠充分利用創(chuàng)新的技能和知識來擴大客戶群,幫助小公司更快地影響業(yè)界,而無需初創(chuàng)公司自己去融資,還要來重復(fù)執(zhí)行大公司很多優(yōu)勢領(lǐng)域的方案。所以初創(chuàng)企業(yè)應(yīng)該關(guān)注自己的創(chuàng)新,而大公司擅長的部分可以由大公司來做,而不是由初創(chuàng)企業(yè)投資幾億元去做芯片。
深鑒的技術(shù)特色
Xilinx過去幾年在AI邊緣計算上投入了很多資源,例如2018年7月,Xilinx收購了深鑒科技。深鑒科技也是用賽靈思的 Zynq SoC技術(shù),面部識別就是深鑒非常重要的一個技術(shù)應(yīng)用領(lǐng)域。深鑒科技有一個剪枝技術(shù),是基于神經(jīng)網(wǎng)絡(luò)來進行優(yōu)化的技術(shù),也就是將神經(jīng)元需要計算的數(shù)量來進行裁減,使得真正計算的神經(jīng)元少一些,即使一些小的FPGA也可以進行計算。
類比一下,就像一個小孩小的時候腦神經(jīng)元比較多,長大的時候使用的神經(jīng)元數(shù)量反而少了,但是這些神經(jīng)元的可用效率和效果是非常好的,隨著人逐漸長大,對神經(jīng)元的訓(xùn)練使得少部分的神經(jīng)元更加強大了。還有模塊上的系統(tǒng)FPGA可以嵌在IP攝像頭和PCI-e卡里,這都是在邊緣計算里的。
高精度的FPGA架構(gòu)
無論是作為協(xié)處理器、獨立的處理單元亦或是簡單的橋接,只要客戶尋求的價值定位是創(chuàng)新、快速上市、低延遲、靈活的IO以及可編程性,F(xiàn)PGA就有其獨特的優(yōu)勢。靈活I(lǐng)O可以在不同的應(yīng)用場景支持不同類別的傳感器,甚至處理多個傳感器交互和融合。AI目前還在初步階段,萊迪思預(yù)計神經(jīng)網(wǎng)絡(luò)引擎需要可編程性持續(xù)演進和優(yōu)化。通用的MCU功耗和延遲一般會較高,加入固化的加速器雖然可以改善當(dāng)下的性能,在未來幾年內(nèi)不能持續(xù)優(yōu)化的缺陷會是個很大的限制。在新一版的CNN加速器IP,萊迪思針對了神經(jīng)網(wǎng)絡(luò)的需求來優(yōu)化了DRAM存儲器帶寬,使得ECP5的推理性能最多提升至2倍。
隨著AI不斷火熱,IoT和智能傳感器市場將持續(xù)增長。物聯(lián)網(wǎng)世界的多樣性也將是FPGA靈活架構(gòu)大放異彩的機會。因此在超低功耗、低成本、小尺寸的iCE40 UltraPlus上,萊迪思也推出了輕量化CNN來滿足更靈活的性能、精度、功耗的平衡與取舍。盡管輕量化CNN比之前推出的二值神經(jīng)網(wǎng)絡(luò)(BNN)功耗稍高,但是其精度和性能也更優(yōu)秀,CNN在業(yè)界的接受度也比BNN更為廣泛。
更高性能的邊緣應(yīng)用
Achronix的FPGA產(chǎn)品和技術(shù)專注于邊緣應(yīng)用上的多種人工智能(AI)需求,例如汽車傳感器融合、目標(biāo)檢測和識別、AI和機器學(xué)習(xí),以及360度環(huán)繞視圖系統(tǒng)等需要在邊緣上本地處理數(shù)據(jù)的應(yīng)用。
可編程邏輯提供了使計算更加以數(shù)據(jù)為中心的能力。雖然傳統(tǒng)的處理器都要求數(shù)據(jù)通過復(fù)雜的高速緩存層級被送到其流水線中,而可編程邏輯則能夠構(gòu)建數(shù)據(jù)流水線。借助由定制邏輯電路和數(shù)字信號處理器(DSP)引擎組成的數(shù)據(jù)單元來在數(shù)據(jù)通過時操控它們,數(shù)據(jù)可以從一個節(jié)點到另一個節(jié)點無縫流動;每個單元都已準(zhǔn)備好把數(shù)據(jù)轉(zhuǎn)發(fā)到需要它們的下一個節(jié)點。隨著需求的變化,其中的邏輯陣列可以輕松地重新連線形成新的配置。與更適合處理控制密集型代碼的微處理器相比,這種邏輯陣列可以為以數(shù)據(jù)為中心的應(yīng)用提供更好的支持。然而,獨立FPGA芯片通常會產(chǎn)生更大的功耗,這是因為需要將數(shù)據(jù)頻繁地移入和移出更專用的ASIC芯片中。
嵌入式FPGA(eFPGA)技術(shù)提供了一種方法,可以在一個封裝芯片中滿足邊緣計算應(yīng)用的能效、性能、延遲和面積限制。結(jié)合eFPGA技術(shù),可以把平時部署在獨立的ASIC芯片中的常用功能在定制硬件中實現(xiàn)集成,以帶來更高的性能和密度。對于機器學(xué)習(xí)應(yīng)用,這些功能可以是用于卷積內(nèi)核或最大池計算的專用處理器陣列。通過在同一芯片上集成可編程邏輯和定制邏輯,可以避免在芯片外傳輸數(shù)據(jù),從而節(jié)省大量功耗。
有關(guān)開發(fā)環(huán)境和技術(shù)方面內(nèi)容如下:
Speedcore?嵌入式FPGA:它是經(jīng)流片驗證的高密度、高性能eFPGA半導(dǎo)體知識產(chǎn)權(quán)(IP)產(chǎn)品。
Speedchip? FPGA合封芯片:FPGA合封芯片專為嵌入到先進的系統(tǒng)級封裝(SiP)解決方案進行了優(yōu)化,如通過硅介電層或有機基板實現(xiàn)了2.5D封裝。
Speedster?22i FPGA:這是一系列高性能和高密度FPGA芯片,帶有適用于通信應(yīng)用的嵌入式系統(tǒng)IP,包括10 G / 100 G以太網(wǎng)、100 G Interlaken、PCIe Gen3×8和DDR3等。
PCIe Accelerator-6D加速板:它們是具有業(yè)界最高存儲器帶寬的、基于FPGA的PCIe附加卡,適用于高速加速應(yīng)用。
Achronix?的自動化設(shè)計(CAD)環(huán)境被稱為ACE,它與行業(yè)標(biāo)準(zhǔn)的邏輯綜合工具配合使用,使FPGA設(shè)計人員能夠輕松地將其設(shè)計映射到Achronix FPGA芯片中。
支持生態(tài)系統(tǒng)與AI的開發(fā)和應(yīng)用
Imagination的業(yè)務(wù)是為半導(dǎo)體芯片提供必要的內(nèi)核構(gòu)建模塊。Imagination主要以自己的嵌入式圖形(GPU)技術(shù)和神經(jīng)網(wǎng)絡(luò)加速器(NNA)技術(shù)而聞名,并將這些技術(shù)授權(quán)給全球領(lǐng)先的芯片供應(yīng)商。他們的半導(dǎo)體芯片廣泛應(yīng)用于多種產(chǎn)品和服務(wù),因此Imagination在市場中擁有非常獨特的地位,因為Imagination可以支持整個生態(tài)系統(tǒng)參與人工智能(AI)的開發(fā)和應(yīng)用。
GPU和NNA現(xiàn)在是邊緣AI的必要元素。隨著眾多企業(yè)開始認(rèn)識到在各種任務(wù)(從自然語言處理到圖像分類)中應(yīng)用神經(jīng)網(wǎng)絡(luò)的潛力,引入人工智能元素的產(chǎn)品數(shù)量也開始穩(wěn)步增加。同時,這些任務(wù)的處理正在從傳統(tǒng)的基于云架構(gòu)轉(zhuǎn)移向設(shè)備端本身,基于硬件的專用神經(jīng)網(wǎng)絡(luò)加速器現(xiàn)在可嵌入至半導(dǎo)體芯片中,以實現(xiàn)本地的AI處理。從可監(jiān)控前方道路的先進駕駛輔助系統(tǒng)(ADAS)到虛擬助手等聲控的消費性電子產(chǎn)品,關(guān)于集成的、基于神經(jīng)網(wǎng)絡(luò)AI的機會正在向多個細分市場延伸。
不可否認(rèn),AI正在成為許多應(yīng)用的必要元素。但是,仍然有很多挑戰(zhàn)。其中之一就是在邊緣和云之間平衡處理負載,并找到放置AI本身的最佳位置。例如,邊緣AI可用于消費性設(shè)備上的本地語音識別,比如識別“喚醒詞”或簡單指令,但是依然有必要在云端進行大部分的語音AI處理,以便利用那些無法在設(shè)備端存儲的龐大知識庫?,F(xiàn)在許多設(shè)備都標(biāo)榜帶有AI,但實際上,除了依靠云端去給人智能的印象以外,就僅僅只是在本地做了簡單的模式匹配和識別而已。
半導(dǎo)體工藝不斷演進,為在邊緣設(shè)備上進行更多的AI處理創(chuàng)造了機會。例如,Imagination將看到能夠監(jiān)控特定事件的智能安全攝像頭。它們將使用邊緣AI處理來識別視頻流中的特征,例如道路上的車輛或鏡頭中的人臉,然后觸發(fā)特定事件,例如計算車輛的數(shù)量或允許授權(quán)人員訪問。他們甚至可以通過減少“誤報”的數(shù)量來節(jié)省成本,因為攝像頭中的邊緣AI可以識別正常行為和可疑行為之間的差異。
另一個挑戰(zhàn)是,盡管AI應(yīng)用的數(shù)量在不斷增加,但這并不一定意味著集成了AI加速功能的SoC是所有應(yīng)用場景的前進方向。的確,如果Imagination考慮AI去覆蓋大部分細分市場,那么由于使用該技術(shù)的各種產(chǎn)品具有截然不同的工藝要求,碎片化會自然而然地發(fā)生。碎片化的市場對于使用專用SoC提供服務(wù)具有挑戰(zhàn)性,所以“一應(yīng)俱全”的方法不會始終適用。雖然諸如手機或ADAS(高級駕駛員輔助系統(tǒng))等一些市場為SoC供應(yīng)商提供了大量機會,但許多以人工智能應(yīng)用為目標(biāo)的市場將自然呈現(xiàn)出低銷量前景。例如,一些產(chǎn)品可能需要AI進行語音處理或圖像識別,但不是兩者都需要;同樣,智能家居供應(yīng)商不大可能只為將AI功能嵌入他們的控制面板而去使用原本為智能手機設(shè)計的SoC,因為這不符合成本效益。這個難題的解決方案就是打造專用的AI芯片,其可以作為輔助芯片與主應(yīng)用處理器一起使用,去卸載通常由主應(yīng)用處理器中的NNA內(nèi)核處理的AI推理任務(wù)。這樣做的優(yōu)勢是SoC供應(yīng)商可以提供一系列具有不同性能水平的邊緣AI芯片;同時,原始設(shè)備制造商(OEM)可以根據(jù)他們希望在自己的特定應(yīng)用中所處理的AI處理開銷來選擇適當(dāng)?shù)財U展產(chǎn)品解決方案。
RISC-V適合AI、物聯(lián)網(wǎng)等創(chuàng)新
有人預(yù)言,RISC-V或?qū)⑹抢^Intel和Arm之后的第三大主流處理器體系。實際上,三年前RISC-V基金會剛剛成立,如今已有200余家會員,會員遍布27個國家,得到了來自中國、印度、俄羅斯等國政府、高校、企業(yè)界的支持。RISC-V為何在短時間內(nèi)受歡迎?
相比Intel和Arm,RISC-V有三大特點。
首先,從微處理器角度看,RISC-V的Core(核)設(shè)計得非常精巧、簡單、有效,允許運行基本的操作系統(tǒng)。
其次,允許可擴展,由非營利組織——RISC-V基金會運營的,不像過去Intel和Arm等是由一家公司運營的,RISC-V核是大家(Community)運營的,只要加入基金會,成為基金會成員,就可以用。RISC-V的可擴充性允許開發(fā)者加自己新的指令,而且允許開發(fā)者的設(shè)計是開源的,也可以不開源,也可以用來賺錢,也可以做研究……這種靈活的模式帶來了微處理器的革命。實際上,RISC-V是第一個硬件開源的,開源了ISA。ISA指令集是硬件與軟件的接口。
第三,帶來很多創(chuàng)新。在微處理器產(chǎn)品里,從IT和IC領(lǐng)域里,很長時間里被Intel壟斷的,之后有Arm。由于知識產(chǎn)權(quán)的限制,其他公司不能使用Intel或Arm的ISA指令來做自己事情,除非得到授權(quán)。因此,多年來,很少有開發(fā)者在架構(gòu)方面做創(chuàng)新。不過,RISC-V開了一扇門,允許公司、高校師生、研究機構(gòu)等做產(chǎn)品或進行研究。有個形象的比喻,過去只有一種榔頭,做任何事都要用這個榔頭,現(xiàn)在允許大家開發(fā)各種各樣的榔頭。
值得指出的是,RISC-V并不是比Intel和Arm好。因為Intel和Arm也是非常優(yōu)秀的公司,投入了大量資金和努力,開發(fā)了很好的產(chǎn)品。區(qū)別在于那兩種芯片/架構(gòu)是私人所有的,不是開放、免費的,RISC-V是第一個在微處理器領(lǐng)域里把ISA指令架構(gòu)開放,這是一場革命,帶來了全新的商業(yè)形態(tài)和創(chuàng)新環(huán)境。
原來的商業(yè)模式,Intel和Arm把產(chǎn)品做好了,無法改變。但市場上應(yīng)用場景在變,目前已經(jīng)超越PC和手機時代了。在很多應(yīng)用場景,例如AI、物聯(lián)網(wǎng)和區(qū)塊鏈等有很多創(chuàng)新的應(yīng)用,對架構(gòu)有新的要求,老是用一套做是不行的,RISC-V允許核本身不動,基本ISA由community(社區(qū))統(tǒng)一管理,允許加不同的東西進來,這樣可以把很多事情做好。
RISC-V的ISA是開放和免費的。有三種模式:1.有可能開源社區(qū)獲得免費的設(shè)計,像Linux;2.商業(yè)模式方面,有的是像致象爾、SiFive、晶心科技等公司,利用ISA設(shè)計芯片,銷售IP和設(shè)計,出售證書(licensing)或royality(版權(quán));3.賣芯片。由表1可見,Arm不做芯片,只做設(shè)計。Intel不賣設(shè)計,只出售芯片。RISC-V在這三個方面都可以。
參考文獻:
[1] 任澤坤.芯片廠商引領(lǐng)廣電的人工智能化[J],電子產(chǎn)品世界,2017(10);19~23
[2] 王瑩.人工智能的進展及發(fā)展建議[J],電子產(chǎn)品世界,2017(2);19~23
[3] 有鵬,劉勇,楊林莉,等. 基于物聯(lián)網(wǎng)的圖像監(jiān)控系統(tǒng)[J],電子產(chǎn)品世界,2017(7);37~40
本文來源于《電子產(chǎn)品世界》2018年第12期第11頁,歡迎您寫論文時引用,并注明出處。
評論