Synopsys ARC處理器家族新增成員,面向更輕型的嵌入式應用
9月20日,Synopsys宣布擴展其DesignWare?ARC?處理器IP產(chǎn)品組合,推出針對低功耗嵌入式SoC的新型128位ARC VPX2和256位ARC VPX3 DSP處理器。2019年,該公司推出了用于高性能信號處理SoC的512位ARC VPX5 DSP處理器。
本文引用地址:http://2s4d.com/article/202203/431788.htmSynopsys處理器解決方案高級營銷總監(jiān)Matt Gutierrez、ARC VPX DSP處理器高級產(chǎn)品營銷經(jīng)理Markus Willems等介紹了新款ARC處理器。
堅定不移地專注于嵌入式應用
從1990年代至今,ARC始終專注于支持嵌入式應用程序。從歷史上看,ARC處理器并未針對過移動應用。但是隨著嵌入式應用市場的發(fā)展,ARC處理器技術也相應地發(fā)生了變化。ARC處理器已經(jīng)從僅用于簡單和專用的任務(例如電源管理)發(fā)展到甚至可以運行64位Linux操作系統(tǒng)。
2010年成為Synopsys的一部分后,蓬勃發(fā)展的物聯(lián)網(wǎng)市場推動了構建新一代嵌入式ARC處理器。需要一個非常小的、高效的、低功耗的處理器系列來支持物聯(lián)網(wǎng)市場。一種新的架構和ISA誕生了。早期的物聯(lián)網(wǎng)設備需要最少量的DSP功能,處理器中添加了一些DSP功能就可以支持IoT要求。
快進到今天,Synopsys提供五個不同的ARC產(chǎn)品系列,每個系列都有廣泛的陣容。嵌入式處理器的每個產(chǎn)品系列都滿足了廣泛應用且嚴格的要求。VPX2和VPX3DSP主要用于語音處理、雷達/激光雷達、傳感器融合和高端物聯(lián)網(wǎng)應用。
專注推動高效的ARC架構
指令集架構(ISA)的設計考慮了嵌入式市場。例如,比較與控制傳輸和分支與循環(huán)等獨特的指令可以輕松高效地實現(xiàn)常見的嵌入式程序行為。另一個例子是為32位指令執(zhí)行16位編碼。ARC ISA有許多這樣的特性來減少代碼大小,因為嵌入式設備的內(nèi)存空間非常寶貴。
每個微架構決策也都考慮到嵌入式市場。例如,內(nèi)置影子寄存器對于實時嵌入式應用程序非常重要,可以實現(xiàn)快速上下文切換。這些類型的架構決策對嵌入式應用程序有很大的影響??梢暂p松將為某些其他應用程序設計的處理器進行調(diào)整,以支持嵌入式應用。
ARC價值主張的其他重要方面是設計的可配置性和指令集的可擴展性??膳渲眯允沟脙H實現(xiàn)SoC所需的最低硬件即可??蓴U展性允許添加自定義指令以加速應用程序代碼、增加代碼密度并降低功耗。
客戶能夠有效地創(chuàng)建由單一標準MetaWare工具鏈支持的定制處理器硬件,為他們的應用程序需求提供最佳PPA和代碼密度。大多數(shù)ARC客戶可以通過為其特定算法添加自定義指令來擴展指令集。
應對不斷擴大的市場需求
在推出VPX系列處理器之前,ARC處理器可以歸類為大CPU、小DSP IP解決方案。物聯(lián)網(wǎng)傳感器融合、雷達和LiDAR處理、語音/語音識別和自然語言處理等嵌入式工作負載需要成熟的DSP功能。由于Synopsys看到了這種不斷增長的市場需求,
推動PPA優(yōu)化信號處理的關鍵應用
這些市場的產(chǎn)品要求
浮點支持對于信號處理應用變得越來越重要。為這些市場開發(fā)的數(shù)據(jù)處理算法使用浮點來支持寬動態(tài)范圍。保持浮點而不是轉換為定點可以更快地將算法映射到設計架構。支持這些應用的DSP庫和線性代數(shù)庫以浮點格式表示。與過去相比,對矢量浮點運算編程的強大支持正變得越來越重要。
人工智能算法的高效執(zhí)行是另一個必備條件現(xiàn)代DSP。這意味著支持短整數(shù)數(shù)據(jù)類型,如Int8,結合專用編程環(huán)境,允許圖形平滑映射到DSP架構。當然,DSP必須配備豐富的機器學習內(nèi)核庫,針對硬件進行優(yōu)化,以簡化軟件開發(fā)。
用于線性和非線性代數(shù)運算的專用硬件加速器顯著加快了這些越來越多使用的數(shù)學函數(shù)的速度。
隨著產(chǎn)品公司開始提供多種變體,可配置性、可擴展性和可縮放性正成為關鍵要求。每個變體可以針對PPA和代碼密度進行不同的優(yōu)化。
VPX系列DSP IP
憑借代表7種不同DSP的三種不同VPX系列的可用性,客戶現(xiàn)在可以更靈活地實現(xiàn)特定應用要求。最新的兩款產(chǎn)品基于與兩年前推出的更高性能512位ARC VPX5 DSP處理器相同的VLIW/SIMD架構。由于新增產(chǎn)品針對的是低功耗嵌入式SoC,因此它們設計用于更小的矢量長度,從而實現(xiàn)更小、更低的功耗。由于超高浮點性能是VPX DSP的重點,因此提供了矢量浮點單元(VFPU)作為選項。VFPU由多個流水線實現(xiàn),每個時鐘周期能夠執(zhí)行多達512個FLOP。隨著這兩款新產(chǎn)品的推出,Synopsys還宣布了對VPX5處理器的一些增強。
ARC VPX2和VPX3 DSP IP
產(chǎn)品的輕松遷移和可擴展性
Synopsys ARC MetaWare開發(fā)工具包支持ARC VPX處理器,該工具包提供矢量長度不可知(VLA)軟件編程模型。從編程的角度來看,向量長度被標識為“n”,n的值在定義語句中指定。MetaWare編譯器執(zhí)行映射并選擇正確的軟件庫集進行編譯。編譯器還提供自動矢量化功能,可將順序代碼轉換為矢量操作,以實現(xiàn)最大吞吐量。
結合DSP、機器學習和線性代數(shù)函數(shù)軟件庫,MetaWare開發(fā)工具包提供了一個全面的編程環(huán)境。
總之,上述功能使客戶能夠輕松地在VPX系列的所有成員之間遷移和/或擴展他們的產(chǎn)品。
優(yōu)化當前基于ARC VPX5的設計的機會
可擴展的ARC VPX系列一覽
VPX5增強功能包括雙寬矢量加載/存儲、更寬的AXI接口、ISA擴展以及支持基于VLA的編程模型的機器學習、DSP和線性代數(shù)庫。這些增強功能使VPX5在常見DSP功能(如FFT、點積和窗口化)方面的性能與早期版本相比提高了一倍。在許多應用中,設計人員無需為這些功能實現(xiàn)設計單獨的外部加速器。
對于汽車市場
為了滿足汽車市場更高的安全要求,Synopsys為其整個產(chǎn)品組合提供了功能安全(FS)系列,包括VPX系列處理器。FS系列處理器滿足隨機故障檢測和系統(tǒng)功能安全開發(fā)流程要求,完全符合ISO 26262至ASIL D。
概括
提供設計效率、優(yōu)化PPA和最大化軟件代碼密度是ARC的根本所在。Synopsys的ARC VPX DSP系列處理器為客戶提供全方位的可擴展解決方案,以滿足他們不同的需求。
評論