新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > ??Arm引領(lǐng)AI時(shí)代芯片設(shè)計(jì)的范式躍遷

??Arm引領(lǐng)AI時(shí)代芯片設(shè)計(jì)的范式躍遷

作者:ZongYu 時(shí)間:2025-04-25 來源:EEPW 收藏

在半導(dǎo)體產(chǎn)業(yè)面臨歷史性轉(zhuǎn)折的當(dāng)下,領(lǐng)先的計(jì)算平臺(tái)公司于近日發(fā)布的《芯片新思維:時(shí)代的新根基》行業(yè)報(bào)告揭示了時(shí)代芯片技術(shù)的演進(jìn)路徑。芯粒與先進(jìn)封裝技術(shù)的崛起正突破傳統(tǒng)摩爾定律的物理極限,為架構(gòu)創(chuàng)新、能效革命與范式重構(gòu)提供了新的可能性,從而為的爆發(fā)式增長構(gòu)建新型算力基座。

本文引用地址:http://2s4d.com/article/202504/469822.htm

 

隨著傳統(tǒng)縮放技術(shù)的終結(jié),先進(jìn)的封裝技術(shù)已逐漸成為摩爾定律的真正繼任者——盡管其本身也面臨著諸多限制。芯粒設(shè)計(jì)趨勢(shì)的興起,實(shí)際上并不是為了讓芯片變得更小。事實(shí)上,隨著晶體管數(shù)量的增長速度超過單純縮放技術(shù)所能支持的速度,系統(tǒng)整體尺寸仍在持續(xù)加大。解決方案工程部執(zhí)行副總裁Kevork Kechichian指出,這一技術(shù)演變始于2010年代,當(dāng)時(shí)臺(tái)積公司推出了CoWoS技術(shù),使系統(tǒng)能夠突破晶圓廠光刻設(shè)備的物理尺寸限制,實(shí)現(xiàn)系統(tǒng)擴(kuò)展。

image.png 

解決方案工程部執(zhí)行副總裁 Kevork Kechichian

現(xiàn)代芯片設(shè)計(jì)正經(jīng)歷從平面集成到3D堆疊的質(zhì)變。通過先進(jìn)封裝將計(jì)算、存儲(chǔ)單元進(jìn)行空間重構(gòu)。Microsoft Azure CobaltGoogle Axion定制芯片的實(shí)踐表明,Arm Neoverse計(jì)算子系統(tǒng)(CSS)正成為架構(gòu)創(chuàng)新的核心載體:其模塊化設(shè)計(jì)允許SoC設(shè)計(jì)人員圍繞經(jīng)過驗(yàn)證的核心計(jì)算功能以及靈活的內(nèi)存與 I/O 接口配置,在確保軟件一致性的同時(shí),使其能夠基于CSS周圍新增定制子系統(tǒng),以打造差異化的解決方案。

 

這種變革正在顛覆傳統(tǒng)制造范式。當(dāng)CFET(互補(bǔ)場(chǎng)效應(yīng)晶體管)等3D集成技術(shù)突破7納米以下制程瓶頸,芯片設(shè)計(jì)商與代工廠的協(xié)作深度達(dá)到空前水平。Arm在報(bào)告中指出,企業(yè)已無法在不了解 IP 如何在實(shí)際芯片中實(shí)現(xiàn)的情況下,進(jìn)行芯片IP設(shè)計(jì)。設(shè)計(jì)與制造之間曾經(jīng)的界限正在逐漸消融,取而代之的是原本各自獨(dú)立運(yùn)作的領(lǐng)域之間必須展開緊密協(xié)作。

能效:計(jì)算的生死線

高盛最新研究顯示,數(shù)據(jù)中心電力消耗將在2030年消耗美國7.5%的供電量。從芯片設(shè)計(jì)的角度來看,最主要的能耗來源有兩個(gè):計(jì)算和數(shù)據(jù)傳輸。此外,還需要對(duì)過程中所產(chǎn)生的熱量進(jìn)行冷卻處理。Arm在報(bào)告中提到了三大技術(shù)趨勢(shì):全行業(yè)推動(dòng)采用FP44位浮點(diǎn)數(shù))靈活架構(gòu)并推出新指令集和功能,帶來了增量收益,并有助于實(shí)現(xiàn)更高效的AI計(jì)算;芯片堆疊技術(shù)和3D封裝技術(shù)的發(fā)展,也催生了諸如芯粒等更高能效的芯片設(shè)計(jì)方案。此外,業(yè)界已經(jīng)證明,更小型、更高能效的AI模型是完全可行的。

 image.png

高盛預(yù)計(jì) AI 將推動(dòng)數(shù)據(jù)中心的電力需求增長達(dá) 160%

可以預(yù)見,無論是現(xiàn)在還是將來,AI都需要在云端和端側(cè)進(jìn)行混合處理。邊緣處理將與數(shù)據(jù)中心處理相輔相成,以更節(jié)能的方式完成推理任務(wù)。通過智能分配工作負(fù)載,可以提高整體系統(tǒng)能效。從移動(dòng)端到物聯(lián)網(wǎng),一系列采用了更小型、更高能效 AI 模型的設(shè)備正在推動(dòng) AI 轉(zhuǎn)向邊緣側(cè)。例如,Arm Meta 的優(yōu)化合作使得Meta Llama 3.2大語言模型能夠以前所未有的速度在基于Arm架構(gòu)的移動(dòng)設(shè)備上運(yùn)行。

而在底層架構(gòu)方面,新的指令集和功能的引入,能夠?yàn)?/span>AI帶來重大的創(chuàng)新機(jī)遇。比如,ArmArmv9架構(gòu)中引入的SME(可伸縮矩陣擴(kuò)展)功能,通過量化技術(shù)減少AIML模型的內(nèi)存帶寬、占用空間以及計(jì)算復(fù)雜性,進(jìn)而提高其效率。 

 image.png

:對(duì)抗AI驅(qū)動(dòng)的威脅與攻擊

DarkTrace 2024年的報(bào)告中一組數(shù)據(jù)揭示了變革的緊迫性:近74%的受訪者表示AI驅(qū)動(dòng)的網(wǎng)絡(luò)威脅對(duì)他們所在的組織已帶來顯著沖擊,60%的受訪者擔(dān)心其所在組織尚未做好充分準(zhǔn)備來應(yīng)對(duì)這類AI驅(qū)動(dòng)的威脅與攻擊。半導(dǎo)體行業(yè)正在通過構(gòu)建多層級(jí)的軟硬件防護(hù)體系,升級(jí)其防御能力。從嵌入在芯片中的加密技術(shù),到經(jīng)AI強(qiáng)化的安全監(jiān)測(cè)系統(tǒng),現(xiàn)代SoC架構(gòu)正不斷加固防線,以抵御傳統(tǒng)攻擊與新一代威脅。

專用計(jì)算的興起催生了對(duì)定制芯片解決方案的空前需求,每種芯片解決方案都針對(duì)特定應(yīng)用進(jìn)行量身打造。這種定制化在顯著提升性能優(yōu)化的同時(shí),對(duì)安全性提出了更高要求。因此,穩(wěn)健的安全框架對(duì)于確保這些專用芯片依然符合嚴(yán)格的保護(hù)標(biāo)準(zhǔn)是必要條件。Arm 推出的PSA Certified 認(rèn)證項(xiàng)目已成為安全芯片設(shè)計(jì)領(lǐng)域的黃金標(biāo)準(zhǔn)。通過對(duì)安全啟動(dòng)、加密服務(wù)以及更新協(xié)議等方面制定全面的要求,PSA 認(rèn)證項(xiàng)目為芯片制造商提供了清晰的路線圖,使其能將安全機(jī)制深植于定制芯片解決方案的基礎(chǔ)架構(gòu)中。

此外,隨著AI從集中式數(shù)據(jù)中心向網(wǎng)絡(luò)邊緣延伸,邊緣計(jì)算不僅是一場(chǎng)技術(shù)革新,它還從根本上改變了我們對(duì)數(shù)據(jù)保護(hù)的思考方式。由于其本地處理能力,邊緣計(jì)算大幅減少了在網(wǎng)絡(luò)中傳輸敏感信息的需求,這種本地化的特性天然地強(qiáng)化了隱私與安全性,并縮小了潛在數(shù)據(jù)泄露的攻擊面。然而,邊緣側(cè)的數(shù)據(jù)保護(hù)需要成熟的硬件解決方案?,F(xiàn)代SoC集成了安全飛地和可信執(zhí)行環(huán)境 (TEE),在芯片內(nèi)部構(gòu)建了加固的數(shù)字保險(xiǎn)庫。這些隔離環(huán)境能夠有效保護(hù)敏感的 AI 運(yùn)算,尤其是推理處理,使其免受未經(jīng)授權(quán)的訪問或篡改。


重構(gòu)計(jì)算邊疆的生態(tài)革命

Arm 在報(bào)告中指出,當(dāng)前行業(yè)正處于一種全新基礎(chǔ)模型范式的關(guān)鍵轉(zhuǎn)折點(diǎn),這不僅會(huì)增加AI推理的復(fù)雜性,還將催生對(duì)更多對(duì)專用CPU架構(gòu)的需求。AI時(shí)代,AI工作負(fù)載正在改變多計(jì)算模塊的需求格局。因此,唯有通過 CPU、GPU、加速器及網(wǎng)絡(luò)等技術(shù)的共生協(xié)作,才能夠最好地滿足這些需求。而Arm計(jì)算平臺(tái)的靈活性讓三大層面的工作得以實(shí)現(xiàn):

1) 異構(gòu)計(jì)算:基于Arm架構(gòu)的CPU正成為GPUTPUAI加速器的理想搭檔——既能高效管理數(shù)據(jù)流和通用計(jì)算任務(wù),又能應(yīng)對(duì)工作流程中遇到的瓶頸。

2) 推理效率:大型AI模型的訓(xùn)練通常依賴高性能GPU,而Arm的高能效處理器則非常適合在端側(cè)和數(shù)據(jù)中心執(zhí)行推理任務(wù)。

3) 可擴(kuò)展性:Arm架構(gòu)支持CPU、GPU與專用加速器的無縫集成,這對(duì)于打造優(yōu)化的AI系統(tǒng)至關(guān)重要。

在這場(chǎng)芯片變革的躍遷中,Arm正以架構(gòu)創(chuàng)新為支點(diǎn),帶動(dòng)整個(gè)計(jì)算產(chǎn)業(yè)的范式重構(gòu)。當(dāng)3D堆疊芯片突破物理限制,當(dāng)開源框架消融生態(tài)壁壘,半導(dǎo)體行業(yè)的游戲規(guī)則已被改寫。正如Kechichian在報(bào)告的結(jié)語中強(qiáng)調(diào):"未來幾年,半導(dǎo)體行業(yè)持續(xù)創(chuàng)新并適應(yīng)AI需求的能力變得至關(guān)重要。唯有通過整個(gè)生態(tài)系統(tǒng)的協(xié)作,我們方能構(gòu)建起必要的技術(shù)基石——既能釋放AI的變革潛力,又能有效管控其計(jì)算成本與復(fù)雜度。"

 




關(guān)鍵詞: Arm 安全 人工智能 AI

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉