并行計(jì)算的興起:為什么GPU將在邊緣AI領(lǐng)域超越NPU
人工智能 (AI) 不僅僅是一項(xiàng)技術(shù)突破,它還是軟件編寫、理解和執(zhí)行方式的永久演變。建立在確定性邏輯和大部分順序處理之上的傳統(tǒng)軟件開(kāi)發(fā)正在讓位于一種新的范式:概率模型、訓(xùn)練有素的行為和數(shù)據(jù)驅(qū)動(dòng)的計(jì)算。這不是一個(gè)轉(zhuǎn)瞬即逝的趨勢(shì)。AI 代表了計(jì)算機(jī)科學(xué)的根本性和不可逆轉(zhuǎn)的轉(zhuǎn)變 — 從基于規(guī)則的編程到基于學(xué)習(xí)的自適應(yīng)系統(tǒng),這些系統(tǒng)越來(lái)越多地集成到更廣泛的計(jì)算問(wèn)題和功能中。
本文引用地址:http://2s4d.com/article/202506/471575.htm這種轉(zhuǎn)變需要對(duì)為其提供支持的硬件進(jìn)行相應(yīng)的更改。在 AI 架構(gòu)和算法不斷變化的世界中(現(xiàn)在和將來(lái)),為狹義定義的任務(wù)構(gòu)建高度專業(yè)化芯片的舊模型不再可擴(kuò)展。為了滿足 AI 不斷變化的需求(尤其是在邊緣領(lǐng)域),我們需要與它們運(yùn)行的工作負(fù)載一樣具有動(dòng)態(tài)性和適應(yīng)性的計(jì)算平臺(tái)。
這就是為什么通用并行處理器 (GPU) 正在成為邊緣 AI 的未來(lái),取代了神經(jīng)處理單元 (NPU) 等專用處理器。這不僅僅是性能問(wèn)題,還關(guān)乎靈活性、可擴(kuò)展性以及與軟件本身未來(lái)的一致性。
牧本波和靈活性的回歸
要理解這種轉(zhuǎn)變,我們只需要看看 Makimoto 的 Wave,這是 Hitachi 的 Tsugio Makimoto 提出的一個(gè)概念。它描述了計(jì)算中標(biāo)準(zhǔn)化和定制化之間隨時(shí)間推移的波動(dòng) - 由市場(chǎng)需求、技術(shù)創(chuàng)新和軟件復(fù)雜性的變化驅(qū)動(dòng)。
(Makimoto 的 Wave 顯示了計(jì)算中優(yōu)先級(jí)波動(dòng)的歷史模式——從靈活性到專業(yè)化,然后再回到。AI 目前的發(fā)展軌跡標(biāo)志著向靈活性和通用平臺(tái)的回歸。
此模型直接映射到 AI 硬件的演變。在 AI 的早期,當(dāng)工作負(fù)載定義明確且穩(wěn)定時(shí),NPU 和其他固定功能加速器是有意義的。它們針對(duì)特定任務(wù)進(jìn)行了高度優(yōu)化,例如使用 CNN 進(jìn)行圖像分類或?qū)ο髾z測(cè)。
但現(xiàn)在,AI 正在迅速發(fā)展。我們已經(jīng)超越了簡(jiǎn)單的靜態(tài)模型,進(jìn)入了混合網(wǎng)絡(luò)、基于 transformer 的架構(gòu)、基礎(chǔ)模型和持續(xù)創(chuàng)新的時(shí)代。為去年的 AI 定制的硬件根本無(wú)法跟上這種速度。
我們?cè)俅翁幱?Makimoto 的拐點(diǎn) — 從專業(yè)化重新轉(zhuǎn)向通用計(jì)算,作為可擴(kuò)展、適應(yīng)性強(qiáng)的解決方案。
AI 是一個(gè)并行計(jì)算問(wèn)題,而不是一個(gè)專門的問(wèn)題
AI 從根本上說(shuō)是一個(gè)并行性問(wèn)題。深度學(xué)習(xí)在很大程度上依賴于并發(fā)運(yùn)算(矩陣數(shù)學(xué)、張量乘法、向量運(yùn)算),這正是 GPU 最初構(gòu)建的工作負(fù)載類型。為同時(shí)渲染數(shù)百萬(wàn)像素而開(kāi)發(fā)的架構(gòu)現(xiàn)在非常適合同時(shí)處理數(shù)百萬(wàn)個(gè)神經(jīng)元激活,這并非巧合。
如今的通用 GPU 已經(jīng)遠(yuǎn)遠(yuǎn)超越了其圖形根源。借助可編程管道、計(jì)算著色器和越來(lái)越以 AI 為中心的設(shè)計(jì),GPU 現(xiàn)在可以加速傳統(tǒng)和新興工作負(fù)載,為邊緣 AI 提供強(qiáng)大、靈活的引擎。
相比之下,像 NPU 這樣的專業(yè)處理器很難在快速變化中保持相關(guān)性。它們針對(duì)特定作進(jìn)行了優(yōu)化,當(dāng) AI 世界不斷向前發(fā)展時(shí),這些芯片很快就會(huì)過(guò)時(shí)。很明顯,隨著這種新型軟件的不斷發(fā)展,它需要一個(gè)靈活的通用并行硬件平臺(tái)來(lái)支持它,即 GPU。
為什么通用型在邊緣
邊緣 AI 需要的不僅僅是性能。它需要適應(yīng)性、可重用性和使用壽命?,F(xiàn)代 GPU 等通用并行處理器可在各個(gè)方面提供:
靈活性:可以編程以運(yùn)行新的模型類型,而無(wú)需更改硬件。
可擴(kuò)展性:適用于各種邊緣設(shè)備,從 IoT 傳感器到智能攝像頭和自動(dòng)駕駛汽車。
軟件生態(tài)系統(tǒng):由成熟、開(kāi)放的開(kāi)發(fā)工具和標(biāo)準(zhǔn)(例如 OpenCL、LiteRT 和 TVM)提供支持。
可持續(xù)性: 延長(zhǎng)產(chǎn)品生命周期并減少對(duì)不斷重新設(shè)計(jì)芯片的需求。
簡(jiǎn)而言之,通用并行計(jì)算 (GPU) 自然而然地是為了與 AI 一起發(fā)展而構(gòu)建的。
展望未來(lái)
盡管證據(jù)越來(lái)越多,但市場(chǎng)仍然傾向于將 AI 加速與 NPU 和定制芯片聯(lián)系起來(lái)。但是,正如圖形行業(yè)認(rèn)識(shí)到固定功能管道無(wú)法跟上游戲創(chuàng)新的步伐一樣,AI 行業(yè)也發(fā)現(xiàn)固定硬件無(wú)法與流暢的軟件相提并論。
是時(shí)候重新教育生態(tài)系統(tǒng)了。邊緣 AI 的未來(lái)并不在于狹隘優(yōu)化的芯片。它是關(guān)于可編程、適應(yīng)性強(qiáng)的并行計(jì)算平臺(tái),這些平臺(tái)可以根據(jù)智能軟件的需求進(jìn)行增長(zhǎng)和擴(kuò)展。
牧本幾十年前就看到了。今天,我們正在踐行他的見(jiàn)解 — 乘著一股浪潮回歸到通用靈活性。GPU 不僅在迎頭趕上;它已經(jīng)處于領(lǐng)先地位。
Dennis Laudick 是 Imagination Technologies 的產(chǎn)品管理副總裁。在加入 Imagination Technologies 之前,Dennis 在 Arm 的汽車、AI 和 GPU 部門擔(dān)任過(guò)超過(guò) 13 年的各種產(chǎn)品和營(yíng)銷領(lǐng)導(dǎo)職務(wù)。在此之前,他曾在多家領(lǐng)先的半導(dǎo)體和 OEM 公司擔(dān)任高級(jí)職位。Imagination 本月推出了面向 AI 的 E 系列 GPU 架構(gòu),詳情請(qǐng)見(jiàn)此處。
評(píng)論