DPU:2023的洪荒之力
日前,華為輪值董事長胡厚崑說道,科技革命經(jīng)過了數(shù)次浪潮,從互聯(lián)網(wǎng)到移動化到云計算、到人工智能,每一輪的變革都給社會帶來了深遠的影響。毫無疑問,今天通用人工智能(AI)正給我們無窮的想象空間,也正帶領(lǐng)我們走進下一個黃金十年。
本文引用地址:http://2s4d.com/article/202307/448786.htm當前,人工智能、大數(shù)據(jù)應(yīng)用進入快速發(fā)展階段,自動駕駛、機器人、AR/VR、元宇宙等應(yīng)用加速落地,傳統(tǒng)數(shù)字基礎(chǔ)設(shè)施難以滿足大模型、多模態(tài)等新型技術(shù)發(fā)展,擁有強大集群算力的新型數(shù)據(jù)中心成為突破人工智能發(fā)展瓶頸的重要基礎(chǔ)。
DPU 作為突破數(shù)據(jù)流量指數(shù)級增長帶來的性能瓶頸的關(guān)鍵技術(shù),通過算力卸載、算力釋放和算力拓展,釋放 CPU 的計算資源,實現(xiàn)任務(wù)加速處理,提升整體計算效率,達到降本增效,產(chǎn)業(yè)賦能價值凸顯。因此,也成為構(gòu)建新型算力基礎(chǔ)設(shè)施的重要基礎(chǔ)部件和下一代芯片技術(shù)競爭的高地。
DPU 也被預(yù)測為 2023 年的十大科技趨勢之一,這份「洪荒之力」發(fā)展的如何呢?
「新貴」是怎樣練成的
有人說,DPU 將成為未來計算的三大支柱之一,未來的數(shù)據(jù)中心標配是:CPU + DPU + GPU。
DPU 最直接的作用是作為 CPU 的卸載(offload)引擎,其效果是給 CPU「減負」?!禗PU 技術(shù)白皮書》主編、中科院計算所研究員鄢貴海作了一個形象比喻,說 DPU 提供了數(shù)據(jù)中心一把「殺雞」的工具,節(jié)省的是 CPU 這把「牛刀」,以釋放 CPU 算力,留給更需要它的業(yè)務(wù)負載。這個比喻也形象地說明了 DPU 這個新貴的定位。
DPU 通過執(zhí)行以下主要功能為現(xiàn)代數(shù)據(jù)中心帶來許多好處:
一、提高處理能力: DPU 減輕 CPU 的網(wǎng)絡(luò)和通信工作負載,從而釋放資源用于應(yīng)用程序處理。
二、提高效率和性能: 通過將處理核心與硬件加速器塊相結(jié)合來大規(guī)模處理以數(shù)據(jù)為中心的工作負載,DPU 可以提高性能并減少延遲。
三、處理復(fù)雜任務(wù)的能力: DPU 旨在處理大型數(shù)據(jù)中心中的數(shù)據(jù)密集型工作負載,支持云環(huán)境或驅(qū)動人工智能、深度學(xué)習(xí)算法和其他數(shù)據(jù)密集型應(yīng)用的超級計算機。
四、能夠滿足數(shù)據(jù)中心不斷增長的需求: 隨著數(shù)據(jù)中心需求的增長和變得更加密集,DPU 可以進行擴展,以適應(yīng)數(shù)量和復(fù)雜性不斷增加的工作負載。此外,DPU 可以添加到現(xiàn)有的硬件基礎(chǔ)設(shè)施中,從而實現(xiàn)靈活且適應(yīng)性強的數(shù)據(jù)中心架構(gòu)。
五、提高可靠性和可用性: DPU 可以通過冗余和高可用性等功能提供更高的可靠性,確保在發(fā)生硬件故障時關(guān)鍵數(shù)據(jù)處理任務(wù)的連續(xù)性。
六、降低成本: DPU 可以通過從 CPU 卸載處理任務(wù)并處理復(fù)雜任務(wù)來降低與管理數(shù)據(jù)中心相關(guān)的總體硬件成本,從而需要更少的硬件組件。
DPU、CPU 和 GPU 之間有什么區(qū)別呢?
首先在功能上,DPU(數(shù)據(jù)處理單元)、CPU(中央處理單元)和 GPU(圖形處理單元)都是計算處理器,各自執(zhí)行不同的功能。CPU 是負責(zé)計算機系統(tǒng)整體運行的主處理器,是計算機的「大腦」。GPU 是用于圖形計算任務(wù)(例如渲染 3D 圖像或視頻)的專用處理器。DPU 是最新的處理器,專門用于以數(shù)據(jù)為中心的工作負載,例如數(shù)據(jù)中心的網(wǎng)絡(luò)、存儲和安全操作。
其次是架構(gòu),CPU 由幾個強大的處理核心組成,這些核心針對串行或順序處理進行了優(yōu)化,這意味著一項又一項任務(wù)。GPU 具有大量針對并行處理(即同時執(zhí)行任務(wù))進行優(yōu)化的更簡單的內(nèi)核。DPU 結(jié)合了處理核心、硬件加速器塊和高性能網(wǎng)絡(luò)接口,可大規(guī)模處理以數(shù)據(jù)為中心的任務(wù)。
另外,CPU 幾乎用于所有計算機設(shè)備,從智能手機到計算機再到服務(wù)器。GPU 經(jīng)常用于游戲電腦。DPU 主要用于數(shù)據(jù)中心。
基于明顯的優(yōu)勢,國外大廠已經(jīng)早早地開始發(fā)展 DPU 了。
2019 年,英偉達以 69 億美元的價格收購以色列網(wǎng)絡(luò)芯片公司 Mellanox,并于同年推出 BlueField-2 DPU,自此拉開 DPU 高速發(fā)展的序幕。
在 2020 年 GPU 技術(shù)大會上,英偉達首席執(zhí)行官黃仁勛推出了名為 BlueField-2 數(shù)據(jù)處理單元 (DPU) 的全新處理器系列。開發(fā)人員可以通過軟件平臺 DOCA SDK 訪問 DPU。DPU 和 DOCA SDK 可與英偉達 GPU 硬件和 CUDA 軟件的強大組合相媲美。
7 月 11 日業(yè)內(nèi)四名知情人士報道,歐盟監(jiān)管機構(gòu)將于本周三批準博通以 690 億美元收購軟件制造商 VMware 的交易。報道稱,歐盟委員會將接受博通的讓步,即 VMware 的軟件將繼續(xù)與競爭對手的硬件兼容。知情人士表示,這一舉措已被證明足以解決歐盟競爭監(jiān)管機構(gòu)的擔(dān)憂,而無需博通出售 VMware 的部分業(yè)務(wù)。
這次的收購如果成功,博通就可以進一步進軍數(shù)據(jù)中心市場,特別是數(shù)據(jù)處理單元(DPU)市場,也稱為智能網(wǎng)絡(luò)接口卡(smartNIC)市場。VMware 也一直在尋找自己的 DPU/smartNIC 市場之路。自 2020 年以來,該公司一直致力于一項名為 Project Monterey 的項目,研究其虛擬化軟件如何與 DPU 配合使用。
2022 年 3 月,高級技術(shù)營銷架構(gòu)師 Dave Morera 對該項目的描述是:「根據(jù) VMware 的蒙特利項目,網(wǎng)絡(luò)流量、分布式防火墻等網(wǎng)絡(luò)進程將被卸載到 SmartNIC(智能網(wǎng)絡(luò)接口卡);這意味著不僅 x86 服務(wù)器的資源被繞過,流量本身也被繞過。蒙特利項目還將促進在 DPU 本身上安裝 ESXi 和 NSX,從而將所需的 CPU 資源從 x86 卸載到 DPU,不僅釋放 x86 上的資源供虛擬機使用,而且還提供額外的安全層」。
除了英偉達之外,下表展示了其他國際廠商的 DPU 產(chǎn)品
國內(nèi) DPU 起勢猛
雖然國內(nèi)廠商在芯片產(chǎn)品化的環(huán)節(jié)與國外一線廠商相比還有差距,但是在 DPU 架構(gòu)的理解上還是有獨到的見解的,而且我國目前在數(shù)據(jù)中心這個領(lǐng)域,無論是市場規(guī)模還是增速,特別是用戶數(shù)量,相較于國外都有巨大的優(yōu)勢。國內(nèi)廠商有望充分利用這一市場優(yōu)勢,加快發(fā)展步伐,在 DPU 這個賽道與國外廠商逐鹿中原。
國內(nèi)廠商在啃的是一塊新的「硬骨頭」。DPU 技術(shù)的特點是燒錢多、周期長、產(chǎn)品面向政企、很難快速上量, 但是技術(shù)壁壘高、客戶黏性強。同時, DPU 是全球新近發(fā)展起來的一項新技術(shù), 不像很多成熟芯片已經(jīng)形成了「西強東弱」的格局, 在 DPU 上中國和西方國家沒有代際差。
也就是說 DPU 是全球新近發(fā)展起來的一種專用處理器。國內(nèi)廠商的一些產(chǎn)品處在從小批量到規(guī)?;瘧?yīng)用的階段, 已經(jīng)有了第一批客戶。當下的任務(wù)是, 保持產(chǎn)品迭代以適應(yīng)用戶需求。同時, 推動產(chǎn)品從小批量到規(guī)?;涞? 再要考慮如何去復(fù)制同類客戶。
然而 DPU 產(chǎn)業(yè)化的挑戰(zhàn)很大, 這包括一些供應(yīng)鏈緊張、人才不足的共性難題, 還有需求碎片化、大量兼容適配的特殊挑戰(zhàn), 目前單顆 DPU 成本較高。
與存儲器、CPU 這種成熟產(chǎn)品不同, 這些芯片已經(jīng)被標準化,國際大廠擁有技術(shù)的、成本的優(yōu)勢, 并善于利用產(chǎn)品的周期性調(diào)整價格, 以驅(qū)逐追趕者。國產(chǎn)的道路是后發(fā)追趕式的, 面臨的競爭非常殘酷。
DPU 未來也會走向標準化。中科馭數(shù)公司的創(chuàng)始人兼 CEO 鄢貴海說:「我們感受到的競爭氛圍更寬松, 而且創(chuàng)新的空間更大, 比如我們正在研究如何將端到端的延遲從 20 微秒降低到 2 微秒, 對于很多技術(shù)點, 各家都有不同的實現(xiàn)方法, 但若這項技術(shù)在國際上已經(jīng)相對成熟, 那國產(chǎn)幾乎沒有空間去創(chuàng)新了, 最緊要的任務(wù)就是趕上國際的水平, 做出一個自主可控的方案?!?/span>
在全球格局尚未形成之前, 國產(chǎn) DPU 需要利用國內(nèi)的資源稟賦和更多國產(chǎn)芯片達成生態(tài)協(xié)同, 并服務(wù)于本土的信息基礎(chǔ)設(shè)施, 在全球角逐一項新技術(shù)的關(guān)鍵窗口期, 探索出一種「中國方案」。
其中「定制化方案」就是國產(chǎn) DPU 很好的發(fā)展方向和布局思路。DPU 是個新興市場,客戶需求還處于粗放階段,各種方案都有適合的應(yīng)用場景。因為玩家不多,客戶需求比較分散,單個廠商無法服務(wù)眾多客戶,因此現(xiàn)階段都能夠通過為客戶進行定制化服務(wù)獲得訂單。
國內(nèi)未來 DPU 的發(fā)展和布局應(yīng)采取一些差異化競爭思路,一方面,加快自主研發(fā) DPU 的進程。不管是處理器架構(gòu)的研發(fā),還是網(wǎng)絡(luò)芯片的研發(fā),都要加快產(chǎn)品的迭代速度。另一方面,在商業(yè)模式上,找一些細分的產(chǎn)品角度進行創(chuàng)新。多與國內(nèi)的云計算、數(shù)據(jù)中心的廠商合作,先進行小批量的產(chǎn)品鋪設(shè),再進行大規(guī)模的布局。
評論