新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 中科馭數(shù)DPU技術開放日

中科馭數(shù)DPU技術開放日

作者: 時間:2024-03-29 來源:EEPW 收藏

一、產(chǎn)業(yè)應用價值及落地情況

本文引用地址:http://2s4d.com/article/202403/457021.htm

·  證券基金行業(yè)

金融信創(chuàng)已步入深水區(qū),由“邊緣替代”邁向“核心替代”。在金融行業(yè),核心交易系統(tǒng)對網(wǎng)絡時延的需求從毫秒級提升到微秒甚至納秒,低時延網(wǎng)絡領域的核心設備長期被國外廠商Solarflare與Mellanox壟斷,時延和安全問題成了制約銀行、證券、期貨等行業(yè)發(fā)展的難點之一,行業(yè)內純軟件的加速方案遭遇瓶頸,超低時延網(wǎng)絡解決方案可有效解決這一難題,并實現(xiàn)完全自主可控。

基于自主研發(fā)的低時延網(wǎng)絡卡構建超低時延網(wǎng)絡,支撐金融交易核心鏈路從底層硬件到上層應用系統(tǒng)具備超低時延、低抖動、完全自主可控等特性,在超低時延網(wǎng)絡領域真正打破壟斷,實現(xiàn)國產(chǎn)升級替代。目前,系列產(chǎn)品已經(jīng)在金融證券領域實現(xiàn)規(guī)模化落地,同時也是上交所天相實驗室、以及申萬宏源、東證期貨等低時延實驗室參與方,助力超過30家金融機構完成核心超低時延系統(tǒng)替換,有力保障金融系統(tǒng)的平穩(wěn)運行。

以國內某頭部證券機構廠商的落地情況為例,低時延網(wǎng)絡DPU卡在部署某金融機構核心交易系統(tǒng)之后,解決了該金融機構交易系統(tǒng)的低時延問題,幫助高頻交易客戶實現(xiàn)交易全鏈路時延優(yōu)化,滿足了核心交易場景下對低時延、低抖動的極致要求。

中科馭數(shù)低時延網(wǎng)絡DPU卡作為證券交易鏈路的關鍵一環(huán),對于證券行業(yè)全國產(chǎn)信創(chuàng)改造至關重要。申萬宏源聯(lián)合中科馭數(shù)等多家軟硬件廠商成立低時延實驗室,針對國內證券機構核心業(yè)務全信創(chuàng)改造的可能性進行了權威實驗測試,全面對比了全信創(chuàng)方案與非信創(chuàng)方案在基礎設施測評、以及業(yè)務系統(tǒng)測評下的不同技術性能表現(xiàn)。測試結果顯示,基于當前性能最優(yōu)的超頻服務器,與Arista7150構成的集成測試環(huán)境中,D廠柜臺在使用中科馭數(shù)網(wǎng)卡時性能表現(xiàn)最佳,柜臺應答全鏈路時延領先17%;相比當前半信創(chuàng)生產(chǎn)環(huán)境,采用華為CE6885 + 鯤鵬920 + 中科馭數(shù)SWIFT-2200N,在全信創(chuàng)環(huán)境下整體提升6%-11%。鏈接參考:https://mp.weixin.qq.com/s/kpA32s8X1oJiFmwy6DKvmQ

隨著信創(chuàng)全面提速和展開,信創(chuàng)云也是當前證券機構上云的重要選擇。東方證券信創(chuàng)云平臺歷時4年多的持續(xù)建設和技術積累,目前已初具規(guī)模。從2023年開始,東方證券開始和中科馭數(shù)接觸,進行相關技術研討和產(chǎn)品的POC測試,嘗試引入低時延技術引入到我們信創(chuàng)云之中。隨著國產(chǎn)DPU卡的引入,進一步優(yōu)化低時延信創(chuàng)云平臺業(yè)務架構,圍繞信創(chuàng)建設和時延優(yōu)化雙重目標,打造一云多芯、超低時延的信創(chuàng)云。“一云多芯” 作為信創(chuàng)產(chǎn)業(yè)鏈承上啟下的關鍵環(huán)節(jié),對下納管多種國產(chǎn)CPU和DPU網(wǎng)絡設備,實現(xiàn)統(tǒng)一調度資源,屏蔽底層差異性;對上兼容各種國產(chǎn)操作系統(tǒng)、國產(chǎn)數(shù)據(jù)庫和各類低時延應用。

·  銀行

在銀行領域,近年來移動互聯(lián)網(wǎng)與金融科技的飛速發(fā)展,銀行數(shù)據(jù)中心的業(yè)務請求數(shù)量以及數(shù)據(jù)處理數(shù)量極速上漲。同時由于金融創(chuàng)新需求,銀行業(yè)開展的的業(yè)務種類也呈現(xiàn)爆發(fā)式增長。這些現(xiàn)狀都對銀行業(yè)的IT基礎設施,尤其是云化設施提出了新的嚴苛挑戰(zhàn)。隨著云原生技術的發(fā)展,其更加輕量的應用部署策略與更加完善的生命周期管理機制,逐漸成為下一代云計算的操作系統(tǒng)基座。同時,隨著數(shù)據(jù)中心網(wǎng)絡帶寬的更新?lián)Q代以及存儲技術的進步,云計算基礎設施消耗的CPU資源逐漸增加。

在此背景下,作為中科馭數(shù)重要客戶的某大型國有銀行希望能借助新興的DPU技術完成下一代云計算系統(tǒng)的驗證與建設,達到降本增效的目的。中科馭數(shù)解決方案可以匹配該銀行的各種應用需求,包括高性能網(wǎng)絡、存儲底座,虛擬機、容器與裸金屬服務器的共池管理,VPC網(wǎng)絡等,可以幫助銀行數(shù)據(jù)中心高效、安全、平穩(wěn)地過渡到云原生業(yè)務架構。

·  云計算

中科馭數(shù)的DPU產(chǎn)品已經(jīng)在某頭部云計算廠商的云數(shù)據(jù)中心中落地?;贒PU的方案使得裸金屬服務的業(yè)務邏輯發(fā)生了明顯變化,可以大大縮短裸金屬服務的交付時間,實現(xiàn)了虛擬網(wǎng)絡功能的全面卸載,也為存算分離相關的多種存儲技術提供了統(tǒng)一的接口。中科馭數(shù)自主研發(fā)的DPU產(chǎn)品不但能夠提升云數(shù)據(jù)中心業(yè)務的性能表現(xiàn),節(jié)省寶貴的算力資源,還可以從根本上消除非國產(chǎn)設備導致的潛在安全風險。

在某大型金融機構的數(shù)據(jù)中心中,DPU的高吞吐和低延遲特性幫助了該數(shù)據(jù)中心高效、安全、平穩(wěn)地過渡到云原生業(yè)務架構,為其打造了更為高效可靠、自主可控的金融交易底座。憑借DPU芯片在新型數(shù)據(jù)中心的落地實踐,中科馭數(shù)相關產(chǎn)品和解決方案獲評新型數(shù)據(jù)中心創(chuàng)新發(fā)展案例。

·  5G通信

中科馭數(shù)是國內三大運營商的硬件合作伙伴,共同探索DPU在5G通信和云計算領域的技術解決方案。在5G通信網(wǎng)絡快速發(fā)展的過程中,算力和網(wǎng)絡融合發(fā)展需要更加綠色高效的數(shù)據(jù)處理硬件加速技術,亟待DPU提升系統(tǒng)性能。DPU將在高性能數(shù)據(jù)處理、低延遲數(shù)據(jù)傳輸、網(wǎng)絡管理、存儲以及安全等基礎設施底層建設發(fā)揮關鍵作用。DPU通過接手CPU不擅長的網(wǎng)絡協(xié)議處理、數(shù)據(jù)加解密等數(shù)據(jù)處理任務,不僅可以提高網(wǎng)絡傳輸效率,而且釋放了CPU算力資源。在新型算力DPU的加持下,能夠提供靈活高效的硬件加速服務,支持云基礎設施層功能卸載,云邊協(xié)同、云網(wǎng)一體都將逐步實現(xiàn)。

聯(lián)通研究院曹暢博士曾在2023中國計算機大會上表示,DPU是銜接計算和網(wǎng)絡兩大領域的重要樞紐,云、網(wǎng)、算協(xié)同,通過資源的深度感知與一體化編排,可以實現(xiàn)算力發(fā)現(xiàn)和跨域互通,打通數(shù)據(jù)與計算節(jié)點的通路。DPU作為網(wǎng)絡和計算的銜接點,可解決數(shù)據(jù)傳輸?shù)摹白詈笠幻住眴栴}。通過DPU可以實現(xiàn)虛擬化層的全卸載和定制化的業(yè)務加速能力,具有更強的可編程能力。

對于未來中國聯(lián)通研究院與中科馭數(shù)的合作,中國聯(lián)通研究院雄燕院長也表達了三點期待:一是在談到未來移動通信研究時,表達了借用DPU技術提供新的高效能硬件加速解決方案的期望。二是認為在引入DPU后,雙方可以為聯(lián)通包括云服務、超算服務等在內的服務體系提供差異化的服務,通過深度融合創(chuàng)新技術為用戶提供更靈活、高效的服務。三是積極探索在算網(wǎng)融合技術的研發(fā)和推廣應用,共建算力網(wǎng)絡生態(tài)。

中國移動云能力中心劉軍衛(wèi)也在2023移動云大會中分享到,中國移動將助力打造國家級自主可控的高性能算力基礎設施,通過布局國產(chǎn)化智算生態(tài)、共建自主GPU+DPU產(chǎn)業(yè)聯(lián)盟、聯(lián)創(chuàng)高性能網(wǎng)絡技術三大舉措,帶動國產(chǎn)化智算產(chǎn)業(yè)成熟發(fā)展,抓住云計算技術定義權,引領云計算市場下一個黃金十年。到2024年,打通DPU、GPU、HPN三大單元,面向大模型場景打造一套全棧自主可控的系統(tǒng)。

 

二、中科馭數(shù)DPU技術開放日解決方案相關簡介

10:00-10:05

開場致辭

10:05-10:20

高性能云原生底座方案

三尺青鋒懷天下,一騎白馬開吳疆 為IaaS服務安裝DPU加速引擎

本方案使用支持RDMA協(xié)議的DPU卡代替?zhèn)鹘y(tǒng)網(wǎng)卡,將RDMA網(wǎng)絡應用于并行文件系統(tǒng),用RDMA高性能網(wǎng)絡替代傳統(tǒng)TCP/IP網(wǎng)絡?;赗DMA協(xié)議零拷貝、內核旁路的特性,大幅降低并行文件系統(tǒng)在數(shù)據(jù)讀寫,數(shù)據(jù)傳輸?shù)臅r延,提高帶寬利用率,進而提升并行文件系統(tǒng)整體性能。同時利用DPU卡上的VirtIO-FS技術,將業(yè)務側host的虛擬化功能卸載至DPU,減少host端CPU的算力損耗。

10:20-10:45

基于DPU的極速服務網(wǎng)格方案 

服務網(wǎng)格化繁為簡,為云原生業(yè)務提供極致時延體驗

本方案將服務網(wǎng)格的sidecar容器集中卸載到DPU卡上執(zhí)行,可以顯著降低服務器CPU的算力消耗。同時,DPU卡對容器網(wǎng)絡CNI進行了硬件卸載,高性能轉發(fā)引擎實現(xiàn)了網(wǎng)絡轉發(fā)功能的加速,從而能夠有效降低業(yè)務時延。該方案支持和原生Istio的無縫對接,對用戶業(yè)務無侵入,可以實現(xiàn)業(yè)務的平滑遷移。

10:45-11:00

高性能國產(chǎn)密碼卸載方案 

自主研發(fā)加解密引擎,助力安全業(yè)務高效運營

本方案通過自主研發(fā)的加解密算力引擎,將加密協(xié)議、密碼算法完全卸載到DPU卡上,突破傳統(tǒng)VPN產(chǎn)品的加解密性能瓶頸,充分釋放主機CPU資源,可以適用于國產(chǎn)化服務器平臺;支持可編程轉發(fā)引擎,實現(xiàn)非VPN場景用戶對指定報文的加解密運算;支持TRNG、SM國密算法及國際算法,滿足國家商密認證技術要求;支持防火墻訪問控制功能,為每臺服務器提供分布式貼身隔離防護,助力安全業(yè)務高效運營。

11:00-11:15

RDMA加速并行文件系統(tǒng)解決方案 

RDMA網(wǎng)絡DPU卡,解鎖存算高速通道

本方案使用支持RDMA協(xié)議的DPU卡代替?zhèn)鹘y(tǒng)網(wǎng)卡,將RDMA網(wǎng)絡應用于并行文件系統(tǒng),用RDMA高性能網(wǎng)絡替代傳統(tǒng)TCP/IP網(wǎng)絡。基于RDMA協(xié)議零拷貝、內核旁路的特性,大幅降低并行文件系統(tǒng)在數(shù)據(jù)讀寫,數(shù)據(jù)傳輸?shù)臅r延,提高帶寬利用率,進而提升并行文件系統(tǒng)整體性能。同時利用DPU卡上的VirtIO-FS技術,將業(yè)務側host的虛擬化功能卸載至DPU,減少host端CPU的算力損耗。

11:15-11:30

證券期貨交易信創(chuàng)低時延網(wǎng)絡解決方案 

異構加速 技術創(chuàng)新   自主安全 時延領先

在證券期貨交易領域,時延關乎收益。隨著國內金融信創(chuàng)快速推進,國內金融機構對國產(chǎn)高性能、低時延網(wǎng)絡方案,有著迫切的需求。

面向證券期貨交易場景,中科馭數(shù)推出了信創(chuàng)低時延網(wǎng)絡解決方案,基于自主研發(fā)并量產(chǎn)的低時延網(wǎng)絡DPU卡KPU SWIFT-2200N和超低時延數(shù)據(jù)處理開發(fā)平臺NDPP,搭配6大國產(chǎn)CPU構建低時延服務器,在系統(tǒng)層兼容各類國產(chǎn)操作系統(tǒng),在應用層廣泛適配多家業(yè)內金融軟件廠商的交易系統(tǒng),從而支撐核心交易業(yè)務從底層硬件到上層軟件,向全信創(chuàng)平臺遷移,同時還能獲取媲美非信創(chuàng)的時延性能。

整體方案,在性能上達到國際領先的水平,完備的生態(tài)為業(yè)務提供端到端的保障,業(yè)內權威機構的認證評測讓方案成為信創(chuàng)示范標桿,馭數(shù)的專業(yè)化交付運維和技術支持讓客戶創(chuàng)新無憂。


 

三、中科馭數(shù)企業(yè)基本情況

·  中科馭數(shù)是DPU新型算力基礎設施領軍企業(yè)

中科馭數(shù)專注于DPU芯片的研發(fā)設計,基于自研KPU芯片架構率先在國內進行了三代DPU芯片研發(fā)。自主研發(fā)的國際領先DPU芯片及系列產(chǎn)品,可以廣泛應用于超低延遲網(wǎng)絡、云和數(shù)據(jù)中心、金融計算、大數(shù)據(jù)處理、5G邊緣計算、高性能計算等場景,助力算力成為數(shù)字時代的新生產(chǎn)力。

發(fā)展至今,中科馭數(shù)從芯片底層架構,到網(wǎng)絡、存儲、計算等上層應用系統(tǒng),已形成深厚的核心技術積累,成長為DPU芯片細分領域內唯一的國家專精特新小巨人企業(yè)、國家高新技術企業(yè)、北京市知識產(chǎn)權試點單位,獲得了多項國家級及省部級科技獎項。中科馭數(shù)牽頭并參與了30余項行業(yè)標準及團隊標準的制定,是DPU標準的重要推動者和參與者。

·  軟硬協(xié)同發(fā)展的技術路線

DPU的研發(fā)基于軟硬協(xié)同的自主研發(fā)技術。芯片設計的核心技術方面,中科馭數(shù)創(chuàng)新性地提出了軟件定義加速器(Software Defined Accelerator)技術路線,自主開發(fā)敏捷異構KPU創(chuàng)新架構,解決DPU芯片設計碎片化的問題,具有軟件定義可配置、低設計成本、計算高效的優(yōu)勢。在芯片軟件生態(tài)方面,中科馭數(shù)自研的DPU軟件開發(fā)平臺HADOS,可兼容多種操作系統(tǒng),大幅降低應用軟件開發(fā)難度。

·  中科馭數(shù)芯片產(chǎn)品及解決方案布局

中科馭數(shù)基于DPU打造超低時延網(wǎng)絡、云原生網(wǎng)絡、智算網(wǎng)絡三大方案,搭建了完善的應用生態(tài),客戶可覆蓋云服務廠商、數(shù)據(jù)中心、運營商、證券基金、銀行等數(shù)字經(jīng)濟領域企業(yè)。

·  中科馭數(shù)生態(tài)建設情況

基DPU軟件開發(fā)平臺HADOS,中科馭數(shù)全面擁抱國產(chǎn)化生態(tài),已與國內6大CPU芯片、12家主流操作系統(tǒng)、9家主流數(shù)據(jù)庫廠商、8家頭部云/云原生廠商、17家TOP級服務器廠商完成兼容性適配。參與10大開源社區(qū)平臺,共同推動技術發(fā)展

四、DPU技術發(fā)展背景

·  DPU已被證明是支撐下一代數(shù)據(jù)中心IaaS及PaaS的重要基礎設施

隨著信息技術的持續(xù)發(fā)展,數(shù)據(jù)中心網(wǎng)絡帶寬從100G邁入400G,甚至將提升至800G或1.6T。然而,作為提供算力的物理載體,受限于通用CPU的結構的馮諾依曼瓶頸、摩爾定律逐漸失效等因素的影響,以CPU為網(wǎng)絡核心的數(shù)據(jù)處理能力難以支持大規(guī)模新型數(shù)據(jù)中心的網(wǎng)絡和數(shù)據(jù)的算力需求。在此背景下,DPU已經(jīng)成為繼CPU、GPU之后未來數(shù)據(jù)中心的第三顆主力芯片。

舉例來說,如果將數(shù)據(jù)中心中的每一臺服務器比喻為一座“城市”,在每個城市人口不斷膨脹,城市間交互需求爆炸式增長的背景下,對比傳統(tǒng)網(wǎng)卡,DPU幫助數(shù)據(jù)中心完成了從“鄉(xiāng)間公路”到“高速鐵路”的轉變。DPU提供的高吞吐、低時延、基礎設施卸載能力,幫助數(shù)據(jù)中心完美的規(guī)避了“信息孤島”問題。未來的技術發(fā)展趨勢將會是高度集成化的片上數(shù)據(jù)中心的模式(Data Center Infrastructure on a chip),即一個GPU、CPU、DPU共存的時代。

·  DPU國內市場規(guī)模巨大

隨著新一代信息技術發(fā)展、算力應用場景不斷涌現(xiàn),數(shù)據(jù)中心需求穩(wěn)步提升,未來國內數(shù)據(jù)中心建設將繼續(xù)加大。根據(jù)2023年《中國數(shù)據(jù)中心產(chǎn)業(yè)發(fā)展白皮書》,預計至 2025 年“十四五”規(guī)劃期末,擬實現(xiàn)數(shù)據(jù)中心機架規(guī)模增長至 1400 萬架,規(guī)??偭糠瓋杀?,總增量投資約 7000 億元。

按服務器規(guī)模預計,未來幾年云與數(shù)據(jù)中心領域每年國內服務器出貨量將維持在500萬臺左右,其中DPU滲透率在10%左右,單臺服務器可以配置一塊到多塊DPU板卡,預計每年DPU需求量將在100萬片左右。

·  政策密集出臺,利好DPU產(chǎn)業(yè)發(fā)展

信創(chuàng)產(chǎn)業(yè)是數(shù)字經(jīng)濟、信息安全發(fā)展的基礎。從國家層面的頂層設計、到地方發(fā)展規(guī)劃,加快建設算力基礎設施的各種重磅政策和方案接連出臺,產(chǎn)業(yè)技術創(chuàng)新受到高度重視。國家十四五規(guī)劃明確將“自主可控”列為制造強國戰(zhàn)略的必要要求。與CPU、GPU芯片一樣,當前國產(chǎn)自主網(wǎng)卡芯片的市場占有率極低。根據(jù)國務院印發(fā)的《新時期促進集成電路產(chǎn)業(yè)和軟件產(chǎn)業(yè)高質量發(fā)展的若干政策》要求,中國芯片自給率要在2025年達到70%。

2023年10月,工信部、中央網(wǎng)信辦、國務院國資委等六部門2023年10月聯(lián)合印發(fā)《算力基礎設施高質量發(fā)展行動計劃》,提出到2025年,算力規(guī)模超過300 EFLOPS,并將數(shù)據(jù)處理器 (DPU) 設為重要任務之一。



關鍵詞: DPU 中科馭數(shù)

評論


技術專區(qū)

關閉