多家頭部國產GPU企業(yè)的產品,已經開始接受市場的檢驗。作者 | 心緣
編輯 | 漠影
芯東西11月3日報道,剛剛,國產GPU獨角獸企業(yè)摩爾線程推出了基于其自研MUSA架構的多功能GPU芯片MT-春曉,以及國潮顯卡MTT S80、面向服務器的MTT S3000加速卡。
同時,摩爾線程充分展示了其軟硬協同的綜合實力:發(fā)布兼容適配CUDA的MUSA開發(fā)者套件,sGPU 1.0云原生技術,還打造了中國首個元宇宙平臺MTVERSE及眾多軟硬件產品,包括基于MTT S3000打造的MCCX元計算一體機等。MTT S80將在“雙11”期間在京東首發(fā)開售,近期在摩爾線程官方公眾號上可查詢產品購買信息。摩爾線程創(chuàng)始人兼CEO張建中在GPU領域深耕超過15年,曾幫助世界頭部芯片設計公司英偉達開拓并構建GPU在中國大陸的完整生態(tài)體系。觀察到中國GPU的發(fā)展始終與國外存在差距,張建中在2020年10月創(chuàng)辦摩爾線程。今年3月,摩爾線程首次交卷,推出基于自研第一代MUSA架構的GPU蘇堤,以及基于蘇堤的桌面級顯卡及數據中心級產品。(4096核心!摩爾線程推首款服務器GPU產品,還有臺式機顯卡)如今,僅隔7個月,摩爾線程再亮多款新品,并現場演示了40多個基于其多功能GPU的豐富應用,覆蓋PC游戲、AI、數字人、數字孿生、物理仿真、8K多媒體顯示、云游戲、云桌面、數字辦公等場景。會后,摩爾線程CEO張建中、摩爾線程CTO張鈺勃與芯東西等媒體進行深入交流。
01.第二款GPU春曉來了!
首款國潮游戲顯卡支持PCIe Gen5
一開場,張建中首先宣布,摩爾線程PES完美體驗系統聯盟不斷壯大,覆蓋CPU、操作系統、OEM廠商、軟件服務廠商、云服務廠商以及系統軟件開發(fā)商。多款現代化辦公PC系統及人工智能(AI)服務器等產品獲得PES認證。
自今年3月推出摩爾線程首款GPU蘇堤以來,蘇堤光速前進,獲得品高云、首都在線、天翼云、七牛云、紫光云、青云、瑞云渲染、移動云、澤塔云、華云等一眾云計算伙伴的支持。中國移動、中國電信、招商****等行業(yè)用戶,均率先使用摩爾線程的首款GPU蘇堤。
緊接著,張建中宣布推出第二款基于其自研架構MUSA的多功能GPU——MT-春曉。
MT-春曉擁有4086個MUSA核心、128個張量計算核心,在1.8GHz主頻下單精度浮點算力(FP32)可達14.4TFLOPS,INT8算力達到57.6TOPS。該GPU的像素填充率、紋理填充率均達到460Pixel/s,支持PCIe Gen5、GDDR6顯存,顯存帶寬為448GB/s,視頻編解碼方面支持8K、AV1、H.265、H.264和32路1080P@30fps,可支撐7680 x 4320@30Hz的8K顯示輸出。相較“蘇堤”,“春曉”的GPU四大引擎全面升級,整體性能提升在4倍左右。其中圖形渲染能力方面平均提升3倍;編碼能力提升4倍,解碼能力提升2倍;AI計算加速平均提升4倍,物理仿真計算性能提升2.5倍;并引入了新技術支持窄帶高清,節(jié)約帶寬30%以上。
張建中在接受采訪時說,摩爾線程首款GPU蘇堤的目標是與國內計算生態(tài)系統適配,第二款GPU則不僅要滿足國產化需要,還希望能成為主流的GPU產品,參與國際化競爭,并更好地提升國產軟件平臺的用戶體驗。基于MT-春曉GPU,摩爾線程打造了其第一款國潮游戲顯卡MTT S80。
張建中說,MTT S80是國內首款支持Windows環(huán)境、DirectX圖形接口以及PCIe Gen5的顯卡產品,這是一款中高端顯卡,配有16GB超大顯存,支持業(yè)界所有的主流游戲。全球排名前二的廠商花了超過10年的時間來開發(fā)驅動程序,摩爾線程希望用更短時間,去完成看似不可能的事情。研發(fā)設計游戲顯卡難度非常大,其中最難的部分在于開發(fā)Windows驅動程序。由于計算機圖形的專業(yè)性非常強,一套成熟的圖形驅動程序代碼量和一個操作系統的代碼量相當,懂得開發(fā)Windows 驅動的人才也非常稀有。因此,所有GPU公司,都會面臨在短時間內開發(fā)優(yōu)秀的Windows驅動程序、完美支持DirectX不同版本的巨大挑戰(zhàn)。經過工程師的努力,今天,摩爾線程推出MUSA DirectX 1.0,已經支持20多款PC游戲,測試用例超過100萬,頂住了12小時循環(huán)壓力測試。
MTT S80的Windows驅動目前已經內置了MUSA DirectX Driver模塊,并已完成對《暗黑破壞神3》、《英雄聯盟》和《穿越火線》等數十款主流游戲的適配。“路再長,走下去必能到達?!睆埥ㄖ姓劦溃柧€程計劃在一年之內,開發(fā)出世界一流的DirectX驅動程序,去滿足用戶對性能的需求。其終極目標是完成DirectX完整功能研發(fā),讓它支持當前的主流游戲及和圖形工作的工作站軟件。摩爾線程現場演示了用MTT S80玩《暗黑破壞神3》和《極品飛車》,整個過程都很穩(wěn)定流暢。
當前摩爾線程正在與Unreal和Unity等游戲引擎開發(fā)商,以及騰訊游戲、網易游戲、西山居、完美世界、360游戲等國內頂尖游戲開發(fā)商展開深度合作,以便對游戲引擎和游戲產品提供更好更快的支持,使得玩家可以獲得持續(xù)更新的3A級游戲體驗。
通過MTSS時空超分辨率技術,MTT S80支持用低分辨率原始圖像重構高分辨率成像,性能超越原生分辨率渲染。
此外,摩爾線程還發(fā)布了PES控制中心,允許用戶管理、監(jiān)控圖形顯卡的運行狀態(tài),可在游戲內實時顯示幀率、GPU負載等信息,并可以設置分辨率、顏色、實現游戲中“一鍵截圖”等。
對游戲性能進行優(yōu)化,通常需要圍繞硬件、計算、訪存、調度和系統等幾個維度來開展,離不開研發(fā)資源和時間的投入。通過驅動軟件的優(yōu)化,性能可以得到大幅提升,但這需要大量時間和資源的投入,還需要和廣泛的游戲開發(fā)者進行深度合作。張建中說,GPU的軟件生態(tài)打造,是比產品研發(fā)還要挑戰(zhàn)的事情,是一項長期的事業(yè)。
02.面向服務器的MTT S3000:訓推一體 兼容CUDA
傳統GPU叫圖像處理器,最早主攻圖形渲染,負責“成像”,是游戲、設計領域的主力;后來GPU在并行計算方面的“天賦”被挖掘,開始拓展邊界,逐步發(fā)展成加速AI及高性能計算的一大主流算力底座。隨著全社會對算力的需求持續(xù)暴漲,GPU的長期市場空間相當可觀。今日發(fā)布的MT-春曉GPU,便是一款多功能計算平臺,集成了視頻編解碼、AI訓練及推理、物理仿真與科學計算等豐富的引擎。除了游戲顯卡外,摩爾線程也基于MT-春曉打造了面向服務器的計算平臺MTT S3000,亮點是同時兼顧AI訓練和推理。
這是目前GPU行業(yè)中首款支持PCIe 5.0標準的產品,可為AI推理和訓練、云游戲、云渲染、視頻云、數字孿生、數字內容創(chuàng)作等提供算力支持。面向服務器的MTT S3000包含了4096個MUSA流處理核心及128個專用張量計算核心,晶體管規(guī)模達到220億,GPU核心頻率為1.9GHz,顯存位寬256bit,搭配32GB GDDR6顯存。
MTT S3000支持FP32、FP16、INT8等多種計算精度,其中FP32算力可達15.2TFLOPS,支持DirectX、OpenGL、Vulkan、OpenCL等主流圖形和計算接口,兼容CUDA,同時支持動態(tài)彈性切分的虛擬化技術和SR-IOV隔離。摩爾線程致力于實現從算法模型到AI應用的端到端全流程覆蓋,可幫助AI開發(fā)者實現從算法到應用的高效部署。
AI訓練方面,MTT S3000提供有龐大的預訓練模型庫,并支持TensorFlow、PyTorch、百度飛槳等主流AI框架,并實現了對Transformer、CNN、RNN等數十類AI模型的優(yōu)化。
AI推理方面,MTT S3000覆蓋多種主流AI模型,并與CUDA兼容適配,可實現算法應用無縫遷移,支持已經開發(fā)好的CUDA代碼。以醫(yī)療應用為例,MTT S3000的FP32高精度推理可以支持醫(yī)療領域MONAI推理框架。MTT S3000內置了AI推理引擎Tensor X,AI應用性能相比“蘇堤”可平均提升4倍。
OpenMMLab、潞晨科技、百度飛槳、計圖、智源研究院都是MUSA AI戰(zhàn)略合作伙伴。
在GPU生態(tài)中,軟件是舉足輕重的存在,開發(fā)門檻很高。而要讓好的軟件與應用得以在GPU上發(fā)揮作用,不僅需要工程師的努力,還需廣大用戶和游戲愛好者的支持。為此,摩爾線程打造了MUSA軟件棧,從下往上包含四大引擎的驅動程序、MUSA開發(fā)套件和應用領域開發(fā)套件,為開發(fā)者提供了多種強大的編程開發(fā)工具。
其中,應用層面開發(fā)套件有各種庫來滿足不同行業(yè)的應用。無論是初學者還是有經驗的開發(fā)者,都能使用地得心應手。
MUSA與CUDA兼容適配,通過自動化工具,可以很方便地將同一段CUDA應用代碼移植到MUSA上,在開發(fā)上也照顧了現有的用戶習慣。從現場演示來看,MUSA上的運行結果與CUDA平臺基本上完全一致。
總的來說,摩爾線程今日發(fā)布的MUSA軟件系列涵蓋平臺軟件、計算加速軟件,以及云計算及應用軟件,并打造了開發(fā)者網站來為開發(fā)者提供全方位的技術與資源支持。
云是GPU的一大應用場景。張建中說,據不完全統計,去年云端數據中心新增算力中,有90%都來自GPU。其中,容器化和虛擬化技術對于提升GPU資源利用率非常重要。為此,摩爾線程發(fā)布一系列基于摩爾線程創(chuàng)新性MT Mesh 2.0的GPU云原生方案。MT Mesh 2.0可根據云端中心應用負載,自動化分配GPU計算和顯存資源,實現GPU算力彈性伸縮。
其云原生sGPU 1.0技術可原生支持Kubernetes生態(tài),支持GPU彈性切分調度、容器共享與安全隔離以及自動化運維,并能通過使用GPU安卓容器透傳技術和渲染編碼一體化技術,加速安卓云手機解決方案,減少應用延遲,增加并發(fā)路數。現場,摩爾線程進行了云桌面實機演示,通過虛擬化技術,將單個物理GPU切分成多個虛擬GPU,能夠同時運行不同類型的云桌面應用,從而滿足對算力資源更靈活多樣化的需求。
愛特云翔、百度智能云等都是摩爾線程的云桌面合作伙伴。
摩爾線程還宣布將與騰訊先鋒一起打造基于MUSA架構的云游戲解決方案ACX,并與蔚領時代、硅基大陸合作云游戲解決方案。
03.打造中國首個元宇宙平臺元計算一體機開箱即用
元宇宙是以圖形和AI計算為核心基石的集成式應用,物理引擎、渲染引擎和AI技術的發(fā)展很大程度上決定了元宇宙的應用演進步伐。張建中告訴芯東西,摩爾線程將下一代互聯網視作主戰(zhàn)場,長期研發(fā)方向是提供元宇宙計算的核心技術。元宇宙有3個關鍵要素:場景、內容、人,摩爾線程便圍繞此打造了核心軟硬件技術。今天,摩爾線程推出了中國首個元宇宙平臺MTVERSE,并宣布關于面向“場景”的物理仿真引擎AlphaCore、面向“內容”的AI內容創(chuàng)作平臺MT馬良、面向“人”的DIGITALME數字人平臺的一系列升級。
MTVERSE元宇宙平臺以摩爾線程MUSA GPU集群為算力基礎,為用戶提供計算基礎架構及服務,包括大數據、AI訓練與推理、圖形渲染和物理仿真三大平臺,提供從硬件集群、軟件基礎架構到SDK工具鏈的全棧式解決方案。上層的SDK工具鏈包含智能重建、智能理解、智能交互/仿真等工具,方便開發(fā)者調用數字人、文獻理解、語音識別、視覺識別、自然語義理解、對話交互、物理仿真、AIGC內容生成等功能,縮短開發(fā)周期。同時,摩爾線程獨立設計研發(fā)的多平臺GPU物理仿真引擎AlphaCore升級至2.0版本。其中CatalystFX可做到實時高精度煙火仿真效果,Flood Dynamics能實現逼真的流體模擬仿真,Storm System可進行天氣與云層模擬,Vera Fiber支持多物理場交互。摩爾線程宣布和多家合作伙伴一起打造元宇宙超寫實場景的制作。
當前摩爾線程正與光線云合作打造云原生渲染引擎RaysEngine全場景應用,可支撐超大城市數字孿生渲染、AlphaCore物理仿真深度整合、DIGITALME數字人渲染與AI驅動、8K超高清圖形渲染等。張建中也感謝了摩爾線程的數字孿生合作伙伴。
面向近年爆火的AI應用AIGC智能內容創(chuàng)作,摩爾線程在MTT S3000上研發(fā)生成了其第一個AI內容創(chuàng)作平臺“MT馬良”,支持中英文圖文生成、圖像超分、簡筆畫創(chuàng)作、視頻生成等。
摩爾線程與云南藝術學院合作,共建設計學院AI藝術創(chuàng)作實驗室,開設MT-馬良課程培養(yǎng)設計專業(yè)人才,制作出更好的AI內容生成作品?,F場還展示了云南藝術學院用“馬良”創(chuàng)作的藝術作品。
摩爾線程DIGITALME數字人解決方案也全新升級,構建了完整的數字人生產線:MT-女媧能基于原始圖片進行人臉風格編輯、3D人臉重建,并可以添加人物資產;MT-畫皮可通過單路攝像頭捕捉,支持數字人表情驅動;MT-隨影可通過單路攝像頭進行準確的動作捕捉;MT-隨答是數字人對話系統,適用于智能客服、AI助手、智能座艙等場景。基于此,摩爾線程研發(fā)其第一個數字人MUSA。張建中現場與MUSA進行了流暢的問答對話。
最后,摩爾線程宣布推出MCCX元宇宙一體機,通過軟硬件一體化交付,為用戶提供開箱即用、可滿足不同場景需求的元計算算力。
04.結語:國產GPU正奮起直追,未來可期
作為智算中心建設的關鍵算力基礎設施,GPU能夠為物理世界數字化和數字世界物理化實現提供多元有效算力支撐。而要實現兼顧高刷新率、高分辨率的圖形圖像顯示功能,在設計難度上非常有挑戰(zhàn)性,涉及幾何、像素、光照、紋理映射等大量復雜功能的設計,技術、生態(tài)壁壘森嚴。當前國產GPU性能和生態(tài)建設仍與國際先進水平存在差距,這是客觀事實,但我們也無需妄自菲薄,自主創(chuàng)新不是一步登天的事,至少有一批國產GPU已經在起步的路上。前方是需求龐大的廣闊市場,側方是美國政府的圍追堵截,在復雜外界環(huán)境的重壓之下,無論從產業(yè)前景還是國家安全的角度來看,國產GPU的發(fā)展只會更加堅決。近兩年來,包括摩爾線程在內的多家頭部國產GPU企業(yè)已經陸續(xù)拿出硬件產品,并開始接受市場的檢驗。實力雄厚如英偉達,也曾在教育用戶、培育生態(tài)的路上跋涉多年,實現全面可替代的路途依然艱辛遙遠,奮起直追的國產GPU們,需被給予更多的包容與試煉的機會。
*博客內容為網友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯系工作人員刪除。
模數轉換器相關文章:模數轉換器工作原理