國產(chǎn)GPU供不應(yīng)求——國產(chǎn)之光性能超乎想象
國產(chǎn)GPU供不應(yīng)求——國產(chǎn)之光性能超乎想象
本文引用地址:http://2s4d.com/article/202404/457390.htmAI屆春晚—英偉達(dá)GTC大會(huì)在3月召開,B100/B200晶片的亮相,刷新了計(jì)算新速度,隨著人工智能技術(shù)的日新月異,從數(shù)據(jù)處理到算法優(yōu)化,再到應(yīng)用場(chǎng)景的拓展,每一步都可能帶來新的市場(chǎng)機(jī)會(huì)。從智能硬件到云計(jì)算,再到物聯(lián)網(wǎng)等多個(gè)領(lǐng)域,AI技術(shù)的深入應(yīng)用都將成為市場(chǎng)的關(guān)注焦點(diǎn)。AI對(duì)算力的要求是需要大量的并行及重復(fù)計(jì)算,GPU正好有這個(gè)專長,時(shí)勢(shì)造英雄,因此GPU就出山擔(dān)此重任。
臺(tái)積電董事長劉德音預(yù)測(cè):未來 15 年每瓦 GPU 性能提升 1000 倍,GPU 晶體管數(shù)破萬億
就在近期,在一則對(duì)英偉達(dá)CEO黃仁勛的最新專訪中,黃仁勛表示:當(dāng)下我們正處于生成式人工智能革命的開端,機(jī)器人基礎(chǔ)模型可能即將出現(xiàn),新一代GPU性能超乎想象,今年到明年,GPU都會(huì)供不應(yīng)求!
面對(duì)國外的行業(yè)龍頭,國內(nèi)GPU在對(duì)標(biāo)的同時(shí)也在不斷進(jìn)步,縮小與頭部公司的差距,在我看來,GPU 有傳統(tǒng) 2D/3D 圖形渲染 GPU 和專注高性能計(jì)算的GPU兩條主要的發(fā)展路線。隨著國家的政策支持及廠商的大力投入,國產(chǎn)GPU 廠商在圖形渲染 GPU 和高性能計(jì)算 GPGPU 領(lǐng)域上均推出了較為成熟的產(chǎn)品,在性能上不斷追趕行業(yè)主流產(chǎn)品,在特定領(lǐng)域達(dá)到業(yè)界一流水平。在軟件支持方面,國產(chǎn)GPU企業(yè)正在積極與主流操作系統(tǒng)、開發(fā)環(huán)境以及圖形處理軟件等進(jìn)行適配,確保用戶能夠流暢地使用各種應(yīng)用軟件。同時(shí),一些企業(yè)還在推動(dòng)GPU在人工智能、云計(jì)算等新興領(lǐng)域的應(yīng)用,為國產(chǎn)GPU生態(tài)注入新的活力。
生態(tài)方面國產(chǎn)廠商大多兼容英偉達(dá) CUDA,融入大生態(tài)進(jìn)而實(shí)現(xiàn)客戶端導(dǎo)入。
我國移動(dòng)GPU和桌面GPU兩大主要終端應(yīng)用場(chǎng)景市場(chǎng)持續(xù)保持增長。全球GPU的市場(chǎng)已經(jīng)達(dá)到了448億美元,我國約占全球市場(chǎng)規(guī)模的24.7%?;ヂ?lián)網(wǎng)、政府側(cè)、服務(wù)、電信、金融、制造、教育等領(lǐng)域是GPU算力需求較大的領(lǐng)域,目前國產(chǎn)GPU企業(yè)都在積極朝大模型方向布局,包括訓(xùn)練和推理。另外軟件和生態(tài)建設(shè)也在加速推進(jìn)。
AI芯片短缺,業(yè)界:未來中國將發(fā)展自己的高端GPU
沐曦
沐曦于2020年9月成立于上海,致力于為異構(gòu)計(jì)算提供全棧GPU芯片及解決方案,可廣泛應(yīng)用于人工智能、智慧城市、自動(dòng)駕駛、數(shù)字孿生、元宇宙等前沿領(lǐng)域。公司擁有技術(shù)完備、設(shè)計(jì)和產(chǎn)業(yè)化經(jīng)驗(yàn)豐富的團(tuán)隊(duì),核心成員平均擁有近20年高性能GPU產(chǎn)品端到端研發(fā)經(jīng)驗(yàn)。
公司擁有完全自主研發(fā)的GPU IP、指令集和架構(gòu),以及兼容主流GPU生態(tài)的完整軟件棧(MXMACA),產(chǎn)品具備高能效、高通用性。目前已推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計(jì)算,以及MXG系列GPU(曦彩)用于圖形渲染,可滿足數(shù)據(jù)中心對(duì)高能效和高通用性的算力需求。
沐曦?fù)碛心壳皣鴥?nèi)出生于全球頂級(jí)GPU廠商的全建制團(tuán)隊(duì),擁有二十年高性能GPU從設(shè)計(jì)到量產(chǎn)交付的全流程經(jīng)驗(yàn)。作為初創(chuàng)公司,成立一年內(nèi)獲得四輪共數(shù)十億人民幣的融資。2021年8月25日,公司獲得十億人民幣融資,由國調(diào)基金和中網(wǎng)投領(lǐng)投,和利資本、紅杉中國等跟投。通過此輪融資,進(jìn)一步加強(qiáng)了沐曦在高性能GPU領(lǐng)域的研發(fā)投入。
對(duì)標(biāo)英偉達(dá) A100,國產(chǎn)計(jì)算 GPU 沐曦 MXC500 僅用 5 小時(shí)成功點(diǎn)亮
海光信息
海光信息主要從事高端處理器、加速器等計(jì)算芯片產(chǎn)品和系統(tǒng)的研發(fā)、設(shè)計(jì)和銷售。公司的產(chǎn)品包括海光通用處理器(CPU)和海光協(xié)處理器(DCU),具有成熟而豐富的應(yīng)用生態(tài)環(huán)境,內(nèi)置專用安全硬件,可滿足互聯(lián)網(wǎng)、金融、能源等行業(yè)的廣泛應(yīng)用需求。
其系列產(chǎn)品海光 8100 采用先進(jìn)的 FinFET 工藝,以GPU架構(gòu)為基礎(chǔ),兼容通用的“類 CUDA”環(huán)境以及國際主流商業(yè)計(jì)算軟件和人工智能軟件,可充分挖掘應(yīng)用的并行性,發(fā)揮其大規(guī)模并行計(jì)算的能力。
摩爾線程成立于2020年,是一家以全功能GPU芯片設(shè)計(jì)為主的集成電路高科技公司,能夠?yàn)閺V泛的科技生態(tài)合作伙伴提供強(qiáng)大的計(jì)算加速能力,致力于打造為下一代互聯(lián)網(wǎng)提供多元算力的元計(jì)算平臺(tái)。
值得一提的是,摩爾線程的創(chuàng)始人是原NVIDIA全球副總裁、中國區(qū)總經(jīng)理張建中先生。核心創(chuàng)建團(tuán)隊(duì)基本都來自NVIDIA,擁有完整的高端芯片人才團(tuán)隊(duì),全面覆蓋GPU芯片IP研發(fā)、系統(tǒng)軟硬件設(shè)計(jì)、生態(tài)建設(shè)和市場(chǎng)營銷等。
2022年,摩爾線程就推出了GPU統(tǒng)一系統(tǒng)架構(gòu)MUSA,發(fā)布并量產(chǎn)“蘇堤”和“春曉”兩顆全功能GPU芯片,這也是國內(nèi)采用現(xiàn)代GPU架構(gòu),唯一內(nèi)置圖形渲染、視頻編解碼、AI計(jì)算加速、物理仿真、科學(xué)計(jì)算四大引擎的全功能高端GPU芯片。
12月19日發(fā)布的摩爾線程MTT S4000是專為計(jì)算而生的加速卡,基本代表國產(chǎn)計(jì)算卡的領(lǐng)軍水平。從圖中可以看到這款卡的一些基本參數(shù)。其中,F(xiàn)P32(單精)達(dá)到25TFLOPS, FP16(半精)達(dá)到100TFLOPS,片間互聯(lián)達(dá)到240GB/s。作為對(duì)比,NVIDIA的RTX4080的FP16和FP32均為48.74TFLOPS,而H100則達(dá)到了FP16為1979TFLOPS,F(xiàn)P32為67TFLOPS的算力;華為的晟騰910的FP16算力為320TFLOPS。
近日,無問芯穹發(fā)布了“無穹Infini-AI”大模型開發(fā)與服務(wù)平臺(tái),并宣布與摩爾線程達(dá)成深度戰(zhàn)略合作。
國內(nèi)首家:摩爾線程推出 GPU 云桌面產(chǎn)品,支持最高 20 路 1080p 30 幀并發(fā)
壁仞科技
壁仞科技創(chuàng)立于 2019 年,在 GPU、DSA(專用加速器)和計(jì)算機(jī)體系結(jié)構(gòu)等領(lǐng)域具有深厚的技術(shù)積累。公司致力于開發(fā)原創(chuàng)性的通用計(jì)算體系,建立高效的軟硬件平臺(tái),同時(shí)在智能計(jì)算領(lǐng)域提供一體化的解決方案。
2022 年 8 月公司發(fā)布的通用 GPU 芯片 BR100 創(chuàng)下全球通用 GPU 算力記錄,峰值算力達(dá)到國際廠商在售旗艦產(chǎn)品 3 倍以上。BR100 率先采用 Chiplet 技術(shù)、新一代主機(jī)接口PCIe 5.0、支持 CXL 互連協(xié)議,確立了公司在國內(nèi)廠商間的技術(shù)領(lǐng)先地位。公司堅(jiān)持自主研發(fā),同步推出原創(chuàng)架構(gòu)“壁立仞”和自研BIRENSUPA 軟件平臺(tái),實(shí)現(xiàn)了 BR100 性能的大幅提升。
以壁仞科技于 2022 年8 月發(fā)布的首款 GP GPU BR100 為例,該芯片采用 Chiplet 技術(shù),16 位浮點(diǎn)算力達(dá)到 1000T 以上、8 位定點(diǎn)算力達(dá)到 2000T 以上,單芯片峰值算力達(dá)到 PFLOPS級(jí)別,是國際廠商在售旗艦產(chǎn)品的 3 倍以上,創(chuàng)造了全球通用 GPU 的算力記錄。
770億晶體管的中國第一算力通用GPU芯片!壁仞科技BR100亮相海外
壁仞科技首次參與權(quán)威AI評(píng)測(cè)MLPerf 獲多項(xiàng)全球第一
不僅如此,國內(nèi)也有一些廠商,依靠著IP及豐富的產(chǎn)品類型,不斷在GPU領(lǐng)域活躍著。
寒武紀(jì)
寒武紀(jì)是國內(nèi)領(lǐng)先人工智能芯片設(shè)計(jì)企業(yè),搭建廣泛覆蓋終端、云端、邊緣端場(chǎng)景的智能芯片產(chǎn)品體系。公司面向終端、云端、邊緣端三大場(chǎng)景,分別研發(fā)推出終端智能處理器IP(智能處理器的產(chǎn)品級(jí)實(shí)現(xiàn)方案,由核心架構(gòu)、代碼、文檔等組成)、云端智能芯片及加速卡(用于加速特定領(lǐng)域應(yīng)用程序的板卡產(chǎn)品,以計(jì)算芯片為核心部件)、邊緣智能芯片及加速卡等產(chǎn)品,適用于各類智能終端、云服務(wù)器、邊緣計(jì)算設(shè)備等,并為該三類產(chǎn)品,研發(fā)推出統(tǒng)一的基礎(chǔ)系統(tǒng)軟件平臺(tái),為客戶提供豐富芯片產(chǎn)品與系統(tǒng)軟件解決方案,致力構(gòu)建云、邊、端一體的智能生態(tài)。
寒武紀(jì)推出的新款智能加速卡 MLU370-X8/M8、訓(xùn)練整機(jī)玄思 1001智能加速器(MLU-X1001)。首次將雙芯片四芯粒思元370整合在MLU370-X8智能加速卡中,提供了兩倍于標(biāo)準(zhǔn)思元370加速卡的內(nèi)存、編解碼資源,同時(shí)搭載MLU-Link?多芯互聯(lián)技術(shù)。在YOLOv3、Transformer、BERT和ResNet101訓(xùn)練任務(wù)中, 8卡并行平均性能達(dá)350W RTX GPU的155%。
寒武紀(jì)1A、寒武紀(jì)1H應(yīng)用于華為海思等旗艦智能手機(jī)芯片內(nèi),已集成在超過1億臺(tái)智能手機(jī)及其他智能終端中。思元系列芯片及對(duì)應(yīng)加速器產(chǎn)品,已應(yīng)用在中科曙光、浪潮、聯(lián)想等多家廠商的服務(wù)器中?;诖耍井a(chǎn)品輻射互聯(lián)網(wǎng)、云計(jì)算、能源、教育、金融、電信、交通、醫(yī)療等行業(yè),支持人工智能行業(yè)各類中小企業(yè)發(fā)展。
在2023年度中國AI芯片先鋒企業(yè)TOP 30中,寒武紀(jì)入選。寒武紀(jì)入選2023中國AI芯片先鋒企業(yè)TOP30
寒武紀(jì)子公司與中國一汽合作,聚焦智能駕駛芯片研發(fā)與應(yīng)用
寒武紀(jì)入選2022年度人工智能領(lǐng)航企業(yè)TOP50
芯原股份
芯原依托自主半導(dǎo)體 IP,為客戶提供平臺(tái)化、全方位、一站式芯片定制服務(wù)和半導(dǎo)體 IP 授權(quán)服務(wù),擁有獨(dú)特的“芯片設(shè)計(jì)平臺(tái)即服務(wù)”經(jīng)營模式。公司可提供高清視頻、物聯(lián)網(wǎng)連接、數(shù)據(jù)中心等多種一站式芯片定制解決方案,擁有自主可控的圖形處理器 IP、神經(jīng)網(wǎng)絡(luò)處理器 IP 等五類處理器 IP 及 1400 多個(gè)數(shù)模混合 IP 和射頻 IP,可快速打造出從定義到測(cè)試封裝完成的半導(dǎo)體產(chǎn)品,業(yè)務(wù)范圍覆蓋消費(fèi)電子、汽車電子、物聯(lián)網(wǎng)等多種應(yīng)用領(lǐng)域。據(jù) IPnest 在 2021 年的統(tǒng)計(jì),芯原的半導(dǎo)體 IP 銷售收入排中國大陸第二,全球第七,其中公司的圖形處理器 IP 排名全球前三。
公司的GPU IP已被眾多主流和高端的汽車品牌所采用,同時(shí),公司基于約 20年 Vivante GPU 的研發(fā)經(jīng)驗(yàn),所推出的 Vivante 3D GPGPU IP 還可提供從低功嵌入式設(shè)備到高性能服務(wù)器的計(jì)算能力,滿足廣泛的人工智能計(jì)算需求。
芯原攜最新的高效能IP應(yīng)用亮相2024年國際嵌入式展
賽昉基于RISC-V的JH-7110智能視覺處理平臺(tái)采用了芯原的顯示處理器IP
嘉楠基于RISC-V的端側(cè)AIoT SoC采用了芯原的ISP IP和GPU IP
近些年國產(chǎn)GPU正在蓬勃發(fā)展,不過相較于國際巨頭,仍然存在較大差距。近年來,大模型快速發(fā)展,國產(chǎn)GPU在大模型訓(xùn)練方面的不足也凸顯出來,在大模型訓(xùn)練及軟件和生態(tài)方面都面臨諸多挑戰(zhàn),舉個(gè)例子,多媒體和圖形處理都屬于單精度浮點(diǎn)計(jì)算(FP32)的計(jì)算需求,雙精度浮點(diǎn)計(jì)算能力FP64是進(jìn)行高算力計(jì)算的硬性指標(biāo)。英偉達(dá)的A100同時(shí)具備上述兩類能力,而國內(nèi)大多GPU只能處理單精度浮點(diǎn)計(jì)算。
但在人工智能、物聯(lián)網(wǎng)等多下游領(lǐng)域快速發(fā)展情況下,我國數(shù)據(jù)中心端、云廠商以及智算領(lǐng)域?qū)PU需求也極為旺盛,在中美貿(mào)易戰(zhàn)、全球芯片供應(yīng)不穩(wěn)定的情況下,我國發(fā)展AI行業(yè),形成自主可控的芯片供應(yīng)體系,為國產(chǎn)GPU提供了進(jìn)入市場(chǎng)的機(jī)會(huì)。所以整體看來,國產(chǎn)GPU市場(chǎng)空間還是相當(dāng)廣闊的。
評(píng)論