新聞中心

EEPW首頁 > 智能計(jì)算 > 業(yè)界動(dòng)態(tài) > 總參數(shù)量1.2萬億 比R1提升1倍!曝DeepSeek R2將徹底擺脫NVIDIA:全部基于華為芯片

總參數(shù)量1.2萬億 比R1提升1倍!曝DeepSeek R2將徹底擺脫NVIDIA:全部基于華為芯片

作者: 時(shí)間:2025-04-30 來源: 收藏

4月29日消息,年初DeepSeek R1的問世,讓美國圈顫三顫,甚至引發(fā)了NVIDIA的股價(jià)暴跌。如今,更強(qiáng)的DeepSeek R2也要來了。

本文引用地址:http://2s4d.com/article/202504/470057.htm

據(jù)報(bào)道,市場最新爆料,R2大模型將采用更先進(jìn)的混合專家模型(MoE),總參數(shù)量較前代R1提升約1倍,預(yù)計(jì)達(dá)1.2萬億(R1總參數(shù)量為6710億),單位推理成本較GPT-4大減97.4%。

當(dāng)下,中美科技戰(zhàn)、貿(mào)易戰(zhàn)愈演愈烈,NVIDIA H20芯片面臨新一波出口管制。

在DeepSeek R2預(yù)期發(fā)布時(shí)間臨近的情況下,各界高度關(guān)注中國指標(biāo)性大模型在缺乏美國芯片資源下的發(fā)展動(dòng)向。

據(jù)傳,R2規(guī)模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當(dāng),還將結(jié)合更智能的門控網(wǎng)絡(luò)層(Gating Network),進(jìn)而優(yōu)化高負(fù)載推理任務(wù)的性能。

消息指出,R2將徹底擺脫NVIDIA芯片,訓(xùn)練全程均未使用NVIDIA顯卡,全部基于昇騰910B(Ascend 910B)芯片集群平臺(tái),在FP16精度下,計(jì)算性能達(dá)到512 PetaFLOPS,芯片利用率高達(dá)82%,整體性能約為NVIDIA上一代A100集群的91%。

市場預(yù)期,這有望降低中國對(duì)海外高端芯片的依賴,且華為全新的昇騰910C芯片也開始進(jìn)入大規(guī)模量產(chǎn)階段。

成本方面,DeepSeek-R2的單位推理成本較Open旗下的GPT-4大減97.4%。其中,R2輸入每百萬個(gè)字符僅需0.07美元,而輸出每百萬個(gè)字符僅0.27美元。

分析認(rèn)為,R2若如傳聞般強(qiáng)勢,可能再次引發(fā)市場對(duì)AI基礎(chǔ)設(shè)施需求的質(zhì)疑,加上華為AI芯片的國產(chǎn)替代,將對(duì)NVIDIA帶來更大影響。




關(guān)鍵詞: AI 智能計(jì)算 Deepseek

評(píng)論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉