總參數(shù)量1.2萬億比R1提升1倍！曝DeepSeek R2將徹底擺脫NVIDIA：全部基于華為芯片

作者：時(shí)間：2025-04-30 來源：

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

4月29日消息，年初DeepSeek R1的問世，讓美國AI圈顫三顫，甚至引發(fā)了NVIDIA的股價(jià)暴跌。如今，更強(qiáng)的DeepSeek R2也要來了。

本文引用地址：http://2s4d.com/article/202504/470057.htm

據(jù)報(bào)道，市場最新爆料，R2大模型將采用更先進(jìn)的混合專家模型（MoE），總參數(shù)量較前代R1提升約1倍，預(yù)計(jì)達(dá)1.2萬億（R1總參數(shù)量為6710億），單位推理成本較GPT-4大減97.4%。

當(dāng)下，中美科技戰(zhàn)、貿(mào)易戰(zhàn)愈演愈烈，NVIDIA H20芯片面臨新一波出口管制。

在DeepSeek R2預(yù)期發(fā)布時(shí)間臨近的情況下，各界高度關(guān)注中國指標(biāo)性大模型在缺乏美國芯片資源下的發(fā)展動(dòng)向。

據(jù)傳，R2規(guī)模與ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相當(dāng)，還將結(jié)合更智能的門控網(wǎng)絡(luò)層（Gating Network），進(jìn)而優(yōu)化高負(fù)載推理任務(wù)的性能。

消息指出，R2將徹底擺脫NVIDIA芯片，訓(xùn)練全程均未使用NVIDIA顯卡，全部基于昇騰910B（Ascend 910B）芯片集群平臺(tái)，在FP16精度下，計(jì)算性能達(dá)到512 PetaFLOPS，芯片利用率高達(dá)82%，整體性能約為NVIDIA上一代A100集群的91%。

市場預(yù)期，這有望降低中國對(duì)海外高端AI芯片的依賴，且華為全新的昇騰910C芯片也開始進(jìn)入大規(guī)模量產(chǎn)階段。

成本方面，DeepSeek-R2的單位推理成本較OpenAI旗下的GPT-4大減97.4%。其中，R2輸入每百萬個(gè)字符僅需0.07美元，而輸出每百萬個(gè)字符僅0.27美元。

分析認(rèn)為，R2若如傳聞般強(qiáng)勢，可能再次引發(fā)市場對(duì)AI基礎(chǔ)設(shè)施需求的質(zhì)疑，加上華為AI芯片的國產(chǎn)替代，將對(duì)NVIDIA帶來更大影響。

新聞中心

總參數(shù)量1.2萬億比R1提升1倍！曝DeepSeek R2將徹底擺脫NVIDIA：全部基于華為芯片

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

新聞中心

總參數(shù)量1.2萬億 比R1提升1倍！曝DeepSeek R2將徹底擺脫NVIDIA：全部基于華為芯片

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)

總參數(shù)量1.2萬億比R1提升1倍！曝DeepSeek R2將徹底擺脫NVIDIA：全部基于華為芯片