_{<span id="m89ij"></span>}

<p id="m89ij"></p>

^{<style id="m89ij"></style>}

新聞中心

EEPW首頁 > 智能計算 > 業(yè)界動態(tài) > 國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

作者：時間：2024-12-27 來源：IT之家

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

收藏

12 月 27 日消息，“深度求索”官方公眾號昨日（12 月 26 日）發(fā)布博文，宣布上線并同步開源 DeepSeek-V3 模型，用戶可以登錄官網 chat.deepseek.com，與最新版 V3 模型對話。

本文引用地址：http://2s4d.com/article/202412/465844.htm

援引博文介紹，DeepSeek-V3 是一個 6710 億參數(shù)的專家混合（MoE，使用多個專家網絡將問題空間劃分為同質區(qū)域）模型，激活參數(shù) 370 億，在 14.8 萬億 token 上進行了預訓練。

多項評測成績超越 Qwen2.5-72B 和 Llama-3.1-405B 等開源模型，性能比肩 GPT-4o 和 Claude-3.5-Sonnet 等世界頂尖閉源模型。

國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

該模型在知識、長文本、代碼、數(shù)學和中文等方面均取得顯著進步，尤其在算法代碼和數(shù)學方面表現(xiàn)突出，生成速度提升至 60 TPS，相比 V2.5 提升了 3 倍。

官方開源了原生 FP8 權重，并提供 BF16 轉換腳本，方便社區(qū)適配和應用。SGLang、LMDeploy、TensorRT-LLM 和 MindIE 已支持 V3 模型推理。

DeepSeek-V3 更新上線的同時，DeepSeek 還調整了 API 服務價格，模型 API 服務定價也將調整為每百萬輸入 tokens 0.5 元（緩存命中）/ 2 元（緩存未命中），每百萬輸出 tokens 8 元。

國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

官方還決定為全新模型設置長達 45 天的優(yōu)惠價格體驗期：即日起至 2025 年 2 月 8 日，DeepSeek-V3 的 API 服務價格仍然會是大家熟悉的每百萬輸入 tokens 0.1 元（緩存命中）/ 1 元（緩存未命中），每百萬輸出 tokens 2 元，已經注冊的老用戶和在此期間內注冊的新用戶均可享受以上優(yōu)惠價格。

國產大模型 DeepSeek-V3 開源：6710 億參數(shù)自研 MoE，性能和 GPT-4o 不分伯仲

<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=114&cb=INSERT_RANDOM_NUMBER_HERE&n=a7a83b30' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=115&cb=INSERT_RANDOM_NUMBER_HERE&n=a3d98779' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=116&cb=INSERT_RANDOM_NUMBER_HERE&n=abca108c' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=117&cb=INSERT_RANDOM_NUMBER_HERE&n=a1775170' border='0' alt='' /></a>
<a target='_blank'><img src='https://ad.eepw.com.cn/www/delivery/avw.php?zoneid=118&cb=INSERT_RANDOM_NUMBER_HERE&n=a449048b' border='0' alt='' /></a>

關鍵詞： DeepSeek-V3 AI 大語言模型 人工智能

評論

相關推薦

在 WWDC 25 上，蘋果應該就 AI 不足和訴訟向開發(fā)者進行賠償

智能計算 WWDC Apple 人工智能 | 2025-06-09

有簡單人工智能的溫度控制電路圖

設計方案簡單人工智能溫度控制電路圖 | 2010-09-01

ADI公司：工業(yè)4.0——人工智能的端

視頻 ADI 人工智能工業(yè)4.0 | 2019-11-08

ew430,v3,10A 詢問哪里有ew430 v3.10A 下載

jackwang | 2006-09-17

WTC-AI太陽能熱水器電路圖

設計方案 WTC-AI 太陽能熱水器電路圖 | 2012-07-24

微軟X英特爾黑客松大賽

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-27

人工智能與機器人

視頻物聯(lián)網可穿戴設備智能硬件高峰論壇機器人人工智能 | 2015-01-19

小米汽車業(yè)務虧損收窄，預計下半年實現(xiàn)盈利

小米智能電動汽車 AI YU7 輔助駕駛 | 2025-06-05

自供電人工突觸模擬人類色覺

智能計算機械視覺人工智能 | 2025-06-04

Altium發(fā)布M16C v3.1r1 開發(fā)工具

taishij | 2005-09-30

星云智聯(lián)發(fā)布S1400系列AI智算高速互聯(lián)網卡

智能計算星云智聯(lián) 高速互聯(lián)網卡 DeepSeek AI訓推 | 2025-06-10

Actel FlashPro v3.1----User’s Guide（Actel）

資源下載 Actel FlashPro v3.1 User’s Guide | 2007-02-28

[分享]I-LOGIX.STATEMATE.V3.2-RORISO

amine | 2003-11-06

IAR,Embedded,Workbench,IDE,V3,20A 關于IAR Embedded Workbench IDE V3.20A的疑問

jackwang | 2006-09-17

臺積電2nm良率曝光

臺積電 2nm AI 蘋果晶圓 | 2025-06-05

MedWin V3.0Beta2集成開發(fā)環(huán)境

資源下載集成開發(fā)環(huán)境 MedWin V3.0Beta2 | 2007-03-20

WinRAR V3.61 簡體中文版

yuiqtoi | 2006-12-27

簡單人工智能的溫度控制電路

設計方案簡單人工智能溫度控制 | 2009-07-06

普林斯頓大學用AI進行無線芯片設計

智能計算 AI 無線芯片設計 | 2025-06-05

AI網絡架構或將進入“無交換機”時代

AI 網絡架構交換機 | 2025-06-12

WinDraft SCH v3.12 電路圖設計軟件

資源下載電路圖設計軟件 WinDraft SCH v3.12 | 2007-02-28

有簡單人工智能的溫度控制電路

設計方案簡單人工智能溫度控制 | 2009-09-01

PADS Power-Logic V3.5 中文教程

資源下載 PADS Power-Logic V3.5 教程 | 2007-03-07

人工智能與無人機的組合如何撕開俄空天軍的 “核心“

智能計算無人機人工智能機械視覺 | 2025-06-06

西門子MicroWin V3

資源下載西門子 SIMATIC MicroWin V3 | 2007-02-09

AI PC新突破端側首次支持128K上下文窗口實現(xiàn)2.2倍推理優(yōu)化

智能計算 AI PC 推理優(yōu)化面壁英特爾 | 2025-06-09

個人-窗口衛(wèi)士項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

英偉達CSO：美國AI禁令讓中國搶走大量AI研發(fā)人才

英偉達 AI | 2025-06-10

具有人工智能的溫度控制電路圖

設計方案具有人工智能溫度控制電路圖 | 2012-07-24

個人-口罩識別系統(tǒng)項目采訪

視頻英特爾微軟黑客松人工智能 OpenVINO | 2021-07-28

焦點

推薦視頻

技術專區(qū)

關閉

<source id="5vwkn"></source>