DeepSeek的一次小更新堪比發(fā)布新模型

作者：時(shí)間：2025-03-26 來源：快科技

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

一個(gè)好消息，時(shí)隔倆月， DeepSeek 終于更新了。

本文引用地址：http://2s4d.com/article/202503/468676.htm

就在昨天晚上， DeepSeek 一聲不吭往 Hugging Face 上扔了個(gè) DeepSeek -V3-0324 模型。

模型參數(shù) 6850 億，跟上一個(gè)版本的 V3 （ 6710 億）相差不大，采用 MoE 架構(gòu)，還支持了更開放的 MIT 開源協(xié)議。

根據(jù)官方更新的版本說明， DeepSeek -V3-0324 主要是針對推理能力和前端開發(fā)能力進(jìn)行了加強(qiáng)，寫作風(fēng)格實(shí)現(xiàn)了跟 R1 對齊，另外還有一些其他方面的小優(yōu)化。

DeepSeek的一次小更新堪比發(fā)布新模型

現(xiàn)在打開 DeepSeek 官網(wǎng)，把深度思考模式關(guān)掉就能直接用上 V3-0324 。

不過有一說一，雖然 V3-0324 僅僅只是 V3 的小版本升級，并不是大伙兒期待已久的 V4 或者 R2 ，且官方賬號也沒有發(fā)布任何跟模型有關(guān)的信息。

但也絲毫不妨礙， V3-0324 一上線，就有人說他的代碼能力，直追克勞德。

新版本的模型剛一上傳，就登上了 Hugging Face 的趨勢榜單。

在國外大模型競技場 KCORES 的測評中， V3-0324 的代碼能力得分 328.3 ，超過了普通版的 Claude 3.7 Sonnet 的 322.3 分，接近 Claude 3.7 Sonnet 思維鏈版本的 334.8 分，排名第三。

圖源 @karminski 牙醫(yī)

重點(diǎn)是，排名在前面的模型壓根就沒幾個(gè)開源免費(fèi)的， V3-0324 可謂是一枝獨(dú)秀。

所以在 V3-0324 上線不到一天的時(shí)間里，就已經(jīng)有很多老哥迫不及待上手測評了一波。

這么說吧， V3-0324 在這些人手里，已經(jīng)成了拳打 o3-mini ，腳踢 Claude 3.7 Sonnet 的存在。

經(jīng)典的小球彈跳測試中，這位老哥把 V3-0324 、 o3-mini 和 R1 拉了個(gè)橫評。

DeepSeek的一次小更新堪比發(fā)布新模型

o3-mini 剛開始看著還不賴，但估計(jì)物理沒學(xué)好，外面的六邊形都轉(zhuǎn)到垂直的位置了，球還不知道往下掉。

R1 的表現(xiàn)，也是有些讓人摸不著頭腦。。

相對來說， V3-0324 生成的結(jié)果是表現(xiàn)最好的，這位老哥絲毫不吝嗇對它的夸獎(jiǎng)，說它 “ 表現(xiàn)得像唯一排名第一的非推理模型 ” 。

DeepSeek的一次小更新堪比發(fā)布新模型

讓 V3-0324 生成一個(gè)網(wǎng)頁，模型一口氣寫了 800 多行代碼，運(yùn)行的時(shí)候還沒有出錯(cuò)，這什么實(shí)力不用多說了吧。

DeepSeek的一次小更新堪比發(fā)布新模型

在評論區(qū)底下，有人僅僅下達(dá)了編寫登錄頁面的簡單指令，并沒有任何其他的附加提示，同樣也生成了一個(gè)完整的登錄頁面。

DeepSeek的一次小更新堪比發(fā)布新模型

還說 V3-0324 在編碼上，能跟 Claude 3.7 Sonnet 掰一掰手腕。

更別提其他的模型，性價(jià)比各方面相比下來，現(xiàn)在 OpenAI 的 o1-pro 和 GPT-4.5 ，都已經(jīng)不香了。

DeepSeek的一次小更新堪比發(fā)布新模型

反正看了幾個(gè)網(wǎng)友的測試案例之后，世超對 V3-0324 的前端代碼生成能力，已經(jīng)有了初步的判斷。

但不管咋說，沒親自上過手的東西，咱硬夸也有點(diǎn)心虛。所以這次世超也打算簡單試一試，看看 V3-0324 到底有多能打。

一上來，世超就讓模型做了一個(gè)畫板，提示詞是 “ 幫我用 HTML 代碼構(gòu)建一個(gè)畫板，支持鼠標(biāo)繪制、橡皮擦功能和顏色選擇 ” ，這次出戰(zhàn)的模型是 V3-0324 和普通版 Claude 3.7 Sonnet 。

只能說，這把 Claude 3.7 Sonnet 贏得很徹底。光是有取色器這一點(diǎn)，就甩了 V3-0324 不知道幾個(gè)車尾燈。

更別提 UI 設(shè)計(jì)了， V3-0324 做出來的畫板讓世超不是很有創(chuàng)作的欲望。。。

世超著實(shí)是沒想到，這盆涼水來得這么快，都讓我有點(diǎn)懷疑到底是我的提示詞沒寫好，還是模型有問題了。。。

不過，我后面又繼續(xù)把小球彈跳的提示詞，分別喂給了 DeepSeek-V3-0324 、普通版 Claude 3.7 Sonnet 還有 DeepSeek-V3 。

這下味兒終于對了。V3-0324 生成的結(jié)果確實(shí)牛叉，能很清楚地看到小球在下落觸底的時(shí)候，產(chǎn)生了小幅度的彈跳。

DeepSeek的一次小更新堪比發(fā)布新模型

就是吧，老版本的 V3 壓根沒運(yùn)行起來。。。只能說兩個(gè)版本之間的差距高下立判了。

再來看普通版 Claude 3.7 Sonnet 的結(jié)果，優(yōu)點(diǎn)是底下的轉(zhuǎn)速、重力和摩擦力都是可調(diào)節(jié)的，彈跳看起來也沒什么大問題，但小球有點(diǎn)出畫面了。。。

最后，世超又分別讓 V3 和 V3-0324 生成一個(gè) Saas 登錄頁面，提示詞就一句話，沒有任何的附加信息。

可以看到， V3 的頁面倒是做出來了，但沒什么設(shè)計(jì)可言。

反觀 V3-0324 ，果然就跟官方的版本更新說明一樣，生成的網(wǎng)頁更美觀了。

綜合看下來， V3-0324 的代碼能力相比 V3 確實(shí)有了比較大的提升，而且在一部分測試案例中，也能夠比肩普通版 Claude 3.7 Sonnet 。

但如果要說完全超越 Claude 3.7 Sonnet ，那世超覺著暫時(shí)還不太行。

不過大伙兒也別忘了， V3-0324 在開源這個(gè)賽道里， V3-0324 已經(jīng)算得上能打的了。

而且 DeepSeek 的 API 價(jià)格業(yè)主打的一個(gè)便宜。世超對比了 Claude 3.7 Sonnet 和 V3-0324 的 API 價(jià)格， V3-0324 百萬 tokens 輸入的價(jià)格是 2 元，百萬 tokens 輸出的價(jià)格是 8 元，而同樣的 tokens 數(shù)， Claude 3.7 Sonnet 的輸入和輸出價(jià)格分別是 36.6 元和 108.9 元，價(jià)差最多有 18 倍。