新聞中心

EEPW首頁 > 網(wǎng)絡(luò)與存儲 > 業(yè)界動態(tài) > 英特爾宣布實現(xiàn) MLPerf Client 0.6 基準(zhǔn)測試首個全 NPU 支持

英特爾宣布實現(xiàn) MLPerf Client 0.6 基準(zhǔn)測試首個全 NPU 支持

作者: 時間:2025-05-07 來源:IT之家 收藏

5 月 7 日消息,當(dāng)?shù)貢r間 5 月 5 日,宣布成為唯一在 MLPerf Client v0.6 中實現(xiàn)全 支持的企業(yè)。

本文引用地址:http://2s4d.com/article/202505/470141.htm

無標(biāo)題.jpg

表示,該結(jié)果標(biāo)志著行業(yè)首個針對客戶端 的大語言模型(LLM)性能標(biāo)準(zhǔn)化評估。測試數(shù)據(jù)顯示,酷睿 Ultra 200 處理器在 GPU 和 上的輸出速度遠(yuǎn)超人類平均閱讀速度。

英特爾客戶端 PC 產(chǎn)品營銷副總裁兼總經(jīng)理丹尼爾?羅杰斯(Daniel Rogers)表示,“我們很榮幸能夠引領(lǐng)行業(yè),實現(xiàn)客戶端 PC 平臺的全 NPU 加速和領(lǐng)先 GPU 性能?!?/p>

測試配置

AMD英特爾平臺華碩 Zenbook S 16華碩 Zenbook S 14型號UM5606WAUX5406SACPUAMD 銳龍 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306內(nèi)存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz顯卡AMD Radeon 890M英特爾 Arc 140V存儲1TB1TB操作系統(tǒng)Windows 11 專業(yè)版 x64

英特爾表示,在基于 Llama 2 7B 模型的四項內(nèi)容生成與摘要測試中,英特爾在 NPU 和內(nèi)置 Arc GPU 上均展現(xiàn)領(lǐng)先性能:

· 創(chuàng) NPU 最快響應(yīng)速度,首個詞元生成僅需 1.09 秒(首 token 延遲)

· 實現(xiàn) NPU 最高吞吐量 18.55 tokens / 秒

· GPU 首 token 生成速度超越競品

MLPerf Client 由 MLCommons 聯(lián)盟成員(含英特爾、AMD、微軟、英偉達(dá)、高通)聯(lián)合開發(fā),首次突破以 GPU 為核心的測試模式,新增專用 NPU 基準(zhǔn)評估。



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉