英特爾宣布實現(xiàn) MLPerf Client 0.6 基準(zhǔn)測試首個全 NPU 支持
5 月 7 日消息,當(dāng)?shù)貢r間 5 月 5 日,英特爾宣布成為唯一在 MLPerf Client v0.6 基準(zhǔn)測試中實現(xiàn)全 NPU 支持的企業(yè)。
本文引用地址:http://2s4d.com/article/202505/470141.htm英特爾表示,該結(jié)果標(biāo)志著行業(yè)首個針對客戶端 NPU 的大語言模型(LLM)性能標(biāo)準(zhǔn)化評估。測試數(shù)據(jù)顯示,英特爾酷睿 Ultra 200 處理器在 GPU 和 NPU 上的輸出速度遠(yuǎn)超人類平均閱讀速度。
英特爾客戶端 PC 產(chǎn)品營銷副總裁兼總經(jīng)理丹尼爾?羅杰斯(Daniel Rogers)表示,“我們很榮幸能夠引領(lǐng)行業(yè),實現(xiàn)客戶端 PC 平臺的全 NPU 加速和領(lǐng)先 GPU 性能?!?/p>
測試配置
AMD英特爾平臺華碩 Zenbook S 16華碩 Zenbook S 14型號UM5606WAUX5406SACPUAMD 銳龍 AI HX 370酷睿 Ultra 9 288VBIOS 日期2025 年 3 月 21 日2025 年 2 月 26 日BIOS 版本UM5606WA.317UX5406SA.306內(nèi)存32GB LPDDR5,7500MHz32GB LPDDR5,8533 MHz顯卡AMD Radeon 890M英特爾 Arc 140V存儲1TB1TB操作系統(tǒng)Windows 11 專業(yè)版 x64
英特爾表示,在基于 Llama 2 7B 模型的四項內(nèi)容生成與摘要測試中,英特爾在 NPU 和內(nèi)置 Arc GPU 上均展現(xiàn)領(lǐng)先性能:
· 創(chuàng) NPU 最快響應(yīng)速度,首個詞元生成僅需 1.09 秒(首 token 延遲)
· 實現(xiàn) NPU 最高吞吐量 18.55 tokens / 秒
· GPU 首 token 生成速度超越競品
MLPerf Client 由 MLCommons 聯(lián)盟成員(含英特爾、AMD、微軟、英偉達(dá)、高通)聯(lián)合開發(fā),首次突破以 GPU 為核心的測試模式,新增專用 NPU 基準(zhǔn)評估。
評論