英特爾可變顯存技術(shù)讓32GB內(nèi)存筆記本流暢運行Qwen 30B參數(shù)大模型
近日,阿里通義千問發(fā)布了兩款新版本30B(300億參數(shù))MoE大模型——Qwen3-30B-A3B-Instruct-2507 和 Qwen3-Coder-30B-A3B-Instruct。在搭載英特爾? 酷睿? Ultra 200H處理器和32GB內(nèi)存的AI PC上,英特爾可變顯存技術(shù)(Intel Variable VRAM Technology)可以將VRAM分配比例從57%提升到87%1,從而更加流暢地運行這兩款大模型,為本地部署注入新活力的同時,帶來“更聰明”的AI應用體驗。AI PC智能助手Flowy AI率先實現(xiàn)了這兩款模型的適配并開放下載,用戶可即刻下載體驗。
智能內(nèi)存管理,動態(tài)按需分配
英特爾可變顯存技術(shù)適配了 MoE 架構(gòu)模型在專家節(jié)點切換時的顯存波動特點,通過在軟件層面的調(diào)優(yōu),實現(xiàn)了突破性的高顯存分配率。該技術(shù)的核心在于其深度優(yōu)化的、基于預留內(nèi)存的動態(tài)調(diào)度機制,它打破了傳統(tǒng)核顯顯存固定分配的限制,實現(xiàn)了VRAM(顯存)的動態(tài)調(diào)節(jié)和高效利用。在搭載英特爾酷睿Ultra 200H處理器和32GB內(nèi)存的AI PC上,用戶只需簡單操作,即可將系統(tǒng)內(nèi)存的默認VRAM分配比例從57%提升到87%1。這意味著,一臺配備 32GB 內(nèi)存的筆記本設備,可使用的VRAM能夠從目前市面通用的18GB提升到27GB。這一顯著提升,進一步拓寬了PC端運行大模型的能力邊界,讓超過20B參數(shù)的大模型和復雜的AI應用也能順暢運行,為用戶帶來更強大的AI體驗。
用戶可以在英特爾官網(wǎng)下載并安裝最新版的顯卡驅(qū)動程序( 32.0.101.6972 或以上版本),再通過 Intel Graphics Software 控制面板自定義設定顯存比例,實現(xiàn)VRAM的動態(tài)調(diào)節(jié)。同時,該技術(shù)還針對酷睿Ultra 200H平臺的硬件特性,對預留內(nèi)存的讀寫路徑進行了深度優(yōu)化,通過提升內(nèi)存帶寬利用率和減少數(shù)據(jù)交換延遲,確保大模型在高占比預留內(nèi)存調(diào)用時仍能保持流暢運行。
30B參數(shù)大模型輕松“裝進口袋”,Flowy率先適配
目前,英特爾生態(tài)合作伙伴 Flowy AI 已率先完成英特爾可變顯存技術(shù)的驗證,在其 Flowy AI PC 軟件中集成了 Qwen3-30B-2507 和 Qwen3-Coder-30B 兩款模型。得益于英特爾可變顯存技術(shù),現(xiàn)在用戶僅憑一臺輕薄本,就能將 30B參數(shù)大模型 “裝進口袋”,隨時隨地享受高效的本地 AI 服務。實際測試結(jié)果顯示,在搭載英特爾酷睿Ultra 9 285H 處理器及 32GB 內(nèi)存PC上,這兩款 30B 參數(shù)大模型均可流暢運行,不僅支持 Q4、Q5、Q6 等更高精度的量化版本,還能實現(xiàn)毫秒級響應的離線交互,讓用戶無需再依賴高性能獨顯或云端算力,即可實現(xiàn)隨時互聯(lián)的移動辦公和離線創(chuàng)作等豐富應用,以更低的成本部署成本,享受本地AI帶來的精彩體驗。
注釋:
1. 數(shù)據(jù)來源于英特爾支持可變顯存的顯卡驅(qū)動32.0.101.6972注釋https://downloadmirror.intel.com/861295/ReleaseNotes_101.6972.pdf
評論