DeepSeek本地部署體驗(yàn) 比想象中有趣
DeepSeek興起以后,本地部署AI大模型逐漸走進(jìn)了大眾視野,對(duì)比云端版本,本地部署的優(yōu)勢很明顯,不需要聯(lián)網(wǎng),告別遇到“服務(wù)器繁忙,請(qǐng)稍后再試”這種問題,而且數(shù)據(jù)庫存在本地,同時(shí)具有隱私性,保護(hù)數(shù)據(jù)安全。
本文引用地址:http://2s4d.com/article/202503/468546.htm因?yàn)镈eepSeek顯著降低了部署成本,使得不少消費(fèi)級(jí)電腦都能輕松玩轉(zhuǎn),變成超級(jí)私人AI助理。不過畢竟需要依靠自身硬件來跑AI大模型,雖然成本降低了不少, 但也不是沒有門檻,只不過相對(duì)較低一些。
目前DeepSeek開源特性,開發(fā)者跑出了五花八門的模型,專業(yè)名詞叫蒸餾模型,這些蒸餾模型有些專門為低配電腦訓(xùn)練,讓入門級(jí)硬件也能跑本地部署AI大模型,不過在運(yùn)行的精度方面肯定沒有那些高配滿血版高了,可以說將一分錢一分貨的理論發(fā)揮的淋漓盡致。
目前DeepSeek R1完整版模型為671B,此外它還有70B、c、14B、8B、7B、1.5B六個(gè)原始蒸餾模型,而六個(gè)原始蒸餾還被個(gè)人開發(fā)者訓(xùn)練除了各種量化版本,以滿足不同平臺(tái)、行業(yè)用戶的需求。
1.5B是原始最小的模型,搭載一般4G顯存和8GB內(nèi)存的顯卡游戲本就能跑。而使用單張顯卡不考慮魔改和多卡的話,一般消費(fèi)級(jí)電腦的頂點(diǎn)在32B、70B的蒸餾模型,需要20GB以上顯卡搭配64GB以上內(nèi)存。其實(shí)從數(shù)字也能看出來高配版和低配版蒸餾模型的差異,1.5B和32B、70B不在一個(gè)量級(jí)。
我們這次來玩一玩DeepSeek本地部署,給大家出一套簡易版本部署教程,首先準(zhǔn)備了一套電腦平臺(tái),配置如下:
這次我們使用了了AMD 銳龍9 9950X3D這款最新發(fā)布的處理器,兼具游戲以及生產(chǎn)力,目前在這雙端都做到了業(yè)界領(lǐng)先。
為了能讓這款處理器可以跑滿性能,我們搭配技嘉X870 A ELITE WE7 ICE主板,這是一款純白主板,擁有16+2+2相供電模組,配備全覆蓋式散熱裝甲,足夠AMD 銳龍9 9950X3D發(fā)揮出全部實(shí)力。
同時(shí)這款主板拓展能力不俗,不僅提供PCIe 5.0顯卡插槽以及M.2插槽,還在I/O區(qū)域板載12個(gè)USB接口,包括兩個(gè)最新的USB 4接口。目前這款轉(zhuǎn)還提供4年質(zhì)保以及1年換新服務(wù),售后無憂。
顯卡為AORUS GeForce RTX 5090 D MASTER ICE 32G,這款顯卡采用GB202核心,使用與上一代相同的TSMC 4nm定制工藝(TSMC 4nm 4N NVIDIA CustomProcess),芯片面積750mm2。擁有21760個(gè)CUDA,Boost頻率為2655MHz。 采用32GB GDDR7顯存,位寬為512bit,顯存帶寬達(dá)到了1792 GB/s,光柵單元和紋理單元為176和680。
顯示器為技嘉FO32U2P OLED顯示器,這是一款4K頂級(jí)桌面顯示器,采用QD-OLED面板,擁有240Hz刷新率以及0.03ms響應(yīng)時(shí)間,還經(jīng)過ClearMR 13000認(rèn)證以及HDR400認(rèn)證,提供了更加真實(shí)的畫面表現(xiàn)。
在部署之前,我們首先要確定使用的容器,也就是啟動(dòng)器,玩過Stable Diffusion對(duì)此應(yīng)該不會(huì)陌生,大名鼎鼎的秋葉啟動(dòng)器就是一種容器。目前很多支持DeepSeek的容器,根據(jù)自己的需求搜索容器官網(wǎng)去下載即可,我們這次先使用的是LM Studio。
LM Studio對(duì)于新手還是非常友好的,界面簡潔干凈,邏輯清晰,我們安裝打開點(diǎn)擊下方齒輪設(shè)置,可以調(diào)節(jié)成簡體中文,不過目前中文僅限于一些基礎(chǔ)界面和功能調(diào)節(jié)。
來到正式界面,與大家網(wǎng)頁端看到的樣式其實(shí)差不多,頂部是加載模型的地方,我們下載了一個(gè)32B版本的模型,加載后直接對(duì)話即可。
加載模型時(shí)能設(shè)置一些細(xì)節(jié),比如字?jǐn)?shù)、CPU步進(jìn)之類的,底部種子玩過Stable Diffusion都知道是什么,用來跑出和其他人接近的生成結(jié)果。
左側(cè)放大鏡圖標(biāo)里是LM Studio的模型庫,里面提供一些蒸餾后的DeepSeek R1,可以看到很多版本,有27B、12B、4B等訓(xùn)練好的模型,可以根據(jù)需求下載,模型越高級(jí)需求的容量也就越大,比如我們使用的32B版本就需要18個(gè)GB以上。
如果不使用LM Studio里面的模型而是下載了獨(dú)立的模型也沒問題,找到左側(cè)圖表中的文件見慘淡,頂部會(huì)給出模型目錄,將模型拷貝進(jìn)去即可,就可以在第一步的加載模型頂部欄中找到它去使用。
我們這里使用了這個(gè)32B模型進(jìn)行了對(duì)話,響應(yīng)速度極快,整個(gè)對(duì)話內(nèi)容生成不到幾秒鐘。這得益于整個(gè)平臺(tái)性能確實(shí)很強(qiáng)大,在跑這個(gè)模型時(shí),顯存使用了21.5GB左右,內(nèi)存利用了9GB左右。
對(duì)于這種大語言模型,顯存和內(nèi)存的容量很關(guān)鍵,這套技嘉平臺(tái),AORUS GeForce RTX 5090 D MASTER ICE 32G有32GB大顯存,內(nèi)存容量高達(dá)64GB,沒有達(dá)到上限,就可以讓這寫硬件本身性能發(fā)揮出來,所以很輕松就能讓本地32B模型快速響應(yīng)。
注意如果你的模型太過高級(jí),需求量超出你的顯存和內(nèi)存容量,記得不要強(qiáng)行跑,因?yàn)樯傻乃俣葧?huì)很慢,1分鐘可能都生成不了幾個(gè)字,比如降低一下蒸餾版本,選擇合適自己的模型。
AMD 銳龍9 9950X3D占用率也只有10%,這樣在生成時(shí)閑暇之余也可以做些別的日常,比如看視頻,玩一玩顯存足夠的游戲。
不過本地模型也有局限性,那就是信息取決于模型,如果你的模型數(shù)據(jù)庫里沒有包含相應(yīng)的信息,它就不會(huì)給你想要的答案。比如我們這個(gè)模型模型庫的時(shí)間在2024年,所以我下面問的這個(gè)關(guān)于AMD 銳龍9 9950X3D的問題它就沒有準(zhǔn)確回應(yīng),而是用錯(cuò)誤數(shù)據(jù)填充了答案。因此在涉及數(shù)據(jù)相關(guān)的內(nèi)容時(shí),還是需要謹(jǐn)慎一些,AI目前畢竟只是輔助工具。
總結(jié)來看,DeepSeek確實(shí)降低了AI大語言類本地部署的門檻,目前消費(fèi)級(jí)電腦是可以去盡心體驗(yàn)的,相較于云端響應(yīng)速度更快,只服務(wù)于你一人,也能針對(duì)性下載相應(yīng)的模型來滿足自身定制需求。缺點(diǎn)則是依舊有一定門檻,并且吐過不常更新模型數(shù)據(jù)庫信息的話,不能實(shí)時(shí)解答熱點(diǎn)問題,整體操作也確實(shí)沒有云端簡單,畢竟現(xiàn)在很多人連壓縮包都解不明白,那確實(shí)不太好上手。
對(duì)于硬件而言,我們這套技嘉X870 A ELITE WE7 ICE主板+AMD 銳龍9 9950X3D+AORUS GeForce RTX 5090 D MASTER ICE 32G+64GB的組合玩轉(zhuǎn)DeepSeek是沒有任何壓力的,消費(fèi)級(jí)這樣的平臺(tái)也基本都到頭了,頂多可能將內(nèi)存升到128GB,那就有可能挑戰(zhàn)更大規(guī)模的模型,總體而言頂級(jí)消費(fèi)級(jí)平臺(tái)體驗(yàn)本地部署會(huì)非常舒服,建議有能力的用戶去嘗試一下。
評(píng)論