英偉達(dá) vs AMD:戰(zhàn)場(chǎng)已移至 1000 美元區(qū)間
英偉達(dá)和 AMD 再次幾乎同步地將新一代專業(yè) GPU 推向市場(chǎng)。英偉達(dá)最新的 Ada Generation GPU 催生了兩款適用于固定/桌面工作站的超高端產(chǎn)品:RTX 5000 Ada 和 RTX 6000 Ada GPU(更不用說適用于移動(dòng)工作站的 GPU 模塊)。AMD 推出 Radeon Pro W7900 和 W7800 進(jìn)行反擊。所有四種產(chǎn)品的售價(jià)均超過 2,000 美元,對(duì)于大多數(shù)工作站用戶來說都太豐富了?,F(xiàn)在,這兩家公司正在與下一代圖形處理器英偉達(dá)的 RTX 4000 Ada Generation 和 AMD 的 Radeon Pro W7700 進(jìn)行另一場(chǎng)勢(shì)均力敵的較量,在利潤(rùn)更豐厚的 1000 美元范圍內(nèi)展開競(jìng)爭(zhēng)。
本文引用地址:http://2s4d.com/article/202401/454417.htmJon Peddie Research 認(rèn)為,雖然產(chǎn)品具有可比性,但一旦進(jìn)入市場(chǎng),供應(yīng)商各自的產(chǎn)品并沒有獲得同樣的成功,差異是明顯的。今天,英偉達(dá)的外接式 GPU 在固定工作站上的銷量約占總銷量的 97%,而在移動(dòng) GPU 服務(wù)于蓬勃發(fā)展的移動(dòng)工作站市場(chǎng)的背景下,這一數(shù)字甚至更高。
要想打破這一市場(chǎng)現(xiàn)狀,需要英偉達(dá)出現(xiàn)問題,而 AMD 則必須完美執(zhí)行雖然 AMD 的執(zhí)行力并不完美,但該公司也很難掉鏈子。相反,AMD 的問題在于英偉達(dá)最近沒有提供任何有意義的失誤供 AMD 利用。因此,隨著這兩款競(jìng)爭(zhēng)產(chǎn)品服務(wù)于相同(大約)1,000 美元的 ASP 社區(qū),我們?cè)诨鶞?zhǔn)測(cè)試中看到了一些熟悉的結(jié)果組合。英偉達(dá)的 3D 圖形性能勝過 AMD,但差距不大(盡管如果渲染方面也能達(dá)到同樣的效果,這一點(diǎn)還有待商榷),而 AMD 更友好的定價(jià)使其在性價(jià)比方面與英偉達(dá)類似。
如果 Radeon Pro W7700 能夠在性能和性價(jià)比上脫穎而出,那么雙插槽與單插槽的問題就不會(huì)是一個(gè)重要的問題。而對(duì)很多人來說,可能還是一句「不在乎」。但是,如果兩者在其他方面旗鼓相當(dāng)(考慮到當(dāng)今市場(chǎng)很大程度上將英偉達(dá)視為默認(rèn)品牌),那么 W7700 更需要更多瓦特,并且可能會(huì)取代插槽(取決于主板),那么這對(duì) Radeon Pro W7700 的前景并無幫助。
雖然這一輪更新不太可能顯著提高市場(chǎng)份額,但如果您只是想配置新工作站的用戶,這可能并不重要。對(duì)于高端市場(chǎng),最大性能更可能是關(guān)鍵的購買標(biāo)準(zhǔn),而在低端市場(chǎng),價(jià)格將脫穎而出。在這些最新 GPU 的 1,000 美元級(jí)別中,性價(jià)比起著更重要的作用。因此,AMD 的性價(jià)比可能會(huì)激起用戶的興趣,而大多數(shù)買家將繼續(xù)選擇 4000 系列 RTX Ada,由于其在工作站供應(yīng)商的配置選項(xiàng)中更廣泛的可訪問性,這一前景更有可能。專業(yè)買家的底線是什么?似乎沒有明確的正確或錯(cuò)誤答案,各種類型的用戶都可以從兩家供應(yīng)商一代又一代的性能提升中受益。
英偉達(dá) vs AMD:戰(zhàn)場(chǎng)已移至 1,000 美元區(qū)間
英偉達(dá)和 AMD 的 GPU 組合在芯片開發(fā)和后續(xù)產(chǎn)品推出方面的一致性確實(shí)讓筆者感到驚訝。也許不應(yīng)該,相反,也許這是一種應(yīng)該給人留下深刻印象的模式。因?yàn)楫?dāng)筆者停下來考慮現(xiàn)代 GPU(或 CPU)的生產(chǎn)這項(xiàng)艱巨的任務(wù)時(shí),兩家供應(yīng)商在執(zhí)行中很少出現(xiàn)失誤,這一事實(shí)應(yīng)該給人留下深刻的印象。雖然他們各自的產(chǎn)品并不總是處于平等的地位,但很少會(huì)看到一個(gè)人在沒有得到對(duì)方及時(shí)和相應(yīng)的回應(yīng)的情況下,通過一些戲劇性的代際進(jìn)步讓對(duì)方完全措手不及。
因此,它一直在市場(chǎng)上尋找配備現(xiàn)代固定和移動(dòng)工作站的專業(yè)級(jí)獨(dú)立 GPU。英偉達(dá)的 Ada 和 AMD 的 RDNA 3 代的不斷推出就證明了兩者的新一代微架構(gòu)往往非常接近。這兩代產(chǎn)品都已經(jīng)出現(xiàn)在各自以工作站為中心的 RTX 和 Radeon Pro 系列中,主要從高端開始,逐漸降低價(jià)格范圍。
在過去的幾個(gè)月里,英偉達(dá)最新的 Ada 一代 GPU 已經(jīng)催生了兩款適用于固定/桌面工作站的超高端產(chǎn)品——RTX 5000 Ada 和 RTX 6000 Ada GPU——以及大量適用于移動(dòng)工作站的 GPU 模塊。與此同時(shí),AMD 推出了自己的兩款高價(jià)選項(xiàng):Radeon Pro W7900 和 W7800。這四款產(chǎn)品的零售價(jià)均超過 2,000 美元,超出了大多數(shù)工作站用戶的承受能力。但它們的出現(xiàn)預(yù)示著這兩家公司下一代產(chǎn)品的下一個(gè)可能價(jià)格點(diǎn):利潤(rùn)豐厚的 1,000 美元范圍。果然,兩者都實(shí)現(xiàn)了這一期望,前者的 RTX 4000 Ada Generation,現(xiàn)在與后者的 Radeon Pro W7700 相媲美。
RTX 4000 Ada
對(duì) RTX 4000 Ada Generation 的顯著硬件指標(biāo)的掃描顯示,其資源數(shù)量(尤其是 CUDA 核心、Tensor 核心和 RT 核心)與其前身 Ampere 一代 RTX A4000 基本相同。因此,RTX 4000 性能的大部分改進(jìn)將歸因于架構(gòu)增強(qiáng)和/或更高頻率的執(zhí)行。一個(gè)值得注意的例外是峰值內(nèi)存帶寬,它實(shí)際上會(huì)降低。提高電源效率可能是設(shè)計(jì)選擇背后的動(dòng)機(jī),因?yàn)橥獠拷涌谏瞎?jié)省的電力可以用在其他地方(例如時(shí)鐘)。但這也證明了 Ada 的架構(gòu)效率(和板載緩存),它可以用更少的總帶寬實(shí)現(xiàn)更高水平的性能。
表 1:RTX 4000 Ada 、 RTX 5000 Ada 及其前身 RTX A4000 的主要硬件指標(biāo)。(來源:英偉達(dá))
Radeon Pro 7700
AMD 的 RDNA 3 代 Radeon Pro 預(yù)計(jì)將于 2023 年 4 月首次宣布部署工作站,最初由兩個(gè) SKU 組成:Radeon Pro W7800 和 W7900。與英偉達(dá)的第一代 Ada Generation RTX 6000 和 RTX 5000 一樣,兩者都非常昂貴,零售價(jià)分別約為 2,500 美元和 4,000 美元。但與英偉達(dá)一樣,AMD 最近又進(jìn)一步降低了價(jià)格曲線,W7700 的售價(jià)約為 1,000 美元。
RDNA 3 的進(jìn)步也與 Ada 一樣,沿著相同路徑推動(dòng)資源和性能:用于通用計(jì)算和 3D 圖形的更快的流處理器,改進(jìn)的(第二代)RT 加速器以加速渲染的路徑跟蹤,以及針對(duì)機(jī)器學(xué)習(xí)(訓(xùn)練和推理)進(jìn)行調(diào)整的人工智能加速器。
表 2:RDNA 第三代 Radeon Pro W7700 的主要硬件指標(biāo)。(來源:AMD)
RDNA 3 的 Radiance 顯示引擎是 RDNA 3 與眾不同的一項(xiàng)資源,與 RTX 的 DP 1.4a 相比,它支持更新、更高帶寬的 DisplayPort 2.1。在物理層,DP 2.1 使帶寬增加了一倍以上,意味著更高分辨率、更高刷新率、更多顯示器,或三者的某種組合。它還允許選擇 12 位 HDR 顏色 (4:4:4),無需色度二次采樣,以滿足最視覺精確的要求。
不過,W7700 還有一個(gè)方面與 RTX 4000 不同,這一點(diǎn)一目了然:后者是單寬度 PCI Express 卡,而前者是雙寬度。外形尺寸選擇反映了各自的散熱和電源規(guī)格:RTX 4000 Ada 為 130W,Radeon Pro W7700 為 190W。當(dāng)然,兩者都使用單個(gè) PCIe x16 插槽,但雙寬卡會(huì)占用更多空間,并且可能會(huì)阻塞第二個(gè) PCIe 插槽,具體取決于主板和機(jī)箱。大多數(shù)迷你或全尺寸塔式工作站將支持雙寬卡(以及更高的功率要求)。有趣的是,正是在 GPU 頻譜中這個(gè) 1000 美元左右、150W 左右的點(diǎn)上我們看到了這種外形尺寸差異。在此級(jí)別之上,兩家供應(yīng)商的產(chǎn)品都是雙寬度的,在該級(jí)別之下,它們都是單寬度的。
單寬度 RTX 4000(左)和雙寬度 Radeon Pro W7700(右)
RTX 5000 Ada 提升 3D 圖形和 3D 渲染的視覺計(jì)算性能
當(dāng)談到更傳統(tǒng)的交互式 3D 圖形時(shí),SPECviewperf(最新的 2020 版本)仍然是 CAD 和其他專業(yè)視覺處理工作負(fù)載較多的應(yīng)用程序的首選基準(zhǔn)。使用 SPECviewperf 2020 進(jìn)行測(cè)試得出以下結(jié)果,在相同的高性能系統(tǒng)上運(yùn)行,交換 RTX 4000 Ada Generation、之前的 Ampere Generation RTX A4000 和 AMD Radeon Pro W7700。
RTX 5000 Ada Generation GPU 在 SPECviewperf 2020 視圖集上的運(yùn)行速度平均比 RTX A5000 快 56%(A6000 Ada Generation 大約快 73%)。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 分?jǐn)?shù),標(biāo)準(zhǔn)化為英偉達(dá) Ampere 一代 RTX A4000。
然而,當(dāng)我們考慮性價(jià)比時(shí),情況就發(fā)生了逆轉(zhuǎn),因?yàn)?AMD Radeon Pro W7700 的 ASP 更易于訪問,使其比英偉達(dá) RTX 4000 Ada 更具優(yōu)勢(shì)。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 性價(jià)比得分,標(biāo)準(zhǔn)化為英偉達(dá) Ampere 一代 RTX A4000。
最后,從電源效率的角度來看,盡管在固定/有線工作站的環(huán)境中(對(duì)于大多數(shù)人來說)這是一個(gè)較小的問題。相反,RTX 4000 Ada 的每瓦分?jǐn)?shù)較低,其較低的最大持續(xù)功耗使其每瓦性能領(lǐng)先于此處對(duì)比的所有同類 GPU。請(qǐng)記住,這些結(jié)果并不反映達(dá)到相應(yīng)分?jǐn)?shù)所消耗的實(shí)際功耗,而是反映電路板為確保熱容限和電容限而可以消耗的持續(xù)功率限制。
RTX 4000(和 5000)Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 每瓦得分,標(biāo)準(zhǔn)化為英偉達(dá) Ampere 一代 RTX A4000。
渲染:GPU 視覺處理不僅限于 3D 圖形
雖然 3D 圖形仍然是大多數(shù)視覺計(jì)算工作流程的基礎(chǔ),但它不再是唯一需要評(píng)估的 GPU 功能。隨著片上光線追蹤硬件的出現(xiàn),以及 GPU 在通用計(jì)算和機(jī)器學(xué)習(xí)方面能力的不斷提高,下一代 GPU 有更多的價(jià)值可供開發(fā)。
得益于普遍的應(yīng)用程序支持、更快的 CPU,以及(特別是在本次評(píng)測(cè)中)GPU 加速和支持軟件庫,渲染曾經(jīng)是一種奢侈品,現(xiàn)在在工作站市場(chǎng)中變得越來越容易使用。除了簡(jiǎn)單地提供比上一代 Ampere 芯片更多的 CUDA、RT 和 Tensor 核心之外,英偉達(dá)在轉(zhuǎn)向 Ada 時(shí)還提高了每個(gè)核心的性能和功能(具有第四代 Tensor 核心和第三代 RT 核心架構(gòu))。例如,RT 核心本身已經(jīng)升級(jí),英偉達(dá)聲稱光線追蹤吞吐量比 Ampere 提高了 2 至 3 倍。雖然 3D 圖形處理主要依賴于 CUDA 核心,但它的渲染代表了利用所有三個(gè)核心功能的算法的十字路口。
考慮 DLSS 3,它擴(kuò)展了之前在 Ampere 和 Turing DLSS 以及 DLSS 2(Ampere 的前身)中利用的 AI/渲染協(xié)同作用。前面的算法利用機(jī)器學(xué)習(xí)來智能地填充像素或光線(其數(shù)量與渲染時(shí)的視口像素相關(guān)),從而縮短到達(dá)最終渲染圖像所需的時(shí)間。在 Ada 中,DLSS 3 將其帶入邏輯上的下一步,但是在時(shí)間域而不是空間域。DLSS 3 不是在同一幀內(nèi)填充像素或光線,而是允許經(jīng)過訓(xùn)練的神經(jīng)網(wǎng)絡(luò)創(chuàng)建中間幀,從而提高幀速率,同時(shí)減少暴力視覺處理。
RTX 4000 Ada 和上一代 RTX A4000 的測(cè)試結(jié)果充分證明了 Ada 在所有處理核心上的先進(jìn)能力,前者在 Blender Cycles 基準(zhǔn)測(cè)試中比后者高出 41%(三個(gè)場(chǎng)景分?jǐn)?shù)的幾何平均值),利潤(rùn)率甚至高于 SPECviewperf 2020 的 3D 圖形。
RTX 4000 Ada 和 RTX 5000 Ada 的 Blender Cycles 渲染基準(zhǔn)測(cè)試結(jié)果,標(biāo)準(zhǔn)化為 Ampere 一代 RTX A4000。
隨著 Maxon 的 Cinebench 2024 的推出,筆者終于找到了比較英偉達(dá)和 AMD GPU 加速渲染的公平基礎(chǔ)。前幾代 Cinebench 或 Blender Cycles 或 LuxRender 等其他基準(zhǔn)測(cè)試如果沒有對(duì)供應(yīng)商首選優(yōu)化庫(英偉達(dá)的 CUDA 或 AMD 最新的 HIP RT)的嵌入式支持,將使英偉達(dá)或 AMD 處于不利地位。另一方面,Cinebench 2024 現(xiàn)在支持兩者,測(cè)試顯示 RTX 4000 Ada 的性能比其前身 RTX A4000 高出 41%,而 Radeon Pro W7700 的幀速率約為后者的 85%。
RTX 4000 Ada 和 RTX AMD Radeon Pro W7700 的 Cinebench 2024 渲染基準(zhǔn)測(cè)試結(jié)果,標(biāo)準(zhǔn)化為 Ampere 一代 RTX A4000。
雖然視覺處理(主要是 3D 圖形,但越來越多的渲染)仍然是專業(yè) GPU 工作負(fù)載的大部分,但加速其他計(jì)算已經(jīng)擴(kuò)大了其效用。如今,人工智能占據(jù)主導(dǎo)地位,GPU 通常被視為訓(xùn)練和推理的首選引擎。SPECworkstation 的 GPU 計(jì)算測(cè)試套件可以在一定程度上深入了解 GPU 對(duì)深度學(xué)習(xí)(使用 Caffe)和科學(xué)研究(使用 FAH 或 Folding@home)的益處,以及另一個(gè)使用 LuxRender 提供額外渲染數(shù)據(jù)點(diǎn)的套件。
在同一測(cè)試系統(tǒng)上運(yùn)行 SPECworkstation 3.1,英偉達(dá)的 RTX 4000 Ada Generation 在 GPU 計(jì)算測(cè)試套件上的性能比其前身 RTX A4000 高出 20%。按絕對(duì)值計(jì)算,英偉達(dá) GPU 在特定于 GPU 的測(cè)試中的性能不會(huì)是最佳的,因?yàn)檫@些測(cè)試支持 OpenCL,而不是英偉達(dá)自己的 CUDA 加速庫。然而,從一代又一代的角度來看,分?jǐn)?shù)應(yīng)該提供另一個(gè)合適的參考,表明 Ada 相對(duì)于 Ampere 的性能進(jìn)步。
RTX 4000 Ada 和 RTX 5000 Ada 的 SPECworkstation 3.1 GPU 特定基準(zhǔn)測(cè)試結(jié)果,標(biāo)準(zhǔn)化為 Ampere 一代 RTX A4000。
評(píng)論