英偉達 vs AMD：戰(zhàn)場已移至 1000 美元區(qū)間

作者：時間：2024-01-03 來源：半導體產(chǎn)業(yè)縱橫

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

英偉達和 AMD 再次幾乎同步地將新一代專業(yè) GPU 推向市場。英偉達最新的 Ada Generation GPU 催生了兩款適用于固定/桌面工作站的超高端產(chǎn)品：RTX 5000 Ada 和 RTX 6000 Ada GPU（更不用說適用于移動工作站的 GPU 模塊）。AMD 推出 Radeon Pro W7900 和 W7800 進行反擊。所有四種產(chǎn)品的售價均超過 2,000 美元，對于大多數(shù)工作站用戶來說都太豐富了?，F(xiàn)在，這兩家公司正在與下一代圖形處理器英偉達的 RTX 4000 Ada Generation 和 AMD 的 Radeon Pro W7700 進行另一場勢均力敵的較量，在利潤更豐厚的 1000 美元范圍內(nèi)展開競爭。

本文引用地址：http://2s4d.com/article/202401/454417.htm

Jon Peddie Research 認為，雖然產(chǎn)品具有可比性，但一旦進入市場，供應(yīng)商各自的產(chǎn)品并沒有獲得同樣的成功，差異是明顯的。今天，英偉達的外接式 GPU 在固定工作站上的銷量約占總銷量的 97%，而在移動 GPU 服務(wù)于蓬勃發(fā)展的移動工作站市場的背景下，這一數(shù)字甚至更高。

要想打破這一市場現(xiàn)狀，需要英偉達出現(xiàn)問題，而 AMD 則必須完美執(zhí)行雖然 AMD 的執(zhí)行力并不完美，但該公司也很難掉鏈子。相反，AMD 的問題在于英偉達最近沒有提供任何有意義的失誤供 AMD 利用。因此，隨著這兩款競爭產(chǎn)品服務(wù)于相同（大約）1,000 美元的 ASP 社區(qū)，我們在基準測試中看到了一些熟悉的結(jié)果組合。英偉達的 3D 圖形性能勝過 AMD，但差距不大（盡管如果渲染方面也能達到同樣的效果，這一點還有待商榷），而 AMD 更友好的定價使其在性價比方面與英偉達類似。

如果 Radeon Pro W7700 能夠在性能和性價比上脫穎而出，那么雙插槽與單插槽的問題就不會是一個重要的問題。而對很多人來說，可能還是一句「不在乎」。但是，如果兩者在其他方面旗鼓相當（考慮到當今市場很大程度上將英偉達視為默認品牌），那么 W7700 更需要更多瓦特，并且可能會取代插槽（取決于主板），那么這對 Radeon Pro W7700 的前景并無幫助。

雖然這一輪更新不太可能顯著提高市場份額，但如果您只是想配置新工作站的用戶，這可能并不重要。對于高端市場，最大性能更可能是關(guān)鍵的購買標準，而在低端市場，價格將脫穎而出。在這些最新 GPU 的 1,000 美元級別中，性價比起著更重要的作用。因此，AMD 的性價比可能會激起用戶的興趣，而大多數(shù)買家將繼續(xù)選擇 4000 系列 RTX Ada，由于其在工作站供應(yīng)商的配置選項中更廣泛的可訪問性，這一前景更有可能。專業(yè)買家的底線是什么？似乎沒有明確的正確或錯誤答案，各種類型的用戶都可以從兩家供應(yīng)商一代又一代的性能提升中受益。

英偉達 vs AMD：戰(zhàn)場已移至 1,000 美元區(qū)間

英偉達和 AMD 的 GPU 組合在芯片開發(fā)和后續(xù)產(chǎn)品推出方面的一致性確實讓筆者感到驚訝。也許不應(yīng)該，相反，也許這是一種應(yīng)該給人留下深刻印象的模式。因為當筆者停下來考慮現(xiàn)代 GPU（或 CPU）的生產(chǎn)這項艱巨的任務(wù)時，兩家供應(yīng)商在執(zhí)行中很少出現(xiàn)失誤，這一事實應(yīng)該給人留下深刻的印象。雖然他們各自的產(chǎn)品并不總是處于平等的地位，但很少會看到一個人在沒有得到對方及時和相應(yīng)的回應(yīng)的情況下，通過一些戲劇性的代際進步讓對方完全措手不及。

因此，它一直在市場上尋找配備現(xiàn)代固定和移動工作站的專業(yè)級獨立 GPU。英偉達的 Ada 和 AMD 的 RDNA 3 代的不斷推出就證明了兩者的新一代微架構(gòu)往往非常接近。這兩代產(chǎn)品都已經(jīng)出現(xiàn)在各自以工作站為中心的 RTX 和 Radeon Pro 系列中，主要從高端開始，逐漸降低價格范圍。

在過去的幾個月里，英偉達最新的 Ada 一代 GPU 已經(jīng)催生了兩款適用于固定/桌面工作站的超高端產(chǎn)品——RTX 5000 Ada 和 RTX 6000 Ada GPU——以及大量適用于移動工作站的 GPU 模塊。與此同時，AMD 推出了自己的兩款高價選項：Radeon Pro W7900 和 W7800。這四款產(chǎn)品的零售價均超過 2,000 美元，超出了大多數(shù)工作站用戶的承受能力。但它們的出現(xiàn)預(yù)示著這兩家公司下一代產(chǎn)品的下一個可能價格點：利潤豐厚的 1,000 美元范圍。果然，兩者都實現(xiàn)了這一期望，前者的 RTX 4000 Ada Generation，現(xiàn)在與后者的 Radeon Pro W7700 相媲美。

RTX 4000 Ada

對 RTX 4000 Ada Generation 的顯著硬件指標的掃描顯示，其資源數(shù)量（尤其是 CUDA 核心、Tensor 核心和 RT 核心）與其前身 Ampere 一代 RTX A4000 基本相同。因此，RTX 4000 性能的大部分改進將歸因于架構(gòu)增強和/或更高頻率的執(zhí)行。一個值得注意的例外是峰值內(nèi)存帶寬，它實際上會降低。提高電源效率可能是設(shè)計選擇背后的動機，因為外部接口上節(jié)省的電力可以用在其他地方（例如時鐘）。但這也證明了 Ada 的架構(gòu)效率（和板載緩存），它可以用更少的總帶寬實現(xiàn)更高水平的性能。

表 1：RTX 4000 Ada 、 RTX 5000 Ada 及其前身 RTX A4000 的主要硬件指標。（來源：英偉達）

Radeon Pro 7700

AMD 的 RDNA 3 代 Radeon Pro 預(yù)計將于 2023 年 4 月首次宣布部署工作站，最初由兩個 SKU 組成：Radeon Pro W7800 和 W7900。與英偉達的第一代 Ada Generation RTX 6000 和 RTX 5000 一樣，兩者都非常昂貴，零售價分別約為 2,500 美元和 4,000 美元。但與英偉達一樣，AMD 最近又進一步降低了價格曲線，W7700 的售價約為 1,000 美元。

RDNA 3 的進步也與 Ada 一樣，沿著相同路徑推動資源和性能：用于通用計算和 3D 圖形的更快的流處理器，改進的（第二代）RT 加速器以加速渲染的路徑跟蹤，以及針對機器學習（訓練和推理）進行調(diào)整的人工智能加速器。

表 2：RDNA 第三代 Radeon Pro W7700 的主要硬件指標。（來源：AMD）

RDNA 3 的 Radiance 顯示引擎是 RDNA 3 與眾不同的一項資源，與 RTX 的 DP 1.4a 相比，它支持更新、更高帶寬的 DisplayPort 2.1。在物理層，DP 2.1 使帶寬增加了一倍以上，意味著更高分辨率、更高刷新率、更多顯示器，或三者的某種組合。它還允許選擇 12 位 HDR 顏色 (4:4:4)，無需色度二次采樣，以滿足最視覺精確的要求。

不過，W7700 還有一個方面與 RTX 4000 不同，這一點一目了然：后者是單寬度 PCI Express 卡，而前者是雙寬度。外形尺寸選擇反映了各自的散熱和電源規(guī)格：RTX 4000 Ada 為 130W，Radeon Pro W7700 為 190W。當然，兩者都使用單個 PCIe x16 插槽，但雙寬卡會占用更多空間，并且可能會阻塞第二個 PCIe 插槽，具體取決于主板和機箱。大多數(shù)迷你或全尺寸塔式工作站將支持雙寬卡（以及更高的功率要求）。有趣的是，正是在 GPU 頻譜中這個 1000 美元左右、150W 左右的點上我們看到了這種外形尺寸差異。在此級別之上，兩家供應(yīng)商的產(chǎn)品都是雙寬度的，在該級別之下，它們都是單寬度的。

單寬度 RTX 4000（左）和雙寬度 Radeon Pro W7700（右）

RTX 5000 Ada 提升 3D 圖形和 3D 渲染的視覺計算性能

當談到更傳統(tǒng)的交互式 3D 圖形時，SPECviewperf（最新的 2020 版本）仍然是 CAD 和其他專業(yè)視覺處理工作負載較多的應(yīng)用程序的首選基準。使用 SPECviewperf 2020 進行測試得出以下結(jié)果，在相同的高性能系統(tǒng)上運行，交換 RTX 4000 Ada Generation、之前的 Ampere Generation RTX A4000 和 AMD Radeon Pro W7700。

RTX 5000 Ada Generation GPU 在 SPECviewperf 2020 視圖集上的運行速度平均比 RTX A5000 快 56%（A6000 Ada Generation 大約快 73%）。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 分數(shù)，標準化為英偉達 Ampere 一代 RTX A4000。

然而，當我們考慮性價比時，情況就發(fā)生了逆轉(zhuǎn)，因為 AMD Radeon Pro W7700 的 ASP 更易于訪問，使其比英偉達 RTX 4000 Ada 更具優(yōu)勢。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 性價比得分，標準化為英偉達 Ampere 一代 RTX A4000。

最后，從電源效率的角度來看，盡管在固定/有線工作站的環(huán)境中（對于大多數(shù)人來說）這是一個較小的問題。相反，RTX 4000 Ada 的每瓦分數(shù)較低，其較低的最大持續(xù)功耗使其每瓦性能領(lǐng)先于此處對比的所有同類 GPU。請記住，這些結(jié)果并不反映達到相應(yīng)分數(shù)所消耗的實際功耗，而是反映電路板為確保熱容限和電容限而可以消耗的持續(xù)功率限制。

RTX 4000（和 5000）Ada 和 AMD Radeon Pro W7700 的 SPECviewperf 2020 每瓦得分，標準化為英偉達 Ampere 一代 RTX A4000。

渲染：GPU 視覺處理不僅限于 3D 圖形

雖然 3D 圖形仍然是大多數(shù)視覺計算工作流程的基礎(chǔ)，但它不再是唯一需要評估的 GPU 功能。隨著片上光線追蹤硬件的出現(xiàn)，以及 GPU 在通用計算和機器學習方面能力的不斷提高，下一代 GPU 有更多的價值可供開發(fā)。

得益于普遍的應(yīng)用程序支持、更快的 CPU，以及（特別是在本次評測中）GPU 加速和支持軟件庫，渲染曾經(jīng)是一種奢侈品，現(xiàn)在在工作站市場中變得越來越容易使用。除了簡單地提供比上一代 Ampere 芯片更多的 CUDA、RT 和 Tensor 核心之外，英偉達在轉(zhuǎn)向 Ada 時還提高了每個核心的性能和功能（具有第四代 Tensor 核心和第三代 RT 核心架構(gòu)）。例如，RT 核心本身已經(jīng)升級，英偉達聲稱光線追蹤吞吐量比 Ampere 提高了 2 至 3 倍。雖然 3D 圖形處理主要依賴于 CUDA 核心，但它的渲染代表了利用所有三個核心功能的算法的十字路口。

考慮 DLSS 3，它擴展了之前在 Ampere 和 Turing DLSS 以及 DLSS 2（Ampere 的前身）中利用的 AI/渲染協(xié)同作用。前面的算法利用機器學習來智能地填充像素或光線（其數(shù)量與渲染時的視口像素相關(guān)），從而縮短到達最終渲染圖像所需的時間。在 Ada 中，DLSS 3 將其帶入邏輯上的下一步，但是在時間域而不是空間域。DLSS 3 不是在同一幀內(nèi)填充像素或光線，而是允許經(jīng)過訓練的神經(jīng)網(wǎng)絡(luò)創(chuàng)建中間幀，從而提高幀速率，同時減少暴力視覺處理。

RTX 4000 Ada 和上一代 RTX A4000 的測試結(jié)果充分證明了 Ada 在所有處理核心上的先進能力，前者在 Blender Cycles 基準測試中比后者高出 41%（三個場景分數(shù)的幾何平均值），利潤率甚至高于 SPECviewperf 2020 的 3D 圖形。

RTX 4000 Ada 和 RTX 5000 Ada 的 Blender Cycles 渲染基準測試結(jié)果，標準化為 Ampere 一代 RTX A4000。

隨著 Maxon 的 Cinebench 2024 的推出，筆者終于找到了比較英偉達和 AMD GPU 加速渲染的公平基礎(chǔ)。前幾代 Cinebench 或 Blender Cycles 或 LuxRender 等其他基準測試如果沒有對供應(yīng)商首選優(yōu)化庫（英偉達的 CUDA 或 AMD 最新的 HIP RT）的嵌入式支持，將使英偉達或 AMD 處于不利地位。另一方面，Cinebench 2024 現(xiàn)在支持兩者，測試顯示 RTX 4000 Ada 的性能比其前身 RTX A4000 高出 41%，而 Radeon Pro W7700 的幀速率約為后者的 85%。

RTX 4000 Ada 和 RTX AMD Radeon Pro W7700 的 Cinebench 2024 渲染基準測試結(jié)果，標準化為 Ampere 一代 RTX A4000。

雖然視覺處理（主要是 3D 圖形，但越來越多的渲染）仍然是專業(yè) GPU 工作負載的大部分，但加速其他計算已經(jīng)擴大了其效用。如今，人工智能占據(jù)主導地位，GPU 通常被視為訓練和推理的首選引擎。SPECworkstation 的 GPU 計算測試套件可以在一定程度上深入了解 GPU 對深度學習（使用 Caffe）和科學研究（使用 FAH 或 Folding@home）的益處，以及另一個使用 LuxRender 提供額外渲染數(shù)據(jù)點的套件。

在同一測試系統(tǒng)上運行 SPECworkstation 3.1，英偉達的 RTX 4000 Ada Generation 在 GPU 計算測試套件上的性能比其前身 RTX A4000 高出 20%。按絕對值計算，英偉達 GPU 在特定于 GPU 的測試中的性能不會是最佳的，因為這些測試支持 OpenCL，而不是英偉達自己的 CUDA 加速庫。然而，從一代又一代的角度來看，分數(shù)應(yīng)該提供另一個合適的參考，表明 Ada 相對于 Ampere 的性能進步。