AVX-512在英特爾Emerald Rapids CPU上是一項顛覆性技術(shù)——第五代至強平均運行速度提高了一倍,功耗略微增加
AVX-512在某些工作負載中提升性能高達10倍。
本文引用地址:http://2s4d.com/article/202401/454575.htm第五代至強Emerald Rapids CPU Linux基準測試網(wǎng)站Phoronix對英特爾的第五代至強Emerald Rapids可擴展CPU進行了測試,以查看啟用AVX-512指令后其運行速度提高了多少,結(jié)果顯示平均性能翻倍。在一些工作負載中,性能甚至提升了十倍以上,而功耗卻沒有大幅增加。
Phoronix使用了一臺服務器進行測試,配備兩顆英特爾頂級的Xeon Platinum 8592+ 64核CPU,1TB DDR5內(nèi)存,3TB SSD,運行在Intel Eagle Stream上,搭載Ubuntu Linux發(fā)行版。該網(wǎng)站對各種工作負載進行了基準測試,如Embree、OpenVKL和Y-Cruncher,并啟用AVX-512,使平均性能翻倍。
其中大部分的平均性能是基于OpenVINO的性能結(jié)果,Phoronix使用不同參數(shù)多次測試了OpenVINO。大多數(shù)啟用AVX-512的OpenVINO運行顯示,性能至少提升了兩倍,最快的結(jié)果甚至提升了十倍以上。這主要歸功于OpenVINO支持AVX-VNNI和BF16,對于AI工作負載尤為有用。啟用AVX-512與關(guān)閉AVX-512時的峰值頻率差異微小。啟用AVX-512時,Xeon Platinum 8592+在所有核心上的頻率達到2.95 GHz,而在關(guān)閉AVX-512時為3.01 GHz。64核Emerald Rapids芯片在啟用或關(guān)閉AVX-512時都達到了3.9 GHz的提升時鐘。
平均而言,啟用或關(guān)閉AVX-512并未改變功耗,盡管許多單獨的工作負載需要多達10%的額外功耗。最大功耗約高出120瓦,這在一定程度上是典型的,因為難以獲得無需權(quán)衡的免費性能。較高的功耗也導致了稍微更高的溫度。此外,啟用AVX-512會稍微降低頻率,這可能是由于更高的功耗和溫度。
廣泛支持AVX-512指令是Emerald Rapids的主要賣點。盡管在原始性能方面,該CPU輸給了AMD的96核第四代EPYC Genoa芯片,正如我們在Emerald Rapids評論中所見,但AVX指令可以改變英特爾和AMD服務器CPU之間的動態(tài),尤其是對于AI。這可能是微軟選擇上一代Sapphire Rapids芯片而非EPYC與AMD的MI300X GPU搭配的原因之一。
評論