三款新型超級計(jì)算機(jī)榮登Green500 List
就在過去的幾年里,超級計(jì)算加速進(jìn)入了超算時(shí)代——世界上最龐大的機(jī)器每秒能夠執(zhí)行超過10億次運(yùn)算。但是,除非效率的大幅提高能夠沿著指數(shù)增長曲線進(jìn)行干預(yù),否則預(yù)計(jì)計(jì)算也將需要越來越不切實(shí)際且不可持續(xù)的能源——甚至根據(jù)一項(xiàng)被廣泛引用的研究,到2040年,計(jì)算所需的能源將超過當(dāng)今世界的總產(chǎn)出。
幸運(yùn)的是,高性能計(jì)算社區(qū)現(xiàn)在不僅將重點(diǎn)轉(zhuǎn)移到提高性能(以原始PB級或EB級為單位)上,而且還轉(zhuǎn)移到更高的效率上,增加了每瓦的操作次數(shù)。
近日公布了最新的Top500超級計(jì)算機(jī)排名(世界上最強(qiáng)大的機(jī)器列表,https://www.top500.org/lists/top500/2024/06/)及Green500(世界上效率排名最高的機(jī)器,https://www.top500.org/lists/green500/2024/06/)。Top 500超級計(jì)算機(jī)中領(lǐng)先的10臺(tái)基本保持不變,由橡樹嶺國家實(shí)驗(yàn)室的Frontier exascale計(jì)算機(jī)領(lǐng)導(dǎo)。前十名中只有一個(gè)新成員,排名第六:瑞士國家超級計(jì)算中心的Alps系統(tǒng)。與此同時(shí),阿貢國家實(shí)驗(yàn)室的Aurora將其規(guī)模擴(kuò)大了一倍,但仍保持著第二梯隊(duì)的排名。另一方面,在Green500榜單上,新來者進(jìn)入了前三名,這表明世界上一些最新的高性能系統(tǒng)可能在追求效率多余純粹的功率。
在新的Green500名單中,Jülich超級計(jì)算中心的原型系統(tǒng)JEDI名列榜首,該系統(tǒng)將用于其即將推出的JUPITER exascale計(jì)算機(jī)。排名第二和第三的是布里斯托爾大學(xué)的Isambard AI,也是一個(gè)更大計(jì)劃系統(tǒng)的第一階段,以及波蘭Cyfronet組織的Helios超級計(jì)算機(jī)。排在第四位的是上屆榜單的領(lǐng)導(dǎo)者,西蒙斯基金會(huì)的Henri。
Green500榜單上排名前三的系統(tǒng)有一個(gè)共同點(diǎn)——它們都是用英偉達(dá)的Grace Hopper超級芯片構(gòu)建的,該芯片是Hopper(H100)GPU和Grace CPU的組合。偉達(dá)加速數(shù)據(jù)中心走向市場戰(zhàn)略總監(jiān)Dion Harris表示,Grace Hopper架構(gòu)如此高效的主要原因有兩個(gè)。第一個(gè)是Grace CPU,它得益于ARM指令集架構(gòu)卓越的電源性能。此外,他說,它還集成了一種稱為LPDDR5X的存儲(chǔ)器結(jié)構(gòu),這種結(jié)構(gòu)通常存在于手機(jī)中,并針對能效進(jìn)行了優(yōu)化。
Harris說,Grace Hopper的第二個(gè)優(yōu)勢是在Hopper GPU和Grace CPU之間新開發(fā)的互連。該連接利用了CPU和GPU在一塊板上彼此接近的優(yōu)勢,實(shí)現(xiàn)了每秒900吉比特的帶寬,大約是最新PCIe第5代互連的7倍。Harris提到,這使得GPU能夠快速訪問CPU的內(nèi)存,這對于人工智能訓(xùn)練或圖形神經(jīng)網(wǎng)絡(luò)等高度并行的應(yīng)用程序尤為重要。
三個(gè)頂級系統(tǒng)都使用Grace Hoppers,但Jülich的JEDI仍以顯著的優(yōu)勢領(lǐng)先——每瓦72.7千兆次,而第二名為每瓦68.8千兆次(上屆排名第一為每瓦65.4千兆次)。JEDI團(tuán)隊(duì)將他們的額外成功歸功于他們將芯片連接在一起的方式。他們的互連結(jié)構(gòu)也來自英偉達(dá)——Quantum-2 InfiniBand——而不是其他兩個(gè)頂級系統(tǒng)使用的HPE Slingshot。
JEDI團(tuán)隊(duì)還引用了他們?yōu)檫m應(yīng)Green500基準(zhǔn)所做的具體優(yōu)化。除了使用所有最新的英偉達(dá)設(shè)備外,JEDI還通過其冷卻系統(tǒng)降低了能源成本。JEDI不使用空氣或冷凍水,而是在其計(jì)算節(jié)點(diǎn)中循環(huán)使用熱水來處理多余的熱量。Jülich高性能計(jì)算部門負(fù)責(zé)人Benedikt von St.Vieth表示:“在正常天氣條件下,多余的熱量可以通過自由冷卻裝置來解決,而不需要額外的冷水冷卻?!?/p>
JUPITER將使用與其原型JEDI相同的架構(gòu),von St.Vieth表示,他的目標(biāo)是保持原型的大部分能效——盡管隨著規(guī)模的擴(kuò)大,互連結(jié)構(gòu)可能會(huì)損失更多的能量。
當(dāng)然,最關(guān)鍵的是這些系統(tǒng)在實(shí)際科學(xué)任務(wù)中的性能,而不僅僅是在Green500基準(zhǔn)上?!翱吹竭@些系統(tǒng)上線真的很令人興奮,”英偉達(dá)的Harris說,“但更重要的是,我們真的很高興看到這些系統(tǒng)的科學(xué)成果,因?yàn)槲艺J(rèn)為(能效)對應(yīng)用的影響甚至比基準(zhǔn)更大?!?/p>
*博客內(nèi)容為網(wǎng)友個(gè)人發(fā)布,僅代表博主個(gè)人觀點(diǎn),如有侵權(quán)請聯(lián)系工作人員刪除。