AI/ML數(shù)據(jù)中心的多太比特互連解決方案
即使在AI出現(xiàn)之前,從物聯(lián)網(wǎng)到云計(jì)算的一系列數(shù)字創(chuàng)新就已經(jīng)產(chǎn)生了對(duì)數(shù)據(jù)中心服務(wù)的前所未有的需求。在這一需求之上,生成式AI、大型語言模型(LLMs)及其他耗電量大的AI相關(guān)工作負(fù)載的需求如洪水般涌現(xiàn)。因此,AI/ML數(shù)據(jù)中心正在迅速轉(zhuǎn)向多太比特網(wǎng)絡(luò)傳輸速度,以跟上AI相關(guān)工作負(fù)載所需的計(jì)算資源的不斷增加。
盡管當(dāng)今的數(shù)據(jù)中心主要依賴于400-Gb以太網(wǎng)(400G)網(wǎng)絡(luò)設(shè)備,但根據(jù)Dell’Oro Group的預(yù)測(cè),到2025年,大多數(shù)AI后端端口將達(dá)到800G。而到2027年,大多數(shù)AI GPU集群預(yù)計(jì)將達(dá)到1.6T。更高速度的網(wǎng)絡(luò)技術(shù)消耗更多的電力并產(chǎn)生更多的熱量,這促使數(shù)據(jù)中心運(yùn)營(yíng)商尋求更節(jié)能、低成本的基礎(chǔ)設(shè)施解決方案。
其中一個(gè)創(chuàng)新領(lǐng)域是高速互連技術(shù),它負(fù)責(zé)在AI加速器、交換機(jī)、服務(wù)器及其他組件之間傳輸數(shù)據(jù)、應(yīng)用和工作負(fù)載。傳統(tǒng)的選擇是銅纜和光纖互連,每種技術(shù)都有顯著的優(yōu)勢(shì)和挑戰(zhàn)。
一種更新的解決方案是通過塑料電纜進(jìn)行射頻傳輸,簡(jiǎn)稱e-Tube。這為GPU集群的后端擴(kuò)展提供了一個(gè)引人注目的第三選擇,特別是在需要太比特以上速度以支持AI/ML工作負(fù)載的情況下。
銅纜和光纖互連的權(quán)衡
長(zhǎng)期以來,銅纜直連電纜(DAC)一直是400G網(wǎng)絡(luò)設(shè)備的默認(rèn)選擇。銅纜互連因其簡(jiǎn)單、便宜、可靠,且非常適合短距離應(yīng)用(如機(jī)架頂部的交換機(jī)連接)而聞名。然而,隨著網(wǎng)絡(luò)速度的提升以支持800G甚至1.6T以太網(wǎng)及更高速度,銅纜互連的局限性變得越來越明顯。
銅纜在速度增加時(shí)會(huì)遭受顯著的信號(hào)損失(如圖1所示),特別是在短距離的應(yīng)用中,這成為一個(gè)問題。盡管技術(shù)上可以通過使用更厚的銅線來延長(zhǎng)電纜長(zhǎng)度,但這樣一來,DAC本身會(huì)變得過于厚重和僵硬,無法部署。
因此,企業(yè)和超大規(guī)模數(shù)據(jù)中心紛紛轉(zhuǎn)向光纖互連,包括有源光纜(AOC),用于許多AI相關(guān)工作負(fù)載。由于光纖通過光信號(hào)傳輸數(shù)據(jù),傳輸速度更快,距離更長(zhǎng),并且信號(hào)損失極小。此外,光纖互連比銅纜明顯更薄、更輕。
然而,光纖互連也比銅纜復(fù)雜得多,耗電量更大,且成本更高,因?yàn)樗鼈冃枰嘿F的電光組件進(jìn)行電光轉(zhuǎn)換。與銅纜相比,光纖互連的成本可能高達(dá)7倍(如圖2所示)。
隨著網(wǎng)絡(luò)速度的增加,光纖互連的功耗迅速上升(如圖3所示)。這種成本和功耗問題使得完全依賴光纖解決方案來實(shí)現(xiàn)多太比特速度變得不切實(shí)際。
為了應(yīng)對(duì)光纖互連的一些問題,諸如共封裝光學(xué)技術(shù)(CPO)等創(chuàng)新應(yīng)運(yùn)而生,這些技術(shù)支持更好的能效和更高的密度。然而,共封裝光學(xué)仍然面臨傳統(tǒng)光纖解決方案的成本、散熱、功耗和可靠性挑戰(zhàn)。盡管它們可能為中層交換機(jī)提供一個(gè)可行的解決方案,但對(duì)于高容量的機(jī)架內(nèi)、相鄰機(jī)架和背板應(yīng)用而言,共封裝光學(xué)仍然在成本和功耗方面存在較大的限制。
e-Tube:更好的射頻傳輸替代方案
鑒于銅纜的物理限制以及光纖互連的高功耗和高成本特性,人們對(duì)低功耗、低延遲且具有成本效益的多太比特可擴(kuò)展互連技術(shù)的興趣日益濃厚。e-Tube技術(shù)是一種通過塑料電介質(zhì)波導(dǎo)進(jìn)行射頻數(shù)據(jù)傳輸?shù)目蓴U(kuò)展互連平臺(tái),波導(dǎo)由普通的塑料材料制成。
e-Tube電纜的重量比銅纜輕80%,體積小50%。它們不會(huì)像銅纜那樣在高頻時(shí)遭受信號(hào)損失,因此同樣的e-Tube內(nèi)核可用于1.6T、3.2T,甚至更高速度的未來電纜。由于e-Tube是一種不需要功耗大的昂貴光學(xué)組件的電子技術(shù),電纜的能效大約比共封裝光學(xué)(CPO)高50%,比傳統(tǒng)的重定時(shí)光纖高約75%(如圖4所示)。
e-Tube的延遲以皮秒計(jì)算,比傳統(tǒng)光纖電纜快了三個(gè)數(shù)量級(jí)(如圖5所示)。
在機(jī)架內(nèi)和相鄰機(jī)架的通信鏈路中,e-Tube電纜提供了比銅纜更低的損耗、更長(zhǎng)的傳輸距離和更高的能效,成本相似。根據(jù)MSA定義的標(biāo)準(zhǔn)設(shè)計(jì)和測(cè)試,這些電纜可以與現(xiàn)有的數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)備生態(tài)系統(tǒng)兼容使用。
e-Tube電纜利用成熟的半導(dǎo)體工藝技術(shù)和電纜制造設(shè)備,最大限度地減少了電纜制造商的資本支出。由于比銅纜體積小50%,薄型的e-Tube電纜有助于消除機(jī)架擁堵,并使安裝更加易于維護(hù),使其成為太比特機(jī)架內(nèi)和相鄰機(jī)架應(yīng)用中最多達(dá)7米的理想選擇。
企業(yè)和超大規(guī)模數(shù)據(jù)中心需要權(quán)衡用光纖技術(shù)替代銅纜的所有優(yōu)勢(shì)和局限性。e-Tube為超大規(guī)模云數(shù)據(jù)中心、AI/ML GPU部署和高性能計(jì)算集群中的機(jī)架內(nèi)和相鄰機(jī)架部署提供了一個(gè)更好的選擇。盡管沒有一種解決方案可以滿足所有需求,但對(duì)于數(shù)據(jù)中心中的AI/ML應(yīng)用,e-Tube為其他新興的光纖互連解決方案提供了一個(gè)有前景的替代方案(如圖6所示)。
評(píng)論