英特爾實現(xiàn)光學I/O芯粒的完全集成
英特爾在用于高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g上取得了突破性進展。在2024年光纖通信大會(OFC)上,英特爾硅光集成解決方案(IPS)團隊展示了業(yè)界領先的、完全集成的OCI(光學計算互連)芯粒,該芯粒與英特爾CPU封裝在一起,運行真實數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應用,英特爾打造的OCI芯粒在新興AI基礎設施中實現(xiàn)了光學I/O(輸入/輸出)共封裝,從而推動了高帶寬互連技術創(chuàng)新。
本文引用地址:http://2s4d.com/article/202406/460418.htm英特爾硅光集成解決方案團隊產品管理與戰(zhàn)略高級總監(jiān)Thomas Liljeberg表示:“服務器之間的數(shù)據(jù)傳輸正在不斷增加,當今的數(shù)據(jù)中心基礎設施難堪重負。目前的解決方案正在迅速接近電氣I/O性能的實際極限。然而,借助英特爾的這項突破性進展,客戶能夠將硅光共封互連方案無縫集成到下一代計算系統(tǒng)中。英特爾的OCI芯粒大大提高了帶寬、降低了功耗并延長了傳輸距離,有助于加速機器學習工作負載,進而推動高性能AI基礎設施創(chuàng)新。”
英特爾OCI(光學計算互連)芯粒
該OCI芯??稍谠谧铋L可達100米的光纖上,單向支持64個32Gbps 通道,有望滿足AI基礎設施日益增長的對更高帶寬、更低功耗和更長傳輸距離的需求。它將有助于實現(xiàn)可擴展的CPU和GPU集群連接,和包括一致性內存擴展及資源解聚的新型計算架構。
AI應用正在全球范圍內被越來越多地部署,近期大語言模型和生成式AI的發(fā)展正在加速這一趨勢。對AI負載加速新需求而言,更大、更高效的機器學習模型將發(fā)揮關鍵作用。未來的計算平臺需要面向AI實現(xiàn)擴展,因而需要指數(shù)級提升的I/O帶寬和更長的傳輸距離,以支持更大規(guī)模的處理器(CPU、GPU和IPU)集群,和資源利用更高效的架構,如xPU解聚和內存池化(memory pooling)。
電氣I/O(即銅跡線連接)帶寬密度高且功耗低,但傳輸距離短至不超一米。數(shù)據(jù)中心和早期AI集群中使用的可插拔光收發(fā)器模塊可以延長傳輸距離,但就AI工作負載的擴展需求而言,其成本和功耗不可持續(xù)。xPU光電共封I/O解決方案 可以在提高能效比、降低延遲和延長傳輸距離的同時,支持更高的帶寬,從而滿足AI和機器學習基礎設施的擴展需求。
打個比方,在CPU和GPU中,用光學I/O取代電氣I/O進行數(shù)據(jù)傳輸,就好比從使用馬車(容量和距離有限)到使用小汽車和卡車來配送貨物(數(shù)量更大、距離更遠)。英特爾的OCI芯粒等光學 I/O 解決方案,在性能和能耗方面實現(xiàn)了這一水平的提升,從而有助于AI的擴展。
在完全集成的OCI芯粒中,英特爾利用了已實際驗證的硅光子技術,集成了包含片上激光器的硅光子集成電路(PIC)、光放大器和電子集成電路。在2024年光纖通信大會上,英特爾展示了與自家CPU封裝在一起的OCI芯粒,但它也能與下一代CPU、GPU、IPU等SOC(系統(tǒng)級芯片)集成。
這一完全集成的OCI芯粒的雙向數(shù)據(jù)傳輸速度達4 Tbps,并兼容第五代PCIe。在2024年光纖通信大會現(xiàn)場,實時光學鏈路演示展示了通過單模光纖(SMF)跳線(patch cord)在兩個CPU平臺之間實現(xiàn)的發(fā)射器(Tx)和接收器(Rx)互連。CPU生成并測量了比特誤碼率(BER)。英特爾還展示了發(fā)射器的光譜(optical spectrum),包括單一光纖上200GHz間隔的八個波長,以及32Gbps發(fā)射器眼圖(eye diagram),表明信號質量很強。
該芯粒目前單向支持64個32Gbps 通道,傳輸距離達100米(由于傳輸延遲,實際應用中距離可能僅限幾十米)。它采用8對光纖,每根8波長密集波分復用(DWDM)。這種共封裝解決方案也非常節(jié)能,功耗僅為每比特5皮焦耳(pJ),而可插拔光收發(fā)器模塊的功耗大約為每比特15皮焦耳。對數(shù)據(jù)中心和HPC環(huán)境而言,超高的能效十分重要,有助于解決AI應用的高能耗問題,提高可持續(xù)性。
英特爾研究院在硅光子領域已深耕超過25年,是硅光集成的開拓者和領導者。英特爾在業(yè)內率先開發(fā)并向大型云服務提供商批量交付硅光子連接器件,這些產品具有領先的可靠性。
英特爾的主要差異化優(yōu)勢在于其直接集成技術,結合晶圓上激光器混合集成技術,可提高良率并降低成本。這一獨特的方法使英特爾能夠在實現(xiàn)卓越性能的同時保持高能效比。依托強大的量產平臺,英特爾已出貨超過800萬個硅光子集成電路,包含多達3200萬個片上集成激光器,時基故障率(FIT)小于0.1。時基故障率是一種廣泛使用的測量可靠性的方法,體現(xiàn)了故障率和發(fā)生故障的次數(shù)。
這些硅光子集成電路被封裝在可插拔收發(fā)器模塊中,部署于超大規(guī)模云服務提供商的大型數(shù)據(jù)中心網(wǎng)絡中,用于傳輸速率需求高達100、200和400 Gbps的應用。面向傳輸速率需求達800 Gbps和1.6 Tbps的新興應用,速度達200G/通道的硅光子集成電路正在開發(fā)中。
英特爾還正在探索新的硅光子制造工藝節(jié)點,該節(jié)點具有先進的器件性能、更高的密度、更好的耦合性,并能大幅提高經(jīng)濟性。英特爾將繼續(xù)在片上激光器和性能、成本(芯片面積減少 40% 以上)和功耗(減少 15% 以上)等方面取得進步。
英特爾研發(fā)的OCI芯粒目前尚處于技術原型(prototype)階段。英特爾正在與客戶合作,開發(fā)共封OCI和客戶SoC,作為光學I/O的解決方案。
英特爾的OCI芯粒推動了高速數(shù)據(jù)傳輸技術的進步。隨著AI基礎設施的不斷發(fā)展,英特爾將繼續(xù)推動前沿技術創(chuàng)新,探索面向未來的連接技術。
評論