英特爾實(shí)現(xiàn)光學(xué)I/O芯粒的完全集成

—— 英特爾的OCI（光學(xué)計(jì)算互連）芯粒有望革新面向AI基礎(chǔ)設(shè)施的高速數(shù)據(jù)處理

作者：時(shí)間：2024-06-27 來源：EEPW

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫查詢

英特爾在用于高速數(shù)據(jù)傳輸?shù)墓韫饧杉夹g(shù)上取得了突破性進(jìn)展。在2024年光纖通信大會(huì)（OFC）上，英特爾硅光集成解決方案（IPS）團(tuán)隊(duì)展示了業(yè)界領(lǐng)先的、完全集成的OCI（光學(xué)計(jì)算互連）芯粒，該芯粒與英特爾CPU封裝在一起，運(yùn)行真實(shí)數(shù)據(jù)。面向數(shù)據(jù)中心和HPC應(yīng)用，英特爾打造的OCI芯粒在新興AI基礎(chǔ)設(shè)施中實(shí)現(xiàn)了光學(xué)I/O（輸入/輸出）共封裝，從而推動(dòng)了高帶寬互連技術(shù)創(chuàng)新。

本文引用地址：http://2s4d.com/article/202406/460418.htm

英特爾硅光集成解決方案團(tuán)隊(duì)產(chǎn)品管理與戰(zhàn)略高級(jí)總監(jiān)Thomas Liljeberg表示：“服務(wù)器之間的數(shù)據(jù)傳輸正在不斷增加，當(dāng)今的數(shù)據(jù)中心基礎(chǔ)設(shè)施難堪重負(fù)。目前的解決方案正在迅速接近電氣I/O性能的實(shí)際極限。然而，借助英特爾的這項(xiàng)突破性進(jìn)展，客戶能夠?qū)⒐韫夤卜饣ミB方案無縫集成到下一代計(jì)算系統(tǒng)中。英特爾的OCI芯粒大大提高了帶寬、降低了功耗并延長了傳輸距離，有助于加速機(jī)器學(xué)習(xí)工作負(fù)載，進(jìn)而推動(dòng)高性能AI基礎(chǔ)設(shè)施創(chuàng)新。”

英特爾OCI（光學(xué)計(jì)算互連）芯粒

該OCI芯?？稍谠谧铋L可達(dá)100米的光纖上，單向支持64個(gè)32Gbps 通道，有望滿足AI基礎(chǔ)設(shè)施日益增長的對(duì)更高帶寬、更低功耗和更長傳輸距離的需求。它將有助于實(shí)現(xiàn)可擴(kuò)展的CPU和GPU集群連接，和包括一致性內(nèi)存擴(kuò)展及資源解聚的新型計(jì)算架構(gòu)。

AI應(yīng)用正在全球范圍內(nèi)被越來越多地部署，近期大語言模型和生成式AI的發(fā)展正在加速這一趨勢(shì)。對(duì)AI負(fù)載加速新需求而言，更大、更高效的機(jī)器學(xué)習(xí)模型將發(fā)揮關(guān)鍵作用。未來的計(jì)算平臺(tái)需要面向AI實(shí)現(xiàn)擴(kuò)展，因而需要指數(shù)級(jí)提升的I/O帶寬和更長的傳輸距離，以支持更大規(guī)模的處理器（CPU、GPU和IPU）集群，和資源利用更高效的架構(gòu)，如xPU解聚和內(nèi)存池化（memory pooling）。

電氣I/O（即銅跡線連接）帶寬密度高且功耗低，但傳輸距離短至不超一米。數(shù)據(jù)中心和早期AI集群中使用的可插拔光收發(fā)器模塊可以延長傳輸距離，但就AI工作負(fù)載的擴(kuò)展需求而言，其成本和功耗不可持續(xù)。xPU光電共封I/O解決方案可以在提高能效比、降低延遲和延長傳輸距離的同時(shí)，支持更高的帶寬，從而滿足AI和機(jī)器學(xué)習(xí)基礎(chǔ)設(shè)施的擴(kuò)展需求。

打個(gè)比方，在CPU和GPU中，用光學(xué)I/O取代電氣I/O進(jìn)行數(shù)據(jù)傳輸，就好比從使用馬車（容量和距離有限）到使用小汽車和卡車來配送貨物（數(shù)量更大、距離更遠(yuǎn)）。英特爾的OCI芯粒等光學(xué) I/O 解決方案，在性能和能耗方面實(shí)現(xiàn)了這一水平的提升，從而有助于AI的擴(kuò)展。

在完全集成的OCI芯粒中，英特爾利用了已實(shí)際驗(yàn)證的硅光子技術(shù)，集成了包含片上激光器的硅光子集成電路（PIC）、光放大器和電子集成電路。在2024年光纖通信大會(huì)上，英特爾展示了與自家CPU封裝在一起的OCI芯粒，但它也能與下一代CPU、GPU、IPU等SOC（系統(tǒng)級(jí)芯片）集成。

這一完全集成的OCI芯粒的雙向數(shù)據(jù)傳輸速度達(dá)4 Tbps，并兼容第五代PCIe。在2024年光纖通信大會(huì)現(xiàn)場(chǎng)，實(shí)時(shí)光學(xué)鏈路演示展示了通過單模光纖（SMF）跳線（patch cord）在兩個(gè)CPU平臺(tái)之間實(shí)現(xiàn)的發(fā)射器（Tx）和接收器（Rx）互連。CPU生成并測(cè)量了比特誤碼率（BER）。英特爾還展示了發(fā)射器的光譜（optical spectrum），包括單一光纖上200GHz間隔的八個(gè)波長，以及32Gbps發(fā)射器眼圖（eye diagram），表明信號(hào)質(zhì)量很強(qiáng)。

該芯粒目前單向支持64個(gè)32Gbps 通道，傳輸距離達(dá)100米（由于傳輸延遲，實(shí)際應(yīng)用中距離可能僅限幾十米）。它采用8對(duì)光纖，每根8波長密集波分復(fù)用（DWDM）。這種共封裝解決方案也非常節(jié)能，功耗僅為每比特5皮焦耳（pJ），而可插拔光收發(fā)器模塊的功耗大約為每比特15皮焦耳。對(duì)數(shù)據(jù)中心和HPC環(huán)境而言，超高的能效十分重要，有助于解決AI應(yīng)用的高能耗問題，提高可持續(xù)性。

英特爾研究院在硅光子領(lǐng)域已深耕超過25年，是硅光集成的開拓者和領(lǐng)導(dǎo)者。英特爾在業(yè)內(nèi)率先開發(fā)并向大型云服務(wù)提供商批量交付硅光子連接器件，這些產(chǎn)品具有領(lǐng)先的可靠性。

英特爾的主要差異化優(yōu)勢(shì)在于其直接集成技術(shù)，結(jié)合晶圓上激光器混合集成技術(shù)，可提高良率并降低成本。這一獨(dú)特的方法使英特爾能夠在實(shí)現(xiàn)卓越性能的同時(shí)保持高能效比。依托強(qiáng)大的量產(chǎn)平臺(tái)，英特爾已出貨超過800萬個(gè)硅光子集成電路，包含多達(dá)3200萬個(gè)片上集成激光器，時(shí)基故障率（FIT）小于0.1。時(shí)基故障率是一種廣泛使用的測(cè)量可靠性的方法，體現(xiàn)了故障率和發(fā)生故障的次數(shù)。

這些硅光子集成電路被封裝在可插拔收發(fā)器模塊中，部署于超大規(guī)模云服務(wù)提供商的大型數(shù)據(jù)中心網(wǎng)絡(luò)中，用于傳輸速率需求高達(dá)100、200和400 Gbps的應(yīng)用。面向傳輸速率需求達(dá)800 Gbps和1.6 Tbps的新興應(yīng)用，速度達(dá)200G/通道的硅光子集成電路正在開發(fā)中。

英特爾還正在探索新的硅光子制造工藝節(jié)點(diǎn)，該節(jié)點(diǎn)具有先進(jìn)的器件性能、更高的密度、更好的耦合性，并能大幅提高經(jīng)濟(jì)性。英特爾將繼續(xù)在片上激光器和性能、成本（芯片面積減少 40% 以上）和功耗（減少 15% 以上）等方面取得進(jìn)步。

英特爾研發(fā)的OCI芯粒目前尚處于技術(shù)原型（prototype）階段。英特爾正在與客戶合作，開發(fā)共封OCI和客戶SoC，作為光學(xué)I/O的解決方案。

英特爾的OCI芯粒推動(dòng)了高速數(shù)據(jù)傳輸技術(shù)的進(jìn)步。隨著AI基礎(chǔ)設(shè)施的不斷發(fā)展，英特爾將繼續(xù)推動(dòng)前沿技術(shù)創(chuàng)新，探索面向未來的連接技術(shù)。

新聞中心

英特爾實(shí)現(xiàn)光學(xué)I/O芯粒的完全集成

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)