大算力芯片，正在擁抱Chiplet

作者：時間：2024-04-08 來源：半導體產(chǎn)業(yè)縱橫

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

在和業(yè)內(nèi)人士交流時，有人曾表示：「要么業(yè)界采用 Chiplet 技術，維持摩爾定律的影響繼續(xù)前進，要么就面臨商業(yè)市場的損失。」隨著摩爾定律走到極限，Chiplet 被行業(yè)普遍認為是未來 5 年算力的主要提升技術。

本文引用地址：http://2s4d.com/article/202404/457250.htm

戰(zhàn)場已拉開，紛爭開始了

Chiplet 不算是新的技術，但是這股浪潮確實是近年來開始火熱的。

什么是 Chiplet？

Chiplet 俗稱芯粒，也叫小芯片，它是將一類滿足特定功能的 die（裸片），通過 die-to-die 內(nèi)部互聯(lián)技術實現(xiàn)多個模塊芯片與底層基礎芯片封裝在一起，形成一個系統(tǒng)芯片，以實現(xiàn)一種新形式的 IP 復用。

簡單來說，可以理解為將每個小的芯片用「膠水」縫合在一起，形成一個性能更強的大芯片。這也不算是一個新鮮的技術，例如：英特爾將兩個芯片（一個 CPU 和一個用于 CPU 大型 L2 高速緩存的快速靜態(tài)內(nèi)存芯片）放在一起，放入公司于 1995 年末推出的 Pentium Pro CPU 的封裝中。

也許去年，大部分廠商還沉浸在 Chiplet 技術的未來應用上，那到了今天 Chiplet 已經(jīng)成為各大廠商的產(chǎn)品中的必選角色。

首先來看 AMD，AMD 是選擇 Chiplet 最積極的廠商之一。

在 2019 年的時候，AMD 就初次嘗試了 Chiplet 封裝，將不同工藝節(jié)點的 CPU 內(nèi)核且 I/O 規(guī)格不同的芯片封裝在一起，顯著提高了能效和功能。

之后，AMD 又發(fā)布了實驗性產(chǎn)品，即基于 3D Chiplet 技術的 3D V-Cache。使用的處理器芯片是 Ryzen 5000，采用臺積電 3D Fabric 先進封裝技術，成功地將包含有 64MB L3 Cache 的 Chiplet 以 3D 堆疊的形式與處理器封裝在了一起。

從數(shù)據(jù)性能來看，采用 3D Chiplet 的原型芯片將性能平均提高了 12%。從這一點上，也能看到 3D Chiplet 對實際工作負載的提升有實質(zhì)性的貢獻。

不止在 CPU，AMD 在 GPU 方面也選擇了 Chiplet 技術。目前，AMD 發(fā)布的最新 MI300 系列芯片時，同樣采用 Chiplet 技術，8 個 GPU Chiplet 加 4 個 I/O 內(nèi)存 Chiplet 的設計，總共 12 個 5nm Chiplet 封裝在一起，使其集成的晶體管數(shù)量達到了 1530 億，高于英偉達 H100 的 800 億晶體管。這款芯片在推出時，也是打出了對標英偉達 H100 的口號。

此外，AMD 含 Chiplet 技術的 CPU 銷量占比也在不斷提高。根據(jù)德國電腦零售商 Mindfactory 數(shù)據(jù)，2021 年 10 月至 2022 年 12 月間 AMD CPU 的銷量中，含 Chiplet 技術的 CPU 銷量占比不斷提高，從約 80% 上升至約 97%。

再來看英特爾。英特爾的首次推出基于 Chiplet 設計的處理器是 Sapphire Rapids，時間在 2023 年 1 月。

具體來看，通過兩組鏡像對稱的相同架構的 building blocks，組合 4 個 Chiplets，獲得 4 倍的性能和互聯(lián)帶寬。每個基本模塊包含計算部分（CHA & LLC & Cores mesh，Accelerators）、memory interface 部分（controller，Ch0/1）、I/O 部分（UPI，PCIe）。通過將上述高性能組件組成基本的 building block，再通過 EMIB 技術進行 Chiplet 互聯(lián)，可以獲得線性性能提升和成本收益。

最后，來看英偉達。英偉達坐穩(wěn) GPU 領域霸主這一點毋庸置疑，而霸主英偉達在今年推出的「最強」GPU B200 也同樣采用 Chiplet 技術。GB200 超級芯片是由 2 顆 B200 GPU 和 1 顆 Arm 架構的 Grace CPU（中央處理器）組合而來。

由此可見，英特爾、AMD、英偉達都在自家的 CPU、GPU 上使用了 Chiplet 技術。這將 Chiplet 推入了一個全新的商業(yè)化階段。

Chiplet 這一錘，算是重重砸下了。

Chiplet 從 CPU 到 GPU

在之前傳統(tǒng)的 GPU 也是由一個中央工作負載處理器，將渲染任務發(fā)送到芯片內(nèi)的多個著色器塊之一。每個單元都被賦予一塊幾何體來處理、轉(zhuǎn)換為像素，然后對它們進行著色。

后來 AMD 發(fā)現(xiàn)，Chiplet 用在 CPU 上效果很好，并且降低了制造成本。于是在 GPU 上也選擇了放棄中央處理器，用多個小芯片取代單個硅塊，每個小芯片處理自己的任務。渲染指令以稱為命令列表的長序列發(fā)送到 GPU，其中所有內(nèi)容都稱為繪制調(diào)用。

AMD 2019 年 Chiplet 專利

該文件于 2019 年 6 月發(fā)布，即提交近兩年后，該功能已在 RDNA 2 中實現(xiàn)。AMD 于 2020 年開始推廣該架構，并于同年 11 月推出了首款配備全新 RT-texture 處理器的產(chǎn)品。

不同制程及封裝技術下的芯片良率、成本、面積的關系注：D 為缺陷密度，c 為負二項分布中的集群參數(shù)或 Seed』s model 中臨界值數(shù)量

摩爾定律沒死，但確實是老了，在 14nm 之后成本曲線就變了。5nm 工藝的成本相比 7nm 工藝增長了近 1 倍，3nm 工藝相比 5nm 工藝預計將增長近 1 倍。在半導體工藝、規(guī)模限制越來越大的情況下，傳統(tǒng)大芯片的策略確實是寸步難行。

總體來看，Chiplet 有四大優(yōu)點：

第一，通過將功能塊劃分為小芯片，那么不需要芯片尺寸的持續(xù)增加。這就提高了良率并簡化了設計和驗證的流程。

第二，每個小芯片是獨立的，那就可以選擇最佳工藝。邏輯部分可以采用尖端工藝制造，大容量 SRAM 可以使用 7nm 左右的工藝制造，I/O 和外圍電路可以使用 12nm 或 28nm 左右的工藝制造，這就大大降低了制造的成本。

第三，組合多樣，適合定制化，輕松制造衍生類型。比如說采用相同的邏輯電路但是不一樣的外圍電路，或相同外圍電路但不同的邏輯電路。

第四，不同制造商的小芯片可以混合使用，而不僅僅是局限在單個制造商內(nèi)。

這些特點都非常適合用在大算力芯片上。相較于傳統(tǒng)消費級芯片，算力芯片面積更大，存儲容量更大，對互連速度要求更高。采用 Chiplet 既可以降低成本提升良率，又可以允許更多計算核心的「堆料」，還能便于引入 HBM 存儲。

越接近摩爾定律極限如 5nm、3nm 和 2nm 的芯片走 Chiplet 設計路線越有意義。

清華大學交叉信息研究院特聘研究員、助理教授馬愷聲也分析過，到底什么樣的芯片適合使用 Chiplet：「具體到芯片應用來說，CPU 和 GPU 這種大芯片是適合的，對于大芯片來說，建議是超過 200 平方毫米，最好是超過 400 平方毫米的是適合做 Chiplet 的；如果僅從成本角度看，如 MCU 這樣本身價格較低的芯片目前是沒有必要的。」

我們也能看到，Chiplet 技術在 CPU 和 GPU 上的商用確實比較順利。

Chiplet 時代，代工廠偷偷賺大錢

Chiplet 制造步驟相對于封裝復雜度大幅提升，同時考慮到不同的連接方式對于精度的要求和工藝要求不同，制造過程分布在 IDM、晶圓廠和封裝廠。

這給臺積電、英特爾帶來了商機。

3nm 制程技術占據(jù)了臺積電晶圓總收入的 6%，5nm 和 7nm 分別占晶圓總收入 33% 和 19%。先進制程（7nm 及以下）占臺積電晶圓總收入的比重達到了 58%。

前文提到的 AMD 發(fā)布的 3D V-Cache 實驗性產(chǎn)品背后，是臺積電的先進半導體工藝技術和先進封裝技術。臺積電作為同時掌握了最先進半導體工藝和封裝技術的代工廠，其全球最頂尖代工廠的地位得到了鞏固，同時其在先進技術領域也將變得更加強勢。

那么臺積電的 7m、5nm 可以得到更好地利用。如果仔細來看臺積電的營收，在先進制程方面的收入使得其業(yè)績一路高升。

不過，對于臺積電來說，Chiplet 也帶來了新的挑戰(zhàn)。通過采用 Chiplet，臺積電避免了傳統(tǒng)的壟斷模式，使客戶理論上能夠從多個來源獲得其芯片。這增加了客戶的選擇自由度，促使了更加競爭激烈的市場環(huán)境。

不同于 AMD 和英偉達，英特爾一直在發(fā)展其 IDM 2.0 的戰(zhàn)略，將晶圓代工看得非常重要。

從代工這方面來看，Chiplet 對于英特爾也有不一樣的影響。

一方面，英特爾承諾過的 4 年交付 5 個工藝節(jié)點（intel 7、intel 4、intel 3、intel 20A、intel 18A），如果使用 Chiplet，那么英特爾可以避免為復雜的 CPU 或 GPU 執(zhí)行完整工藝所需的困難。

另一方面，英特爾還可以利用混合制造廠商（使用來自多個代工廠的 Chiplet 并將其打包）的概念來獲得代工廠商機。在去年，英特爾宣布與臺積電攜手打造全球首款符合 Chiplet 互連產(chǎn)業(yè)聯(lián)盟（UCIe）標準的多芯片封裝芯片，當中包含英特爾與臺積電各自生產(chǎn)的 IC。

值得注意的是，英特爾是第一個主動選擇，多源代工業(yè)務模式的廠商。

結語

Chiplet 的探索正在圍繞著 CPU 和 GPU 這兩大領域，但從長遠來看，隨著 Chiplet 產(chǎn)業(yè)鏈更加成熟，Chiplet 的發(fā)展將不局限于這類大芯片，而是會有更廣闊的運用空間。

Chiplet 的風行，也讓半導體產(chǎn)業(yè)必須有所調(diào)整，以建構出對應的完善生態(tài)系統(tǒng)。目前市場上的 Chiplet 產(chǎn)品，是各家大廠自行發(fā)展出來的成果，故目前半導體業(yè)內(nèi)存在多種不相通的 Chiplet 互連技術，導致 Chiplet 生態(tài)系呈現(xiàn)碎片化的局面。

目前在底層封裝層面，已經(jīng)有臺積電、英特爾等廠商提供 CoWOS、EMIB 等先進封裝，可以提供超高速、超高密度和超低延時的 Chiplet 互聯(lián)；在標準協(xié)議層面，也有眾多大廠領銜發(fā)布的 UCIe 1.0 版本，提供了跨片接口設計的指導和約束。

Chiplet 的春風在吹了。

新聞中心

大算力芯片，正在擁抱Chiplet

戰(zhàn)場已拉開，紛爭開始了

Chiplet 從 CPU 到 GPU

Chiplet 時代，代工廠偷偷賺大錢

結語

評論

相關推薦

技術專區(qū)

新聞中心

大算力芯片，正在擁抱Chiplet

戰(zhàn)場已拉開，紛爭開始了

Chiplet 從 CPU 到 GPU

Chiplet 時代，代工廠偷偷賺大錢

結語

評論

相關推薦

技術專區(qū)

大算力芯片，正在擁抱Chiplet

戰(zhàn)場已拉開，紛爭開始了

Chiplet 時代，代工廠偷偷賺大錢