博客專欄

EEPW首頁 > 博客 > HBM(高帶寬存儲器)簡介

HBM(高帶寬存儲器)簡介

發(fā)布人:旺材芯片 時間:2024-08-04 來源:工程師 發(fā)布文章

本文主要源于幾篇產(chǎn)業(yè)報告,從中提取了一些相對重要且客觀信息進行梳理。文中圖表較多可能會影響閱讀,其實整體思路很簡單主要分為四個板塊:1、AI時代的內(nèi)存墻問題;2、HBM用來解決這個問題并闡述了HBM的概念及技術(shù)特點;3、HBM的制造工藝;4、HBM的核心材料

AI算力時代的內(nèi)存墻問題

隨著摩爾定律的不斷迭代,CPU運行速度快速提升,CPU主頻高達5GHz,DRAM內(nèi)存性能取決于電容充放電速度以及DRAMCPU之間的接口帶寬,存儲性能提升遠慢于CPU,DRAM內(nèi)存帶寬成為制約計算機性能發(fā)展的重要瓶頸DDR4內(nèi)存主頻為2666~3200MHz,帶寬為6.4GB/s,但是在AI應(yīng)用中(高性能計算/數(shù)據(jù)中心),算力芯片的數(shù)據(jù)吞吐量峰值在TB/s主流的DRAM內(nèi)存或顯存帶寬一般為幾GB/s到幾十GB/s量級,與算力芯片存在顯著的差距,“內(nèi)存墻由此形成。Transformer類模型為例,模型大小平均每兩年翻410,AI硬件上的內(nèi)存大小僅僅是以每年翻2倍的速率在增長;內(nèi)存墻問題不僅與內(nèi)存容量大小有關(guān)也包括內(nèi)存的傳輸帶寬;內(nèi)存容量和傳輸?shù)乃俣榷即蟠舐浜笥谟布挠嬎隳芰?/span>。

圖片

典型的DRAM,每個芯片有八個DQ引腳(數(shù)據(jù)傳輸路徑,用作處理器和存儲器之間通信的數(shù)據(jù)總線,必須具備讀寫功能,所以具備雙向特性),即數(shù)據(jù)輸入/輸出引腳。組成DIMM模塊單元后(雙列直插式存儲模塊安裝在PCB板上的存儲模塊,包含多個存儲芯片,被用作PC或者服務(wù)器中的主存儲單元),共有64DQ引腳。隨著數(shù)據(jù)處理速度等方面的要求不斷提高數(shù)據(jù)傳輸量也不斷增加,傳統(tǒng)DRAM DQ引腳的數(shù)量已無法保證數(shù)據(jù)快速通過。傳統(tǒng)DRAM需要大量空間與CPU/GPU等處理器通信同時封裝的形式看需要通過引線鍵合或PCB進行連接,DRAM不可能對海量數(shù)據(jù)進行并行處理。

圖片

HBM的概念

HBM(High Bandwidth Memory)意為高帶寬存儲器,是一種面向需要極高吞吐量的數(shù)據(jù)密集型應(yīng)用程序的DRAM,HBM 的作用類似于數(shù)據(jù)的中轉(zhuǎn)站”,就是將使用的每一幀每一幅圖像等圖像數(shù)據(jù)保存到幀緩存區(qū)中,等待GPU 調(diào)用。

HBM 在帶寬、功耗、封裝體積方面具備明顯優(yōu)勢。按照不同應(yīng)用場景,行業(yè)標準組織 JEDEC DRAM 分為三個類型標準 DDR、移動 DDR 以及圖形 DDR,圖形 DDR 中包括 GDDR  HBM。相比于標準的 DDR4、DDR5 等產(chǎn)品 GDDR  HBM 為代表的圖形 DDR 具備更高的帶寬,其中HBM 在實現(xiàn)更大帶寬的同時也具備更小的功耗和封裝尺寸。

圖片

圖片

圖片

HBM 有效解決了內(nèi)存墻的問題在中高端 GPU 中得到廣泛應(yīng)用。高帶寬存儲器HBM(Highband Memory)使用硅通孔TSV和微凸塊技術(shù)垂直堆疊多個DRAM可以顯著提升數(shù)據(jù)處理速度,性能提升的同時尺寸有所減少。2013年開始,JEDEC制定了高帶寬存儲器系列標準(包括HBM,HBM2,HBM2E,HBM3),其中,HBM3相比2代標準有顯著的提升,芯片單個引腳速率達到6.4Gbit/s,總帶寬超過1TB/s。

圖片

圖片

HBM的技術(shù)特點

主要可分為高速/高帶寬更低功耗;擴展容量

高速/高帶寬HBM2EHBM3的單引腳最大輸入/輸出(I/O)速度分別達3.2Gbit/s6.4Gbit/s,低于GDDR5存儲器的7Gbit/s,HBM的堆棧方式可通過更多的I/O數(shù)量使總帶寬遠高于GDDR5,例如HBM2帶寬可以達到307 GB/s。海力士官網(wǎng)數(shù)據(jù)顯示:HBM3E的數(shù)據(jù)處理速度,相當于可以在1s內(nèi)下載230部全高清(FHD)級電影(每部5千兆字節(jié),5GB),優(yōu)化后可用于處理人工智能領(lǐng)域的海量數(shù)據(jù)。

圖片

圖片

更低功耗采用微凸塊和TSV技術(shù)存儲和算力芯片信號傳輸路徑短,單引腳I/O速率較低,使HBM具備更好的內(nèi)存功耗能效特性。DDR3存儲器單引腳I/O帶寬功耗為基準,HBM2I/O功耗比明顯低于DDR3/DDR4GDDR5,相比于GDDR5存儲器,HBM2的單引腳I/O帶寬功耗比數(shù)值降低42%。

圖片


圖片

HBM制造工藝

HBM 制造工藝包括 TSV、Bumping 和堆疊等工藝環(huán)節(jié)。HBM 是由多個 DRAMdie 堆疊而成,利用硅通孔(TSV)和微凸塊(Microbump) die 之間相連接,多層 DRAMdie 再與最下層的 Basedie 連接然后通過凸塊(Bump)與硅中階層(interposer)互聯(lián)。HBM  GPU、CPU  ASIC 共同鋪設(shè)在硅中階層上,通過 CoWoS  2.5D/3D 封裝工藝相互連接硅中介層通過 CuBump 連接至封裝基板(Package Substrate)最后封裝基板再通過錫球與下方的PCB 基板相連。

圖片

圖片

圖片

圖片

HBM工藝流程中所需要的設(shè)備清單如下


HBM堆疊核心:MR-MUF(向上堆疊方式

SK海力士表示,通過先進的MR-MUF堆疊技術(shù)加強了工藝效率和產(chǎn)品性能的穩(wěn)定性;隨著對高速高容量的需求不斷增加,散熱問題預(yù)計將成為HBM產(chǎn)品持續(xù)迭代的重大技術(shù)障礙。MR-MUF:將半導(dǎo)體芯片堆疊后,為了保護芯片和芯片之間的電路在其空間中注入液體形態(tài)的保護材斜,并固化的封裝工藝技術(shù)與每堆疊一個芯片鋪上薄膜型材料的方式對比,工藝效率高,散熱方面也更有效。具體步驟:1)連接芯片的微凸塊采用金屬塑封材料;2)一次性融化所有的微凸塊,連接芯片與電路;3)芯片與芯片之間或者芯片與載板之間的間隙填充,絕緣和塑封同時完成


HBM堆疊技術(shù)發(fā)展趨勢

海力士正在加速開發(fā)新工藝混合鍵合”,截止目前,HBMDRAM芯片之間通過微凸塊材料進行連接通過混合鍵合,芯片可以在沒有凸塊的情況下連接,從而顯著減小芯片的厚度。當間距小到20um以內(nèi),熱壓鍵合過程中細微傾斜使得釬料變形擠出而發(fā)生橋連短路,難以進一步縮減互聯(lián)間距HBM芯片標準厚度為720um,預(yù)計2026年左右量產(chǎn)的第六代HBM4需要縱向垂直堆疊16DRAM芯片,當前的封裝技術(shù)很難讓客戶滿意所以混合鍵合的應(yīng)用被認為是必然的趨勢。2023年海力士用于第三代HBM產(chǎn)品(HBM2e)測試混合鍵合技術(shù)規(guī)格低于HBM4產(chǎn)品。同時海力士擬計劃將新一代的HBM與邏輯芯片堆疊在一起取消硅中介層。




混合鍵合的定義混合鍵合是一種永久鍵合,將介電鍵合(siox)與嵌入式金屬(Cu)結(jié)合起來互聯(lián),形成電介質(zhì)和金屬-金屬鍵。使用緊密嵌入電介質(zhì)中的微小銅焊盤可以提供比銅微凸塊多1000倍的I/O連接支持3D封裝和先進的存儲立方體更高的互連密度。混合鍵合可以實現(xiàn)低于10um的鍵合間距當接近10u尺寸時帶有焊錫尖端的銅凸塊會遇到可靠性問題,從而導(dǎo)致轉(zhuǎn)向混合鍵合。


新一代HBM材料-LMC

根據(jù)我國集成電路材料專題系列報告》,90%的集成電路采用環(huán)氧塑封料(Epoxy Molding Compound,簡稱EMC)作為包封材料環(huán)氧塑封料可分為餅狀、片狀、顆粒狀(GMC)和液態(tài)(LMC)四種。其中,餅狀環(huán)氧塑封料主要用于傳統(tǒng)封裝采用傳遞成型法對芯片實現(xiàn)包封;后三者主要用于先進封裝。片狀、GMCLMC采用壓縮法實現(xiàn)芯片包封。其中GMC具有操作簡單、工時較短成本較低等優(yōu)勢;LMC具備可中低溫固化、低吸水率以及高可靠性等優(yōu)點。LMC可應(yīng)用于HBM封裝中。SK海力士在其HBM3產(chǎn)品上采用了MR-MUF(Mass Reflow-Molded Underfil)技術(shù),大幅提高了散熱性能。然而相比固態(tài)EMC,LMC填料含量低

圖片

圖片

來源: 光學(xué)與半導(dǎo)體綜研


*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。



關(guān)鍵詞: HBM

相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉