AI計算時代,25年工齡的RRAM漸入佳境
RRAM,一個非易失性新型存儲器,突然火了。
該新型存儲器是以非導性材料的電阻在外加電場作用下,在高阻態(tài)和低阻態(tài)之間實現(xiàn)可逆轉(zhuǎn)換為原理制造而成的存儲器。由于結(jié)構(gòu)簡單、集成度高、低功耗等優(yōu)點,一直被認為是最有可能突破傳統(tǒng)器件限制的新型器件。
而RRAM一路走來,卻萬分坎坷。從開始“上班”到不被看好,再到小有名氣,RRAM花了25年:
2008年,惠普公司提出一種被稱為憶阻器(memristor)的 RRAM,將其用在面向未來的系統(tǒng)“The Machine”上。但惠普在這項技術(shù)上努力多年之后卻轉(zhuǎn)向了一種更加傳統(tǒng)的內(nèi)存方案,退出了憶阻器的道路。
對于一項新型技術(shù)來說,大廠長時間堅持后未果并拋棄,最為致命,更何況是兩個:
2014年前后,自2011年開始與索尼一同開發(fā)RRAM的美光退出項目,轉(zhuǎn)而開始與英特爾合作重點開發(fā)另一種存儲技術(shù) 3D XPoint。
從1990s到2010s,RRAM走過了功能機時代,跨過了智能終端時代,一直被研究,從未被大規(guī)模應(yīng)用,幾乎被時代遺忘。
而現(xiàn)如今,RRAM又被大廠“相中”,同時多了一大批堅定的擁護者:
2022年11月,英飛凌和臺積電宣布,兩家公司正準備將臺積電的電阻式RAM(RRAM)非易失性存儲器(NVM)技術(shù)引入英飛凌的下一代AURIX?微控制器(MCU)。
國內(nèi)外多個半導體初創(chuàng)公司一心撲在RRAM上:
● 成立于2015年的Weebit Nano,試圖利用RRAM,滿足物聯(lián)網(wǎng)(IoT)設(shè)備、機器人、5G通信和人工智能等一系列新電子產(chǎn)品中對更高性能和更低功耗內(nèi)存解決方案日益增長的需求。
● 成立于2019年的昕原半導體,打造基于RRAM技術(shù)的新型存儲產(chǎn)品及相關(guān)衍生品,服務(wù)于AIoT、人工智能、數(shù)據(jù)中心、智能汽車等新興應(yīng)用。
● 成立于2020年的億鑄科技,研發(fā)基于RRAM的全數(shù)字存算一體大算力AI芯片,服務(wù)于云端數(shù)據(jù)中心、智能駕駛等對算力密度、能效比需求很高的應(yīng)用場景。
······
本文想要探討的是:RRAM為何在現(xiàn)在讓大廠回心轉(zhuǎn)意?RRAM要如何完成自己的逆襲之路?
“團寵”RRAM
逆襲始于2021年。
過去業(yè)內(nèi)對于RRAM最大的質(zhì)疑,無外乎“工藝不成熟、商業(yè)化遲遲不能落地”。
而在2021年,晶圓代工廠臺積電現(xiàn)身,為RRAM站臺:宣布40nmRRAM進入量產(chǎn),28nm和22nmRRAM準備量產(chǎn)。
隨后,國內(nèi)同樣傳來利好消息:2022年2月,昕原半導體主導建設(shè)的RRAM 12寸中試生產(chǎn)線順利完成了自主研發(fā)裝備的裝機驗收工作,實現(xiàn)中試線工藝流程的通線,并成功流片(試生產(chǎn))。
質(zhì)疑被一步步打破,RRAM正式迎來自己的逆襲之路。
首先是在學界,RRAM存在感直線上升,從探討其潛力、可行性轉(zhuǎn)變到證明其可靠性。
在2008-2016年前后,學界的文章關(guān)于RRAM的描述大多是“有潛能”,團隊大多是提出解決方案:
● 2009年,惠普實驗室論證了利用 Crosslatch 系統(tǒng)可以較為簡單的實現(xiàn)堆棧,形成立體的內(nèi)存結(jié)構(gòu),RRAM在速度、密度等方面均具有極大的潛能,能有效替代目前的存儲單元。
● 2016年,在VLSI(超大規(guī)模集成電路)國際研討會上,中國科學院微電子研究所劉明院士的團隊提出了自對準高性能自選通RRAM結(jié)構(gòu),為高密度、低成本三維垂直交叉陣列的制備提供解決方案。
······
而在2022年,大多文章是在推動RRAM的快速落地,通過設(shè)計、實驗證明其有著足夠的優(yōu)勢:
● 在2022年度ISSCC會議上,臺積電發(fā)表六篇關(guān)于存內(nèi)計算存儲器IP的論文,大力推進基于RRAM的存內(nèi)計算方案。
● 在中國半導體十大研究進展候選推薦(2022-025)中,有著RRAM的身影:
以中國科學院微電子研究所微電子劉明院士、張鋒研究員為主導的團隊,首次設(shè)計實現(xiàn)了基于三維垂直結(jié)構(gòu)阻變存儲器的存算一體宏單元芯片,實驗表明三維阻變存儲器不但可以完整的實現(xiàn)存算一體技術(shù),同時證明了其在低功耗以及高算力、高密度方面的優(yōu)勢。
其次是在產(chǎn)界,芯片設(shè)計、制造廠商紛紛將RRAM納入到自己的規(guī)劃之中:
在代工廠方面,臺積電、Crossbar、聯(lián)電、中芯國際以及昕原半導體等均已建立了可量產(chǎn)的商業(yè)化RRAM產(chǎn)線:
例如2022年6月,昕原半導體宣布其RRAM新型存儲技術(shù)通過嚴苛測試,“昕·山文”安全存儲系列RRAM產(chǎn)品成功交付工控領(lǐng)域頭部企業(yè)禾川科技,實現(xiàn)在工業(yè)自動化控制核心部件的商用量產(chǎn)。
在商業(yè)化方面,RRAM在市面上主要有兩大應(yīng)用方向,分別是存儲應(yīng)用與存算應(yīng)用。
在存儲應(yīng)用上,目前有英特爾、松下等大廠將RRAM用于MCU領(lǐng)域:
● 2013年7月,松下推出了8位MCU,該MCU集成了0.18微米RRAM技術(shù),成為第一個將RRAM技術(shù)商業(yè)化的大廠;
● 2022年11月,英特爾宣布,將非易失性存儲器RRAM引入英飛凌的下一代 AURIX ?微控制器 (MCU)
除此之外,在去年的各大展會、論壇上,也有多家初創(chuàng)企業(yè)認可了RRAM的發(fā)展?jié)摿Γ岢鲇媱澥褂没蛘咿D(zhuǎn)向RRAM作為其未來發(fā)展AI芯片的存儲介質(zhì)。
在存算應(yīng)用上,目前僅有國內(nèi)的億鑄科技,試圖基于RRAM通過存算一體架構(gòu)實現(xiàn)AI大算力芯片,將其應(yīng)用在中心側(cè)與邊緣側(cè)的應(yīng)用場景中,著眼于解決目前AI芯片“能效比不理想、算力密度不滿足市場要求、軟件部署成本高及效率低”等痛點。
學界、產(chǎn)界正將RRAM推向“C位”,視為團寵,這背后是AI市場的驅(qū)動。
現(xiàn)階段,自動駕駛、智算中心、AR/VR元宇宙、ChatGPT等高密度計算場景的蓬勃發(fā)展,帶動了以AI芯片為首的一大批新型半導體技術(shù)的爆發(fā)。
機會與挑戰(zhàn)并存,隨著AI算力需求走向100Tops、1000Tops甚至更高水平,以及對于能效比需求走向10TOPS/W、甚至100TOPS/W以上,傳統(tǒng)馮·諾伊曼架構(gòu)“招架不住”了。
這是因為在馮·諾伊曼架構(gòu)之下,芯片的存儲、計算區(qū)域是分離的。計算時,數(shù)據(jù)需要在兩個區(qū)域之間來回搬運,而隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,數(shù)據(jù)已經(jīng)面臨“跑不過來”的境況,成為高效能計算性能和功耗的瓶頸,也就是業(yè)內(nèi)俗稱的“存儲墻”。
存儲墻相應(yīng)地也帶來了能耗墻、編譯墻(生態(tài)墻)的問題。例如編譯墻問題,是由于大量的數(shù)據(jù)搬運容易發(fā)生擁塞,編譯器無法在靜態(tài)可預(yù)測的情況下對算子、函數(shù)、程序或者網(wǎng)絡(luò)做整體的優(yōu)化,只能手動、一個個或者一層層對程序進行優(yōu)化,耗費了大量時間。
這“三堵墻”導致算力無謂浪費:據(jù)統(tǒng)計,在大算力的AI應(yīng)用中,數(shù)據(jù)搬運操作消耗90%的時間和功耗,數(shù)據(jù)搬運的功耗是運算的650倍。
于是,能夠打破這三堵墻的“存算一體架構(gòu)”漸入人們的視野。該架構(gòu)將存儲和計算的融合,徹底消除了訪存延遲,并極大降低了功耗。同時,由于計算完全耦合于存儲,因此可以開發(fā)更細粒度的并行性,獲得更高的性能和能效。
目前,實現(xiàn)存算一體有兩種存儲器件的選擇:
● 第一種是基于易失性存儲器,例如DRAM和SRAM,但由于DRAM制造工藝和邏輯計算單元的制造工藝不同,無法實現(xiàn)良好的片上融合,而SRAM難以進行片上大規(guī)模集成,同時,因為SRAM和DRAM是易失性存儲器,需要持續(xù)供電來保存數(shù)據(jù),仍存在功耗的問題。
● 第二種是結(jié)合非易失性新型存儲器。新型存儲器通過阻值變化來存儲數(shù)據(jù),而存儲器加載的電壓等于電阻和電流的乘積,相當于每個單元可以實現(xiàn)一個乘法運算,再匯總相加便可以實現(xiàn)矩陣乘法。在這種情況下,同一單元就可以完成數(shù)據(jù)存儲和計算,消除了數(shù)據(jù)訪存帶來的延遲和功耗,是真正意義上的存算一體。
另外,傳統(tǒng)存儲器所具有的易失性、微縮性差等問題可以被新型非易失性存儲器很好地解決。RRAM在AI大算力場景下似乎更具優(yōu)勢:
目前可用于存算一體的成熟存儲器有NOR FLASH、SRAM、DRAM、RRAM、MRAM等。相比之下,RRAM具備低功耗、高計算精度、高能效比和制造兼容CMOS工藝等優(yōu)勢:
也就是說,AI計算整體市場的驅(qū)動,引發(fā)了RRAM在存算一體這一方向的爆發(fā)。隨著人工智能市場規(guī)模不斷擴大,屬于RRAM的市場爆發(fā)很快就會到來,學界、產(chǎn)界難免要“蜂擁而至”。
AI大算力,RRAM的“用武之地”
當我們回顧存儲器的發(fā)展時發(fā)現(xiàn),目前主流的存儲介質(zhì)NOR FLASH,同樣經(jīng)歷了不被看好階段:
2000年前后的功能機時代,手機對內(nèi)存的要求不高,NOR Flash憑借著NOR+PSRAM的XIP架構(gòu),更快的讀取速度、可隨機訪問等特點,得到快速發(fā)展。
好景不長,沒過幾年NOR Flash市場便不斷萎縮:
2009—2016 年 NOR Flash 市場規(guī)模一路下降至低于20億美元,存儲大廠三星、美光等公司都逐步退出NOR市場。這是因為,到了智能機時代,大量吃內(nèi)存的APP涌現(xiàn),NOR的容量小、成本高的缺點無法被掩蓋,逐漸被容量充足、成本更低的NAND給取代。
但就在各大廠商關(guān)停NOR產(chǎn)線的同時,NOR Flash喜迎“第二春”。最主要的原因是,下游需求旺盛的AMOLED急需NOR Flash來“救場”。
隨著手機廠商蘋果選擇了AMOLED屏幕,AMOLED的滲透率得到了大幅提升,AMOLED相較于LCD而言,優(yōu)點眾多,但亮度不均勻、存在殘像仍是它面臨的兩個主要難題,也就需要用到補償技術(shù)。
業(yè)內(nèi)紛紛選擇外部補償模式(內(nèi)部補償模式成本過高,技術(shù)難以達到):掛一個存儲器隨時解決AMOLED面板的藍色光會隨時間消退的問題。
此時,NOR Flash的高可靠性、快速讀取使其比NAND Flash更為合適,且在外部補償模式下,屏幕對于容量的要求并不高。
于是,NOR Flash的需求又被快速帶動起來,華邦、兆易創(chuàng)新(目前國內(nèi)NOR Flash龍頭)迅速崛起。
可以看到,找到合適的賽道,是以往存儲器大放光彩的轉(zhuǎn)折點。
RRAM與AI大算力賽道,也同樣如此。
原先,大家對RRAM的期望是純存儲應(yīng)用,希望其成為下一代主流存儲技術(shù)。但其容量和閃存相比,差別還很大,故在存儲應(yīng)用領(lǐng)域,RRAM并不是最佳的選擇,也就一直“被耽誤”。
如今,在AI大算力時代,由于存算一體架構(gòu)解決了存儲墻等問題,可以極大降低功耗,提升運算能效比。同時,RRAM工藝逐漸成熟,可以支持大算力芯片的量產(chǎn)。此時,RRAM具備的“低功耗、低延遲性、高密度”等優(yōu)勢愈發(fā)凸顯,通過將RRAM存儲技術(shù)與存算一體架構(gòu)結(jié)合,無疑會產(chǎn)生1+1>2的效果,從而打造高算力、高能效比的AI芯片。
而在AI時代的多個應(yīng)用中,RRAM更適用于AI大算力賽道。
AI大算力賽道,正面臨著“井噴”的需求:
根據(jù)IDC、浪潮信息聯(lián)合發(fā)布的《2022-2023中國人工智能計算力發(fā)展評估報告》顯示,2021年中國智能算力規(guī)模達到155.2EFLOPS,預(yù)計2026年將達到127.4EFLOPS,年復(fù)合增長率達到52.3%。
這是因為,隨著技術(shù)的突破、模型規(guī)模的不斷增長,需要消化更大規(guī)模的數(shù)據(jù),也意味著更高的算力需求。據(jù)OpenAI統(tǒng)計,從2012年到2020年,人工智能模型訓練消耗的算力增長了30萬倍,平均每3.4個月翻一番超過了摩爾定律的每18個月翻番的增速。
故,為滿足對算力的要求,各行各業(yè)各地都在建設(shè)智算中心:
1月11日,由國家信息中心聯(lián)合浪潮信息發(fā)布的《智能計算中心創(chuàng)新發(fā)展指南》顯示,當前全國范圍形成智算中心建設(shè)的熱潮:全國目前有超過30個城市正在建設(shè)或提出建設(shè)智算中心,整體布局以東部地區(qū)為主,并逐漸向中西部地區(qū)拓展。
AI大算力的下游市場“嗷嗷待哺”,基礎(chǔ)設(shè)施正快馬加鞭地建設(shè),RRAM“大顯身手”指日可待:
據(jù)國內(nèi)基于RRAM設(shè)計存算一體AI大算力芯片的億鑄科技創(chuàng)始人、董事長兼CEO熊大鵬博士介紹,基于RRAM的存算一體AI大算力芯片可以在不增加物理空間的前提下,大大提升算力密度,大幅度降低能耗,減少采購和運維成本。
假以時日,RRAM將在AI大算力賽道上造就下一個里程碑。
評論