新的存儲器研究使密度躍升100倍
沿著材料工程前沿的新研究有望為計算設備帶來真正的性能改進。以馬庫斯·海倫布蘭德德等人為首的研究小組和劍橋大學的相關人員認為,一種基于氧化鉿層的新材料,通過電壓變化的鋇尖峰隧穿,融合了存儲器和處理綁定材料的特性。這意味著這些設備可以用于數(shù)據存儲,提供 10 到 100 倍于現(xiàn)有存儲介質的密度,或者它可以被用作處理單元。
本文引用地址:http://2s4d.com/article/202307/448915.htm這項研究發(fā)表在《科學進展》雜志上,為我們指明了一條道路,通過這條道路,我們的計算設備可能會獲得更高的密度、性能和能源效率。事實上,基于該技術(稱為連續(xù)范圍)的典型 USB 記憶棒可以容納比我們目前使用的 USB 記憶棒多 10 到 100 倍的信息。
正如 JEDEC 指出的那樣,RAM 的密度每四年翻一番,RAM 制造商需要數(shù)十年的時間才能最終達到與該技術今天所顯示的相同的密度水平。
該設備也是神經形態(tài)計算隧道中的一盞燈。就像我們大腦中的神經元一樣,這種材料(稱為電阻開關存儲器)有望同時用作存儲和處理介質。這在我們當前的半導體技術中根本不會發(fā)生:存儲單元所需的晶體管和材料設計安排與處理單元所需的晶體管和材料設計安排非常不同(主要是在耐用性方面,例如不遭受性能下降的能力),目前還沒有辦法將它們合并。
這種無法合并它們的情況意味著信息必須在處理系統(tǒng)及其各種緩存(當考慮現(xiàn)代 CPU 時)以及其外部內存池之間持續(xù)流動。在計算中,這被稱為馮諾依曼瓶頸,這意味著具有獨立內存和處理能力的系統(tǒng)將從根本上受到它們之間的帶寬(通常稱為總線)的限制。這就是為什么所有半導體設計公司(從 Intel 到 AMD、Nvidia 等)都設計專用硬件來加速這種信息交換,例如 Infinity Fabric 和 NVLink。
問題在于這種信息交換會產生能源成本,而這種能源成本目前限制了可實現(xiàn)性能的上限。當能量循環(huán)時,也會存在固有的損耗,這會導致功耗增加(當前硬件設計的硬性限制,也是半導體設計中日益重要的優(yōu)先事項)以及熱量的增加——這是另一個硬性限制,導致越來越奇特的冷卻解決方案的開發(fā),試圖讓摩爾定律暫時失效。當然,還有可持續(xù)性因素:預計在不久的將來,計算將消耗全球能源需求的 30%。
「在很大程度上,能源需求的爆炸式增長是由于當前計算機存儲技術的缺陷造成的,」劍橋大學材料科學與冶金系的第一作者馬庫斯·海倫布蘭德博士說?!冈趥鹘y(tǒng)計算中,一側有內存,另一側有處理,數(shù)據在兩者之間重新洗牌,這既需要能量又需要時間?!?/span>
正如您可能想象的那樣,合并內存和處理的好處是相當驚人的。雖然傳統(tǒng)存儲器只能具有兩種狀態(tài)(一或零),但電阻開關存儲器件可以通過一系列狀態(tài)改變其電阻。這使得它能夠在更多的電壓下運行,從而可以編碼更多的信息。在足夠高的水平上,這與 NAND 領域中發(fā)生的過程大致相同,每個單元位數(shù)的增加對應于存儲單元設計中解鎖的更多可能電壓狀態(tài)。
區(qū)分處理和存儲的一種方法是,處理意味著信息正在按照其切換周期請求的速度進行寫入和重寫(添加或減去、轉換或重組)。存儲意味著信息需要在較長時間內保持靜態(tài)——例如,可能因為它是 Windows 或 Linux 內核的一部分。
為了構建這些突觸設備,正如論文所提到的,研究團隊必須找到一種方法來解決材料工程瓶頸,即均勻性問題。由于氧化鉿 (HfO2) 不具有任何原子級結構,因此決定或破壞其絕緣性能的鉿和氧原子會隨機沉積。這限制了它在傳導電子(電力)方面的應用;原子結構越有序,造成的阻力就越小,速度和效率就越高。但研究小組發(fā)現(xiàn),在非結構化氧化鉿薄膜中沉積鋇(Ba)會產生高度有序的鋇橋(或尖峰)。而且由于它們的原子結構更加結構化,這些橋可以更好地允許電子流動。
海倫布蘭德說:「這些材料真正令人興奮的是它們可以像大腦中的突觸一樣工作:它們可以在同一個地方存儲和處理信息,就像我們的大腦一樣,這使得它們在快速發(fā)展的人工智能和機器學習領域非常有前途?!?/span>
這些照片是用透射電子顯微鏡 (TEM) 拍攝的,展示了當動態(tài)變化的鋇尖峰穿過氧化鉿沉積時,氧化鉿的沉積順序增加(無序和自然沉積,如圖 A 所示)。(來源:劍橋大學/Markus Hellbrand 等人)
但當研究團隊發(fā)現(xiàn)他們可以動態(tài)改變鋇尖峰的高度,從而可以對其電導率進行細粒度控制時,樂趣就開始了。他們發(fā)現(xiàn)尖峰可以以約 20 納秒的速率提供開關能力,這意味著它們可以在該窗口內改變其電壓狀態(tài)(從而保存不同的信息)。他們發(fā)現(xiàn)開關耐久性 >10^4 個周期,內存窗口 >10。這意味著雖然該材料速度很快,但它目前可以承受的最大電壓狀態(tài)變化次數(shù)約為 10,000 次循環(huán)。
它相當于 MLC(多級單元)技術的耐用性,這自然會限制其應用,使用這種材料作為處理介質(其中電壓狀態(tài)快速變化,以保存計算及其中間結果的存儲)。
粗略地計算一下,大約 20 ns 的切換導致工作頻率為 50 MHz(轉換為每納秒的周期數(shù))。當系統(tǒng)全速處理不同狀態(tài)時(例如,作為 GPU 或 CPU 工作),這意味著鋇橋將在 0,002 秒左右停止運行(達到其耐用極限)。對于處理單元來說,它的性能似乎不夠。
就是存儲容量「密度高 10 到 100 倍」的 USB 記憶棒的用武之地。這些突觸設備可以訪問比當今最寬敞的 USB 記憶棒中最密集的 NAND 技術更多的中間電壓狀態(tài),是其 10 或 100 倍。
在鋇電橋的耐用性和開關速度方面還有一些工作要做,但看起來該設計已經是一個誘人的概念證明。更好的是,半導體行業(yè)已經使用氧化鉿,因此需要克服的工具和物流噩夢更少。
但這里有一個特別巧妙的產品可能性:想象一下,該技術已經改進到可以制造并可用于設計 AMD 或 Nvidia GPU(目前其運行頻率約為 2 GHz)。在某個世界中,顯卡具有重置出廠狀態(tài),完全作為內存運行(現(xiàn)在想象一下具有 10 TB 容量的顯卡,與我們假設的 USB 記憶棒相同)。
想象一下這樣一個世界:AMD 和 Nvidia 提供的本質上是可編程 GPU,基于連續(xù)范圍的 GPU 芯片在最大存儲能力方面進行了產品堆疊(記住比當前 USB 密度高 10 到 100)。如果您是一位人工智能愛好者,試圖構建自己的大型語言模型 (LLM),您可以對 GPU 進行編程,以便適量的合成設備(這些神經形態(tài)晶體管)運行處理功能—隨著復雜性的增加,我們無法確定模型最終會產生多少萬億個參數(shù),因此內存將變得越來越重要。
能夠決定圖形卡中的晶體管是完全用作內存還是完全用作養(yǎng)眼放大器以將圖形設置提高到 11 個,這完全取決于最終用戶;從休閑游戲玩家到高性能計算 (HPC) 安裝人員。即使這意味著我們芯片部件的壽命會明顯縮短。
總之,這是一項新技術,不要操之過急,與所有技術一樣,當它準備就緒時,它就會到來。
評論