谷歌TPU秘密武器,6小時完成芯片布局!新AI算法登Nature
作者 | 心緣
編輯 | 漠影
芯東西6月10日報道,谷歌用人工智能提高芯片設計速度的研究,已發(fā)表于國際頂級期刊Nature。原本人類專家需要花費數(shù)周時間的芯片布局設計,通過一種深度強化學習方法,平均6小時內(nèi)就能完成這個過程。這項工作并不完全新穎,包括谷歌人工智能負責人Jeff Dean在內(nèi)的谷歌工程師團隊,在一年前發(fā)表的一篇預印版論文中已經(jīng)提到了這一技術。谷歌博客:
https://ai.googleblog.com/2020/04/chip-design-with-deep-reinforcement.html而在Nature最新發(fā)表的論文中,谷歌原始研究團隊稱其已微調(diào)該技術,來設計即將推出的、以前未宣布的谷歌張量處理單元(TPU)的生成,專門用于加速人工智能(AI)。
該論文題目為《一個快速芯片設計的布圖布局方法》(A graph placement methodology for fast chip design)。如果這一技術公開,或有助于讓資金受限的初創(chuàng)企業(yè)開發(fā)滿足特定需求的自家芯片,并縮短芯片設計周期,使硬件更好地適應快速發(fā)展的研究。
芯片設計自動化挑戰(zhàn)大,性能難達人類水準
微芯片面積約為幾十到數(shù)百毫米平方,容納數(shù)千個組件,如內(nèi)存、邏輯和處理單元,外加許多公里的超薄電線將這些組件連接在一起。設計過程中,全局布線是最復雜和耗時的階段之一,這涉及研究這些組件的最佳放置位置,就像建筑師設計建筑的內(nèi)部空間一樣,如何以最好的規(guī)劃容納所有所需的固定裝置和配件。在這項研究中,谷歌研究人員提出了一種基于深度強化學習的芯片布局方法,目標是將電路組件和標準單元的網(wǎng)表節(jié)點映射到一個芯片畫布上,從而優(yōu)化功率、性能和面積(PPA),同時遵守對布局密度和布線擁塞的限制。自20世紀60年代以來,提出了許多自動化的芯片平面圖方法,但沒有一種方法達到人類專家上手所能實現(xiàn)的性能。此外,芯片復雜性的指數(shù)增長,使這些技術難以在現(xiàn)代芯片上使用。人類芯片設計師往往必須使用電子設計自動化(EDA)工具迭代數(shù)月,對芯片網(wǎng)表進行RTL描述,并手動將該網(wǎng)表放置在芯片畫布上。基于這種長達72小時的反饋,設計師要么得出結(jié)論,認為設計標準已經(jīng)達到,要么向上游RTL設計師提供反饋,后者然后修改低級代碼,使放置任務更容易。而谷歌提出的深度強化學習方法,是一種具有泛化能力的芯片布局方法。通過領域自適應策略,它能夠跨芯片進行推廣,可以自行從經(jīng)驗中學習,使其芯片布局設計能力變得更好、更快。
用游戲系統(tǒng)、10000個芯片布局訓練
訓練跨芯片推廣的AI驅(qū)動設計系統(tǒng)具有挑戰(zhàn)性,因為它需要學會優(yōu)化將所有可能的芯片凈列表放置在所有可能的畫布上。芯片平面圖類似于具有各種部件、板塊和獲勝條件的游戲,因此可以用包含狀態(tài)、動作、狀態(tài)轉(zhuǎn)移、獎勵四個關鍵要素的強化學習方法,通過訓練一個智能體,用累計獎勵最大化,讓AI優(yōu)化芯片布局的能力持續(xù)增強。從空芯片開始,谷歌團隊的系統(tǒng)按順序放置組件,直到實現(xiàn)一個完全布局的網(wǎng)表。為了指導系統(tǒng)選擇首先放置的組件,組件按降序由大到小排序;首先放置較大的組件會減少以后沒有可行放置的可能性。
訓練該系統(tǒng)需要創(chuàng)建一個包含10000個芯片布局的數(shù)據(jù)集,其中輸入是與給定布局相關的狀態(tài),標簽是布局的獎勵(即線長和擁塞)。研究人員首先選擇了5個不同的芯片凈網(wǎng)表,并用AI算法為每個網(wǎng)表創(chuàng)建2000個不同的布局位置。該系統(tǒng)花了48個小時在英偉達Volta顯卡和10個CPU上“預訓練”,每個CPU都有2GB的RAM。在一項測試中,谷歌研究人員將他們的系統(tǒng)建議與手動基線——谷歌TPU物理設計團隊創(chuàng)建的上一代TPU芯片設計——進行比較。結(jié)果顯示,系統(tǒng)和人類專家均生成符合時間和擁塞要求的可行位置,而AI系統(tǒng)在面積、功率和電線長度方面優(yōu)于或媲美手動布局,同時滿足設計標準所需的時間要少得多。
未來工作:或為芯片設計全自動化奠定基礎
谷歌稱其系統(tǒng)推廣和生成“高質(zhì)量”解決方案的能力具有“重大影響”,為與芯片設計過程的早期階段進行優(yōu)化提供了機會。大規(guī)模的架構探索以前是不可能的,因為評估給定的架構需要數(shù)月的努力。谷歌團隊認為,修改芯片的設計或?qū)π阅墚a(chǎn)生巨大影響,并可能為芯片設計過程的完全自動化奠定基礎。此外,雖然谷歌團隊的系統(tǒng)被用于設計下一代谷歌TPU,但研究人員認為,它可以應用于芯片設計以外的有影響力的放置規(guī)劃問題,包括城市規(guī)劃、疫苗測試分發(fā)和大腦皮層映射等一系列應用。
結(jié)語:減少設計芯片時間,或優(yōu)化供應鏈流程
Nature社論認為,谷歌這一研究大大縮短設計芯片所需的時間,將極大地幫助提速供應鏈,但技術專長必須廣泛共享,以確保公司的“生態(tài)系統(tǒng)”真正全球化。產(chǎn)業(yè)必須確保節(jié)省時間的技術不會趕走擁有必要核心技能的人。更易訪問、更高效的微芯片將為自動駕駛汽車、5G通信和AI的發(fā)展提供動力,這些機會不容錯過。但重要的是,要考慮使用自動化設計技術的更廣泛影響,特別是需要具有相關技能和專業(yè)知識的人,和提高目前手動完成流程的人的技能。芯片布局無論是手動還是自動化,都需要計算、電子工程和設備物理方面的專業(yè)知識。這些技能需要時間來學習,在一個生產(chǎn)微芯片以外許多其他產(chǎn)品的行業(yè)中,同樣非常需要這些技能。至關重要的是,相關公司要理解這一點,并采取適當步驟來滿足其本地和全球的技能需求。自動化往往加劇了人們對裁員的擔憂。事實上,保持電子行業(yè)的勢頭,需要有遠見的人和公司來創(chuàng)造下一代微芯片。來源:Nature,VentureBeat
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權請聯(lián)系工作人員刪除。
linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)霍爾傳感器相關文章:霍爾傳感器工作原理
電度表相關文章:電度表原理
霍爾傳感器相關文章:霍爾傳感器原理