加速器墻將成為后摩爾定律的新問(wèn)題嗎?
"摩爾定律告訴我們晶體管的尺寸會(huì)縮小,并且我們可以將更多的晶體管集成在一個(gè)特定的區(qū)域中,從而具備更強(qiáng)的處理能力以及更低的成本。50年來(lái),摩爾定律在這個(gè)行業(yè)中一直都十分有效,但如今這條定律已經(jīng)很難再維持下去了。摩爾定律是有關(guān)密度微縮的速率,但我們正以一種可預(yù)測(cè)的速度走向盡頭,再經(jīng)過(guò)幾個(gè)世代就會(huì)達(dá)到實(shí)體極限了。"
本文引用地址:http://2s4d.com/article/201902/397935.htm后摩爾時(shí)代的不適應(yīng)性
整整50年來(lái),計(jì)算機(jī)的底層元件都遵從著摩爾定律:在價(jià)格不變的情況下,集成在芯片上的晶體管數(shù)量每隔18到24個(gè)月將增加一倍,計(jì)算成本呈指數(shù)型下降。摩爾定律成就了各種技術(shù)變革,例如互聯(lián)網(wǎng)、基因組測(cè)序等。
然而現(xiàn)在,摩爾定律的趨勢(shì)第一次放緩了。芯片行業(yè)進(jìn)入了一個(gè)不確定的時(shí)代,在同樣的投入下,收益變得越來(lái)越低。芯片制造商面臨的一個(gè)經(jīng)濟(jì)問(wèn)題,相比與芯片體積,大多數(shù)人對(duì)芯片的價(jià)格更敏感,要求芯片要做到經(jīng)濟(jì)實(shí)用。隨著晶體管尺寸的不斷縮小,我們遇到了原子極限,先前標(biāo)準(zhǔn)、規(guī)則結(jié)構(gòu)的晶體管結(jié)構(gòu)已經(jīng)無(wú)法維系。
發(fā)展決定算力需突飛猛進(jìn)
在深度學(xué)習(xí)激發(fā)的人工智能熱潮下,AI計(jì)算系統(tǒng)設(shè)計(jì)與優(yōu)化的重要性愈發(fā)明顯。同時(shí)算法的發(fā)展對(duì)整個(gè)計(jì)算需求所造成的挑戰(zhàn)會(huì)變得更大,提高整個(gè)AI計(jì)算系統(tǒng)的性能與效率迫在眉睫。
人類的算力需求每3.43個(gè)月就會(huì)翻倍,每年大約增加10倍,這樣的發(fā)展趨勢(shì)將會(huì)繼續(xù)。在未來(lái),AI計(jì)算系統(tǒng)將要面臨計(jì)算平臺(tái)優(yōu)化設(shè)計(jì)、復(fù)雜異構(gòu)環(huán)境下計(jì)算效率、計(jì)算框架的高度并行與擴(kuò)展、AI應(yīng)用計(jì)算性能等挑戰(zhàn)。事實(shí)證明,我們真正需要的是超過(guò)現(xiàn)在100萬(wàn)倍的計(jì)算能力,而不僅僅是幾十倍的增長(zhǎng)。
從計(jì)算需求來(lái)看,AI計(jì)算系統(tǒng)的設(shè)計(jì)與優(yōu)化之路似乎任重道遠(yuǎn)。因此,推動(dòng)AI發(fā)展的動(dòng)力中,算力起到了最為關(guān)鍵的作用。算法是否有創(chuàng)新發(fā)展難以量化跟蹤,而數(shù)據(jù)的巨大體量也難以計(jì)算,但算力是可以量化的,雖然使用大量的算力暴露出了當(dāng)前AI算法不夠高效的問(wèn)題,但是,重要的技術(shù)突破依然必須在足夠的算力基礎(chǔ)上才能實(shí)現(xiàn)。
目前加速器芯片的類別
?、貵PU方面,形成了NVIDIA+AMD七三開(kāi)的市場(chǎng)格局,NVIDIA深度打造應(yīng)用場(chǎng)景生態(tài),構(gòu)建壁壘,而AMD作為同時(shí)具備CPU+GPU模塊化能力的廠商,有望在云算力時(shí)代顛覆原有服務(wù)器芯片產(chǎn)業(yè)格局,成為最大贏家;
②FPGA方面,技術(shù)壁壘高,多用于軍事領(lǐng)域,美國(guó)廠商壟斷市場(chǎng),國(guó)內(nèi)處于漸進(jìn)式突破階段,份額還非常低;
③ASIC方面對(duì)下游細(xì)分領(lǐng)域需求量有較高要求,典型如區(qū)塊鏈應(yīng)用,國(guó)內(nèi)廠商發(fā)展迅速,ASIC領(lǐng)域是國(guó)內(nèi)廠商有望實(shí)現(xiàn)彎道超車的較好選擇。
芯片專用化可能起到負(fù)面作用
芯片專用化,使得各類原本運(yùn)行在通用CPU之上的軟件及其內(nèi)部常見(jiàn)算法得以在定制化硬件上帶來(lái)更快的處理速度,被認(rèn)為是摩爾定律失效之后,我們能夠在接下來(lái)一到兩代芯片當(dāng)中繼續(xù)驅(qū)動(dòng)計(jì)算能力保持增長(zhǎng)的一種方法。但它不會(huì)長(zhǎng)時(shí)間奏效。根據(jù)行業(yè)專家預(yù)測(cè),芯片專用化不能產(chǎn)生摩爾定律所能產(chǎn)生的那種收益,加速器的發(fā)展速度將放緩,而且這會(huì)比預(yù)期的更快發(fā)生。
研究人員評(píng)估了特定應(yīng)用集成電路(簡(jiǎn)稱ASIC)上的視頻解碼、GPU上的游戲幀速率、FPGA上的卷積神經(jīng)網(wǎng)絡(luò)以及ASIC上的比特幣采礦。結(jié)果并不令人振奮:專用芯片的增益很大程度上取決于每平方毫米硅上可用晶體管數(shù)量的增加。換句話說(shuō),離開(kāi)了摩爾定律,芯片專用化本身的力量是有限的。
多年來(lái),芯片制造商已經(jīng)使用了各種手段來(lái)跟上摩爾定律的步伐,包括增加更多的核心,驅(qū)動(dòng)芯片內(nèi)部的線程,以及利用各種加速器。然而更快更好的系統(tǒng)不僅需要通過(guò)處理器技術(shù)實(shí)現(xiàn),還需要通過(guò)架構(gòu)來(lái)實(shí)現(xiàn)。系統(tǒng)架構(gòu)本身也面臨著諸多挑戰(zhàn),特別是功率和密度,這也限制了性能。
加速器芯片使算力時(shí)代的高算力需求得以實(shí)現(xiàn),云計(jì)算服務(wù)器的算力配置模式,將使得CPU+加速器的模塊化能力成為未來(lái)主流,加速器芯片的競(jìng)爭(zhēng)力以及模塊化綜合競(jìng)爭(zhēng)力成為未來(lái)半導(dǎo)體產(chǎn)業(yè)競(jìng)爭(zhēng)的重要因素。
后摩爾時(shí)代要擺脫慣性束縛
實(shí)際上,我們每年都希望電子產(chǎn)品都能遵循這樣的物理定律:人們可以以同樣的價(jià)格得到能力更強(qiáng)的更好的產(chǎn)品。因此,當(dāng)我們說(shuō)摩爾定律不再適用于我們今天的產(chǎn)業(yè)發(fā)展時(shí),這種影響是十分深遠(yuǎn)的。
如果你無(wú)法輕松規(guī)劃這些新方法,保持后摩爾定律時(shí)代18到24個(gè)月的增長(zhǎng)率依然是徒勞的。生態(tài)系統(tǒng)中有CPU,但是如果你想利用CPU和其他加速器,你需要開(kāi)放的方案。有些人采用專門的方案,這很有用,但成本高昂。
要想在后摩爾時(shí)代的世界保持繼續(xù)進(jìn)步,需要半導(dǎo)體行業(yè)與不同的制造商、學(xué)術(shù)界進(jìn)行工程合作,創(chuàng)造易于編程環(huán)境的開(kāi)放標(biāo)準(zhǔn)。相信公司可以添加更多晶體管,并能管理成本曲線。將這一切結(jié)合起來(lái),也許它真的能夠促進(jìn)計(jì)算進(jìn)一步加速。
評(píng)論