新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 基于TalusVortexFX的32/28納米節(jié)點設(shè)計方案

基于TalusVortexFX的32/28納米節(jié)點設(shè)計方案

作者: 時間:2010-12-16 來源:網(wǎng)絡(luò) 收藏

  如worst-case和best-casePVT等特定系列條件就是我們俗稱的“角點”。在技術(shù),晶粒間與晶粒內(nèi)PVT差異十分明顯,解決大量模式和角點的工作是必不可少的。而且,前文提過的低功耗技術(shù)還會讓這一問題進一步復雜化。例如:在多電源多電壓(MSMV)技術(shù)情況下,可能一個電壓島的電壓值為其允許電壓范圍內(nèi)最低電壓,另一個電壓島的電壓值為其允許電壓范圍內(nèi)最高電壓,而其余電壓島的電壓值則會在這兩者之間。又如:有的芯片具有不同操作模式、擁有的一個或多個電路模塊位于在電源切斷的晶粒中心都將導致所需分析的角點情況顯著增加。

  目前工具的問題在于:實現(xiàn)期間,芯片必須可在MMMC前景下進行優(yōu)化。許多現(xiàn)有系統(tǒng)通過先考量已假設(shè)的worst-case情景、然后對別的條件進行優(yōu)化的方式來著手處理優(yōu)化問題。遺憾的是,這可能導致過度悲觀主義,造成次優(yōu)性能。甚至更糟的是,如果這些關(guān)于哪些是worst-case情景的假設(shè)是錯誤的,那么結(jié)果可能是得到完全不管用的芯片。Talus1.2內(nèi)置有自帶MMMC處理功能,這意味著優(yōu)化過程不會漏掉任何情景。此外,Talus1.2的高速度和大容量還意味著,它能夠考慮到的不只是較小子集的實現(xiàn)情景,而是這款工具需要處理的整個系列的簽核情景。因此,Talus1.2可提供更好的性能和更短的實現(xiàn)周期。

  以DistributedSmartSync技術(shù)增強TalusVortex的性能

  前文所提及的物理實現(xiàn)流程每個步驟都是屬于計算密集型問題。而且為了解決伴隨技術(shù)而增加的復雜性,每個必須執(zhí)行的計算量也在提高。此外,當器件中所集成的功能越來越多時,的規(guī)模和復雜性會隨著每個節(jié)點而提高,物理實現(xiàn)相關(guān)的計算需求也會相應(yīng)增加。

  再有一個因素就是:功能模塊的尺寸(為實現(xiàn)模塊功能所需的單元數(shù)量)也會隨著每項功能中包裝進越來越多特性而不斷增加。一些物理實現(xiàn)團隊偏愛層次化,而另外一些團隊則更喜歡使用“扁平化”,因為他們感覺在使用層次化時放棄了太多東西。

  如果工具具有處理更大型電路模塊的能力,那么生產(chǎn)率就可得到即時的提升。例如:定義和微調(diào)層次化模塊間約束是極為耗時的資源密集型工作。如果這些工具具有處理更大型電路模塊的能力,那么就不需要定義子模塊間約束,因為不會有任何子模塊存在。這會大大提高生產(chǎn)率。

  問題在于:多數(shù)布局布線解決方案都局限于只能處理幾百萬個單元。這常迫使物理實現(xiàn)工程師由于工具的局限性而不得不人工將電路模塊進行分割。而這也對工程師生產(chǎn)率造成了影響。

  除非通過某些方式進行增強,不然的話即便目前最先進的Talus1.2布局布線解決方案的實際容量也只在200萬到500萬個單元之間,所提供的生產(chǎn)率為每天100-150萬單元。結(jié)果會造成一種由容量驅(qū)動的生產(chǎn)率差距。為了處理節(jié)點,實現(xiàn)包括1000萬以上個單元的扁平電路模塊是必不可少的,如圖7所示(另見側(cè)邊欄)。

  

物理實現(xiàn)工具對扁平容量需求永不滿足

  圖7.物理實現(xiàn)工具對扁平容量需求永不滿足。

  在過去,一直是通過提供多線程功能來增強物理實現(xiàn)工具的容量和性能。在有些情況下,這些功能是被“生搬硬套”到的傳統(tǒng)工具上,效果有限。相較之下,Talus1.2中所有工具均完全內(nèi)置有自帶的多線程功能。

  前文已說過,多線程對工具的作用十分有限;阿姆達爾定律(Amdahl’slaw)等計算機科學定律,(伴隨在其核心運行的每個線程)線程的數(shù)量越來越多所起到的效果卻越來越小。簡單來說,就是告訴我們,任何程序的加速均會受到并行數(shù)量的限制(也就是說,程序的最長序列片斷關(guān)系到程序的其它部分),如圖8所示。

  

阿姆達爾定律反映了多線程的局限性

  圖8.阿姆達爾定律反映了多線程的局限性。

  對于被用來創(chuàng)建ASIC/ASSP/SoC器件的物理實現(xiàn)工具來說,這些工具的并行部分約占到了50%到75%。就如我們從圖8中所看到的“甜蜜點(sweetspot)”,而在best-case情景下,使用8-10個處理核心,只可獲得約3倍的加速。

  幸運的是,通過將物理實現(xiàn)任務(wù)分發(fā)到多臺機器上就可以克服阿姆達爾定律所定義的局限性。如圖9所示,采用全新DistributedSmartSync(分布式智能同步)技術(shù)的提供了與貫穿物理實現(xiàn)流程所有步驟(時鐘樹綜合除外,這種方法對它起不了什么作用)的智能同步技術(shù)相結(jié)合的獨特分布式管理。微捷碼將這款最新解決方案稱為,它以DistributedSmartSync技術(shù)增強了Talus1.2。

  

技術(shù)增強的TalusVortexFX流程的高級視圖

  技術(shù)增強的流程的高級視圖



評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉