談?wù)勅绾卫肍PGA開發(fā)板進(jìn)行ASIC原型開發(fā)
ASIC設(shè)計在尺寸和復(fù)雜性上不斷增加,現(xiàn)代FPGA的容量和性能的新進(jìn)展意味著這些設(shè)計中的2/3能夠使用單個FPGA進(jìn)行建模。然而,這些設(shè)計中仍然保留有1/3(那就是說,所有ASIC設(shè)計中的1/9)要求一個基于多個FPGA的原型開發(fā)板。
本文引用地址:http://2s4d.com/article/201710/365616.htm在不太遙遠(yuǎn)的過去,對ASIC設(shè)計團(tuán)隊而言,在這類情況下主要的解決方案就是在內(nèi)部建立他們自己的定制多個FPGA的原型開發(fā)板。然而,今天,使用現(xiàn)成的多個FPGA原型開發(fā)板——例如,由Synplicity公司的原型開發(fā)伙伴生產(chǎn)的開發(fā)板——與合適的設(shè)計工具相結(jié)合能夠節(jié)省數(shù)周時間,否則的話將花費幾個月的驗證時間以及在NRE費用上花費數(shù)萬美元。
本文首先討論了ASIC驗證能夠采用的主要技術(shù)。接著,文章考慮了與使用一個現(xiàn)成的產(chǎn)品相比,建立一個定制的多個FPGA的原型開發(fā)板的優(yōu)勢和缺陷。最后,論文介紹了目前最先進(jìn)的用于驗證大型設(shè)計的分割和綜合設(shè)計工具,其采用內(nèi)部開發(fā)或現(xiàn)成的多個FPGA的原型開發(fā)板。
可供選擇的驗證技術(shù)
今天高端ASIC,例如那些在手機(jī)、通訊、圖形子系統(tǒng)以及信號處理應(yīng)用中使用的,經(jīng)常包含多個CPU和DSP內(nèi)核,其結(jié)合了硬件加速器、外圍設(shè)備、接口和存儲器管理內(nèi)核。(由于這些討論的目的,術(shù)語ASIC被假設(shè)包括了ASSP和SoC器件。)所以,為了滿足芯片的市場需求,盡可能早的在設(shè)計階段開發(fā)、端口、集成、調(diào)試和驗證任何嵌入式軟件的內(nèi)容。
ASIC的RTL全功能驗證——其本身與任何嵌入式軟件——是ASIC設(shè)計過程中最耗費時間和最困難的部分之一。統(tǒng)計表明今天ASIC設(shè)計中的70%要求重制。除了費用極其昂貴之外,重制能夠引起項目失去其市場空間,這將嚴(yán)重?fù)p害公司的聲譽和金融底線。
對ASIC設(shè)計者開放的三個主要驗證選擇是仿真,模擬和FPGA原型開發(fā)。
*仿真:基于軟件的仿真被廣泛使用,但即使在一個真正的高端(并且,相對昂貴)的計算機(jī)平臺運行時,其運行比實際的ASIC硬件慢六到十個數(shù)量級,這使得其成為一項極大花費時間并且效率極差的技術(shù)。為了提供整個系統(tǒng)的尺寸認(rèn)識,軟件仿真能夠典型地達(dá)到僅僅幾Hz相當(dāng)?shù)乃俣?那就是,設(shè)計的系統(tǒng)時鐘相對真實時間每秒鐘的幾個周期)。實際上,這意味著僅僅在一小部分設(shè)計中能夠?qū)崿F(xiàn)廣泛的軟件驗證。
*模擬:基于硬件的模擬是另一個可供選擇的方法,但它仍然比實際的ASIC硬件至少慢三個數(shù)量級,因為大量的有關(guān)的復(fù)用技術(shù)將驗證速度減慢到僅僅500 KHz到2 MHz。此外,這種方法在預(yù)算和資源方面(依賴于模擬器的大小,每個相等的門電路成本能夠從25美分到一美元)是極其昂貴的。設(shè)計者需要的是一種可供選擇的方法,這將允許他們以較低的風(fēng)險和成本投放市場。
*基于FPGA的原型開發(fā):在許多情況下,“快速”驗證設(shè)計是必要的。例如,就視頻處理芯片來說,部分驗證可能包含評估視頻輸出流的主觀品質(zhì)。相似地,在嵌入式軟件中驗證硬件要求極高的速度。其答案就是使用運行在10到80 MHz速度下的多個FPGA原型開發(fā)板,其相等于(或相當(dāng)于)真實時間的ASIC速度(“真實激勵輸入,真實響應(yīng)輸出”)。當(dāng)將設(shè)計定制開發(fā)板與使用現(xiàn)成的開發(fā)板進(jìn)行比較時,后者——當(dāng)與恰當(dāng)?shù)脑O(shè)計工具結(jié)合時——能夠削減數(shù)周時間,不然的話,將花費數(shù)月的驗證時間并且(在每個相等的門電路為一美分的典型值下)節(jié)省數(shù)萬美元的NRE費用。
所關(guān)心的同樣是,除了提供一個軟件開發(fā)平臺和硬件的軟件驗證之外,該公司設(shè)計ASIC簡單地要求盡可能快的完成設(shè)計的全部功能;例如,證明硬件可以進(jìn)行商業(yè)展示。
全定制與現(xiàn)成的原型開發(fā)板
大約在本文寫作前的三至五年,所有多個FPGA的原型開發(fā)板是“建立你自己的”全定制品種。相反,今天有著眾多現(xiàn)成的多個FPGA的原型開發(fā)板供應(yīng)商群體。
提供一些參考,傳統(tǒng)的硬件模擬目前的市場是每年一億美元。比較起來,在過去幾年中,沒有任何人真正注意到,現(xiàn)成的多個FPGA的原型開發(fā)板工業(yè)已經(jīng)增長到硬件模擬市場規(guī)模的四分之三。
工程師認(rèn)為任何通用的都是次最優(yōu)的。事實上,工程師經(jīng)常希望建立他們自己的定制原型開發(fā)板,因為他們認(rèn)為其性能將更好,他們相信與真實的世界接口將更容易,這些接口將更接近于他們想要的,他們認(rèn)為這將減少項目成本,并且這將減少產(chǎn)品推向市場的時間。讓我們依次列出這些觀點:
*更好的性能:在包含了兩個或三個以上FPGA的原型開發(fā)板情況下,定制實現(xiàn)方式將超過它的現(xiàn)成對應(yīng)物的性能是非常不可能的。這是因為設(shè)計這樣一塊電路板要求非常高水平的知識和經(jīng)驗,這只能通過在幾年內(nèi)設(shè)計數(shù)代這樣的電路板得到提高。
*消除創(chuàng)新:如果一項ASIC設(shè)計適合單個的FPGA,然后設(shè)計和實現(xiàn)一塊定制的電路板是相對簡單的。比較起來,在一項要求兩個FPGA的ASIC設(shè)計的情況下,該問題變得非常令人感興趣;并且,當(dāng)使用三個或更多的FPGA時,事情變得按指數(shù)規(guī)律增加復(fù)雜性。
*消除接口:如果一項ASIC設(shè)計適合單個的FPGA,然后有一些令人信服的原因來設(shè)計定制電路板。其中一個原因是,在同一塊卡上按照任何接口邏輯實現(xiàn)該FPGA通常是有意義的。然而,在多個FPGA的原型開發(fā)板的解決方案中,通過使用很知名的現(xiàn)成電路板以及集中努力在特制的接口卡設(shè)計上,接口問題幾乎總是很簡單的。
*減少成本:設(shè)計和實現(xiàn)高端多個FPGA原型開發(fā)板要求大量的專業(yè)設(shè)計工程師和版圖工程師,這將比簡單的購買現(xiàn)成的電路板增加非常大的成本。
*減少產(chǎn)品推向市場的時間:即使對一家專業(yè)設(shè)計和實現(xiàn)多個FPGA原型開發(fā)板的公司而言,高端電路板的制作能夠很容易的花費掉9個月(并且這假設(shè)多個工程師和版圖設(shè)計師分多班倒班工作)的時間。不必驚訝,一個非專業(yè)的團(tuán)隊將幾乎肯定花費更長的時間,這能夠很容易的造成項目落后于它的進(jìn)度表,并且失去它的市場空間。作為一個多個FPGA原型開發(fā)板設(shè)計問題復(fù)雜性的例子,考慮來自Dini集團(tuán)的DN8000K10電路板。Dini集團(tuán)是Synplicity原型開發(fā)計劃的合作伙伴成員。
DN8000K10是一個USB 2.0主機(jī)邏輯原型系統(tǒng),其能夠用二到十六個高容量的FPGA來組裝。在其最高的配置中,該電路板能夠被用于代表保守值相當(dāng)于24,000,000 ASIC門的原型設(shè)計。
DN8000K10的設(shè)計和實現(xiàn)共花費九個月的時間。最為該項目的一部分,六位版圖工程師分兩班輪班工作了幾個月。最終的產(chǎn)品是28層的電路板,其芯片間通訊是在350 MHz下采用低壓差分信號(LVDS)實現(xiàn)的。(在設(shè)計管腳受限的情況下,每個LVDS管腳對支持集成的SERDES,這能夠提供高達(dá)10:1的復(fù)用。)在這一復(fù)雜度上,噪聲的處理問題和信號完成性問題要求很高的知識和經(jīng)驗水平。這一水平的電路板完全超過了今天現(xiàn)成的自動布線工具能夠找到解決方案的能力的一至兩個數(shù)量級;所以,每個管腳是“手工挑選”,并且每條路徑是“手工連接”——沒有使用自動布線(除了該電路板周圍的外圍設(shè)備之外)。
手工分割和綜合多個FPGA設(shè)計
在手工分割的情況下,任何ASIC中心結(jié)構(gòu)(門控時鐘,Synopsys的DesignWare?實例等),在原始的RTL源代碼中,在進(jìn)行分割之前,不得不手工將它們翻譯為與它們的FPGA相等同的代碼。除其它東西之外,這直接導(dǎo)致了兩個分離的代碼流,這可能失去同步,從而導(dǎo)致在FPGA原型和ASIC之間所代表的功能不同。
當(dāng)開始分割處理時,工程師們嘗試將不同的功能模塊組集合在一起,在這里每組在不同的FPGA上實現(xiàn)。這種組合(分割)以門級的傳統(tǒng)方式實現(xiàn)。最近,一些流程支持在RTL級分組,此時每個分成的組通過傳統(tǒng)的FPGA綜合工具,并且僅在這一點上,不同F(xiàn)PGA的實際資源利用是已知的。
所有這些方案都有一個問題,就是對于不同組的面積和資源的影響而言,工程師們是“臨時的盲人”,這導(dǎo)致了許多耗時的迭代。首先,工程師根據(jù)“A模塊可能將消耗‘xxx’的資源,而模塊B可能要求‘yyy’的資源”而進(jìn)行“估算”。這些估算是根據(jù)大量“分組”命令,然后綜合(在基于RTL分割的情況下),然后是結(jié)果的分析,以及然后是大量的“取消組”和“再次分組”命令來估算不同的實現(xiàn)方式。
該任務(wù)由于這一事實而進(jìn)一步混淆,該事實就是這些原型經(jīng)常被FPGA上的I/O管腳的數(shù)量所限制;一個無效的解決方案很容易耗費一個器件上100%的I/O資源,然而與此同時,僅僅其相對少量的內(nèi)部邏輯資源可以實現(xiàn)。為了克服這些I/O限制,I/O的多重分組和/或在多個FPGA中復(fù)制同一個邏輯模塊是必要的。(為了達(dá)到特定的性能目標(biāo),邏輯復(fù)制也是經(jīng)常要求的。)
假設(shè)在這種原型中使用的每個FPGA可能有超過1000個管腳,一項管理連接的電子表格方法能很容易地包含幾千個單元。不足為奇地是,記錄分配給每個FPGA的模塊和連接矩陣(在不同F(xiàn)PGA之間的連接)是一項繁重的任務(wù),這將是資源密集型的、耗時的以及容易出錯的。
自動分割和綜合多個FPGA設(shè)計
來自Synplicity的CerTIfy? RTL原型開發(fā)工具是業(yè)內(nèi)時間最長和最強大的多個FPGA分割和綜合工具。很令人感興趣的是,當(dāng)CerTIfy軟件在上世紀(jì)90年代晚期創(chuàng)立時,對ASIC設(shè)計團(tuán)隊而言,沒有任何現(xiàn)成的多個FPGA原型開發(fā)板能夠得到。在那時,CerTIfy軟件被設(shè)計成一個ASIC團(tuán)隊設(shè)計他們自己的定制的多個FPGA原型開發(fā)板的輔助工具。
使用CerTIfy軟件,工程師們能夠定義電路板上的FPGA的數(shù)量和類型以及它們之間的互連線。隨后,該數(shù)據(jù)被用于對通過多個FPGA進(jìn)行ASIC設(shè)計自動地分割RTL,并且將被分割的RTL綜合成用于FPGA編程的配置文件。
一旦工程師們已經(jīng)使用Certify工具來定義電路板的基本結(jié)構(gòu),來自該軟件的輸出之一是描述FPGA以及它們之間連接的網(wǎng)表。以Verilog來描述的該網(wǎng)表的格式由Synplicity定義,并且是知名的*.vb(Verilog模版)格式。
設(shè)計團(tuán)隊希望建立他們自己的定制電路板今天仍然使用這種技術(shù)。這一點使得Synplicity的*.vb格式很快變成這種類型應(yīng)用的事實上的工業(yè)標(biāo)準(zhǔn)?,F(xiàn)在,每個現(xiàn)成的多個FPGA原型開發(fā)板供應(yīng)商采用通用的*.vb文件交付他們的電路板,其作為定義每塊開發(fā)板結(jié)構(gòu)的輸入被讀入到Certify軟件。
Certify工具能夠采用Verilog、VHDL和混合語言進(jìn)行設(shè)計。該流程中的第一個要素是采用Certify軟件,自動將任何ASIC專用代碼轉(zhuǎn)換為相當(dāng)?shù)腇PGA結(jié)構(gòu)。就目前現(xiàn)成的多個FPGA原型開發(fā)板而言,用戶簡單地通知軟件使用下拉式列表框的開發(fā)板的類型,該列表框包括來自所有主要第三方供應(yīng)商所提供的開發(fā)板。(換句話說,如果這是一塊定制的電路板,Certify工具有能力建立一個在傳輸過程中的“虛擬的”多個FPGA開發(fā)板,接下來這塊虛擬的開發(fā)板能夠作為建立真實電路板的基礎(chǔ)來使用。)接下來,Certify軟件用于通過多個FPGA自動分割設(shè)計(圖 2)。
與Certify軟件緊密集成在一起的是Synplicity的HDL分析器,其以高級的層次化的模塊圖以及接著綜合相應(yīng)的門級電路的形式,自動地產(chǎn)生設(shè)計的技術(shù)獨立的圖形視圖。Certify和HDL分析器工具在HDL源代碼和模塊級以及門級電路之間,支持全雙向交叉探測,所以允許設(shè)計者在設(shè)計以及定位感興趣的信號和邏輯功能之間,進(jìn)行快速定位。除設(shè)計的各種其他視圖之外,Certify軟件提供一個形成原型開發(fā)板的FPGA的圖形表示(第6頁圖3)。這些虛擬器件中的每一個有兩個關(guān)聯(lián)的“溫度計型”顯示:其反映I/O的應(yīng)用和器件的其他面積/資源應(yīng)用。
以I/O和相關(guān)的邏輯資源以及FPGA和在FPGA之間的布線資源的認(rèn)識為基礎(chǔ),Certify軟件能夠自動地實現(xiàn)管腳分配和交互地執(zhí)行分割——通過簡單地拖曳代碼模塊和將它們下拉到不同的FPGA——或者兩種技術(shù)可以混合使用。
Certify軟件提供大量非常強大的工具來幫助分割任務(wù)。例如,接下來的分割,軟件能夠分析結(jié)果和向用戶提出使用Certify管腳復(fù)用(CPM)的時機(jī),信號的復(fù)合設(shè)置是一起復(fù)用來減輕在相關(guān)器件I/O資源上的負(fù)載。除了在多個器件上促進(jìn)邏輯復(fù)制外,Certify工具也提供位片應(yīng)用,其中寬的數(shù)據(jù)路徑結(jié)構(gòu)能夠?裂成更小的分支。此外,Certify軟件提供成熟的“撕裂”能力,借此將大的模塊分解成更小的部分(這些部分能夠依次分配給不同的FPGA)。
作為一個候選的分割實現(xiàn)方式就是建立,其他非常有用的特性使其能夠被命名和保存。這允許用戶維持對多個可選擇的分割方案的控制。這種能力能夠與Certify軟件的影響分析特征一道使用,其允許用戶就在該多個FPGA開發(fā)板上能夠得到的面積和I/O而論,估計布局和/或移動邏輯。而不是用戶不得不推測這個邏輯應(yīng)該被分配給哪個FPGA,影響分析產(chǎn)生關(guān)于以那個分割決定為基礎(chǔ)的特定信息。
一旦分割已經(jīng)被執(zhí)行,Certify軟件用于綜合與不同的FPGA器件有關(guān)的代碼流。該工具使用同一個基本的綜合技術(shù),就是起重要作用的Synplicity的主導(dǎo)市場的Synplify Pro? FPGA綜合引擎。例如,Certify軟件充分利用Synplicity的BEST? (Behavior Extracting Synthesis Technology?)算法,其分析RTL和在主要綜合步驟前實現(xiàn)高級優(yōu)化。并且,Certify工具以擁有Synplify Pro軟件的先進(jìn)的綜合能力為自豪,例如資源共享、寄存器平衡、重定時、復(fù)制以及再次綜合。
這個過程一個關(guān)鍵的方面是Certify軟件把不同的FPGA簡單看作設(shè)計層次中一個額外的層。這意味著該工具提供針對性能優(yōu)化時序路徑的獨特能力,甚至當(dāng)這些路徑越過多個FPGA時(Certify軟件也能夠提供一個時序報告,其告知設(shè)計者原型在硬件被編程之前能夠達(dá)到的性能)。
總結(jié)
建立ASIC原型設(shè)計的必要性正在不斷增加,按照系統(tǒng)要求其實現(xiàn)是“飛速”地。達(dá)到這一性能水平的最節(jié)省成本的技術(shù)就是,建立基于FPGA的原型開發(fā)。已經(jīng)證明有九分之一的ASIC設(shè)計師使用多個FPGA的原型開發(fā)板,這一趨勢正在不斷增長。在這種情況下,人們越來越普遍使用現(xiàn)成的原型開發(fā)板,這來自Synplicity的原型開發(fā)伙伴之一,包括Dini集團(tuán)、Hardi電子、GiDel和Altera。
當(dāng)使用與來自Synplicity的Certify RTL原型開發(fā)軟件時,與建立定制的原型開發(fā)板相比,這些最新技術(shù)的電路板在更低的成本上提供了更高的性能,并且減少了產(chǎn)品推向市場的時間?,F(xiàn)成的多個FPGA的原型開發(fā)板和Certify軟件的組合意味著ASIC項目能夠節(jié)省數(shù)月的驗證時間,這是在所有的器件和系統(tǒng)層次,允許設(shè)計團(tuán)隊與真實的硬件相比進(jìn)行測試得出的結(jié)論,并且可以在設(shè)計過程中較早的發(fā)現(xiàn)難以察覺的問題。通過較早的允許硬件原型用于軟件開發(fā)和系統(tǒng)集成,可以更進(jìn)一步的縮短產(chǎn)品推向市場的時間。
評論