低功耗FPGA設(shè)計(jì)技術(shù)

作者：時(shí)間：2016-10-18 來(lái)源：網(wǎng)絡(luò)

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對(duì)面交流
  海量資料庫(kù)查詢

一、前言

本文引用地址：http://2s4d.com/article/201610/308522.htm

隨著系統(tǒng)功率預(yù)算的不斷緊縮，迫切需要新型低功率元器件。對(duì)通信基礎(chǔ)設(shè)施而言，電路板冷卻、機(jī)箱體積小型化以及系統(tǒng)可靠性在系統(tǒng)設(shè)計(jì)中都起著重要的作用。對(duì)e-應(yīng)用，電池壽命、熱耗散和小體積尺寸是主要的設(shè)計(jì)難點(diǎn)。選用智能器件，輔以正確的設(shè)計(jì)技巧增加了符合功率預(yù)算的可能性。盡管可編程邏輯器件(PLD)有很好的性能，然而卻以犧牲功耗為代價(jià)。Actel公司的抗熔斷型FPGA提供低功耗且高性能應(yīng)用的理想解決方案。本文涵蓋Actel eX系列以及SX/SX-A系列器件，詳細(xì)描述了器件的結(jié)構(gòu)特點(diǎn)與設(shè)計(jì)技巧。

二、抗熔斷型FPGA的結(jié)構(gòu)與特點(diǎn)

Actel公司的抗熔斷型FPGA是用先進(jìn)的CMOS工藝制作的，內(nèi)部采用專利的金屬-金屬抗熔斷元件。抗熔斷互連就象純金屬互連一樣，而與用晶體管開關(guān)的SRAM互連截然不同?？谷蹟嘟Y(jié)構(gòu)消除了CRAM互連開關(guān)中圖騰柱結(jié)構(gòu)的功耗，并且縮小了器件的尺寸，使全部連線資源都位于硅片的頂部。這種結(jié)構(gòu)可以更形象地用掩埋在金屬層上的“模塊海洋”來(lái)描述，極大地減少了芯片的尺寸以及開關(guān)的電阻與電容，從而降低了功耗(圖1)。

分段式連線資源

該類器件采用分段式連線資源，其容量是連線的長(zhǎng)度，寬度和負(fù)載的函數(shù)。分段式連線較全長(zhǎng)式短，因而電容也較小。分段結(jié)構(gòu)還允許切斷未使用連線，進(jìn)一步減小了電容。當(dāng)信號(hào)需要傳輸較長(zhǎng)距離時(shí)，可將多個(gè)線段連接在一起，這是通過(guò)連線開關(guān)完成的。由于這類開關(guān)是快速且低功耗的，因此不會(huì)增加功耗與延時(shí)。eX以及 SX/SX-A結(jié)構(gòu)采用稱為Fastconnet與Directconnect兩種創(chuàng)新的局部連線資源將邏輯塊連接在一起。此外，器件還具有由不同段長(zhǎng)度組成的其它連線資源，以備需要較長(zhǎng)距離的連線信號(hào)連接使用。

低功耗模式引腳

eX器件提供一個(gè)專用的低功耗引腳，這是降低功耗的又一種手段。它能關(guān)閉所有的內(nèi)部電荷泵，將靜態(tài)電流降低至幾乎為0。當(dāng)然用戶必須細(xì)心地處理某些邊緣效應(yīng)，這將在下文詳細(xì)討論。

細(xì)晶粒結(jié)構(gòu)

粗晶粒PLD與FPGA邏輯的效率比Actel細(xì)晶粒邏輯塊低，因而浪費(fèi)了很多邏輯功能。Actel eX，SX/SX-A系列是在細(xì)晶粒4輸入MUX基本結(jié)構(gòu)上構(gòu)建的，且備有多個(gè)控制輸入。一個(gè)單元能實(shí)現(xiàn)多達(dá)5個(gè)輸入的邏輯功能，使邏輯映射功能更有效。這種細(xì)晶粒結(jié)構(gòu)與大量的且分段的連線資源相結(jié)合，有助于在不犧牲性能的前提下降低功耗。

非易失性與通電時(shí)即時(shí)工作

由于Actel FPGA采用抗熔斷技術(shù)，本質(zhì)上是非易失性的，在通電時(shí)能即時(shí)工作，器件在通電序列中無(wú)需進(jìn)行重構(gòu)，信息是永久性編程的，信息的存儲(chǔ)與保持不消耗電流，從而減小靜態(tài)電流，降低功耗。器件不必?cái)y帶通電系統(tǒng)引導(dǎo)程序的PROM，因而是一種高性能的單片解決方案。

三、降低功耗的設(shè)計(jì)技巧

基于CMOS的設(shè)計(jì)主要消耗三類切率：內(nèi)部的(短路)、漏電的(靜態(tài)的)以及開關(guān)的(電容)。當(dāng)門電路瞬變時(shí)，VDD與地之間短路連接消耗內(nèi)部功率。漏電功耗是CMOS工藝普遍存在的寄生效應(yīng)引起的。而開關(guān)功耗則是自負(fù)載電容,放電造成的。開關(guān)功耗與短路功耗合在一起稱為動(dòng)態(tài)功耗。下面介紹降低靜態(tài)功耗和動(dòng)態(tài)功耗的設(shè)計(jì)技巧。

降低靜態(tài)功耗

雖然靜態(tài)電流與動(dòng)態(tài)電流相比可以忽略不計(jì)，然而對(duì)電池供電的手持設(shè)備就顯得十分重要，在設(shè)備通電而不工作時(shí)更是如此。靜態(tài)電流的因素眾多，包括處于沒(méi)有完全關(guān)斷或接通的狀態(tài)下的I/O以及內(nèi)部晶體管的工作電流、內(nèi)部連線的電阻、輸入與三態(tài)電驅(qū)動(dòng)器上的拉或下拉電阻。在易失性技術(shù)中，保持編程信息也需一定的靜態(tài)功率。抗熔斷是一種非易失性技術(shù)，因此信息存儲(chǔ)不消耗靜態(tài)電流。

下面介紹幾種降低靜態(tài)功耗的設(shè)計(jì)方法：

·驅(qū)動(dòng)輸入應(yīng)有充分的電壓電平，因而所有晶體管都是完全通導(dǎo)或關(guān)閉的。

·由于I/O線上的上拉或下拉電阻要消耗一定的電流，因此盡量避免使用這些電阻。

·少用驅(qū)動(dòng)電阻或雙極晶體管，這些器件需維持一個(gè)恒定電流，從而增加了靜態(tài)電流。

·將時(shí)鐘引腳按參數(shù)表推薦條件連接至低電平。懸空的時(shí)鐘輸入會(huì)大大增加靜態(tài)電流。

·在將設(shè)計(jì)劃分為多個(gè)器件時(shí)，減少器件間I/O的使用。

eX器件LP方式引腳的使用

Actel eX系列設(shè)計(jì)了特殊的低功率“休眠”模式。在該引腳驅(qū)動(dòng)至高電平800ns后，器件進(jìn)入極低功率待機(jī)模式，待機(jī)電流小于100μA。在低功率模式下，所有 I/O(除時(shí)鐘輸入外)都處于三態(tài)，而內(nèi)核全部斷電。由于內(nèi)核被斷電，觸發(fā)器中存儲(chǔ)的信息會(huì)丟失，在進(jìn)入工作模式(在引腳驅(qū)動(dòng)至低平200ms后)時(shí)，用戶需再次對(duì)器件初始化。同樣，用戶也應(yīng)關(guān)閉所有通過(guò)CLKA、CLKB以及HCLK輸入的時(shí)鐘。然而這些時(shí)鐘并不處于三態(tài)，時(shí)鐘就可進(jìn)入器件，從而增加功耗，因此在低功率模式下，時(shí)鐘輸入必須處于邏輯0或邏輯1。

有時(shí)用戶很難阻止時(shí)鐘進(jìn)入器件。在此場(chǎng)合，用戶可使用與CLKA或CLKA相鄰的正常輸入引腳并在設(shè)計(jì)中加進(jìn)CLKINT。這樣，時(shí)鐘將通過(guò)靠近時(shí)鐘引腳的正常輸入進(jìn)入器件，再通過(guò)CLKINT向器件提供時(shí)鐘資源。

采用這種輸入電路后，由于常規(guī)I/O是三態(tài)的，因此用戶不必?fù)?dān)心時(shí)鐘進(jìn)入器件。當(dāng)然，增加一級(jí)門電路會(huì)產(chǎn)生0.6ns的較大時(shí)鐘延時(shí)，幸好這在多數(shù)低功率設(shè)計(jì)中是可以接受的。注意應(yīng)將與CLKINT緩沖器相關(guān)的CLKA或CLKB引腳接地。

此外還要注意，CLKINT只可用作連線時(shí)鐘，HCLK并不具備將內(nèi)部走線網(wǎng)連接到HCLK的能力，因而HCLK資源不能被常規(guī)輸入驅(qū)動(dòng)。換句話說(shuō)，如果使用LP引腳就不能使用HCLK;使用HCLK時(shí)就應(yīng)在外部截?cái)鄷r(shí)鐘信號(hào)。

降低動(dòng)態(tài)功耗

動(dòng)態(tài)功耗是在時(shí)鐘工作且輸入正在開關(guān)時(shí)的功耗。對(duì)CMOS電路，動(dòng)態(tài)功耗基本上確定了總功耗。動(dòng)態(tài)功耗包括幾個(gè)成分，主要是電容負(fù)載充電與放電(內(nèi)部與I/O)以及短路電流。多數(shù)動(dòng)態(tài)功率是內(nèi)部或外部電容向器件充、放電消耗的。如果器件驅(qū)動(dòng)多個(gè)I/O負(fù)載，大量的動(dòng)態(tài)電流構(gòu)成總功耗的主要部分。

對(duì)設(shè)計(jì)中給定的驅(qū)動(dòng)器，動(dòng)態(tài)功耗由下式計(jì)算

p=CL×V 2 DD×f

式中，CL是電容負(fù)載，VDD是電源電壓，f則是開關(guān)頻率?？偣氖敲總€(gè)驅(qū)動(dòng)器功耗之總和。

由于VDD是固定的，降低內(nèi)部功耗就要降低平均邏輯開關(guān)頻率，減少每個(gè)時(shí)鐘沿處的邏輯開關(guān)總數(shù)、減少連線網(wǎng)絡(luò)，特別是高頻信號(hào)連線網(wǎng)絡(luò)中的電容值。對(duì)低功率設(shè)計(jì)，需要從系統(tǒng)至工藝的每個(gè)設(shè)計(jì)級(jí)別中采取相應(yīng)預(yù)防措施，級(jí)別越高，效果越好。

四、減少開關(guān)活動(dòng)量的設(shè)計(jì)方法

減少開關(guān)動(dòng)作可在設(shè)計(jì)流程中的各個(gè)級(jí)別加以控制。當(dāng)然，在設(shè)計(jì)周期最初階段的結(jié)構(gòu)確定影響最大。設(shè)計(jì)者應(yīng)統(tǒng)盤考慮時(shí)鐘門控、總線時(shí)分復(fù)用、減少毛刺、使用功率低的數(shù)據(jù)通路元件、減少高開關(guān)信號(hào)的邏輯電平等。下面敘述某些常用的技巧。

時(shí)鐘門控

這是最廣泛使用的方法，即在器件末使用時(shí)截?cái)鄷r(shí)鐘來(lái)降低功耗。然而正確地截?cái)鄷r(shí)鐘十分重要。門控信號(hào)與門控邏輯應(yīng)正確地設(shè)計(jì)，以消除時(shí)鐘線上的任何毛刺。再者，門控邏輯會(huì)增加時(shí)鐘的延時(shí)，影響建立時(shí)間與保持時(shí)間。由于抗熔斷是一種極快速的技術(shù)，引入的延時(shí)很小且容易控制。在使用時(shí)鐘門控時(shí)，用戶應(yīng)仔細(xì)地安置門控邏輯，將時(shí)鐘網(wǎng)絡(luò)的延時(shí)降低到最小限度。典型的門控邏輯如圖3所示。

防護(hù)技巧

這是一種在塊輸出不用時(shí)防止輸入信號(hào)使塊開關(guān)工作的技巧。例如考慮一個(gè)乘法器，它的輸出僅在某些特定條件下才使用。在此場(chǎng)合可增添一個(gè)鎖存器，這樣每當(dāng)輸出不用時(shí)，乘法器的輸入將阻止不必要的開關(guān)動(dòng)作帶入乘法器(圖4)。一個(gè)鎖存器只需一個(gè)組合單元，并不占用過(guò)多芯片面積。

總線復(fù)用

高密度設(shè)計(jì)的布局必須留有空地并相當(dāng)?shù)卣归_，才可完成，這便導(dǎo)致連線長(zhǎng)，每個(gè)線上開關(guān)多，這些因素產(chǎn)生不良的時(shí)序結(jié)果并增加了功耗。此外，塊中的邏輯趨向于分類集結(jié)在一起，總線跨越不同塊時(shí)需走過(guò)較長(zhǎng)的距離。在一個(gè)設(shè)計(jì)中采用時(shí)分復(fù)用寬總線技術(shù)，可減少總線的數(shù)量，有利于時(shí)序和功耗。再者，在DSP設(shè)計(jì)中，數(shù)據(jù)是相關(guān)的，這表明大多數(shù)數(shù)據(jù)位并未改變狀態(tài)。攜帶相關(guān)數(shù)據(jù)的總線應(yīng)盡量復(fù)用在一起，進(jìn)一步減少M(fèi)UX、DEMUX邏輯中的開關(guān)活動(dòng)(圖5)。

減少毛刺與流水作業(yè)

毛刺是信號(hào)趨于穩(wěn)定前不必要的開關(guān)動(dòng)作。每個(gè)時(shí)鐘沿改變了寄存器間組合邏輯的輸入。對(duì)每個(gè)節(jié)點(diǎn)而言，不同的輸入路徑有不同的延時(shí)，它將多次改變狀態(tài)。節(jié)點(diǎn)上的毛刺與該節(jié)點(diǎn)的邏輯深度，也就是節(jié)點(diǎn)至最初輸入的邏輯門個(gè)數(shù)有關(guān)。到達(dá)節(jié)點(diǎn)的邏輯錐體越深、越寬，毛刺也越多。降低邏輯深度，減少邏輯錐體的開關(guān)輸入可減少這類毛剌。流水線、時(shí)序驅(qū)動(dòng)合成以及邏輯單元的合理映射能減少邏輯級(jí)的數(shù)量。

流水線是又一種技巧，它在很長(zhǎng)組合路徑的中點(diǎn)引入寄存器。寄存器會(huì)增加等待時(shí)間，卻能增加速度，減少邏輯級(jí)。引入附加寄存器增加了一定的功耗，然而能極大地減少毛剌。例如，一個(gè)用ACTGEN生成的流水線16×16位不帶符號(hào)乘法器所消耗的功率比未使用流水線的同樣器件少。

降低頻繁開關(guān)轉(zhuǎn)換信號(hào)的邏輯深度

重新安排“if-else”表達(dá)式，用戶可將毛刺或快變化信號(hào)移至邏輯錐體的后部。這樣既減少開關(guān)動(dòng)作的傳播，又降低了功耗。在合成時(shí)，合成工具總是試圖降低高開關(guān)概率輸入信號(hào)的邏輯級(jí)，當(dāng)輸入具有同等開關(guān)概率時(shí)，最好采用平衡樹來(lái)合成邏輯。

選擇功率低的數(shù)據(jù)通路元件

不同的數(shù)據(jù)通路元件對(duì)功耗產(chǎn)生不同的影響。例如，脈動(dòng)進(jìn)位具有少扇出，從而減少了邏輯面積，降低了功耗;然而它又使用了深開關(guān)傳播，因此就有一個(gè)利弊權(quán)衡，折衷考慮。譯碼器通常是重負(fù)荷的，向它提供一個(gè)使能信號(hào)可在譯碼器不使用時(shí)防止輸出的不必要開關(guān)動(dòng)作。對(duì)計(jì)數(shù)器，Gray計(jì)數(shù)器具有最低開關(guān)率，應(yīng)經(jīng)常使用。對(duì)內(nèi)部存儲(chǔ)器尋址，也應(yīng)使用Gray尋址。

狀態(tài)機(jī)編碼

狀態(tài)機(jī)在傳統(tǒng)上是按二進(jìn)制編碼的。然而采用Gray編碼，相鄰狀態(tài)可減少瞬變的次數(shù)。有時(shí)不可能在所有狀態(tài)中使用Gray編碼，則應(yīng)在狀態(tài)矢量中增加觸發(fā)器的數(shù)量以減少開關(guān)的次數(shù)。另一種方法是使用one-hot編碼，雖然該編碼使用的觸發(fā)器較多，即可減少組合邏輯的使用，在帶多個(gè)輸出且每個(gè)輸出是幾個(gè)狀態(tài)的函數(shù)的狀態(tài)機(jī)中更是如此。根據(jù)狀態(tài)機(jī)的形式，設(shè)計(jì)者可在Gray、One-hot或二進(jìn)制間進(jìn)行選擇。

使用異步邏輯

雖然并不經(jīng)常推薦使用異步邏輯，有時(shí)它也能降低功耗。一個(gè)例子是前文已提及的時(shí)鐘門控。時(shí)鐘大約消耗30%的總動(dòng)態(tài)功率。在eX、SX/SX-A系列中，每個(gè)序列元件具有連線時(shí)鐘的時(shí)鐘選擇邏輯、一個(gè)硬連時(shí)鐘(HCLK)或常規(guī)連線資源。對(duì)每個(gè)已使用的觸發(fā)器，它的時(shí)鐘選擇邏輯以時(shí)鐘速率開關(guān)。減少時(shí)鐘輸入開關(guān)有助于降低功耗。例如一個(gè)異步二進(jìn)制計(jì)數(shù)器的功耗僅為同步計(jì)數(shù)器的一半。當(dāng)然，異步邏輯會(huì)帶來(lái)諸如競(jìng)爭(zhēng)狀態(tài)，保持時(shí)間出錯(cuò)的時(shí)序問(wèn)題。因此使用異步邏輯時(shí)特別推薦運(yùn)行極小-極大條件下的時(shí)序模擬法。

降低時(shí)鐘速率

雖然時(shí)鐘速率是固定的，有時(shí)也可采用低速并行而不是高速串行的方案。上文已提及，每個(gè)觸發(fā)器都有相應(yīng)的時(shí)鐘選擇邏輯，時(shí)鐘切耗占總功耗的很大一部分。任何旨在減少時(shí)鐘開關(guān)動(dòng)作的措施都有助于降低功耗。由于Actel的模塊和連線結(jié)構(gòu)具有低功率特片，使用附加邏輯模塊來(lái)補(bǔ)償較低時(shí)鐘速率還是能節(jié)省功率的。

新聞中心

低功耗FPGA設(shè)計(jì)技術(shù)

評(píng)論

相關(guān)推薦

技術(shù)專區(qū)