大型設(shè)計中FPGA的多時鐘策略

——

作者：Tim Behne 時間：2005-10-12 來源：電子產(chǎn)品世界

加入技術(shù)交流群
- 掃碼加入
  和技術(shù)大咖面對面交流
  海量資料庫查詢

　　利用FPGA 實現(xiàn)大型設(shè)計時，可能需要FPGA 具有以多個時鐘運行的多重數(shù)據(jù)通路，這種多時鐘FPGA 設(shè)計必須特別小心，需要注意最大時鐘速率、抖動、最大時鐘數(shù)、異步時鐘設(shè)計和時鐘/數(shù)據(jù)關(guān)系。設(shè)計過程中最重要的一步是確定要用多少個不同的時鐘，以及如何進(jìn)行布線，本文將對這些設(shè)計策略深入闡述。

　　FPGA 設(shè)計的第一步是決定需要什么樣的時鐘速率，設(shè)計中最快的時鐘將確定FPGA 必須能處理的時鐘速率。最快時鐘速率由設(shè)計中兩個觸發(fā)器之間一個信號的傳輸時間P 來決定，如果P 大于時鐘周期T，則當(dāng)信號在一個觸發(fā)器上改變后，在下一個邏輯級上將不會改變，直到兩個時鐘周期以后才改變，如圖1 所示。

　　傳輸時間為信號在第一個觸發(fā)器輸出處所需的保持時間加上兩級之間的任何組合邏輯的延遲，再加兩級之間的布線延遲以及信號進(jìn)入第二級觸發(fā)器的設(shè)置時間。無論時鐘速率為多少，每一個FPGA 設(shè)計所用的時鐘必須具有低抖動特性。抖動S 是觸發(fā)器的一個時鐘輸入到另一個觸發(fā)器的時鐘輸入之間的最大延遲。為使電路正常工作，抖動必須小于兩個觸發(fā)器之間的傳輸時間。

　　圖2 顯示了如果抖動大于傳輸時間(S＞P)將出現(xiàn)的情況，該電路用時鐘的兩個上升沿來延遲信號1。然而，信號1 上的一個改變會在相同的時鐘周期上傳輸?shù)降男盘? 上，從而引起信號2 的改變。因為S＞P，電路將不能不正常。

　　須注意的是，時鐘速率與傳輸延時并沒有什么關(guān)系，甚至普通的100bps 時鐘也會出現(xiàn)抖動

　　好在FPGA 供應(yīng)商已經(jīng)認(rèn)識到時鐘抖動的影響，并在他們的芯片中提供低抖動的布線資源。這些特殊的布線能夠在芯片中一個給定范圍內(nèi)的任何兩個觸發(fā)器之間提供一個確定的最大抖動。部分產(chǎn)品的低抖動資源覆蓋了整個芯片，而其它的則可能只覆蓋了FPGA 邏輯塊中的一個特定的行或列。對于一個需要很多不同時鐘源的設(shè)計，這些低抖動FPGA 是比較理想的選擇。

　　多時鐘設(shè)計的最嚴(yán)重問題之一是用異步時鐘將兩級邏輯結(jié)合在一起。由于異步時鐘會產(chǎn)生亞穩(wěn)態(tài)，從而嚴(yán)重降低設(shè)計性能，或完全破壞設(shè)計所能實現(xiàn)的功能。在觸發(fā)器的時序要求產(chǎn)生沖突時(設(shè)置時間和保持時間)將產(chǎn)生亞穩(wěn)態(tài)，觸發(fā)器的最終輸出是未知的，并使整個設(shè)計處于不確定狀態(tài)。如果有一級邏輯要將數(shù)據(jù)異步地發(fā)送到另一級，圖3 所示的情形將不能滿足觸發(fā)器的設(shè)置和保持時間要求。確切地說，如果設(shè)計中含有異步邏輯將有可能會產(chǎn)生亞穩(wěn)態(tài)。在處置異步資源時必需非常小心，因為這可能產(chǎn)生一些很嚴(yán)重的問題。

多時鐘設(shè)計

　　本文以電信應(yīng)用中的E3 多路復(fù)用/解復(fù)用設(shè)計為例。如圖4 所示，多路復(fù)用器接收來自一組獨立線路接口芯片的16 個獨立E1 信道，每一個信道都工作于2.048MHz；經(jīng)復(fù)用后，這些E1 流組合成4 個E2 流，分別工作在8.0448MHz；4 個E2 流最后組合成一個E3 流，以34.368Mbps 的速率串行發(fā)送出去。在接收端執(zhí)行相反的操作：解復(fù)用器從E3 流提取4 個E2 數(shù)據(jù)流，然后從E2 流提取16 個E1 流，最終將E1 流發(fā)送到接收端的線路接口芯片。

　　這些E1 線路接口在發(fā)送和接收時都獨立工作，因此2.048MHz 的時鐘速率可以有+/- 20ppm

　　由于E2 流是在芯片上產(chǎn)生的，這些E2 多路復(fù)用器可以共享同一個8.448MHz 時鐘。然而，由于接收的數(shù)據(jù)速率與我們所設(shè)計的板無關(guān)(且不能假定所有E2 多路復(fù)用器使用相同時鐘)，所以E2 解復(fù)用器時鐘必須能工作在略為不同的速率下。

　　此外，假定設(shè)計中需要一個由工作頻率為1MHz 的處理器控制的獨立SPI(串行外圍接口)總線接口，該接口用于狀態(tài)和控制。這樣一來，設(shè)計中總共用了32 個2.048MHz 時鐘，5 個8.448MHz 時鐘，2 個34.368MHz 時鐘和一個1MHz 時鐘，總共多達(dá)40 個時鐘。
　
　　本設(shè)計中最快時鐘是34.368MHz E3 時鐘。FPGA 的最大時鐘速率的確定很重要，因為設(shè)計的差異將影響到該最大值。然而，在芯片商的資料手冊中常常可以看到“全局時鐘設(shè)置及保持時間”和“至CLB 輸出的時鐘”兩個參數(shù)，將這兩個參數(shù)的最大值相加，再增加25%就能可以得到最小時鐘周期的初略值，在最大時鐘速率條件下允許10%的余量，以保證過熱條件下能正常工作。因此，我們設(shè)置的最小速率為40MHz，很多較新的FPGA 都能夠很容易地支持該頻率。事實上，F(xiàn)PGA 供應(yīng)商已經(jīng)推出了超過300MHz 的器件。

　　在確定了能滿足最大頻率要求的FPGA 后，就需要保證有足夠的空間來實現(xiàn)你的設(shè)計。如果所選的FPGA 沒有足夠的余量，就不能提供足夠的布線資源來滿足設(shè)計的時序約束。通常芯片供應(yīng)商宣稱的速率是最佳條件下的速率，F(xiàn)PGA 供應(yīng)商一般建議FPGA 邏輯在布線功能開始明顯變差以前可以用到80%。在選擇FPGA 器件時，建議在新的設(shè)計時最好使FPGA 邏輯用到50%左右，這樣就允許計算起始設(shè)計大小出現(xiàn)超差，以及為在設(shè)計起動后產(chǎn)生不可避免的設(shè)計變更留出空間。如果最終的設(shè)計只占用低于50%的資源，則可以使用同一系列中較小的FPGA 以降低成本。

　　通過時序約束來規(guī)定慢時鐘速率，從而可以改進(jìn)設(shè)計中最快時鐘的布線。在多路復(fù)用器例子中，如果設(shè)置FPGA 布線工具SPI 總線時鐘為1MHz，而E3 時鐘為40MHz，布線工具將盡量使E3 時鐘的邏輯電路模塊相鄰布局。如果由于空間的限制而不能將全部電路布局在一起，則首先應(yīng)將SPI 邏輯另外布局，因為SPI 邏輯可以處理更長傳輸延遲。所有FPGA 供應(yīng)商的布線工具都能規(guī)定這些較慢時鐘速率。

減少時鐘數(shù)量

　　根據(jù)市場調(diào)查，目前還沒有哪個FPGA 器件能夠支持這種多路復(fù)用器/解復(fù)用器設(shè)計所需的40 個時鐘。所以，我們必須減少所需要的時鐘數(shù)。

　　首先了解E2 和E3 多路復(fù)用器的時鐘。前面已經(jīng)分析了4 個E2 多路復(fù)用器工作在相同時鐘下的可接受度，E3 多路復(fù)用器運行于比E2 時鐘高得多的速率，必需使用一個不同的時鐘。但是，如果我們從E3 時鐘中引出E2 時鐘是否可行呢？因為E3 多路復(fù)用器要從每個E2 支路得到數(shù)據(jù)，我們可以在需要E2 多路復(fù)用器給我們數(shù)據(jù)時，簡單地將脈沖送給每個多路復(fù)用器。我們沒有去掉任何時鐘，但E2 時鐘現(xiàn)在是基于E3 時鐘。

　　如果在所有的多路復(fù)用器中也使用同樣的時鐘，并且只使用一個使能信號來告訴E2 多路復(fù)用器什么時候工作，這時會產(chǎn)生什么問題呢？如果E3 多路復(fù)用器用34.368MHz 時鐘產(chǎn)生使能信號，在這些使能信號上的抖動不會比用在FPGA 中任何其它同步邏輯更大。所以，使能信號可以使用正常(高抖動)布線資源，這樣就不需要單獨的8.448MHz多路復(fù)用器時鐘，讀取E1 數(shù)據(jù)緩沖器的數(shù)據(jù)時也是一樣。換言之，如果E2 多路復(fù)用器需要數(shù)據(jù)，它可以激活到特定緩沖器的使能信號。到緩沖器的時鐘本身能夠保持E3 多路復(fù)用器所用的

34.368MHz 時鐘，如圖5 所示。

　　最后，我們檢查16 個從線路接口芯片輸入到FPGA 的E1 時鐘。這些時鐘有會產(chǎn)生下面幾個問題：首先，16 個時鐘將占用太多可用芯片時鐘布線資源；其次，在同一個FPGA 中使用16 個異步時鐘來驅(qū)動相互鄰近的觸發(fā)器，由于地彈、串?dāng)_和其它效應(yīng)將產(chǎn)生噪聲問題。例如，由于噪聲的原因，一個正邊沿觸發(fā)器會在下降邊沿時改變輸出狀態(tài)，此類問題將難以處理。

　　作為一種可能的解決方案，我們推薦使用一個最快的時鐘來對16 個E1 時鐘采樣。16 個輸入時鐘都接近2.048MHz，并且還有一個34.368MHz 的系統(tǒng)時鐘。這樣，我們可以用

　　34.368MHz 時鐘來對16 個E1 時鐘分別進(jìn)行采樣，并將結(jié)果存儲在一個16 位存儲器中(每個E1 時鐘一個位)。然后，我們可以使用一個算法來檢測在E1 時鐘上由低至高的轉(zhuǎn)換，為每一個E1 數(shù)據(jù)信號產(chǎn)生一個使能信號，并在下一個周期(34.368MHz)中存儲數(shù)據(jù)。

　　要成功實現(xiàn)這種方案，還必需了解時鐘-數(shù)據(jù)關(guān)系以避免在數(shù)據(jù)變化時對數(shù)據(jù)采樣，參見圖6。請注意在時鐘采樣電路的第一級中使用了兩個觸發(fā)器以確保在亞穩(wěn)態(tài)下正常工作。另外需要注意的是，數(shù)據(jù)和時鐘必須具有相同時鐘周期數(shù)的延遲。

　　我們已經(jīng)成功地將多路復(fù)用器的時鐘減少到一個時鐘，同樣的方法可否用在解復(fù)用器呢？E3 解復(fù)用器必須采用一個外部輸入時鐘，這是因為驅(qū)動E3 輸入數(shù)據(jù)的同一個片外器件利用到該時鐘。由于E3 解復(fù)用器知道在什么時候發(fā)送數(shù)據(jù)到E2 解復(fù)用器，并能對每個E2 解復(fù)用器產(chǎn)生使能信號，而四個E2 解復(fù)用器能工作在與E3 多路復(fù)用器相同的主時鐘下。同樣，E2 多路復(fù)用器能夠為每個E1 流產(chǎn)生使能信號。

　　如果我們假設(shè)線路接口芯片能夠接受有間隙的時鐘(gapped clock)，一旦確定發(fā)出E1 使能信號,我們只需要發(fā)送一個時鐘脈沖至線路接口。然而，只需要簡單地發(fā)送使能信號本身至接口芯片而不必產(chǎn)生一個新的時鐘。因為送至接口的數(shù)據(jù)將在使能信號的下降沿產(chǎn)生改變(參見圖5)，我們需要確認(rèn)接口在時鐘的上升沿進(jìn)行采樣。因為使能信號僅在線路接口芯片上而不是在FPGA 內(nèi)用作一個時鐘，就沒有必要在一個低抖動源中進(jìn)行布線。注意這是在知道將再也不會用主時鐘的連續(xù)脈沖送數(shù)據(jù)到相同的從屬器件中時才這樣做。

異步時鐘

　　在用異步時鐘產(chǎn)生任何邏輯前應(yīng)該盡量先考慮采用其它替代方法，用異步時鐘的組合邏輯是產(chǎn)生亞穩(wěn)態(tài)問題的主要原因。同樣，當(dāng)違反觸發(fā)器的設(shè)置和保持時間約束時，在一個短時間內(nèi)輸出將具有不確定性，并且將最終設(shè)定在“1”或“0”上，確切的狀態(tài)不可預(yù)知。

　　幸運的是對于亞穩(wěn)態(tài)性問題已經(jīng)有一些解決方案。圖6 說明了這一方案，這是一種雙寄存器方法：進(jìn)入第一級觸發(fā)器的數(shù)據(jù)與時鐘異步，所以第一級觸發(fā)器幾乎肯定是亞穩(wěn)態(tài)；然而，只要亞穩(wěn)態(tài)的長度小于時鐘的周期，第二級觸發(fā)器就不會進(jìn)入亞穩(wěn)態(tài)。但是，F(xiàn)PGA 供應(yīng)商很少提供亞穩(wěn)態(tài)時間，盡管該時間一般小于觸發(fā)器的設(shè)置和保持時間之和。

　　如果時鐘不是太快而且能滿足時序約束的話，像圖6 所示的電路將可能不會產(chǎn)生亞穩(wěn)態(tài)。只要所有輸出到觸發(fā)器的通路由相同時鐘驅(qū)動，即使第一級觸發(fā)器的輸出可用，通常還是需要用像圖6 中電路來將亞穩(wěn)態(tài)隔離到一條短線。采用這種方法后，將不太可能出現(xiàn)由于電路的改變而無意地在無時鐘驅(qū)動的邏輯中用到該亞穩(wěn)太線。

　　如果讀數(shù)據(jù)的是一個計數(shù)器，像從一個異步FIFO 讀或?qū)懙刂罚銘?yīng)該考慮下列情況：一個傳統(tǒng)的3 位計數(shù)器在狀態(tài)之間有一個、兩個或三個位的變化，例如讀數(shù)發(fā)生在計數(shù)器從“011” 到“100”變化的瞬間，則所有三個位的值將不確定，讀的值會是八種可能狀態(tài)中的任一種。如果計數(shù)器是使用格雷碼，如表所示，則每次僅有一位發(fā)生狀態(tài)改變，如果讀數(shù)發(fā)生在計數(shù)器變化的瞬間，則只有一個位會有問題，所以在讀操作中只有兩種可能結(jié)果，而且這兩種可能結(jié)果是計數(shù)器正好在讀以前的值和正好在讀以后的值時。因為讀正好發(fā)生在計數(shù)器產(chǎn)生變化的瞬間，你不可能確切地說哪個值是正確的，即兩者都應(yīng)該認(rèn)為是有效的。

　　另一個避免異步時鐘問題的方法是忽略較慢的時鐘，并用較快的時鐘來采樣。這需要數(shù)據(jù)有特殊的成幀特性(例如，具有一個前導(dǎo)碼)來定義數(shù)據(jù)邊界。這是一個常用的方法，在差不多每一個具有UART 形式的嵌入式系統(tǒng)都有應(yīng)用。該方法是：采用一個非?？斓臅r鐘，比如數(shù)據(jù)符號率的16 倍，在連續(xù)發(fā)現(xiàn)15 個起始字符后開始采樣，則下一個16(左右)位相當(dāng)于送的第一個位，再下一個16(左右)位對應(yīng)下一個位，并以次類推。

新聞中心

大型設(shè)計中FPGA的多時鐘策略

評論

相關(guān)推薦

技術(shù)專區(qū)