基于FPGA的改進型FIR濾波器的實現(xiàn)

作者：時間：2017-06-05 來源：網絡

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

FIR數(shù)字濾波器在數(shù)字信號處理的過程中有很好的線性相位和穩(wěn)定性，被廣泛應用于音頻處理、語音處理、信息系統(tǒng)等各種系統(tǒng)中。隨著現(xiàn)代電子技術及EDA技術的發(fā)展，特別是可編程邏輯電路的發(fā)展，F(xiàn)IR數(shù)字濾波器的實現(xiàn)將變得更具有靈活性和實時性。FIR濾波器的實現(xiàn)有多種方法，其中基于分布式算法FIR濾波器的FPGA實現(xiàn)采用硬件結構，此算法的特點是運行速度快，能較好地實現(xiàn)實時處理，特別適合于高速實時的信號處理。本文提出了一種基于分布式算法改進型FIR濾波器的FPGA實現(xiàn)，并設計和實現(xiàn)了改進型FIR濾波器。

本文引用地址：http://2s4d.com/article/201706/349206.htm

1 FIR數(shù)字濾波器的直接型結構

FIR數(shù)字濾波器的輸入與輸出可以用下式表示：

式中：N為濾波器的階數(shù)(或抽頭數(shù))；x(k)為第k時刻的輸入樣本值；h(k)為第k級抽頭系數(shù)。FIR因為其單位脈沖響應h(n)是有限長而得名，即h(n)是一個有限長序列，對h(n)做Z變換就得到FIR數(shù)字濾波器的系統(tǒng)函數(shù)H(z)：

由此可以得到FIR數(shù)字濾波器直接型的結構圖如圖1所示。

2 改進型FIR數(shù)字濾波器算法

2.1 分布式算法的原理

分布式算法是一種重要的FPGA技術，廣泛應用在計算乘積和之中。除了卷積之外，相關、DFT計算和RNS反演映射等都可以轉化為乘積和(sum of products)的形式。

(1)無符號分布式算法

假設N項的乘積和表示為：

又設系數(shù)h(n)是已知的常系數(shù)，x(n)是變量，設x(n)的表達式如下：

其中xb(n)表示x(n)的第b位，x(n)是x的第n次采樣，則y又可以表示為：

(2)有符號分布式算法

對于有符號數(shù)補碼數(shù)采用補碼的表示方法。需要注意的是，在補碼中，最高有效位是用來區(qū)別正數(shù)和負數(shù)的。將采用(B+1)位表達式：

要實現(xiàn)有符號分布式系統(tǒng)，通常采用“帶有加/減控制器的累加器”實現(xiàn)此系統(tǒng)，當xb(n)為0時進行加法運算，為1時進行減法運算。

2.2 串行分布式算法

串行分布式算法結構如圖2所示。利用一個LUT實現(xiàn)映射，即2N字寬，預先編寫好程序的xb=[xb(0)，xb(1)，…，xb(N-1)]的映射，經查找表查找后輸出，N次查詢循環(huán)后就完成了計算結果。

以三階四位有符號的數(shù)字濾波器為例，令濾波器的系數(shù)為{-2，1，3}，LUT可采用基于FPGA的邏輯查找表或利用FPGA自帶的ROM實現(xiàn)。用case表實現(xiàn)的核心代碼如下：

Process (table_ in)

Begin

Case table_ in is

when “000”=> table_ out=0；

when “001”=> table_ out=-2；

when “010”=> table_ out=3；

when “011”=> table_ out=1；

when “100”=> table_ out=1；

when “101”=> table_ out=-1；

when “110”=> table_ out=4；

when “111”=> table_ out=2；

when others=> table_ out=0；

end case；

end process；

2.3 并行分布式算法

并行分布式算法結構如圖3所示，圖中虛線代表流水線寄存器，輸入采用逐次采樣（每次一個字）、位并行的形式。將每個數(shù)據的相同位遞給LUT，對于輸入的每一位都需要配置相應單獨的表，且表的規(guī)模不固定（輸入位寬等于濾波器抽頭的數(shù)量），但表的內容相同。且不同的位對應不同的值，然后將從LUT中讀取的數(shù)據經過處理后送入加法器中，每級的加法運算都是并行的。

2.4 拆分查找表

并行分布式算法雖然能夠有效提高系統(tǒng)運算的速度，但是占用的資源太大。串行分布式算法占用的資源小，但系統(tǒng)的運算速度慢。而且當N很大時，即在FIR濾波器中如果階數(shù)很高時，作為查找表的ROM將很大，例如：假定N=16，輸入LUT的位寬為16，則ROM的大小為16×216 bit，即1 Gbit。N每增加一位，ROM容量就增加一倍，這種以2的冪次遞增的資源占用是硬件資源不可接受的。

當系統(tǒng)對速度要求不太高、而濾波器的階數(shù)很高時，可以采用拆分表減少ROM容量并將結果累加。如果再加上流水線寄存器，這個改進并沒有降低速度，卻可以極大減少LUT的設計規(guī)模。

假設長度為LN的內積：

可以用一個DA結構實現(xiàn)。將和分配到L個獨立的N階并行DA的LUT之中，結果如下：　

例如：實現(xiàn)一個4N的DA設計需要3個次輔助加法器。而表格的規(guī)模從一個4N×2B的LUT降低到4個N×2B表。圖4是拆分查找表的硬件結構圖。

3 基于FPGA實現(xiàn)的改進型FIR濾波器結構性能

3.1 16階8位FIR濾波器的實現(xiàn)及仿真

本設計采用Altera公司的Cyclone II EP2C35F672C8器件，在Quartus II 5.0下仿真，F(xiàn)IR濾波器為16階，輸入數(shù)據為8位（最高位代表符號位）。如果采用單個查找表的面積為28×16 bit，面積太大。采用拆分查找表的結構能減少面積，在Altera公司的一系列FPGA中LUT查找表采用四輸入查找表，因此單個表可以拆分為2個四輸入的查找表。因為設計的是線性相位濾波器，這樣單個表的面積就得到了最優(yōu)化。同時單個查找表的連線是LUT查找表的內部連線，減少了互聯(lián)的資源和連線的延遲。查找表計算方法如表1所示。

設輸入序列為{99，0，0，0，70，0，0，0，99，0，0，0，70，0，0，0}，濾波器的系數(shù)為{-12 -18 13 29 -13 -52 14 162 242 14 -52 -13 29 13 -18}。仿真結果如圖5所示。

本設計的時鐘主頻可達73.49 MHz，占用了236個邏輯單元，占整個LC（Logic cell）的2%。可見拆分查找表的方式實現(xiàn)FIR濾波器速度較快，占用的資源少。

若要實現(xiàn)更高階的濾波器，拆分查找表法的優(yōu)勢將更加明顯。另外，如果是線性相位的濾波器，表的個數(shù)將能縮小一倍。本設計即為線性相位濾波器。

3.2 改進型FIR濾波器在FPGA中實現(xiàn)的特點分析

為了分析改進型FIR濾波器在FPGA中實現(xiàn)的特點，利用VHDL語言程序分別設計了16階的串行、并行及直接型FIR濾波器，并與相應的拆分查找表法FIR濾波器進行比較，其各自的運行速度及占用FPGA資源的情況如表2所示。

從表2可以看出，改進型濾波器與直接型相比存在兩大明顯的優(yōu)勢。一方面，在濾波器階數(shù)相同時，改進型FIR濾波器在FPGA資源占用上比直接型更少；另一方面，系統(tǒng)運行的速度比直接型更快。而且，隨著濾波器階數(shù)的增加，這種優(yōu)勢更加明顯。串行濾波器完成一次運算需要8個時鐘周期，為了把數(shù)據分為8個時鐘周期進行計算，采用了移位寄存器，這樣單個表的面積相當大，從而占用了大量資源，工作速度也受到了限制。并行分布式濾波器在1個時鐘周期完成了累加，提高了工作速度，但所用面積較大。拆分查找表法濾波器大大減少了面積，而且速度并沒有降低。

本設計采用了拆分查找表方法，影響系統(tǒng)速度的是加法器組，可以對濾波器進一步改進，如對加法器組利用流水線、編碼等技術可以提高工作速度。

通過以上的理論分析和仿真結果表明，基于FPGA器件的拆分查找表FIR算法，占用資源少、運算速度快，在資源允許的條件下可根據實際應用任意確定濾波器的長度和階數(shù)，是一種比較實用可靠的高效設計方法。

新聞中心

基于FPGA的改進型FIR濾波器的實現(xiàn)

評論

相關推薦

技術專區(qū)