基于FPGA的移位寄存器流水線結構FFT處理器設計與實
對于移位寄存器,在實現(xiàn)時,各級的前級移位寄存器深度為N/2-1,從本質而言,是使運算開始的時鐘上升沿到來時,數(shù)據(jù)已經出現(xiàn)在碟算模塊輸入線上,而不需要下一個時鐘的驅動來移出寄存器,比如第二級移位寄存器的級數(shù)為63。這樣,運算周期正好是2的倍數(shù),從而方便使用計數(shù)器的各位直接對開關進行控制。
同時,計數(shù)器還可以用來產生所需旋轉因子的RAM地址。根據(jù)各級蝶形運算所需旋轉因子的規(guī)律,可以利用計數(shù)器的高位補零來產生查找表的地址。比如,對于第一級,因為需要在最低位第一次出現(xiàn)1時提供


控制和地址產生模塊的仿真結果如圖5所示,其中sel代表開關控制,addr代表產生的地址。
3.2 蝶形運算模塊
蝶算模塊由一個復數(shù)加法器,一個復數(shù)減法器和一個旋轉因子的復數(shù)乘法器構成,如圖6所示。
旋轉因子乘法器通常由4次實數(shù)乘法和2次加/減法運算實現(xiàn),但因為cos和sin的值可以預先存儲,通過下面的算法可以簡化復數(shù)乘法器:
(1)存儲如下三個系數(shù):C,C+S,C-S
(2)計算:E=X-Y和Z=C*E=C*(X-Y)
(3)用R=(C-S)*Y+Z,I=(C+S)*X-Z,
得到需要的結果。
這種算法使用了3次乘法,1次加法和2次減法,但是需要使用存儲3個表的ROM資源。
設計中數(shù)據(jù)的輸入為16位復數(shù),所以將旋轉因子cos(2kπ/N),sin(2kπ/N)量化成帶符號數(shù)的16位二進制數(shù)后,存儲到ROM中,由于值域不同,需要注意C+S和C-S的表要比C表多1位精度。
運算后的結果需要除以量化時乘以的倍數(shù)16b011111llllllllll。具體實現(xiàn)時由于除法運算在FPGA器件需要消耗較多的資源,設計中采用二進制數(shù)移位的方法來實現(xiàn)除法運算。為了防止數(shù)據(jù)溢出,設計對輸出結果除以2。圖7為蝶形運算模塊的RTL級結構圖。
評論