基于DSP的寬帶雷達(dá)多片流水分段脈壓處理平臺設(shè)計
1 引 言
本文引用地址:http://2s4d.com/article/87582.htm作為一種探測目標(biāo)信息的工具,雷達(dá)在現(xiàn)代戰(zhàn)爭中發(fā)揮著舉足輕重的作用。在雷達(dá)回波信號處理中,通常利用線性調(diào)頻信號脈沖壓縮技術(shù)來獲得高的距離分辨率。他有效地解決了雷達(dá)作用距離與距離分辨率之間的矛盾,可以在保證雷達(dá)作用距離的情況下提高雷達(dá)的距離分辨力。數(shù)字脈沖壓縮就是利用數(shù)字信號處理的方法來實(shí)現(xiàn)雷達(dá)信號的脈沖壓縮,分為時域和頻域兩種實(shí)現(xiàn)方式。時域脈壓常用數(shù)字濾波器實(shí)現(xiàn),而頻域脈壓常用專用的FFT芯片或DSP完成。一般而言,對于小時寬帶寬積信號,用時域脈壓較好;但對于大時寬帶寬積信號,用頻域脈壓較好。隨著通用DSP芯片本身處理能力的不斷提高,基于并行DSP芯片的雷達(dá)信號處理系統(tǒng)基本能夠滿足雷達(dá)脈沖壓縮信號處理實(shí)時性的需求。
本文針對雷達(dá)回波的實(shí)時脈沖壓縮處理,首先分析了頻域脈壓處理方法,介紹了分段脈壓原理。然后研究了基于DSP的多片流水分段脈壓設(shè)計,以某寬帶雷達(dá)回波為例,提出了基于4片ADSP-TS101芯片的高性能并行DSP硬件處理平臺設(shè)計。最后給出了硬件實(shí)現(xiàn)和實(shí)驗(yàn)結(jié)果。
2 頻域脈壓實(shí)現(xiàn)分析
對接收到的信號作數(shù)字脈壓,等同于信號通過一個加權(quán)的匹配濾波器。從時域來說,輸出為信號與加權(quán)的匹配濾波器的線性卷積,等價于二者在頻域的乘積。需要注意的是兩離散信號頻率域相乘相當(dāng)他們在時域作圓卷積,為使圓卷積與線性卷積等價,待處理的信號須加零延伸,避免圓卷積時發(fā)生混疊。
設(shè)輸入序列x(n)長度為L,系統(tǒng)沖擊響應(yīng)h(n)長度為M(M<L),輸出y(n)。對于頻域處理,其運(yùn)算為:
式(1)實(shí)際上是圓卷積運(yùn)算,在運(yùn)算時,x(n)和h(n)必須至少補(bǔ)零到L+M-1點(diǎn),等到x(n)完全讀入后,開始脈壓運(yùn)算,得到的y(n)有效輸出長度為L點(diǎn)。因此頻域脈壓處理時間大致分為數(shù)據(jù)塊讀入讀出時間和脈壓運(yùn)算時間??傔\(yùn)算量包括L點(diǎn)x(n)數(shù)據(jù)輸入、L+M-1點(diǎn)復(fù)FFT,L+M-1點(diǎn)復(fù)點(diǎn)乘、L+M-1點(diǎn)復(fù)IFFT以及L點(diǎn)y(n)數(shù)據(jù)輸出。
當(dāng)輸入序列x(n)的長度L》M,直接做L+M-1點(diǎn)的脈壓不僅運(yùn)算量大、存儲單元多,而且有很大的數(shù)據(jù)讀入讀出延遲??梢圆捎弥丿B保留法進(jìn)行分段脈壓處理。設(shè)x(n)均勻分段,每段長度為N(滿足N≥M,N+M-1接近2的整數(shù)次冪),在每段后面再補(bǔ)上后一段的前M-1個輸入序列值,組成N+M-1點(diǎn)序列,若為最后一段,則補(bǔ)M-1個零。每個N+M-1點(diǎn)序列與h(n)脈壓后,輸出的結(jié)果取前N點(diǎn)為每段的有效輸出。這樣按順序拼接在一起即可得到輸入序列x(n)的脈壓輸出。其原理如圖1所示。
3 基于DSP的多片流水分段脈壓設(shè)計
當(dāng)分段脈壓處理時,可以采用多個分段同時脈壓的并行處理技術(shù)來減少整個脈壓過程的處理時間。流水線技術(shù)(Pipeline)為并行處理系統(tǒng)設(shè)計中實(shí)現(xiàn)時間并行性提供了一種有效方法,他將輸入流水線的任務(wù)分為一串子任務(wù),相繼的任務(wù)不斷流人流水線,利用子任務(wù)在執(zhí)行時間上的重疊(Time Interleaving),使得每個子任務(wù)都處在整個操作流程不同的處理段中,且保持在不同的完成階段來達(dá)到操作級并行。
在忽略數(shù)據(jù)內(nèi)部交換以及脈壓前的數(shù)據(jù)浮點(diǎn)化等運(yùn)算時間的前提下,可以將每段脈壓任務(wù)大致分為數(shù)據(jù)輸入、數(shù)據(jù)脈壓和脈壓結(jié)果輸出三個子任務(wù)。若各段分段脈壓過程均采用流水線技術(shù)操作,相鄰兩段脈壓任務(wù)分別由不同的DSP完成。那么相鄰兩段脈壓過程進(jìn)入流水的時間僅相差數(shù)據(jù)輸入的操作時間,流水操作如圖2所示。
設(shè)輸入序列x(n)長度為L點(diǎn),分段重疊點(diǎn)數(shù)為M-1,分段脈壓點(diǎn)數(shù)為d(為2的整數(shù)次冪)點(diǎn),定義x(n)的分段總數(shù)為p,則p=[L/(d-(M-1))],[]表示不小于此值的最小正整數(shù)(下同)。定義每段的分段長度為N,則N=[L/p]。
下面以某寬帶雷達(dá)為例,在輸入序列點(diǎn)數(shù)和分段重疊點(diǎn)數(shù)確定的情況下,采用AD公司的高性能定/浮點(diǎn)ADSP-TS101芯片,分析各流水任務(wù)時間、流水操作時總的脈壓時間、分段數(shù)、任務(wù)時間比以及參與多片流水的DSP數(shù)量等與分段脈壓點(diǎn)數(shù)之間的關(guān)系。設(shè)雷達(dá)脈沖寬度為1 μs,脈沖重復(fù)周期(PRT)為1 ms,帶寬為200 MHz,脈壓距離范圍為10 km,采樣率為220 MHz,I,Q兩路合并輸出為16 b。相鄰兩分段的重疊數(shù)據(jù)在ADSP-TS101之間采用Link口傳輸。隨分段脈壓點(diǎn)數(shù)d的變化規(guī)律見圖3和圖4。
由圖3可以看出,流水操作時,隨分段脈壓點(diǎn)數(shù)d的增加,數(shù)據(jù)脈壓時間是快速增加的,數(shù)據(jù)輸入輸出時間是先遞減后緩慢增加的??偟拿}壓時間Tpip是先遞減后快速增加的,這是因?yàn)?,在d相對較小時,數(shù)據(jù)輸入輸出時間的減少量大于數(shù)據(jù)脈壓時間的增加量,總的脈壓時間Tpip的變化表現(xiàn)為減少;而隨著d的增加,數(shù)據(jù)脈壓時間的增加量明顯大于數(shù)據(jù)輸入輸出時間的增加量,總的脈壓時間Tpip的變化表現(xiàn)為快速增加,特別當(dāng)d大于4 096點(diǎn)之后,數(shù)據(jù)脈壓時間更成為總的脈壓時間Tpip的主要部分??梢缘贸?,分段脈壓點(diǎn)數(shù)d的遞減不一定總會帶來總的脈壓時間的減少,特別當(dāng)d相對較小時,數(shù)據(jù)輸入輸出時間更成為制約總的脈壓時間Tpip的主要因素。
由圖4可以看出,隨分段脈壓點(diǎn)數(shù)d的增加,分段數(shù)反比于d,是快速遞減的。任務(wù)時間比是緩慢變化的,維持在7~8的水平,這是由ADSP-TS101本身的處理速度的決定的。在對應(yīng)的分段脈壓點(diǎn)上,選擇分段數(shù)與任務(wù)時間比中相對較小的值,得到參與多片流水的DSP數(shù)量NDSP,其變化趨勢是遞減的??梢赃@樣理解,在d相對較小時,分段數(shù)較多,每個DSP可以完成多次分段脈壓任務(wù),DSP的數(shù)量主要由任務(wù)時間比決定;而隨著d的增加,分段數(shù)快速遞減,直接減少了對DSP數(shù)量的需求。
為了評價基于DSP的多片流水分段脈壓設(shè)計的并行程度,在這里引用加速比(Accelerate Ratio)和并行效率的概念??梢远xNDSP個DSP處理器的加速比為:
可以看出,并行效率與加速比是密切相關(guān)的,Sp越接近于NDSP,Ep越接近于1。實(shí)際上,影響多片流水分段脈壓設(shè)計并行效率的因素是多方面的,我們應(yīng)該綜合考慮流水操作時總的脈壓時間、參與多片流水的DSP數(shù)量、加速比以及并行效率等各項(xiàng)指標(biāo),以盡可能達(dá)到多片流水分段脈壓的最優(yōu)設(shè)計。
根據(jù)式(2)~式(5),結(jié)合某寬帶雷達(dá)參數(shù),給出不同分段脈壓點(diǎn)數(shù)d時的流水操作時總的脈壓時間Tpip、參與多片流水的ADSP-TS101數(shù)量NDSP,加速比Sp以及并行效率Ep等指標(biāo),詳見表1。
以上分析還沒有考慮單片ADSP-TS101的數(shù)據(jù)內(nèi)部存取以及脈壓前的數(shù)據(jù)浮點(diǎn)化等運(yùn)算時間。綜合各方面因素考慮,要在1 ms內(nèi)完成該寬帶雷達(dá)回波的實(shí)時脈沖壓縮處理,我們選擇的分段脈壓點(diǎn)數(shù)為4 096點(diǎn),據(jù)此設(shè)計了基于4片ADSP-TS101芯片的多片流水分段脈壓并行DSP硬件平臺,該平臺采用了共享總線并行結(jié)構(gòu)和分布式并行結(jié)構(gòu)相結(jié)合的方式,充分利用了并行總線的帶寬,以及Link口的靈活、方便及快速的特點(diǎn)。
4 硬件平臺設(shè)計實(shí)現(xiàn)
本文設(shè)計的實(shí)時脈壓處理硬件平臺是一塊由4片ADSP-Ts101構(gòu)成的6U CPCI前面板,結(jié)構(gòu)如圖5所示。DSP1,DSP2,DSP3,DSP4采用共享總線結(jié)構(gòu)和MeshSP結(jié)構(gòu)相結(jié)合的方式,構(gòu)成板上的多片流水分段脈壓并行運(yùn)算模塊。4片DSP在通過集成于芯片內(nèi)部的發(fā)布式總線仲裁邏輯共享總線的同時,還通過Link口構(gòu)成了兩兩互連的網(wǎng)格結(jié)構(gòu),這樣充分發(fā)揮ADSP-TS101芯片的并行處理能力的優(yōu)勢。兩種并行計算結(jié)構(gòu)的結(jié)合,既減少了處理器對總線的競爭,又大大增強(qiáng)了處理器問的數(shù)據(jù)交換能力。數(shù)據(jù)總線和地址總線上連接存放程序代碼的FLASH芯片和作為外部存儲的SDRAM芯片,能夠滿足系統(tǒng)對大批量數(shù)據(jù)的處理需求。
FIFO1和FIFO2作為數(shù)據(jù)的輸入輸出緩存,寬帶雷達(dá)的視頻回波數(shù)據(jù)首先在FIFO1中緩存。當(dāng)FIFO1中寫入14 667點(diǎn)完整的目標(biāo)回波數(shù)據(jù)后,由EPLD向DSP發(fā)出數(shù)據(jù)有效標(biāo)志。當(dāng)DSP檢測到數(shù)據(jù)有效標(biāo)志后,將FIFO1中數(shù)據(jù)寫到DSP緩沖區(qū)。數(shù)據(jù)在DSP之間的傳輸主要通過Link口實(shí)現(xiàn),當(dāng)DSP將脈壓結(jié)果寫入FIFO2后,EPLD向CPCI接口芯片S5933發(fā)送數(shù)據(jù)有效標(biāo)志。當(dāng)S5933檢測數(shù)據(jù)有效標(biāo)志后將FIFO2中數(shù)據(jù)寫到主機(jī)。實(shí)物圖如圖6所示。
下面給出4片DSP的任務(wù)劃分,見表2,當(dāng)d=4 096時,p=4,N=14 667/4,我們?nèi)「鞣侄伍L度分別為3 666,3 667,3 667,3 667。
5 實(shí)驗(yàn)結(jié)果及結(jié)論
雷達(dá)回波數(shù)據(jù)經(jīng)過脈壓處理之后,由CPCI總線接口傳輸給計算機(jī),通過Matlab軟件將脈壓結(jié)果顯示如圖7所示。經(jīng)過實(shí)測,整個脈壓處理過程從數(shù)據(jù)輸入到脈壓結(jié)果輸出共耗時約780μs。完全滿足脈沖重復(fù)周期(PRT)1 ms的要求。
在雷達(dá)回波的實(shí)時處理過程中,脈沖壓縮處理占有舉足輕重的地位。本文在進(jìn)行基于DSP的多片流水分段脈壓設(shè)計時,做了兩個假設(shè):第一個是將每段脈壓任務(wù)分為數(shù)據(jù)輸入、數(shù)據(jù)脈壓和數(shù)據(jù)輸出三個子任務(wù),忽略其他的運(yùn)算時間,進(jìn)行流水設(shè)計,得出了總的脈壓時間;第二個是假設(shè)相鄰的子任務(wù)由不同的DSP完成,據(jù)此得出了參與多片流水的DSP數(shù)量。然后綜合考慮了總的脈壓時間、參與多片流水的DSP數(shù)量、加速比以及并行效率等因素,在輸入序列點(diǎn)數(shù)和分段重疊點(diǎn)數(shù)確定的情況下,研究了分段脈壓的分段長度設(shè)計,指導(dǎo)設(shè)計實(shí)現(xiàn)了基于4片ADSP-TS101芯片的高性能并行DSP硬件平臺。最后通過實(shí)測數(shù)據(jù)驗(yàn)證了硬件平臺的設(shè)計。
評論