新聞中心

EEPW首頁 > 嵌入式系統(tǒng) > 設(shè)計應(yīng)用 > 雷達(dá)信號處理:FPGA還是GPU?

雷達(dá)信號處理:FPGA還是GPU?

作者:MichaelParker 時間:2014-02-13 來源:摘自《電子發(fā)燒友》 收藏

  為降低桶形移位頻率,綜合過程盡可能使用較大的尾數(shù)寬度,從而不需要頻率歸一化和去歸一化。27 × 27和36 × 36硬核乘法器支持比單精度實(shí)現(xiàn)所要求的23位更大的乘法計算,54 × 54和72 × 72結(jié)構(gòu)的乘法器支持比52位更大的雙精度計算,這通常是雙精度實(shí)現(xiàn)所要求的。邏輯已經(jīng)針對大規(guī)模定點(diǎn)加法器電路進(jìn)行了優(yōu)化,包括了內(nèi)置進(jìn)位超前電路。

本文引用地址:http://2s4d.com/article/221498.htm

  當(dāng)需要進(jìn)行歸一化和去歸一化時,另一種可以避免低性能和過度布線的方法是使用乘法器。對于一個24位單精度尾數(shù)(包括符號位),24 × 24乘法器通過乘以2n對輸入移位。27 × 27和36 × 36硬核乘法器支持單精度擴(kuò)展尾數(shù),可以用于構(gòu)建雙精度乘法器。

  在很多線性代數(shù)算法中,矢量點(diǎn)乘是占用大量FLOP的底層運(yùn)算。單精度實(shí)現(xiàn)長度是64的長矢量點(diǎn)乘需要64個浮點(diǎn)乘法器,以及隨后由63個浮點(diǎn)加法器構(gòu)成的加法樹。這類實(shí)現(xiàn)需要很多桶形移位電路。

  相反,可以對64個乘法器的輸出進(jìn)行去歸一化,成為公共指數(shù),最大是64位指數(shù)??梢允褂枚c(diǎn)加法器電路對這些64路輸出求和,在加法樹的最后進(jìn)行最終的歸一化。如圖4所示,這一本地模塊浮點(diǎn)處理過程省掉了每一加法器所需要的中間歸一化和去歸一化。即使是IEEE 754浮點(diǎn)處理,最大指數(shù)決定了最終的指數(shù),因此,這種改變只是在計算早期進(jìn)行指數(shù)調(diào)整。

圖4.矢量點(diǎn)乘優(yōu)化

  圖4.矢量點(diǎn)乘優(yōu)化

  但進(jìn)行信號處理時,在計算最后盡可能以高精度來截斷結(jié)果才能獲得最佳結(jié)果。這種方法傳遞除單精度浮點(diǎn)處理所需要尾數(shù)位寬之外的額外的尾數(shù)位寬,一般從27位到36位補(bǔ)償了單精度浮點(diǎn)處理所需要的早期去歸一化這種次優(yōu)方法,。采用浮點(diǎn)乘法器進(jìn)行尾數(shù)擴(kuò)展,因此,在每一步消除了對乘積進(jìn)行歸一化的要求。

  這一方法每個時鐘周期也會產(chǎn)生一個結(jié)果。體系結(jié)構(gòu)可以并行產(chǎn)生所有浮點(diǎn)乘法,但不能高效并行進(jìn)行加法。原因是因?yàn)椴煌膬?nèi)核必須通過本地存儲器傳輸數(shù)據(jù)實(shí)現(xiàn)通信,因此缺乏架構(gòu)的連接的靈活特性。

  融合數(shù)據(jù)通路方法產(chǎn)生的結(jié)果比傳統(tǒng)IEEE 754浮點(diǎn)結(jié)果更加精確,如表3所示。

  表3.Cholesky分解準(zhǔn)確性(單精度)

表3.Cholesky分解準(zhǔn)確性(單精度)

  使用Cholesky分解算法,實(shí)現(xiàn)大規(guī)模矩陣求逆,獲得了這些結(jié)果。相同的算法以三種不同的方法實(shí)現(xiàn):

  ♦ 在MATLAB/Simulink中,采用IEEE 754單精度浮點(diǎn)處理。
  ♦ 在RTL單精度浮點(diǎn)處理中,使用融合數(shù)據(jù)通路方法。
  ♦ 在MATLAB中,采用雙精度浮點(diǎn)處理。

  雙精度實(shí)現(xiàn)要比單精度實(shí)現(xiàn)精度高十億倍(109)。

  MATLAB單精度誤差、RTL單精度誤差和MATLAB雙精度誤差對比確認(rèn)了融合數(shù)據(jù)通路方法的完整性。采用了這一方法來獲得輸出矩陣中所有復(fù)數(shù)元素的歸一化誤差以及矩陣元素的最大誤差。使用Frobenius范數(shù)計算了總誤差:

  由于范數(shù)包括了所有元素的誤差,因此比單一誤差大很多。

  此外,DSP Builder高級模塊庫和OpenCL工具流程都針對下一代體系結(jié)構(gòu),支持并優(yōu)化目前的設(shè)計。由于體系結(jié)構(gòu)創(chuàng)新和工藝技術(shù)創(chuàng)新,性能可以達(dá)到100峰值s/W。

  結(jié)論

  高性能雷達(dá)系統(tǒng)現(xiàn)在有新的處理平臺選擇。除了更好的SWaP,與基于處理器的解決方案相比,F(xiàn)PGA能提供低延時和高。隨著下一代高性能計算優(yōu)化FPGA的推出,這種優(yōu)勢會更明顯。

  Altera的OpenCL編譯器為編程人員提供了幾乎無縫的通路來評估這一新處理體系結(jié)構(gòu)的指標(biāo)。Altera OpenCL符合1.2規(guī)范,提供全面的數(shù)學(xué)庫支持。它解決了傳統(tǒng)FPGA遇到的時序收斂、DDR存儲器管理以及PCIe主處理器接口等難題。

  對于非開發(fā)人員,Altera提供DSP Builder高級模塊庫工具流程,支持開發(fā)人員開發(fā)高fMAX定點(diǎn)或浮點(diǎn)DSP設(shè)計,同時保持基于Mathworks的仿真和開發(fā)環(huán)境的優(yōu)點(diǎn)。使用FPGA的雷達(dá)開發(fā)人員多年以來一直使用該產(chǎn)品,實(shí)現(xiàn)更高效的工作流程和仿真,其fMAX性能與手動編碼HDL相同。

fpga相關(guān)文章:fpga是什么


鎖相環(huán)相關(guān)文章:鎖相環(huán)原理

上一頁 1 2 3 下一頁

關(guān)鍵詞: FPGA CPU GPU GFLOP 轉(zhuǎn)換器

評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉