基于C語言在FPGA上實(shí)現(xiàn)DSP的解決方案
盡管FPGA中可以實(shí)現(xiàn)浮點(diǎn)運(yùn)算單元,但它們能迅速消耗FPGA的資源,所以如果可以,最好謹(jǐn)慎使用。主要依靠浮點(diǎn)運(yùn)算的算法最好轉(zhuǎn)換成定點(diǎn)運(yùn)算,這樣你既可利用用“模塊浮點(diǎn)”方法,又可通過定點(diǎn)的方法設(shè)計(jì)整個(gè)系統(tǒng)。然后,通過對(duì)比實(shí)際輸出與原始的全浮點(diǎn)運(yùn)算的軟件實(shí)現(xiàn)來確定轉(zhuǎn)換精度。在霍爾算法的例子中,14b+7b的定點(diǎn)分辨率與全浮點(diǎn)的結(jié)果完全相同。本文引用地址:http://2s4d.com/article/148909.htm
2確定資源
在接下來的設(shè)計(jì)中,需要對(duì)每個(gè)處理部分的時(shí)鐘周期計(jì)數(shù)。通常,每個(gè)時(shí)鐘周期可以完成二到三個(gè)運(yùn)算,然后確定所需的FPGA資源以適應(yīng)代碼??梢栽诙鄠€(gè)FPGA中分段運(yùn)行代碼來獲得更高的計(jì)算能力。這些解決方案的拓展非常容易,只要使用所需的多個(gè)FPGA(最多5個(gè)),系統(tǒng)將自動(dòng)檢測(cè)它們。在該例子中,設(shè)計(jì)是基于處理塊的。這些塊按順序被發(fā)送給每個(gè)FPGA,或者從每個(gè)FPGA收集起來(其邏輯是代碼的一部分)。一個(gè)FPGA的加速比例可以達(dá)到37:1,而10個(gè)FPGA(每兩個(gè)電路板上有5個(gè))可以達(dá)到370:1。對(duì)設(shè)計(jì)進(jìn)行編碼相對(duì)簡單,因?yàn)樵O(shè)計(jì)主要由C語言完成,除了一些需要特殊Handel-C指令的新功能。這些新指令包括:增強(qiáng)位操作、并行處理、宏操作和公式、任意寬度的變量、FPGA存儲(chǔ)器接口、RAM和ROM類型、信號(hào)(代表硬件中的信號(hào)線)以及通道(在代碼并行分支或時(shí)鐘域之間通信)。工具條中的“代碼轉(zhuǎn)換”可以完成C和Handel-C的樣本轉(zhuǎn)換。
3對(duì)環(huán)境的仿真
再下一步是建立仿真環(huán)境,并在其中測(cè)試和優(yōu)化硬件代碼。仿真環(huán)境提供了完整的bit-true/cycle-true仿真,并對(duì)FPGA的實(shí)現(xiàn)進(jìn)行可靠的模擬。利用設(shè)計(jì)輸出與C軟件仿真輸出的比較來測(cè)試精度,同樣也可得到FPGA處理器上真實(shí)運(yùn)行速度的報(bào)告。通常,進(jìn)行結(jié)構(gòu)塊仿真有助于找到設(shè)計(jì)中的問題,因?yàn)檫@些塊在重組后可以確定總體的運(yùn)行效果??稍诜抡孢^程中做進(jìn)一步的調(diào)整,如利用流水線在每個(gè)時(shí)鐘周期內(nèi)進(jìn)行單輸入單輸出的測(cè)試,或?qū)⑻幚磉^程細(xì)分到更多的并行數(shù)據(jù)流中直到FPGA的資源利用率達(dá)到100%。此外,在硬件編譯時(shí)也能發(fā)現(xiàn)算法的最慢點(diǎn)并對(duì)其優(yōu)化,在FPGA甚至板子之間分割算法還可以獲得額外的速度。利用軟件,進(jìn)一步調(diào)整可獲得更好的性能。然而,精確調(diào)整帶來的性能增益卻會(huì)下降。通過簡單的增加FPGA非常具有成本效益。并不需要使設(shè)計(jì)完美化,因?yàn)?a class="contentlabel" href="http://2s4d.com/news/listbylabel/label/基于">基于這些結(jié)果的設(shè)計(jì)可以在任何時(shí)候進(jìn)行快速的仿真和優(yōu)化。一旦仿真完成,就可以將設(shè)計(jì)編譯到硬件里并激活數(shù)據(jù)流管理(DSM),以便將數(shù)據(jù)流送到FPGA處理器板而不是仿真器中。
訪問TI網(wǎng)站,獲取最新技術(shù)信息全面了解德州儀器(TI)的處理器電源參考設(shè)計(jì):交叉參考搜索、應(yīng)用手冊(cè)、工具和軟件、方框圖參考設(shè)計(jì)、模擬eLAB。
fpga相關(guān)文章:fpga是什么
矢量控制相關(guān)文章:矢量控制原理
評(píng)論