新聞中心

EEPW首頁 > 汽車電子 > 設(shè)計應(yīng)用 > 基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計

基于VxWorks的多DSP系統(tǒng)的多任務(wù)程序設(shè)計

——
作者: 時間:2007-07-23 來源:嵌入式世界 收藏

  近年來,計算機(jī)產(chǎn)品的應(yīng)用領(lǐng)域越來越廣,數(shù)字信號處理器的發(fā)展表現(xiàn)得尤為明顯。芯片制造商和板開發(fā)商利用自身的優(yōu)勢不斷開發(fā)出多結(jié)構(gòu)的產(chǎn)品來滿足這種需求。通常的DSP設(shè)備是與系統(tǒng)相結(jié)合,來實(shí)時地完成某一特定任務(wù)。隨著信號采集速度和處理速度的要求越來越高,許多領(lǐng)域都需要進(jìn)行多處理器運(yùn)算,其中包括醫(yī)學(xué)、圖像處理、軍事、工業(yè)控制、電信等許多領(lǐng)域。多處理器系統(tǒng)可以根據(jù)所需實(shí)現(xiàn)的功能和處理器的性能來調(diào)節(jié)處理結(jié)點(diǎn)的數(shù)目,使系統(tǒng)達(dá)到最佳的性能價格比。

  實(shí)際上,只有從芯片開始仔細(xì)設(shè)計,才能方便地實(shí)現(xiàn)多處理器系統(tǒng)的調(diào)節(jié)功能。這里選用的是AD公司新出品的SHARC級處理器ADSP21160。

  ADSP21160具有很大的片內(nèi)存儲區(qū)、多重內(nèi)部總線結(jié)構(gòu)、獨(dú)立的I/O子系統(tǒng);具有構(gòu)造多處理器系統(tǒng)的所有特點(diǎn),能夠真正支持處理器數(shù)目的可調(diào)節(jié)功能,十分適合組成高性能浮點(diǎn)的多DSP系統(tǒng)。

  是目前世界上用戶數(shù)量最大的實(shí)時操作系統(tǒng)。這使它除了具有優(yōu)越的技術(shù)性能之外,還具有豐富的應(yīng)用軟件支持、良好的技術(shù)服務(wù)和可靠的系統(tǒng)穩(wěn)定性。由于它具有以上優(yōu)點(diǎn),本系統(tǒng)中選用了作為MVME167的操作系統(tǒng)。

  一、ADSP21160的特點(diǎn)

  ADSP21160 是AD公司采用超級哈佛結(jié)構(gòu)的一種新產(chǎn)品。21160的匯編代碼與2106x兼容,處理器具有SIMD(單指令流多數(shù)據(jù)流)功能;而2106x只具有SISD(單指令流單數(shù)據(jù)流)功能。為了充分利用這種新的功能,一些指令做了一些改變。ADSP21160包括1個100/150MHz的運(yùn)算核、雙端片內(nèi)SRAM、1個支持多處理器的集成在片內(nèi)的I/O處理器和多重內(nèi)部總線以消除I/O瓶頸。

  ADSP21160的匯編源代碼與2106x兼容。SIMD計算結(jié)構(gòu):2個32bit的計算單元,其中每一個單元包括乘法器、ALU、移位寄存器及寄存器文件。具有完備的與外圍設(shè)備接口功能。包括獨(dú)立的I/O處理器、4Mbit 的片內(nèi)雙端SRAM、可直接連接的多處理器特性及端口(串口、連接口、外總線及JTAG)。

  ADSP21160包括2個運(yùn)算處理單元,具有SIMD功能。處理單元指的是PEX和PEY。PEX始終是有效的,而PEY的有效是通過設(shè)置MODE1寄存器中的PEYEN位來實(shí)現(xiàn)的。當(dāng)PEY模式有效時,同一條指令在2個處理器單元中都得到執(zhí)行,但每一個處理器單元中的操作數(shù)不同。

  SIMD模式在存儲區(qū)和處理器單元之間的數(shù)據(jù)傳輸也是很有作用的。當(dāng)使用SIMD模式,通過加倍數(shù)據(jù)帶寬來保證處理器單元的操作。在SIMD模式,當(dāng)使用DAGs來傳輸數(shù)據(jù)時,存儲區(qū)每次訪問所傳輸?shù)氖莾蓚€數(shù)據(jù)值。

  ADSP21160包括4Mbit的片內(nèi)SRAM,分為兩塊,每一塊2Mbit??梢远x為不同字長的指令和數(shù)據(jù)存儲。每一個存儲塊的雙端口結(jié)構(gòu)可以使存儲塊獨(dú)立地被運(yùn)算核處理和I/O處理器訪問。21160的存儲區(qū)最大可以容納128K的32bit數(shù)據(jù),或256K的16bit數(shù)據(jù),或85K的48bit指令,或其他混合字長的數(shù)據(jù),但總和最大為4Mbit。所有存儲區(qū)可以16、32、48、64bit字長的字訪問。 外端口支持處理器與片外存儲器及外設(shè)的接口,片外的4G地址空間屬于21160的統(tǒng)一地址空間。

  外端口支持同步、異步及同步BURST訪問。DMA控制器的操作相對處理器運(yùn)算核是獨(dú)立和不可見的,即DMA操作可與執(zhí)行指令同時進(jìn)行。DMA傳輸可以在內(nèi)部存儲區(qū)與外部存儲區(qū)、外圍設(shè)備或主機(jī)之間進(jìn)行。21160共有14個DMA通道,其中:連接口(linkport)占6個;串口占4個;外端口(external port)占4個。21160可以通過DMA傳輸來下載程序,外圍異步設(shè)備也可以通過DMA請求/應(yīng)答線來控制2個DMA通道。

  21160具有許多特點(diǎn)支持多DSP系統(tǒng)。外端口與連接口支持多處理器系統(tǒng)的直接連接,外端口支持統(tǒng)一的地址空間,允許DSP之間互相訪問。片內(nèi)具有分布式總線仲裁邏輯,最多支持6片21160和主機(jī)連接。外端口的最大數(shù)據(jù)傳輸率為400MB/s,廣播寫信號可以同時發(fā)送到各片21160。6個連接口提供了另一種方法實(shí)現(xiàn)多處理器之間的通信。連接口的最高傳輸速率為600MB/s。

  整個系統(tǒng)基于VME總線。VME總線系統(tǒng)作為最早的國際通用開放式總線,自1981年起,經(jīng)歷了近20年的發(fā)展。其影響不斷擴(kuò)大,功能不斷完善,現(xiàn)已成為性能最好、應(yīng)用最廣的國際總線標(biāo)準(zhǔn)之一。

  根據(jù)設(shè)計要求,采用了4片ADSP21160。片外共享內(nèi)存SRAM可以被主機(jī)和各片DSP直接訪問;EPROM用來存放初始化程序和各片DSP要運(yùn)行的程序,在系統(tǒng)上電后這些程序被下載到各片DSP中;LEDs用來顯示插件的狀態(tài),如reset、normal等。每一片都有1個連接口連到插件的前面板,這樣前端采集來的數(shù)據(jù)就可以很方便地傳輸?shù)蕉郉SP上,而且也使數(shù)據(jù)的傳輸模式更加靈活。

  連接口(linkport)是SHARC系列DSP芯片的一個特點(diǎn)。ADSP21160共有6個8bit連接口提供額外的I/O服務(wù)。在100MHz時鐘下運(yùn)行時,每個連接口可達(dá)100MB/s。連接口尤其適合多處理器間點(diǎn)到點(diǎn)的連接。連接口可以獨(dú)立地同時操作,通過連接口的數(shù)據(jù)封裝成48/32bit字長后,可以從片內(nèi)存儲區(qū)直接被運(yùn)算核讀取或DMA傳輸。每一個連接口有它自己的雙緩沖I/O寄存器,數(shù)據(jù)傳輸可編程,硬件由時鐘/應(yīng)答握手線控制。4片DSP使用連接口實(shí)現(xiàn)DSP間兩兩互連。

  21160的主機(jī)接口可以很方便地與標(biāo)準(zhǔn)微處理器總線(16/32bit)相連,幾乎不需要額外硬件。主機(jī)通過21160的外端口對其進(jìn)行訪問,存儲區(qū)地址映射為統(tǒng)一的地址空間。4個DMA通道可以用于主機(jī)接口,代碼和數(shù)據(jù)傳輸?shù)能浖_銷很小,主處理器通過HBR、HBG和REDY信號線與21160進(jìn)行通信,主機(jī)可以對片內(nèi)存儲區(qū)進(jìn)行直接讀寫。

  二、開發(fā)環(huán)境Tornado

  的開發(fā)環(huán)境是WindRiver公司提供的Tornado。Tornado采用主機(jī)-目標(biāo)機(jī)開發(fā)方式,主機(jī)系統(tǒng)可采用運(yùn)行Sun Solaris、HP-UX以及Win95/NT的工作站或個人計算機(jī),VxWorks則運(yùn)行在Intel x86、MC68K、PowerPC或SPARC等處理器上。Tornado支持各種主機(jī)-目標(biāo)機(jī)連接方式,如以太網(wǎng)、串行線、在線仿真器和ROM仿真器。

  Tornado的體系結(jié)構(gòu)使得許多強(qiáng)有力的開發(fā)工具可以用于各種目標(biāo)機(jī)系統(tǒng)和各種主機(jī)-目標(biāo)機(jī)連接方式下,而不受制于目標(biāo)機(jī)的資源和通信機(jī)制。同時VxWorks具有良好的可剪裁性。因此它適用于各種環(huán)境的開發(fā),小到資源極其有限的個人手持式設(shè)備如PDA(Personal Digital Assistant);大到多處理機(jī)系統(tǒng),如VME系統(tǒng)。

  Tornado可提供一個直觀的、可視化的、用戶可擴(kuò)充的開發(fā)環(huán)境,極大縮短了開發(fā)周期。同時,由于Tornado是一個完全的開放系統(tǒng),使得集成第三方開發(fā)工具變得十分容易。

  主機(jī)與目標(biāo)機(jī)之間的通信是通過運(yùn)行各自處理器上的代理進(jìn)程來完成的,使主機(jī)上的開發(fā)工具和目標(biāo)機(jī)的操作系統(tǒng)可以完全脫離相互連接的方式。

  為了擺脫主機(jī)-目標(biāo)機(jī)通信帶寬和目標(biāo)機(jī)資源的限制,Tornado將傳統(tǒng)的目標(biāo)機(jī)方的工具遷移到主機(jī)上,如shell、loader和符號表等。這樣,系統(tǒng)不再需要額外的時間和帶寬在主機(jī)和目標(biāo)機(jī)之間交換信息,降低了對連接帶寬的需求,也避免了目標(biāo)機(jī)的資源(如內(nèi)存)被工具或符號表大量占用,使得應(yīng)用程序擁有更多的系統(tǒng)資源。同時這種遷移也使得各種主機(jī)開發(fā)工具獨(dú)立于目標(biāo)機(jī)存在,從而使同一主機(jī)平臺上的工具可以用于所有的目標(biāo)機(jī)系統(tǒng)。

  作為一個應(yīng)用軟件開發(fā)環(huán)境,Tornado提供了友好的可視化開發(fā)界面、交叉編譯環(huán)境、源碼級調(diào)試工具、目標(biāo)機(jī)命令解釋器和目標(biāo)機(jī)狀態(tài)監(jiān)視器等多種應(yīng)用工具,為應(yīng)用軟件開發(fā)提供了一個高效而可靠的平臺。

  三、程序設(shè)計

  我們選用的DSP開發(fā)工具是AD公司提供的VisualDSP。這是一個集成開發(fā)環(huán)境,支持對SHARC系列DSP芯片的開發(fā)。實(shí)時操作系統(tǒng)VxWorks的開發(fā)工具是WindRiver公司的Tornado集成開發(fā)工具。VisualDSP可以C語言或匯編語言編寫的DSP代碼,最新版本的VisualDSP還支持C++。它還有1個優(yōu)點(diǎn),就是可以編譯多片DSP的源代碼,并產(chǎn)生下載文件,這就可以很方便地進(jìn)行多DSP系統(tǒng)的軟件模擬。

  ADSP21160陣列的設(shè)計結(jié)構(gòu)使它既可以構(gòu)成單指令流多數(shù)據(jù)流(SIMD)的并行處理機(jī),也可以構(gòu)成多指令流單數(shù)據(jù)流(MISD)或多指令流多數(shù)據(jù)流(MIMD)的流水線處理機(jī),視用戶的要求而定。這兩種并行方案的選擇,簡單來說就是選擇分割數(shù)據(jù)流還是分割處理工序。SIMD方案的原理如圖1所示。

 

  以下介紹我們實(shí)驗(yàn)室承擔(dān)的水聲信號處理系統(tǒng)。本系統(tǒng)以VME總線為系統(tǒng)開發(fā)平臺,前端調(diào)理模件、模數(shù)轉(zhuǎn)換模件和前端控制模件等為VME插件,采用SHARC級DSP芯片陣列完成聲納信號實(shí)時處理,基于實(shí)時操作系統(tǒng)VxWorks及X窗口系統(tǒng)的中央控制和顯示。

  圖2是4片DSP的任務(wù)分配圖。從前端采集來的信號,經(jīng)波束形成和復(fù)解調(diào),再經(jīng)過窄帶濾波后的信號分為兩路,一路送去進(jìn)行幅度檢波,一路做頻域處理。幅度檢波就是對復(fù)信號求模,根據(jù)信號幅度判決有無目標(biāo)存在。頻域處理分兩種情況:當(dāng)發(fā)射信號為單頻脈沖時,進(jìn)行功率譜估計,然后根據(jù)多普勒頻移估計目標(biāo)速度;當(dāng)發(fā)射信號為雙曲調(diào)頻信號時,進(jìn)行相關(guān)處理。

 

  聲納綜合數(shù)據(jù)處理主要包括主動聲納信號處理和被動聲納信號處理。其中,主動聲納信號處理又根據(jù)發(fā)射信號的不同,分為非相干處理、相干處理、功率譜處理。聲納綜合數(shù)據(jù)處理主要完成:目標(biāo)自動檢測、目標(biāo)參數(shù)測定和動目標(biāo)跟蹤。

  四、操作流水線

  操作流水線是模塊內(nèi)數(shù)據(jù)計算與I/O的流水線,物理上表現(xiàn)為CPU與I/O端口的DMA之間的并行。在前端處理中由于數(shù)據(jù)率高,通信開銷很大。以通信任務(wù)最為繁重的復(fù)解調(diào)和多普勒補(bǔ)償模塊為例,輸入數(shù)據(jù)率為2Mw/s,輸出數(shù)據(jù)率為4Mw/s,高速連接口LinkPort最高速率為100Mw/s,如果采用串行傳輸?shù)脑挘ㄐ艜r間就將占用60%以上的處理時間,計算時間顯然嚴(yán)重不足。所以必須采用并行執(zhí)行,流程圖如圖3所示。這也是一種異步流水線方式,每次傳送和計算完成都須要設(shè)置標(biāo)志以通知下一操作。

 

  結(jié)束語

  在VxWorks實(shí)時操作系統(tǒng)下,4片ADSP21160上的程序已經(jīng)通過模擬輸入和系統(tǒng)測試。采用SHARC DSP 陣列能夠很好地完成聲納信號實(shí)時處理,每一片DSP至少有10%的計算裕量,基本達(dá)到設(shè)計要求。

linux操作系統(tǒng)文章專題:linux操作系統(tǒng)詳解(linux不再難懂)

c語言相關(guān)文章:c語言教程


c++相關(guān)文章:c++教程




評論


相關(guān)推薦

技術(shù)專區(qū)

關(guān)閉