新聞中心

EEPW首頁 > 設計應用 > 3G 手機語音識別應用中DSP的選擇策略

3G 手機語音識別應用中DSP的選擇策略

作者: 時間:2010-03-18 來源:網(wǎng)絡 收藏

  成本、性能和效率的折衷

  的速度越快,就越便于利用現(xiàn)代的HMM技術,如信道匹配和聲域匹配技術,因此,理論上講,速度越快,ASR系統(tǒng)的性能就越好。然而,并行處理方法在提高ASR系統(tǒng)吞吐量中也扮演著重要角色。例如,一個具有4 ALU(算術邏輯單元)的200MHz 比只有1 ALU但運行于400MHz的DSP具有更高的吞吐量。根據(jù)具體的不同,2到3個單ALU DSP提供的性能與一個具有4 ALU的DSP相仿。相對一個具有4 ALU的DSP處理器方案來說,多個單ALU的DSP會提高的成本,因此對于適銷對路產(chǎn)品要充分權衡成本與性能之間的折衷。

成本性能和效率的折衷

  總之,當比較一個600MHz的單ALU DSP和一個300MHz但有4 ALU的DSP時,設計工程師始終應把握的最終目標是高效的運算吞吐量,具有多個ALU的DSP也許是最好的解決方案。

  性能與功耗

  頂級性能的DSP采用并行結構來獲得最佳的性能空間。有個著名的平衡型并行結構StarCore SC140就采用了指令級并行結構,它具有4個并行ALU以及一個稱為變長執(zhí)行集(VLES)的改進型甚長指令字模型。VLES的優(yōu)點在于它支持在內(nèi)存中完成高效的指令調度、執(zhí)行和打包。它能通過一個指令隊列對前端提供反饋,并通過調度器控制后端,因此除非需要執(zhí)行計算,VLES處理一般不消耗功率。

 在并行VLES結構中,一些特殊指令需要成組以避免空操作(Nop),由于減少了時鐘周期,處理時間也相應減少了。比較而言,在甚長指令字計算中,所有執(zhí)行步驟都必須按順序排列,因此在一個8字節(jié)的執(zhí)行集甚至是1字節(jié)數(shù)據(jù)時,系統(tǒng)就需要7個占位符(placeholder)或Nop。

  由于VLES結構不需要Nop,VLES設計中的復雜性從硬件或編程器轉移到了編譯器。由于每個周期都充滿了數(shù)據(jù),因此每個周期就具有更高的效率,從而也提高了電源與內(nèi)存的使用效率。

  電源管理
  
  由于ASR系統(tǒng)需要連續(xù)處理語音數(shù)據(jù),會使DSP成為消耗電能的主要部件,因此高效利用電源對設備成功走向市場至關重要。
  
  在高性能DSP中,選擇16位指令集而非32位指令集能提高代碼密度,進一步減少對內(nèi)存、功耗和體積的需求,一部分原因是由于更短的16位指令集可以減少寄存器和數(shù)據(jù)線數(shù)量。例如在ASR中,存儲的詞匯量可能達到2.5MB(對于1024簇的三音素狀態(tài),5個合成和39個參數(shù)來說,聲學HMM狀態(tài)模型是400KB;一本有1萬個三態(tài)三音素代碼本是60KB;三音素狀態(tài)轉移概率矩陣是500KB;一個具有40個雜亂態(tài)2萬字的雙字母組是1.6MB)。如果DSP具有高的代碼密度,能為ASR系統(tǒng)提供固定數(shù)量的存儲器,那么就可以獲得更好更大的聲學和語言模型。

  片上和片外存儲器

  對于ASR系統(tǒng)中使用的DSP來說,有效地利用片上和片外存儲器是另外一個重要的課題。由于ASR系統(tǒng)需要大量的存儲空間用于詞匯與模式識別數(shù)據(jù)的存儲,一個靈活的存儲結構在這里將顯得特別重要。例如,一個具備統(tǒng)一尋址存儲器的DSP能使設計工程師很好地平衡程序和數(shù)據(jù),還能平衡系統(tǒng)算法的復雜性與聲學和語言模型的大小以獲得最優(yōu)化的性能。

  例如,如果具有100條命令的識別系統(tǒng)模型只有100kB的片上系統(tǒng)內(nèi)存,總共內(nèi)存空間需求是240kB,那么采用二次識別方法能更有效地利用片上快速存儲器。

  第一次(原始識別階段)只使用39個參數(shù)中的13個MFCC,因此模型大小為80kB,可以載入片上內(nèi)存。原始識別階段的候選命令數(shù)量要比原來的100個少,比方說是33個命令,但可信度高達99.9%。

  第二次(精確識別階段)把33個候選命令的39個參數(shù)作為模型使用,大小是80kB,因此又可以把該模型裝載入片上內(nèi)存。這種二次識別方法會引入一些延時,但延時非常小,大約只有10ms,說話人一般不會覺察到。

  統(tǒng)一尋址存儲器能夠支持較大的詞匯庫或命令集,還能支持較大的HMM模型或神經(jīng)網(wǎng)絡系數(shù),因此能簡單化實時任務。例如為ASR系統(tǒng)的程序和數(shù)據(jù)準備100kB的存儲器,設計工程師就能平衡好算法復雜性與詞匯量或命令集大小之間的關系。如果程序要占50kB,那么數(shù)據(jù)只能是50kB。如果允許降低識別精度而將程序代碼壓縮到20kB,那么命令集就能用到80kB,也就是增加了詞匯庫容量。

  在ASR系統(tǒng)中,高度并行化、高代碼密度和有效利用存儲器等優(yōu)點還能使DSP完成以外的任務。在大多數(shù)情況下,設計工程師可以將部分計算資源分配給之用,而將剩余資源用來執(zhí)行信道處理系統(tǒng)中所需的其它任務。



評論


相關推薦

技術專區(qū)

關閉