基于DSP的音頻實時處理系統(tǒng)設計
如圖2 所示,通過加入靜音檢測算法( VAD) 對輸入信號的狀態(tài)進行判斷,不僅可以減輕實際的運算量,也可降低噪音對自適應濾波器的干擾,在一定程度上避免了濾波器發(fā)散的情況。同時加入MMSE Short t imeSpect ral Amplitude Estimator替代了傳統(tǒng)的非線性處理器( NLP) 算法。在頻域內對參與回聲的頻譜能量進行估計,計算增益,最后達到相對平滑的殘余回聲和噪音的處理。
圖2 一種結合噪音消除的回聲消除原理圖
通過對濾波器狀態(tài)參數的跟蹤,根據濾波器當前是否正常收斂,殘余回聲估計模塊的輸出結果會自動調節(jié)估計值的大小,避免在濾波器正常收斂的情況下,抑制殘余回聲導致處理后正常信號損失過多的問題。
圖2 中采用的靜音檢測算法( VAD) 采用了同時檢測短時能量與過零率的方法,保證了判斷的可靠性。
在遠端語音不存在的時候,沒有必要進行回聲消除,只需要進行本地的噪音消除,若本地語音不存在則不需要做任何處理。
結合VAD 系統(tǒng)更有效地減少了對噪音和回音估計的誤差范圍,通過對濾波器系數更新的學習和調整功能使得在雙方通話過程中音頻信號具備更好的信噪比。
通過非線性信號檢測模塊加強了整體消除回音的能力。
2. 1 硬件平臺
DSP 的選型需要考慮運算速度、成本、硬件資源以及程序的可移植性等多個問題。由于算法的浮點特性,本文采用了美國德州儀器( T I) 的TMS320C6713B 浮點DSP 作為核心處理器,通過使用JT EG 標準測試接口、EDMA 控制器、GIPO 通用輸入輸出端口以及多通道音頻緩沖串口( McASP) 等主要片外設備來完成系統(tǒng)的設計。
TMS320C6713B 可以工作在225 MHz 主頻上,片內有8 個并行處理單元,分為相同的兩組,其體系結構采用甚長指令字( V LIW) 結構,單指令字長為32 b,8 個指令組成一個指令包,總字長為256 b。L1 支持4 KB的程序緩存以及4 KB 的數據緩存,L2 支持64 KB 的緩存。32 b 的外部存儲器接口( EMIF) 。與SDRAM 等無縫連接,可以尋址256 MB。
由于系統(tǒng)運行過程中需要實現(xiàn)的算法較多,僅依靠TMS320C6713B 的192 KB片內RAM 來執(zhí)行程序是很困難的。本文使用了EMIF 的接口擴展了SDRAM 作為算法和數據的存儲區(qū)域。采用TLV320AIC23B 實現(xiàn)音頻輸入和輸出,AIC23 支持48 kHz 帶寬、96 kHz 采樣率的雙聲道立體聲A/ D,D/ A,音頻輸入包括了*輸入和線路輸入。
系統(tǒng)的硬件平臺如圖3 所示。
圖3 硬件平臺結構圖
評論