利用麥克風數(shù)組抑制背景噪聲
第二部分
麥克風數(shù)組的解決方案
根據(jù)選用的方法,麥克風數(shù)組解決方案可以成為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲的一項非常高效的技術。
配合適當?shù)乃惴?,?shù)組中的個別麥克風信號經(jīng)過濾波后再組合,以便達到波束成形或空間濾波的效果,進而產(chǎn)生一個復雜的麥克風數(shù)組極性響應模式,能夠指向或遠離某個聲音位置。因此,可以將某個位置的聲音隔離或加強,又或可將其抑制或拒絕。同樣地,麥克風聲道中的信號相關性可找出主要信號的方向及其正確位置。
視乎數(shù)組的復雜度及應用,該數(shù)組可經(jīng)由一個配備了數(shù)字信號處理器的模擬電路,再加上適當?shù)挠嬎銠C軟件和一系列方法去控制。
波束成形
波束成形分為兩種技術:自適應及定向。
在自適應波束成形技術中,可通過數(shù)據(jù)相關濾波及改變對數(shù)據(jù)的時間響應去調(diào)節(jié)波束的方向,在自適應波束成形方面已有幾種方法被開發(fā)出來。雖然在信號的處理上比較繁復,但好處是設計靈活度更高,包括麥克風的數(shù)量、類型及間隔距離。自適應波束成形一般需要數(shù)字信號處理器或計算機軟件來實現(xiàn)。
至于定向波束成形方面,波束的行走方向會按照相關聲源的方位而優(yōu)化,并且同時排除來自其它方向的噪聲。一般來說,排列緊密兼具備固有方向性的差分式麥克風端射數(shù)組都是依靠固定時間延遲或其它方法來改變波束的方向。對于這類應用,任何濾波及信號處理的方法均須對特別的機械設計加以優(yōu)化。定向波束成形一般需要模擬電路、數(shù)字信號處理器或計算機軟件來實現(xiàn)。
對于語音應用來說,采用定向波束成形解決方案會比較好,尤其當應用牽涉到語音辨識。假如以模擬電路來實現(xiàn),它們便應該:
● 對噪聲輸入有實時的響應
● 容易實現(xiàn)而且無需開發(fā)任何的算法程序
● 為抑制穩(wěn)態(tài)及非穩(wěn)態(tài)噪聲提供一個可接受的信/噪比改進(SNRI)值
● 在無語音時表現(xiàn)極低的失真,并且可改善語音質(zhì)量測試(ITU-T P.835)的整體平均意見分數(shù)(mean opinion score)
● 運算復雜度低并具備低信號延遲
● 功耗比其它解決方案小
與定向方案比較,采用數(shù)字信號處理器或軟件實現(xiàn)的自適應波束成形的缺點為:
● 當實施及調(diào)節(jié)抑制算法時,需要時間去重復辨識及收斂噪聲
● 雖然可提供較佳的SNRI值,但通常也會為語音輸出信號帶來較多的問題,包括因噪聲收斂時間所引起的延遲、卡嗒聲和砰啪聲、非意愿靜音、頻率失真、回聲或與子頻帶頻率信號處理方法有關的不定期信號級變化
● 由于需要另行開發(fā)演算程序,因此在實現(xiàn)上比較困難
● 需要更大的功耗
所有波束成形解決方案都是采用很小的數(shù)組,它們對誤差都非常敏感,包括由麥克風增益與相位失配所引起的誤差,以及由于音頻信號路徑嵌入于產(chǎn)品內(nèi)而非設于大氣中所導致的路徑偏差。因此,波束解決方案必須具備某種形式的補償,而這種補償可以設于波束成形系統(tǒng)之內(nèi),又或是在系統(tǒng)之外加設適合的麥克風和音頻信號路徑。
麥克風間隔
奈奎斯特空間采樣率為相關最高頻率的二分之一個波長(d=λ/2)。為了從空間取得相關頻率的一個波長樣品,兩個傳感器(即麥克風)必須相隔二分之一個波長。
然而,當傳感器的間隔少于二分之一個波長時(d 1/2λ),過采樣便會發(fā)生,使波長被采樣超過兩次。相反地,如距離大于二分之一個波長(d > 1/2λ),空間性欠采樣便會發(fā)生,這時第一個傳感器在完成一個波長的采樣后,會在第二個傳感器進行采樣之前再重新啟動??臻g性欠采樣可將較高頻的信號混迭到相關的頻帶,導致結果出現(xiàn)混亂。為了防止出現(xiàn)假頻,采樣器的頻寬必須限制在最高相關頻率以上。
不少研究指出假如能夠盡量縮少傳感器之間的距離便可打造出高效的麥克風數(shù)組,距離可以比奈奎斯特速率的最低要求小很多。現(xiàn)再舉一個例子,其中傳感器的間隔為相關聲波的八分之一個波長。
在一個純語音系統(tǒng)中,頻率范圍為300Hz 到 3500Hz,而最大聲音能量可出現(xiàn)在500Hz 到 2500Hz之間。在此條件下,λ/8的間隔在3500Hz下為1.18公分,而于2500Hz下為1.65公分。
由于波長增加,在3500Hz 及2500Hz頻率以下的音頻信號仍然會被過采樣,因此1.18公分或1.65公分的間隔能有效地取得更多的信號樣品。
另一個計算方法將間隔定為兩公分,如此當頻率為2500Hz時,波長的間隔(λ)/(c/df)便為:
λ/(331.1/0.02*2500)=λ/6.62
假如空間采樣率在最高相關頻率下仍然低于λ/2,則需要調(diào)節(jié)麥克風的間隔以滿足產(chǎn)品的應用要求。但隨著間隔越來越擠(空間采樣率越來越高),麥克風數(shù)組中的遠場信號之間的相干性變大,使得數(shù)組在各頻率下均可發(fā)揮更佳的整體背景噪聲抑制效能。相反地,假如間隔變得較寬闊,數(shù)組的整體抑制能力便會下降,變得難以對較低頻信號作出反應。
一旦決定了傳感器的間隔,便可對應頻率的需求將數(shù)組優(yōu)化。假如采用的是定向波束成形方案,數(shù)組的響應模式也需同時被固定。
不論是任何的產(chǎn)品,在設計的過程中必須要作出一些折衷決定,包括在操作頻率范圍與所需噪聲抑制級之間、理論與實際麥克風間隔之間、以及整體的數(shù)組系統(tǒng)成本和復雜性之間等。
麥克風數(shù)組解決方案的例子
以下采用美國國家半導體的遠場抑制麥克風數(shù)組放大器LMV1088作為麥克風數(shù)組解決方案的一個例子,它可為語音應用提供高至20 dB的背景噪聲抑制。LMV1088是一個模擬定向波束成形解決方案,適用于采用全指向性麥克風的差分式雙麥克風端射數(shù)組。
圖中兩個麥克風分別位于兩條相距約1.5公分至2.5公分的線上,或保持等同的聲波路徑距離。說話者與手機或耳機的麥克風距離最好保持2公分至10公分,通過使用圖1和圖2便可計算出語音信號隨距離變化的損耗。
LMV1088不僅可為兩條聲道上的聲音、麥克風和放大器信號路徑之間的差別提供初始性補償,并且可執(zhí)行修正濾波令語音輸出更加自然,還可提供頻寬限制濾波功能。
由于內(nèi)部放大器增益可通過I2C指令調(diào)節(jié),因此可使用不同靈敏度的麥克風,并促使LMV1088的輸出信號級能配合模擬輸入信道信號的要求,以針對各式各樣的通信處理器及設備。
評論