數(shù)字音頻技術(shù)與杜比AC-3 作者: 時(shí)間:2007-03-09 來(lái)源:網(wǎng)絡(luò) 加入技術(shù)交流群 掃碼加入和技術(shù)大咖面對(duì)面交流海量資料庫(kù)查詢 收藏 摘要:介紹了杜比公司開發(fā)的AC-3數(shù)字音頻壓縮碼技術(shù)的原理和編解碼過(guò)程。 關(guān)鍵詞:數(shù)據(jù)壓縮 感知型編碼 AC-3編碼 AC-3解碼 隨著人們對(duì)多媒體圖像和聲音的要求越來(lái)越高,在高清晰數(shù)字電視(HDTV)和數(shù)字電影中不僅應(yīng)有高質(zhì)量的圖像,也應(yīng)當(dāng)具有CD質(zhì)量的立體聲。因?yàn)橛脭?shù)字方法記錄聲音比用模擬方法記錄聲音具有更強(qiáng)的優(yōu)勢(shì),例如傳輸時(shí)抗噪聲能力強(qiáng)、增加音頻動(dòng)態(tài)范圍、多次翻錄沒(méi)有信號(hào)衰減等。但是數(shù)字聲音最大的缺陷是記錄的數(shù)據(jù)量大,表現(xiàn)在兩個(gè)方面:其一是在傳輸過(guò)程中,傳輸數(shù)字聲音需要占用很寬的傳輸帶寬;其二是在存儲(chǔ)過(guò)程中,需要占用大量的存儲(chǔ)空間。所以在數(shù)字音頻中需要采用數(shù)字音頻壓縮技術(shù),對(duì)音頻數(shù)據(jù)進(jìn)行壓縮。 杜比AC-3提供的數(shù)字音頻壓縮編碼技術(shù)具有較高的編碼效率;而由5個(gè)全頻域聲道和1個(gè)超低音聲道組成的AC-3環(huán)繞聲系統(tǒng)能完美再現(xiàn)高質(zhì)量的立體聲。 1 數(shù)字音頻編碼的原理 目前,高品質(zhì)聲音的主流是CD音質(zhì),其采樣頻率為48kHz或44.1kHz,以每個(gè)采樣點(diǎn)16bit的精度進(jìn)行編碼,其比特率將達(dá)到每個(gè)通道768kbps(48kHz采樣率)和705.6kbps(44.1kHz采樣率),雙聲道立體聲分別需要1.54Mbps和1.41Mbps的碼率。而如果采用新的音頻編碼技術(shù),則可以在保持同等音質(zhì)的前提下,實(shí)現(xiàn)64kbps~128kbps速率編碼。以44.1K樣本/秒計(jì)算,相當(dāng)于每個(gè)采樣點(diǎn)1.5bit,以如此低的平均信息量能達(dá)到接近于CD的高音質(zhì),這就是高品質(zhì)數(shù)字音頻編碼要達(dá)到的目的。圖1一般來(lái)說(shuō),數(shù)據(jù)壓縮有兩種方法。一種方法是利用信號(hào)的統(tǒng)計(jì)性質(zhì),完全不丟失信息的高效率編碼法,稱為平均信息量編碼或熵編碼(entropy coding)。第二種方法是利用接收信號(hào)人的感覺(jué)特性,省略不必要的信息,壓縮信息量,稱為感覺(jué)編碼(perceptual coding)。 音頻信號(hào)的感覺(jué)編碼是以心理聲學(xué)原理為基礎(chǔ),利用聽覺(jué)心理特性,只記錄那些能被人的聽覺(jué)所感知的聲音信號(hào),從而達(dá)到減少數(shù)據(jù)量而又降低音質(zhì)的目的。一般而言,人耳的聽覺(jué)像20Hz~20kHz帶通濾波器,它對(duì)不同頻率的信號(hào)有不同的感知辨別率。相對(duì)于高頻而言,低頻的聲音更易新人耳感知,其中尤以對(duì)2kHz~4kHz的信號(hào)最為敏感,因而形成了圖1中的絕對(duì)可聞閾曲線。絕對(duì)可聞閾是指寂靜地聽覺(jué)可聽到的各頻段的最低音量。遮蔽效應(yīng)對(duì)于聽覺(jué)特性有著很大的影響。遮蔽分為同時(shí)性的遮蔽和非同時(shí)性的遮蔽。前者是頻域下的一種現(xiàn)象,指在相近的頻率下,強(qiáng)度較大的信號(hào)會(huì)遮蔽較小的信號(hào)。后者也稱時(shí)間的遮蔽性,是指在短暫的時(shí)間間隔內(nèi),強(qiáng)度大的信號(hào)遮蔽較小的信號(hào),它又分為前遮蔽和后遮蔽。前遮蔽是指強(qiáng)度大的信號(hào)遮蔽發(fā)生較早的小信號(hào),后遮蔽則是強(qiáng)度大的信號(hào)遮蔽發(fā)生較晚的小信號(hào)。通常前遮蔽的持續(xù)時(shí)間為20ms,對(duì)再前的聲音的影響幾乎可以忽略;而后遮蔽所產(chǎn)生的效應(yīng)相對(duì)大而且持久,一般可達(dá)100~200ms,所以應(yīng)用更為廣泛。典型的聽覺(jué)心理特性如圖1所示的頻率特性(左)和時(shí)間特性(右)。 圖1中,噪聲A因在絕對(duì)可聞閾以上而可聞,但噪聲C因在絕對(duì)可聞閾以下,故聽不到。如左圖所示,當(dāng)有黑線所示的某頻率信號(hào)存在時(shí),靠近它的本來(lái)可以聽見的噪聲B就變得聽不見了,這種現(xiàn)象就是同時(shí)性遮蔽效應(yīng)。而如右圖所示,當(dāng)某時(shí)刻有黑線所示的信號(hào)存在時(shí),位于其后面的比它小一些的本來(lái)可聽見的噪聲E也變得聽不見了,這種現(xiàn)場(chǎng)稱為非同時(shí)性遮蔽效應(yīng)。兩種效應(yīng)合成的結(jié)果形成了實(shí)際的可聞閾。 杜比AC-3就是一種感知型編碼方式,它把整個(gè)音頻頻帶分割成若干個(gè)較窄的頻段,因?yàn)槿祟惖穆犛X(jué)對(duì)不同頻率的聲音具有不同的靈敏度,各頻段的寬度并不完全一樣。由于有用的信號(hào)被劃分成狹窄的頻頻,編碼噪聲的濾降總是就比較容易。因?yàn)閷?duì)于每個(gè)頻段來(lái)說(shuō),該頻率以外的所有信號(hào)可以全部被濾除掉而不會(huì)損傷有用信號(hào)。而頻段內(nèi),剩余噪聲信號(hào)的頻率與有用信號(hào)的頻率非常接近,這正是遮蔽效應(yīng)發(fā)揮最大作用的區(qū)域。從這種意義上說(shuō),象AC-3這樣的感知型編碼系統(tǒng)是一種非常有效的減噪系數(shù)。這些被分割成狹窄頻段的多路數(shù)字音頻信號(hào)最終還需要被合成一路完整的全頻帶信號(hào),但每一個(gè)頻段所占有的數(shù)據(jù)量并不是平均分配的,編碼器內(nèi)部有一個(gè)“聽覺(jué)遮蔽模塊”,可以模擬人的聽覺(jué)遮蔽效應(yīng),它能根據(jù)信號(hào)的動(dòng)態(tài)特性來(lái)決定在某一時(shí)刻的數(shù)據(jù)用量應(yīng)當(dāng)如何分配給各頻段才是最合適的。頻譜密集、音量大的聲音元素應(yīng)該獲得較多的數(shù)據(jù)占有量,那些由于遮蔽效應(yīng)而聽不到的聲音則少占用或不占用數(shù)據(jù)量。 2 AC-3的編解碼技術(shù)簡(jiǎn)介 AC-3是在AC-1和AC-2基礎(chǔ)上發(fā)展起來(lái)的多通道編碼技術(shù),保留了原AC-2中如窗函數(shù)處理、指數(shù)變換編碼、自適應(yīng)比特分配等許多特點(diǎn),還新增了運(yùn)用立體聲多聲道的編碼技術(shù)策略的coupling和rematrix算法。一般而言,立體聲的左聲道和右聲道的信號(hào)在聽覺(jué)上十分相似,存在著許多重復(fù)的冗余信息,將這兩個(gè)聲道的信號(hào)聯(lián)合起來(lái)加以編碼,便可除去冗余的信號(hào)且不會(huì)影響原來(lái)的音質(zhì)。這里AC-3陣低碼率的又一個(gè)有效的手法。圖2為AC-3編碼器原理框圖。AC-3輸入PC聲音數(shù)據(jù),輸出壓縮后的數(shù)碼流。編碼的第一步是,運(yùn)用TDAC(Time Domain Aliasing Cancellation)濾波器把時(shí)域內(nèi)的PC取樣數(shù)據(jù)變換成頻域內(nèi)成塊的一系列變換系數(shù),每個(gè)變換系數(shù)以二進(jìn)制指數(shù)形式表示,即由一個(gè)指數(shù)和一個(gè)尾數(shù)構(gòu)成。指數(shù)部分經(jīng)編碼后構(gòu)成了整個(gè)信號(hào)大致的頻譜,又被稱為頻譜包絡(luò)。用頻譜包括和遮蔽由線的相關(guān)性決定每個(gè)尾數(shù)的比特分配。由于比特分配中采用了前/后向混合自適應(yīng)比特分配以及公共比特池等技術(shù),因而可使有限的碼率在各聲道之間、不同的頻率分量之間獲得合理的分配;在對(duì)尾數(shù)的量化過(guò)程中,可對(duì)尾數(shù)進(jìn)行抖晃處理,抖晃所使用的偽隨機(jī)數(shù)生器的可在不同的平臺(tái)上獲得相同的結(jié)果。最后由六個(gè)塊的頻譜包絡(luò)、粗量化的尾數(shù)及相應(yīng)的參數(shù)組成AC-3數(shù)據(jù)幀格式,連續(xù)的幀匯成數(shù)碼流輸出。 由時(shí)域變換到頻域的塊長(zhǎng)度的選擇是指數(shù)變換編碼的基礎(chǔ)。在AC-3中定義了兩種長(zhǎng)度切換,一種是512個(gè)樣值點(diǎn)的長(zhǎng)塊,一種是256個(gè)樣值點(diǎn)的短塊。在信號(hào)頻譜分析時(shí),對(duì)要處理的聲道信號(hào)塊區(qū)截取得越長(zhǎng)越好,這樣可以得到較好的頻率分辨力,同時(shí)也能得到較高的編碼效率。但是較長(zhǎng)的數(shù)據(jù)塊可能包含了一些不同一些可能被識(shí)別的噪音,如pre-echo。也就是說(shuō)人耳因時(shí)間和頻率上存在的遮蔽效應(yīng)在進(jìn)行指數(shù)變換編碼時(shí)是有矛質(zhì)的,不能同時(shí)兼顧,必須統(tǒng)籌處理。對(duì)于穩(wěn)態(tài)信號(hào),其頻率隨時(shí)間變換緩慢,為提高編碼效率,要求濾波器組有好的頻率分辨力,即要求一個(gè)長(zhǎng)區(qū)塊;而對(duì)于快速變化的信號(hào),則要求好的時(shí)間分辨力,即要求一個(gè)短區(qū)塊。在編碼器中,輸入信號(hào)在經(jīng)過(guò)3Hz高通濾波器去除直流成分后,再經(jīng)過(guò)一個(gè)8kHz的高通濾波器取出高頻成分,用其能量與預(yù)先設(shè)定的閾值相比較,以檢測(cè)信號(hào)的瞬變情況。 AC-3采用基于改良離散余弦變換(MDCT)的自適應(yīng)變換編碼(ATC)算法。雖然在AC-3標(biāo)準(zhǔn)中定義了MDCT變換,但是實(shí)際采用一個(gè)N/4點(diǎn)的IFFT(快速傅立葉變換),再加上兩個(gè)簡(jiǎn)單的Pre-IFFT和Post-IFFT作為調(diào)整,以實(shí)現(xiàn)一個(gè)N點(diǎn)的IMDCT變換。ATC算法的一個(gè)重要考慮是基于聽覺(jué)遮蔽效應(yīng)的臨界頻帶理論,即在臨界頻帶內(nèi)一個(gè)聲音對(duì)另一個(gè)聲音信號(hào)的遮蔽效應(yīng)最明顯。因此,劃分頻帶的濾波器組要有足夠迅速的頻率響應(yīng),以此保證臨界頻帶外的噪聲衰減足夠大,使時(shí)域和頻率內(nèi)的噪聲限定在遮蔽閾值以下。 在AC-3編碼器的比特分配技術(shù)中,采用了應(yīng)用廣泛的前向和后向自適應(yīng)比特分配法則。前向自適應(yīng)方法是編碼器計(jì)算比特分配,并把比特分配信息明確地編入數(shù)據(jù)比特流中,其特點(diǎn)是在前端編碼過(guò)程中使用聽覺(jué)模型,因此修改模型對(duì)接收側(cè)解碼過(guò)程沒(méi)有影響;其缺點(diǎn)是降低編碼效率,因?yàn)橐獋魉捅忍胤峙湫畔⒍加昧艘徊糠钟行П忍亍:笙蜃赃m應(yīng)方法沒(méi)有得到編碼器明確的比特分配信息,而是從數(shù)碼流中產(chǎn)生比特分配信息,優(yōu)點(diǎn)是不占用有效比特,因此有更高的傳輸效率。其缺點(diǎn)是要從接收的數(shù)據(jù)中計(jì)算比特分配,如果計(jì)算太復(fù)雜會(huì)使解碼器的成本升高。此外,解碼器的算法也會(huì)隨著編碼器聽覺(jué)模型的改變而改變。AC-3采用混合前向/后向自適應(yīng)比特分配,在提高碼率和降低成本間取得了平衡。圖3為AC-3解碼器的原理框圖。AC-3解碼器的解碼原理基本上是編碼的逆向過(guò)程,首先解碼器必須與編碼數(shù)據(jù)流同步,然后從經(jīng)過(guò)數(shù)據(jù)糾錯(cuò)校驗(yàn)的數(shù)碼流中分離出控制數(shù)據(jù)、系統(tǒng)配置參數(shù)、編碼后的頻譜包絡(luò)及量化后的尾數(shù)等內(nèi)容,根據(jù)聲音的頻譜包絡(luò)產(chǎn)生比特分配信息,對(duì)尾數(shù)部分進(jìn)行反量化,恢復(fù)變換系數(shù)的指數(shù)和尾數(shù),再經(jīng)過(guò)合成濾波器組,把數(shù)據(jù)由頻域變換到時(shí)域,最后輸出重建的PCM樣值信號(hào)。 通過(guò)對(duì)AC-3的了解,可以看到AC-3技術(shù)充分利用人耳的感官模型,針對(duì)不同性質(zhì)的信號(hào),采取了相應(yīng)有效的算法,達(dá)到了在保證較高音質(zhì)的前提下實(shí)現(xiàn)較高碼率的預(yù)期目的,是一種非常高效而又經(jīng)濟(jì)的數(shù)字音頻壓縮系統(tǒng)。AC-3是美國(guó)數(shù)字電視系統(tǒng)的強(qiáng)制標(biāo)準(zhǔn),是歐洲數(shù)字電視系統(tǒng)的推薦標(biāo)準(zhǔn),同時(shí),AC-3還是DVD系統(tǒng)的強(qiáng)制標(biāo)準(zhǔn)。目前我國(guó)正在發(fā)展和推廣數(shù)字電視系統(tǒng),所有有理由相信AC-3技術(shù)會(huì)有一個(gè)不錯(cuò)的應(yīng)用前景。
評(píng)論