音頻嵌入數(shù)字水印研究方案
摘 要: 在論述音頻水印技術(shù)及其發(fā)展的基礎(chǔ)上,綜述了音頻數(shù)字水印的一些重要算法,并提出了一個基于離散小波分析并結(jié)合人耳聽覺特性設(shè)計的明水印算法。
本文引用地址:http://2s4d.com/article/165826.htm近幾年來,網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和計算機(jī)的迅速普及使得信息交流,編輯和發(fā)布變得十分容易。信息技術(shù)的發(fā)展在給人類生活帶來快捷便利的同時,也被一些不法分子利用計算機(jī)進(jìn)行詐騙,也使人們面臨著嚴(yán)峻挑戰(zhàn)。打擊不法分子已經(jīng)成為一個迫切需要解決的現(xiàn)實問題。數(shù)字水印是能滿足這些要求的一項技術(shù)。
較早利用分塊DCT的水印技術(shù),他們的水印方案是用一個密鑰隨機(jī)的選擇圖像的一些分塊,在頻域的中頻上稍稍改變一個三元組來隱藏二進(jìn)制序列信息。這種方法對有損壓縮和低通濾波是穩(wěn)健的。Cox等[提出了著名的基于圖像全局變換的數(shù)字水印技術(shù),該方案對整個圖像作離散余弦變換(DCT),Barni等提出一種利用HVS掩蔽特性的基于DCT的水印算法,在水印嵌入階段,對 的圖像進(jìn)行 的DCT變換,對DCT系數(shù)按Zig-Zag掃描重新排列為一維向量,留下向量中開始的L個系數(shù)不作修改,對第L個系數(shù)后面的M個系數(shù)進(jìn)行修改以嵌入水印。黃繼武等人 在對DCT系數(shù)DC和AC分量的定性和定量分析的基礎(chǔ)上,指出DC分量比AC分量更適合嵌入水印,嵌入DC分量的水印具有更好的穩(wěn)健性,并提出了一個利用DC分量的自適應(yīng)算法。
數(shù)字水?。―igital Watermarking)技術(shù)是將一些標(biāo)識信息(即數(shù)字水?。┲苯忧度霐?shù)字載體當(dāng)中(包括多媒體、文檔、軟件等)或是間接表示(修改特定區(qū)域的結(jié)構(gòu)),且不影響原載體的使用價值,也不容易被探知和再次修改。但可以被生產(chǎn)方識別和辨認(rèn)。通過這些隱藏在載體中的信息,可以達(dá)到確認(rèn)內(nèi)容創(chuàng)建者、購買者、傳送隱秘信息或者判斷載體是否被篡改等目的。數(shù)字水印是信息隱藏技術(shù)的一個重要研究方向。 數(shù)字水印是實現(xiàn)版權(quán)保護(hù)的有效辦法,是信息隱藏技術(shù)研究領(lǐng)域的重要分支。本文簡單介紹了數(shù)字水印的幾種重要算法,提出了一個基于離散小波變換(DWT)的音頻數(shù)字水印模型,并給出了部分實驗結(jié)果。
1 音頻水印
音頻數(shù)字水印的主要應(yīng)用是隱蔽通信及版權(quán)保護(hù)。隱蔽通信注重信息的隱匿以及數(shù)據(jù)的嵌入容量,版權(quán)保護(hù)則強(qiáng)調(diào)穩(wěn)健性。目前應(yīng)用于音頻產(chǎn)品數(shù)字版權(quán)保護(hù)的水印技術(shù)大多局限于非壓縮域,包括時域和變換域。時域主要有LSB算法和回聲算法,變換域算法則主要采用DCT、DFT以及DWT。
音頻嵌入數(shù)字水印比較重要的算法有以下幾類:
(1)最不顯著位嵌入(LSB-Lesat Significant Bit)是一種最簡單的嵌入方法。任何形式的水印均可以轉(zhuǎn)換成一串二進(jìn)制的碼流。音頻文件的每一個采樣數(shù)據(jù)也是用二進(jìn)制數(shù)值加以表示的。這樣可以通過將每一個采樣值的最不顯著位(通常為最低位),用代表水印的二進(jìn)制位替換,即可在音頻信號中嵌入水印。如果將音頻信號看作水印傳輸?shù)男诺溃】醋髟谛诺乐袀鬏數(shù)男盘?,理想情況下,信道容量將是1Kbps/kHz,即采樣率和比特率在數(shù)值上相當(dāng)。偽隨機(jī)序列可以由偽隨機(jī)序列發(fā)生器產(chǎn)生。當(dāng)偽隨機(jī)序列發(fā)生器具有固定結(jié)構(gòu)時,不同的初始值會產(chǎn)生不同的偽隨機(jī)序列,這樣收發(fā)雙方只需要秘密傳送一個初值作為密匙而不必傳送整個偽隨機(jī)序列值。為增強(qiáng)水印穩(wěn)健性,可考慮將水印加到音頻數(shù)據(jù)的高頻分量上。
LSB法簡單易行,數(shù)據(jù)容量大,安全性較高。缺點是對抗信號處理的穩(wěn)健性差。
(2)擴(kuò)頻方法(Spread Sprectrum Encoding)。此方法是將編碼數(shù)據(jù)分布到盡可能多的頻譜中對信息流進(jìn)行編碼。常用的有直接序列擴(kuò)頻編碼(DSSS),它通常結(jié)合性能優(yōu)良的m序列進(jìn)行編碼和解碼。為了利用HAS的掩蔽效應(yīng),一般需要對所采用的序列進(jìn)行若干級的濾波處理,水印的檢測則結(jié)合相關(guān)性假設(shè)檢驗檢測方法。該方法對MP3音頻編碼、PCM量化以及附加噪聲有一定的穩(wěn)健性。擴(kuò)頻方法具有抗干擾性能好,隱蔽性強(qiáng)、干擾小,易于實現(xiàn)碼分多址,數(shù)模兼容。
(3)相位編碼。利用人耳聽覺系統(tǒng)對絕對相位不敏感以及對相對相位敏感的特性,使用代表水印信息的參考相位替代原始音頻段的絕對相位,并調(diào)整其余音頻段以保持相對相位的不變。其編碼步驟簡述如下:
⑥根據(jù)修改后得到的相位矩陣和原始幅度矩陣,進(jìn)行IDFT逆變換,生成含有水印的音頻信號。
(4)回聲隱藏。通過引入回聲將水印數(shù)據(jù)嵌入到音頻信號,其中利用了HAS的另一特性:音頻信號在時域的向后屏蔽作用,即弱信號在強(qiáng)信號消失之后被屏蔽,大約在強(qiáng)信號消失之后的50ms~200ms之內(nèi)繼續(xù)作用而不被人耳所察覺。
由于回聲隱藏是將水印信息作為載體數(shù)據(jù)的環(huán)境而非隨機(jī)噪聲嵌入到載體數(shù)據(jù)中,因此對一些有損壓縮的算法有令人滿意的穩(wěn)健性。
(5)變換域算法:變換域算法具有許多空域算法所不具備的優(yōu)點,其中最突出的一點是其算法的穩(wěn)健性。變換域算法包括離散傅立葉變化(DFT)、離散余弦變換(DCT)以及近年來興起的離散小波變換(DWT)。對于前二種方法,國內(nèi)外已經(jīng)做了相當(dāng)多的研究,基本思想都是結(jié)合HAS聽覺特性對原始音頻數(shù)據(jù)在一定的頻域內(nèi)進(jìn)行變換處理,然后改變相應(yīng)的變換系數(shù)來嵌入水印。本文的算法是基于第三種變換即離散小波變換的。這里簡單介紹一下DWT技術(shù)。
DWL算法是利用Daubechies-4小波基的原始音頻進(jìn)行L級的小波分解,保留前L-1級的差別分量而對第L級的細(xì)節(jié)分量進(jìn)行處理并嵌入水印。此算法的一個特點是將水印信號放在語音信號能量最集中的低頻部分。
2 人類聽覺模型
人類聽覺系統(tǒng)對于輸入信號所作出的反應(yīng)是基于頻率的,音調(diào)的不同對應(yīng)于頻率的變化。圖1所示即為人耳的靈敏度對于頻率的函數(shù),圖中給出了可為人耳所聽到的最低聲音強(qiáng)度,對于每個不同頻率正好就是音頻靈敏度的倒數(shù)。從圖1可知,人耳對于3kHz左右的頻率最為敏感,對于過高(20kHz)以及過低(20Hz)的頻率,人耳敏感性將降低。
評論