高 健,劉星星,楊 珂
(上海大學(xué) 機(jī)電工程與自動(dòng)化學(xué)院,上海 200072)
自適應(yīng)最小能量諧波相位偏轉(zhuǎn)音頻水印算法
高 健,劉星星,楊 珂
(上海大學(xué) 機(jī)電工程與自動(dòng)化學(xué)院,上海 200072)
隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,多媒體音頻的傳輸越來(lái)越便利,以致音頻作品的版權(quán)保護(hù)也顯得日趨重要。針對(duì)離散余弦變換(DCT)的頻譜系數(shù)符號(hào)具有良好魯棒性的特點(diǎn),文中提出了一種基于最小能量諧波相位偏轉(zhuǎn)的音頻水印算法。該算法依據(jù)音頻幅值平均值具備良好的魯棒性特點(diǎn),將音頻數(shù)據(jù)根據(jù)水印長(zhǎng)度進(jìn)行分段處理,對(duì)每個(gè)數(shù)據(jù)段去絕對(duì)值的平均值進(jìn)行離散余弦變換,通過(guò)偏轉(zhuǎn)最小能量諧波的相位實(shí)現(xiàn)水印信息的嵌入。為了控制水印的嵌入強(qiáng)度,引入了品質(zhì)因子這一性能指標(biāo),將音頻文件分解為若干水印可嵌入段和水印不可嵌入段,確保水印信息的嵌入對(duì)音頻數(shù)據(jù)的改變控制在較小范圍內(nèi)。實(shí)驗(yàn)結(jié)果表明,該算法不僅具有非常好的不可感知性,而且對(duì)常規(guī)信號(hào)處理操作具備較好的魯棒性。
離散余弦變換;符號(hào);品質(zhì)因子;MP3壓縮
數(shù)字水印技術(shù)是指將具有標(biāo)識(shí)性的信息嵌入到圖像、音頻、視頻等載體中,但要保持載體原有的使用價(jià)值,并要盡可能避免被人類(lèi)的感知系統(tǒng)察覺(jué)[1-3]。數(shù)字音頻水印技術(shù)作為保護(hù)數(shù)字音頻作品版權(quán)的重要手段,是當(dāng)前學(xué)術(shù)界的一個(gè)研究熱點(diǎn)。對(duì)于音頻水印技術(shù)而言,近年來(lái),研究人員提出了許多時(shí)、頻域音頻水印算法。時(shí)域算法[4-5]主要有回聲隱藏、相位編碼等;頻域算法主要有離散傅里葉變換(DFT)[6]、離散余弦變換(DCT)[7-9]、離散小波變換(DWT)[10-14]。
文獻(xiàn)[3]從時(shí)域角度提出了一種基于鄰域平均的魯棒水印算法,該算法同時(shí)具備良好的不可感知性和對(duì)常規(guī)信號(hào)處理操作、去同步的抖動(dòng)攻擊以及隨機(jī)剪切等的抵抗能力。但該算法對(duì)整段音頻選取了相同的量化步長(zhǎng)而非自適應(yīng)的量化步長(zhǎng)。量化步長(zhǎng)的取值偏小或偏大分別會(huì)影響水印的抵抗攻擊能力和音頻質(zhì)量。文獻(xiàn)[6]基于音頻DCT系數(shù)的統(tǒng)計(jì)特征,提出了一種最大似然水印檢測(cè)方法,采用擴(kuò)頻方式將水印嵌入DCT域,獲取對(duì)應(yīng)的高斯混合模型,再通過(guò)最大似然檢測(cè)方法,進(jìn)行水印信息的判斷與提取。從檢測(cè)可靠性上說(shuō),該文獻(xiàn)提出的水印檢測(cè)算法比傳統(tǒng)檢測(cè)方法更高。但在檢測(cè)過(guò)程中,該方法還需通過(guò)密鑰來(lái)尋找初始的水印嵌入位置,實(shí)際應(yīng)用價(jià)值不高。
文中基于音頻數(shù)據(jù)壓縮前后的DCT系數(shù)符號(hào)具有良好的魯棒性這一特性,提出了一種最小能量諧波相位偏轉(zhuǎn)的音頻水印算法。該算法依據(jù)中低頻段最小能量諧波符號(hào)改變后導(dǎo)致的音頻數(shù)據(jù)改動(dòng)量是否在品質(zhì)因子的控制范圍內(nèi)這一特性,將音頻數(shù)據(jù)段分為水印可嵌入段與水印不可嵌入段。在水印可嵌入段中通過(guò)改變最小中低頻段頻譜系數(shù)符號(hào),實(shí)現(xiàn)最小能量諧波相位偏轉(zhuǎn),從而完成水印信息的嵌入。由于諧波符號(hào)具有天然較好的魯棒性,文中所提出的方法對(duì)如何協(xié)調(diào)水印魯棒性和水印透明性上做出了一些有意義的探索。
一維DCT變換公式如下:
(1)
(2)
其中,k,i=1,2,…,n。
(3)
(4)
(5)
由式(5)可見(jiàn),數(shù)組X=[x1,x2,…,xN]受到擾動(dòng)影響后,對(duì)應(yīng)的DCT頻譜系數(shù)在以下兩種情形下會(huì)發(fā)生變號(hào):
由此可知,當(dāng)數(shù)組X=[x1,x2,…,xN]的擾動(dòng)量絕對(duì)值不超過(guò)其本身數(shù)值時(shí),系數(shù)F1不會(huì)發(fā)生變號(hào),從而說(shuō)明DCT系數(shù)中直流系數(shù)的符號(hào)魯棒性很強(qiáng)。
F2=c2[x1a1+x2a2+…+x8a8]
此時(shí)ΔF2為最大負(fù)值(極端情形)。于是
表1給出了某一音頻文件經(jīng)MP3壓縮攻擊后8點(diǎn)DCT系數(shù)的變號(hào)概率表。
表1 8位DCT變換的各位置系數(shù)變號(hào)概率表
表1數(shù)據(jù)通過(guò)如下對(duì)比實(shí)驗(yàn)獲得:選擇某一wav音頻文件A(碼率1 411kbps,采樣率44.1kHz),先作MP3壓縮處理,獲得MP3音頻文件B(碼率128kbps,采樣率44.1kHz),再將音頻文件B解壓為wav音頻文件C。依次計(jì)算A和C相鄰5個(gè)音頻采樣點(diǎn)的絕對(duì)值平均值,每8點(diǎn)絕對(duì)值平均值做1次DCT變換,連續(xù)做了4 000次后,得到8點(diǎn)DCT變號(hào)概率。取單個(gè)采樣點(diǎn)的絕對(duì)值進(jìn)行8點(diǎn)DCT變換,與取5個(gè)采樣點(diǎn)的絕對(duì)值平均值進(jìn)行8點(diǎn)DCT變換相比,雖然水印嵌入容量更大,但水印的魯棒性較差。由表1可知,直流分量頻譜系數(shù)的符號(hào)在壓縮攻擊后系數(shù)符號(hào)不變,中低頻系數(shù)變號(hào)概率較小,也小于高頻系數(shù)的變號(hào)概率,由此說(shuō)明中低頻系數(shù)的符號(hào)具有較好的魯棒性。
2.1 品質(zhì)因子
結(jié)合人類(lèi)的感覺(jué)系統(tǒng)和心理學(xué)的感知機(jī)理對(duì)數(shù)字水印算法進(jìn)行研究,是近年來(lái)該領(lǐng)域的研究熱點(diǎn)。對(duì)于音頻水印算法來(lái)說(shuō),由于人類(lèi)的聽(tīng)覺(jué)系統(tǒng)要比視覺(jué)系統(tǒng)敏銳得多,所以數(shù)字音頻水印算法對(duì)透明性的要求要比圖像水印算法高得多。一般情況下,嵌入水印的強(qiáng)度越大,算法的魯棒性越好,透明性越差;反之,嵌入水印的強(qiáng)度越小,算法的魯棒性越差,透明性越好??傊?,魯棒性和透明性之間相互矛盾。為了解決這個(gè)嚴(yán)重的矛盾關(guān)系,文中通過(guò)品質(zhì)因子的引入,控制了水印嵌入強(qiáng)度過(guò)大的問(wèn)題。
(6)
其中,0≤Q(i)<1,x≠0。
文中Q(x)按式(7)給出:
Q(i)=aebx(i)
(7)
2.2 可嵌入水印與不可嵌入水印數(shù)據(jù)段
文中算法取音頻文件相鄰5點(diǎn)絕對(duì)值平均值,按8點(diǎn)絕對(duì)值平均值做DCT變換,相鄰8點(diǎn)絕對(duì)值平均值稱(chēng)為一個(gè)水印信息(0或1)的嵌入段。選取DCT中低頻段(第2~5個(gè)系數(shù))中絕對(duì)值最小的系數(shù),判斷該數(shù)據(jù)段是否能嵌入水印,具體做法如下:
(1)按8點(diǎn)位置品質(zhì)因子計(jì)算各點(diǎn)可改動(dòng)的最大量:
(2)計(jì)算DCT(x(n+1),x(n+2),…,x(n+8)),確定最小諧波系數(shù)(最小系數(shù))位置,即
(3)確定數(shù)據(jù)段是否為可嵌入水印段。
(8)
2.3 水印嵌入算法
假設(shè)原始音頻信號(hào)為A,數(shù)字水印為二值圖像,記為W,音頻水印嵌入過(guò)程如下:
步驟2:對(duì)每個(gè)數(shù)據(jù)段40個(gè)數(shù)據(jù)依次按5點(diǎn)計(jì)算絕對(duì)值平均值,共計(jì)8個(gè)絕對(duì)值平均值;原始音頻數(shù)據(jù)A轉(zhuǎn)化為絕對(duì)值平均值數(shù)據(jù)B,B大小為Size×Times×8。
步驟3:按照2.2節(jié)所述方法判斷各數(shù)據(jù)段是否為可嵌入水印數(shù)據(jù)段。
步驟4:若數(shù)據(jù)段為可嵌入數(shù)據(jù)段,則在DCT系數(shù)的第2~5位置中選取第二最小系數(shù)fs,其中
步驟6:水印嵌入方法。
①若該數(shù)據(jù)段嵌入水印信息“1”,且fm>0,則視為水印信息已自然嵌入。
同理,若數(shù)據(jù)段嵌入水印信息“0”,采用類(lèi)似方法處理。
步驟8:按照y1,y2,…,y8的取值對(duì)數(shù)據(jù)段中的40個(gè)點(diǎn)進(jìn)行修正,以嵌入水印信息。
2.4 水印提取算法
步驟2:對(duì)每個(gè)數(shù)據(jù)段40個(gè)數(shù)據(jù)依次按5點(diǎn)計(jì)算絕對(duì)值平均值,共計(jì)8個(gè)絕對(duì)值平均值;將音頻數(shù)據(jù)C轉(zhuǎn)化為絕對(duì)值平均值數(shù)據(jù)D,D大小為Size×Times×8。
步驟3:結(jié)合2.2節(jié)所述方法,判斷各數(shù)據(jù)段是否為已植入水印信息數(shù)據(jù)段。
步驟5:結(jié)合2.3節(jié)所述方法,每個(gè)水印信息(0或1)均被多次重復(fù)嵌入,提取水印時(shí),統(tǒng)計(jì)同一水印信息提取后“1”的個(gè)數(shù)與“0”的個(gè)數(shù),如果“1”的個(gè)數(shù)大于等于“0”的個(gè)數(shù),則判定為“1”;否則為“0”。
由于水印可嵌入段和不可嵌入段完全依賴(lài)于對(duì)應(yīng)的最小諧波系數(shù)的數(shù)值,而該數(shù)值的大小會(huì)因音頻數(shù)據(jù)的改動(dòng)而發(fā)生一定范圍內(nèi)的改變。因此在水印提取過(guò)程中,會(huì)因?yàn)檫@些關(guān)鍵數(shù)值的改動(dòng)而導(dǎo)致水印可嵌入段和不可嵌入段的誤判。為了較好地解決這個(gè)問(wèn)題,文中采用多重(40重)水印嵌入的方法,按照少數(shù)服從多數(shù)的原則定義對(duì)應(yīng)的水印信息。以下實(shí)驗(yàn)將某音樂(lè)文件按照水印圖像大小和水印嵌入重?cái)?shù)分為64×64×40段。
文中選取了4首不同風(fēng)格的音樂(lè)文件進(jìn)行實(shí)驗(yàn)。其中一雙聲道音頻文件的各參數(shù)如下:采樣率為44.1kHz,比特率為16b/s,時(shí)長(zhǎng)為280s。水印為64×64的二值圖像。實(shí)驗(yàn)內(nèi)容包括:
(1)MP3壓縮:先將含水印音頻分別壓縮到320kbps,192kbps,128kbps,然后再解壓還原到wav格式文件;
(2)疊加噪聲:加入高斯白噪聲,信噪比為35dB;
(3)低通濾波:采用6級(jí)巴特沃斯低通濾波器,截止頻率為10kHz;
(4)重量化:先將音頻從16比特量化到8比特,然后再量化到16比特;
(5)重采樣:先將音頻下采樣到22.05kHz,然后再上采樣到44.1kHz[15-16]。
在水印魯棒性的客觀評(píng)估方面,采用誤碼率(BitErrorRatio,BER)和歸一化相似系數(shù)NC衡量水印的提取準(zhǔn)確度。嵌入水印信息后,音頻的信噪比SNR為40.425 1dB。常規(guī)信號(hào)處理后水印檢測(cè)的實(shí)驗(yàn)結(jié)果如表2所示。
表2 常規(guī)信號(hào)處理后水印檢測(cè)結(jié)果
從表2實(shí)驗(yàn)數(shù)據(jù)可以看出,在各類(lèi)攻擊下,文中算法具有較低的誤碼率和較高的相似系數(shù)。該算法對(duì)常規(guī)信號(hào)處理的攻擊具備較好的抵抗能力。另一方面,為了更直觀地評(píng)估算法的抵抗性能,還可以觀察水印提取圖像的可辨識(shí)度,如圖1所示。
圖1 原始水印圖像和水印提取圖像
結(jié)合圖1的提取水印圖像和各個(gè)攻擊類(lèi)型來(lái)分析,水印的提取準(zhǔn)確度隨MP3壓縮程度的增大有所降低,在MP3格式碼率為128kbps下,所提取的水印圖像仍可通過(guò)肉眼較清晰地辨識(shí)出水印信息。并且,從提取的水印圖像上可以看出,算法對(duì)添加白噪聲、重量化以及重采樣等攻擊均具有較好的魯棒性。
為了進(jìn)一步測(cè)試算法對(duì)音頻文件聽(tīng)覺(jué)質(zhì)量的影響,采用了國(guó)際電信聯(lián)盟ITU推薦的BS.1116定義的主觀評(píng)價(jià)標(biāo)準(zhǔn)SDG和BS.1387音頻質(zhì)量聽(tīng)覺(jué)評(píng)價(jià)標(biāo)準(zhǔn)中的PEAQ測(cè)試工具對(duì)含水印音頻進(jìn)行主觀和客觀的評(píng)價(jià)。文中對(duì)4首不同風(fēng)格的音樂(lè)進(jìn)行了SDG和PEAQ的實(shí)驗(yàn)測(cè)試,結(jié)果如表3所示。
表3 SDG和PEAQ測(cè)試值
通過(guò)對(duì)表3測(cè)試數(shù)據(jù)的分析,SDG測(cè)試平均分值約為-0.500 0,平均PEAQ值約為-0.198 4,其中最小PEAQ值為-0.206 9,最大PEAQ值為-0.190 8。實(shí)驗(yàn)結(jié)果表明,水印算法具備較好的不可感知性。
文中結(jié)合理論分析和對(duì)比實(shí)驗(yàn)對(duì)DCT系數(shù)符號(hào)的魯棒性進(jìn)行分析,驗(yàn)證了中低頻段的DCT系數(shù)符號(hào)具備較好的魯棒性。通過(guò)品質(zhì)因子的引入對(duì)水印嵌入強(qiáng)度進(jìn)行了控制,從而較好地實(shí)現(xiàn)了水印信息的不可感知性。同時(shí),利用多次重復(fù)嵌入方法,提高了提取水印的準(zhǔn)確率。實(shí)驗(yàn)結(jié)果表明,提出的水印算法對(duì)常規(guī)信號(hào)處理操作,尤其是MP3壓縮類(lèi)攻擊,在保證一定的音頻質(zhì)量前提下,具備較好的抵抗力。但是,在判斷可嵌入水印段和不可嵌入水印段的過(guò)程中,由于各類(lèi)攻擊的影響會(huì)導(dǎo)致誤判,在一定程度上降低了水印提取的成功率。另一方面,文中提出的算法對(duì)數(shù)據(jù)長(zhǎng)度較短的音頻文件可能因數(shù)據(jù)量不夠而無(wú)法完成水印嵌入。以上問(wèn)題有待進(jìn)一步的分析與研究。
[1] 金 聰.數(shù)字水印理論與技術(shù)[M].北京:清華大學(xué)出版社,2008:1-20.
[2] 李秀瀅,段曉毅,王建新.一種心理聲學(xué)模型的自同步音頻水印方案[J].計(jì)算機(jī)工程與應(yīng)用,2013,49(8):96-99.
[3]CoxIJ,MillerMI.Thefirst50yearsofelectronicwatermarking[J].JournalofAppliedSignalProcessing,2002,2:126-132.
[4] 張金全,王宏霞,李學(xué)華.基于鄰域平均的魯棒音頻水印算法[J].鐵道學(xué)報(bào),2012,34(7):43-48.
[5]XiangY,NatgunanathanI,PengD,etal.Adual-channeltime-spreadechomethodforaudiowatermarking[J].IEEETransactionsonInformationForensicsandSecurity,2012,7(2):383-392.
[6]SinghJ,GargP,DeA.MultiplicativewatermarkingofaudioinDFTmagnitude[J].MultimediaToolsandApplications,2014,71(3):1431-1453.
[7] 林曉丹.基于高斯混合模型的DCT域水印檢測(cè)方法[J].自動(dòng)化學(xué)報(bào),2012,38(9):1445-1448.
[8] 任克強(qiáng),李 慧,謝 斌.基于DWT和DCT的自適應(yīng)雙重音頻水印[J].計(jì)算機(jī)應(yīng)用研究,2013,30(7):2120-2123.
[9] 凡 超,王 忠,肖留威,等.改進(jìn)的DCT域音頻水印算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(4):1351-1355.
[10] Alshammas H A.Robust audio watermarking based on dynamic DWT with error correction[C]//Proceedings of ITU kaleidoscope:building sustainable communities.[s.l.]:IEEE,2013:1-6.
[11] 劉 芳,李學(xué)斌.一種基于混沌與DWT的數(shù)字音頻水印算法[J].微計(jì)算機(jī)信息,2011,27(1):193-194.
[12] 黃雄華,蔣偉貞,王宏霞,等.基于比值的小波域數(shù)字音頻盲水印算法[J].鐵道學(xué)報(bào),2011,33(5):66-71.
[13] 馬德洋,盧 忱,范九倫.一種均勻量化小波能量的盲提取音頻水印算法[J].微電子學(xué)與計(jì)算機(jī),2013,30(3):43-46.
[14] 王向陽(yáng),牛盼盼.基于音頻統(tǒng)計(jì)特性的數(shù)字水印嵌入算法[J].自動(dòng)化學(xué)報(bào),2008,34(8):1001-1003.
[15] 韓紀(jì)慶.音頻信息處理技術(shù)[M].北京:清華大學(xué)出版社,2007.
[16] 程佩青.數(shù)字信號(hào)處理教程[M].北京:清華大學(xué)出版社,2007:69-77.
An Adaptive Audio Watermarking Algorithm Based on Minimum Energy of Harmonic Phase Deflection
GAO Jian,LIU Xing-xing,YANG Ke
(School of Mechatronic Engineering and Automation,Shanghai University,Shanghai 200072,China)
With the rapid development of computer network,the transportation of multi-media audio is becoming more and more convenient,which makes the right protection of audio works more important.For the symbol of spectral coefficients has robustness for spectral coefficients Discrete Cosine Transform (DCT),the novel audio watermarking algorithm based on the minimum energy-harmonic phase deflection has been proposed.Based on audio amplitude average with good robustness characteristics,the audio data is segmented according to the length of the watermarking,and average value out of absolute value for each data segment is carried on DCT,implementation of the embedding of watermarking through deflection of phase for minimum energy harmonic.In order to control the strength of the embedding watermarking,the algorithm uses the quality factor as a performance index.Audio files are divided into several watermark embedding segments and watermark segments cannot be embedded.This object is to ensure that the embedded watermark information has a little effect on audio data.The experimental results show that the proposed algorithm has a good performance in terms of imperceptibility,and also has a high robustness for the conventional signal processing operations.
discrete cosine transform;symbol;quality factor;MP3 compression
2015-07-05
2015-10-16
時(shí)間:2016-03-22
國(guó)家自然科學(xué)基金青年基金(71201097)
高 健(1961-),男,副教授,博士,研究方向?yàn)橐纛l水印、圖像編碼;劉星星(1990-),女,碩士研究生,研究方向?yàn)橐纛l水印。
http://www.cnki.net/kcms/detail/61.1450.TP.20160322.1519.054.html
TP309
A
1673-629X(2016)05-0110-05
10.3969/j.issn.1673-629X.2016.05.023