牛盼盼,楊思宇,王麗,楊紅穎,李麗,王向陽(yáng)
(1.遼寧師范大學(xué)計(jì)算機(jī)與信息技術(shù)學(xué)院,遼寧 大連 116029;2.大連理工大學(xué)電子信息與電氣工程學(xué)部,遼寧 大連 116023)
數(shù)字水印是一種可以在開(kāi)放的網(wǎng)絡(luò)環(huán)境下保護(hù)版權(quán)和認(rèn)證來(lái)源及完整性的新技術(shù),目前已成為網(wǎng)絡(luò)與信息安全領(lǐng)域的一個(gè)研究熱點(diǎn)。不可感知性、穩(wěn)健性及水印容量是數(shù)字水印系統(tǒng)必須滿足的基本要求,也是近年來(lái)數(shù)字水印領(lǐng)域的主要研究?jī)?nèi)容[1]。用于版權(quán)保護(hù)的數(shù)字水印系統(tǒng)必須具有高度穩(wěn)健性?,F(xiàn)有大多數(shù)穩(wěn)健音頻水印算法能夠抵抗簡(jiǎn)單的常規(guī)音頻信號(hào)處理攻擊(如疊加噪聲、重新量化、重新采樣、MP3壓縮等),尚無(wú)法有效抵抗破壞性較強(qiáng)的去同步攻擊(desynchronization attack)[2-3]。去同步攻擊能夠改變水印信號(hào)嵌入位置,即破壞水印信號(hào)分量的同步性,使水印檢測(cè)器找不到有效的水印信號(hào)[4]。數(shù)字音頻水印系統(tǒng)中的去同步攻擊可以分為2類:簡(jiǎn)單的全局去同步攻擊和復(fù)雜的局部去同步攻擊。其中,全局去同步攻擊是針對(duì)整段音頻信號(hào)的攻擊方式,如時(shí)間縮放、幅度伸縮、音調(diào)伸縮、DA/AD 轉(zhuǎn)換等,即對(duì)音頻整體內(nèi)容進(jìn)行了破壞;局部去同步攻擊是針對(duì)局部音頻信號(hào)的攻擊方式,如隨機(jī)剪切、局部變調(diào)、抖動(dòng)攻擊等,即對(duì)音頻信號(hào)的一部分內(nèi)容進(jìn)行了破壞[5]。
到目前為止,人們主要采納5種策略解決數(shù)字音頻水印領(lǐng)域的去同步攻擊問(wèn)題,包括窮舉搜索、構(gòu)造同步不變特征、擴(kuò)頻水印擴(kuò)頻碼相結(jié)合、同步碼、利用音頻重要特征等。
1)基于窮舉搜索的穩(wěn)健音頻水印
窮舉搜索是數(shù)字音頻信號(hào)遭受時(shí)域去同步攻擊后恢復(fù)水印信息的最簡(jiǎn)單方法[6]。該類水印算法存在2個(gè)致命問(wèn)題,一是對(duì)數(shù)字水印檢測(cè)器的多次操作會(huì)顯著增加虛警率;二是計(jì)算復(fù)雜度太高,其計(jì)算量將隨著搜索空間的擴(kuò)大而迅速膨脹。因此該類方法只適用于小數(shù)據(jù)量水印檢測(cè),且無(wú)法有效抵抗諸如時(shí)間縮放、隨機(jī)剪切、抖動(dòng)等去同步攻擊。
2)基于同步不變特征的穩(wěn)健音頻水印
同步不變特征方案以其原理簡(jiǎn)單、性能穩(wěn)定等優(yōu)點(diǎn)而受到人們普遍重視。該類水印方案的基本思想是將水印信息隱藏在原始載體音頻信號(hào)具有同步不變性的量中,而目前所使用的同步不變量主要包括二進(jìn)小波變換(DYWT,dyadic wavelet transform)、幾何不變矩、直方圖、奇異值、向量范數(shù)等[7-9]。在含水印音頻遭受各種攻擊后,同步不變量由于具有同步不變特性不會(huì)發(fā)生變化,因此隱藏于其中的數(shù)字水印信號(hào)得以保存。但目前該類水印方案僅僅能夠抵抗輕微的全局音調(diào)伸縮和整體時(shí)間縮放,尚不能有效抵抗諸如抖動(dòng)、局部變調(diào)、隨機(jī)剪切等較復(fù)雜的局部去同步攻擊。
3)基于擴(kuò)頻水印擴(kuò)頻碼相結(jié)合的穩(wěn)健音頻水印
擴(kuò)頻數(shù)字水印技術(shù)往往先利用糾錯(cuò)編碼技術(shù),對(duì)水印信號(hào)進(jìn)行編碼預(yù)處理;然后利用正交頻分復(fù)用、相移鍵控、移頻鍵控等調(diào)制方法,對(duì)數(shù)字水印信號(hào)進(jìn)行頻譜擴(kuò)展;最后在原始載體音頻的變換系數(shù)中疊加擴(kuò)頻水印信號(hào)[10-11]。擴(kuò)頻水印擴(kuò)頻碼相結(jié)合算法的優(yōu)勢(shì)在于不需要額外同步信號(hào),且能夠有效抵抗諸如幅度伸縮等輕微全局去同步攻擊。但其仍然存在2個(gè)問(wèn)題,一是由于其缺乏必要的同步保護(hù)機(jī)制,故普遍難以抵抗局部變調(diào)、隨機(jī)剪切、抖動(dòng)等破壞性較強(qiáng)的局部去同步攻擊;二是無(wú)法實(shí)現(xiàn)數(shù)字水印信號(hào)的盲檢測(cè),不利于應(yīng)用。
4)基于同步碼的穩(wěn)健音頻水印
基于同步碼的音頻水印方案需同時(shí)嵌入數(shù)字水印信號(hào)和同步碼信息。進(jìn)行水印檢測(cè)時(shí),首先檢測(cè)到同步碼信息,然后再根據(jù)同步碼信息確定出水印信號(hào)的嵌入位置。顯然,這類數(shù)字音頻水印方法的穩(wěn)健性和安全性主要依賴于同步碼信息??傮w說(shuō)來(lái),基于同步碼的音頻水印方案具有一定的抵抗諸如整體時(shí)間縮放等輕微去同步攻擊能力,但其無(wú)法有效抵御諸如局部變調(diào)、隨機(jī)剪切等局部去同步攻擊,且數(shù)字水印容量受到一定限制。此外,同步碼音頻水印算法還會(huì)產(chǎn)生2個(gè)嚴(yán)重問(wèn)題,一是安全性問(wèn)題,二是虛警問(wèn)題。原因是當(dāng)一個(gè)同步標(biāo)記被用于一系列不同數(shù)字音頻作品時(shí),其很容易被敵人發(fā)現(xiàn)和去除[12-13]。
5)基于音頻重要特征的穩(wěn)健音頻水印
基于載體內(nèi)容局部特征的數(shù)字水印方案,其基本思想為,利用相對(duì)穩(wěn)定的載體特征點(diǎn)(也稱顯著點(diǎn),salient point)來(lái)標(biāo)識(shí)水印嵌入位置并確定相對(duì)應(yīng)的特征區(qū)域用以嵌入水印信息。在檢測(cè)含水印音頻信號(hào)時(shí),同樣利用載體特征點(diǎn)進(jìn)行定位和提取水印信息,從而有效抵御破壞性較強(qiáng)的去同步攻擊。Wang 等[14]結(jié)合人類聽(tīng)覺(jué)掩蔽特性,提出了一種基于載體音頻內(nèi)容的新能量特征點(diǎn)提取方法。該算法具有一定的抵抗噪聲干擾等常規(guī)攻擊能力及輕微剪切攻擊能力,但無(wú)法有效抵抗時(shí)間縮放、音調(diào)伸縮、DA/AD 轉(zhuǎn)換等去同步攻擊能力。Li 等[15]首先提取出原始載體音頻包絡(luò)的峰值點(diǎn),然后以此作為音頻特征點(diǎn)并從原始載體中選取4096個(gè)局部音頻片段用于水印信號(hào)嵌入,最后利用FFT 在每個(gè)局部音頻片段內(nèi)獨(dú)立嵌入數(shù)字水印信號(hào)。該算法可抵抗輕微的時(shí)間縮放、隨機(jī)剪切等去同步攻擊,但對(duì)高通濾波等常規(guī)音頻處理比較敏感,而且無(wú)法有效抵御聯(lián)合攻擊。Ma 等[16]結(jié)合獨(dú)立分量分析理論,選取數(shù)字音頻能量峰值點(diǎn)作為特征標(biāo)識(shí)并依此確定數(shù)字水印嵌入位置,而數(shù)字水印信號(hào)被嵌入子采樣后的音頻載體內(nèi),該算法對(duì)噪聲添加、重新采樣等常規(guī)音頻處理非常敏感。鮑德旺等[17]首先利用非下采樣小波分解所得的低頻信息重構(gòu)出新載體數(shù)字音頻,然后根據(jù)數(shù)字音頻的局部能量特征,從新載體中提取出穩(wěn)定的音頻特征點(diǎn),并以音頻特征點(diǎn)為標(biāo)識(shí)提取出長(zhǎng)度固定的局部音頻段,最后利用量化調(diào)制方法將水印信息嵌入局部音頻段內(nèi)。該算法具有較好的抗噪聲干擾能力,但其抵抗時(shí)間縮放、音調(diào)伸縮、DA/AD 轉(zhuǎn)換等攻擊能力較弱。Pun 等[18]提出了一種自同步小波域數(shù)字音頻水印方案,該方案利用音頻載體信號(hào)的局部方差不變特性來(lái)定位水印嵌入位置,具有較好的抵抗常規(guī)音頻信號(hào)處理及輕微剪切攻擊能力,但對(duì)DA/AD 轉(zhuǎn)換、音調(diào)伸縮、時(shí)間縮放等比較敏感。Pun 等[19]提出了一種基于穩(wěn)健不變音頻特征點(diǎn)的檢測(cè)方法,利用SWT(stationary wavelet transform)系數(shù)的平移不變性、不可感知性和穩(wěn)健性嵌入水印信息。該算法在空域內(nèi)提取特征點(diǎn),與頻域相比抵抗攻擊能力較差,并且該算法是選取特征點(diǎn)周圍的固定長(zhǎng)度作為待嵌入水印特征區(qū)域,而不是根據(jù)特征點(diǎn)周圍的局部特征從而自適應(yīng)確定待嵌入水印特征區(qū)域大小,水印容量與其他算法相比也相對(duì)較小。Yuan 等[20]首先在空間域內(nèi)提取出載體音頻的局部能量峰值點(diǎn),并將其作為穩(wěn)定的數(shù)字音頻特征點(diǎn),然后以音頻特征點(diǎn)為標(biāo)識(shí),確定固定尺寸的局部音頻段,最后對(duì)局部音頻段進(jìn)行小波變換,并利用量化調(diào)制技術(shù)將水印信息嵌入低頻子帶內(nèi),該方法計(jì)算簡(jiǎn)單、容易實(shí)現(xiàn),但其抵抗噪聲干擾、時(shí)間縮放、音調(diào)伸縮等攻擊能力均較差。Xiang 等[21]提出了一種基于DCT(discrete cosine transform)域的大容量穩(wěn)健水印檢測(cè)方法,利用DCT 系數(shù)的不可感知性和穩(wěn)健性嵌入正交PN 序列作為水印信息,該算法在提高算法穩(wěn)健性的同時(shí),保證了較高的水印負(fù)載能力。
此外,近年來(lái)已有學(xué)者將深度學(xué)習(xí)方法應(yīng)用到數(shù)字水印技術(shù)中,對(duì)基于深度學(xué)習(xí)的水印方法進(jìn)行了深入的研究,以尋求不可感知性及同時(shí)抵抗常規(guī)信號(hào)處理操作和去同步攻擊的穩(wěn)健性之間的平衡為優(yōu)化目標(biāo),利用粒子群優(yōu)化等技術(shù)設(shè)計(jì)音頻水印優(yōu)化過(guò)程,自動(dòng)確定水印算法的最優(yōu)水印參數(shù)和搜索最合適的嵌入位置等,為所設(shè)計(jì)的水印系統(tǒng)提供了更大的靈活性[22-23]。
綜上所述,窮舉搜索、構(gòu)造同步不變特征、擴(kuò)頻水印擴(kuò)頻碼相結(jié)合、同步碼等方案難以有效解決諸如抖動(dòng)、局部變調(diào)、隨機(jī)剪切等較復(fù)雜的局部去同步攻擊問(wèn)題,而基于音頻重要特征的數(shù)字音頻水印方案為去同步攻擊問(wèn)題提供了一些可行而有效的解決方向,但現(xiàn)有該類方案普遍存在諸如特征點(diǎn)穩(wěn)定性差且分布極不均勻、計(jì)算量偏大、時(shí)間復(fù)雜度較高等一系列問(wèn)題,從而嚴(yán)重影響了數(shù)字水印的穩(wěn)健性和不可感知性,大大降低了整個(gè)數(shù)字音頻水印系統(tǒng)的工作性能。鑒于此,本文提出了一種基于穩(wěn)健特征點(diǎn)的平穩(wěn)小波域音頻水印算法。該算法首先利用高斯濾波技術(shù)計(jì)算出平穩(wěn)小波域低頻子帶的一階平滑梯度響應(yīng),并結(jié)合平滑梯度響應(yīng)分布確定基準(zhǔn)閾值,進(jìn)而提取出分布均勻且性能穩(wěn)定的音頻特征點(diǎn);然后以音頻特征點(diǎn)為標(biāo)識(shí),結(jié)合短時(shí)能量[24]自適應(yīng)確定適合于水印嵌入的局部特征音頻段;最后利用擴(kuò)展抖動(dòng)調(diào)制方法[25]將水印信息嵌入局部特征音頻段中。實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法不僅不可感知性良好,并且對(duì)常規(guī)音頻信號(hào)處理和局部去同步攻擊均具有較好的穩(wěn)健性。
與DWT 相比,平穩(wěn)小波變換(SWT,stationary wavelet transform)[26]具有平移不變性和冗余性等特性,可以對(duì)連續(xù)小波變換做出更加近似的估計(jì)。在音頻信號(hào)進(jìn)行分解時(shí),DWT 采用下采樣抽樣,并采用差值補(bǔ)0的方法對(duì)音頻信號(hào)進(jìn)行重構(gòu);而SWT在進(jìn)行音頻信號(hào)分解時(shí)采用非下采樣抽樣,將信號(hào)分解成一系列與原信號(hào)長(zhǎng)度相同的近似系數(shù)和細(xì)節(jié)系數(shù),同時(shí)在每2個(gè)濾波器系數(shù)之間插入零值以實(shí)現(xiàn)濾波器的延拓,從而避免在音頻信號(hào)進(jìn)行重構(gòu)時(shí)產(chǎn)生Gibbs 震蕩現(xiàn)象。
其中,a J(u)為近似系數(shù)或低頻系數(shù),d j(u)為細(xì)節(jié)系數(shù)或高頻系數(shù)。對(duì)于j≥0,則有
其中,h(n)、g(n)為小波函數(shù)ψ(t)對(duì)應(yīng)的共軛鏡像濾波器組,hj(n)為在h(n)相鄰兩項(xiàng)之間插入2j-1個(gè)0得到的擴(kuò)展濾波器。不同于DWT,SWT 并未將每個(gè)分級(jí)得到的近似系數(shù)和細(xì)節(jié)系數(shù)納入到下采樣范圍中,故變換后的近似系數(shù)和細(xì)節(jié)系數(shù)能夠保持與原始信號(hào)相同的長(zhǎng)度。進(jìn)行SWT 操作可以得到每個(gè)分級(jí)的低通和高通濾波系數(shù),此操作相當(dāng)于擴(kuò)頻操作。隨著分級(jí)層數(shù)的增加,SWT 系數(shù)的分辨率隨之下降,利用濾波器,可以均勻地進(jìn)行下采樣操作并進(jìn)一步分級(jí)低通系數(shù)(二次分級(jí))。SWT的結(jié)構(gòu)如圖1所示。
圖1 SWT 的結(jié)構(gòu)
為證明SWT 的有效性,圖2給出了數(shù)字音頻的3級(jí)SWT 分解/重構(gòu)示意。其中,圖2(a)為原始音頻,圖2(b)為3級(jí)小波分解的低頻子帶,圖2(c)~圖2(e)分別為3級(jí)小波分解的尺度3、尺度2和尺度1高頻子帶,圖2(f)為小波重構(gòu)音頻,圖2(g)為小波重構(gòu)音頻與原始音頻的差值。
圖2 數(shù)字音頻的3級(jí)非下采樣小波分解/重構(gòu)示意
觀察圖2可以看出,數(shù)字音頻經(jīng)過(guò)3級(jí)SWT 分解后再重構(gòu),重構(gòu)波形與原始音頻波形基本保持一致。
特征點(diǎn)提取是基于載體內(nèi)容局部特征的數(shù)字音頻水印方案的關(guān)鍵環(huán)節(jié)之一。目前,可應(yīng)用于數(shù)字音頻水印領(lǐng)域的音頻特征點(diǎn)檢測(cè)算子包括樣本峰值法、包絡(luò)峰值法[14-22]。然而,以上音頻特征點(diǎn)檢測(cè)算子均直接采用音頻樣本值刻畫(huà)局部數(shù)字音頻性質(zhì),其不可避免存在2個(gè)方面的問(wèn)題:一方面,特征點(diǎn)檢測(cè)算子對(duì)音程跳躍幅度較大的“高”音調(diào)區(qū)很敏感,會(huì)在“高”音調(diào)區(qū)域檢測(cè)出很多“噪聲”特征點(diǎn);另一方面,特征點(diǎn)過(guò)于集中在高頻泛音充分的“尖”音色區(qū)。也就是說(shuō),利用現(xiàn)有檢測(cè)算子所提取出的音頻特征點(diǎn),普遍存在穩(wěn)定性差且分布極不均勻的問(wèn)題,嚴(yán)重影響數(shù)字音頻水印對(duì)DA/AD 轉(zhuǎn)換、隨機(jī)剪切、抖動(dòng)等攻擊的抵抗能力。盡管Dessein 等[27]結(jié)合最大似然參數(shù)估計(jì)理論,提出了一種基于廣義似然比極值的數(shù)字音頻特征點(diǎn)檢測(cè)算法,但由于其所采納的樣本指數(shù)分布假設(shè)并不適合大多數(shù)實(shí)際音頻,故該算法的音頻特征點(diǎn)檢測(cè)性能較低。此外,該特征點(diǎn)檢測(cè)算法的時(shí)間復(fù)雜度較高,不利于實(shí)際應(yīng)用。
本文將利用描述能力強(qiáng)且性能穩(wěn)定的平滑梯度刻畫(huà)局部數(shù)字音頻性質(zhì),進(jìn)而提出一種基于平滑梯度的平穩(wěn)小波域音頻特征點(diǎn)提取方法,可以很好地滿足音頻水印的要求。
假設(shè)A={a(x),1≤x≤L}表示原始數(shù)字音頻信號(hào),其中L為音頻的樣本數(shù),a(x)∈{0,1,2,…,(2p-1)}表示每個(gè)樣本的幅值,p表示每個(gè)樣本的量化位數(shù),則基于平滑梯度的音頻特征點(diǎn)提取方法如下。
步驟1SW 變換。對(duì)原始載體音頻A進(jìn)行3級(jí)SWT 分解,以得到一個(gè)低頻子帶F和若干個(gè)高頻子帶。本文選取抗噪能力較強(qiáng)的低頻子帶提取音頻特征點(diǎn)。
步驟2音頻梯度計(jì)算。利用式(2),計(jì)算出低頻子帶F(x)={f1,f2,…,fx,…,fL}的一階梯度其中,音頻梯度值
步驟3平滑處理。利用式(3),對(duì)一階音頻梯度進(jìn)行高斯濾波處理,以得到性能穩(wěn)定的一階平滑梯度
步驟4響應(yīng)計(jì)算。利用一階平滑梯度幅值,計(jì)算出原始音頻樣本a(x)的響應(yīng)值R(x),并以此刻畫(huà)局部數(shù)字音頻性質(zhì)。音頻樣本a(x)的局部響應(yīng)值R(x)為
這里,b為任意常量,實(shí)驗(yàn)中b=0.5。
步驟5特征點(diǎn)提取。對(duì)音頻樣本響應(yīng)值R(x)={r1,r2,…,rx,…,rL}進(jìn)行降序排列得到PR={Pr_L,Pr_L-1,···,Pr_1},濾掉位于首尾兩端的音頻樣本,確保有足夠的空間可以嵌入完整水印信息,即不滿足
其中,X代表相鄰特征點(diǎn)之間的基本間距,本實(shí)驗(yàn)中,X=1.5×104。
以最高響應(yīng)值Pr-x為基準(zhǔn)設(shè)置閾值,濾掉與其相鄰過(guò)近的特征點(diǎn),從而確保提取出的特征點(diǎn)分布均勻,即不滿足
其中,Pr_y∈{Pr_x-1,Pr_x-2,···,Pr_1},選取前Y個(gè)點(diǎn)Pr∈{P1,P2,···,PY}作為本方法的音頻特征點(diǎn)即同步標(biāo)記,本實(shí)驗(yàn)中,Y=13。
圖3給出了本文特征點(diǎn)提取方法抵抗常規(guī)信號(hào)處理和去同步攻擊的部分實(shí)驗(yàn)結(jié)果。其中,“○”表示正確提取,“●”表示錯(cuò)誤提取(本實(shí)驗(yàn)中,特征點(diǎn)位置偏移5個(gè)樣本以上即視為錯(cuò)誤點(diǎn))。
本文采用冗余嵌入策略,提出了一種基于穩(wěn)健特征點(diǎn)的平穩(wěn)小波域數(shù)字音頻水印算法,水印嵌入的關(guān)鍵步驟可描述如下。
圖3 各種攻擊下的音頻特征點(diǎn)提取
步驟1數(shù)字水印產(chǎn)生。由密鑰K產(chǎn)生一個(gè)偽隨機(jī)序列C={c(i),i=1,···,s}作為數(shù)字水印信息,其中,s為水印大小,c(i)∈{0,1}。
步驟2音頻特征點(diǎn)提取。利用基于平滑梯度的平穩(wěn)小波域音頻特征點(diǎn)檢測(cè)算子,從原始音頻載體A中提取音頻特征點(diǎn),以得到音頻特征點(diǎn)集Pr∈{P1,P2,···,PY}。
步驟3局部特征音頻段構(gòu)造。所謂局部特征音頻段,是指以數(shù)字音頻特征點(diǎn)為標(biāo)識(shí),從原始載體音頻中分割出的一部分子音頻,以其作為水印信號(hào)的嵌入和檢測(cè)區(qū)域。本文局部特征音頻段的具體構(gòu)造過(guò)程如下。
1)將載體音頻信號(hào)A進(jìn)行降序排列,得到載體音頻數(shù)據(jù)最大值A(chǔ)max與最小值A(chǔ)min,并歸一化到[-1,1]的范圍,具體計(jì)算式為
其中,Anorm是歸一化后的音頻信號(hào)。
2)對(duì)Anorm進(jìn)行3級(jí)SWT 分解,以得到一個(gè)低頻子帶F1和若干個(gè)高頻子帶。
3)在低頻子帶F1下,以特征點(diǎn)Pr為標(biāo)識(shí),循環(huán)統(tǒng)計(jì)每個(gè)特征點(diǎn)Pr左右窗口長(zhǎng)度為M范圍內(nèi)的能量和,用以代表特征點(diǎn)周圍音頻短時(shí)能量。于是,短時(shí)能量可表示為[24]
其中,En表示n時(shí)刻音頻信號(hào)a1(n)的短時(shí)能量,w(n-m)表示窗函數(shù),h(n)=w2(n),n=1+2M。本文選取的窗函數(shù)為漢寧窗w(n),即
其中,N表示窗長(zhǎng),特征點(diǎn)Pr周圍的音頻信號(hào)集可表示為
4)利用特征點(diǎn)短時(shí)能量集E∈{E1,E2,…,EY}再次計(jì)算
5)計(jì)算自適應(yīng)局部特征音頻段,其中,待嵌入水印音頻段長(zhǎng)度Dr=E1sK,s為水印大小,K為常數(shù),Dr∈{D1,D2,···,DY}。于是,得到用于水印嵌入的局部特征音頻段集為
步驟4數(shù)字水印嵌入。本文采用量化調(diào)制方法,數(shù)字水印的具體嵌入過(guò)程如下。
1)對(duì)載體音頻信號(hào)A進(jìn)行3級(jí)SWT 分解,以得到一個(gè)低頻子帶F和若干個(gè)高頻子帶。本文選取性能穩(wěn)定的SWT 域低頻子帶嵌入水印信息。
2)在低頻子帶F內(nèi),依據(jù)特征點(diǎn)Pr和待嵌入水印音頻段長(zhǎng)度Dr找到對(duì)應(yīng)的特征區(qū)域,并根據(jù)水印位的長(zhǎng)度s對(duì)待嵌入水印的局部特征音頻段進(jìn)行分段,每段長(zhǎng)度為可得到音頻子段
3)量化調(diào)制音頻子段a2內(nèi)的t1個(gè)低頻系數(shù),每個(gè)音頻子段嵌入一個(gè)水印位。首先根據(jù)水印信息的值,使用2種不同的抖動(dòng)量化[25],自適應(yīng)確定水印嵌入強(qiáng)度。
①當(dāng)C=0時(shí),抖動(dòng)量化Q0為
②當(dāng)C=1時(shí),抖動(dòng)量化Q1為
然后將水印信息利用STDM(spread transform dither modulation)量化方法嵌入音頻子段,量化調(diào)制方法為[25]
其中,p為投影向量,為嵌入水印后的音頻段。
4)用含水印音頻子段內(nèi)的低頻系數(shù)代替原低頻系數(shù),并進(jìn)行逆SWT,即可得到含水印局部特征音頻段。
步驟5含水印音頻獲得。重復(fù)步驟1~步驟4,直到所有局部特征音頻段都按照上述步驟處理完畢。最后,用含水印局部特征音頻段替換原始的局部特征音頻段,得到含水印數(shù)字音頻Aw信號(hào)。
步驟1使用與嵌入過(guò)程相同的密鑰K產(chǎn)生原始數(shù)字水印序列C={c(i),i=1,···,s}。
步驟2利用基于平滑梯度的平穩(wěn)小波域音頻特征點(diǎn)檢測(cè)算子,從含水印數(shù)字音頻Aw中提取音頻特征點(diǎn),以得到音頻特征點(diǎn)集Prw∈{P1,P2,···,PYw}。
步驟3以所提取的音頻特征點(diǎn)為標(biāo)識(shí),利用本文局部特征音頻段構(gòu)造方法,計(jì)算出短時(shí)能量E2,并根據(jù)E2計(jì)算出含水印特征音頻段長(zhǎng)度Drw=E2sK,s為水印大小,K為常數(shù),Drw∈{D1,D2,···,DYw},從而得到用于水印提取的局部特征音頻段集為
步驟4對(duì)含水印數(shù)字音頻Aw進(jìn)行3級(jí)SWT分解,并按照如下過(guò)程提取水印信息。
1)在低頻子帶Fw內(nèi),依據(jù)特征點(diǎn)Prw和含水印特征音頻段長(zhǎng)度Drw找到對(duì)應(yīng)的特征區(qū)域,并根據(jù)水印位的長(zhǎng)度s對(duì)待提取水印的局部特征音頻段進(jìn)行分段,每段長(zhǎng)度為,得到音頻子段∈(每個(gè)音頻子段提取一個(gè)水印位)。
3)重復(fù)上述步驟,即可檢測(cè)出局部特征音頻段內(nèi)所隱藏的數(shù)字水印序列為
重復(fù)步驟4,直到檢測(cè)完所有局部特征音頻段。只要有2個(gè)以上的局部特征音頻段能夠成功檢測(cè)到水印信號(hào),即可認(rèn)為數(shù)字水印檢測(cè)成功;否則,水印檢測(cè)失敗。
本節(jié)分別給出了檢測(cè)性能測(cè)試以及抗攻擊能力測(cè)試的仿真實(shí)驗(yàn)結(jié)果。實(shí)驗(yàn)中,選用采樣頻率為44.1 kHz、量化精度為16 bit、長(zhǎng)度為15 s 的單聲道數(shù)字音頻信號(hào)作為原始載體,數(shù)字水印采用了128位的偽隨機(jī)序列。另外,量化步長(zhǎng)Δ=73,檢測(cè)閾值Ts=24(即虛警率PF-A ≈5×10-4)。
圖4給出了本文算法的不可感知性能測(cè)試結(jié)果,包括原始音頻、含水印音頻、差值音頻。從圖4(a)與圖4(b)中可以明顯看出,原始音頻與含水印音頻的波形區(qū)別很小,而差值圖4(c)也充分證明了這一觀點(diǎn)。另外,本文算法的PSNR 值為39.8312 dB,客觀結(jié)果充分證明了本文算法的不可感知性良好。
圖4 數(shù)字音頻水印的不可感知性能測(cè)試結(jié)果
為了驗(yàn)證本文數(shù)字音頻水印算法的穩(wěn)健性能,仿真實(shí)驗(yàn)分別對(duì)本文算法和文獻(xiàn)[19-21]算法的含水印音頻進(jìn)行了一系列攻擊。其中,文獻(xiàn)[19-20]算法均是利用了平滑梯度刻畫(huà)了局部數(shù)字音頻性質(zhì),針對(duì)如何有效解決數(shù)字音頻水印算法的局部去同步攻擊問(wèn)題展開(kāi)研究,因此本文首先與文獻(xiàn)[19-20]算法進(jìn)行了性能比較。文獻(xiàn)[21]算法為較新的具有代表性的基于擴(kuò)頻水印擴(kuò)頻碼相結(jié)合的數(shù)字音頻水印方法。圖5和圖6分別給出了本文算法抵抗常規(guī)信號(hào)處理和去同步攻擊的實(shí)驗(yàn)結(jié)果。其中,分子表示從攻擊后含水印數(shù)字音頻中成功檢測(cè)到水印信號(hào)的局部特征音頻段數(shù)目,分母表示原始載體音頻中嵌有水印信號(hào)的局部特征音頻段數(shù)目。這里,定義每個(gè)完整水印信息正確提取位數(shù)多于,即視為該自適應(yīng)特征音頻段的水印被正確提取。本實(shí)驗(yàn)中,利用RCES(the ratio of correctly extracted segment)表示自適應(yīng)特征音頻段水印的正確提取率,正確提取的含水印局部特征音頻段選用淺色填充“”,錯(cuò)誤提取的含水印局部特征音頻段選用深色填充“”。表1和表2、圖7和圖8給出了本文算法和文獻(xiàn)[19-21]算法的穩(wěn)健性能對(duì)比。
表1和表2給出了各種攻擊下本文算法與文獻(xiàn)[19-20]的對(duì)比結(jié)果,圖7和圖8顯示了本文算法與文獻(xiàn)[21]算法在相同原始音頻載體條件下,抵抗常規(guī)攻擊和去同步攻擊的對(duì)比結(jié)果。從對(duì)比結(jié)果可以看出,本文算法實(shí)驗(yàn)結(jié)果整體好于文獻(xiàn)[19-21],進(jìn)一步證明了本文算法具有良好的穩(wěn)健性。
圖5 本文算法抵抗常規(guī)音頻信號(hào)處理的實(shí)驗(yàn)結(jié)果
圖6 本文算法抵抗去同步攻擊的實(shí)驗(yàn)結(jié)果
表1 本文算法和文獻(xiàn)[20]算法的穩(wěn)健性能對(duì)比結(jié)果
表2 本文算法和文獻(xiàn)[19]算法的穩(wěn)健性能對(duì)比結(jié)果
圖7 本文算法和文獻(xiàn)[21]算法的穩(wěn)健性能對(duì)比結(jié)果(’Piano.wav’)
數(shù)字水印是解決數(shù)字作品版權(quán)保護(hù)與內(nèi)容認(rèn)證的有效辦法之一,穩(wěn)健性是數(shù)字水印算法的重要性能指標(biāo)之一。但現(xiàn)有絕大多數(shù)音頻水印在經(jīng)受去同步攻擊后難以生存。因此,研究可有效抵抗去同步攻擊的強(qiáng)穩(wěn)健數(shù)字音頻水印理論與方法仍是一項(xiàng)富有挑戰(zhàn)性的工作。本文提出了一種基于穩(wěn)健特征點(diǎn)的平穩(wěn)小波域音頻水印算法,實(shí)驗(yàn)結(jié)果表明,本文數(shù)字音頻水印算法不僅具有較好的不可感知性,而且對(duì)常規(guī)音頻信號(hào)處理(包括重采樣、重量化、MP3壓縮、均衡化等)和去同步攻擊(包括隨機(jī)剪切、幅度伸縮、局部變調(diào)、抖動(dòng)等)均具有較好的穩(wěn)健性。
圖8 本文算法和文獻(xiàn)[21]算法的穩(wěn)健性能對(duì)比結(jié)果(’Heart.wav’)