師春靈,錢 清
(1.信陽學(xué)院 大數(shù)據(jù)與人工智能學(xué)院,河南 信陽 464000;2.貴州財(cái)經(jīng)大學(xué) 信息學(xué)院,貴州 貴陽 550025)
數(shù)字音頻內(nèi)容真實(shí)性和完整性取證問題已成為當(dāng)前多媒體信息安全領(lǐng)域的研究熱點(diǎn)[1]。用于取證的水印技術(shù)發(fā)展至今已取得了豐碩的研究成果[2-6]。文獻(xiàn)[7]提出了一種精確篡改定位的數(shù)字語音取證算法。文中定義了一種保密的語音特征——能量比,并給出了基于能量比的水印嵌入的理論依據(jù),進(jìn)一步通過實(shí)驗(yàn)分析了該特征的魯棒性和水印的抗信號(hào)處理能力。然而隨著應(yīng)用的深入,對(duì)語音信號(hào)處理的方式趨于多樣化,文獻(xiàn)[7]的算法對(duì)于傳統(tǒng)信號(hào)處理具有一定的魯棒性,然而對(duì)于其它信號(hào)處理,比如添加回聲等操作,則魯棒性不能滿足實(shí)際需求。對(duì)于另外一部分采用公開特征進(jìn)行水印嵌入的算法[8,9],由于特征易被攻擊者獲取,導(dǎo)致嵌入的水印存在安全隱患。
5G的大帶寬使高清信號(hào)的實(shí)時(shí)傳輸成為可能,必將帶來語音信號(hào)采樣頻率的提高。對(duì)于采樣頻率較高的語音信號(hào)而言,采用傳統(tǒng)的水印技術(shù)來進(jìn)行取證,或多或少地存在一些針對(duì)性不強(qiáng)的問題[10-12]。從實(shí)際需求出發(fā),以數(shù)字語音信號(hào)為載體,提出了一種魯棒的水印取證算法。定義了語音信號(hào)FDCR(frequency domain coefficient residuals)特征,并分析了此特征對(duì)信號(hào)處理的魯棒性以及對(duì)惡意攻擊的脆弱性。本文將語音信號(hào)分幀,將各幀幀號(hào)映射為二進(jìn)制的水印序列。然后,將各幀分段,并提取各段信號(hào)的FDCR特征。依據(jù)嵌入信息的不同來量化FDCR特征,進(jìn)一步通過修改對(duì)應(yīng)的DCT系數(shù)來完成水印的嵌入。提取端,通過提取二進(jìn)制水印信息,并將其轉(zhuǎn)換成幀號(hào)來進(jìn)行內(nèi)容取證,以及必要時(shí)候的篡改定位。最后實(shí)驗(yàn)分析了本算法的綜合性能,表明本文所提算法具有較好的不可聽性,對(duì)信號(hào)處理操作具有較好的魯棒性,同時(shí)提高了水印系統(tǒng)的安全性,以及對(duì)惡意攻擊的篡改定位能力。
對(duì)于含有N個(gè)樣本的音頻信號(hào)A={an|1≤n≤N},由式(1)計(jì)算其DCT系數(shù),記為C={cn|1≤n≤N}
(1)
從DCT系數(shù)C中選低頻和中頻系數(shù)(長(zhǎng)度均為M),分別記為Clow和Cmed。由式(2)計(jì)算低頻系數(shù)Clow的對(duì)數(shù)和Dlow
(2)
式中:α>0,λ>max(|Clow|,|Cmed|),α和λ作為本文水印系統(tǒng)的密鑰。同樣,計(jì)算中頻系數(shù)Cmed的對(duì)數(shù)和Dmed。由式(3)計(jì)算信號(hào)A的FDCR特征
R=|Dlow-Dmed|
(3)
對(duì)音頻信號(hào)而言,一方面,高頻部分更多表征信號(hào)的細(xì)節(jié)部分,而能量主要集中在低頻和中頻部分。另一方面,不同內(nèi)容的信號(hào),低頻和中頻之間的關(guān)系存在差異;而對(duì)于表達(dá)內(nèi)容相同的信號(hào)(如經(jīng)過一定信號(hào)處理前后的信號(hào)),低頻和中頻之間的關(guān)系具有一定的穩(wěn)定性?;诖耍疚奶岢隽巳缡?3)所示的音頻信號(hào)FDCR特征。下面測(cè)試FDCR特征在信號(hào)處理后的改變程度。
隨機(jī)選取一段長(zhǎng)為L(zhǎng),采樣頻率為44.1 kHz的語音信號(hào),記為A,如圖1所示。下面實(shí)驗(yàn)分析FDCR在信號(hào)處理后的改變程度。
圖1 原始語音信號(hào)
(1)將A分為P幀,第i幀記為Ai,每幀長(zhǎng)為N。
(2)對(duì)Ai進(jìn)行DCT,計(jì)算其FDCR特征,記為Ri。
(3)對(duì)語音信號(hào)A進(jìn)行信號(hào)處理操作,包括壓縮率為64 kbps的MP3壓縮、由44.1 kHz采樣頻率下降到22.05 kHz的重采樣、截至頻率為8 kHz的低通濾波操作。圖2給出了語音信號(hào)進(jìn)行信號(hào)處理前后各幀的FDCR特征。
圖2 語音信號(hào)進(jìn)行處理前后各幀的FDCR特征
(4)對(duì)語音信號(hào)A進(jìn)行惡意攻擊(從其它信號(hào)中選取一段內(nèi)容,對(duì)A進(jìn)行替換攻擊),攻擊后的信號(hào)如圖3所示。圖4給出了原始信號(hào)A各幀的FDCR特征和替換攻擊后各幀的FDCR特征。
圖3 替換攻擊后的語音信號(hào)
圖4 替換攻擊前后語音信號(hào)的FDCR特征
為了測(cè)試不同類型信號(hào)FDCR特征對(duì)信號(hào)處理的魯棒性,從樣本庫隨機(jī)選取200段不同類型的語音信號(hào),包括男聲和女聲,錄制環(huán)境有安靜的室內(nèi)、討論會(huì)現(xiàn)場(chǎng)、空曠的野外。然后對(duì)選取的測(cè)試信號(hào)進(jìn)行信號(hào)處理操作(64 kbps的MP3壓縮、由44.1 kHz采樣頻率下降到22.05 kHz的重采樣、截至頻率為8 kHz的低通濾波)。將原信號(hào)和信號(hào)處理后的信號(hào)分幀(這里等分為40幀),分別計(jì)算200段信號(hào)處理前后各幀的FDCR特征統(tǒng)計(jì)均值,如圖5所示。由測(cè)試結(jié)果可得不同類型語音信號(hào)FDCR特征信號(hào)處理前后幾乎保持不變,具有較好的魯棒性。若采用量化FDCR特征的方法來嵌入水印,可以保證含水印信號(hào)在信號(hào)處理后,以較高的概率正確地提取嵌入的信息。
圖5 200段不同類型的語音信號(hào)處理前后FDCR特征變化統(tǒng)計(jì)均值
從以上測(cè)試結(jié)果表明,本文提出的FDCR特征對(duì)信號(hào)處理具有一定的魯棒性,對(duì)惡意攻擊(改變音頻表達(dá)內(nèi)容)具有一定的脆弱性。下面我們分析FDCR特征和DCT系數(shù)之間的關(guān)系,為將FDCR特征作為嵌入域的水印嵌入提供量化方法。
由語音信號(hào)DCT系數(shù)構(gòu)造了FDCR特征,實(shí)驗(yàn)驗(yàn)證了FDCR特征對(duì)信號(hào)處理的魯棒性和惡意攻擊的脆弱性?;贔DCR特征的性質(zhì),本文將FDCR作為嵌入域來嵌入水印信息。下面給出DCT系數(shù)和FDCR特征之間的關(guān)系,為本文通過量化DCT系數(shù)來修改FDCR特征值,實(shí)現(xiàn)水印的嵌入提供依據(jù)。假設(shè)Dlow>Dmed(對(duì)于Dlow≤Dmed的情況類似),且通過修改低頻系數(shù)Clow來量化FDCR特征。R和R′分別表示量化前后的FDCR特征,Clow和C′low分別表示量化前后的DCT低頻系數(shù)。式(4)給出了量化前后的DCT低頻系數(shù)之間的關(guān)系,表明本文嵌入水印可以采用式(4)的方法來量化DCT低頻系數(shù)完成水印的嵌入。其中c′n∈C′low
(4)
本文提出的取證水印算法,首先將語音信號(hào)分幀,記錄各幀幀號(hào),并將幀號(hào)映射為水印信息,嵌入在對(duì)應(yīng)的語音幀中。當(dāng)含水印信號(hào)被惡意攻擊后,被攻擊語音幀中的水印將很難被準(zhǔn)確地提取。然而,卻能夠從攻擊語音幀前后相鄰的沒有被攻擊的幀中提取準(zhǔn)確的水印信息。將提取的水印信息映射為幀號(hào),前后幀號(hào)中不連續(xù)的部分即為被攻擊的內(nèi)容,以此來取證并進(jìn)行篡改定位,詳細(xì)的水印方案如下。
取語音信號(hào)A={al|1≤l≤L},al表示第l個(gè)樣本點(diǎn),L表示信號(hào)A的長(zhǎng)度。
(1)將語音信號(hào)A等分為P幀,第i幀記為Ai,每幀長(zhǎng)為N,N=L/P。
(2)由式(5)將Ai的幀號(hào)i映射為二進(jìn)制序列Bi={bt|1≤t≤T}
i=b1×2T-1+b2×2T-2+…+bT-1×2+bT
(5)
(3)將Ai等分為2T段,第t段記為Ai,t,1≤t≤2T,將Bi分別嵌入Ai的前后兩段中。對(duì)Ai,t進(jìn)行DCT,并取DCT系數(shù)的低頻和中頻系數(shù),由式(2)和式(3)計(jì)算Ai,t的FDCR特征,記為Ri,t。
(4)根據(jù)bt來量化Ri,t,如式(6),其中Δ表示量化步長(zhǎng),R′i,t表示量化后的FDCR特征
(6)
(5)根據(jù)量化前后的FDCR特征Ri,t和R′i,t,由式(4)對(duì)第i幀第t段的DCT低頻系數(shù)幅值進(jìn)行量化,然后逆DCT生成含水印的第i幀第t段的信號(hào)。
重復(fù)上述方法,完成各幀水印的嵌入,得到的含水印信號(hào)記為A′i。嵌入過程如圖6所示。
圖6 水印嵌入過程框架
將含水印信號(hào)記為A*,長(zhǎng)度為L(zhǎng)*,水印提取和內(nèi)容取證過程如下:
(7)
(5)若檢測(cè)到第1幀的內(nèi)容是真實(shí)的,則將第1幀后面的樣本依照上述方法進(jìn)行分幀并驗(yàn)證其真實(shí)性;若檢測(cè)到第1幀的內(nèi)容是被攻擊的,移動(dòng)樣本重新分幀,檢測(cè)新的分幀內(nèi)容的真實(shí)性,直到檢測(cè)到內(nèi)容真實(shí)的語音幀為止。不能被準(zhǔn)確提取的語音幀的幀號(hào)(缺失的幀號(hào))即為篡改定位的結(jié)果。水印提取和內(nèi)容的取證流程如圖7所示。
圖7 水印提取和內(nèi)容取證過程框架
值得一提的是,水印提取端一般情況下并不了解待提取信號(hào)是經(jīng)歷了何種攻擊(如剪切、替換等),部分攻擊會(huì)導(dǎo)致含水印信號(hào)的長(zhǎng)度和原始信號(hào)有所不同。此種情況下,若將含水印信號(hào)等分為P幀,存在分幀長(zhǎng)度和原始信號(hào)相差較大的情況(如遠(yuǎn)大于或小于N)。為了避免此類問題的出現(xiàn),也為了提高水印提取的正確率,從含水印信號(hào)起始位置,以和N接近的長(zhǎng)度進(jìn)行分幀(如90%×N、N、110%×N),以能夠通過驗(yàn)證為目的。下面,我們通過實(shí)驗(yàn)來測(cè)試本文算法的綜合性能。
為了測(cè)試本文算法對(duì)不同類型信號(hào)的綜合性能,選取300段語音信號(hào)作為測(cè)試樣本庫,包括150段不同環(huán)境下的男聲語音信號(hào)(安靜的辦公室、討論會(huì)現(xiàn)場(chǎng)、火車站候車大廳各50段),150段相同環(huán)境下的女聲語音信號(hào)。測(cè)試信號(hào)采樣頻率為44.1 kHz,16位量化的單聲道語音信號(hào)。在Window10操作系統(tǒng),Matlab2018a的軟件環(huán)境下,根據(jù)本文算法,生成300段含水印的語音信號(hào),其中所用參數(shù)為L(zhǎng)=441 000,N=4410,P=10,α=0.001,T=5,λ=11。然后結(jié)合GoldWave工具對(duì)含水印信號(hào)進(jìn)行信號(hào)處理操作,以及惡意攻擊操作,綜合實(shí)驗(yàn)結(jié)果如下。
通常水印的嵌入會(huì)對(duì)原始音頻信號(hào)造成改變,如果改變程度較大,會(huì)影響原始信號(hào)的聽覺質(zhì)量。水印嵌入對(duì)原始音頻信號(hào)改變程度可用水印不可聽性來衡量,主要有主觀和客觀兩種評(píng)價(jià)方式。主觀評(píng)價(jià)方法常見的為主觀區(qū)分度(subjective difference grades,SDG),客觀評(píng)價(jià)方法常見的為信噪比(signal to noise ratio,SNR)。主觀區(qū)分度是將原始信號(hào)和含水印信號(hào)給聽眾現(xiàn)場(chǎng)試聽,并依據(jù)主觀區(qū)分度評(píng)價(jià)標(biāo)準(zhǔn)來打分,打分的平均值作為SDG值。主觀區(qū)分度評(píng)價(jià)標(biāo)準(zhǔn)見表1??陀^評(píng)價(jià)方法信噪比,是將嵌入的水印看作在原始信號(hào)中添加的噪聲,其計(jì)算方法如式(8)所示,其中a(l)和a′(l)分別表示原始信號(hào)和含水印信號(hào)的第l個(gè)樣本點(diǎn)。通常來講,SDG和SNR值越大,說明含水印信號(hào)的聽覺質(zhì)量越好
表1 SDG值和ODG值的評(píng)分標(biāo)準(zhǔn)
(8)
本文對(duì)300段測(cè)試信號(hào)分別計(jì)算SDG值和SNR值。SDG值由15位聽眾打分所得;SNR值由式(8)計(jì)算所得。表2給出了SDG值和SNR值的最大值、最小值,以及300段測(cè)試信號(hào)的平均值。由表2所示結(jié)果可得,SDG值和SNR值均大于評(píng)價(jià)系統(tǒng)所要求的最小值(SDG>-1,SNR>20),表明本所提算法滿足水印不可聽性的要求。
表2 含水印信號(hào)的SNR值和SDG值
對(duì)于音頻信號(hào)而言,攻擊類型可以簡(jiǎn)單地分為兩種,第一種為不改變表達(dá)內(nèi)容的攻擊(信號(hào)處理操作),如格式轉(zhuǎn)換、壓縮等;第二種為改變表達(dá)含義的惡意攻擊,如刪除、替換攻擊。由于信號(hào)處理操作不改變?cè)盘?hào)的表達(dá)含義,信號(hào)處理后的信號(hào)本文將其視為真實(shí)的信號(hào)。對(duì)于惡意攻擊,本文將對(duì)其進(jìn)行檢測(cè),并篡改定位。下面首先測(cè)試本文算法的魯棒性,然后給出對(duì)惡意攻擊的取證以及篡改定位結(jié)果。
這里采用誤碼率(BER)來測(cè)試水印提取的準(zhǔn)確率。BER值率越小,說明提取水印的錯(cuò)誤率越低,正確率越高,算法魯棒性越強(qiáng)。BER的定義如式(9)所示
(9)
式中:2T×P表示嵌入水印的長(zhǎng)度,b(t)和b*(t)分別表示原始水印信息和提取的水印信息,⊕表示異或操作。
為了測(cè)試算法的魯棒性,本文將測(cè)試樣本進(jìn)行MP3壓縮、添加回聲、低通濾波等信號(hào)處理,然后提取信號(hào)處理后信號(hào)中的水印信息,并依據(jù)式(9)計(jì)算水印提取的BER值。表3給出了300段測(cè)試信號(hào)BER值的平均值。
表3所列結(jié)果表明,本文算法在經(jīng)過128 kbps的MP3壓縮后,可以從壓縮信號(hào)中完整無誤地提取水印信息。經(jīng)過壓縮率為64 kbps的MP3壓縮之后,BER值相比壓縮率為128 kbps的情況有所增加,但增加的幅度非常小,水印提取準(zhǔn)確率也達(dá)到了99%。不可否認(rèn)文獻(xiàn)[7]也有不錯(cuò)的抗MP3壓縮的能力,不過本文水印提取準(zhǔn)確率更好,表明具有更好的魯棒性。對(duì)于回聲(40%)和高斯噪聲(20 dB)而言,本文算法同樣具有比較高的水印提取準(zhǔn)確率。尤其是對(duì)于截至頻率為8 kHz的低通濾波而言,本文算法能夠以99%準(zhǔn)確率提取水印信息。通常而言,8 kHz采樣頻率的語音信號(hào)已能滿足通信和交流的需要。于是和音頻信號(hào)(如歌曲)相比,8 kHz的低通濾波處理更為常見。從測(cè)試結(jié)果來看,和文獻(xiàn)[7]相比,對(duì)于8 kHz的低通濾波處理本文水印提取正確率提高的最多。表明本文算法相比文獻(xiàn)[7]算法具有更強(qiáng)的容忍信號(hào)處理的能力,為高清音頻低通濾波后水印的提取提供保障。
表3 本文算法和文獻(xiàn)[7]算法在不同信號(hào)處理后水印提取的BER(%)值
對(duì)語音信號(hào)的惡意攻擊能夠改變?cè)盘?hào)的表達(dá)含義。若被攻擊的內(nèi)容被認(rèn)為是真實(shí)的,則會(huì)對(duì)說話人以及聽眾帶來難以估量的損失。對(duì)語音信號(hào)進(jìn)行取證,并給出篡改定位結(jié)果,能夠給聽眾以警示,減少由于語音內(nèi)容被攻擊而帶來的損失。下面從樣本庫中隨機(jī)選取一段語音信號(hào)(如圖8所示),對(duì)該信號(hào)進(jìn)行刪除、插入和替換攻擊,并給出相應(yīng)的篡改定位結(jié)果。
圖8 含水印語音信號(hào)
(1)刪除攻擊
本文提到的刪除攻擊指的是,選擇部分含水印的音頻信號(hào)樣本進(jìn)行刪除,來改變?cè)⌒盘?hào)的表達(dá)含義,達(dá)到攻擊者希望達(dá)到的目的。為了測(cè)試本文算法對(duì)刪除攻擊的檢測(cè)能力,我們選擇如圖8所示的含水印信號(hào),刪除其中的部分樣本實(shí)施刪除攻擊(這里選擇含水印語音信號(hào)第110 001到第154 100個(gè)樣本點(diǎn)之間的內(nèi)容)。刪除攻擊的信號(hào)如圖9所示。
圖9 刪除攻擊的含水印語音信號(hào)
依據(jù)本文提出的取證算法對(duì)圖9所示的經(jīng)過刪除攻擊的音頻信號(hào)進(jìn)行篡改檢測(cè),步驟簡(jiǎn)述為:
步驟1 對(duì)圖9所示的音頻信號(hào)從第一個(gè)樣本開始,取長(zhǎng)為N的樣本,作為第一幀的音頻內(nèi)容。
步驟2 將第一幀的內(nèi)容分為2T段,計(jì)算各段的FDCR特征,并由式(7)得到每段提取的二進(jìn)制水印信息。
步驟3 將提取的2T比特的水印信息分為前后兩部分。①若前、后兩部分的T比特的水印信息相同,則認(rèn)為該幀是真實(shí)的,并由T比特的水印重構(gòu)幀號(hào);②若前、后兩部分的T比特的水印信息不相同,則表明該幀的內(nèi)容是被攻擊的部分。對(duì)于被攻擊的音頻幀,由于前、后兩部分T比特的水印信息不同,依據(jù)算法,該幀的幀號(hào)不能重構(gòu)。所以,能重構(gòu)幀號(hào)的音頻幀被認(rèn)為是真實(shí)的內(nèi)容,不能被重構(gòu)幀號(hào)的音頻幀將被檢測(cè)為存在攻擊的內(nèi)容。
根據(jù)上述步驟,對(duì)圖9所示的音頻信號(hào)各幀幀號(hào)重構(gòu)結(jié)果如圖10所示,其中TL=1對(duì)應(yīng)的幀表示幀號(hào)能夠被重構(gòu),TL=0的幀表示幀號(hào)不能能夠被重構(gòu)(TL的含義適用于插入和替換攻擊的檢測(cè)結(jié)果)。于是,對(duì)于刪除攻擊的信號(hào),第3、第4幀的內(nèi)容是被攻擊的部分。
圖10 對(duì)刪除攻擊的篡改定位結(jié)果
(2)插入攻擊
本文提到的插入攻擊指的是,在音頻信號(hào)中插入部分樣本點(diǎn),來改變音頻信號(hào)的表達(dá)含義,達(dá)到攻擊的目的。為了測(cè)試本文算法對(duì)插入攻擊的檢測(cè)能力,我們選擇如圖8所示的含水印信號(hào)進(jìn)行攻擊,選取其它語音內(nèi)容插入到如圖8含水印信號(hào)的第270 000個(gè)樣本的位置。攻擊后的信號(hào)如圖11所示。
圖11 插入攻擊的含水印語音信號(hào)
采用和刪除攻擊相似的方法,對(duì)插入攻擊的音頻信號(hào)進(jìn)行篡改檢測(cè)。依據(jù)本算法,能重構(gòu)幀號(hào)的音頻幀為真實(shí)的內(nèi)容,不能被重構(gòu)幀號(hào)的內(nèi)容為被攻擊的部分。幀號(hào)重構(gòu)結(jié)果(即篡改檢測(cè)結(jié)果)如圖12所示。由圖12所示結(jié)果易得,圖11所示的含水印信號(hào)第7、第8幀的內(nèi)容是被攻擊的部分。
圖12 對(duì)插入攻擊的篡改定位結(jié)果
(3)替換攻擊
本文提到的替換攻擊指的是,選擇要攻擊的音頻樣本,用表達(dá)含義不同的樣本來替換要攻擊的內(nèi)容。為了測(cè)試本文算法對(duì)替換攻擊的檢測(cè)能力,相似地選擇如圖8所示的含水印信號(hào)進(jìn)行攻擊,選取其它語音內(nèi)容替換含水印信號(hào)第220 501個(gè)樣本到第264 601個(gè)樣本之間的內(nèi)容。替換攻擊后的內(nèi)容如圖13所示。
圖13 替換攻擊的含水印語音信號(hào)
和刪除、插入攻擊類似,采用相似的方法對(duì)替換攻擊的音頻信號(hào)進(jìn)行篡改檢測(cè)。能重構(gòu)幀號(hào)的音頻幀為真實(shí)的內(nèi)容,不能被重構(gòu)音頻幀的內(nèi)容為被攻擊的部分。幀號(hào)重構(gòu)結(jié)果(即篡改檢測(cè)結(jié)果)如圖14所示。由圖14所示結(jié)果可得,第6幀的幀號(hào)不能被重構(gòu)(依據(jù)TL=0的含義),故第6幀為檢測(cè)到的被攻擊的內(nèi)容。
圖14 對(duì)替換攻擊的篡改定位結(jié)果
以上對(duì)不同攻擊的取證結(jié)果可以看出,篡改定位結(jié)果和實(shí)際被攻擊的位置一致。表明對(duì)于含水印的語音信號(hào),本文算法能夠驗(yàn)證其真?zhèn)?,在此基礎(chǔ)上,對(duì)于惡意攻擊內(nèi)容,文本算法能夠較為精確地定位被攻擊的語音幀。
對(duì)于水印系統(tǒng)而言,若用來嵌入水印的特征是公開的(可以輕易地被攻擊者獲取),則該水印系統(tǒng)會(huì)存在較大的安全隱患。比如,攻擊者可以計(jì)算嵌入水印的特征,搜索找到表達(dá)含義不同而對(duì)應(yīng)的特征和該水印段特征相同的音頻段,并替換含水印的內(nèi)容。因?yàn)樘鎿Q后內(nèi)容的特征和替換前相同,驗(yàn)證端可以從被攻擊內(nèi)容中提取準(zhǔn)確的水印信息,致使該攻擊能夠逃過驗(yàn)證段的檢測(cè)。下面用一實(shí)例來詳細(xì)給出此類攻擊的攻擊方法,這里假設(shè)嵌入水印的特征為信號(hào)的能量。
(1)水印嵌入
假設(shè)原始音頻信號(hào)為A,Ai為對(duì)A分幀后第i幀的內(nèi)容,wi為要嵌入到Ai中的水印信息。常用的嵌入方法如下:
步驟1 計(jì)算信號(hào)Ai的能量,如式(10)所示
(10)
式中:Ei為計(jì)算所得能量,Ai(l)為第i段信號(hào)的第l個(gè)樣本點(diǎn)。
步驟2 依據(jù)wi的不同,來量化能量Ei,量化后的能量記為E′i,方法如下
wi=0時(shí)
(11)
wi=1時(shí)
(12)
其中,Δ為嵌入水印選擇的量化步長(zhǎng)。
步驟3 依據(jù)能量特征和音頻信號(hào)樣本點(diǎn)的線性關(guān)系,通過縮放樣本值的方法來得到含水印的信號(hào),記為A′i,方法如式(13)所示,其中A′i(l)表示含水印第i段信號(hào)的第l個(gè)樣本點(diǎn)
(13)
(2)攻擊方法
一般情況下,含水印信號(hào)是通過公共網(wǎng)絡(luò)傳播,含水印信號(hào)A′i對(duì)攻擊者而言是已知的,下面給出對(duì)A′i的攻擊方法。
步驟1 攻擊者由式(10)從A′i中提取能量E′i。
步驟3 攻擊者選取其它的長(zhǎng)度和A′i相同的音頻段Bi,計(jì)算其能量EBi,并根據(jù)式(11)和式(12)的方法量化EBi為EB′i,然后將水印wi嵌入到音頻段Bi中,得到含水印的音頻段B′i。用B′i替換原含水印信號(hào)第i段A′i的內(nèi)容。
由于從B′i中提取的水印和A′i中提取的水印相同,所以驗(yàn)證端很難發(fā)現(xiàn)攻擊的存在。以上分析表明,基于公開特征的水印嵌入方法[8,9]存在安全隱患。
(3)本文算法抗替換攻擊的能力
本文算法提出的FDCR特征,在特征獲取時(shí)首先需要密鑰α、λ和K。在密鑰不確定的情況下,很難直接提取信號(hào)特征。文中首先將音頻信號(hào)分幀,每幀分為2T段。通過量化各段的FDCR特征,將長(zhǎng)為T的水印信息分別嵌入到前后T段信號(hào)中。提取端用同樣的方法對(duì)含水印信號(hào)分幀、分段,計(jì)算水印信號(hào)各段的FDCR特征,提取每幀的長(zhǎng)為2T的水印信息。將提取的水印信息分為兩段,判斷前后兩段水印信息的異同來驗(yàn)證該幀內(nèi)容的真實(shí)性。
依據(jù)水印嵌入方案,若隨機(jī)選取其它內(nèi)容的音頻信號(hào)來攻擊一幀含水印的信號(hào),則攻擊成功的可能性為1/2T。于是,本文算法抵抗替換攻擊的能力R可由式(14)得到
R=1-1/2T
(14)
表4列出了本文算法和部分常見的水印嵌入方法[5,8,9]抵抗替換攻擊能力的對(duì)比,其中Y表示能夠抵抗替換攻擊,N表示不具有抵抗替換攻擊的能力。
表4 本文算法與部分水印算法安全性對(duì)比
綜上實(shí)驗(yàn)分析結(jié)果,本文算法水印的嵌入不影響原始信號(hào)的聽覺質(zhì)量,具有一定的容忍信號(hào)處理的能力,對(duì)于惡意攻擊能夠定位被攻擊的內(nèi)容,同時(shí)提高了整個(gè)水印系統(tǒng)的安全性。
為了提高數(shù)字語音信號(hào)的可信度和認(rèn)可度,提出了一種魯棒的數(shù)字語音取證算法。給出了語音信號(hào)FDCR特征,實(shí)驗(yàn)分析了該特征對(duì)部分信號(hào)處理操作的魯棒性和惡意攻擊的脆弱性。將載體信號(hào)分幀,幀號(hào)映射為水印序列,采用量化FDCR特征的方法將水印進(jìn)行嵌入。提取端通過對(duì)幀號(hào)的提取進(jìn)行取證以及必要的篡改定位。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文算法具有良好的不可聽性,對(duì)信號(hào)處理的魯棒性,以及對(duì)惡意攻擊的篡改定位能力,提高了水印系統(tǒng)的安全性,為新時(shí)代數(shù)字語音信號(hào)的安全性提供了一定的技術(shù)支持。