胡爾西旦
摘 要: 隨著科技的不斷進(jìn)步,音頻產(chǎn)品快速發(fā)展,人們開始關(guān)注音頻產(chǎn)品版權(quán)的保護(hù),數(shù)字音頻水印技術(shù)成為了當(dāng)前比較活躍的研究領(lǐng)域。音頻水印具備以下優(yōu)點(diǎn):用戶體驗(yàn)感好、快速準(zhǔn)確、方便移動端采集。使用音頻水印技術(shù),通過在節(jié)目播出實(shí)時(shí)信號或離線素材中嵌入音頻水印,在電視節(jié)目播放時(shí),觀眾可通過手機(jī)等移動終端的麥克風(fēng)采集聲音并識別水印信息,根據(jù)結(jié)果跳轉(zhuǎn)到對應(yīng)互動界面參與節(jié)目互動。如何實(shí)現(xiàn)屏幕的擴(kuò)展,將“大屏幕”的視覺效果和現(xiàn)場感與“小屏幕”的優(yōu)勢相結(jié)合,延伸電視互動應(yīng)用場景,成為了新媒體行業(yè)的熱門研究方向。
關(guān)鍵詞: 音頻水印;水印嵌入;水印檢測;電視節(jié)目互動
【中圖分類號】P301.6 【文獻(xiàn)標(biāo)識碼】B 【DOI】10.12215/j.issn.1674-3733.2020.25.179
引言:如何保護(hù)數(shù)字內(nèi)容的安全性已成為近年來法律界和信息產(chǎn)業(yè)界的熱點(diǎn)問題。針對這些問題,傳統(tǒng)的解決方式是采用密碼學(xué)技術(shù)。但是,多媒體產(chǎn)品數(shù)據(jù)比較特殊,僅依靠傳統(tǒng)密碼學(xué)技術(shù)無法解決多媒體信息產(chǎn)生的安全問題。基于傳統(tǒng)密碼學(xué)技術(shù)的多媒體信息安全保護(hù)具有局限性。這種背景下,能夠解決版權(quán)問題的數(shù)字水印應(yīng)運(yùn)而生。
1 電視播出互動中的應(yīng)用中音頻水印的技術(shù)特點(diǎn)
(1)適于空氣傳播,在電視互動場景中,觀眾使用手機(jī)等移動終端設(shè)備識別電視節(jié)目聲音中的音頻水印,訪問互動內(nèi)容,聲音在電視播放過程中通過空氣傳播至手機(jī)麥克風(fēng),距離、背景聲等周圍環(huán)境多種多樣,因此需要考慮到音頻水印的抗干擾能力。
(2)魯棒性高:由于電視信號從電視臺播出一直到用戶機(jī)頂盒的傳輸鏈路復(fù)雜,特別是上星播出的節(jié)目,中間會經(jīng)歷多次編解碼、信號格式轉(zhuǎn)換、音頻變換等處理,因此在電視節(jié)目中嵌入的水印需具有較高的魯棒性,避免水印在傳輸鏈路中被干擾破壞,影響終端設(shè)備的正常識別。
(3)檢測程序性能,考慮到市場上的手機(jī)檔次不一,音頻水印檢測算法不能占用太高的手機(jī)資源,基本設(shè)計(jì)目標(biāo)是占用CPU不超過中檔手機(jī)的20%。
2 數(shù)字音頻水印的評價(jià)標(biāo)準(zhǔn)
2.1 不可感知性評價(jià)標(biāo)準(zhǔn)
2.1.1 主觀標(biāo)準(zhǔn)
主觀評價(jià)一個(gè)水印算法透明性的過程中,通常應(yīng)用平均觀點(diǎn)分(MeanOpinionScore,MOS),即由測試者對含水印的音頻進(jìn)行打分。其主要根據(jù)音頻的音質(zhì)進(jìn)行打分,通常使用5分制規(guī)則,MOS越靠近5,說明算法的透明性越好。由于此標(biāo)準(zhǔn)常常因參加測試人員的個(gè)人因素或者測試的環(huán)境的不同,導(dǎo)致測試結(jié)果存在差異,且會浪費(fèi)大量人力,因此通常不被采用。
2.1.2 客觀標(biāo)準(zhǔn)
評價(jià)透明性時(shí),使用較多的是信噪比和峰值信噪比(PeakSignaltoNoiseRatio,PSNR),可以定量評價(jià)算法。雖然音頻發(fā)生的一些較小改變在主觀上聽不出任何差異,但是會對SNR或者PSNR的數(shù)值造成一定影響。
2.2 水印容量評價(jià)標(biāo)準(zhǔn)
水印容量通常指保證音頻產(chǎn)品具有不可感知性的前提條件下,單位時(shí)間內(nèi)嵌入到宿主音頻產(chǎn)品中的水印大小,單位是bps(bitspersecond)。bps值越大,說明嵌入的水印越多;反之,說明嵌入的水印較少。對于不同的應(yīng)用域,嵌入水印序列大小的要求不盡相同,通常要求音頻產(chǎn)品夠針對不同的場景,嵌入相應(yīng)大小的水印序列。
3 音頻水印互動系統(tǒng)中的關(guān)鍵技術(shù)
3.1 音頻水印嵌入
3.1.1 音頻分幀處理
設(shè)原始音頻信號分段時(shí)每幀音頻信號的長度為M,M的取值對算法性能的好壞有一定的影響。為了提高算法的感知透明性,使嵌入水印后的音頻信號在聽覺上不被感知,可以說M的取值越大越好。本算法中取每幀M=1024,嵌入水印的音頻信號與原始音頻信號相比在聽覺上差異不明顯。
對每一個(gè)窗口進(jìn)行幀結(jié)構(gòu)處理:分幀處理,對于48kHz采樣頻率的音頻信號,每1024個(gè)時(shí)間采樣點(diǎn)分為1幀,每一個(gè)完整的水印窗口為32幀,對這32幀在時(shí)域進(jìn)行漢明窗口函數(shù)重疊滾降,在這時(shí)間T內(nèi)要完成16bit信息的嵌入。
3.1.2 嵌入過程
將一個(gè)二值隨機(jī)序列wm作為待嵌入的信息位,這里記同步碼與信息位之和共N位,選取一段原始音頻作為掩護(hù)音頻F,其長度為L。
選取兩段不同的m序列:m1和m2作為擴(kuò)頻序列,其中m1作為對同步碼的擴(kuò)頻序列,m2作為對水印信息的擴(kuò)頻序列,對水印序列S進(jìn)行擴(kuò)頻,選擇的m序列可作為密鑰。擴(kuò)頻序列的長度M,擴(kuò)頻后的序列為VS,長度為“N×M”。
3.2 音頻水印檢測
3.2.1 初始化同步搜索
同步信息是4位的同步頭,嵌入時(shí)采用與水印信息不同的擴(kuò)頻碼序列。具體序列的選擇由密鑰唯一確定,而密鑰在嵌入與檢測兩端都是相同的。
概述來說,解碼時(shí),首先用已經(jīng)知道的同步擴(kuò)頻碼序列提取同步頭,當(dāng)解碼得到同步頭時(shí),用整個(gè)碼本所有的擴(kuò)頻序列分別去做相關(guān),得到相關(guān)最大的碼序列即為同步所使用的擴(kuò)頻碼序列;進(jìn)一步精細(xì)搜索,用這個(gè)同步擴(kuò)頻碼序列在這個(gè)位置的周圍滑動提取相關(guān)值,得到相關(guān)值最大的位置確定為同步信號的嵌入位置。
3.2.2 置信度處理
根據(jù)嵌入端在特定子帶嵌入的規(guī)則,在檢測端可以單獨(dú)對某些子帶進(jìn)行處理,比如取前10個(gè)相關(guān)檢測峰值最高的子帶視為有效信息,其他子帶信息丟棄,對10個(gè)最優(yōu)檢測相關(guān)值進(jìn)行綜合判定。為可信度量提供充分的數(shù)據(jù)支持。對于解碼得到的水印數(shù)據(jù),為了確認(rèn)可信度較高的水印信息,同時(shí)丟棄可信度較低的水印信息。
基于冗余嵌入設(shè)計(jì)了可信度度量方法。假設(shè)水印信息在傳輸過程中沒有受到任何的干擾,則從兩組水印中解碼得到的水印應(yīng)該具有相同的符號,即使用兩個(gè)擴(kuò)頻序列解碼并重新排列恢復(fù)后得到的水印數(shù)據(jù)應(yīng)該完全相同。隨著干擾的不斷增加,兩組水印數(shù)據(jù)中的不全部相同的位數(shù)開始增加,因此兩組水印數(shù)據(jù)中不全部相同的位數(shù)已在一定程度上反映出水印信號的被干擾情況。此外,同步碼由于進(jìn)行了四倍的冗余,在一定程序上也提供了受干擾程度的反饋,可以作為置信度的一個(gè)參考。
結(jié)語:當(dāng)前,數(shù)字音頻水印雖然取得了一些進(jìn)展,但也存在這一些問題。一些算法設(shè)計(jì)時(shí)沒有考慮同步問題,該問題也是目前音頻水印技術(shù)中所要考慮的問題之一。目前關(guān)于能夠同時(shí)進(jìn)行版權(quán)及內(nèi)容認(rèn)證的算法需求越來越多,因此進(jìn)行雙水印方案的研究很有必要。
參考文獻(xiàn)
[1] 何茜,趙景惠.數(shù)字水印算法研究[J].信息與電腦(理論版),2017,(7):82-83.
[2] 甘蓉.數(shù)字視頻水印技術(shù)淺析[J].電子測試,2018,390(9):126,128.
[3] 萬旭光,劉凡.軍事通信中基于DCT域直流分量的音頻數(shù)字水印技術(shù)研究[J].現(xiàn)代電子技術(shù),2017,40(13):6-8.