摘要:隨著語音通信的飛速發(fā)展和各種語音產品的日益普及,數(shù)字音頻逐漸成為最流行的多媒體應用之一。云作為一種提供計算資源的新方式,不僅僅可以提供無限的存儲容量,而且不需要擔心電量、空間和升級等諸多問題。但從密碼學角度來說,云存儲端不是可信任第三方。為此,將logistic映射以及貓臉變換技術結合在一起對語音進行加密,并基于語音的基音周期設計了一種具有隱私保護特性的密文語音檢索方案。
關鍵詞:感知哈希;可恢復水??;語音認證;基音周期;檢索
中圖分類號:G4文獻標識碼:Adoi:10.19311/j.cnki.16723198.2017.06.082
3.3密文語音檢索
將感知哈希作為水印嵌入到加密后的語音信號中從而得到含水印的密文語音,并上傳到云服務器端,同時構建一個系統(tǒng)哈希表來存儲相應的感知哈希值。當用戶向云服務器管理員發(fā)送檢索請求時,管理員可以在不下載、不解密加密語音的情況下對密文語音進行檢索。首先根據(jù)水印嵌入算法的逆過程從密文語音中提取感知哈希值H1,隨后將其與從系統(tǒng)哈希表中對應的感知哈希值H2進行匹配,根據(jù)式(6)求出二者的歸一化漢明距離D(H1,H2):
D(H1,H2)=11M∑M1p=1H1(p)H2(p),p=1,2,3,…,M(9)
假設T2為相似性閾值,且0 4性能分析與比較 4.1感知哈希性能 實驗中采用的語音庫為100個采樣率為441kHz,16位量化的單聲道語音。我們按照每幀1280個采樣點將每個語音進行不重疊分幀,得到每個語音幀的基音周期生成感知哈希,計算每幀語音感知哈希值與其它各幀感知哈希值的歸一化漢明距離,得到如圖3所示的4950個結果,以及如圖4所示的統(tǒng)計直方圖。根據(jù)圖3和圖4中能夠發(fā)現(xiàn)不同語音感知哈希值的歸一化漢明距離主要分布在0.18-0.7之間。這個分布結果可近似于數(shù)學期望為0.4796,標準差為00791的高斯分布。設015為相似性閾值,即T2=0.15,可以計算出它的碰撞率為1.5312×10-5。由此可見,通過本文算法計算得到的感知哈希值有較好的唯一性和區(qū)分性。 直方圖對語音進行常規(guī)信號處理,計算出處理前后語音的感知哈希值的歸一化漢明距離。表1給出了在添加噪音、低通濾波、音量調節(jié)以及重采樣、重量化等不同語音信號處理后的語音產生的感知哈希值與原始語音產生的感知哈希值之間的歸一化漢明距離??梢缘弥?,常規(guī)信號處理前后語音的感知哈希值的歸一化漢明距離都小于0.1,說明本算法產生的感知哈希值的魯棒性好。上述測試結果顯示本文算法具有良好的實時性、區(qū)分性、唯一性和感知魯棒性,這為其用于海量密文語音檢索奠定了基礎。 為保證語音云存儲得安全性,首先,本文采用logistic映射與Arnold變換對語音做加密處理。下面實驗采用的語音樣本為單聲道,采樣率為44.1kHz,量化位數(shù)為16bits,長度為51200個采樣點。圖5(a)所示為原始語音波形,我們取Logistic混沌初值為0.001,同時Arnold變換a=2且b=3對其進行加密操作,圖5(b)所示為加密后的語音??梢钥闯觯用芮昂蟮谜Z音波形相差很大,加密效果良好。 將通過基音周期生成的感知哈希值嵌入到加密語音中,嵌入時的量化步長是0.05,得到如圖6(a)所示的含水印語音。由圖6(a)和圖6(b)可見,嵌入感知哈希值前后的密文語音信號在波形上幾乎沒有差異,這表明感知哈希值的嵌入不影響密文語音的感知質量。將嵌有感知哈希的密文語音信號進行解密后得到的語音信號波形如圖6(b)所示??梢钥闯觯队懈兄V档拿芪恼Z音完全可以進行解密操作,且解密后的語音波形與加密的語音波形基本相同,因此嵌入感知哈希值這一操作,并不影響語音的解密。 下面我們將分別從密鑰敏感度對加密性能進行分析。為測試密鑰的敏感性,我們將對系統(tǒng)的密鑰做一些小的改變。比如,本文測試時利用的Logistic混沌初值為0.001,同時Arnold變換a=2且b=3,我們稱系統(tǒng)密鑰為K=(0.001,2,3),利用此密鑰對語音進行加密?,F(xiàn)在對混沌初值做修改,取初值為0.0011,Arnold變換的密鑰a、b不變,即K′=(0.00111,2,3),并用修改過的密鑰對語音進行解密。圖7(a)為經(jīng)過密鑰K加密后得語音波形,圖7(b)為使用錯誤的密鑰K′對加密語音進行解密后的語音波形。由此可以看出,盡管密鑰K與K′中只有k1與k′1的值相差00001,但該加密系統(tǒng)在進行若干次迭代后生成的混沌序列差別很大,所以不能正確的解密語音。這說明本算法的密鑰敏感性良好。 4.3密文語音檢索的準確性 為了評價密文語音的檢索性能,下面將采用查全率R和查準率P這兩個指標進行分析。設檢索正確的語音個數(shù)為fT,檢索丟失的語音個數(shù)fL,檢索錯誤的語音個數(shù)fF,那么查全率R和查準率P的計算公式分別如下: 從語音庫中任意選取4個語音,然后采用不同參數(shù)對其進行如表1所示的不同語音攻擊,將攻擊后的語音與剩余96個語音組成新的語音庫。對新的語音庫中的語音采取上述加密方式進行加密并將感知哈希嵌入到加密后的語音中,從而構成待檢索的密文語音庫。在檢索過程中,把待檢索的密文語音庫中提取的感知哈希值與目標語音的感知哈希值進行匹配,假如計算所得的歸一化漢明距離比閾值小,則判定為該語音的檢索結果。本文所選相似性閾值T2=0.15,表2為經(jīng)過不同語音處理后的查全率和查準率。 從表2中能夠看到,經(jīng)過噪聲、低通濾波、音量調節(jié)等語音處理后,本文算法的查全率和查準率均為100%。綜上分析,可以看出根據(jù)本文算法所產生的感知哈希在魯棒性高于文獻\[38\]的情況下,也取得了令人滿意的查全率和查準率。 5結論 本文針對云環(huán)境下的大規(guī)模語音數(shù)據(jù)設計了一種基于Logistic映射和Arnold變換相結合的加密方法,保證了云存儲的隱私性和安全性,隨后設計了一種基于語音基音周期的感知哈希密文語音檢索方法。本文方案的優(yōu)勢:(1)提出的基于Logistic映射和Arnold變換相結合的加密方法具有非??煽康陌踩裕⑶疫\算速度快,適合大規(guī)模數(shù)據(jù)的加密;(2)基于語音周期的感知哈希方法具有很強的魯棒性和唯一性,由此提出的檢索方式具有很高的查全率和查準率;(3)可以在不下載、不解密的情況下直接對密文語音進行檢索。根據(jù)仿真結果可知,本文方案的唯一性良好,并且對常規(guī)語音攻擊具有較好的感知魯棒性,可以滿足用戶安全性和實時性的需求。 參考文獻 [1]吳婧.基于感知哈希技術的音頻檢索方案研究[D].哈爾濱:哈爾濱工業(yè)大學,2008. [2]孫圣和,陸哲明,牛夏牧.數(shù)字水印技術及其應用[M].北京:科學出版社,2004. [3]劉瑞禎,譚鐵牛.數(shù)字圖像水印研究綜述[J].通信學報.2000,32(8):3945. [4]I. Cox,M.Miller,J.Bloom.Digital Watermarking[J].Computing Milleux,2003. [5]徐達文,王讓定,鮑吉龍.基于聽覺感知模型的自適應音頻數(shù)字水印算法[J].計算機工程與應用,2006,(31):6870. [6]錢清.數(shù)字語音認證水印技術研究[D].成都:西南交通大學,2012. [7]林藍.密文語音檢索與基于可恢復水印的語音認證研究[D].成都:西南交通大學,2015. [8]鮑長春,樊昌信.基于歸一化互相關函數(shù)的基音檢測算法[J].通信學報,1998,19(10):2731. [9]胡瑛,陳寧.基于小波變換的清濁音分類及基音周期檢測算法[J].電子與信息學報.2008,30(2):353356. [10]王秋生,孫圣和.基于量化數(shù)字音頻信號頻域參數(shù)的水印嵌入算法[J].聲學學報.2002,27(4):380385.