劉效勇,盧佩,史芹,邵建新,張永才,孫迪
(1石河子大學(xué)理學(xué)院,新疆 石河子832003; 2石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,新疆 石河子832003;3石河子大學(xué)師范學(xué)院,新疆 石河子832003)
隨著計算機網(wǎng)絡(luò)及通信技術(shù)的迅猛發(fā)展,數(shù)字音頻信息可以方便快捷地被傳輸和發(fā)布,音頻的各種應(yīng)用也越來越向智能化、移動化和安全化發(fā)展。人們不僅關(guān)注音頻信息傳輸?shù)馁|(zhì)量,而且更加注重傳輸過程中信息的完整性、保密性和安全性。信息安全關(guān)系著個人隱私、商業(yè)機密乃至國家安全等諸多方面,因此,研究音頻加密具有重大的實際意義,也是現(xiàn)代通信技術(shù)中的重要部分。數(shù)字音頻具有精細(xì)、準(zhǔn)確、容量大等特點。Tang S等[1]使用AES算法對音頻信號進行了加密,不過在密鑰擴展過程中容易受到密碼攻擊;Gambhir A等[2]通過DES算法和RSA算法相結(jié)合實現(xiàn)了語音信息加密,但由于采用以數(shù)學(xué)方法為主的傳統(tǒng)加密算法,編碼和解碼速度慢,造成效率低下,不能滿足實時性要求;Li G等[3]通過控制混沌維度設(shè)計出音頻加密系統(tǒng),加密效果好,但由于采用低維混沌系統(tǒng)導(dǎo)致密鑰空間小,安全性降低;Lima J B等[4]應(yīng)用圖像作為可變密鑰進行音頻加密,但可控性不強,魯棒性不高。
為增加保密安全性,一些音頻加密方案采用了多重加密機制,雖然增加了密鑰空間,提升了加密魯棒性,但同時也增加了數(shù)據(jù)處理量和加解密處理速度[5]。同時,大部分音頻加密方案驗證安全性時方法不統(tǒng)一,采用主觀評判標(biāo)準(zhǔn)時人為因素影響過大,而采用客觀評判方法時過于復(fù)雜的弊端[6],因此,相關(guān)研究在效果測試時大多采用客觀評價標(biāo)準(zhǔn)中的部分參量進行對比分析。
本文提出一種將圖像加密思想應(yīng)用到音頻信號的安全方案,先將一維數(shù)字音頻信息轉(zhuǎn)化為二維圖像形式,此處稱為“聲圖(Sound figure)”,再使用圖像編碼的方式實現(xiàn)對音頻信息編碼,以提高加密速度,并借助Arnold變換和雙隨機相位編碼(DRPE)技術(shù)完成對音頻加密,采用無理數(shù)序列構(gòu)建隨機相位板,以增強加密安全性和效率,同時,這種轉(zhuǎn)換為聲圖的方式也可以有效解決進行密文魯棒性判斷時主、客觀判斷方法存在的弊端。
Arnold變換也稱貓臉變換,是1968年數(shù)學(xué)家V I Arnold研究遍歷理論時提出的[7],變換有一維、二維、多維多種形式。一維Arnold變換可定義如下:坐標(biāo)為(x,y)的一點經(jīng)變換到另一點后坐標(biāo)變?yōu)?x′,y′),則有:
(1)
圖像屬于二維信息,假如尺寸為N×N的原始圖像像素坐標(biāo)為(x,y),Arnold變換以后的像素坐標(biāo)為(x′,y′),二維Arnold變換的表達式為:
(2)
可以得到迭代公式:
(3)
Arnold變換是在變換域?qū)崿F(xiàn)數(shù)字圖像加密的一種主要技術(shù),利用該變換對圖像像素進行置亂,能夠?qū)⒂幸饬x的數(shù)字圖像變成像白噪聲一樣的無意義圖像,從而實現(xiàn)信息的隱藏,并且將置亂次數(shù)作為安全密鑰,從而增強系統(tǒng)的安全性和可操作性。Arnold變換算法簡單、效率高、速度快,系統(tǒng)開銷小,在信息安全領(lǐng)域經(jīng)常使用[8-10]。
雙隨機相位編碼技術(shù)是1995年由美國康涅狄格大學(xué)的Refregier和Javidi教授提出的,這種技術(shù)采用4f光學(xué)信息處理系統(tǒng)實現(xiàn)[11-12]。
如圖1所示,在圖像的加密過程中,起加密密鑰作用的是2個隨機相位掩模板RPM1和RPM2,可用下式表示:
圖1 基于4f系統(tǒng)的雙隨機相位編碼系統(tǒng)Fig.1 4f systems based on double random phase encoding
θ(x,y)=exp[i2πθ0(x,y)],
(4)
φ(u,v)=exp[i2πφ0(u,v)],
(5)
其中:(x,y)、(u,v)分別代表空域和頻域坐標(biāo),θ0(x,y)、φ0(u,v)代表空間域和頻域均勻幾率分布在[0,1]區(qū)間的隨機相位函數(shù),二者能夠?qū)斎氲墓猱a(chǎn)生0~2π的隨機相位延遲。
雙隨機相位編碼光學(xué)系統(tǒng)的加密與解密過程用數(shù)學(xué)表示如下:
g(x,y)=FT{FT[f(x,y)·θ(x,y)]·φ(u,v)},
(6)
f(x,y)=FT-1{FT-1{g(x,y)}·φ*(u,v)}·
θ*(x,y),
(7)
其中:f(x,y)為輸入圖像,g(x,y)為加密圖像,F(xiàn)T、FT-1分別表示傅里葉變換和傅里葉逆變換,“*”表示共軛。
加密過程中采用隨機相位掩模板作為密鑰,因此密鑰空間非常大,在不確定密鑰相位分布的前提下,利用反卷積運算破解是不可能獲得成功的。此外,由于隨機相位掩模板純粹是相位信息,完全不能使用光強探測器接收它的相位分布,因此,對這種方式編碼的加密攻擊也極難破譯,加密的穩(wěn)健性和安全性極高。
在序列密碼領(lǐng)域,通常采用序列構(gòu)建函數(shù)生成隨機序列作為密鑰,但序列構(gòu)建函數(shù)存在周期性,從而對信息的安全造成威脅。由于無理數(shù)是無限不循環(huán)小數(shù),周期無限長,無理數(shù)序列的隨機性、自相關(guān)性、功率譜和最大Lyapunov指數(shù)表明其具有很好的似混沌特點,將其構(gòu)造成隨機的相位掩模板作為密鑰,能夠提高破譯的難度,有效保證信息的安全性,因此,本文使用無理數(shù)展開式構(gòu)造隨機相位掩模板作為加密密鑰。
(8)
由序列可生成滿足μ(0-1)均勻分布的隨機相位板,表1為隨機相位板生成方式。
表1 隨機相位板設(shè)計Tab.1 Random phase plate design
音頻信息可看作是一維的(圖2a),用Z(K)[13]表示,即
[Z(1),…,…,…,Z(K)],
(9)
其中Z(1)、Z(2)、…、Z(K)表示數(shù)據(jù)中的每個采樣。
用f(M,N)表示二維矩陣,它的大小是M×N像素,表示為:
(10)
將音頻信息賦值到二維數(shù)組中,賦值的表達式為:
f(m,n)=Z((m-1)*M+n),
(11)
式(1)中1≤m≤M,1≤n≤N。
賦值后二維數(shù)組變?yōu)?/p>
(12)
賦值后的二維數(shù)組表現(xiàn)為圖像的形式,將其稱為聲圖(圖2b)。
圖2 音頻信號轉(zhuǎn)化為聲圖Fig.2 Digital audio transformed into Sound figure
由圖2可以看出:
(1)轉(zhuǎn)換成聲圖后的數(shù)字音頻信息具有圖像的特性,但沒有可讀性,通過聲圖得不到任何有用信息。
(2)聲圖中每個像素值對應(yīng)數(shù)字音頻的每個采樣單元,聲圖越大容納的數(shù)字音頻信息量越大,如一幅1024×1024像素的聲圖可以容納131 s 8000 Hz采樣頻率的單聲道數(shù)字音頻信息。
加密過程中選擇聲圖的像素為256×256,首先使用Arnold變換將聲圖加密一次,為了提高安全性,然后再使用雙隨機相位編碼技術(shù)進行二次加密。圖3為數(shù)字音頻信息的加密流程圖。
為提高信息保密安全性,將聲圖分成16個64×64像素的小塊,分別對每個小塊做Arnold變換,每個分塊的變換次數(shù)為10次。如圖4b所示,聲圖經(jīng)過Arnold變換后已變得隨機和混亂。
然后使用雙隨機相位編碼技術(shù)對經(jīng)過Arnold變換后的聲圖加密,隨機相位板使用無理數(shù)序列來構(gòu)建。對聲圖編碼后的密文圖像表現(xiàn)形式為噪聲(圖4c)所示,原始音頻信息轉(zhuǎn)換為圖像形式后已被很好的隱藏。
圖3 加密流程圖Fig.3 Flow chart of encryption
解碼過程是編碼過程的反過程,解碼時密文圖像首先通過逆向雙隨機相位編碼技術(shù),然后再通過反向貓臉變換解密為聲圖,最后聲圖轉(zhuǎn)化為數(shù)字音頻信息。
解碼過程中以聲圖分塊大小、貓臉變換次數(shù)和使用無理數(shù)序列構(gòu)建隨機相位板的信息作為解碼的密鑰使用。
圖5 解密流程圖Fig.5 Flow chart of decryption
使用該加密方案編碼數(shù)字音頻信息時,數(shù)字音頻信息首先變換成為聲圖,聲圖經(jīng)過貓臉變換和雙隨機相位編碼技術(shù)兩次編碼,解碼信息有很好的質(zhì)量(圖6b)。
實驗中使用的是8000 Hz采樣頻率,采樣單元8位量化的數(shù)字音頻信息。聲圖采用256×256像素。為了測量解密信息的質(zhì)量,采用信噪比(SNR)來描述解密的信息與原始信息之間的差異,其定義如下:
(13)
式(13)中:K是數(shù)字音頻總的采樣數(shù),Zin和Zout分別表示原始數(shù)字音頻和解密后的數(shù)字音頻。
3.1.1 密鑰敏感性與密鑰空間分析
加密數(shù)字音頻信息時密鑰是Arnold變換次數(shù)和制作隨機相位板的無理數(shù)及無理數(shù)展開的取位。實驗中選取Arnold變換次數(shù)為10次,將無理數(shù)π展開,其中初始位置為2,小數(shù)位數(shù)為4,序列長度為256×256。如果使用錯誤密鑰初始位置為3時,則解密結(jié)果變成圖6c所示隨機噪聲,解密信息的平均信噪比為-8.2,人耳不能分辨出有效信息,因此,該加密方案具有很強的密鑰敏感性。
在本該加密方案中,Arnold變換有2個模板參數(shù),無理數(shù)序列展開有5個模板參數(shù),理論上可以設(shè)置無窮多個密鑰,假設(shè)使用精度為16位有效數(shù)字的計算機,則該加密方案的密鑰空間為無窮大,因而能夠有效抵抗窮舉攻擊。文獻[1]密鑰空間為1096,文獻[2]的密鑰空間為10195,文獻[3]的密鑰空間是1064,本加密方案和文獻[1-3]比較密鑰空間最大,安全性最高。
圖6 解密結(jié)果Fig.6 Decryption result
3.1.2 相關(guān)性分析
隨機抽取原始數(shù)字音頻和對應(yīng)密文各10000對相鄰數(shù)據(jù)分別計算其相關(guān)性,結(jié)果(圖7)顯示:
(1)圖7a為明文語音的相關(guān)性,相關(guān)系數(shù)為0.9672,可見是高度相關(guān)的。
(2)圖7b為加密密文的相關(guān)性,相關(guān)系數(shù)為0.0616,說明密文相鄰數(shù)據(jù)相關(guān)性很弱,原始信息的統(tǒng)計特征已被擴散至隨機的加密密文之中。
圖7 相關(guān)性對比圖Fig.7 Contrast chart of correlation
3.1.3 直方圖分析
統(tǒng)計分析是評判抗攻擊能力優(yōu)劣的重要標(biāo)準(zhǔn)。圖8a為原始音頻聲圖的直方圖,圖8b為密文的直方圖。由圖8可以看出:原始音頻的數(shù)據(jù)值在某些點出現(xiàn)的頻率很高,而加密后的直方圖呈現(xiàn)類隨機均勻分布,很好地掩蓋了原始音頻的數(shù)據(jù)值分布規(guī)則,因此這種加密掩蓋了明文的統(tǒng)計特性,可以更好抵抗針對密文統(tǒng)計特性的破解攻擊,增加破譯難度。
3.1.4 加密耗時分析
在加密過程中,加密運行時間是一個重要因素,可以反映加密算法的優(yōu)劣。選擇3段大小不一的wav格式音頻文件,用本文的加密方法和文獻[2]以及文獻[3]加密方法分別進行了3次加密操作,通過計算平均時間比較加密時長,測試結(jié)果見表2。由表2可知:
(1)雖然受計算機運行環(huán)境等因素影響,計算結(jié)果有一些偏差,但可以看出,本文加密方法較文獻[2]耗時大有改善,與文獻[3]相差不多,而且本文加密安全性較高。
(2)加密耗時也和各個加密方案中各個加密參數(shù)的選擇有關(guān)。如果將本文無理數(shù)序列構(gòu)建相位板時小數(shù)位數(shù)取為2,則耗時會明顯減少,因此,對于不同加密方法各有優(yōu)異,在選擇時應(yīng)該根據(jù)實際需要進行選擇。
圖8 直方圖對比圖Fig.8 Contrast chart of histogram
表2 算法加密耗時對比Tab.2 Time comparison of algorithm encryption
3.2.1 密文遭到剪切攻擊時解密信息的質(zhì)量
來自外部的攻擊不只局限在試圖破譯,也包括剪切密文信息,加入噪聲或通過濾波器等主動攻擊形式。在密文信息遭到剪切時,解密信息的質(zhì)量會極大的降低,通過測量信噪比可以確定解密信息的質(zhì)量降低情況,并確定密文信息容許的攻擊程度。
當(dāng)1/4的密文信息被剪切時,通過對大量密文信息測量,解密信息的平均信噪比為16.27 dB(圖9a、b),這種情況下解密的數(shù)字音頻信息質(zhì)量仍然相當(dāng)好,能夠被人耳清晰辨識。
當(dāng)7/8的密文信息被剪切時,通過對大量密文信息測量,解密信息的平均信噪比為2.27 dB(圖9c、d),這種情況下解密的數(shù)字音頻信息仍能被人耳辨別。但是在同等條件下對圖像加解密,解密的圖像信息只能看到輪廓(圖9e、f)。這說明在密文受到剪切攻擊情況下,數(shù)字音頻信息比圖像有更好的魯棒性,
圖9 剪切效果及對比Fig.9 Encrypted image pixels are occluded
同時,這種加密也能夠有效避免將音頻信息直接加密時如果密文部分信息丟失而不能完整解密的缺陷。
3.2.2 密文遭到加入噪聲攻擊時解密信息的質(zhì)量
實驗結(jié)果(圖10)顯示:
(1)實驗時密文中被加入隨機噪聲,隨機噪聲的振幅在0-1,在這種情況下解密的數(shù)字音頻信息的平均信噪比為18.24 dB,信號質(zhì)量比較好(圖10)。
(2)當(dāng)密文遭到更加嚴(yán)重的噪聲攻擊時,解密的數(shù)字音頻信息噪聲比較大但是仍然可以被人耳分辨出,而同等條件下解密的圖像信息只能看到輪廓。這說明數(shù)字音頻信息在轉(zhuǎn)化為聲圖形式后,使用雙隨機相位編碼技術(shù)編碼和解碼有著很好的魯棒性。
圖10 噪聲攻擊Fig.10 Noise attack
3.2.3 密文通過濾波攻擊時解密信息的質(zhì)量
密文通過高通濾波器,濾波器的大小是256×256像素,中心區(qū)域半徑是20像素,得出的解密信息的信噪比平均為20.40 dB(圖11)。說明在這種情況下解密信息的質(zhì)量是相當(dāng)好,也就是說密文可以抵御高通濾波器攻擊。
圖11 濾波攻擊Fig.11 Filter attack
(1)本文提出了基于雙隨機相位編碼技術(shù)的數(shù)字音頻信息加密方案,在加密過程中先將數(shù)字音頻信息轉(zhuǎn)化為二維“聲圖”形式,再使用貓臉變換對聲圖進行置亂變換,使原來信息間的統(tǒng)計特性完全被打破,然后使用雙隨機相位編碼技術(shù)對聲圖進行再次加密,密文信息的表現(xiàn)形式是噪聲。
(2)加密過程中使用無理數(shù)序列構(gòu)造隨機相位板能有效增加密鑰空間,提高密鑰的可控性,增強信息的安全性。
(3)這種加密思想和方法具有較強的實用性。