徐 明,胡沐宇
(上海海事大學(xué)信息工程學(xué)院,上海 201306)
隨著網(wǎng)絡(luò)信息技術(shù)的發(fā)展,各個領(lǐng)域產(chǎn)生的信息量呈現(xiàn)出爆炸性增長,其中敏感和隱私信息如生物識別中的特征數(shù)據(jù)、植入式醫(yī)療電子設(shè)備中的無線可靠傳輸、視頻流媒體傳輸以及電子商務(wù)交易數(shù)據(jù)集之類的傳輸處理方式就顯得尤為重要[1~4].未經(jīng)處理的原始信息量巨大,為了有效傳輸,需要進行壓縮即編碼.在該背景下,信息的壓縮和安全傳輸技術(shù)面臨挑戰(zhàn).信息論通過研究網(wǎng)絡(luò)傳輸中信息流的極限以及達到這些極限的最優(yōu)編碼方案來提高系統(tǒng)的安全性.
基于信息論實現(xiàn)信源的安全傳輸最早由Shannon提出[5].在此基礎(chǔ)上,Wyner提出假設(shè)竊聽信道與合法信道相比是退化的,那么消息在有噪信道中可以安全傳輸[6].Csiszár和K?rner將此結(jié)論拓展到一般的廣播信道,并根據(jù)竊聽者對傳輸信息的不確定程度來衡量信道的保密級別,建立存在公共消息和保密消息的速率-泄露率區(qū)域(rate-leakage region)[7].上述工作都基于信源的安全無損傳輸,即合法接收者在信源壓縮傳輸時不產(chǎn)生失真的情況下重建信源.如果信源在壓縮傳輸時產(chǎn)生失真,那么就要考慮失真對信源安全傳輸?shù)挠绊懀甒yner和Ziv定義了信源安全有損傳輸下的速率-失真函數(shù)(rate-distortion function),并在傳輸?shù)募s束條件中增加了速率、失真和泄露率等有限碼率約束,目的是讓竊聽者對傳輸?shù)南⒈M可能保持未知[8].Chia和Chong刻畫了具有邊信息的Wyner-Ziv信源編碼的速率-失真區(qū)域,指出解碼器到編碼器的反饋不會減少總速率[9].Villard和Piantanida構(gòu)建了邊信息對竊聽者非因果性可知的信道模型,考慮了未編碼邊信息對合法用戶非因果性可知時,合法用戶接收到的信源能無損重建的情況,得出更緊的速率-失真-模糊率區(qū)域[10].考慮到無線衰落信道的統(tǒng)計特性不斷變化,Koyluoglu等人引入狀態(tài)信息,對具有狀態(tài)的廣播信道建立索引,得出退化高斯信道模型的最優(yōu)角點以及上界與可達區(qū)域的距離[11].Han等人提出狀態(tài)信息對編碼器非因果性可知的竊聽信道模型,并得出該信道模型的保密容量下界以及密鑰容量[12].
通過上述分析可知,邊信息有助于解碼器減小信源與信源估計之間的失真,狀態(tài)信息可以用來表征統(tǒng)計特征不確定的無線衰落信道以及提高消息傳輸速率.然而,由于無線信道的復(fù)雜性,特別是在無線衰落竊聽信道下,往往既包含邊信息又包含狀態(tài)信息,并且竊聽者可能竊聽到邊信息.如何設(shè)計安全可靠的編解碼機制并對相關(guān)有限碼率約束進行定界需要進一步研究.本文提出一種邊信息對解碼器非因果性可知和狀態(tài)信息對編碼器非因果性可知的安全有損傳輸方案,基于雙分簇技術(shù)設(shè)計出信源編解碼機制,并以該模型下的高斯噪聲竊聽信道為例進行具體分析,推導(dǎo)出速率-失真-信息泄露率的下界,然后引入模糊率,將信息泄漏率轉(zhuǎn)化為估計信源的最小均方誤差,得出信源估計最小均方誤差的上界.考慮噪聲功率不同的情況下的速率和失真的下界以及信源估計最小均方誤差的上界進行仿真,得到三者之間最優(yōu)權(quán)衡并對實驗結(jié)果進行比較分析.
熵H(·)表示隨機變量不確定性的度量;互信息I(·)表示一個隨機變量中包含的關(guān)于另一個隨機變量的信息量;X、Y、Z表示有限集合X、Y、Z上的離散型隨機變量,x、y、z表示X、Y、Z的取值,概率分布分別為P(x)、P(y)和P(z);xnk表 示 由(xi)i∈N*構(gòu) 成 的 序 列(xk,xk+1,…,xn),其中N*表示正自然數(shù)集,xn1簡化為xn;若P和Q是聯(lián)合高斯隨機變量,ΓPQ表示P和Q的協(xié)方差矩陣;R表示實數(shù)集,Rd表示d維歐幾里得空間.
定義2若隨機變量X在集合X上均勻分布,則保密編碼(2nR,n)對應(yīng)的信息泄露率Ie為
定義3如果一個以速率R,失真D,信息泄露率Ie構(gòu)成的三元組(R,D,Ie)存在并進行信息的安全有損傳輸,對于任意δ>0和n≥1,一個(n,R+δ)碼序列滿足以下2個條件,則(R,D,Ie)∈R3+是可達的.
本文所構(gòu)建的具有邊信息和狀態(tài)信息的竊聽信道模型由合法發(fā)送者Alice,合法接收者Bob以及竊聽者Eve組成.Alice想發(fā)送信源信息給Bob,Bob根據(jù)接收到的消息重構(gòu)信源,并確保泄露給Eve的信息盡可能少.編碼器和解碼器由編碼函數(shù)f(n):X n×Sn→Fn和解碼函數(shù)g(n):Yn×Bn→X n構(gòu)成.編碼器產(chǎn)生的序列Fn通過信道傳輸給Bob,Eve通過竊聽信道進行竊聽,狀態(tài)信息Sn對編碼器非因果性可知,并且與信道噪聲相互獨立.假設(shè)存在平均傳輸功率約束
則Bob可以通過接收到的序列Yn和邊信息Bn重構(gòu)信源,而Eve根據(jù)竊聽到的序列Zn和邊信息En不能重構(gòu)信源.
根據(jù)上節(jié)提出的系統(tǒng)模型,設(shè)計了信源安全有損傳輸方案.該方案中的編碼機制通過雙分簇技術(shù)構(gòu)造二維碼本,目標(biāo)是在有限碼率約束下,使壓縮失真和信息泄漏率盡可能?。?/p>
3.2.1 碼本生成
(1)固定概率PF|XPV|XFPU|V使其達到信道容量,隨機生成2nI(X;F)個序列f n(wf),wf∈{1,…,2nF}.對于每個wf,獨立并隨機生成2nI(U;X|F)個獨立同分布的碼字序列un(wf,wu),wu∈{1,…,2nI(U;X|F)},并將un(wf,wu)隨機分到大小相同的2nRX個簇C1(ru)中,簇的索引ru∈{1,2,…,2nRX},該層分簇構(gòu)成了碼本的第1維.
(2)對于每個(wf,wu)索引對,隨機生成2nI(V;X|U,F(xiàn))個獨立同分布的碼字序列νn(wf,wu,wν),wν∈{1,…,2nI(V;X|U,F(xiàn))},然后將碼字序列νn(wf,wu,wν)隨機分配到2nRC個大小相同的簇C2(rν)中,簇的索引rν∈{1,2,…,2nRC},該層分簇構(gòu)成了碼本的第2維.
3.2.2 編碼
(1)查找一個與信源序列xn聯(lián)合典型的序列f n(wf).根據(jù)覆蓋引理[13],存在這樣的f n(wf),隨機選擇一個與(xn,f n)高概率同分布的序列索引wf,將其發(fā)送給解碼器.
(2)查找一個與(xn,f n)聯(lián)合典型的序列un(wf,wu).根據(jù)覆蓋引理,隨機選擇一個相應(yīng)簇的索引wu,將其發(fā)送給解碼器.
(3)查找一個與(xn,f n,un)聯(lián)合典型的序列νn(wf,wu,wν).根據(jù)覆蓋引理,隨機選擇一個相應(yīng)簇的索引wν,將其發(fā)送給解碼器.
3.2.3 傳輸
Alice發(fā)送索引wf,wu,wν,Bob得到其中是wf,wu,wν經(jīng)過合法信道傳輸后得到的索引估計值;Eve得到其中是wf,wu,wν經(jīng)過竊聽信道傳輸后得到的索引估計值.
3.2.4 解碼
Bob以速率R和失真D接收到Y(jié)n并獲得關(guān)于信源的邊信息Bn,通過解碼器在簇C1(ru)中查找與(bn,f n)聯(lián)合典型的序列un,在簇C2(rν)中查找與(bn,f n,un)聯(lián)合典型的序列νn,由此得到狀態(tài)序列sn,繼續(xù)解碼可得估計信源x?n.
3.2.5 錯誤概率分析
將編碼和解碼過程中出現(xiàn)錯誤的事件記為ξ,考慮存在以下情形:
(1)典型性錯誤
將邊信息的典型性錯誤記為事件ξ1,根據(jù)典型序列性質(zhì),存在ε→0使得不等式P(ξ1)=P{(X n,F(xiàn)n,Bn,En)?Tεn(X,F(xiàn),B,E)}≤ε成立.將信道的典型性錯誤記為事件ξ2,其錯誤概率P(ξ2)=P{(Fn,Yn,Zn)?Tε
n(F,Y,Z)}≤ε.
(2)編解碼錯誤
將編解碼錯誤記為事件ξ3,存在錯誤概率上界使得P(ξ3)≤ε.因此
本節(jié)利用信息論推導(dǎo)速率-失真-信息泄露率的下界并給出可達性證明和逆命題證明.
定理1若三元組速率-失真-信息泄露率(R,D,Ie)∈R3+,U,V分別屬于有限集合U,V中的輔助隨機變量,并存在馬爾科夫鏈U-V-(X,F(xiàn))-(B,E)和U-V-(F,S)-表示解碼信源序列函數(shù),則需要滿足
證明
(1)可達性證明
①速率
定義信源的傳輸速率為R+δ(δ→0),δ表示傳輸中的誤差值,則
②失真
將?記為在編碼步驟或者解碼步驟出現(xiàn)錯誤的事件,令ε→0,則
③信息泄露率
式中(a)是因為在所有序列都高概率聯(lián)合典型的條件下,根據(jù)信源的無記憶特性得到和H(En|Fn,Un,Cn)[14].
(2)逆命題證明
①速率
式中(a)是根據(jù)隨機變量F和B在時間上的獨立性得到.
②失真
③信息泄露率
式中(a)是根據(jù)Fano不等式和馬爾科夫鏈(Fn,Sn,X ni,得到.式中(b)根據(jù)解碼器的解碼機制,利用Csiszár求和式得到,因 此n(Ri+δ)≥
證畢.
在本節(jié)中,我們以具有邊信息和狀態(tài)信息的高斯竊聽信道為例分析本文所提出的安全有損傳輸方案,推導(dǎo)出高斯噪聲竊聽信道中有限碼率約束的界并給出證明,然后考慮不同傳輸條件下的情況并利用具體數(shù)據(jù)進行實驗和分析.
圖1描繪了高斯噪聲竊聽信道下具有邊信息和狀態(tài)信息的安全有損傳輸模型.其中Bob和Eve觀測到的邊信息噪聲分別服從Nb~N(0,Pb)和Ne~N(0,Pe)分布.信道狀態(tài)服從S~N(0,Ps)分布,合法信道噪聲服 從N1~N(0,Py)分布,竊聽信道噪聲服從N2~N(0,Pz)分布.合法信道的信道增益為g1,竊聽信道的信道增益為g2,信道平均輸入功率約束為P.
圖1 高斯噪聲竊聽信道的安全有損傳輸
由于狀態(tài)信息對編碼器非因果性可知,所以可以將Sn看作有限遍歷的馬爾科夫鏈,通過最優(yōu)功率分配函數(shù)Υ(·)對信道狀態(tài)進行優(yōu)化,求解出最優(yōu)信道狀態(tài)功率P*s.
根據(jù)拉格朗日乘子和Kuhn-Tucker條件,最優(yōu)功率分配函數(shù)需要滿足
其中拉格朗日乘子λ>0,其實際值可以通過求解
得出,確保滿足信道平均輸入功率約束.最后得出
根據(jù)本文編碼機制,Bob接收到的序列為
Eve竊聽到的序列為
定理2若三元組(R,D,IDE)∈R3+,U=?,V屬于有限集合V中的輔助隨機變量且存在馬爾科夫鏈V-(X,F(xiàn))-(B,E)和V-(F,S)-(Y,Z)則需要滿足
證明
(1)速率R
由 式(7)可 得R≥I(V;F|B),其 中I(V;F|B)=因所以
(2)失真D
(3)信源估計的最小均方誤差I(lǐng)DE
由式(8)可得
因此
證畢.
本節(jié)對本文提出的系統(tǒng)模型及其編解碼機制的安全性和可靠性進行仿真.仿真中所有信道為獨立同分布的衰落信道且服從均值為0和方差為1的高斯分布.合法接收者和竊聽者分別觀測到的噪聲功率是Pb和Pe,合法信道的加性高斯信道噪聲功率為Py,竊聽信道噪聲功率為Pz,信道平均輸入功率約束為P,最優(yōu)信道狀態(tài)功率Ps*根據(jù)式(11)計算得出.
根據(jù)構(gòu)造的高斯噪聲竊聽信道模型和編碼機制,選取以下隨機變量
圖2 隨機變量之間的相互關(guān)系
函數(shù)關(guān)系可表示為
令信道增益g1=g2=1,根據(jù)等式得到R、D和IDE的上下界關(guān)于α和β的表達式,然后對R、D和IDE定界后分情況進行實驗和分析.
(1)R的下界
最后得出R的下界關(guān)于α和β的表達式.
(2)D的下界
其中,根據(jù)式(17)~(19)可得
根據(jù)式(19)和(20)可得
其中,根據(jù)式(19)可得
根據(jù)式(17)和(20)可得
最后得出D的下界關(guān)于α和β的表達式.
(3)IDE的上界
本節(jié)將根據(jù)合法信道與竊聽信道噪聲功率的不同以及合法接收者與竊聽者邊信息傳輸時噪聲功率不同劃分為表1所示的4種情況,然后分析本文方案在不同情況下的速率、失真、泄露率和模糊率.其中,情況1表示Bob比Eve的信道噪聲小且Bob邊信息的噪聲比Eve小,信道狀態(tài)功率取最優(yōu)值Ps*,是合法接收者相對于竊聽者的最優(yōu)條件.其余3種情況為非最優(yōu)條件,信道狀態(tài)功率也取相應(yīng)的最優(yōu)值Ps*.
表1 不同噪聲功率條件下劃分的4種情況
根據(jù)表1考慮噪聲功率不同的4種情況,將各種情況下的數(shù)據(jù)代入化簡得到的表達式中,速率R,失真D,信源估計的最小均方誤差I(lǐng)DE和模糊率Δ的單位是bit/source-bit.本節(jié)將尋找速率-失真-信源估計的最小均方誤差三者之間的最優(yōu)權(quán)衡點轉(zhuǎn)化為目標(biāo)值W最大化的優(yōu)化問題,優(yōu)化問題表述如下:
其中,atan()為反正切函數(shù),[x]+表示max{0,x}.
情況1:Bob比Eve的信道噪聲小且Bob邊信息的噪聲比Eve?。頟y=0.5,Pz=1,Pb=0.5,Pe=1,P=1.
情況2:Bob比Eve的信道噪聲小但Bob邊信息的噪聲比Eve大.令Py=0.5,Pz=1,Pb=1,Pe=0.5,P=1.
情況3:Bob比Eve的信道噪聲大但Bob邊信息的噪聲比Eve?。頟y=1,Pz=0.5,Pb=0.5,Pe=1,P=1.
情況4:Bob比Eve的信道噪聲大且Bob邊信息的噪聲比Eve大.令Py=1,Pz=0.5,Pb=1,Pe=0.5,P=1.
圖3描繪了情況1下目標(biāo)值W與α和β的函數(shù)關(guān)系,最優(yōu)權(quán)衡在α=0.1,β=0.9,γ=0.43時取得,此時最大目標(biāo)值為196.9906,速率為0.7601 bit/source-bit,失真為0.0051 bit/source-bit,信源估計的最小均方誤差為0.8427 bit/source-bit.
圖3 情況1:傳輸信道噪聲小且邊信息噪聲小
圖4描繪了情況2下目標(biāo)值W與α和β的函數(shù)關(guān)系,最優(yōu)權(quán)衡點在α=0.9,β=0.1,γ=0.43時取得,此時最大目標(biāo)值為51.1407,速率為0.6305 bit/source-bit,失真為0.0198 bit/source-bit,信源估計的最小均方誤差為0.7202 bit/source-bit.
圖4 情況2:傳輸信道噪聲小但邊信息噪聲大
圖5描繪了情況3下目標(biāo)值W與α和β的函數(shù)關(guān)系,最優(yōu)權(quán)衡點在α=0.9,β=0.1,γ=0.43時取得,此時最大目標(biāo)值為34.6518,速率為0.3285 bit/source-bit,失真為0.0306 bit/source-bit,信源估計的最小均方誤差為1.2815 bit/source-bit.
圖5 情況3:傳輸信道噪聲大但邊信息噪聲小
圖6描繪了情況4的目標(biāo)值W與α和β的函數(shù)關(guān)系,最優(yōu)權(quán)衡點在α=0.9,β=0.1,γ=0.43時取得,此時最大目標(biāo)值為29.2453,速率為0.3998 bit/source-bit,失真為0.0367 bit/source-bit,信源估計的最小均方誤差為1.2079 bit/source-bit.
圖6 情況4:傳輸信道噪聲大且邊信息噪聲大
進一步,分析本文方案在以上4種情況下模糊率的變化情況.圖7描繪的是在情況1下模糊率關(guān)于α和β的變化情況.當(dāng)α=0.15,β=0.42,γ=0.8950時,竊聽者對信源的模糊率最高,達到0.1410 bit/source-bit.
圖7 情況1下的模糊率
圖8描繪了情況2下模糊率關(guān)于α和β的變化情況.當(dāng)α=0.15,β=0.42,γ=0.8950時,竊聽者對信源的模糊率最高,達到0.1357 bit/source-bit.
圖8 情況2下的模糊率
圖9描繪了情況3下模糊率關(guān)于α和β的變化情況.當(dāng)α=0.32,β=0.61,γ=0.7249時,竊聽者對信源的模糊率最高,達到0.1996 bit/source-bit.
圖9 情況3下的模糊率
圖10描繪了情況4下模糊率關(guān)于α和β的變化情況.當(dāng)α=0.32,β=0.61,γ=0.7249時,竊聽者對信源的模糊率最高,達到0.1945 bit/source-bit.
圖10 情況4下的模糊率
綜合以上實驗結(jié)果可以得出:在最優(yōu)條件下,即Bob比Eve的信道噪聲小且Bob邊信息的噪聲比Eve小,所得目標(biāo)值達到4種情況下的最大值,速率最大且失真最小,根據(jù)信源估計的最小均方誤差推算出信息泄漏率為0.1277 bit/source-bit,所得結(jié)果比文獻[10]中所提出的安全有損信源傳輸方案中的速率高,比其所得的失真低;信源估計的最小均方誤差比文獻[11]所提出的最優(yōu)方案得出的值高.利用速率和失真來衡量其可靠性,信源估計的最小均方誤差來衡量其安全性,對比可得本文所提出的傳輸模型及其編解碼方案具有更好的安全性和可靠性.
在非最優(yōu)條件下,例如第2種情況,Bob比Eve的信道噪聲小,但Bob邊信息的噪聲比Eve大時,速率和信源估計的最小均方誤差都減小且失真增大;情況3和情況4下,目標(biāo)值都相對減小,但情況4的目標(biāo)值最小,因此本文方案在情況4下性能最差.進一步分析可得邊信息的噪聲功率對有限碼率約束域的影響比信道噪聲的影響?。送猓谇闆r3下,即傳輸信道噪聲大但邊信息噪聲小時,模糊率最高可達0.1996 bit/source-bit.其它3種情況下的模糊率也比文獻[10]所提方案的模糊率0.1330 bit/source-bit要高,原因是利用雙分簇技術(shù)構(gòu)造的二維碼本進行編解碼時碼字具有更高的隱蔽性.
本文構(gòu)建了竊聽信道下具有邊信息和狀態(tài)信息的信源安全有損傳輸模型,根據(jù)該模型設(shè)計了基于雙分簇技術(shù)的編解碼機制,并推導(dǎo)出傳輸速率-失真-信息泄露率這三個有限碼率約束的下界.隨后考慮現(xiàn)實噪聲問題,分析了該模型下的高斯噪聲竊聽信道.仿真實驗結(jié)果表明當(dāng)合法信道比竊聽信道噪聲功率小且合法接收者比竊聽者的邊信息噪聲小時,傳輸速率-失真-信息泄露率之間的權(quán)衡最優(yōu),此時速率為0.7601 bit/source-bit,失真為0.0051 bit/source-bit,信息泄露率為0.1277 bit/source-bit.在非最優(yōu)條件下,當(dāng)傳輸信道噪聲大但邊信息噪聲小時所提方案可以達到更高的模糊率.