張笑天, 汪鵬君,2, 張躍軍, 張會(huì)紅
( 1. 寧波大學(xué)電路與系統(tǒng)研究所,浙江 寧波 315211;2. 溫州大學(xué)電氣與電子工程學(xué)院,浙江 溫州 325035)
物聯(lián)網(wǎng)的不斷發(fā)展助推了便攜式設(shè)備數(shù)量呈現(xiàn)大規(guī)模增長(zhǎng)的趨勢(shì),片上系統(tǒng)(System on Chip,SoC)技術(shù)的進(jìn)步縮短了電子產(chǎn)品開發(fā)周期并使之在便攜式設(shè)備中得到了廣泛應(yīng)用。然而在用戶對(duì)便攜式設(shè)備需求增長(zhǎng)的同時(shí),信息安全問題也日益凸顯。攻擊者可通過逆向工程等攻擊方式竊取設(shè)備中的存儲(chǔ)數(shù)據(jù)[1],損害了用戶與設(shè)備廠商的利益。物理不可克隆函數(shù)(Physical Unclonable Function, PUF)電路利用集成電路制造工藝偏差產(chǎn)生數(shù)字密鑰,可有效降低侵入式攻擊風(fēng)險(xiǎn)[2]。但隨著人工智能技術(shù)的不斷發(fā)展,通過機(jī)器學(xué)習(xí)對(duì)PUF 進(jìn)行模型攻擊已成為可能,PUF 面臨新型安全問題[3]。此外,由于資源受限型系統(tǒng)中電路面積、電池能量等資源有限,新穎的輔助電路和加密技術(shù)無(wú)法有效使用,其安全強(qiáng)度受到限制,因此兼具低能耗與高安全性的PUF 電路設(shè)計(jì)已成為信息安全領(lǐng)域中的關(guān)鍵研究方向[4]。
文獻(xiàn)[5]提出了一種低能耗SRAM 型PUF 電路,具有良好的隨機(jī)性,但隨著溫度、電壓的變化,該P(yáng)UF 電路的穩(wěn)定性下降。文獻(xiàn)[6]提出了一種亞閾值電流型PUF 電路,具有較低能耗,但其穩(wěn)定性對(duì)溫度變化敏感。文獻(xiàn)[7]提出了一種亞閾值電流型PUF 電路,能有效抵御機(jī)器學(xué)習(xí)攻擊且具有較高穩(wěn)定性,但是電路面積過大,能耗開銷很大。文獻(xiàn)[8]提出了一種亞閾值延遲型PUF 電路,利用差分對(duì)稱設(shè)計(jì),提高輸出穩(wěn)定性,雖然通過降低電壓減少了能耗,但顯著增加了電路延時(shí),并且仍然面臨被模型攻擊的風(fēng)險(xiǎn)。因此,傳統(tǒng)的低功耗PUF 電路已難以進(jìn)一步提升安全性。
采用亞閾值邏輯是常規(guī)低功耗設(shè)計(jì)方式之一,已有廣泛應(yīng)用。亞閾值特性也可用于提高PUF 電路輸出函數(shù)復(fù)雜度。為進(jìn)一步提高低能耗PUF 電路安全性,本文提出了一種基于動(dòng)態(tài)亞閾值的延遲型(Dynamic Subthreshold Delayed, DSD)PUF 電路設(shè)計(jì)方案,并采用TSMC 65nm CMOS 工藝進(jìn)行驗(yàn)證。該方案將電荷分享效應(yīng)與動(dòng)態(tài)亞閾值邏輯相結(jié)合,能有效降低電路能耗并具有良好的抵御模型攻擊特性。
仲裁器PUF(Arbiter PUF, APUF)[9]原理如圖1所示。信號(hào)傳輸電路上下對(duì)稱,C1、C2、···、Cn信號(hào)決定E1和E2傳播至仲裁器的路徑選擇情況。因工藝偏差,E1與E2的傳播路徑延時(shí)不相等,它們將在不同時(shí)間點(diǎn)到達(dá)仲裁器。仲裁器根據(jù)這種延遲差輸出具有隨機(jī)性的PUF 響應(yīng),其電路輸出模型函數(shù)如式(1)所示。由于激勵(lì)會(huì)改變信號(hào)傳輸方向,因此w(n)需乘以系數(shù) φ (j)。 φ (j)的計(jì)算式如式(2)所示。
圖 1 仲裁器PUF 結(jié)構(gòu)Fig. 1 Architecture of the arbiter PUF
式(1)和式(2)中:r為輸出結(jié)果;w(n)對(duì)應(yīng)各子路徑延遲差;sgn 定義為正值取1、負(fù)值取0 的函數(shù);j的取值為1~n;C1~Cn為對(duì)應(yīng)激勵(lì)信號(hào),其取值均為0 或1。式(1)和式(2)體現(xiàn)了APUF 輸出模型函數(shù)是一種線性疊加函數(shù),攻擊者可對(duì)APUF 進(jìn)行建模并預(yù)測(cè)輸出結(jié)果[10]。
為減少電路功耗,降低電路工作電壓是一種常用方式,但降低電壓也會(huì)帶來(lái)一系列問題。如圖2(a)所示的靜態(tài)CMOS 與非門(NAND gate),相同條件下NMOS 漏源電流比PMOS 大,即使輸入信號(hào)A、B全為低電平,NMOS 亞閾值漏電流也不可忽略。隨著電壓下降,動(dòng)態(tài)功耗呈平方關(guān)系下降,亞閾值漏電功耗卻以指數(shù)形式增長(zhǎng)。當(dāng)電壓下降到一定程度時(shí),靜態(tài)漏電流功耗成為主要功耗,因此降低功耗就必須抑制其漏電流??紤]如圖2(b)所示的動(dòng)態(tài)與非門,當(dāng)時(shí)鐘信號(hào)CLK為低電平時(shí),電路為預(yù)充電狀態(tài),通過負(fù)載電容CL,Y被充電至高電平。當(dāng)CLK為高電平時(shí),電路進(jìn)入求值狀態(tài)。A和B只要任一個(gè)為高電平,Y將被放電至低電平,完成與非邏輯運(yùn)算。該電路在求值過程并不需要PMOS, 與靜態(tài)CMOS 相比,相當(dāng)于可減少兩個(gè)串聯(lián)大尺寸PMOS。此外,若輸入邏輯數(shù)量為N,則靜態(tài)CMOS 邏輯晶體管數(shù)量為2N,而動(dòng)態(tài)邏輯晶體管數(shù)量為N+2。在多輸入邏輯下,動(dòng)態(tài)邏輯能夠節(jié)省更多面積,但其缺點(diǎn)是有電荷泄漏以及電荷分享效應(yīng)。電荷分享效應(yīng)是指當(dāng)圖2(b)中A、B邏輯僅有一個(gè)為高電平時(shí),下拉堆疊網(wǎng)絡(luò)關(guān)閉,但是高電平所控制的晶體管仍具有寄生電容,同樣具有儲(chǔ)存電荷能力,Y將發(fā)生電平偏移。假設(shè)VX、VY分別表示X、Y的電壓值,初始值分別為0、VDD(電源電壓),VTn為晶體管閾值電壓,并以ΔVY表示Y的電壓偏移量。此時(shí)分兩種情況:(1) ΔVY<VTn,VX終值等于VDD-VTnVX。由電荷守恒定理可得式(3)和式(4),其中VYfinal代表VY終值,Cα為晶體管N1 的寄生電容值;(2) ΔVY>VTn,VY與VX處于相同值,可得式(5)。兩種情況邊界條件可由式(6)確定,當(dāng)電容之比小于該值,情況(1)成立,否則情況(2)成立。應(yīng)當(dāng)控制ΔVY在合理范圍,否則電路會(huì)發(fā)生邏輯錯(cuò)誤。
圖2 靜態(tài)與非門和動(dòng)態(tài)與非門Fig. 2 Static and dynamic NAND gate
混合延遲單元電路采用動(dòng)態(tài)亞閾值邏輯,其結(jié)構(gòu)如圖3 所示。電路由晶體管N1~N4、P1~P3 以及反相器I1、I2 構(gòu)成。時(shí)鐘信號(hào)CLK控制電路預(yù)充電、求值狀態(tài),當(dāng)CLK為低電平時(shí),P1、N2、P3 開啟,X與Out 被預(yù)充電至高電平,而Y被放電至低電平,預(yù)充電階段結(jié)束。當(dāng)CLK跳變至高電平時(shí),電路進(jìn)入求值狀態(tài),由于下拉網(wǎng)絡(luò)開啟,X與Out 將被放電。晶體管P2 漏源電流受X電位影響,隨著X電位下降,P2 晶體管漏源電流逐漸增大。因此Y在電路計(jì)算過程中處于動(dòng)態(tài)變化狀態(tài),稱為亞閾值壓控結(jié)點(diǎn),N4 晶體管漏源電流也隨之變化。由于N4 在時(shí)鐘剛反轉(zhuǎn)時(shí)漏源電流較低,為避免電路噪聲影響,需要經(jīng)緩沖器延時(shí)開啟,而P3 開啟時(shí)間與P1 相同,則下拉網(wǎng)絡(luò)具有較好的穩(wěn)定性。由于反相器I1、I2 的固有延遲,Y電位上升速度比X放電速度慢,在此期間,N4 柵極電位處于變化狀態(tài)。電荷分享陣列由5 個(gè)并聯(lián)NMOS 晶體管組成,受激勵(lì)信號(hào)C[4:0]控制,每個(gè)晶體管開啟都將產(chǎn)生電荷分享效應(yīng)并引起輸出Out 電壓偏移。因此,盡管整體下拉網(wǎng)絡(luò)處于關(guān)閉狀態(tài)(由于緩沖器的延時(shí),晶體管N3 不會(huì)立即開啟),每增加一個(gè)開啟的電荷分享晶體管,Out 都將發(fā)生電壓偏移。激勵(lì)信號(hào)控制并聯(lián)晶體管開啟數(shù)量,并產(chǎn)生不同電壓偏移量從而使輸出節(jié)點(diǎn)電壓改變。當(dāng)CLK經(jīng)過緩沖器到達(dá)N3 晶體管時(shí),Out 開始放電,其初始電壓(即下拉網(wǎng)絡(luò)對(duì)應(yīng)的零輸入響應(yīng)初始值)為改變后的值。因此不同激勵(lì)信號(hào)對(duì)應(yīng)不同的輸出函數(shù)。
圖3 混合延遲單元電路Fig. 3 Hybrid delayed cell circuit
為對(duì)混合延遲單元輸出進(jìn)行判決,設(shè)計(jì)了動(dòng)態(tài)判決器如圖4 所示。在電路輸入級(jí)采用P 型動(dòng)態(tài)反相器設(shè)計(jì),晶體管N1、N2、P1、P4 受反相時(shí)鐘信號(hào)控制,A、B信號(hào)作為上拉網(wǎng)絡(luò)輸入信號(hào),堆疊NMOS 晶體管有利于平衡PMOS 與NMOS 驅(qū)動(dòng)能力。電路主體為兩個(gè)對(duì)稱耦合與非門,初始狀態(tài)為高電平時(shí),N1、N2 開啟,將X1、X2下拉至低電平,因此與非門輸出停留在高電平。A、B以不一樣的速度降低至低電平時(shí),X1、X2到達(dá)對(duì)稱與非門輸入端時(shí)間點(diǎn)也不一樣,若A下拉速度較快,則M1將被封鎖在低電平,此時(shí)晶體管N7 被M1封鎖,M2通過P6 補(bǔ)充電荷維持在高電平,反之則M1輸出高電平,M2輸出低電平。為減少負(fù)載效應(yīng)影響,輸出級(jí)采用一級(jí)靜態(tài)反相器緩沖,并增加N11 與N12 兩個(gè)休眠晶體管以減少亞閾值靜態(tài)漏電功耗,僅在CLK為高電平時(shí),輸出級(jí)下拉網(wǎng)絡(luò)開啟,最終Y1與Y2形成互斥輸出,作為判別A、B信號(hào)速度快慢的標(biāo)志。
圖4 動(dòng)態(tài)亞閾值判決器Fig. 4 Dynamic subthreshold arbiter
1 位DSD PUF 單元結(jié)構(gòu)如圖5 所示,兩個(gè)混合延遲單元D1、D2 具有相同激勵(lì)C[4:0]與時(shí)鐘CLK輸入。D1、D2 的輸出信號(hào)通過判決器產(chǎn)生1 位PUF 輸出信號(hào)。在實(shí)際應(yīng)用中,密鑰通常具有多位,因此構(gòu)造8×128 位PUF 單元陣列,從128 位PUF 陣列中分別選出1 位形成8 位并行密鑰輸出,并擴(kuò)展激勵(lì)信號(hào)至13 位,構(gòu)成地址與路徑選擇信號(hào),其結(jié)構(gòu)框圖如圖6 所示。最終可在CLK控制下,產(chǎn)生8 位并行數(shù)字密鑰。
圖5 1 位DSD PUF 單元框圖Fig. 5 1-bit DSD PUF cell block diagram
圖6 N 位DSD PUF 電路框圖Fig. 6 N-bit DSD PUF circuit block diagram
在TSMC 65 nm 工藝下,使用HSPICE 工具進(jìn)行驗(yàn)證。電源電壓為0.4 V 時(shí),電路輸出時(shí)序圖如圖7所示(13 位激勵(lì)信號(hào)Cx已省略)。當(dāng)時(shí)鐘跳變至高電平,電路開始產(chǎn)生密鑰Key,在12 次不同Cx下,每個(gè)時(shí)鐘周期內(nèi)Key都呈現(xiàn)不同的0、1 分布,具有隨機(jī)性。通過蒙特卡洛仿真分析并對(duì)其平均能耗進(jìn)行統(tǒng)計(jì),結(jié)果如圖8 所示,DSD PUF 平均能耗為0.238 pJ/bit,最大能耗為0.305 pJ/bit,具有低能耗特點(diǎn)。
圖7 密鑰提取時(shí)序圖Fig. 7 Timing diagram of key extraction
圖8 能耗分布Fig. 8 Energy consumption distribution
PUF 的隨機(jī)性以信息熵Entropy 表示,其表達(dá)式如式(7)所示:
其中,p(r)表示邏輯r的出現(xiàn)概率。對(duì)密鑰輸出進(jìn)行2 048 次蒙特卡羅仿真分析,仿真結(jié)果如圖9 所示。高電平輸出個(gè)數(shù)為1 001,低電平輸出個(gè)數(shù)為999。由公式可得信息熵為0.999 999 279。其漢明距離分布如圖10 所示,片內(nèi)、片間漢明距離分別滿足μ=0.002 5、σ=0.004 3 與μ=0.497、σ=0.093 的正態(tài)分布,其中μ表示數(shù)學(xué)期望,σ表示方差。
圖9 2 000 次蒙特卡洛仿真結(jié)果Fig. 9 2 000 times Monte Carlo simulation results
圖10 DSD PUF 漢明距離分布Fig. 10 Hamming distance distribution of DSD PUF
在動(dòng)態(tài)亞閾值邏輯下,DSD PUF 延遲時(shí)間tdelay_sub滿足式(8)所示指數(shù)特性:
其中:K為線性系數(shù);CG為負(fù)載電容;Vth為晶體管閾值電壓;I0為由工藝決定的方塊漏極電流;νt為熱電壓;Won與Lon分別表示充放電過程中等效晶體管的寬與長(zhǎng);n為經(jīng)驗(yàn)參數(shù)。傳統(tǒng)模型攻擊方式通過搜集一定數(shù)量激勵(lì)響應(yīng)對(duì)(Challenge Response Pair,CRP)代入輸出模型公式,計(jì)算相關(guān)系數(shù)并建立對(duì)應(yīng)數(shù)學(xué)模型從而預(yù)測(cè)剩余密鑰。對(duì)于DSD PUF,當(dāng)激勵(lì)不同時(shí),下拉網(wǎng)絡(luò)的零輸入響應(yīng)函數(shù)是不一樣的。以f(σ1)、f(σ2)分別表示工藝偏差系數(shù)σ1、σ2對(duì)延時(shí)函數(shù)指數(shù)部分的影響,即使對(duì)于具有相同0、1 數(shù)量分布的不同激勵(lì)輸入,器件參數(shù)偏差也使得指數(shù)部分的參數(shù)存在差異,該延遲差函數(shù)可簡(jiǎn)化為:
其中:k1、k2為與工藝相關(guān)的線性系數(shù); φ (m) 為電路固有延遲。 對(duì)DSD PUF 使用人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)算法進(jìn)行抗攻擊驗(yàn)證時(shí),其效果如圖11 所示??梢钥闯觯珹PUF 在訓(xùn)練組數(shù)量為500 時(shí),預(yù)測(cè)錯(cuò)誤率便已明顯減少。DSD PUF 在訓(xùn)練組數(shù)量達(dá)5 000 時(shí),預(yù)測(cè)錯(cuò)誤率仍接近理想狀態(tài)50%。因此DSD PUF 能夠有效抵御這類模型攻擊。
圖11 ANN 算法預(yù)測(cè)錯(cuò)誤率Fig. 11 Prediction error rate by ANN algorithm
在亞閾值區(qū),溫度對(duì)電路性能影響很大,因此對(duì)DSD PUF 在不同溫度下進(jìn)行蒙特卡洛仿真驗(yàn)證。晶體管閾值電壓與溫度負(fù)相關(guān),當(dāng)溫度升高時(shí),電路中各晶體管漏源電流明顯增加,因此整體速度性能提高。如圖12(a)所示,125 °C 工作溫度下,電路速度性能提高并且高電平個(gè)數(shù)為1 000,低電平個(gè)數(shù)為1 000,隨機(jī)性接近理想狀態(tài)。如圖12(b)所示,當(dāng)工作溫度降低至-25 °C 時(shí),電路性能明顯下降,高電平個(gè)數(shù)為1 014,低電平個(gè)數(shù)為986,電路隨機(jī)性變差。這是由于低溫引起亞閾值電流大幅降低,電路延時(shí)明顯增加并且易受噪聲干擾而產(chǎn)生錯(cuò)誤。對(duì)不同工作電壓以及溫度下DSD PUF 的誤碼率(Bit Error Rate, BER)進(jìn)行統(tǒng)計(jì),結(jié)果如圖13 所示。盡管高溫使得電路具有更高的隨機(jī)性,但對(duì)電路穩(wěn)定性產(chǎn)生影響。對(duì)實(shí)驗(yàn)結(jié)果分析,DSD PUF 最優(yōu)工作電壓為0.4 V,此時(shí)誤碼率能夠達(dá)到0.4%,而在最壞情況下誤碼率為2.19%。與其他相關(guān)文獻(xiàn)的對(duì)比結(jié)果如表1所示??梢钥闯鯠SD PUF 輸出信息熵為0.999 999 279,僅次于文獻(xiàn)[13],具有良好隨機(jī)性;能耗為0.238 pJ/bit,與同類最優(yōu)電路相比降低了20.67%。
表1 電路性能比較結(jié)果Table 1 Circuit performance comparison results
圖12 極端溫度下的蒙特卡洛仿真情況Fig. 12 Monte Carlo simulation in worst temperature condition
圖13 不同溫度、電壓下的誤碼率Fig. 13 BER against temperature and voltage variations
本文通過對(duì)PUF 電路的研究,結(jié)合動(dòng)態(tài)亞閾值特性,提出了一種基于動(dòng)態(tài)亞閾值邏輯的延遲型PUF 電路。該電路主要優(yōu)點(diǎn)為在動(dòng)態(tài)亞閾值邏輯中,利用電荷分享效應(yīng)改變不同激勵(lì)信號(hào)下的電路輸出函數(shù)。采用TSMC 65nm 工藝設(shè)計(jì)電路并通過HSPICE 驗(yàn)證。結(jié)果表明,DSD PUF 電路具有良好唯一性和隨機(jī)性,其平均能耗為0.238 pJ/bit,與同類最優(yōu)電路相比降低了20.67%,并能有效抵御模型攻擊。