謝海情 ,宜新博 ,曾健平 ,曹武 ,謝進 ,凌佳琪
(1.長沙理工大學 物理與電子科學學院,湖南 長沙 410114;2.長沙理工大學 柔性電子材料基因工程湖南省重點實驗室,湖南 長沙 410114;3.湖南大學 物理與微電子科學學院,湖南 長沙 410082)
隨著半導體器件的飛速發(fā)展,摩爾定律已接近極限,研究人員積極尋求制造器件的新工藝、新材料、新結構[1-3].構建高精度器件模型是實現器件設計、優(yōu)化與應用的關鍵,以數學公式描述器件電氣行為的SPICE 模型因具有建模周期短、準確性高等特點而備受關注.根據器件某種特性的仿真、測量數據構建準確的特性函數對SPICE 模型的有效性、準確性起決定性作用.梁家鋮[4]通過將4H-SiC 材料參數及橫向溝道結型場效應晶體管結構與Shockley 模型結合,構建器件的SPICE 模型,該模型僅能反映器件特性曲線的趨勢,不能擬合特性細節(jié),準確性差,對物理理論知識要求高,且建模時間長.Zhang 等[5]首先構建了忽略溝道輸運的理想漏電流模型,再分別采用Drain-FET、Source-resistance 方法考慮溝道輸運,構建了隧穿場效應晶體管的SPICE 模型,此模型較好地模擬了器件的特性,但精度有限.鄧雯娟[6]將器件的特性曲線變換為多段近似線性曲線的組合,進而通過Origin 工具對曲線進行擬合,基于此構建SPICE 模型,該模型能較好地反映器件的特性趨勢,但擬合曲線的精度有限,且建模時間較長.Zheng等[7]用分段非線性函數對器件的特性曲線進行擬合,并解決了函數的收斂問題,該方法在曲線非線性程度較低的部分擬合效果較好,但在非線性程度較高的部分擬合效果差.針對以上問題,近年來,神經網絡作為一種新方法在器件建模領域被廣泛使用.相較于傳統方法,目前已有的基于神經網絡構建的SPICE 模型有效地提高了器件特性曲線的擬合精度,尤其是對復雜曲線的擬合能力大大增強,并且降低了建模的難度,縮短了建模時間,然而在非線性程度較高的曲線中仍存在擬合準確度不高的缺點[8-9],且往往缺少對擬合效果的評估[10-11].此外,現有的基于神經網絡的SPICE 模型構建方法大多針對場效應晶體管,特性曲線變化程度相對平緩[12-14].對雪崩光電二極管而言,由于其存在雪崩過程,雪崩前后電流數量級相差大,曲線變化劇烈[15],如不對數據進行預處理,神經網絡模型不能很好擬合其特性曲線,導致SPICE模型準確性差.
針對上述問題,本文提出了一種從仿真或測量數據預處理,到神經網絡搭建、優(yōu)化,再到SPICE 模型構建的方法.對數據進行預處理、優(yōu)化神經網絡結構以提升模型準確性.采用Verilog-A 硬件描述語言實現APD SPICE 模型構建,并在Cadence中驗證模型的有效性和準確性,引入相對誤差評估模型的準確度.
神經網絡算法能夠從模型的輸入中學習到數據特征與規(guī)律,并將其用于處理新的數據,因此數據決定了神經網絡模型性能的上限.本文使用Silvaco TCAD 工具對一種SOI 基LSAMBM APD(如圖1 所示[16])的I-V特性進行仿真計算,仿真數據作為神經網絡的訓練數據.
圖1 SOI基LSAMBM APD結構Fig.1 Structure of LSAMBM APD based on SOI film
為使數據更有利于神經網絡模型的訓練,本文采用對數化與歸一化兩種方法對數據進行預處理.對電流數據取對數[式(1)],放大了數據的變化,使神經網絡能更好地學習數據中的細節(jié)特征.式(1)中,I表示電流,I'表示對數化后的電流.圖2 反映了原始數據對數處理前后的變化,其中左軸為線性坐標軸,右軸為對數坐標軸.原始數據中電流的范圍為8.5×10-14~3.27×10-6A.數據量級過小,神經網絡訓練速度慢,且不利于損失函數評估訓練結果;量級跨度過大,數值較大的特征可能會完全支配其他特征,不利于神經網絡捕捉I-V特性中的細節(jié)信息.本文采用式(2)、式(3)分別對電壓、電流數據進行歸一化處理,式中,V表示電壓,V''表示歸一化處理后的電壓,I''表示歸一化處理后的電流,Vmean、I'mean、Vstd、I'std分別表示V與I'的平均值、標準差.圖3 為數據經歸一化處理后的曲線圖.由圖3 可知,經過兩種方法處理后,電壓的分布范圍為-1.73~1.67 V,電流的分布范圍為-0.70~2.30 A,從而可提高神經網絡對I-V特性細節(jié)的捕捉,縮短訓練時間,提升模型的準確度.
圖2 原數據與電流取對數后的I-V特性曲線Fig.2 I-V characteristic curve of the original data and the current after taking logarithm
圖3 歸一化后的I-V特性曲線Fig.3 I-V characteristic curve after normalization
本文采用PyTorch 機器學習庫,搭建包含輸入層、輸出層與2 個隱藏層的淺層神經網絡模型,其中輸入層、輸出層各有1 個神經元,每個隱藏層各包含10個神經元.為了避免梯度消失導致網絡收斂慢、不收斂,在隱藏層的每個神經元上均使用ReLU 函數[式(4)]作為激活函數.式中:x表示神經元的輸入值,在輸出層神經元上使用線性激活函數.該神經網絡的數學表達式見式(5).
在訓練時,初始學習率設置為0.1,并且每訓練 5 000 Epoch 便衰減為原來的99%.以隨機梯度下降法作為網絡優(yōu)化器,以均方誤差作為損失函數.使用預處理后的I-V特性數據訓練該網絡至500 000 Epoch,此時損失值已收斂,訓練用時約134 s,30 次訓練的最優(yōu)損失值為1.042 2×10-5,提取網絡的權重矩陣與偏置矩陣,代入式(5),得到經過數據預處理的LSAMBM APDI-V特性函數.
采用Verilog-A 硬件描述語言,在Cadence 軟件中構建LSAMBM APD 的SPICE 模型.在Cadence Verilog-A Editor 中定義管腳、節(jié)點、支路、常量、變量,進而將經過數據預處理后的I-V特性函數作為器件的行為描述.并且,采用式(2)對SPICE 模型的輸入數據進行預處理使其符合I-V函數的數據特征.采用式(6)對輸出數據做相應的反處理,使其符合APD SPICE 模型的實際輸出數據特征,式中:I''、I'''分別表示反處理前、后的電流.進一步建立LSAMBM APD的Symbol,完成基于神經網絡的SPICE模型構建.
在Cadence-Virtuoso Schematic Editing 中分別為基于2 層神經網絡的SPICE 模型、基于解析模型的SPICE 模型[7]搭建如圖4 所示的驗證電路,獲取I-V數據,與Silvaco TCAD 工具的仿真數據對比,并計算相對誤差,以此評估SPICE模型的性能.
圖4 SPICE模型驗證電路Fig.4 Verification circuit for SPICE models
圖5~圖8 為兩種SPICE 模型的驗證結果與TCAD 仿真結果的對比,圖5、圖7 左軸為線性軸,右軸為對數軸.由圖5、圖6 可以看出,基于解析模型的SPICE 模型在雪崩電壓附近與TCAD 仿真數據的相對誤差很大,最大相對誤差為82.553%,平均相對誤差為3.907%,不能精確地反映APD 的I-V特性.由圖7、圖8 可知,基于2 層神經網絡的SPICE 模型最大相對誤差為6.673%,平均相對誤差為1.361%,誤差相對較低,但在7 V以上的偏置電壓范圍內相對誤差仍然不佳,產生這種現象的原因是數據預處理后,I-V特性曲線的非線性程度較高,僅有2 個隱藏層的神經網絡包含的參數少,對非線性程度較高曲線的學習能力弱.因此,本文進一步優(yōu)化神經網絡結構,以提升模型的精準度.
圖5 基于解析模型的SPICE模型與TCAD仿真結果對比Fig.5 Comparison of simulation results of SPICE model based on analytical model and TCAD
圖6 基于解析模型的SPICE模型與TCAD仿真結果相對誤差Fig.6 Relative error of simulation results of SPICE model based on analytical model and TCAD
圖7 基于2層神經網絡的SPICE模型與TCAD仿真結果對比Fig.7 Comparison of simulation results of SPICE model based on 2-layer neural network and TCAD
圖8 基于2層神經網絡的SPICE模型與TCAD仿真結果相對誤差Fig.8 Relative error of simulation results of SPICE model based on 2-layer neural network and TCAD
可學習參數更多的神經網絡擁有更強的非線性函數擬合能力.由圖3 可知,經過預處理的APDI-V特性數據仍然具有較高的非線性程度.因此,本文通過提升神經網絡的深度以提升其可學習參數的數量,進而提高模型的精準度,尋求性能最佳的神經網絡結構.圖9 反映了2~17 層神經網絡各訓練30 次損失值分布.
由圖9可知,當隱藏層為2~13層時,各神經網絡模型訓練損失的最小值呈現下降趨勢,這種現象契合了前面提到的更深的網絡有更多可學習的參數,因此有更強的非線性函數擬合能力.但從14 層開始,隨著深度的增加,網絡的最佳性能反而下降,并且在訓練過程中,損失值過高,網絡不更新的概率隨著隱藏層數的上升而上升,17 層以上的神經網絡幾乎不可訓練.這是由于盡管在隱藏層神經元上使用ReLU 作為激活函數,以降低梯度消失出現的概率,但過深的全連接神經網絡在進行反向傳播時,更多層的梯度累乘更容易導致網絡陷入局部最優(yōu),同時訓練更多的參數需要消耗更多的時間.從圖9 可以看出,當隱藏層數為13 層時,神經網絡的性能最好,此時最優(yōu)的損失值為2.544×10-7,比2 層隱藏層神經網絡模型的最優(yōu)結果低2個數量級.
提取13 層神經網絡的權重和偏置參數,代入網絡的函數表達式,得到I-V特性函數.使用Verilog-A構建對應的SPICE 模型,并搭建驗證電路驗證模型的有效性和準確性,結果如圖10、圖11所示,圖10左軸為線性軸,右軸為對數軸.
由圖11 可知,基于13 層神經網絡的SPICE 模型進一步改善了擬合精度,在線性坐標和對數坐標下都能精確地擬合I-V特性數據,最大相對誤差僅為3.448%,平均相對誤差僅為0.630%,是基于2層神經網絡的SPICE 模型平均相對誤差的46.3%,是基于解析模型的SPICE 模型平均相對誤差的16.1%.在建模用時上,由于訓練參數更多的神經網絡、構建系數更多的數學表達式都需要更長時間,因此基于13 層神經網絡的SPICE 模型的建模時間較其他兩種模型更長,用時50 h.
本文通過對一種SOI 基橫向吸收區(qū)-多緩沖區(qū)-倍增區(qū)分離雪崩光電二極管進行TCAD仿真獲取I-V特性數據,并對數據進行對數化和歸一化預處理,構建、優(yōu)化神經網絡學習APD 的I-V特性函數,采用Verilog-A 硬件描述語言構建其SPICE 模型并進行了驗證.結果表明,設計與優(yōu)化的神經網絡可以準確地擬合TCAD 工具仿真得到的I-V數據,最大相對誤差僅為3.448%,平均相對誤差僅為0.630%,進而使得SPICE 模型能很好地反映APD 的I-V特性.相較于傳統的基于解析模型所構建的SPICE 模型,基于優(yōu)化后的神經網絡所構建的SPICE 模型準確性更高,且建模僅耗時50 h,可以有效提高器件SPICE 模型的構建效率,對新型光電器件的研發(fā)與應用具有重要推動作用.