許麗丹, 劉嘉勇, 何 祥
(1.四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院, 成都 610065; 2.四川大學(xué)電子信息學(xué)院, 成都 610065)
命名實(shí)體識(shí)別是自然語(yǔ)言處理領(lǐng)域中一項(xiàng)重要任務(wù),經(jīng)過(guò)幾十年的研究發(fā)展已取得了顯著成果[1-5].但是目前已有的研究較少關(guān)注命名實(shí)體識(shí)別數(shù)據(jù)集數(shù)據(jù)類別標(biāo)記不平衡這類數(shù)據(jù)分布問(wèn)題[6].數(shù)據(jù)類別標(biāo)記不平衡[7]是指一個(gè)類別的數(shù)據(jù)量與屬于另一類別的數(shù)據(jù)量差距較大,且小樣本量類呈現(xiàn)出的信息更具價(jià)值.數(shù)據(jù)類別標(biāo)記不平衡會(huì)影響統(tǒng)計(jì)學(xué)習(xí)模型的效果,導(dǎo)致模型更關(guān)注多數(shù)類別數(shù)據(jù),忽略少數(shù)類別數(shù)據(jù)[7-16].在分類問(wèn)題中解決數(shù)據(jù)類別標(biāo)記不平衡的方法主要有以下三類: (1) 采樣方法,包括欠采樣和過(guò)采樣方法[7];(2) 改進(jìn)統(tǒng)計(jì)學(xué)習(xí)算法,包括one-class學(xué)習(xí)方法[8],修改算法的代價(jià)[9]以及集成學(xué)習(xí)[10];(3) 特征選擇,通過(guò)收集最佳特征子集[11]以實(shí)現(xiàn)最佳性能.
針對(duì)序列數(shù)據(jù),Tomanek等人通過(guò)主動(dòng)學(xué)習(xí),在數(shù)據(jù)標(biāo)記階段盡可能平衡地標(biāo)記數(shù)據(jù)[12].Douzas等人使用條件對(duì)抗生成模型為少數(shù)類別數(shù)據(jù)生成更多數(shù)據(jù)以緩解數(shù)據(jù)失衡[13],但這種方法模型復(fù)雜、計(jì)算代價(jià)大.Gliozzo假設(shè)頻繁出現(xiàn)的單詞一般不提供文本具體信息,也不會(huì)是實(shí)體.可以過(guò)濾掉這些詞以減小非實(shí)體類單詞與實(shí)體類單詞比值[14].Maragoudakis等人使用Tomek連接法在訓(xùn)練階段減少訓(xùn)練集中不必要的負(fù)面樣本[15].Akkasi等人[6]提出了平衡欠采樣方法,該方法保留句子邏輯短語(yǔ)結(jié)構(gòu)以及句子間相關(guān)性,并在四個(gè)生物醫(yī)學(xué)數(shù)據(jù)集上分別實(shí)驗(yàn)比較隨機(jī)欠采樣、SWF[14]和平衡欠采樣三種欠采樣方法的效果并證明了調(diào)節(jié)數(shù)據(jù)集中實(shí)體類單詞和實(shí)體類單詞比例可以改善模型效果.然而這種方法直接剔除數(shù)據(jù)集中非實(shí)體單詞或語(yǔ)句,可能破壞文本的短語(yǔ)結(jié)構(gòu),丟失有價(jià)值的數(shù)據(jù).
針對(duì)已有方法可能造成的信息丟失問(wèn)題,本文通過(guò)改造遺傳算法[17]用于序列文本合成,提出了一種基于遺傳算法的數(shù)據(jù)類別標(biāo)記平衡方法,本文簡(jiǎn)稱CBM-GA(class balance method based on genetic algorithm).該方法保留所有原始語(yǔ)料,利用遺傳算法基因重組、繁衍行為特點(diǎn),充分挖掘類別平衡文本特征,盡可能維持語(yǔ)句中實(shí)體短語(yǔ)結(jié)構(gòu)的同時(shí),合成新文本以擴(kuò)充原始數(shù)據(jù)集.實(shí)驗(yàn)表明,本文提出的方法有效緩解數(shù)據(jù)集類別標(biāo)記不平衡問(wèn)題,提高命名實(shí)體識(shí)別任務(wù)性能.
本文提出的數(shù)據(jù)類別平衡方法CBM-GA框架如圖1所示,首先對(duì)原始數(shù)據(jù)集進(jìn)行篩選,獲得合適的父代樣本集,通過(guò)適應(yīng)度函數(shù)評(píng)估樣本并按照其適應(yīng)度函數(shù)值排序獲得有序父代樣本集.從有序父代樣本集中隨機(jī)選擇樣本形成父代樣本對(duì),經(jīng)過(guò)交叉和變異操作生成新樣本,再次使用適應(yīng)度函數(shù)評(píng)估新樣本,抽取適應(yīng)度函數(shù)值高的新樣本集合更新下一輪文本合成操作所需的父代樣本集,如此循環(huán)N次.最后將第N輪生成新樣本數(shù)據(jù)集和原始數(shù)據(jù)集合并產(chǎn)生擴(kuò)充數(shù)據(jù)集,用于命名實(shí)體識(shí)別.
圖1 CBM-GA框架圖Fig.1 Method framework
2.2.1 數(shù)據(jù)篩選 現(xiàn)有用于命名實(shí)體識(shí)別研究的公開(kāi)數(shù)據(jù)集中實(shí)體單詞個(gè)數(shù)遠(yuǎn)小于非實(shí)體單詞個(gè)數(shù),且包含大量無(wú)實(shí)體單詞、類別嚴(yán)重失衡的語(yǔ)句[6].直接使用這樣的數(shù)據(jù)集進(jìn)行文本合成會(huì)增加后續(xù)操作代價(jià),降低文本合成效果.因此需要進(jìn)行文本篩選,初步獲取類別分布相對(duì)平衡的文本集合作為父代樣本集.
如何評(píng)估文本類別標(biāo)記平衡的程度是首先需要解決的問(wèn)題,Akkasi等人[6]用非實(shí)體單詞個(gè)數(shù)和實(shí)體單詞個(gè)數(shù)比值來(lái)評(píng)估文本類別標(biāo)記平衡性,如式(1)所示.
(1)
式(1)中,WO表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù);分母WE表示語(yǔ)句實(shí)體單詞個(gè)數(shù).本文將R值作為文本平衡性的衡量指標(biāo),R值越大文本類別越不平衡.
統(tǒng)計(jì)分析常用數(shù)據(jù)集CoNLL2003[18]、JNLPBA[19]中語(yǔ)句的非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)比值R和語(yǔ)句單詞總數(shù)的關(guān)系,我們可以得出以下結(jié)論:文本單詞個(gè)數(shù)越多,R值越大,文本類別越不平衡,兩者近似反比例關(guān)系,如圖2所示.
圖2 兩個(gè)常用數(shù)據(jù)集文本R值與文本單詞個(gè)數(shù)關(guān)系圖
Fig.2 Relationship between the textRvalue of two common datasets and the number of text words
圖2中橫軸表示語(yǔ)句的單詞總數(shù),縱軸表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)的比值.實(shí)線、虛線分別表示JNLPBA、CoNLL2003數(shù)據(jù)集的文本R值與文本長(zhǎng)度的關(guān)系,二者整體呈上升趨勢(shì).當(dāng)文本單詞個(gè)數(shù)超過(guò)60,文本的R值波動(dòng)幅度變大;當(dāng)文本單詞個(gè)數(shù)超過(guò)100,JNLPBA數(shù)據(jù)集的R值均處于劇烈波動(dòng)狀態(tài),CoNLL2003數(shù)據(jù)集R值快速增長(zhǎng),表明此時(shí)文本類別較不平衡,使用這樣的數(shù)據(jù)進(jìn)行后續(xù)操作將不利于合成類別均衡的新文本.
因此,為了減少后續(xù)文本合成操作的計(jì)算代價(jià),提高合成效率,數(shù)據(jù)篩選過(guò)程中需要剔除類別嚴(yán)重失衡的數(shù)據(jù).結(jié)合上述分析,數(shù)據(jù)篩選具體流程如下.
(1) 計(jì)算每個(gè)語(yǔ)句中實(shí)體單詞個(gè)數(shù),剔除不含實(shí)體單詞的語(yǔ)句;
(2) 剔除單詞個(gè)數(shù)超過(guò)100的語(yǔ)句.
2.2.2 適應(yīng)度評(píng)估 適應(yīng)度函數(shù),在遺傳算法中用以評(píng)估給定解決方案與所需問(wèn)題最佳解決方案的接近程度[17].CBM-GA方法使用適應(yīng)度函數(shù)作為評(píng)估指標(biāo)以評(píng)估樣本的平衡性,并將類別標(biāo)記平衡條件引入適應(yīng)度函數(shù)中,使得算法尋優(yōu)過(guò)程中嘗試構(gòu)造類別分布平衡的新樣本.定義適應(yīng)度函數(shù)f如式(2)所示.
f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)
(2)
式(2)中,R為式(1)定義的語(yǔ)句非實(shí)體單詞和實(shí)體單詞的比值;Rs是合成文本R值上限值;Rr是合成文本R值下限值;λ是Rr權(quán)重系數(shù).式(2)借助sigmoid函數(shù)控制合成樣本的R值在[Rr,Rs]范圍內(nèi).
由圖2分析可知文本單詞個(gè)數(shù)不應(yīng)過(guò)長(zhǎng),因此向適應(yīng)度函數(shù)中添加單詞個(gè)數(shù)小于100的限制,如式(3)所示.
(3)
式(3)中,L表示語(yǔ)句單詞個(gè)數(shù)限制函數(shù);l表示當(dāng)前樣本單詞個(gè)數(shù).relu函數(shù)限制合成文本的長(zhǎng)度.適應(yīng)度函數(shù)引入單詞個(gè)數(shù)限制,如式(4)所示.
f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)+
(4)
式(4)中,μ是L的權(quán)重系數(shù),用以控制類別平衡條件和單詞個(gè)數(shù)限制的重要性差異.
2.2.3 文本合成 CBM-GA方法文本合成過(guò)程主要是通過(guò)一系列選擇、交叉和變異操作合成數(shù)據(jù)標(biāo)記平衡的數(shù)據(jù).其中,選擇操作從有序父代樣本集合中抽取父代樣本構(gòu)建父代樣本對(duì)集合;交叉操作將父代樣本對(duì)進(jìn)行組合以生成新樣本;變異操作調(diào)整新樣本的單詞順序,向樣本中添加更多隨機(jī)性.
CBM-GA方法將文本視為染色體,將單詞及其實(shí)體標(biāo)記類型視為染色體上的基因.如圖3所示.每個(gè)框內(nèi)上行表示單詞,下行表示對(duì)應(yīng)實(shí)體類型標(biāo)記[17],二者共同構(gòu)成一個(gè)完整的基因.基因構(gòu)成染色體,又稱之為樣本.將數(shù)據(jù)集中每個(gè)文本視為樣本,數(shù)據(jù)集視為樣本群體.
為了便于后續(xù)分析,定義樣本染色體x=(x1,x2,…,xn),其中,xi是包含單詞及其對(duì)應(yīng)實(shí)體類型標(biāo)記的基因,n是染色體長(zhǎng)度.
1) 選擇操作
在選擇步驟中,遍歷有序父代樣本集并按照比例選擇方法[20]隨機(jī)選擇兩個(gè)父代樣本構(gòu)成父代樣本對(duì),從而構(gòu)成父代樣本對(duì)集合.
圖3 染色體示意圖
Fig.3 Chromosome schematic diagram
圖4 交叉過(guò)程示意圖Fig.4 Crossover schematic diagram
2) 交叉操作
在交叉階段,對(duì)父代樣本對(duì)集合中每個(gè)父代樣本對(duì)采用隨機(jī)交叉策略進(jìn)行單詞序列相互交換,以產(chǎn)生新樣本,如圖4所示.
為避免實(shí)體短語(yǔ)被切分而導(dǎo)致命名實(shí)體模糊、歧義等問(wèn)題,CBM-GA方法修改基因組合規(guī)則,限制單詞交換位置僅為開(kāi)始,結(jié)尾以及O標(biāo)記[18]的非實(shí)體單詞位置以確保實(shí)體單詞結(jié)構(gòu)完整交換.因此首先根據(jù)父樣本1的實(shí)體標(biāo)記類型,構(gòu)建交換位置集合l.并隨機(jī)從l中抽取交叉發(fā)生的開(kāi)始、結(jié)束位置以得到單詞序列如圖中黑色框單詞序列,將其與父樣本2合并生成新樣本x′.
x′=x1[lstart:lend]+x2
(6)
式(6)中,x1表示父樣本1;x2表示父樣本2;lstart、lend分別表示從交換位置集合l隨機(jī)抽取的開(kāi)始、結(jié)束位置;x′表示新樣本.
3) 變異操作
本文采用隨機(jī)交換單詞位置的方式實(shí)現(xiàn)變異.具體操作為:設(shè)定一個(gè)變異概率α,對(duì)交叉得到的新樣本x′,隨機(jī)產(chǎn)生一個(gè)[0,1]區(qū)間上的隨機(jī)數(shù)r,如果r<α,則隨機(jī)交換新樣本x′兩個(gè)單詞的位置.最終生成樣本如式(7)所示.
(7)
式(7)表明當(dāng)r<α?xí)r,隨機(jī)選定兩個(gè)單詞位置i、k,交換x′中兩個(gè)位置的單詞從而實(shí)現(xiàn)變異操作,反之則不進(jìn)行變異.
綜上分析,CBM-GA方法完整表述如算法1.
算法1 CBM-GA方法
輸入原始訓(xùn)練樣本集合S;參數(shù)Rs、Rr、λ、μ、循環(huán)次數(shù)N、變異概率α、合成樣本集合大小La
輸出擴(kuò)展的新樣本集合A
Begin
初始化迭代次數(shù)n:n=0
(1) 遍歷原始訓(xùn)練樣本S,過(guò)濾不含實(shí)體單詞及文本單詞個(gè)數(shù)超過(guò)100的語(yǔ)句,獲得父代樣本集D;
(2) 遍歷父代樣本集D,根據(jù)式(4)計(jì)算每個(gè)語(yǔ)句的適應(yīng)值并排序,得到有序父代樣本集D1;
(3) 使用比例選擇法隨機(jī)從D1中抽取兩個(gè)父代樣本組成的父代樣本對(duì)集合;
(4) 遍歷父代樣本對(duì)集合:
(a) 針對(duì)父代樣本對(duì)(p1,p2),分別從p1、p2樣本的開(kāi)始、結(jié)尾及非實(shí)體單詞的位置集合中隨機(jī)選擇位置變量以截取單詞序列;
(b) 將單詞序列合并成新樣本T;
(c) 以概率α交換T中任意兩個(gè)位置的單詞,并將T加入新樣本集合G;
(5) 遍歷G,根據(jù)式(4)計(jì)算每個(gè)新語(yǔ)句的適應(yīng)值.抽取適應(yīng)值最高的La個(gè)樣本的集合替換D1、G,迭代次數(shù)n加1;
(6) 如果n End 為了驗(yàn)證CBM-GA方法的有效性,排除單一數(shù)據(jù)集影響,實(shí)驗(yàn)采用命名實(shí)體識(shí)別研究中常用數(shù)據(jù)集CoNLL2003[18]和JNLPBA[19]進(jìn)行實(shí)驗(yàn).數(shù)據(jù)集基本統(tǒng)計(jì)信息如表1所示. 表1 數(shù)據(jù)集統(tǒng)計(jì)信息表 如表1所示, CoNLL 2003已分配好訓(xùn)練集、驗(yàn)證集和測(cè)試集;JNLPBA僅劃分了訓(xùn)練集和測(cè)試集.本文從JNLPBA中隨機(jī)抽取1/3數(shù)據(jù)作為驗(yàn)證集. 本文實(shí)驗(yàn)平臺(tái)為ubuntu16.04系統(tǒng)服務(wù)器,GPU為GeForce GTX 1070,顯存8 G.實(shí)驗(yàn)?zāi)P褪褂胻ensorflow框架構(gòu)建. Akkasi等人提出平衡欠采樣方法以緩解數(shù)據(jù)集的類別失衡問(wèn)題,從而改善命名實(shí)體識(shí)別的效果,其借助命名實(shí)體識(shí)別評(píng)價(jià)指標(biāo)作為最終的方法有效性衡量指標(biāo)[6].本文沿用該評(píng)價(jià)指標(biāo)來(lái)論證CBM-GA方法的有效性.命名實(shí)體識(shí)別一般采用精準(zhǔn)率(prec)、召回率(recall)和F1值作為模型性能評(píng)估指標(biāo)[1-5].本文使用的模型評(píng)價(jià)指標(biāo)定義如下. (8) (9) (10) 根據(jù)2.2節(jié)定義,CBM-GA方法實(shí)現(xiàn)過(guò)程涉及參數(shù):合成樣本R值上限Rs,合成樣本R值下限Rr,Rr值權(quán)重λ,L的權(quán)重系數(shù)μ,合成樣本集合大小La,變異概率α以及循環(huán)次數(shù)N. 根據(jù)Whitley等人的經(jīng)驗(yàn)[17],本文實(shí)驗(yàn)將α設(shè)為0.01.為給其它參數(shù)設(shè)置合理的取值,實(shí)驗(yàn)基于Bi-LSTM-CRF模型[2]使用貝葉斯優(yōu)化[16]尋優(yōu)方法來(lái)設(shè)置參數(shù).具體操作如下. 1) 分別以1為步長(zhǎng),設(shè)置Rs,Rr的取值范圍為[0,30];以500為步長(zhǎng),設(shè)置La的取值范圍為[500,2000];以0.1為步長(zhǎng),設(shè)置λ取值范圍為[0,1];以1為步長(zhǎng),設(shè)置循環(huán)次數(shù)N取值范圍為[1,10],構(gòu)建參數(shù)集合; 2) 基于Bi-LSTM-CRF模型使用貝葉斯優(yōu)化尋優(yōu)方法以F1值為指標(biāo),對(duì)參數(shù)集合進(jìn)行尋優(yōu).選取驗(yàn)證集實(shí)驗(yàn)結(jié)果中F1值最大的參數(shù)作為后續(xù)實(shí)驗(yàn)參數(shù). 圖5 參數(shù)Rs選擇實(shí)驗(yàn)結(jié)果Fig.5 Results of Rs selection 以CoNLL 2003數(shù)據(jù)集的Rs參數(shù)選取為例,以1為步長(zhǎng),設(shè)置Rs取值區(qū)間為[0,30],繪制不同Rs對(duì)應(yīng)F1值分布圖,如圖5所示. 根據(jù)圖5可知,當(dāng)Rs為15時(shí),合成的數(shù)據(jù)集進(jìn)行命名實(shí)體識(shí)別F1值最高,因此選定Rs=15.由此思路選擇其他參數(shù),最終參數(shù)取值如表2所示. 表2 數(shù)據(jù)集參數(shù)表 實(shí)驗(yàn)使用Bi-LSTM-CRF模型作為基準(zhǔn)模型.為了驗(yàn)證CBM-GA方法的有效性和優(yōu)異性,分別設(shè)計(jì)了2組對(duì)比實(shí)驗(yàn).且為了避免偶然因素影響,實(shí)驗(yàn)結(jié)果均為5次重復(fù)實(shí)驗(yàn)結(jié)果.具體如下. 為了驗(yàn)證CBM-GA方法的有效性,設(shè)計(jì)基準(zhǔn)模型和CBM-GA方法對(duì)比實(shí)驗(yàn). 1) 基準(zhǔn)實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CoNLL2003、JNLPBA建模; 2) CBM-GA方法實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CBM-GA方法作用后的兩數(shù)據(jù)集建模; 針對(duì)CoNLL 2003數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表3所示,CBM-GA方法相比基準(zhǔn)模型在保持精確率幾乎不變的情況下,召回率提升3.26%,F(xiàn)1值提高1.70%;針對(duì)JNLPBA數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表4所示,CBM-GA方法雖然造成精確率的小幅下降,但其召回率提高了2.44%,最終F1值增加了1.03%. 為了驗(yàn)證CBM-GA方法表現(xiàn)優(yōu)于已有平衡欠采樣、隨機(jī)過(guò)采樣方法,設(shè)計(jì)以下對(duì)比實(shí)驗(yàn). 1) 隨機(jī)過(guò)采樣方法實(shí)驗(yàn):使用隨機(jī)過(guò)采樣方法擴(kuò)充原始CoNLL 2003、JNLPBA,獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,并使用基準(zhǔn)模型其建模; 2) 平衡欠采樣方法實(shí)驗(yàn).使用平衡欠采樣方法處理原始兩數(shù)據(jù)集獲得新樣本集合,并隨機(jī)采樣新樣本集合擴(kuò)充原始數(shù)據(jù)集以獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,使用基準(zhǔn)模型其建模; 優(yōu)異性驗(yàn)證實(shí)驗(yàn)結(jié)果如表5和表6所示,針對(duì)CoNLL 2003數(shù)據(jù)集,CBM-GA方法召回率比平衡欠采樣高2.98%,比隨機(jī)過(guò)采樣方法高3.29%,F(xiàn)1值均超出1.76%以上;針對(duì)JNLPBA,CBM-GA方法召回率比平衡欠采樣高1.78%,比隨機(jī)過(guò)采樣方法高2.25%,F(xiàn)1值均超出0.97%以上. 綜上實(shí)驗(yàn)分析驗(yàn)證了CBM-GA方法可以有效提高模型召回率,改善命名實(shí)體識(shí)別效果,相比已有方法表現(xiàn)更優(yōu)異. 表3 CoNLL 2003數(shù)據(jù)集上有效性驗(yàn)證結(jié)果 表4 JNLPBA數(shù)據(jù)集上有效性驗(yàn)證結(jié)果 表5 CoNLL 2003數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果 表6 JNLPBA數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果 進(jìn)一步分析實(shí)驗(yàn)結(jié)果,以CoNLL 2003數(shù)據(jù)集為例,繪制基準(zhǔn)、CBM-GA實(shí)驗(yàn)接收者操作特征曲線(receiver operating characteristic curve,ROC)[21]如圖6所示. 圖6 ROC曲線Fig.6 ROC of baseline and CBM-GA 分別計(jì)算兩條ROC曲線對(duì)應(yīng)AUC[22]值如表7所示. 表7 AUC值 圖6和表7更一步證明CBM-GA模型通過(guò)緩解實(shí)體類和非實(shí)體類單詞個(gè)數(shù)的不平衡問(wèn)題,有效地改善了命名實(shí)體識(shí)別的效果. 從時(shí)間代價(jià)分析,CBM-GA算法增廣CoNLL 2003數(shù)據(jù)集需2.42 min,增廣JNLPBA數(shù)據(jù)集訓(xùn)練需2.4 min,相比Bi-LSTM-CRF模型訓(xùn)練每epoch需32 s,50個(gè)epoch需要26.7 min,CBM-GA算法的運(yùn)行成本是可以接受的.數(shù)據(jù)類別標(biāo)記失衡是普遍存在于開(kāi)源數(shù)據(jù)集的問(wèn)題,但目前關(guān)于命名實(shí)體識(shí)別任務(wù)上的數(shù)據(jù)標(biāo)記失衡研究較少.本文針對(duì)這一現(xiàn)狀創(chuàng)新性地改造遺傳算法,提出了保持文本實(shí)體短語(yǔ)結(jié)構(gòu)的CBM-GA方法.實(shí)驗(yàn)結(jié)果表明,CBM-GA方法在文本數(shù)據(jù)預(yù)處理階段有效緩解數(shù)據(jù)集類別標(biāo)記失衡問(wèn)題,改善模型召回率并進(jìn)一步提高命名實(shí)體識(shí)別性能.該方法可以應(yīng)用在其它序列標(biāo)注任務(wù)上如分詞、機(jī)器翻譯等中.3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)
3.3 實(shí)驗(yàn)參數(shù)設(shè)置與尋優(yōu)
3.4 實(shí)驗(yàn)測(cè)試結(jié)果
3.5 結(jié)果分析