• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種解決命名實(shí)體識(shí)別數(shù)據(jù)集類別標(biāo)記失衡的方法

    2020-01-10 03:17:26許麗丹劉嘉勇
    關(guān)鍵詞:父代個(gè)數(shù)類別

    許麗丹, 劉嘉勇, 何 祥

    (1.四川大學(xué)網(wǎng)絡(luò)空間安全學(xué)院, 成都 610065; 2.四川大學(xué)電子信息學(xué)院, 成都 610065)

    1 引 言

    命名實(shí)體識(shí)別是自然語(yǔ)言處理領(lǐng)域中一項(xiàng)重要任務(wù),經(jīng)過(guò)幾十年的研究發(fā)展已取得了顯著成果[1-5].但是目前已有的研究較少關(guān)注命名實(shí)體識(shí)別數(shù)據(jù)集數(shù)據(jù)類別標(biāo)記不平衡這類數(shù)據(jù)分布問(wèn)題[6].數(shù)據(jù)類別標(biāo)記不平衡[7]是指一個(gè)類別的數(shù)據(jù)量與屬于另一類別的數(shù)據(jù)量差距較大,且小樣本量類呈現(xiàn)出的信息更具價(jià)值.數(shù)據(jù)類別標(biāo)記不平衡會(huì)影響統(tǒng)計(jì)學(xué)習(xí)模型的效果,導(dǎo)致模型更關(guān)注多數(shù)類別數(shù)據(jù),忽略少數(shù)類別數(shù)據(jù)[7-16].在分類問(wèn)題中解決數(shù)據(jù)類別標(biāo)記不平衡的方法主要有以下三類: (1) 采樣方法,包括欠采樣和過(guò)采樣方法[7];(2) 改進(jìn)統(tǒng)計(jì)學(xué)習(xí)算法,包括one-class學(xué)習(xí)方法[8],修改算法的代價(jià)[9]以及集成學(xué)習(xí)[10];(3) 特征選擇,通過(guò)收集最佳特征子集[11]以實(shí)現(xiàn)最佳性能.

    針對(duì)序列數(shù)據(jù),Tomanek等人通過(guò)主動(dòng)學(xué)習(xí),在數(shù)據(jù)標(biāo)記階段盡可能平衡地標(biāo)記數(shù)據(jù)[12].Douzas等人使用條件對(duì)抗生成模型為少數(shù)類別數(shù)據(jù)生成更多數(shù)據(jù)以緩解數(shù)據(jù)失衡[13],但這種方法模型復(fù)雜、計(jì)算代價(jià)大.Gliozzo假設(shè)頻繁出現(xiàn)的單詞一般不提供文本具體信息,也不會(huì)是實(shí)體.可以過(guò)濾掉這些詞以減小非實(shí)體類單詞與實(shí)體類單詞比值[14].Maragoudakis等人使用Tomek連接法在訓(xùn)練階段減少訓(xùn)練集中不必要的負(fù)面樣本[15].Akkasi等人[6]提出了平衡欠采樣方法,該方法保留句子邏輯短語(yǔ)結(jié)構(gòu)以及句子間相關(guān)性,并在四個(gè)生物醫(yī)學(xué)數(shù)據(jù)集上分別實(shí)驗(yàn)比較隨機(jī)欠采樣、SWF[14]和平衡欠采樣三種欠采樣方法的效果并證明了調(diào)節(jié)數(shù)據(jù)集中實(shí)體類單詞和實(shí)體類單詞比例可以改善模型效果.然而這種方法直接剔除數(shù)據(jù)集中非實(shí)體單詞或語(yǔ)句,可能破壞文本的短語(yǔ)結(jié)構(gòu),丟失有價(jià)值的數(shù)據(jù).

    針對(duì)已有方法可能造成的信息丟失問(wèn)題,本文通過(guò)改造遺傳算法[17]用于序列文本合成,提出了一種基于遺傳算法的數(shù)據(jù)類別標(biāo)記平衡方法,本文簡(jiǎn)稱CBM-GA(class balance method based on genetic algorithm).該方法保留所有原始語(yǔ)料,利用遺傳算法基因重組、繁衍行為特點(diǎn),充分挖掘類別平衡文本特征,盡可能維持語(yǔ)句中實(shí)體短語(yǔ)結(jié)構(gòu)的同時(shí),合成新文本以擴(kuò)充原始數(shù)據(jù)集.實(shí)驗(yàn)表明,本文提出的方法有效緩解數(shù)據(jù)集類別標(biāo)記不平衡問(wèn)題,提高命名實(shí)體識(shí)別任務(wù)性能.

    2.1 類別平衡方法框架

    本文提出的數(shù)據(jù)類別平衡方法CBM-GA框架如圖1所示,首先對(duì)原始數(shù)據(jù)集進(jìn)行篩選,獲得合適的父代樣本集,通過(guò)適應(yīng)度函數(shù)評(píng)估樣本并按照其適應(yīng)度函數(shù)值排序獲得有序父代樣本集.從有序父代樣本集中隨機(jī)選擇樣本形成父代樣本對(duì),經(jīng)過(guò)交叉和變異操作生成新樣本,再次使用適應(yīng)度函數(shù)評(píng)估新樣本,抽取適應(yīng)度函數(shù)值高的新樣本集合更新下一輪文本合成操作所需的父代樣本集,如此循環(huán)N次.最后將第N輪生成新樣本數(shù)據(jù)集和原始數(shù)據(jù)集合并產(chǎn)生擴(kuò)充數(shù)據(jù)集,用于命名實(shí)體識(shí)別.

    圖1 CBM-GA框架圖Fig.1 Method framework

    2.2 類別平衡方法原理

    2.2.1 數(shù)據(jù)篩選 現(xiàn)有用于命名實(shí)體識(shí)別研究的公開(kāi)數(shù)據(jù)集中實(shí)體單詞個(gè)數(shù)遠(yuǎn)小于非實(shí)體單詞個(gè)數(shù),且包含大量無(wú)實(shí)體單詞、類別嚴(yán)重失衡的語(yǔ)句[6].直接使用這樣的數(shù)據(jù)集進(jìn)行文本合成會(huì)增加后續(xù)操作代價(jià),降低文本合成效果.因此需要進(jìn)行文本篩選,初步獲取類別分布相對(duì)平衡的文本集合作為父代樣本集.

    如何評(píng)估文本類別標(biāo)記平衡的程度是首先需要解決的問(wèn)題,Akkasi等人[6]用非實(shí)體單詞個(gè)數(shù)和實(shí)體單詞個(gè)數(shù)比值來(lái)評(píng)估文本類別標(biāo)記平衡性,如式(1)所示.

    (1)

    式(1)中,WO表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù);分母WE表示語(yǔ)句實(shí)體單詞個(gè)數(shù).本文將R值作為文本平衡性的衡量指標(biāo),R值越大文本類別越不平衡.

    統(tǒng)計(jì)分析常用數(shù)據(jù)集CoNLL2003[18]、JNLPBA[19]中語(yǔ)句的非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)比值R和語(yǔ)句單詞總數(shù)的關(guān)系,我們可以得出以下結(jié)論:文本單詞個(gè)數(shù)越多,R值越大,文本類別越不平衡,兩者近似反比例關(guān)系,如圖2所示.

    圖2 兩個(gè)常用數(shù)據(jù)集文本R值與文本單詞個(gè)數(shù)關(guān)系圖

    Fig.2 Relationship between the textRvalue of two common datasets and the number of text words

    圖2中橫軸表示語(yǔ)句的單詞總數(shù),縱軸表示語(yǔ)句中非實(shí)體單詞個(gè)數(shù)與實(shí)體單詞個(gè)數(shù)的比值.實(shí)線、虛線分別表示JNLPBA、CoNLL2003數(shù)據(jù)集的文本R值與文本長(zhǎng)度的關(guān)系,二者整體呈上升趨勢(shì).當(dāng)文本單詞個(gè)數(shù)超過(guò)60,文本的R值波動(dòng)幅度變大;當(dāng)文本單詞個(gè)數(shù)超過(guò)100,JNLPBA數(shù)據(jù)集的R值均處于劇烈波動(dòng)狀態(tài),CoNLL2003數(shù)據(jù)集R值快速增長(zhǎng),表明此時(shí)文本類別較不平衡,使用這樣的數(shù)據(jù)進(jìn)行后續(xù)操作將不利于合成類別均衡的新文本.

    因此,為了減少后續(xù)文本合成操作的計(jì)算代價(jià),提高合成效率,數(shù)據(jù)篩選過(guò)程中需要剔除類別嚴(yán)重失衡的數(shù)據(jù).結(jié)合上述分析,數(shù)據(jù)篩選具體流程如下.

    (1) 計(jì)算每個(gè)語(yǔ)句中實(shí)體單詞個(gè)數(shù),剔除不含實(shí)體單詞的語(yǔ)句;

    (2) 剔除單詞個(gè)數(shù)超過(guò)100的語(yǔ)句.

    2.2.2 適應(yīng)度評(píng)估 適應(yīng)度函數(shù),在遺傳算法中用以評(píng)估給定解決方案與所需問(wèn)題最佳解決方案的接近程度[17].CBM-GA方法使用適應(yīng)度函數(shù)作為評(píng)估指標(biāo)以評(píng)估樣本的平衡性,并將類別標(biāo)記平衡條件引入適應(yīng)度函數(shù)中,使得算法尋優(yōu)過(guò)程中嘗試構(gòu)造類別分布平衡的新樣本.定義適應(yīng)度函數(shù)f如式(2)所示.

    f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)

    (2)

    式(2)中,R為式(1)定義的語(yǔ)句非實(shí)體單詞和實(shí)體單詞的比值;Rs是合成文本R值上限值;Rr是合成文本R值下限值;λ是Rr權(quán)重系數(shù).式(2)借助sigmoid函數(shù)控制合成樣本的R值在[Rr,Rs]范圍內(nèi).

    由圖2分析可知文本單詞個(gè)數(shù)不應(yīng)過(guò)長(zhǎng),因此向適應(yīng)度函數(shù)中添加單詞個(gè)數(shù)小于100的限制,如式(3)所示.

    (3)

    式(3)中,L表示語(yǔ)句單詞個(gè)數(shù)限制函數(shù);l表示當(dāng)前樣本單詞個(gè)數(shù).relu函數(shù)限制合成文本的長(zhǎng)度.適應(yīng)度函數(shù)引入單詞個(gè)數(shù)限制,如式(4)所示.

    f=sigmoid(Rs-R)+λ×sigmoid(R-Rr)+

    (4)

    式(4)中,μ是L的權(quán)重系數(shù),用以控制類別平衡條件和單詞個(gè)數(shù)限制的重要性差異.

    2.2.3 文本合成 CBM-GA方法文本合成過(guò)程主要是通過(guò)一系列選擇、交叉和變異操作合成數(shù)據(jù)標(biāo)記平衡的數(shù)據(jù).其中,選擇操作從有序父代樣本集合中抽取父代樣本構(gòu)建父代樣本對(duì)集合;交叉操作將父代樣本對(duì)進(jìn)行組合以生成新樣本;變異操作調(diào)整新樣本的單詞順序,向樣本中添加更多隨機(jī)性.

    CBM-GA方法將文本視為染色體,將單詞及其實(shí)體標(biāo)記類型視為染色體上的基因.如圖3所示.每個(gè)框內(nèi)上行表示單詞,下行表示對(duì)應(yīng)實(shí)體類型標(biāo)記[17],二者共同構(gòu)成一個(gè)完整的基因.基因構(gòu)成染色體,又稱之為樣本.將數(shù)據(jù)集中每個(gè)文本視為樣本,數(shù)據(jù)集視為樣本群體.

    為了便于后續(xù)分析,定義樣本染色體x=(x1,x2,…,xn),其中,xi是包含單詞及其對(duì)應(yīng)實(shí)體類型標(biāo)記的基因,n是染色體長(zhǎng)度.

    1) 選擇操作

    在選擇步驟中,遍歷有序父代樣本集并按照比例選擇方法[20]隨機(jī)選擇兩個(gè)父代樣本構(gòu)成父代樣本對(duì),從而構(gòu)成父代樣本對(duì)集合.

    圖3 染色體示意圖
    Fig.3 Chromosome schematic diagram

    圖4 交叉過(guò)程示意圖Fig.4 Crossover schematic diagram

    2) 交叉操作

    在交叉階段,對(duì)父代樣本對(duì)集合中每個(gè)父代樣本對(duì)采用隨機(jī)交叉策略進(jìn)行單詞序列相互交換,以產(chǎn)生新樣本,如圖4所示.

    為避免實(shí)體短語(yǔ)被切分而導(dǎo)致命名實(shí)體模糊、歧義等問(wèn)題,CBM-GA方法修改基因組合規(guī)則,限制單詞交換位置僅為開(kāi)始,結(jié)尾以及O標(biāo)記[18]的非實(shí)體單詞位置以確保實(shí)體單詞結(jié)構(gòu)完整交換.因此首先根據(jù)父樣本1的實(shí)體標(biāo)記類型,構(gòu)建交換位置集合l.并隨機(jī)從l中抽取交叉發(fā)生的開(kāi)始、結(jié)束位置以得到單詞序列如圖中黑色框單詞序列,將其與父樣本2合并生成新樣本x′.

    x′=x1[lstart:lend]+x2

    (6)

    式(6)中,x1表示父樣本1;x2表示父樣本2;lstart、lend分別表示從交換位置集合l隨機(jī)抽取的開(kāi)始、結(jié)束位置;x′表示新樣本.

    3) 變異操作

    本文采用隨機(jī)交換單詞位置的方式實(shí)現(xiàn)變異.具體操作為:設(shè)定一個(gè)變異概率α,對(duì)交叉得到的新樣本x′,隨機(jī)產(chǎn)生一個(gè)[0,1]區(qū)間上的隨機(jī)數(shù)r,如果r<α,則隨機(jī)交換新樣本x′兩個(gè)單詞的位置.最終生成樣本如式(7)所示.

    (7)

    式(7)表明當(dāng)r<α?xí)r,隨機(jī)選定兩個(gè)單詞位置i、k,交換x′中兩個(gè)位置的單詞從而實(shí)現(xiàn)變異操作,反之則不進(jìn)行變異.

    綜上分析,CBM-GA方法完整表述如算法1.

    算法1 CBM-GA方法

    輸入原始訓(xùn)練樣本集合S;參數(shù)Rs、Rr、λ、μ、循環(huán)次數(shù)N、變異概率α、合成樣本集合大小La

    輸出擴(kuò)展的新樣本集合A

    Begin

    初始化迭代次數(shù)n:n=0

    (1) 遍歷原始訓(xùn)練樣本S,過(guò)濾不含實(shí)體單詞及文本單詞個(gè)數(shù)超過(guò)100的語(yǔ)句,獲得父代樣本集D;

    (2) 遍歷父代樣本集D,根據(jù)式(4)計(jì)算每個(gè)語(yǔ)句的適應(yīng)值并排序,得到有序父代樣本集D1;

    (3) 使用比例選擇法隨機(jī)從D1中抽取兩個(gè)父代樣本組成的父代樣本對(duì)集合;

    (4) 遍歷父代樣本對(duì)集合:

    (a) 針對(duì)父代樣本對(duì)(p1,p2),分別從p1、p2樣本的開(kāi)始、結(jié)尾及非實(shí)體單詞的位置集合中隨機(jī)選擇位置變量以截取單詞序列;

    (b) 將單詞序列合并成新樣本T;

    (c) 以概率α交換T中任意兩個(gè)位置的單詞,并將T加入新樣本集合G;

    (5) 遍歷G,根據(jù)式(4)計(jì)算每個(gè)新語(yǔ)句的適應(yīng)值.抽取適應(yīng)值最高的La個(gè)樣本的集合替換D1、G,迭代次數(shù)n加1;

    (6) 如果n

    End

    為了驗(yàn)證CBM-GA方法的有效性,排除單一數(shù)據(jù)集影響,實(shí)驗(yàn)采用命名實(shí)體識(shí)別研究中常用數(shù)據(jù)集CoNLL2003[18]和JNLPBA[19]進(jìn)行實(shí)驗(yàn).數(shù)據(jù)集基本統(tǒng)計(jì)信息如表1所示.

    表1 數(shù)據(jù)集統(tǒng)計(jì)信息表

    如表1所示, CoNLL 2003已分配好訓(xùn)練集、驗(yàn)證集和測(cè)試集;JNLPBA僅劃分了訓(xùn)練集和測(cè)試集.本文從JNLPBA中隨機(jī)抽取1/3數(shù)據(jù)作為驗(yàn)證集.

    本文實(shí)驗(yàn)平臺(tái)為ubuntu16.04系統(tǒng)服務(wù)器,GPU為GeForce GTX 1070,顯存8 G.實(shí)驗(yàn)?zāi)P褪褂胻ensorflow框架構(gòu)建.

    3.2 實(shí)驗(yàn)評(píng)價(jià)指標(biāo)

    Akkasi等人提出平衡欠采樣方法以緩解數(shù)據(jù)集的類別失衡問(wèn)題,從而改善命名實(shí)體識(shí)別的效果,其借助命名實(shí)體識(shí)別評(píng)價(jià)指標(biāo)作為最終的方法有效性衡量指標(biāo)[6].本文沿用該評(píng)價(jià)指標(biāo)來(lái)論證CBM-GA方法的有效性.命名實(shí)體識(shí)別一般采用精準(zhǔn)率(prec)、召回率(recall)和F1值作為模型性能評(píng)估指標(biāo)[1-5].本文使用的模型評(píng)價(jià)指標(biāo)定義如下.

    (8)

    (9)

    (10)

    3.3 實(shí)驗(yàn)參數(shù)設(shè)置與尋優(yōu)

    根據(jù)2.2節(jié)定義,CBM-GA方法實(shí)現(xiàn)過(guò)程涉及參數(shù):合成樣本R值上限Rs,合成樣本R值下限Rr,Rr值權(quán)重λ,L的權(quán)重系數(shù)μ,合成樣本集合大小La,變異概率α以及循環(huán)次數(shù)N.

    根據(jù)Whitley等人的經(jīng)驗(yàn)[17],本文實(shí)驗(yàn)將α設(shè)為0.01.為給其它參數(shù)設(shè)置合理的取值,實(shí)驗(yàn)基于Bi-LSTM-CRF模型[2]使用貝葉斯優(yōu)化[16]尋優(yōu)方法來(lái)設(shè)置參數(shù).具體操作如下.

    1) 分別以1為步長(zhǎng),設(shè)置Rs,Rr的取值范圍為[0,30];以500為步長(zhǎng),設(shè)置La的取值范圍為[500,2000];以0.1為步長(zhǎng),設(shè)置λ取值范圍為[0,1];以1為步長(zhǎng),設(shè)置循環(huán)次數(shù)N取值范圍為[1,10],構(gòu)建參數(shù)集合;

    2) 基于Bi-LSTM-CRF模型使用貝葉斯優(yōu)化尋優(yōu)方法以F1值為指標(biāo),對(duì)參數(shù)集合進(jìn)行尋優(yōu).選取驗(yàn)證集實(shí)驗(yàn)結(jié)果中F1值最大的參數(shù)作為后續(xù)實(shí)驗(yàn)參數(shù).

    圖5 參數(shù)Rs選擇實(shí)驗(yàn)結(jié)果Fig.5 Results of Rs selection

    以CoNLL 2003數(shù)據(jù)集的Rs參數(shù)選取為例,以1為步長(zhǎng),設(shè)置Rs取值區(qū)間為[0,30],繪制不同Rs對(duì)應(yīng)F1值分布圖,如圖5所示.

    根據(jù)圖5可知,當(dāng)Rs為15時(shí),合成的數(shù)據(jù)集進(jìn)行命名實(shí)體識(shí)別F1值最高,因此選定Rs=15.由此思路選擇其他參數(shù),最終參數(shù)取值如表2所示.

    表2 數(shù)據(jù)集參數(shù)表

    3.4 實(shí)驗(yàn)測(cè)試結(jié)果

    實(shí)驗(yàn)使用Bi-LSTM-CRF模型作為基準(zhǔn)模型.為了驗(yàn)證CBM-GA方法的有效性和優(yōu)異性,分別設(shè)計(jì)了2組對(duì)比實(shí)驗(yàn).且為了避免偶然因素影響,實(shí)驗(yàn)結(jié)果均為5次重復(fù)實(shí)驗(yàn)結(jié)果.具體如下.

    為了驗(yàn)證CBM-GA方法的有效性,設(shè)計(jì)基準(zhǔn)模型和CBM-GA方法對(duì)比實(shí)驗(yàn).

    1) 基準(zhǔn)實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CoNLL2003、JNLPBA建模;

    2) CBM-GA方法實(shí)驗(yàn):使用基準(zhǔn)模型分別對(duì)CBM-GA方法作用后的兩數(shù)據(jù)集建模;

    針對(duì)CoNLL 2003數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表3所示,CBM-GA方法相比基準(zhǔn)模型在保持精確率幾乎不變的情況下,召回率提升3.26%,F(xiàn)1值提高1.70%;針對(duì)JNLPBA數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果如表4所示,CBM-GA方法雖然造成精確率的小幅下降,但其召回率提高了2.44%,最終F1值增加了1.03%.

    為了驗(yàn)證CBM-GA方法表現(xiàn)優(yōu)于已有平衡欠采樣、隨機(jī)過(guò)采樣方法,設(shè)計(jì)以下對(duì)比實(shí)驗(yàn).

    1) 隨機(jī)過(guò)采樣方法實(shí)驗(yàn):使用隨機(jī)過(guò)采樣方法擴(kuò)充原始CoNLL 2003、JNLPBA,獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,并使用基準(zhǔn)模型其建模;

    2) 平衡欠采樣方法實(shí)驗(yàn).使用平衡欠采樣方法處理原始兩數(shù)據(jù)集獲得新樣本集合,并隨機(jī)采樣新樣本集合擴(kuò)充原始數(shù)據(jù)集以獲取與CBM-GA方法相同規(guī)模的擴(kuò)充數(shù)據(jù)集,使用基準(zhǔn)模型其建模;

    優(yōu)異性驗(yàn)證實(shí)驗(yàn)結(jié)果如表5和表6所示,針對(duì)CoNLL 2003數(shù)據(jù)集,CBM-GA方法召回率比平衡欠采樣高2.98%,比隨機(jī)過(guò)采樣方法高3.29%,F(xiàn)1值均超出1.76%以上;針對(duì)JNLPBA,CBM-GA方法召回率比平衡欠采樣高1.78%,比隨機(jī)過(guò)采樣方法高2.25%,F(xiàn)1值均超出0.97%以上.

    綜上實(shí)驗(yàn)分析驗(yàn)證了CBM-GA方法可以有效提高模型召回率,改善命名實(shí)體識(shí)別效果,相比已有方法表現(xiàn)更優(yōu)異.

    表3 CoNLL 2003數(shù)據(jù)集上有效性驗(yàn)證結(jié)果

    表4 JNLPBA數(shù)據(jù)集上有效性驗(yàn)證結(jié)果

    表5 CoNLL 2003數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果

    表6 JNLPBA數(shù)據(jù)集上優(yōu)異性驗(yàn)證結(jié)果

    3.5 結(jié)果分析

    進(jìn)一步分析實(shí)驗(yàn)結(jié)果,以CoNLL 2003數(shù)據(jù)集為例,繪制基準(zhǔn)、CBM-GA實(shí)驗(yàn)接收者操作特征曲線(receiver operating characteristic curve,ROC)[21]如圖6所示.

    圖6 ROC曲線Fig.6 ROC of baseline and CBM-GA

    分別計(jì)算兩條ROC曲線對(duì)應(yīng)AUC[22]值如表7所示.

    表7 AUC值

    圖6和表7更一步證明CBM-GA模型通過(guò)緩解實(shí)體類和非實(shí)體類單詞個(gè)數(shù)的不平衡問(wèn)題,有效地改善了命名實(shí)體識(shí)別的效果.

    從時(shí)間代價(jià)分析,CBM-GA算法增廣CoNLL 2003數(shù)據(jù)集需2.42 min,增廣JNLPBA數(shù)據(jù)集訓(xùn)練需2.4 min,相比Bi-LSTM-CRF模型訓(xùn)練每epoch需32 s,50個(gè)epoch需要26.7 min,CBM-GA算法的運(yùn)行成本是可以接受的.數(shù)據(jù)類別標(biāo)記失衡是普遍存在于開(kāi)源數(shù)據(jù)集的問(wèn)題,但目前關(guān)于命名實(shí)體識(shí)別任務(wù)上的數(shù)據(jù)標(biāo)記失衡研究較少.本文針對(duì)這一現(xiàn)狀創(chuàng)新性地改造遺傳算法,提出了保持文本實(shí)體短語(yǔ)結(jié)構(gòu)的CBM-GA方法.實(shí)驗(yàn)結(jié)果表明,CBM-GA方法在文本數(shù)據(jù)預(yù)處理階段有效緩解數(shù)據(jù)集類別標(biāo)記失衡問(wèn)題,改善模型召回率并進(jìn)一步提高命名實(shí)體識(shí)別性能.該方法可以應(yīng)用在其它序列標(biāo)注任務(wù)上如分詞、機(jī)器翻譯等中.

    猜你喜歡
    父代個(gè)數(shù)類別
    農(nóng)村家庭父代在家庭現(xiàn)代性轉(zhuǎn)型中的作用研究
    中國(guó)高等教育的代際傳遞及其內(nèi)在機(jī)制:“學(xué)二代”現(xiàn)象存在嗎?
    延遲退休決策對(duì)居民家庭代際收入流動(dòng)性的影響分析
    ——基于人力資本傳遞機(jī)制
    怎樣數(shù)出小正方體的個(gè)數(shù)
    等腰三角形個(gè)數(shù)探索
    怎樣數(shù)出小木塊的個(gè)數(shù)
    怎樣數(shù)出小正方體的個(gè)數(shù)
    男孩偏好激勵(lì)父代掙取更多收入了嗎?
    ——基于子女?dāng)?shù)量基本確定的情形
    服務(wù)類別
    論類別股東會(huì)
    商事法論集(2014年1期)2014-06-27 01:20:42
    久久久久国产一级毛片高清牌| 又粗又爽又猛毛片免费看| 国产又色又爽无遮挡免费看| 欧美性猛交╳xxx乱大交人| 国产亚洲av嫩草精品影院| 免费看日本二区| 级片在线观看| 国产精品1区2区在线观看.| 女人高潮潮喷娇喘18禁视频| or卡值多少钱| 久99久视频精品免费| 两个人看的免费小视频| 中文亚洲av片在线观看爽| 亚洲欧美日韩无卡精品| 国产精品av久久久久免费| 国产熟女午夜一区二区三区| 欧美一级a爱片免费观看看 | АⅤ资源中文在线天堂| 一本久久中文字幕| 最近最新中文字幕大全电影3| 两性午夜刺激爽爽歪歪视频在线观看 | 搡老岳熟女国产| 欧美一区二区国产精品久久精品 | 亚洲一区中文字幕在线| 巨乳人妻的诱惑在线观看| or卡值多少钱| 首页视频小说图片口味搜索| 亚洲欧美日韩东京热| 精品人妻1区二区| 国产午夜精品久久久久久| 麻豆av在线久日| 99久久综合精品五月天人人| 亚洲国产日韩欧美精品在线观看 | 在线观看免费视频日本深夜| 香蕉av资源在线| 欧美在线一区亚洲| 国产激情久久老熟女| 国产精品乱码一区二三区的特点| av国产免费在线观看| 香蕉丝袜av| 美女 人体艺术 gogo| 人妻丰满熟妇av一区二区三区| 夜夜看夜夜爽夜夜摸| 国产精品av视频在线免费观看| 在线观看美女被高潮喷水网站 | 午夜福利高清视频| 91成年电影在线观看| 久久久国产成人免费| 亚洲av成人精品一区久久| 国产精品99久久99久久久不卡| 无遮挡黄片免费观看| 欧美性猛交╳xxx乱大交人| 很黄的视频免费| 男男h啪啪无遮挡| 999久久久国产精品视频| 老汉色av国产亚洲站长工具| 麻豆成人午夜福利视频| 波多野结衣巨乳人妻| 久久婷婷成人综合色麻豆| 美女高潮喷水抽搐中文字幕| 日韩大码丰满熟妇| 国产探花在线观看一区二区| 欧美三级亚洲精品| 久久久久久久久久黄片| 免费在线观看黄色视频的| 啦啦啦观看免费观看视频高清| 国产精品久久久久久久电影 | 欧美在线黄色| 欧美黑人巨大hd| 久久伊人香网站| 亚洲午夜精品一区,二区,三区| 国产一区在线观看成人免费| 国产亚洲精品久久久久5区| 亚洲欧美激情综合另类| 久久久久免费精品人妻一区二区| 久久久久亚洲av毛片大全| 久久久久久久午夜电影| 99热6这里只有精品| 国产av麻豆久久久久久久| 一区二区三区高清视频在线| 中文字幕熟女人妻在线| 99久久国产精品久久久| 免费在线观看视频国产中文字幕亚洲| 国产av一区二区精品久久| 中亚洲国语对白在线视频| 99热这里只有精品一区 | 麻豆久久精品国产亚洲av| 亚洲男人天堂网一区| 俺也久久电影网| 50天的宝宝边吃奶边哭怎么回事| 午夜免费成人在线视频| 日韩av在线大香蕉| xxx96com| 我的老师免费观看完整版| 99在线人妻在线中文字幕| 麻豆成人午夜福利视频| 免费在线观看视频国产中文字幕亚洲| 日韩欧美一区二区三区在线观看| 1024手机看黄色片| 国产伦在线观看视频一区| 亚洲真实伦在线观看| 国内毛片毛片毛片毛片毛片| 亚洲国产精品久久男人天堂| 99久久久亚洲精品蜜臀av| 亚洲熟妇中文字幕五十中出| 国产成人av教育| netflix在线观看网站| 久久人人精品亚洲av| 床上黄色一级片| 日韩有码中文字幕| 又黄又粗又硬又大视频| 亚洲激情在线av| 99riav亚洲国产免费| 制服人妻中文乱码| 亚洲专区中文字幕在线| 亚洲一码二码三码区别大吗| 淫妇啪啪啪对白视频| 麻豆久久精品国产亚洲av| av有码第一页| 久久精品国产99精品国产亚洲性色| 99久久综合精品五月天人人| 国产精品免费视频内射| 午夜福利免费观看在线| 国产成人啪精品午夜网站| 又紧又爽又黄一区二区| 亚洲av日韩精品久久久久久密| 久久久精品国产亚洲av高清涩受| 少妇熟女aⅴ在线视频| 国产高清激情床上av| 久久久久国内视频| 天堂av国产一区二区熟女人妻 | 亚洲成av人片免费观看| 国产成人av激情在线播放| 日本免费一区二区三区高清不卡| 18禁美女被吸乳视频| 亚洲一区高清亚洲精品| 看免费av毛片| 精品电影一区二区在线| 久久久久久久午夜电影| www.www免费av| 精品久久久久久久久久免费视频| 国产精品久久久久久亚洲av鲁大| 欧美成人一区二区免费高清观看 | 亚洲中文字幕一区二区三区有码在线看 | 国产av不卡久久| 午夜老司机福利片| 欧美日韩瑟瑟在线播放| 日本精品一区二区三区蜜桃| 18禁黄网站禁片午夜丰满| 亚洲自偷自拍图片 自拍| 国产一区二区在线观看日韩 | 丰满人妻一区二区三区视频av | 国产一区二区激情短视频| 非洲黑人性xxxx精品又粗又长| 欧美乱色亚洲激情| 国产免费av片在线观看野外av| 一本久久中文字幕| 欧美 亚洲 国产 日韩一| 一a级毛片在线观看| 日韩大码丰满熟妇| 中文资源天堂在线| 美女黄网站色视频| 国产69精品久久久久777片 | 国产成年人精品一区二区| 18禁黄网站禁片午夜丰满| 亚洲欧美日韩东京热| 香蕉av资源在线| av福利片在线| 午夜激情av网站| 免费在线观看完整版高清| 女警被强在线播放| 激情在线观看视频在线高清| 亚洲中文av在线| 成年女人毛片免费观看观看9| 欧美日韩精品网址| videosex国产| 伦理电影免费视频| 免费看a级黄色片| cao死你这个sao货| 成人精品一区二区免费| avwww免费| 国产精华一区二区三区| 久久精品亚洲精品国产色婷小说| 亚洲av美国av| 狂野欧美激情性xxxx| 亚洲欧美精品综合一区二区三区| 午夜福利免费观看在线| 欧美大码av| 伊人久久大香线蕉亚洲五| 午夜亚洲福利在线播放| 国产av麻豆久久久久久久| 97人妻精品一区二区三区麻豆| 亚洲五月天丁香| 成人一区二区视频在线观看| 丁香欧美五月| 午夜精品久久久久久毛片777| 中文资源天堂在线| 国产高清视频在线观看网站| 少妇的丰满在线观看| 亚洲午夜精品一区,二区,三区| 国产欧美日韩精品亚洲av| 亚洲国产精品成人综合色| 亚洲avbb在线观看| 国内少妇人妻偷人精品xxx网站 | 久久午夜亚洲精品久久| 不卡av一区二区三区| 国产精品久久久久久精品电影| 久久香蕉激情| 熟女电影av网| 亚洲av第一区精品v没综合| 精品第一国产精品| 成人三级黄色视频| 18禁黄网站禁片午夜丰满| 欧美日韩瑟瑟在线播放| 听说在线观看完整版免费高清| 亚洲avbb在线观看| 日韩免费av在线播放| 亚洲国产精品成人综合色| 免费在线观看日本一区| 国产私拍福利视频在线观看| aaaaa片日本免费| 又紧又爽又黄一区二区| 国产精品自产拍在线观看55亚洲| 国产成人av激情在线播放| av国产免费在线观看| 一本一本综合久久| 黑人巨大精品欧美一区二区mp4| 亚洲无线在线观看| 久久久久久久久免费视频了| 天天躁狠狠躁夜夜躁狠狠躁| 亚洲欧美日韩高清专用| 三级男女做爰猛烈吃奶摸视频| 哪里可以看免费的av片| 国产人伦9x9x在线观看| 久久国产乱子伦精品免费另类| 国产成人影院久久av| 99精品在免费线老司机午夜| 美女免费视频网站| 国产亚洲欧美98| 精品不卡国产一区二区三区| 狠狠狠狠99中文字幕| 国产在线精品亚洲第一网站| 国产精品av视频在线免费观看| 免费在线观看黄色视频的| 黄色成人免费大全| 亚洲av日韩精品久久久久久密| 91麻豆av在线| 嫩草影视91久久| 国产精品精品国产色婷婷| 99热这里只有是精品50| av欧美777| 日韩有码中文字幕| 国产精品久久久久久久电影 | 亚洲av日韩精品久久久久久密| 久久伊人香网站| 天天躁夜夜躁狠狠躁躁| 欧美乱妇无乱码| 搞女人的毛片| 露出奶头的视频| 国产av一区在线观看免费| 午夜免费成人在线视频| 精品熟女少妇八av免费久了| 一边摸一边做爽爽视频免费| 日日干狠狠操夜夜爽| 在线观看免费视频日本深夜| 丝袜美腿诱惑在线| 人人妻人人看人人澡| 日韩欧美一区二区三区在线观看| 色综合欧美亚洲国产小说| 久久久久久九九精品二区国产 | 欧美三级亚洲精品| a级毛片在线看网站| 亚洲国产日韩欧美精品在线观看 | 久久婷婷人人爽人人干人人爱| 老司机午夜十八禁免费视频| 少妇粗大呻吟视频| 两性夫妻黄色片| 不卡av一区二区三区| 女生性感内裤真人,穿戴方法视频| 日本三级黄在线观看| 好男人电影高清在线观看| 亚洲精品久久国产高清桃花| 亚洲av五月六月丁香网| 日本a在线网址| 成人欧美大片| 日韩三级视频一区二区三区| 91老司机精品| 欧美黑人欧美精品刺激| 欧美日韩亚洲国产一区二区在线观看| 国产男靠女视频免费网站| 久久九九热精品免费| 亚洲欧美日韩东京热| 中文字幕熟女人妻在线| 看片在线看免费视频| 91麻豆精品激情在线观看国产| 两人在一起打扑克的视频| 亚洲成人久久性| 欧美黑人巨大hd| 久久精品亚洲精品国产色婷小说| 俄罗斯特黄特色一大片| 看片在线看免费视频| 亚洲精品色激情综合| 婷婷丁香在线五月| 日韩成人在线观看一区二区三区| 日本撒尿小便嘘嘘汇集6| 999精品在线视频| 精品久久久久久久末码| 又黄又爽又免费观看的视频| 搡老妇女老女人老熟妇| 国产成+人综合+亚洲专区| 国产精品九九99| 国产高清videossex| 日韩成人在线观看一区二区三区| e午夜精品久久久久久久| 999精品在线视频| 99riav亚洲国产免费| 国产精品一区二区三区四区免费观看 | 波多野结衣高清无吗| 国产精华一区二区三区| 亚洲熟女毛片儿| 亚洲国产精品成人综合色| 亚洲自偷自拍图片 自拍| videosex国产| 亚洲午夜理论影院| 国产一区二区三区在线臀色熟女| 成人精品一区二区免费| 久久久久久久午夜电影| 国产成人精品久久二区二区免费| 国产精品九九99| 看免费av毛片| 天堂√8在线中文| 天堂影院成人在线观看| 他把我摸到了高潮在线观看| 成人18禁在线播放| 日本 av在线| 成年女人毛片免费观看观看9| 久久久久亚洲av毛片大全| 欧美色视频一区免费| 午夜两性在线视频| a级毛片在线看网站| 亚洲最大成人中文| 国产精品久久久久久人妻精品电影| 国产亚洲精品av在线| 哪里可以看免费的av片| 日日摸夜夜添夜夜添小说| 宅男免费午夜| 中文字幕最新亚洲高清| 国产主播在线观看一区二区| 精品日产1卡2卡| 亚洲精品一区av在线观看| 一进一出抽搐动态| 又粗又爽又猛毛片免费看| 欧美日韩一级在线毛片| 日韩欧美 国产精品| 毛片女人毛片| 亚洲精品中文字幕在线视频| 操出白浆在线播放| 91字幕亚洲| 午夜精品久久久久久毛片777| 亚洲国产高清在线一区二区三| 一个人观看的视频www高清免费观看 | 女人爽到高潮嗷嗷叫在线视频| 色综合站精品国产| 久久久久久久久中文| 女生性感内裤真人,穿戴方法视频| 亚洲欧美日韩高清在线视频| 哪里可以看免费的av片| 成人欧美大片| 亚洲狠狠婷婷综合久久图片| 在线国产一区二区在线| 国产精品精品国产色婷婷| 人人妻人人看人人澡| 91成年电影在线观看| 亚洲av中文字字幕乱码综合| 欧美日韩中文字幕国产精品一区二区三区| 丁香六月欧美| 久久香蕉国产精品| 看黄色毛片网站| 国产精品爽爽va在线观看网站| 精品久久久久久久人妻蜜臀av| 床上黄色一级片| 脱女人内裤的视频| 久久精品综合一区二区三区| 亚洲国产欧美网| av在线天堂中文字幕| 国产熟女xx| 黄色视频,在线免费观看| 9191精品国产免费久久| 嫩草影院精品99| 中文资源天堂在线| 搡老妇女老女人老熟妇| 国语自产精品视频在线第100页| 欧美成人性av电影在线观看| 亚洲av五月六月丁香网| 一边摸一边抽搐一进一小说| 身体一侧抽搐| 99精品久久久久人妻精品| 少妇粗大呻吟视频| 中文字幕精品亚洲无线码一区| 伊人久久大香线蕉亚洲五| 三级毛片av免费| www.自偷自拍.com| 在线看三级毛片| 天天躁狠狠躁夜夜躁狠狠躁| 午夜福利成人在线免费观看| 久久精品国产清高在天天线| 成人18禁高潮啪啪吃奶动态图| 日本精品一区二区三区蜜桃| 一级毛片精品| 亚洲人成77777在线视频| 波多野结衣巨乳人妻| 成在线人永久免费视频| 日本熟妇午夜| av超薄肉色丝袜交足视频| 久热爱精品视频在线9| 久久精品成人免费网站| 一区二区三区激情视频| av福利片在线| 免费看a级黄色片| 婷婷丁香在线五月| 国产精品久久久人人做人人爽| 正在播放国产对白刺激| www.999成人在线观看| 看免费av毛片| 嫩草影院精品99| 欧美性长视频在线观看| 精品久久久久久久末码| 黄色 视频免费看| 真人一进一出gif抽搐免费| 天天躁夜夜躁狠狠躁躁| 欧美黄色淫秽网站| 一区福利在线观看| 黄色丝袜av网址大全| 男女床上黄色一级片免费看| 欧美最黄视频在线播放免费| 一个人免费在线观看的高清视频| 两性午夜刺激爽爽歪歪视频在线观看 | 真人做人爱边吃奶动态| 舔av片在线| 搞女人的毛片| 亚洲精华国产精华精| 国产私拍福利视频在线观看| 99热这里只有精品一区 | 久久香蕉国产精品| 香蕉久久夜色| 免费人成视频x8x8入口观看| 国产精品久久久久久久电影 | 午夜福利视频1000在线观看| 国产爱豆传媒在线观看 | 国产精品香港三级国产av潘金莲| svipshipincom国产片| 国产成年人精品一区二区| 日日夜夜操网爽| 欧美性猛交╳xxx乱大交人| 欧美 亚洲 国产 日韩一| 久久天躁狠狠躁夜夜2o2o| 国产精品亚洲一级av第二区| 一级作爱视频免费观看| 国产精品久久久久久亚洲av鲁大| 欧美日韩亚洲国产一区二区在线观看| 久久中文看片网| 看片在线看免费视频| 亚洲九九香蕉| 成人国产综合亚洲| 国产成人影院久久av| 午夜福利高清视频| 国产单亲对白刺激| 国产私拍福利视频在线观看| 一级毛片精品| 久久中文字幕一级| 国产乱人伦免费视频| 给我免费播放毛片高清在线观看| 日韩免费av在线播放| 亚洲免费av在线视频| 久久精品国产亚洲av香蕉五月| 亚洲在线自拍视频| 久久人妻福利社区极品人妻图片| 成年版毛片免费区| 亚洲一卡2卡3卡4卡5卡精品中文| 波多野结衣高清无吗| 熟女少妇亚洲综合色aaa.| 少妇被粗大的猛进出69影院| 脱女人内裤的视频| 听说在线观看完整版免费高清| 欧美日韩精品网址| 成人手机av| av中文乱码字幕在线| 亚洲欧美精品综合久久99| 久久天堂一区二区三区四区| 亚洲 欧美一区二区三区| 欧美日韩乱码在线| 亚洲专区国产一区二区| 国产成人av教育| 精华霜和精华液先用哪个| 天堂影院成人在线观看| videosex国产| 国产精品一区二区精品视频观看| 久久性视频一级片| 精品人妻1区二区| 国产激情久久老熟女| 长腿黑丝高跟| 搡老熟女国产l中国老女人| 久久精品91无色码中文字幕| 老司机靠b影院| 国产69精品久久久久777片 | 青草久久国产| 午夜福利在线在线| 亚洲国产精品久久男人天堂| 日韩三级视频一区二区三区| 又黄又爽又免费观看的视频| 一本一本综合久久| 美女大奶头视频| 国产av一区在线观看免费| 亚洲av日韩精品久久久久久密| 天天一区二区日本电影三级| 亚洲欧美日韩高清专用| 在线视频色国产色| 日本一本二区三区精品| 最近视频中文字幕2019在线8| 国产精品免费视频内射| 中文字幕精品亚洲无线码一区| av在线播放免费不卡| 成人一区二区视频在线观看| а√天堂www在线а√下载| 国产精品久久久久久久电影 | 国产熟女午夜一区二区三区| 欧美av亚洲av综合av国产av| 黄色丝袜av网址大全| 亚洲国产欧美人成| 国语自产精品视频在线第100页| 免费在线观看黄色视频的| 啦啦啦免费观看视频1| 国内精品久久久久精免费| 在线观看美女被高潮喷水网站 | 亚洲国产欧美一区二区综合| 午夜福利高清视频| 国产精品 欧美亚洲| 老汉色av国产亚洲站长工具| 日韩精品中文字幕看吧| 亚洲一卡2卡3卡4卡5卡精品中文| 亚洲自拍偷在线| 淫妇啪啪啪对白视频| 日韩欧美免费精品| 在线a可以看的网站| 久久久久九九精品影院| 每晚都被弄得嗷嗷叫到高潮| 97超级碰碰碰精品色视频在线观看| 男女做爰动态图高潮gif福利片| 黄色丝袜av网址大全| 88av欧美| 日韩欧美在线乱码| 中亚洲国语对白在线视频| 午夜福利在线在线| 久久国产精品人妻蜜桃| 嫩草影院精品99| 国产精品久久久久久久电影 | 黄色片一级片一级黄色片| 国产一区在线观看成人免费| 国产av麻豆久久久久久久| 欧美黑人巨大hd| 97碰自拍视频| 久久久久精品国产欧美久久久| av有码第一页| 日本成人三级电影网站| 久久久精品国产亚洲av高清涩受| 国产欧美日韩一区二区三| 国产成人精品久久二区二区免费| 18美女黄网站色大片免费观看| 亚洲精品一区av在线观看| 91大片在线观看| 国产黄色小视频在线观看| 亚洲电影在线观看av| 性欧美人与动物交配| 亚洲18禁久久av| 亚洲欧美日韩东京热| 99精品久久久久人妻精品| 男女做爰动态图高潮gif福利片| 亚洲中文日韩欧美视频| 嫁个100分男人电影在线观看| av天堂在线播放| 久久国产精品人妻蜜桃| 国产高清有码在线观看视频 | 一本久久中文字幕| 日韩成人在线观看一区二区三区| 欧美最黄视频在线播放免费| 亚洲国产精品成人综合色| 午夜福利在线在线| 制服人妻中文乱码| 久久精品国产亚洲av高清一级| 18禁观看日本| 亚洲第一电影网av| 久久中文字幕人妻熟女| 国产一级毛片七仙女欲春2| 色综合欧美亚洲国产小说| 亚洲国产欧美人成| 亚洲熟女毛片儿| 老司机福利观看| 国产欧美日韩精品亚洲av| 国产精品免费视频内射| 国产视频内射| 哪里可以看免费的av片| 国语自产精品视频在线第100页| 桃红色精品国产亚洲av| 久久久久久九九精品二区国产 | 一a级毛片在线观看| 日日夜夜操网爽| 18禁裸乳无遮挡免费网站照片| 男女午夜视频在线观看| 国产精品电影一区二区三区| 精品久久久久久久末码| 国产成人系列免费观看| 日日摸夜夜添夜夜添小说| 桃红色精品国产亚洲av| 国产精品香港三级国产av潘金莲| 在线国产一区二区在线|