• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    中文分詞研究綜述

    2021-04-23 05:51:18王佳楠梁永全
    軟件導(dǎo)刊 2021年4期
    關(guān)鍵詞:歧義分詞準(zhǔn)確度

    王佳楠,梁永全

    (山東科技大學(xué)計算機科學(xué)與工程學(xué)院,山東青島 266590)

    0 引言

    隨著自然語言處理的發(fā)展,分詞作為基礎(chǔ)任務(wù)成為研究重點,中文因其復(fù)雜性和特殊性成為分詞熱點話題。中國知網(wǎng)和Web of Science 的相關(guān)論文顯示,自2010 年分詞研究達(dá)到小高峰后,中文分詞研究熱度再次緩步增長,見圖1、圖2。但是,作為自然語言處理的基礎(chǔ)任務(wù),分詞究竟有沒有必要,Li 等[1]在2019 年ACL 會議上提出此觀點,并在機器翻譯、文本分類、句子匹配和語言建模4 個NLP任務(wù)上驗證分詞的非必要性,但這并不說明分詞研究不再有意義。詞級別模型欠佳表現(xiàn)在數(shù)據(jù)稀疏、過擬合、OOV以及數(shù)據(jù)遷移能力缺乏等,要解決此類問題,提高分詞性能仍有重大意義,例如谷歌提出的知識圖譜概念。知識圖譜強大的語義關(guān)聯(lián)能力為網(wǎng)絡(luò)搜索提供便利。知識圖譜本質(zhì)是一種語義網(wǎng)絡(luò),用圖的形式描述客觀事物,由邊和節(jié)點組成。邊一般指關(guān)系和屬性,節(jié)點指概念和實體。現(xiàn)實中,書本和網(wǎng)頁中的內(nèi)容屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù),無法直接構(gòu)建知識圖譜,分詞成為構(gòu)建知識圖譜的第一步。英文通過空格區(qū)分單詞,中文則需要根據(jù)上下文信息理解分詞,但這對于計算機而言相當(dāng)困難。

    Fig.1 Statistics on the number of word segmentation documents of CNKI圖1 中國知網(wǎng)分詞文獻(xiàn)數(shù)量統(tǒng)計

    Fig.2 Statistics on the number of word segmentation documents in Web of Science圖2 Web of Science 分詞文獻(xiàn)數(shù)量統(tǒng)計

    本文通過詳細(xì)閱讀近20 年文獻(xiàn)資料,總結(jié)歸納中文分詞的瓶頸和算法,提出新的瓶頸及改進(jìn)方向。

    1 中文分詞瓶頸

    1.1 粒度選擇

    由于中文的復(fù)雜性,分詞時粒度的選擇尤為重要。目前分詞粒度分為粗粒度和細(xì)粒度兩類,例如“中華人民共和國”,粗粒度:中華人民|共和國;細(xì)粒度:中華|人民|共和國。

    雖然人類閱讀不會發(fā)生障礙,但對于計算機來說,尤其是當(dāng)分詞用于搜索引擎時,細(xì)粒度可能導(dǎo)致搜索準(zhǔn)確率降低;當(dāng)用于知識圖譜構(gòu)建時則導(dǎo)致圖譜復(fù)雜性增加,準(zhǔn)確度降低。

    1.2 分詞歧義

    歧義字段在中文中普遍存在,而歧義字段又是中文切分的一個難點。梁南元教授[2]最早對歧義字段進(jìn)行了兩種基本定義:

    (1)交集型切分歧義。漢字串ASB 稱作交集型切分歧義,如果滿足AS、SB 同時為詞(A、S、B 分別為漢字串),此時漢字串S 稱作交集串。如句子“人民生活幸福”,分詞的可能結(jié)果有:

    Eg1:人民|生活|幸福

    Eg2:人|民生|活|幸福

    如果由計算機判斷,則“人民”和“民生”皆為可能詞匯,就會造成交集型歧義。

    (2)組合型切分歧義。漢字串AB 稱作多義組合型切分歧義,如果滿足A、B、AB 同時為詞,如“校友會”一詞:

    Eg1:我|在|校友會|工作

    Eg2:我|的|校友|會|來

    “校友”和“會”可以單獨成詞,也可組合成詞,就造成了組合型歧義。

    歧義字段給分詞帶來極大困擾,想要作出正確的切分判斷,需要結(jié)合上下文語境,甚至韻律、語氣、重音、停頓等,這對機器來說無疑是困難的。

    1.3 未登錄詞識別

    未登錄詞有兩種,一種指已有的詞表中沒有收錄的詞,另一種指訓(xùn)練語料中未曾出現(xiàn)過的詞,而后一種也可被稱作集外詞(Out of Vocabulary,OOV),即訓(xùn)練集以外的詞。未登錄詞通常包含以下幾種類型:

    (1)新出現(xiàn)的普通詞匯。隨著時代變遷,語言不斷發(fā)展,詞匯也在更新,尤其是網(wǎng)絡(luò)用語中層出不窮的新詞,這對分詞甚至自然語言處理都是一大挑戰(zhàn)。

    (2)專有名詞。如人名、地名以及組織機構(gòu)名稱等。

    (3)專業(yè)名詞和研究領(lǐng)域名稱。將分詞運用到某些特定領(lǐng)域或?qū)I(yè),需要特定的領(lǐng)域詞典。

    (4)其它專用名詞。如新產(chǎn)生的產(chǎn)品名、電影名稱、書籍名稱等。

    由此可見,粒度選擇、歧義消除和未登錄詞識別是干擾中文分詞的重要原因。孫茂松等[3]發(fā)現(xiàn)在真實語料庫中,由未登錄詞造成的分詞錯誤是歧義切分的5 倍以上,提高未登錄詞識別對提升分詞性能有重大影響。

    2 傳統(tǒng)分詞方法

    2.1 基于規(guī)則的分詞方法

    基于規(guī)則的匹配方法又稱為機械分詞方法或基于字典的分詞方法,就是按照一定的規(guī)則將測試的字段與機器詞典中的詞條相匹配。

    1984 年梁南元教授根據(jù)漢俄翻譯機器提到的6-5-4-3-2-1 分詞方法,利用詞典中最長詞的長度作為匹配字段長度進(jìn)行匹配,成功則輸出,失敗則去掉匹配字段中的最后一個字,繼續(xù)匹配,直到全部切分為止,稱為最大匹配法,并首次將最大匹配法用于中文分詞任務(wù),實現(xiàn)了我國第一個自動漢語分詞系統(tǒng)CDWS。除此之外,還有逆向最大匹配法和雙向最大匹配法。

    基于詞典的分詞方法直觀簡單,可以通過增減詞典調(diào)整最終的分詞效果。當(dāng)詞典直接決定分詞結(jié)果的好壞時,詞典的構(gòu)造就成了重中之重,即使到現(xiàn)在詞典的作用仍然不可磨滅。

    分詞的詞典機制主要有:基于整詞二分、基于TRIE 索引樹以及基于逐字二分。2000 年孫茂松等通過實驗比較3 種詞典機制,認(rèn)為基于逐字二分的分詞詞典機制簡潔、高效,能較好地滿足實用型漢語自動分詞系統(tǒng)需要;2001 年楊文峰等[4]則認(rèn)為原始的3 種詞典機制在更新時維護成本較高且效率較低,故根據(jù)PATRICIA tree 的數(shù)據(jù)結(jié)構(gòu)設(shè)計一種新的分詞詞典機制,可以實現(xiàn)快速查詢及快速更新功能;2003 年李慶虎等[5]提出雙子哈希機制,在不提升現(xiàn)有詞典機制空間復(fù)雜度和維護復(fù)雜度基礎(chǔ)上,提高了中文分詞的速度和效率。

    隨后,通過改進(jìn)分詞詞典提高分詞性能的文章層出不窮。雖然基于詞典的分詞方法簡潔高效、操作簡單,但是準(zhǔn)確度不高,不能很好地處理歧義切分和未登錄詞識別。

    2.2 基于統(tǒng)計的分詞方法

    基于統(tǒng)計的分詞方法是把每個詞看作字組成,相鄰的字在語料庫中出現(xiàn)的次數(shù)越多,就越可能是一個詞。

    Mashall 于1993 年提出了CLAWS 算法,利用概率統(tǒng)計模型對語料庫的詞性進(jìn)行自動標(biāo)注;Derose[6]在CLAWS算法基礎(chǔ)上提出WOLSUNGA 算法。此后,中文分詞利用統(tǒng)計方法在詞性標(biāo)注方面取得了巨大成就。2002 年第一屆SIGHAN 會議召開后,Xue 等[7]第一次提出基于字標(biāo)注分詞,成為中文分詞領(lǐng)域的重要方法。一年后,在最大熵模型上實現(xiàn)基于字標(biāo)注的分詞系統(tǒng),在2003 年的bakeoff測評中取得好成績,之后發(fā)表論文詳細(xì)闡述了基于字標(biāo)注的分詞模型。序列標(biāo)注就是將每個中文單字標(biāo)注為B(),I(),O(),E(),S()的形式,以此進(jìn)行分詞,開啟了分詞領(lǐng)域新模式。

    目前,基于統(tǒng)計的字序列標(biāo)注分詞方法最常用的步驟如下:①構(gòu)建語言模型;②對句子作單詞劃分,對劃分結(jié)果利用隱馬爾可夫(Hidden Markov Model,HMM)或條件隨機場(Conditional Random Field,CRF)等進(jìn)行概率計算,獲得概率最大分詞方式。

    其中,HMM 模型是利用已分詞的訓(xùn)練集訓(xùn)練模型,得到三概率矩陣,利用維特比算法和三概率矩陣分析測試集標(biāo)簽,利用標(biāo)簽進(jìn)行分詞,最常用的結(jié)巴分詞就是基于此模型;此后,Peng 等(2004)又將CRF 引入分詞學(xué)習(xí)中。CRF 模型較于HMM 模型能更好地利用上下文信息,以及外部信息特征完成實驗。

    基于統(tǒng)計的分詞方法可以很好地識別未登錄詞和消除歧義,但是統(tǒng)計模型復(fù)雜度高,運行周期長,依賴人工特征提取。隨著計算機運行速度加快,神經(jīng)網(wǎng)絡(luò)逐漸進(jìn)入分詞領(lǐng)域。

    3 神經(jīng)網(wǎng)絡(luò)分詞法

    2001 年,Bengio 等[8]提出第一個神經(jīng)語言模型——前饋神經(jīng)語言模型,并誕生了詞嵌入這一概念,隨后又提出一種基于神經(jīng)網(wǎng)絡(luò)變種的概率語言模型,將神經(jīng)網(wǎng)絡(luò)引入自然語言處理任務(wù)。神經(jīng)網(wǎng)絡(luò)因其自動學(xué)習(xí)特征,避免了傳統(tǒng)的特征構(gòu)建,早在20 世紀(jì)就有學(xué)者試圖在中文分詞任務(wù)中運用神經(jīng)網(wǎng)絡(luò),但是分詞速度不理想。到了21 世紀(jì),隨著技術(shù)提升以及深度學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)在中文分詞領(lǐng)域有了重大進(jìn)步。自序列標(biāo)注方法在bakeoff 測試中取得優(yōu)異成績后,將神經(jīng)網(wǎng)絡(luò)與序列標(biāo)注相結(jié)合成為中文分詞領(lǐng)域的通用框架。

    2011 年Collobert 等[9]為改善以往每個NLP 任務(wù)需要設(shè)計構(gòu)造新模型的思想,提出一種可以推廣到其它多種NLP 任務(wù)中的多層神經(jīng)網(wǎng)絡(luò)體系結(jié)構(gòu);2013 年Zheng 等[10]在Collobert 的基礎(chǔ)上,為減少學(xué)習(xí)算法對特征提取的依賴性,將整個句子作為輸入進(jìn)行多層特征提取,得到抽象的特征表示,同時提出了Perceptron-Style 算法,并首次探討利用以上模型算法在中文分詞和詞性標(biāo)注任務(wù)中與CRF統(tǒng)計模型比較速度上的優(yōu)劣;2014 年,Pei 等[11]在此基礎(chǔ)上提出了最大邊緣張量神經(jīng)網(wǎng)絡(luò)模型,模型模擬了標(biāo)簽和上下文字符之間的交互,以獲得更多的語義信息,加快訓(xùn)練速度,防止過擬合,提高了準(zhǔn)確度。

    但是,這些算法受限于輸入窗口大小,無法利用文本的時間序列信息進(jìn)行分詞,遞歸神經(jīng)網(wǎng)絡(luò)(Recursive Neural Network,RNN)的分詞方法應(yīng)運而生。遞歸神經(jīng)網(wǎng)絡(luò)利用順序信息,在處理新輸入信息的同時存儲上一時刻信息。利用當(dāng)前輸入和上一時刻輸出,同時得到這一時刻輸出。利用遞歸神經(jīng)網(wǎng)絡(luò)可以在序列標(biāo)記任務(wù)中考慮序列信息,提高分詞準(zhǔn)確度。

    2015 年,為了對輸入上下文進(jìn)行建模,Chen 等[12]提出門控遞歸神經(jīng)網(wǎng)絡(luò)模型,利用重置門和更新門控制信息的傳送和抽取。而為了解決神經(jīng)網(wǎng)絡(luò)利用固定窗口而忽視長距離信息問題,在Sutskever 等[13]基礎(chǔ)上提出在分詞領(lǐng)域運用長短時記憶網(wǎng)絡(luò)(Long-short-term memory,LSTM)思想,成為分詞領(lǐng)域里程碑式的進(jìn)步。

    LSTM 是在RNN 基礎(chǔ)上提出的。雖然RNN 已經(jīng)在語音識別、語言建模和文本生成方面取得巨大成就,但是由于梯度消失和梯度爆炸導(dǎo)致很難訓(xùn)練長距離信息,LSTM則允許網(wǎng)絡(luò)學(xué)習(xí)何時忘記先前信息以及何時在給定信息的情況下更新存儲單元,將重要信息保留在存儲單元中以避免窗口大小限制,可以很好地應(yīng)用在分詞領(lǐng)域;Chen等[14]在一般模型(包括字嵌入層、神經(jīng)網(wǎng)絡(luò)層和標(biāo)簽推理層)基礎(chǔ)上在網(wǎng)絡(luò)層運用LSTM,從精確度(precision)、召回率(recall)、FI 值以及OVV 召回率4 個方面評估,發(fā)現(xiàn)與最新模型相比,LSTM 可以利用較小的窗口獲得最好的性能。

    但是LSTM 分詞模型自提出后并沒有在分詞領(lǐng)域得到廣泛研究與應(yīng)用,直到2016 年Yao 等[15]為了充分利用上下文信息進(jìn)行分詞才提出了雙向LSTM;早在2015 年,為解決詞性標(biāo)注問題,Huang 等[16]提出雙向LSTM-CRF 模型,實驗證明該模型在詞性標(biāo)注上的準(zhǔn)確度要優(yōu)于當(dāng)前模型,最高可達(dá)到97.55%;隨后,Xu[17]提出一種基于依賴的門控遞歸網(wǎng)絡(luò),將LSTM 和門控遞歸神經(jīng)網(wǎng)絡(luò)相結(jié)合;黃丹丹等[18]將注意力機制融入雙向LSTM-CRF 模型;Zhang等[19]第一次提出將Lattice LSTM 應(yīng)用到中文實體識別中;Yang 等[20]在Zhang 的基礎(chǔ)上提出在Lattice LSTM 中加入子詞編碼,發(fā)現(xiàn)使用Lattice+word(詞)或Lattice+subword(子詞)替換字符信息后模型性能更好,并提出將具有域詞典的Lattice LSTM 結(jié)構(gòu)用于跨領(lǐng)域分詞的可行性。

    2018 年,新型語言模型BERT 刷新了11 項NLP 任務(wù)的性能記錄。Huang 等[21]提出采用多準(zhǔn)則的學(xué)習(xí)方法進(jìn)行中文分詞,利用BERT 進(jìn)行預(yù)訓(xùn)練產(chǎn)生詞向量進(jìn)行特征提取,對BERT 模型進(jìn)行層級修剪來平衡分割速度和準(zhǔn)確度,同時采集不同準(zhǔn)則的數(shù)據(jù)集,捕獲每個數(shù)據(jù)集的異構(gòu)分段標(biāo)準(zhǔn)以及公共知識,最后利用CRF 推理層得到最佳標(biāo)簽序列。這種方法不僅提高了分詞性能,加快了計算速度,還減小了模型尺度。BERT 為中文分詞開創(chuàng)了新的突破口,大幅提高了分詞準(zhǔn)確度。

    基于神經(jīng)網(wǎng)絡(luò)的分詞模型經(jīng)過近20 年的研究已趨于成熟,研究人員在序列標(biāo)注、網(wǎng)絡(luò)模型以及推理機制等方面不斷改進(jìn),大大提高了中文分詞的準(zhǔn)確度。但是分詞速度和跨領(lǐng)域分詞等方面仍然存在不足。

    4 中文分詞新的瓶頸

    隨著計算機技術(shù)的發(fā)展,分詞領(lǐng)域的準(zhǔn)確度也隨之提高,但是通過增加模型內(nèi)部復(fù)雜度來提高準(zhǔn)確度,損害了運行速度;除此之外,未登錄詞的影響仍然存在,專業(yè)名詞的識別失誤在跨領(lǐng)域分詞中尤為明顯。

    4.1 跨領(lǐng)域分詞

    自從將神經(jīng)網(wǎng)絡(luò)應(yīng)用到中文分詞領(lǐng)域,隨著網(wǎng)絡(luò)模型的不斷改進(jìn),中文分詞的準(zhǔn)確度大大提升,歧義切分的影響逐漸縮小,但是未登錄詞的識別方法仍需改進(jìn),尤其在跨領(lǐng)域分詞任務(wù)中。

    2018 年,Ma 等[22]使用雙向LSTM(Bi-LSTM)模型進(jìn)行中文分詞,但未提出新的模型或改進(jìn)模型,而是在LSTM 模型基礎(chǔ)上預(yù)訓(xùn)練字向量、Dropout 和調(diào)整超參數(shù)以達(dá)到State-of-the-art(SOTA),詳細(xì)比較了3 種技術(shù)對性能的影響。預(yù)訓(xùn)練字向量(詞向量)已經(jīng)成為NLP 任務(wù)的基礎(chǔ)工作,例如Word2vec、ELMO、BERT 等,都是對字向量訓(xùn)練的提升算法,實驗發(fā)現(xiàn)預(yù)訓(xùn)練字向量對性能優(yōu)化貢獻(xiàn)最大。針對不同的數(shù)據(jù)集調(diào)整參數(shù)可以很好地提高模型的準(zhǔn)確度。最新的分詞模型大約三分之一的錯誤來自注釋不一致問題,三分之二由詞匯不足造成,使用外部詞典或知識庫非常重要,而調(diào)整模型結(jié)構(gòu)對這類錯誤幾乎毫無用處;Zhang 等[23]提出結(jié)合字典的神經(jīng)網(wǎng)絡(luò)分詞,該方法可以解決由詞稀少引起的問題,并在模型應(yīng)用于不同的域時僅需添加額外的域特定詞典,其它參數(shù)可保持不變。該方法在跨域CWS 任務(wù)中得到明顯改進(jìn),也恰恰證明了Ma 等關(guān)于詞匯不足的重要性結(jié)論。

    Zhao 等[24]提出結(jié)合未標(biāo)記和部分標(biāo)記數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)用于跨領(lǐng)域中文分詞方法。發(fā)現(xiàn)在跨域分詞中,Bi-LSMT+LM(未標(biāo)記)+PL(部分標(biāo)記)在大部分測試集中具有最佳性能,同時在域內(nèi)數(shù)據(jù)分詞中有最佳性能。未標(biāo)記和部分標(biāo)記數(shù)據(jù)的結(jié)合應(yīng)用,為跨域分詞乃至域內(nèi)分詞提供了一種新的研究方向。

    跨領(lǐng)域分詞瓶頸主要來自于OOV 的原始瓶頸,專有名詞的限制使該瓶頸不可能完全消除,增加領(lǐng)域詞典可以很好地解決跨領(lǐng)域分詞問題。隨著科技進(jìn)步,強大知識庫的構(gòu)建使運用外部輔助方法變得越來越簡便。但是,不同領(lǐng)域的通用分詞算法仍需進(jìn)一步研究。

    4.2 分詞速度

    速度是任何系統(tǒng)不可避免的熱點問題,分詞模型的高準(zhǔn)確率導(dǎo)致復(fù)雜的模型層出不窮,損害了分詞速度,即使在CPU 運算速度不斷提高的情況下,LSTM 分詞模型運行時間仍可達(dá)3 天,Bi-LSTM 的時間也達(dá)17 個小時,而CRF的加入使模型運行速度更加緩慢。分詞作為自然語言處理的基礎(chǔ)步驟,不僅需要高準(zhǔn)確度,運行速度也是目前研究熱點。

    2016 年,Cai 等[25]提出一種新穎的神經(jīng)網(wǎng)絡(luò)模型,構(gòu)建句子完整的切分歷史,直接在結(jié)果上進(jìn)行建??砂l(fā)現(xiàn)訓(xùn)練和測試速度慢的原因。隨后提出一種貪婪神經(jīng)詞分割器,通過去掉不必要的設(shè)計建立更有效的字符組合模型,大幅降低訓(xùn)練和運行時間[26]。

    劉志明等[27]提出一種最簡門單元模型,在LSTM 基礎(chǔ)上刪除輸出門,將隱藏狀態(tài)和細(xì)胞狀態(tài)合并,輸入門和遺忘門合為更新門以簡化網(wǎng)絡(luò)結(jié)構(gòu)。結(jié)果顯示MGU 精度并無大的差異,而推理速度是LSTM 模型的3 倍,訓(xùn)練耗時則是LSTM 的1/2,證明通過簡化模型提高訓(xùn)練速度減少訓(xùn)練時間的方法是可行的。

    除此之外,循環(huán)神經(jīng)網(wǎng)絡(luò)在長距離信息保存上的優(yōu)越性,使得NLP 中循環(huán)神經(jīng)網(wǎng)絡(luò)占主要地位,但實際上卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)能更好地理解語義信息,并利用稀疏連接縮短運算時間,提高效率。文獻(xiàn)[28]為改進(jìn)人工設(shè)計特征提取,采用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行特征提取并取得較好效果;涂文博等[29]驗證了采用無池化卷積神經(jīng)網(wǎng)絡(luò)的速度是池化層卷積神經(jīng)網(wǎng)絡(luò)的4 倍左右;王星等[30]認(rèn)為目前的分詞模型只利用到漢字,字根和五筆等深層次特征也應(yīng)考慮在內(nèi)。采用膨脹卷積神經(jīng)網(wǎng)絡(luò),使用CRF 進(jìn)行解碼,結(jié)果表明準(zhǔn)確度和速度都高于Bi-LSTM 模型。可見,卷積神經(jīng)網(wǎng)絡(luò)早已進(jìn)入分詞領(lǐng)域。

    對于分詞速度的影響因素主要有網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性以及解碼方式。目前,分詞準(zhǔn)確度已達(dá)到相當(dāng)高的水平,因此在保證準(zhǔn)確率的前提下,速度成為分詞研究的重要方向,而卷積神經(jīng)網(wǎng)絡(luò)對速度和準(zhǔn)確率的兼顧性使其具有極大的研究價值。

    5 結(jié)語

    分詞技術(shù)正在逐步改進(jìn)?;谠~典分詞的機械分詞方法操作簡單,實現(xiàn)快速,但利用已有的詞典直接匹配獲取存在領(lǐng)域局限性,并且歧義性和局外詞匯識別差。基于統(tǒng)計分詞的監(jiān)督學(xué)習(xí)算法改進(jìn)了歧義等問題,將分詞轉(zhuǎn)換為序列標(biāo)注問題,CRF 模型和HMM 模型成為統(tǒng)計分詞的主要方法。近年,神經(jīng)網(wǎng)絡(luò)的出現(xiàn)使分詞準(zhǔn)確度有了極大提高,但在Bi-LSTM+CRF 算法應(yīng)用于分詞領(lǐng)域后,準(zhǔn)確度的提升空間逐步變小,如表1 所示。

    Table 1 F1 value of participle in each document表1 各文獻(xiàn)分詞F1 值

    雖然各文獻(xiàn)所用方法存在外部差異,如外加字典、預(yù)處理、Dropout 等,但結(jié)果波動不大。由此可見,目前分詞領(lǐng)域研究已經(jīng)趨于成熟,作為基礎(chǔ)任務(wù)可滿足絕大部分NLP問題研究。但是,分詞性能和速度存在不一致性,而卷積神經(jīng)網(wǎng)絡(luò)由于速度優(yōu)勢,近年也常應(yīng)用于自然語言處理領(lǐng)域并取得顯著成效。

    中文分詞研究應(yīng)該兼顧準(zhǔn)確度與速度,在兩者之間選擇平衡點,卷積神經(jīng)網(wǎng)絡(luò)在速度上的優(yōu)勢勢必會給分詞領(lǐng)域帶來重大改進(jìn)。

    猜你喜歡
    歧義分詞準(zhǔn)確度
    eUCP條款歧義剖析
    中國外匯(2019年12期)2019-10-10 07:26:58
    結(jié)巴分詞在詞云中的應(yīng)用
    智富時代(2019年6期)2019-07-24 10:33:16
    幕墻用掛件安裝準(zhǔn)確度控制技術(shù)
    建筑科技(2018年6期)2018-08-30 03:40:54
    English Jokes: Homonyms
    值得重視的分詞的特殊用法
    動態(tài)汽車衡準(zhǔn)確度等級的現(xiàn)實意義
    “那么大”的語義模糊與歧義分析
    高爐重量布料準(zhǔn)確度的提高
    天津冶金(2014年4期)2014-02-28 16:52:58
    對電子天平的誤差及保證其稱量準(zhǔn)確度的探討
    機電信息(2014年35期)2014-02-27 15:54:30
    高考分詞作狀語考點歸納與疑難解析
    好男人在线观看高清免费视频| 麻豆国产97在线/欧美| 999久久久精品免费观看国产| 狂野欧美激情性xxxx| 国产高清激情床上av| 亚洲欧美精品综合一区二区三区| 精品日产1卡2卡| 国产真实乱freesex| 我要搜黄色片| 国产精品免费一区二区三区在线| 国产午夜福利久久久久久| 在线观看舔阴道视频| xxx96com| 午夜福利在线观看吧| 国产精品av久久久久免费| 日本 av在线| 波多野结衣高清无吗| 成人特级黄色片久久久久久久| 亚洲最大成人中文| 国产探花在线观看一区二区| 99久久成人亚洲精品观看| 中文字幕精品亚洲无线码一区| 亚洲av熟女| 九色成人免费人妻av| 日韩欧美一区二区三区在线观看| 每晚都被弄得嗷嗷叫到高潮| av天堂中文字幕网| 在线国产一区二区在线| 一区二区三区国产精品乱码| 久久伊人香网站| 亚洲avbb在线观看| 在线免费观看不下载黄p国产 | 国内揄拍国产精品人妻在线| 国产精品1区2区在线观看.| 国产av麻豆久久久久久久| 狂野欧美白嫩少妇大欣赏| 精品免费久久久久久久清纯| 欧美日韩中文字幕国产精品一区二区三区| 精品国产美女av久久久久小说| 国产三级中文精品| 三级男女做爰猛烈吃奶摸视频| 国产毛片a区久久久久| 人人妻人人看人人澡| x7x7x7水蜜桃| 日本a在线网址| 国产精品久久久久久精品电影| 不卡一级毛片| 无限看片的www在线观看| 欧美中文综合在线视频| bbb黄色大片| 一本久久中文字幕| 69av精品久久久久久| 午夜福利免费观看在线| 久久久成人免费电影| 日本五十路高清| 成人av一区二区三区在线看| 国产黄片美女视频| 国产亚洲精品av在线| 日本一本二区三区精品| 亚洲第一欧美日韩一区二区三区| 真人一进一出gif抽搐免费| 国产成人精品无人区| 久久这里只有精品中国| 日本成人三级电影网站| 婷婷丁香在线五月| 在线观看日韩欧美| 丝袜人妻中文字幕| 日本a在线网址| 亚洲性夜色夜夜综合| 成人午夜高清在线视频| 精品久久久久久久毛片微露脸| 国产午夜精品久久久久久| 亚洲精品国产精品久久久不卡| 日韩三级视频一区二区三区| 久久中文看片网| 日韩成人在线观看一区二区三区| 又粗又爽又猛毛片免费看| 日本黄色视频三级网站网址| 老熟妇乱子伦视频在线观看| 岛国在线观看网站| 亚洲中文日韩欧美视频| 男女那种视频在线观看| 成人18禁在线播放| 一卡2卡三卡四卡精品乱码亚洲| 色视频www国产| 国产麻豆成人av免费视频| 一本一本综合久久| 亚洲av熟女| 国产成人精品无人区| 国产精品久久久久久人妻精品电影| 九九热线精品视视频播放| 亚洲18禁久久av| 国产精品av视频在线免费观看| 久久久久久九九精品二区国产| 激情在线观看视频在线高清| 亚洲成av人片在线播放无| 亚洲成av人片在线播放无| 真实男女啪啪啪动态图| 亚洲欧美日韩高清在线视频| 啦啦啦韩国在线观看视频| 久久午夜综合久久蜜桃| 欧美日韩亚洲国产一区二区在线观看| 老司机午夜十八禁免费视频| 成年人黄色毛片网站| 嫩草影院入口| 又大又爽又粗| 岛国在线免费视频观看| 亚洲av成人av| 亚洲精品国产精品久久久不卡| 99久久精品热视频| 男女下面进入的视频免费午夜| 97超视频在线观看视频| av欧美777| 亚洲美女黄片视频| 国产一区在线观看成人免费| 国产精品香港三级国产av潘金莲| 免费av毛片视频| 亚洲乱码一区二区免费版| 成人国产综合亚洲| 99国产精品99久久久久| 国产精品野战在线观看| 亚洲国产欧美网| 一级毛片女人18水好多| 国产欧美日韩精品一区二区| 国产伦精品一区二区三区四那| 亚洲av成人一区二区三| 亚洲 欧美一区二区三区| 最新美女视频免费是黄的| 制服人妻中文乱码| 久久国产精品人妻蜜桃| av黄色大香蕉| 蜜桃久久精品国产亚洲av| 蜜桃久久精品国产亚洲av| 亚洲avbb在线观看| 国产精品永久免费网站| 国产激情久久老熟女| 国产人伦9x9x在线观看| 校园春色视频在线观看| av片东京热男人的天堂| 成人鲁丝片一二三区免费| 老司机午夜福利在线观看视频| 欧美丝袜亚洲另类 | 波多野结衣巨乳人妻| 亚洲天堂国产精品一区在线| 伦理电影免费视频| 日本一本二区三区精品| 久久精品亚洲精品国产色婷小说| 中文字幕av在线有码专区| 亚洲在线观看片| 亚洲欧美日韩高清在线视频| 一级毛片高清免费大全| 天天一区二区日本电影三级| 免费无遮挡裸体视频| 999久久久精品免费观看国产| 亚洲精品在线美女| 久久久久亚洲av毛片大全| 91av网一区二区| 国产野战对白在线观看| 久久人人精品亚洲av| 欧美一区二区精品小视频在线| 黄色日韩在线| 999久久久精品免费观看国产| 伊人久久大香线蕉亚洲五| 亚洲国产精品999在线| 久久亚洲精品不卡| 深夜精品福利| 国产精品爽爽va在线观看网站| 老鸭窝网址在线观看| 午夜精品久久久久久毛片777| 最近在线观看免费完整版| www国产在线视频色| 美女高潮的动态| 精品一区二区三区视频在线 | 成在线人永久免费视频| 91av网站免费观看| 夜夜爽天天搞| 日韩高清综合在线| 成人av在线播放网站| 免费在线观看成人毛片| 美女高潮的动态| 亚洲国产精品久久男人天堂| 日日夜夜操网爽| 国产伦在线观看视频一区| 国产精品1区2区在线观看.| 日韩欧美国产一区二区入口| 国内揄拍国产精品人妻在线| 成人特级av手机在线观看| 夜夜爽天天搞| 最近在线观看免费完整版| 99热6这里只有精品| 成熟少妇高潮喷水视频| 亚洲av成人精品一区久久| 人人妻人人看人人澡| 日韩精品中文字幕看吧| 变态另类成人亚洲欧美熟女| 午夜福利在线在线| 欧美又色又爽又黄视频| 波多野结衣高清无吗| 久久精品aⅴ一区二区三区四区| 日本精品一区二区三区蜜桃| 黄频高清免费视频| 俺也久久电影网| 两人在一起打扑克的视频| 特大巨黑吊av在线直播| 免费在线观看日本一区| 岛国在线观看网站| 午夜视频精品福利| 欧美一区二区精品小视频在线| 最好的美女福利视频网| 成人三级黄色视频| 黄色女人牲交| 国产精品日韩av在线免费观看| 精品免费久久久久久久清纯| 男人和女人高潮做爰伦理| 精品熟女少妇八av免费久了| 欧美日韩亚洲国产一区二区在线观看| 国产精品一区二区免费欧美| 亚洲成av人片在线播放无| 国产乱人伦免费视频| 97人妻精品一区二区三区麻豆| 亚洲,欧美精品.| 久久中文字幕人妻熟女| 99riav亚洲国产免费| 国产美女午夜福利| www.精华液| 国产精品电影一区二区三区| 欧美乱色亚洲激情| 亚洲中文字幕一区二区三区有码在线看 | av片东京热男人的天堂| 亚洲国产精品久久男人天堂| 国产精品电影一区二区三区| 757午夜福利合集在线观看| 999久久久精品免费观看国产| 嫩草影视91久久| 国产主播在线观看一区二区| 国产三级黄色录像| 久久亚洲真实| x7x7x7水蜜桃| 最近最新中文字幕大全电影3| 熟妇人妻久久中文字幕3abv| 身体一侧抽搐| 一级a爱片免费观看的视频| 亚洲熟妇熟女久久| 最近最新免费中文字幕在线| 狂野欧美白嫩少妇大欣赏| 国产综合懂色| 嫩草影视91久久| 一进一出好大好爽视频| 91av网站免费观看| 成人性生交大片免费视频hd| 欧美国产日韩亚洲一区| 搡老熟女国产l中国老女人| 亚洲中文字幕日韩| 搡老岳熟女国产| 国产精品av久久久久免费| 熟女人妻精品中文字幕| 精品久久久久久久久久久久久| 又黄又粗又硬又大视频| 神马国产精品三级电影在线观看| 美女黄网站色视频| av视频在线观看入口| 99久久国产精品久久久| 制服人妻中文乱码| 岛国在线观看网站| 欧美日本亚洲视频在线播放| 国产午夜精品久久久久久| 国产精品 国内视频| 99热6这里只有精品| 两个人看的免费小视频| 又黄又爽又免费观看的视频| 久久久国产欧美日韩av| 国内毛片毛片毛片毛片毛片| 欧美一级毛片孕妇| 又紧又爽又黄一区二区| 亚洲美女视频黄频| 亚洲av熟女| 女人被狂操c到高潮| 欧美绝顶高潮抽搐喷水| 男女做爰动态图高潮gif福利片| 男女之事视频高清在线观看| 国产精品亚洲av一区麻豆| 国产精品一区二区三区四区免费观看 | 久久这里只有精品中国| 嫩草影院入口| 成人性生交大片免费视频hd| 亚洲人成电影免费在线| 欧美大码av| 久久久久国产精品人妻aⅴ院| 亚洲最大成人中文| 亚洲 国产 在线| 欧美+亚洲+日韩+国产| 九九久久精品国产亚洲av麻豆 | 丝袜人妻中文字幕| 欧美成人免费av一区二区三区| 日韩欧美在线乱码| 欧美一区二区精品小视频在线| 色综合亚洲欧美另类图片| 51午夜福利影视在线观看| 熟女人妻精品中文字幕| 九色国产91popny在线| 三级男女做爰猛烈吃奶摸视频| 九九久久精品国产亚洲av麻豆 | 国产真实乱freesex| 午夜久久久久精精品| 久久香蕉精品热| 搡老岳熟女国产| 在线观看美女被高潮喷水网站 | 在线国产一区二区在线| 亚洲专区国产一区二区| 亚洲欧美日韩无卡精品| 琪琪午夜伦伦电影理论片6080| 久久久久九九精品影院| 精品久久久久久久久久久久久| 欧美不卡视频在线免费观看| 国产成人系列免费观看| 91av网站免费观看| 女警被强在线播放| 亚洲人成网站高清观看| 国产亚洲av高清不卡| 美女免费视频网站| 欧美成人性av电影在线观看| 亚洲一区高清亚洲精品| 亚洲无线观看免费| 国产高清视频在线播放一区| 国产精品,欧美在线| 男女视频在线观看网站免费| 成年女人毛片免费观看观看9| 国产亚洲精品av在线| 免费在线观看影片大全网站| 91麻豆精品激情在线观看国产| 男女视频在线观看网站免费| 精品日产1卡2卡| 免费无遮挡裸体视频| 亚洲美女视频黄频| 国产成人精品无人区| 两人在一起打扑克的视频| 波多野结衣巨乳人妻| 欧美一区二区精品小视频在线| 亚洲中文av在线| 成人性生交大片免费视频hd| 丁香六月欧美| 不卡一级毛片| 国产精品,欧美在线| 亚洲黑人精品在线| 成人三级做爰电影| 一级毛片女人18水好多| 白带黄色成豆腐渣| 久久亚洲精品不卡| 日日干狠狠操夜夜爽| 老司机午夜福利在线观看视频| 成人高潮视频无遮挡免费网站| 一级a爱片免费观看的视频| 亚洲欧美日韩卡通动漫| 欧美中文综合在线视频| 九九在线视频观看精品| 国产精品一及| 一本一本综合久久| 天堂网av新在线| 国产一级毛片七仙女欲春2| 19禁男女啪啪无遮挡网站| 在线免费观看不下载黄p国产 | 91字幕亚洲| 亚洲精品美女久久久久99蜜臀| 香蕉国产在线看| 国产成人精品久久二区二区免费| 亚洲真实伦在线观看| 日韩欧美免费精品| 国产精品久久电影中文字幕| 又紧又爽又黄一区二区| 久久精品影院6| tocl精华| 国产激情欧美一区二区| 午夜福利18| 99久久无色码亚洲精品果冻| 国产又黄又爽又无遮挡在线| 身体一侧抽搐| 国产精品精品国产色婷婷| xxxwww97欧美| 国产黄片美女视频| 国产精品久久久久久精品电影| 最好的美女福利视频网| 极品教师在线免费播放| 午夜激情福利司机影院| 好看av亚洲va欧美ⅴa在| 日韩欧美精品v在线| 岛国在线免费视频观看| 精品久久久久久成人av| 激情在线观看视频在线高清| 国产蜜桃级精品一区二区三区| 久久天躁狠狠躁夜夜2o2o| 日韩欧美国产在线观看| 熟女电影av网| 国产欧美日韩精品亚洲av| 欧美色欧美亚洲另类二区| 免费av不卡在线播放| 中文字幕熟女人妻在线| 精品久久久久久久久久久久久| 成人特级黄色片久久久久久久| 国产精品一区二区三区四区久久| 亚洲成人久久爱视频| 好看av亚洲va欧美ⅴa在| 欧美在线黄色| 免费看十八禁软件| 啦啦啦观看免费观看视频高清| 成人国产一区最新在线观看| 叶爱在线成人免费视频播放| 性欧美人与动物交配| 欧美激情久久久久久爽电影| 在线永久观看黄色视频| 一本久久中文字幕| 美女被艹到高潮喷水动态| 神马国产精品三级电影在线观看| 国产精品久久久久久人妻精品电影| 99久久成人亚洲精品观看| 中文亚洲av片在线观看爽| 露出奶头的视频| 久久午夜综合久久蜜桃| 久久精品人妻少妇| 久久亚洲真实| 日韩大尺度精品在线看网址| 亚洲乱码一区二区免费版| 免费搜索国产男女视频| 中文字幕久久专区| 日韩成人在线观看一区二区三区| 日韩av在线大香蕉| 男女那种视频在线观看| 亚洲专区中文字幕在线| 精品国产乱码久久久久久男人| www.熟女人妻精品国产| 国产三级中文精品| 午夜免费激情av| 国产伦精品一区二区三区四那| 亚洲欧美日韩无卡精品| 国产高清有码在线观看视频| 校园春色视频在线观看| 久久精品91蜜桃| a级毛片a级免费在线| 亚洲精品乱码久久久v下载方式 | 国产精品亚洲美女久久久| 美女午夜性视频免费| 美女cb高潮喷水在线观看 | 99精品欧美一区二区三区四区| 无人区码免费观看不卡| 亚洲国产精品合色在线| 久久婷婷人人爽人人干人人爱| 国产欧美日韩一区二区精品| 真人做人爱边吃奶动态| 男女做爰动态图高潮gif福利片| 精品熟女少妇八av免费久了| 免费看光身美女| 免费高清视频大片| 午夜免费激情av| 色哟哟哟哟哟哟| 日韩欧美免费精品| 精品一区二区三区av网在线观看| 亚洲专区中文字幕在线| 国产精品久久久久久人妻精品电影| 人妻丰满熟妇av一区二区三区| 免费在线观看影片大全网站| 91在线精品国自产拍蜜月 | av视频在线观看入口| www.熟女人妻精品国产| 婷婷精品国产亚洲av在线| 国产精品久久视频播放| 国产激情偷乱视频一区二区| 99久久精品热视频| 99久久精品国产亚洲精品| 九九在线视频观看精品| 国产伦人伦偷精品视频| 午夜久久久久精精品| 亚洲美女黄片视频| 国产亚洲av嫩草精品影院| 免费在线观看视频国产中文字幕亚洲| 国产精品一区二区三区四区久久| 女人被狂操c到高潮| av在线蜜桃| 欧美在线一区亚洲| 少妇的逼水好多| 99久久精品热视频| 国产视频内射| 精品国产亚洲在线| 亚洲七黄色美女视频| 精品一区二区三区av网在线观看| 精品国产三级普通话版| 欧美中文日本在线观看视频| 精品一区二区三区视频在线观看免费| 男女午夜视频在线观看| 99久久无色码亚洲精品果冻| 国产成+人综合+亚洲专区| 哪里可以看免费的av片| 精品99又大又爽又粗少妇毛片 | 又粗又爽又猛毛片免费看| 国产精品久久久久久人妻精品电影| 18禁黄网站禁片午夜丰满| 日本成人三级电影网站| 偷拍熟女少妇极品色| 久久热在线av| www日本黄色视频网| 久久这里只有精品19| 不卡一级毛片| 亚洲国产欧美一区二区综合| 国产亚洲精品av在线| 国产av不卡久久| 级片在线观看| 美女大奶头视频| 久久这里只有精品19| 国产午夜福利久久久久久| 老鸭窝网址在线观看| 中文资源天堂在线| 在线免费观看的www视频| 欧美日韩亚洲国产一区二区在线观看| 18禁观看日本| 国产成人影院久久av| 欧美精品啪啪一区二区三区| 亚洲国产欧美人成| 国产高清三级在线| 国内揄拍国产精品人妻在线| 色视频www国产| 又粗又爽又猛毛片免费看| 青草久久国产| 黄色成人免费大全| 69av精品久久久久久| 香蕉久久夜色| 90打野战视频偷拍视频| 精品国产乱子伦一区二区三区| 亚洲片人在线观看| 熟女少妇亚洲综合色aaa.| 亚洲成人中文字幕在线播放| 欧美日韩福利视频一区二区| 1000部很黄的大片| 国产真实乱freesex| 全区人妻精品视频| 午夜亚洲福利在线播放| 亚洲国产日韩欧美精品在线观看 | 婷婷精品国产亚洲av在线| 久久久国产成人免费| 国产亚洲av高清不卡| 欧美zozozo另类| 欧美乱色亚洲激情| 90打野战视频偷拍视频| 日韩大尺度精品在线看网址| 午夜免费观看网址| 欧美日韩亚洲国产一区二区在线观看| 亚洲自拍偷在线| 无人区码免费观看不卡| 成人av一区二区三区在线看| 亚洲五月婷婷丁香| 黄色成人免费大全| 欧美激情在线99| 搞女人的毛片| 欧美性猛交╳xxx乱大交人| 亚洲午夜理论影院| 久久久精品欧美日韩精品| 黑人操中国人逼视频| 国产精品爽爽va在线观看网站| 99国产精品99久久久久| 床上黄色一级片| 久久久久性生活片| 人人妻,人人澡人人爽秒播| 99热6这里只有精品| 日本免费一区二区三区高清不卡| 1024手机看黄色片| 一区二区三区高清视频在线| 麻豆成人午夜福利视频| 伊人久久大香线蕉亚洲五| 三级毛片av免费| 日韩欧美 国产精品| 精品欧美国产一区二区三| 老汉色∧v一级毛片| 亚洲人成电影免费在线| 91字幕亚洲| 午夜激情福利司机影院| 此物有八面人人有两片| 亚洲成a人片在线一区二区| 欧美av亚洲av综合av国产av| www国产在线视频色| 日本 av在线| 亚洲欧洲精品一区二区精品久久久| 精品国产美女av久久久久小说| 亚洲精品456在线播放app | 男人舔女人下体高潮全视频| 校园春色视频在线观看| 久久精品国产亚洲av香蕉五月| 高清在线国产一区| 亚洲激情在线av| 国产精品一区二区免费欧美| 久久久水蜜桃国产精品网| 天堂网av新在线| 亚洲精品美女久久av网站| 国产精品电影一区二区三区| 色综合站精品国产| 亚洲国产欧美网| 香蕉丝袜av| 激情在线观看视频在线高清| 亚洲黑人精品在线| 一个人看的www免费观看视频| 精品久久久久久久末码| 在线a可以看的网站| 国产成人影院久久av| 一区二区三区激情视频| 精品一区二区三区视频在线 | 成人国产综合亚洲| 国产伦人伦偷精品视频| 超碰成人久久| 亚洲精品中文字幕一二三四区| 欧美激情久久久久久爽电影| 免费看美女性在线毛片视频| 老司机深夜福利视频在线观看| 亚洲黑人精品在线| av天堂中文字幕网| 亚洲成av人片免费观看| 1000部很黄的大片| 亚洲人与动物交配视频| 成人国产一区最新在线观看| 色视频www国产|