• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    一種面向財務(wù)文本分類的TF-IDF改進算法

    2020-02-22 03:09:35孫德華孫晨
    現(xiàn)代信息科技 2020年18期
    關(guān)鍵詞:特征詞詞頻準(zhǔn)確率

    孫德華 孫晨

    摘? 要:結(jié)合財務(wù)文本特征,對TF-IDF方法在應(yīng)用到財務(wù)文本分類時的不足進行了分析,提出了一種新的特征詞權(quán)重計算方法(SNGTI-LFDF)。該算法以TF-IDF方法為基礎(chǔ),引入停用詞失效的N-Gram方法和特征詞位置詞頻因子,保留特征詞位置信息并改善了特征詞的權(quán)重分配。采用樸素貝葉斯方法對分類性能進行了驗證,實驗結(jié)果表明,相對于TF-IDF和同類改進算法TF-IDF-DL,SNGTI-LFDF方法取得了更高的準(zhǔn)確率、召回率和F1值。因此該算法在能較好地提高財務(wù)文本分類性能。

    關(guān)鍵詞:TF-IDF;N-Gram;位置因子;SNGTI-LFDF;財務(wù)文本分類

    中圖分類號:TP301.6? ? ? 文獻標(biāo)識碼:A 文章編號:2096-4706(2020)18-0107-05

    Abstract:Combining with the characteristics of financial texts,the TF-IDF algorithm was investigated for its shortcomings when applied to financial text classification,and a new algorithm for calculating the weight of feature words (SNGTI-LFDF) was proposed. This algorithm is based on TF-IDF method,and introduces the N-Gram method of invalid stop words and term frequency location factor,which retains the location information of the feature word and improves the weight distribution of the feature word. The Naive Bayes method is used to verify the classification performance. The experimental results show that compared with TF-IDF and the similar algorithm TF-IDF-DL,the SNGTI-LFDF method achieves higher accuracy,recall and F1 value. Therefore,the algorithm is better improving the performance of financial text classification.

    Keywords:TF-IDF;N-Gram;location factor;SNGTI-LFDF;financial text classification

    0? 引? 言

    隨著信息技術(shù)的發(fā)展,網(wǎng)絡(luò)文本充斥著人們生活的方方面面,財務(wù)文本是網(wǎng)絡(luò)文本中的一大分支,在財務(wù)危機預(yù)測[1]、資本市場調(diào)研、企業(yè)管理等方面都有重要的指示作用。就財務(wù)文本的性質(zhì)和作用可以將其劃分為政策類財務(wù)文本、規(guī)章制度類財務(wù)文本、統(tǒng)計數(shù)據(jù)類財務(wù)文本。其中政策類財務(wù)文本是國家各行政部門、企業(yè)財務(wù)部門等針對財務(wù)狀況出臺的一系列財務(wù)管理的方針、政策,這類文本為個人和企業(yè)提供政策指引,做出更好的財務(wù)決策;規(guī)章制度類財務(wù)文本是各企業(yè)制定的符合企業(yè)發(fā)展的章程,對企業(yè)和財務(wù)工作者制定符合其發(fā)展的規(guī)章制度有很高的參考價值;統(tǒng)計數(shù)據(jù)類財務(wù)文本是符合客觀財務(wù)信息并能反映一段時間內(nèi)企業(yè)財務(wù)狀況的文本,統(tǒng)計類財務(wù)文本可以幫助規(guī)避投資風(fēng)險、預(yù)防財務(wù)詐騙等。然而在這個大數(shù)據(jù)時代下,各類財務(wù)錯綜復(fù)雜,使得我們很難快速準(zhǔn)確地找到所需類別的財務(wù)文本,由于缺乏信息資料進而造成損失。作者結(jié)合實習(xí)項目“財務(wù)機器人”的開發(fā),對智能財務(wù)機器人的實現(xiàn)進行了深入調(diào)研,智能財務(wù)機器人的實現(xiàn)要依據(jù)大量的已知類別的財務(wù)文本,通過學(xué)習(xí)每種類別的文本的特征,總結(jié)經(jīng)驗,實現(xiàn)智能化。因此如何快速準(zhǔn)確地對財務(wù)文本進行分類就成了一個待解決的課題,傳統(tǒng)的基于人工進行財務(wù)文本分類同時存在效率低下和人為失誤不可避免等問題。機器學(xué)習(xí)和人工智能技術(shù)的發(fā)展使得自動高效地進行財務(wù)文本分類[2]變成了可能,有效地改善了人工分類時所帶來的問題,它通過學(xué)習(xí)已標(biāo)記類別的文本集,建立文本特征詞與文本類別之間的關(guān)系模型,進而通過該模型對新的文本進行類別判定。

    對文本進行分類要遵循文本所具有的特征。本文擬根據(jù)財務(wù)文本特征定向的改進文本分類中常用的方法——TF-IDF算法[3],以較好地提升財務(wù)文本分類的性能。因此本文收集調(diào)研了大量的財務(wù)文本并對財務(wù)文本的特征總結(jié)為:

    (1)財務(wù)特征詞的不可分割性:財務(wù)特征詞又可叫作財務(wù)術(shù)語,不可分割性是指一旦分割就會偏離原詞所表達的含義。如“固定資產(chǎn)”雖然可以被拆分為“固定”和“資產(chǎn)”兩個有實際意義的詞,但是其已經(jīng)偏離了原特征詞所表示的含義;

    (2)財務(wù)文本結(jié)構(gòu)的嚴(yán)謹(jǐn)性:結(jié)構(gòu)的嚴(yán)謹(jǐn)性是指大多數(shù)財務(wù)文本都符合類似“總分總”這樣的文本特征,在文本始末都會出現(xiàn)對文本進行總結(jié)的內(nèi)容。

    TF-IDF算法是一種基于詞頻統(tǒng)計的特征權(quán)重計算方法,通過計算詞頻和逆文檔頻率來計算特征詞的權(quán)重,在應(yīng)用到文本分類時取得了良好的效果,但是傳統(tǒng)的TF-IDF方法還存在有明顯的缺陷,第一,依賴于特征詞提取的效果,在特征詞提取準(zhǔn)確率不高的情況下,分類性能較低;第二,未考慮特征詞出現(xiàn)的位置信息,默認(rèn)賦予所有特征詞同樣的權(quán)重。基于此,結(jié)合財務(wù)文本的特性,本文的主要工作為:

    (1)引入了基于去停用詞的N-Gram方法,在豐富特征詞的同時清除了無效特征詞帶來的影響;

    (2)引入特征詞位置因子,加重符合文本主題的特征詞的權(quán)重;

    (3)提出了基于N-Gram特征詞失效和位置因子和詞頻統(tǒng)計的TF-IDF方法(SNGTI-LFDF)并在財務(wù)數(shù)據(jù)集上取得了良好的效果。

    1? 相關(guān)工作

    為了考慮一個詞語對其上若干個詞語的依賴關(guān)系,Jestes[4]等人在2013年便提出了N-Gram的概念,N-Gram在保留詞匯的特征信息的同時也保留了特征詞的位置信息;文獻[5]將N-Gram方法用到計算機病毒特征碼的提取中,取得了較好的結(jié)果;文獻[6]在SQL注入檢測中結(jié)合N-Gram中提取SQL語句固定維數(shù)的特征向量,提高了檢測率降低了誤報率;文獻[7]將N-Gram模型結(jié)合卷積神經(jīng)網(wǎng)絡(luò),從而提升了短文本分類的分類性能。文獻[5-7]的結(jié)果表明,N-Gram方法與特定領(lǐng)域結(jié)合使用時,可以在一定程度上取得較好的效果。

    對于TF-IDF算法來說,其核心就是特征詞的權(quán)重計算,計算方式為:

    其中,wi,k為文本i中的第k個特征詞的權(quán)重。針對傳統(tǒng)的TF-IDF算法存在的不足,眾多學(xué)者都其進行了研究改進。文獻[8]通過改進特征詞權(quán)重計算,提出詞頻-逆重力矩計算方法,提升分類效果;文獻[9]引入去中心化詞頻因子和特征詞位置因子,加強特征權(quán)重的準(zhǔn)確性;文獻[10]將新詞納入TF-IDF的權(quán)重計算中,達到了特征降維的目的,提升了文本分類的效果;文獻[11-12]均引入權(quán)重影響因子,對TF-IDF算法的權(quán)重進行優(yōu)化,這些改進算法雖然提升了文本分類的準(zhǔn)確率,但其在應(yīng)用到財務(wù)文本分類時,由于未結(jié)合財務(wù)文本特征,還存在著一定的局限性。

    2? 改進的TF-IDF權(quán)重計算方法

    2.1? 基于停用詞失效的N-Gram方法

    N-Gram方法是從一個句子中提取連續(xù)的N個字的字符串集合,可以獲取到字的前后信息的同時還可以提高特征詞提取的豐富程度。例如“資產(chǎn)轉(zhuǎn)移手段”,如果按照傳統(tǒng)的TF-IDF涉及的關(guān)鍵詞計算過程,其關(guān)鍵詞信息只有“資產(chǎn)、轉(zhuǎn)移、手段”,但結(jié)合N-Gram方法進行詞匯特征的選取,以2-Gram為例,程序和執(zhí)行結(jié)果如下所示:

    In[1]: content = “資產(chǎn)轉(zhuǎn)移的手段”

    ...: ls_word = list(content)

    ...: bigram = []

    ...: for i in range(len(ls_word)-1):

    ...:? ? word = “”

    ...:? ? ?for j in range(i,i+2):

    ...:? ? ? ? ?word+=ls_word[j]

    ...:? ? ?bigram.append(word)

    ...: print(bigram)

    [“資產(chǎn)”,“產(chǎn)轉(zhuǎn)”,“轉(zhuǎn)移”,“移的”,“的手”,“手段”]

    由以上結(jié)果可以看出,原來僅有的3個特征詞,經(jīng)過2-Gram的處理變長到了6個,特征詞的豐富程度得到了極大的提升,但這種方式也帶來了無效特征詞的干擾,如上述結(jié)果中的“產(chǎn)轉(zhuǎn)、移的、的手”,這類特征詞不僅不具備特定的意義而且還會對文本處理的結(jié)果產(chǎn)生干擾,影響文本分類的性能。其中部分的無效特征詞可以通過一定的手段將其識別并從特征詞分詞表中刪除,如“移的、的手”兩詞都包含有字符“的”,而“的”通常是描述定語和形容詞之間的修飾關(guān)系,與其組成的詞在語義上無任何意義,相同的一類詞在文本中經(jīng)常出現(xiàn)的還有“是、為、也、了、個”等,與這些詞組成的特征詞在語義上無任何意義,因而又被稱為停用詞。停用詞失效是指一個特征詞如果包含有停用詞,那么這個特征詞是無意義的,對文本分類結(jié)果產(chǎn)生負(fù)面影響。

    基于停用詞失效的N-Gram方法就是在使用N-Gram方法進行特征詞劃分選取時,對特征詞是否包含停用詞進行判別,判別公式如式(2)所示:

    其中,termi,k指文本i中的第k個特征詞,validi,k第k個特征詞的有效性,stw指停用詞。

    其具體步驟為:

    (1)使用N-Gram方法對文本處理得到一個特征詞集合TC;

    (2)使用式(2)對TC中的第k個特征詞進行有效性判定,結(jié)果為True則轉(zhuǎn)到步驟(3);若結(jié)果為False,轉(zhuǎn)到(4);

    (3)從TC移除當(dāng)前的第k個特征詞,TC長度減1;

    (4)k加1,轉(zhuǎn)到(2),直到k值等于TC的長度,結(jié)束處理過程。

    2.2? 特征詞位置詞頻影響因子

    在財務(wù)文檔中,大多數(shù)文檔都符合中文文本“總分總”的結(jié)構(gòu),即在文本的開始和末尾都會包含符合文本主題的特征詞信息,這類特征詞對文本較為重要,應(yīng)該賦予更高的權(quán)重,所以本文將特征詞的位置信息作為特征詞權(quán)重調(diào)節(jié)的重要影響因子。以1為度量單位,將所有的特征詞以第一次出現(xiàn)的位置排列成一個序列,取文本序列最中間的位置為原點,建立二維直角坐標(biāo)系,x軸存儲特征詞的相對位置信息,y軸存儲特征詞的詞頻(Term Frequency,TF)信息,以原點為基礎(chǔ),計算其他特征詞與原點的距離(x軸絕對距離),距離越大,說明其越是位于文本的開始或者末尾,應(yīng)該賦予更高的權(quán)重。在一份文檔中,文本的開始和末尾包含有若干特征詞,特征詞的TF值可以客觀地反映特征詞對文本的重要程度,將特征詞位置因子和詞頻因子結(jié)合,距離越遠、頻次越高的特征詞對文本更重要,應(yīng)賦予更高的權(quán)重。但在實際處理過程中,會出現(xiàn)某個特征詞在長文本中出現(xiàn)的頻次比短文本中出現(xiàn)頻次高,產(chǎn)生偏袒長文本的現(xiàn)象,因此需要對TF值進行規(guī)范化處理,通過取特征詞的詞頻和文本中特征詞的總數(shù)的比值定義規(guī)范化公式如式(3)所示:

    其中,RTFi,x為規(guī)范化處理后的詞頻值,結(jié)果取兩位小數(shù)點,Mi為文本i包含的特征詞的總數(shù),TFi,x為文檔i中位置x的特征詞的詞頻。

    將位置因子和詞頻因子結(jié)合,定義位置詞頻(Location Factor Term Frequency,LFDF)影響因子,要增加的文本i中x位置的權(quán)重LFDF值計算如式(4)所示:

    其中,ε為權(quán)重值倍數(shù),范圍在(1,+)之間,η的范圍在(0,D/2)之間,D為序列總長度。

    2.3? SNGTI-LFDF算法

    將基于停用詞失效的N-Gram方法與特征詞位置詞頻影響因子相結(jié)合,定義基于停用詞失效和改進TF-IDF算法的特征詞權(quán)重計算算法(SNGTI-LFDF),算法步驟為:

    (1)引入N-Gram模型,使用2.1章節(jié)的方法對特征詞集處理,得到一個有效特征詞集合;

    (2)引入特征詞位置詞頻影響因子,使用式(4)計算特征詞的LFDF值;

    (3)將特征詞的位置詞頻影響因子納入TF-IDF權(quán)重計算公式中,最終得到SNGTI-LFDF公式,由式(1)和式(4)得:

    其中,weighti,k為由SNGTI-LFDF算法計算的文本i中第k個特征詞的權(quán)重值。

    3? 實驗與結(jié)果分析

    3.1? 實驗數(shù)據(jù)

    目前公開的數(shù)據(jù)集中少有中文財務(wù)文本檔,本文從國內(nèi)一些財經(jīng)網(wǎng)站和相關(guān)金融媒體微博、公眾號等搜集整理了一個包含3 720條數(shù)據(jù)的財務(wù)文本集,其數(shù)據(jù)遵循的格式為:

    差旅費用報銷管理制度

    為了保證出差人員工作和生活的需要,合理使用差旅費用,提高出差效率,特制定差旅費用報銷管理制度。

    交通工具按標(biāo)準(zhǔn)乘坐,采用實報實銷制……

    ……

    差旅費用報銷制度即日起施行

    同時,對獲取的文檔進行分類處理,將其劃分為政策類、統(tǒng)計類、制度類三種類型的文本,各類文本的測試集和訓(xùn)練集數(shù)量的劃分如表1所示。

    3.2? 實驗步驟

    本文采用傳統(tǒng)的TF-IDF算法、文獻[8]中的TF-IDF-DL算法和SNGTI-LFDF算法進行特征詞權(quán)重計算。并使用樸素貝葉斯方法實現(xiàn)對文本的分類,結(jié)合實驗結(jié)果進行分析,具體實驗步驟為:

    (1)提取特征詞并將生成的特征詞轉(zhuǎn)化詞頻向量;

    (2)分別采用傳統(tǒng)TF-IDF、TF-IDF-DL和SNGTI-LFDF算法對特征詞的權(quán)重進行計算,選取權(quán)重最高的M個特征詞;

    (3)將訓(xùn)練集文本的特征詞送入到樸素貝葉斯分類器,訓(xùn)練分類器模型;

    (4)對測試文本按照樸素貝葉斯理論[13]進行相似度的計算,對最后相似度的大小排序,選擇相似度最大的作為待分類文本的類別;

    (5)對比分析實驗結(jié)果。使用準(zhǔn)確率、召回率、和F1值作為分類器性能的評估指標(biāo)。其中準(zhǔn)確率指分類結(jié)果中正確分類為A類別的樣本數(shù)占所有分類為A類別的樣本數(shù)的比例;召回率指分類結(jié)果中正確分類為A類別的樣本數(shù)占實際為A類別的樣本數(shù)的比例;F1值為準(zhǔn)確率和召回率的調(diào)和平均值。

    3.3? 實驗對比

    采用SNGTI-LFDF算法進行特征詞權(quán)重計算時,首先需要計算出需要選取的N-Gram方法中的N值來完成特征詞的劃分。由于N-Gram方法也適用于所有的權(quán)重計算方法,本文采用TF-IDF方法對不同的N值設(shè)定的情況下,財務(wù)文本集分類的準(zhǔn)確率結(jié)果進行了計算驗證,結(jié)果如表2所示。由表2可知,分類的準(zhǔn)確率、召回率和F1值隨著N值的增加均有上升的趨勢,在N=4時,分類的準(zhǔn)確率、召回率和F1值均達到最高,而后隨著N值的增加分類的性能不斷降低,因此可以斷定4為分類的一個峰值,應(yīng)采用4-Gram作為本文的特征詞劃分方法。

    3.3.1? 參數(shù)選擇

    在文本分類中,特征詞的選取直接關(guān)系到文本分類的結(jié)果。少量的特征詞不能準(zhǔn)確的表達文本的主題,造成文本分類效果較差,但特征詞數(shù)量過大,也會對實驗產(chǎn)生一定的消極影響。因此在分類前,首先要計算出需要送入樸素貝葉斯分類器中的權(quán)重值最高的M個特征詞數(shù)量M。由于特征詞數(shù)量的選取適用于所有的權(quán)重值計算方法,因此本文采用傳統(tǒng)的TF-IDF方法在財務(wù)數(shù)據(jù)集上的文本分類的準(zhǔn)確率和時間兩個方面綜合考慮M值的選取,圖1為特征詞數(shù)量對分類的準(zhǔn)確率的影響。

    假設(shè)文本i中的特征詞的總數(shù)量為D,由圖1可知,當(dāng)選取的特征詞數(shù)量M占總量D的40%左右時分類的準(zhǔn)確率增長速度開始變慢,由圖2可知,當(dāng)M占總量D的50%時,分類需要的時間開始急劇增加。因此,為了兼顧文本分類的準(zhǔn)確率和時間性能,本實驗選取中間值45%作為每個文本作為分類的特征詞數(shù)量比例,即M=0.45×D。

    此外還需要計算出特征詞位置信息的影響因子ε和η的值。η值反應(yīng)特征詞的位置信息,ε為加權(quán)因子。本文等比例地從三個種類的財務(wù)文本集中抽取200個文本,其中政策類財務(wù)文本70個、統(tǒng)計類財務(wù)文本82個,制度類財務(wù)文本48個,對每個文本經(jīng)過4-Gram方法進行分詞后,分別計算每個財務(wù)文本的始末特征詞數(shù)量與文本特征詞總數(shù)量的商,得到一個文本比例數(shù)據(jù)集,經(jīng)過對數(shù)據(jù)集進行分析,發(fā)現(xiàn)其符合均值μ為0.12,方差σ為0.03的正態(tài)分布,其分布如圖2所示,因此可以假設(shè)所有的財務(wù)文本的始末特征詞數(shù)量與特征詞總數(shù)量的商也都符合這一分布,即需要根據(jù)位置信息對特征詞進行加權(quán)操作的特征詞數(shù)量占總特征詞數(shù)量的12%,此外,對這200個文本進行平均特征詞權(quán)重數(shù)量的計算,得到每個文本平均特征詞數(shù)量為545,由于這200個文本是隨機選取的,可以認(rèn)為整財務(wù)文本數(shù)據(jù)集中的平均特征詞數(shù)量為545,因此η的最優(yōu)值計算為545×(1-0.12)/2,即η=240。

    在η值確定后,把ε作為變量,對財務(wù)文本分類的準(zhǔn)確率進行了驗證,結(jié)果如圖3所示。

    由圖3可知,隨著加權(quán)因子ε的增加,文本分類的準(zhǔn)確率也會有一定的提升,但在ε值達到1.4時,分類的準(zhǔn)確率達到峰值,此后ε值再增加,分類的準(zhǔn)確率反而會降低,因此本文選取ε=1.4作為特征詞權(quán)重的調(diào)節(jié)值。

    3.3.2? 結(jié)果分析

    完成了對各個實驗參數(shù)的求解,分別使用TF-IDF、TF-IDF-DL和SNGTI-LFDF算法對財務(wù)數(shù)據(jù)文本進行特征詞權(quán)重的計算,并將訓(xùn)練集文本的特征詞經(jīng)由貝葉斯方法訓(xùn)練得到樸素貝葉斯分類器,對測試集文本進行驗證,記錄每個方法計算得到的準(zhǔn)確率、召回率和F1值,結(jié)果如圖4所示。

    通過實驗對比,由圖4可知,SNGTI-LFDF算法在財務(wù)文本分類的準(zhǔn)確率、召回率以及F1值的性能表現(xiàn)方面都較TF-IDF和TF-IDF-DL算法有了較明顯的提升。其中SNGTI-LFDF的準(zhǔn)確率、召回率以及F1值較TF-IDF方法分別提升了20.3%、23.0%和21.7%,較TF-IDF-DL算法分別提升了5.3%、5.0%和5.2%。說明SNGTI-LFDF在財務(wù)文本分類中,能適應(yīng)財務(wù)文本的特征,分類效果更好,是一種良好的特征詞權(quán)重計算方法。

    4? 結(jié)? 論

    通過調(diào)研財務(wù)文本的特征,總結(jié)TF-IDF方法在應(yīng)用到財務(wù)文本分類中存在的不足,引入N-Gram方法進行財務(wù)文本特征詞提取的同時引入特征詞位置因子對TF-IDF方法進行改進,提出SNGTI-LFDF算法并結(jié)合樸素貝葉斯方法對算法的性能進行驗證。實驗采用自整理的財務(wù)文本數(shù)據(jù)集,結(jié)果表明該算法在財務(wù)文本分類中取得了較高的準(zhǔn)確率、召回率和F1值,較好地提升了財務(wù)文本分類的效果。

    參考文獻:

    [1] 劉佳明.引入財務(wù)狀態(tài)分析的上市公司財務(wù)危機預(yù)測方法研究 [D].哈爾濱:哈爾濱工業(yè)大學(xué),2018.

    [2] 蘇金樹,張博鋒,徐昕.基于機器學(xué)習(xí)的文本分類技術(shù)研究進展 [J].軟件學(xué)報,2006(9):1848-1859.

    [3] QU Z,SONG X,ZHENG S,et al. Improved Bayes Method Based on TF-IDF Feature and Grade Factor Feature for Chinese Information Classification [C]// 2018 IEEE International Conference on Big Data and Smart Computing (BigComp),2018:677-680.

    [4] KIM Y,PARK H,SHIM K,et al. Efficient processing of substring match queries with inverted variable-length gram indexes [J]. Information Sciences,2013,244:119-141.

    [5] YANG Y,JIANG G P.Improved Method of Computer Virus Signature Automatic Extraction Basedon N-Gram [J]. Computer Science,2017,44(S2):338-341(in Chinese).

    [6] 萬卓昊,徐冬冬,梁生,等.基于N-Gram的SQL注入檢測研究 [J].計算機科學(xué),2019,46(7):108-113.

    [7] WANG H T,HE J,ZHANG X H,et al. A Short Text Classification Method Based on N-Gram and CNN [J]. Chinese Journal of Electronics,2020,29(2):248-254.

    [8] CHEN K W,ZHANG Z P,LONG J,et al. Turning from TF-IDF to TF-IGM for term weighting in text classification [J]. Expert Systems With Applications,2016,66:245-260.

    [9] 許甜華,吳明禮.一種基于TF-IDF的樸素貝葉斯算法改進 [J].計算機技術(shù)與發(fā)展,2020,30(2):75-79.

    [10] 葉雪梅,毛雪岷,夏錦春,等.文本分類TF-IDF算法的改進研究 [J].計算機工程與應(yīng)用,2019,55(2):104-109+161.

    [11] 董蕊芳,柳長安,楊國田.一種基于改進TF-IDF的SLAM回環(huán)檢測算法 [J].東南大學(xué)學(xué)報(自然科學(xué)版),2019,49(2):251-258.

    [12] 但唐朋,許天成,張姝涵.基于改進TF-IDF特征的中文文本分類系統(tǒng) [J].計算機與數(shù)字工程,2020,48(3):556-560.

    [13] LIU P,ZHAO H H,TENG J Y,et al. Parallel naive Bayes algorithm for large-scale Chinese text classification based on spark [J].Journal of Central South University,2019,26(1):1-12.

    作者簡介:孫德華(1994—),男,漢族,河南周口人,碩士研究生在讀,研究方向:自然語言處理。

    猜你喜歡
    特征詞詞頻準(zhǔn)確率
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
    健康之家(2021年19期)2021-05-23 11:17:39
    不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
    2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
    高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
    基于改進TFIDF算法的郵件分類技術(shù)
    產(chǎn)品評論文本中特征詞提取及其關(guān)聯(lián)模型構(gòu)建與應(yīng)用
    詞頻,一部隱秘的歷史
    面向文本分類的特征詞選取方法研究與改進
    云存儲中支持詞頻和用戶喜好的密文模糊檢索
    真实男女啪啪啪动态图| 我的女老师完整版在线观看| 91久久精品国产一区二区成人| 国产淫片久久久久久久久| 亚洲精品乱码久久久v下载方式| 国产免费男女视频| 婷婷精品国产亚洲av在线| 免费av毛片视频| 日本免费a在线| 国产中年淑女户外野战色| 国内精品久久久久精免费| 欧美区成人在线视频| 婷婷六月久久综合丁香| 亚洲高清免费不卡视频| 欧美国产日韩亚洲一区| 国产免费男女视频| 国内揄拍国产精品人妻在线| 一夜夜www| 欧美色欧美亚洲另类二区| 国产激情偷乱视频一区二区| 中文字幕av成人在线电影| 99久久精品热视频| 亚洲av.av天堂| 天堂av国产一区二区熟女人妻| 亚洲精品乱码久久久v下载方式| 亚洲国产精品久久男人天堂| 国产精品伦人一区二区| 91精品国产九色| 亚洲av电影不卡..在线观看| 在线播放国产精品三级| 人妻丰满熟妇av一区二区三区| 亚洲人成网站在线观看播放| 欧美人与善性xxx| h日本视频在线播放| 欧美区成人在线视频| 午夜福利高清视频| 亚洲欧美日韩无卡精品| 午夜a级毛片| 91麻豆精品激情在线观看国产| 国国产精品蜜臀av免费| 丝袜美腿在线中文| 99热这里只有精品一区| 亚洲人成网站在线播放欧美日韩| 亚洲av免费在线观看| 午夜免费激情av| 国内久久婷婷六月综合欲色啪| 白带黄色成豆腐渣| 国产高清激情床上av| 日韩av在线大香蕉| 国产精品永久免费网站| 三级国产精品欧美在线观看| 一级毛片电影观看 | 久久精品夜夜夜夜夜久久蜜豆| 日日干狠狠操夜夜爽| 国产v大片淫在线免费观看| 欧美+日韩+精品| 午夜福利18| 最近视频中文字幕2019在线8| 少妇人妻精品综合一区二区 | 不卡视频在线观看欧美| 久久亚洲精品不卡| 97热精品久久久久久| 亚洲av电影不卡..在线观看| 少妇高潮的动态图| 久久中文看片网| 亚洲精品国产av成人精品 | 久久精品综合一区二区三区| 99热这里只有是精品在线观看| 在线播放无遮挡| 午夜福利18| 亚洲七黄色美女视频| 精品日产1卡2卡| 看免费成人av毛片| 国产私拍福利视频在线观看| 麻豆成人午夜福利视频| 亚洲中文日韩欧美视频| 精品久久久久久久久亚洲| 天美传媒精品一区二区| 级片在线观看| ponron亚洲| 国产精品爽爽va在线观看网站| 一级黄片播放器| 午夜日韩欧美国产| 男人舔女人下体高潮全视频| 久久久久国内视频| 国产欧美日韩精品一区二区| 亚洲精品日韩在线中文字幕 | 干丝袜人妻中文字幕| 搞女人的毛片| 国产精品国产三级国产av玫瑰| 亚洲av免费高清在线观看| 亚洲欧美日韩高清在线视频| 一进一出抽搐gif免费好疼| 我要看日韩黄色一级片| 少妇人妻精品综合一区二区 | 欧美日韩综合久久久久久| 丰满的人妻完整版| 久久久色成人| a级一级毛片免费在线观看| 国产精品久久久久久亚洲av鲁大| 色播亚洲综合网| av黄色大香蕉| 国产乱人视频| 欧美激情在线99| 亚洲久久久久久中文字幕| 国产高清不卡午夜福利| a级毛片免费高清观看在线播放| 麻豆精品久久久久久蜜桃| 久久久久久久久久成人| 免费电影在线观看免费观看| 热99re8久久精品国产| 国产伦精品一区二区三区四那| 亚洲精品在线观看二区| 国产精品久久久久久av不卡| 男女那种视频在线观看| 人人妻人人澡欧美一区二区| av卡一久久| 国产在线精品亚洲第一网站| 99国产极品粉嫩在线观看| 天美传媒精品一区二区| 亚洲国产精品国产精品| 精品一区二区三区视频在线观看免费| 我要看日韩黄色一级片| 女的被弄到高潮叫床怎么办| 精品不卡国产一区二区三区| 国产一区二区亚洲精品在线观看| 干丝袜人妻中文字幕| 精品福利观看| 丰满乱子伦码专区| 别揉我奶头 嗯啊视频| av.在线天堂| 国产精品三级大全| 九九爱精品视频在线观看| 亚洲电影在线观看av| 久久久久久久午夜电影| 久久精品国产99精品国产亚洲性色| 白带黄色成豆腐渣| 丰满乱子伦码专区| 精品久久久久久久久久久久久| 成年女人看的毛片在线观看| 免费看美女性在线毛片视频| 欧美高清性xxxxhd video| 精品一区二区三区视频在线观看免费| 日韩强制内射视频| 最近最新中文字幕大全电影3| 日韩欧美 国产精品| or卡值多少钱| 欧美高清性xxxxhd video| 日本-黄色视频高清免费观看| 女生性感内裤真人,穿戴方法视频| 干丝袜人妻中文字幕| 变态另类成人亚洲欧美熟女| 九九热线精品视视频播放| 91精品国产九色| 国产精品久久久久久久电影| 久久综合国产亚洲精品| 人妻丰满熟妇av一区二区三区| 日产精品乱码卡一卡2卡三| 久久6这里有精品| 丝袜喷水一区| 成人三级黄色视频| 亚洲国产色片| 人人妻人人澡人人爽人人夜夜 | 老女人水多毛片| 99久久久亚洲精品蜜臀av| 一级毛片久久久久久久久女| 精品一区二区三区av网在线观看| 18禁黄网站禁片免费观看直播| 亚洲va在线va天堂va国产| 亚洲av中文字字幕乱码综合| 91麻豆精品激情在线观看国产| 日韩 亚洲 欧美在线| 国产精品乱码一区二三区的特点| 国产黄a三级三级三级人| 成年女人毛片免费观看观看9| 日本成人三级电影网站| 99九九线精品视频在线观看视频| 亚洲在线自拍视频| 久久人人精品亚洲av| 性插视频无遮挡在线免费观看| 人妻丰满熟妇av一区二区三区| 午夜影院日韩av| 亚洲五月天丁香| 日韩一区二区视频免费看| 18禁黄网站禁片免费观看直播| 国产亚洲精品久久久com| 少妇的逼水好多| 国产不卡一卡二| 国产欧美日韩一区二区精品| 国产黄片美女视频| 男女边吃奶边做爰视频| 久久精品国产鲁丝片午夜精品| 日韩人妻高清精品专区| 日本一二三区视频观看| 日韩,欧美,国产一区二区三区 | 婷婷六月久久综合丁香| 欧美丝袜亚洲另类| 身体一侧抽搐| 99久久无色码亚洲精品果冻| 人人妻人人看人人澡| 久久婷婷人人爽人人干人人爱| 成人性生交大片免费视频hd| 欧美最新免费一区二区三区| 男女边吃奶边做爰视频| 国内久久婷婷六月综合欲色啪| 日韩精品青青久久久久久| 国产精品久久久久久av不卡| 亚洲,欧美,日韩| 免费电影在线观看免费观看| 一卡2卡三卡四卡精品乱码亚洲| 精品一区二区三区人妻视频| 久久午夜福利片| 日韩欧美在线乱码| 国产精品一区二区三区四区久久| 亚洲久久久久久中文字幕| 在线观看av片永久免费下载| 99riav亚洲国产免费| 亚洲国产日韩欧美精品在线观看| АⅤ资源中文在线天堂| 亚洲国产精品国产精品| 黄片wwwwww| 欧美色视频一区免费| 久久鲁丝午夜福利片| 国产亚洲91精品色在线| 午夜久久久久精精品| 亚洲真实伦在线观看| 99riav亚洲国产免费| 国产精品亚洲美女久久久| 久久久久久久久久黄片| 亚洲图色成人| 看非洲黑人一级黄片| 国产黄色视频一区二区在线观看 | 国产精品99久久久久久久久| 精品久久久久久久久av| 国产高清三级在线| 国产精品av视频在线免费观看| 久99久视频精品免费| 人人妻人人澡人人爽人人夜夜 | 尤物成人国产欧美一区二区三区| 亚洲自拍偷在线| 午夜免费激情av| 特级一级黄色大片| 女生性感内裤真人,穿戴方法视频| 九九爱精品视频在线观看| 久久久午夜欧美精品| 一级毛片我不卡| 国产精品亚洲美女久久久| 欧美精品国产亚洲| 国产乱人偷精品视频| 亚洲激情五月婷婷啪啪| 欧美性感艳星| 成年女人毛片免费观看观看9| 一个人看视频在线观看www免费| 人人妻人人澡欧美一区二区| a级毛片a级免费在线| 在线免费观看不下载黄p国产| 丝袜喷水一区| 人妻夜夜爽99麻豆av| 精品久久国产蜜桃| 99热6这里只有精品| 亚洲三级黄色毛片| 午夜福利高清视频| 中文字幕熟女人妻在线| 久久99热6这里只有精品| 欧美+日韩+精品| 国产精品福利在线免费观看| 男女之事视频高清在线观看| 亚洲av电影不卡..在线观看| 黄色日韩在线| 亚洲综合色惰| 性色avwww在线观看| 老师上课跳d突然被开到最大视频| 成年版毛片免费区| 亚洲av美国av| 日韩亚洲欧美综合| 久久人妻av系列| 黄色日韩在线| 久久精品国产亚洲av香蕉五月| 99久久无色码亚洲精品果冻| 桃色一区二区三区在线观看| 看免费成人av毛片| 亚洲精品成人久久久久久| 欧美成人一区二区免费高清观看| 国产综合懂色| 1000部很黄的大片| 九色成人免费人妻av| 国产美女午夜福利| 小蜜桃在线观看免费完整版高清| 神马国产精品三级电影在线观看| 免费大片18禁| 内地一区二区视频在线| 亚洲成人av在线免费| 国产精品,欧美在线| 久99久视频精品免费| 少妇的逼水好多| 精品人妻视频免费看| 亚洲欧美日韩卡通动漫| 男女那种视频在线观看| 黄色日韩在线| 免费看光身美女| 真人做人爱边吃奶动态| 日日撸夜夜添| 国产精品女同一区二区软件| 18禁裸乳无遮挡免费网站照片| 一级黄片播放器| 小说图片视频综合网站| 午夜福利高清视频| 最近视频中文字幕2019在线8| 亚洲欧美中文字幕日韩二区| 熟妇人妻久久中文字幕3abv| 一区福利在线观看| 国产片特级美女逼逼视频| 国产成人freesex在线 | 99热6这里只有精品| 国产精品亚洲一级av第二区| 18禁在线播放成人免费| 国产成人a区在线观看| 欧美日韩精品成人综合77777| 亚洲欧美中文字幕日韩二区| av天堂中文字幕网| 噜噜噜噜噜久久久久久91| 久久久精品大字幕| ponron亚洲| 欧美性感艳星| 亚洲在线自拍视频| 日韩中字成人| 亚洲欧美中文字幕日韩二区| 久久久久国产精品人妻aⅴ院| 国产国拍精品亚洲av在线观看| 国产精品久久久久久久久免| 12—13女人毛片做爰片一| а√天堂www在线а√下载| 精品久久久久久久久久免费视频| 美女大奶头视频| 别揉我奶头~嗯~啊~动态视频| 婷婷亚洲欧美| 久久久久久大精品| 精品人妻一区二区三区麻豆 | 日本爱情动作片www.在线观看 | 91麻豆精品激情在线观看国产| 国产中年淑女户外野战色| av福利片在线观看| 久久久久久大精品| 性欧美人与动物交配| 国产成人精品久久久久久| 一区二区三区四区激情视频 | 在线国产一区二区在线| 亚洲欧美日韩无卡精品| 少妇猛男粗大的猛烈进出视频 | 非洲黑人性xxxx精品又粗又长| 免费无遮挡裸体视频| 天堂动漫精品| 亚洲欧美精品综合久久99| 欧美三级亚洲精品| 高清毛片免费观看视频网站| 久久久欧美国产精品| 日韩欧美三级三区| 女的被弄到高潮叫床怎么办| 国产高潮美女av| 嫩草影院入口| 啦啦啦观看免费观看视频高清| 少妇被粗大猛烈的视频| 好男人在线观看高清免费视频| 小蜜桃在线观看免费完整版高清| 少妇丰满av| 国产麻豆成人av免费视频| 九九在线视频观看精品| 美女xxoo啪啪120秒动态图| 高清毛片免费看| 亚洲国产精品合色在线| 国国产精品蜜臀av免费| 日本黄色片子视频| 我的老师免费观看完整版| 一区二区三区四区激情视频 | 啦啦啦韩国在线观看视频| 精品人妻视频免费看| 久久久久九九精品影院| 亚洲性久久影院| 变态另类丝袜制服| 最近最新中文字幕大全电影3| 97人妻精品一区二区三区麻豆| 亚洲国产精品成人久久小说 | 久久久午夜欧美精品| 午夜福利视频1000在线观看| 小蜜桃在线观看免费完整版高清| www日本黄色视频网| 97超级碰碰碰精品色视频在线观看| 成人av一区二区三区在线看| av卡一久久| 成人欧美大片| 久久精品国产清高在天天线| 欧美丝袜亚洲另类| 欧美日韩一区二区视频在线观看视频在线 | 亚洲五月天丁香| 亚洲中文日韩欧美视频| 亚洲av免费在线观看| 一卡2卡三卡四卡精品乱码亚洲| 自拍偷自拍亚洲精品老妇| 在现免费观看毛片| 波野结衣二区三区在线| 我要搜黄色片| 欧美最黄视频在线播放免费| 国产私拍福利视频在线观看| 极品教师在线视频| 国产熟女欧美一区二区| 舔av片在线| 国产综合懂色| 欧美日韩精品成人综合77777| 亚洲精品国产av成人精品 | 亚洲最大成人av| 亚洲人成网站在线播| 蜜臀久久99精品久久宅男| 亚洲婷婷狠狠爱综合网| 国产亚洲精品av在线| 国产精品人妻久久久影院| 精品久久久久久成人av| 亚洲真实伦在线观看| 亚洲四区av| 久久鲁丝午夜福利片| 天堂动漫精品| 国内久久婷婷六月综合欲色啪| 人人妻,人人澡人人爽秒播| 国产欧美日韩一区二区精品| 国内精品一区二区在线观看| 91久久精品国产一区二区三区| 亚洲成av人片在线播放无| 亚洲av一区综合| 婷婷亚洲欧美| 久久九九热精品免费| 在线观看av片永久免费下载| 久久久国产成人精品二区| 久久精品久久久久久噜噜老黄 | 99热这里只有是精品在线观看| 深夜a级毛片| 内地一区二区视频在线| 亚洲18禁久久av| 国产欧美日韩精品一区二区| 欧美日韩乱码在线| 在线a可以看的网站| 久久久色成人| 亚洲精品一区av在线观看| 亚洲欧美精品综合久久99| 精品一区二区免费观看| 黄色欧美视频在线观看| 国产精品日韩av在线免费观看| 欧美高清成人免费视频www| 日韩欧美免费精品| 国产高清不卡午夜福利| 精品欧美国产一区二区三| 日韩av不卡免费在线播放| 久久久国产成人精品二区| 亚洲美女视频黄频| 精品国内亚洲2022精品成人| 国产精品精品国产色婷婷| 午夜福利在线观看免费完整高清在 | 日韩高清综合在线| 日韩人妻高清精品专区| 晚上一个人看的免费电影| 亚洲av.av天堂| 可以在线观看毛片的网站| 深爱激情五月婷婷| 亚洲成人av在线免费| 99在线视频只有这里精品首页| 99国产极品粉嫩在线观看| 午夜精品国产一区二区电影 | 中国国产av一级| 日本熟妇午夜| 俺也久久电影网| 在线观看av片永久免费下载| 如何舔出高潮| 亚洲自偷自拍三级| av在线亚洲专区| 嫩草影院入口| 久久久久久九九精品二区国产| a级毛色黄片| 一区福利在线观看| 99热精品在线国产| 亚洲七黄色美女视频| 中文亚洲av片在线观看爽| 狂野欧美白嫩少妇大欣赏| 色在线成人网| 亚洲天堂国产精品一区在线| 露出奶头的视频| 伦理电影大哥的女人| 在现免费观看毛片| 深夜a级毛片| 中文字幕免费在线视频6| 深夜a级毛片| 成人鲁丝片一二三区免费| 日本免费一区二区三区高清不卡| 一区二区三区免费毛片| 人妻制服诱惑在线中文字幕| 黄色视频,在线免费观看| 日韩一区二区视频免费看| 亚洲熟妇熟女久久| 亚洲在线观看片| 亚洲精品色激情综合| 国产aⅴ精品一区二区三区波| 久久精品久久久久久噜噜老黄 | 色综合站精品国产| 少妇的逼水好多| 狂野欧美激情性xxxx在线观看| 午夜视频国产福利| 丰满乱子伦码专区| 小蜜桃在线观看免费完整版高清| 国国产精品蜜臀av免费| 日日摸夜夜添夜夜添小说| 男女边吃奶边做爰视频| 真人做人爱边吃奶动态| or卡值多少钱| 91狼人影院| 日韩人妻高清精品专区| 午夜爱爱视频在线播放| 国产精品久久久久久亚洲av鲁大| 亚洲图色成人| 综合色av麻豆| 小说图片视频综合网站| 免费在线观看成人毛片| 日韩制服骚丝袜av| 午夜日韩欧美国产| 中国美女看黄片| 欧美+亚洲+日韩+国产| 亚洲人成网站在线播| 变态另类丝袜制服| 国产精品国产高清国产av| 1024手机看黄色片| 精华霜和精华液先用哪个| 久久久精品大字幕| 91在线精品国自产拍蜜月| 国产一级毛片七仙女欲春2| 国产69精品久久久久777片| 精品乱码久久久久久99久播| 搡老熟女国产l中国老女人| 亚洲va在线va天堂va国产| av中文乱码字幕在线| 国产大屁股一区二区在线视频| 成人特级av手机在线观看| 国产白丝娇喘喷水9色精品| 能在线免费观看的黄片| 久久这里只有精品中国| a级一级毛片免费在线观看| 毛片一级片免费看久久久久| 又粗又爽又猛毛片免费看| 日本在线视频免费播放| 九九热线精品视视频播放| 亚洲成人av在线免费| a级毛色黄片| 精品乱码久久久久久99久播| 国产伦一二天堂av在线观看| 午夜精品在线福利| 搡老岳熟女国产| 中文字幕久久专区| 岛国在线免费视频观看| 久久久久久九九精品二区国产| 蜜桃久久精品国产亚洲av| 国国产精品蜜臀av免费| 一级黄色大片毛片| 美女高潮的动态| 精品午夜福利在线看| 亚洲国产精品合色在线| 国产精品美女特级片免费视频播放器| 国产高清激情床上av| 18+在线观看网站| 亚洲精品国产av成人精品 | 中文在线观看免费www的网站| 久久久精品欧美日韩精品| 夜夜看夜夜爽夜夜摸| 成人鲁丝片一二三区免费| 欧美精品国产亚洲| 三级经典国产精品| a级毛色黄片| 国产高清视频在线观看网站| 国产精品一区二区三区四区免费观看 | 黄色一级大片看看| 少妇人妻精品综合一区二区 | 国产精品爽爽va在线观看网站| 亚洲人成网站在线播放欧美日韩| 国产单亲对白刺激| 亚洲av免费在线观看| 又黄又爽又免费观看的视频| 国产美女午夜福利| 我的女老师完整版在线观看| 亚洲最大成人中文| 三级毛片av免费| 99久久中文字幕三级久久日本| 伊人久久精品亚洲午夜| 久久久国产成人免费| 久久精品国产亚洲av香蕉五月| 色5月婷婷丁香| 老司机影院成人| 婷婷六月久久综合丁香| 亚洲无线观看免费| 国产欧美日韩一区二区精品| 草草在线视频免费看| 久久亚洲国产成人精品v| 国产亚洲精品久久久com| 久久精品久久久久久噜噜老黄 | 日韩欧美国产在线观看| 精品免费久久久久久久清纯| 日韩一本色道免费dvd| 亚洲天堂国产精品一区在线| 69人妻影院| 久久欧美精品欧美久久欧美| 精品久久久久久久久久免费视频| 欧美在线一区亚洲| 欧美又色又爽又黄视频| 久久久精品大字幕| 久久天躁狠狠躁夜夜2o2o| 色在线成人网| 99久久精品一区二区三区| 欧美成人一区二区免费高清观看| 久久国产乱子免费精品| 天堂av国产一区二区熟女人妻| 日韩av在线大香蕉| 久久人人精品亚洲av|