• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于穩(wěn)定性語義聚類的相關模型估計

    2016-05-14 10:01:54孫芯宇吳江蒲強
    計算機應用 2016年5期
    關鍵詞:信息檢索

    孫芯宇 吳江 蒲強

    摘要:針對由不穩(wěn)定聚類估計的相關模型影響檢索性能的問題,提出了基于穩(wěn)定性語義聚類的相關模型(SSRM)。首先利用初始查詢前N個結果文檔構成反饋數(shù)據(jù)集;然后探測數(shù)據(jù)集中穩(wěn)定的語義類別數(shù)量;接著從穩(wěn)定性語義聚類中選擇與用戶查詢最相似的語義類別估計SSRM;最后通過實驗對模型的檢索性能進行了驗證。對TREC數(shù)據(jù)集5個子集的實驗結果顯示,SSRM相比相關模型(RM)、語義相關模型(SRM),平均準確率(MAP)性能最少提高了32.11%和0.41%;相比基于聚類的文檔模型(CBDM)、基于LDA的文檔模型(LBDM)和Resampling等基于聚類的檢索方法,MAP性能最少提高了23.64%,19.59%和8.03%。實驗結果表明,SSRM有利于改善檢索性能。

    關鍵詞:信息檢索;語義聚類;穩(wěn)定性驗證;獨立分量分析;相關模型估計

    中圖分類號:TP391.3 文獻標志碼:A

    Abstract:To solve the problem of relevance model based on unstable clustering estination and its effect on retrieval performance, a new Stable Semantic Relevance Model (SSRM) was proposed. The feedback data set was first formed by using the top N documents from user initial query, after the stable number of semantic clusters had been detected, SSRM was estimated by those stable semantic clusters selected according to higher userquery similarity. Finally, the SSRM retrieval performance was verified by experiments. Compared with Relevance Model (RM), Semantic Relevance Model (SRM) and the clusteringbased retrieval methods including ClusterBased Document Model (CBDM), LDABased Document Model (LBDM) and Resampling, SSRM has improvement of MAP by at least 32.11%, 0.41%, 23.64%,19.59%, 8.03% respectively. The experimental results show that retrieval performance can benefit from SSRM.

    Key words:information retrieval; semantic clustering; stability validation; Independent Component Analysis (ICA); relevance model estimation

    0 引言

    信息檢索研究中常用偽相關反饋方法估計相關模型,改善用戶查詢,更準確獲取用戶信息需求。相關模型的估計需要用到偽相關反饋技術,通常假設用戶初始查詢的前N個結果文檔是查詢相關的,但大多數(shù)情況下這個假設并不成立。全部N個文檔參與反饋必將帶入不相關噪聲,使得相關模型估計偏離用戶查詢[1-2]。

    聚類技術可將N個查詢結果文檔形成的數(shù)據(jù)集劃分成若干類別,只選擇與用戶查詢最相似的聚類中的文檔估計語言模型,可以減少模型估計中不相關文檔帶來的噪聲。已有研究[3-4]表明,語義聚類技術相比傳統(tǒng)聚類技術在聚類效果上有顯著改善。語義聚類指在未知數(shù)據(jù)類別的潛在語義空間上的聚類操作,語義空間以多個數(shù)據(jù)主題為基張成。語義聚類通常借助本體[4]或利用統(tǒng)計[5-6]的方法進行。本體WordNet可以判斷文檔間的關聯(lián),決定文檔是否劃分到相同的語義聚類。雖然借助本體的語義聚類效果有所改善,但是規(guī)則式的語義聚類方法不能靈活適應各種數(shù)據(jù)。潛在語義索引(Latent Semantic Indexing,LSI)[5]、獨立分量分析(Independent Component Analysis,ICA)[6]采用統(tǒng)計方法分離語義主題,為典型的語義聚類技術。LSI技術將最大方差投影方向定義為語義類別,但最大方差投影方向并不總是表示數(shù)據(jù)的真實語義類別[6]。ICA技術具有在任意方向上分離出數(shù)據(jù)中獨立分量的能力,分量間不要求一定滿足正交關系。相比LSI定義的最大方差投影方向,ICA的任意方向上分離的獨立分量更能表示數(shù)據(jù)中真實存在的語義類別,因此本文采用ICA進行語義聚類。ICA算法分離出的每一個獨立分量代表數(shù)據(jù)中的一個語義類別,以每個獨立分量為基可張成ICA語義空間。

    由于數(shù)據(jù)中未知的語義類別數(shù)量和ICA算法的隨機性,多次運行ICA算法分離的獨立分量是不同的[7],因此得到的數(shù)據(jù)語義聚類也不一樣,也就是語義聚類是不穩(wěn)定的。數(shù)據(jù)本來具有隱含的固定數(shù)量的語義主題,在不穩(wěn)定的語義聚類上估計相關模型必定存在主題偏差。文獻[8-9]利用語義聚類估計了相關模型,并提升了檢索性能,但沒有考慮語義聚類的穩(wěn)定性。

    如果能夠預先探測數(shù)據(jù)中隱含語義類別的個數(shù),那么ICA算法根據(jù)此類別數(shù)量才能分離出接近真實可靠的語義聚類穩(wěn)定性語義聚類。探測數(shù)據(jù)集中的聚類個數(shù)通常使用多個k值重復運行包含隨機性的聚類算法,并利用聚類穩(wěn)定性指標計算不同k值下的聚類穩(wěn)定性,選擇聚類穩(wěn)定性最高的k值作為最合適的聚類個數(shù)[10]。

    針對基于穩(wěn)定聚類的語言模型估計對檢索性能的影響等研究工作較少,本文提出一種基于穩(wěn)定性語義聚類估計的相關模型(Stable Semantic Relevance Model, SSRM),通過探測前N個查詢結果文檔構成的數(shù)據(jù)集中存在的穩(wěn)定語義類別數(shù)量來驗證語義聚類的穩(wěn)定性。本文認為在穩(wěn)定性驗證后的語義聚類中,選擇與用戶查詢最相似的語義類別估計的相關模型,能夠獲取比現(xiàn)有方法更好的檢索性能。

    由于ICA算法的隨機性,在微小差別條件下多次運行ICA算法可以解決單次運行分離獨立分量的不可靠問題。假設數(shù)據(jù)集中存在從1到n的語義類別數(shù)量,通過如下方法保證穩(wěn)定性語義聚類:探測1到n的類別數(shù)量,在同一數(shù)據(jù)集上使用Bootstrapping方法微小改變運行條件,多次運行ICA算法,并聚類得到的一組獨立分量。將聚類質量得分最高對應的探測類別數(shù)量作為數(shù)據(jù)集中穩(wěn)定的語義聚類數(shù)量。

    本文研究工作將解決如下問題:如何驗證語義聚類穩(wěn)定性;如何選擇參與相關模型估計的穩(wěn)定性語義聚類;如何估計基于穩(wěn)定性語義聚類的相關模型;如何利用穩(wěn)定性語義聚類估計的相關模型進行檢索實驗,并將檢索結果在縱向和橫向上同已有典型算法詳細比較,以證明基于穩(wěn)定性語義聚類估計的相關模型能夠帶來檢索性能上的提升。

    1 相關模型和潛在語義聚類的關系

    信息檢索中,通過相關文檔的反饋可以改善用戶查詢,研究表明檢索性能改善效果明顯[11]。用戶查詢已知,相關文檔未知的情況下使得相關模型估計變得困難。文獻[11]提出一種在相關文檔未知情況下,利用用戶查詢和初始查詢結果前面若干文檔估計相關模型的理論方法。方法假設用戶查詢和文檔之間存在一個隱含的相關模型,因此可觀察的用戶查詢和文檔是由隱含的相關模型隨機采樣詞條生成的。這樣,用戶查詢和文檔通過相關模型聯(lián)系起來。

    利用查詢和初始查詢結果的前面若干文檔作為相關反饋文檔,可以近似估計相關模型。有兩種經典的相關模型估計方法[11]:一種假設由反饋文檔估計的文檔模型獨立生成查詢詞條和文檔詞條,查詢詞條和文檔詞條間無關聯(lián)關系;另一種假設查詢詞條由文檔模型獨立生成,但各查詢詞條保持和文檔詞條關聯(lián),關聯(lián)度高的詞條在相關模型估計中擁有較高的權重。

    相關模型的估計通常采用基于聚類的方法[1-2,8-9,12],好處在于可以先對初始查詢結果文檔聚類,然后只選擇用戶查詢最相似的某個類別中的文檔參與估計相關模型?;诰垲惖姆椒ü烙嬒嚓P模型的基本思想是:借助聚類選擇,過濾掉與用戶查詢相似度不高的文檔帶來的噪聲。

    ICA算法已被證明是一種有效的語義聚類方法[8-9],和文獻[8-9]不同的是,本文重點考慮了ICA算法的隨機性造成在同一數(shù)據(jù)集上多次運行ICA算法分離的獨立分量結果不唯一性,也就是語義聚類數(shù)量的不唯一問題,因此有必要驗證ICA算法在不同數(shù)據(jù)類別數(shù)量上分離獨立分量的穩(wěn)定性。本文認為在穩(wěn)定的語義聚類中選擇和用戶查詢最相似的語義類別估計的相關模型能夠改善檢索性能。驗證的基本思想是,假設數(shù)據(jù)集中存在L個語義類別,利用重采樣方法[7,13],在同一數(shù)據(jù)集上分別按1至L個類別,多次運行ICA算法,并將每次得到的一組獨立分量進行聚類。如果在某個數(shù)量m上的語義類別穩(wěn)定,那么獨立分量應接近聚類中心而遠離其他聚類,這時可將分離的獨立分量數(shù)量m作為數(shù)據(jù)集中的語義類別數(shù)量。

    2 ICA語義聚類及穩(wěn)定性驗證

    2.1 ICA語義聚類

    如果將語義空間看成一組相互獨立的隱含主題為基構成的空間,那么混合了隱含主題的一組文檔在語義空間上張成用戶可觀察的文檔集合[14]。已知混合主題的文檔集合,利用ICA技術可分離其中的隱含主題,即將文檔集表示為獨立分量的線性組合[6]。本文將獨立分量表示的相互獨立的隱含主題定義為文檔集中的語義類別。ICA模型如式(1):

    2.2 語義聚類的穩(wěn)定性驗證

    多次利用隨機性和無監(jiān)督的ICA算法分離的語義類別是不同的。如果能事先驗證數(shù)據(jù)中存在的穩(wěn)定類別數(shù)量,那么通過ICA算法得到的語義類別才可靠并接近數(shù)據(jù)類別的真實情況。在盡可能接近真實可靠的語義聚類上估計的相關模型應該能夠提升檢索性能,本文實驗部分將驗證這一猜測。

    語義聚類的穩(wěn)定性驗證的基本過程是:假設數(shù)據(jù)集中存在不同的獨立分量數(shù)量,即語義類別數(shù)量。遍歷每個類別數(shù)量,多次運行ICA算法,將得到的獨立分量進行聚類;然后考察聚類質量,將聚類質量最高情況下對應的獨立分量個數(shù)作為數(shù)據(jù)集中穩(wěn)定的語義聚類數(shù)量。

    3 基于穩(wěn)定性語義聚類的相關模型估計

    已知用戶查詢的情況下,利用前N個初始查詢結果文檔作為偽相關反饋可以估計相關模型。例如,已知用戶查詢Q和前N個結果文檔構成的文檔集D,相關模型R的估計為p(D|Q,R)=∏Ni=1p(di|Q,R)。p(di|Q,R)為假設已知相關模型R和用戶查詢Q的條件下,生成文檔di的條件概率。

    由于前N個查詢結果文檔并非都與用戶查詢相關,將N個結果文檔全部參與反饋估計相關模型必定帶入不相關的噪聲,導致估計的相關模型偏離用戶查詢主題。這里提出利用基于穩(wěn)定性語義聚類估計相關模型(SSRM)的方法,期望估計的相關模型比已有方法更好地改善檢索性能。SSRM估計過程包括兩個階段:1)選擇參與相關模型估計的穩(wěn)定性語義聚類;2)基于穩(wěn)定性語義聚類估計相關模型。

    3.1 篩選穩(wěn)定性語義聚類

    語義聚類穩(wěn)定性驗證后得到的一組獨立分量將作為數(shù)據(jù)集中穩(wěn)定的語義聚類,對應多個語義類別。穩(wěn)定性語義聚類選擇的目的是,選取穩(wěn)定性語義聚類中適合度高于閾值的一組語義類別參與相關模型的估計。語義聚類的適合度采用KL散度計算,基本思想是將語義聚類和用戶查詢的相似度距離作為語義聚類的適合度,離用戶查詢相似度距離最小的語義聚類適合度最高。語義聚類的適合度按照語義聚類模型和查詢模型間的相似度計算,并篩選出適合度高于閾值的語義聚類。計算如式(7):

    如果語義聚類模型和用戶查詢模型生成詞條w的概率越接近,那么這兩種模型的詞條分布越相似。適合度高于閾值的語義聚類下的文檔將用來估計相關模型,期待緩解使用全部前N個查詢結果文檔估計相關模型帶入的不相關噪聲,造成相關模型估計出現(xiàn)主題偏移的問題。

    3.2 估計相關模型

    假設用戶查詢詞條q1,q2,…,qk間相互獨立,與文檔詞條w保持某種程度的關聯(lián)。通過式(7)選擇的穩(wěn)定性語義聚類將在相關模型估計過程中發(fā)揮橋梁作用,它將用戶查詢和語義聚類中文檔詞條關聯(lián)起來。使用穩(wěn)定性語義聚類后,在已知用戶查詢Q的情況下,相關模型p(w | Q, R)的估計轉化為計算文檔詞條w和用戶查詢q在穩(wěn)定性語義聚類中的同現(xiàn)概率,如式(8):

    4 實驗結果與分析

    4.1 實驗設計

    實驗目的是為了驗證基于穩(wěn)定性語義聚類估計的相關模型(SSRM)更接近用戶的查詢需求,比已有的相關模型和基于聚類的檢索方法在檢索性能上有所改善。

    實驗將在TREC數(shù)據(jù)集上測試SSRM的檢索性能。實驗中,TREC標題用來模擬用戶查詢,并刪除了無相關結果文檔的查詢。數(shù)據(jù)集使用Porter進行詞干處理,同時刪除了停止詞。實驗使用Indri5.0建立數(shù)據(jù)集索引。查詢編號51~150的美聯(lián)社(Associated Press Newswire,AP)數(shù)據(jù)集作為訓練集,查詢編號151~200的AP數(shù)據(jù)集、華爾街日報(Wall Street Journal,WSJ)、圣何塞水星報(San Jose Mercury News,SJMN)、查詢編號301~400的金融時報(Financial Times,F(xiàn)T)和洛杉磯時報(Los Angeles Times,LA)等數(shù)據(jù)集作為測試集。

    估計SSRM實驗步驟包括:1)使用基本的查詢似然模型得到初始查詢結果文檔;2)使用DTU工具箱[14]255中的ICA算法對前50個用戶查詢結果文檔進行語義聚類;3)穩(wěn)定性語義聚類驗證。首先假設前50個文檔形成的數(shù)據(jù)集中存在20個語義類別,然后使用Bootstapping方法運行FastICA算法[6]154930次,探測數(shù)據(jù)集中存在的穩(wěn)定語義類別;4)通過式(7)選擇適合度高于閾值的穩(wěn)定性語義聚類。適合度閾值設定為0.3,即選擇KL散度值由高到低排列的前面30%的穩(wěn)定性聚類參與相關模型的估計;5)利用選擇的穩(wěn)定性語義聚類進行相關模型估計。估計中,選擇穩(wěn)定性語義聚類生成詞條的概率值大于閾值0.3的詞條作為語義聚類的關鍵詞。

    為了驗證SSRM的檢索性能高于其他相關模型和基于聚類的方法,實驗在查詢平均準確率均值(Mean Average Precision, MAP)上縱向和橫向比較了SSRM和其他模型的檢索性能??v向比較的模型包括:1)基線相關模型(Relevance Model, RM):Indri實現(xiàn)Lavarenko的相關模型[11]122-123作為檢索性能比較基線;2)在無穩(wěn)定性驗證的ICA語義聚類上估計的語義相關模型(Semantic Relevance Model, SRM)。橫向比較的方法包括:基于聚類的方法(ClusterBased Document Model, CBDM)[1]、基于LDA的文檔模型(LDABased Document Model, LBDM)[15]和重采樣(Resampling)方法[2]。

    4.2 三種相關模型性能縱向比較

    表1給出了SSRM在測試集上的MAP性能相比RM、SRM的MAP性能的提升情況?!?chg”表示SSRM相對RM和SRM在MAP性能上提高的百分比。表中值的上標α、β、γ分別表示RM、SRM和SSRM三種模型在置信度為95%的情況下,MAP值在Wilcoxon檢驗下顯著性提高?!癠pper”列中的值為MAP性能上界。性能上界值計算方法:首先手動選取前50個查詢結果文檔中真正查詢相關的文檔,然后將這些真實相關的文檔作為反饋估計語義相關模型(SRM)并檢索得到MAP值。之所以利用SRM計算檢索性能上界,主要考慮SRM沒有消耗額外的時間驗證語義聚類的穩(wěn)定性。

    表1縱向比較的結果顯示,SSRM在所有測試集上得到的MAP值均高于RM和SRM,MAP性能最少提高了32.11%和0.41%。例如在AP測試集,使用SSRM得到的MAP值為0.3431,相對RM的MAP值0.25,在性能上提升了37.24%;相對SRM的MAP值0.3345,在性能上提升了2.57%。

    表1中SSRMMAP值的提高驗證了經過穩(wěn)定性驗證的語義聚類更好過濾了用戶查詢無關的噪聲,因而估計的相關模型更接近用戶查詢的實際需求,從而提高了MAP性能。同時也觀察到,并非所有MAP值都是顯著性提高的。例如對于AP測試集,SSRMMAP值提高只對RM是顯著性提高,而對SRM的提高是非顯著的;但是對于SJMN和FT測試集,SSRM相對RM和SRM在MAP值上的提升都是顯著性的。這說明SJMN和FT測試集中主題噪聲影響了相關模型的估計,但SSRM能夠有效過濾這兩種測試集中的噪聲,因而帶來的MAP提升是顯著性的。

    測試集FT和LA每個主題對應的真實相關文檔在TREC五個數(shù)據(jù)集中最少[8],但SSRM在這兩個測試集上相對其他三個測試集的MAP性能提升最大。這進一步驗證了SSRM能夠較好過濾數(shù)據(jù)集中用戶查詢不相關噪聲,使穩(wěn)定性語義聚類中的文檔查詢相關,并遠離查詢不相關主題。在AP和WSJ兩個測試集上,SSRM對MAP性能的提升有限,其原因可能是兩個數(shù)據(jù)集中的文檔包含多個語義主題,使用ICA算法很難將多語義主題文檔劃分到合適的語義類別中。這說明利用ICA算法進行穩(wěn)定性語義聚類,對于多個語義主題的文檔效果有限。由表1還可以觀察到,SSRM的MAP值離性能上界還存在不小差距,說明基于穩(wěn)定性語義聚類估計出的相關模型在MAP性能上還有改進空間。

    4.3 四種聚類方法性能橫向比較

    橫向比較的三種基于聚類的方法為:基于聚類方法(CBDM)、基于LDA的方法(LBDM)和重采樣(Resampling)方法。比較的原因是:這三種方法是信息檢索中比較典型的方法,同時三種方法沒有作穩(wěn)定性聚類驗證工作,可以對比驗證SSRM的性能。表2中三種基于聚類的方法的MAP值均來源于文獻[1-2,15]的數(shù)據(jù)。

    表2顯示,SSRM在測試集上相比三種基于聚類方法的MAP性能改善明顯。相比三種基于聚類的檢索方法,MAP性能至少提高了23.64%,19.59%和8.03%。由于SSRM采用ICA算法進行語義聚類,并對語義聚類進行了穩(wěn)定性驗證,這說明ICA算法相比其他三種聚類方法在語義聚類上的效果更好,特別是經過語義聚類穩(wěn)定性驗證后估計的相關模型,在語義上更接近用戶查詢,是提升MAP性能的主要原因。

    圖1顯示了SSRM、RM、SRM三種相關模型和檢索上界UP在AP訓練集和5個測試集上檢索的準確率召回率曲線的比較情況。可以看出,無論在訓練階段還是在測試階段,SSRM總是獲得比RM明顯好的檢索性能。通常情況下,SSRM也能得到相對SRM好的檢索性能。檢索性能的改善證明了語義聚類經過穩(wěn)定性驗證后,更好地將查詢相關的文檔聚在一起,因此SSRM方法較SRM方法使用更多的真實相關文檔參與相關模型估計,而RM方法直接使用前N個查詢結果文檔估計相關模型,帶入了較多的不相關噪聲。

    圖1顯示,在WSJ和FT測試集上,在高召回率一端,SSRM比RM的檢索性能稍差;同時,SSRM在AP和WSJ測試集上相比SRM提升的檢索性能有限,甚至在低召回率一端,SSRM的檢索性能比SRM還差。顯示表明,SSRM在召回率的中前段對檢索性能的提升最明顯。

    圖1中SSRM的檢索性能同性能上界有很大差距。由于性能上界由真實的相關文檔估計的相關模型得到,這個差距說明通過數(shù)據(jù)聚類的方法不能完全獲取相關模型估計需要的真實相關的反饋文檔,同時也說明SSRM方法有較大的提升空間。一個解決思路是如何更好地選擇主題相關文檔,將聚類粒度放到段落或句子層次而不是整個文檔上。

    5 結語

    本文研究了ICA語義聚類穩(wěn)定性驗證對相關模型估計的影響及其對檢索性能的改善效果。研究發(fā)現(xiàn),語義聚類經過穩(wěn)定性驗證后,能夠更好地將查詢相關的文檔聚在一起。

    利用語義聚類的適合度篩選出和用戶查詢最相似的語義聚類,并以篩選出的語義聚類為文檔和查詢間的橋梁,估計出的穩(wěn)定性語義聚類模型(SSRM)能夠改善檢索性能。由于不相關噪聲會使相關模型估計中出現(xiàn)偏離用戶查詢主題的問題,SSRM有效利用了穩(wěn)定性語義聚類的噪聲過濾功能,因而SSRM更接近用戶的查詢需求。另外,SSRM相比基于聚類方法的檢索性能提升,也說明ICA算法是一種適合的語義聚類算法。

    研究發(fā)現(xiàn)對于多主題文檔,文檔級別上的語義聚類很難將其劃分到合適的類別中。將來的工作考慮段落或者句子粒度上的聚類,并做聚類的穩(wěn)定性驗證工作。另外,如何根據(jù)不同數(shù)據(jù)集學習適合數(shù)據(jù)集的訓練參數(shù),也是一個值得研究的問題。

    參考文獻:

    [1]LIU X, CROFT W B. Clusterbased retrieval using language models[C]// Proceedings of the 27th International Conference on Research and Development in Information Retrieval. New York: ACM, 2004:186-193.

    [2]LEE K S, CROFT W B, ALLAN J. A clusterbased resampling method for pseudorelevance feedback[C]// Proceedings of the 31st International Conference on Research and Development in Information Retrieval. New York: ACM, 2008:235-242.

    [3]NASIR J A, VARLAMIS I, KARIM A, et al. Semantic smoothing for text clustering[J]. KnowledgeBased Systems, 2013, 54(4): 216-229.

    [4]ALSULAMI B S, ABULKHAIR M F, ESSA F A. Semantic clustering approach based multiAgent system for information retrieval on Web[J]. International Journal of Computer Science & Network Security, 2012, 12(1):41-44.

    [5]HOFMANN T. Probabilistic latent semantic indexing[C]// Proceedings of the 22nd International Conference on Research and Development in Information Retrieval. New York: ACM, 1999:56-73.

    [6]HYVARINEN A. Survey on independent component analysis[J]. Neural Computing Surveys, 1999, 2(7):1527-1558.

    [7]HIMBERG J, HYVARINEN A, ESPOSITO F. Validating the independent components of neuroimaging timeseries via clustering and visualization[J]. Neuroimage, 2004, 22(3): 1214-1222.

    [8]PU Q, HE D. Pseudo relevance feedback using semantic clustering in relevance language model[C]// Proceedings of the 18th ACM International Conference on Information and Knowledge Management. New York: ACM, 2009:1931-1934.

    [9]蒲強,何大慶,楊國緯.一種基于統(tǒng)計語義聚類的查詢語言模型估計[J].計算機研究與發(fā)展,2011,48(2):224-231.(PU Q, HE D Q, YANG G W. An estimation of query language model based on statistical semantic clustering [J]. Journal of Computer Research and Development, 2011, 48(2): 224-231.)

    [10]劉家辰, 苗啟廣, 宋建鋒. 使用聚類穩(wěn)定性分析方法增強單類學習算法[J]. 西安電子科技大學學報(自然科學版), 2015, 2(2):58-64. (LIU J C, MIAO Q G, SONG J F. Enhanced oneclass learning based on clustering stability analysis[J]. Journal of Xidian University (Natural Science), 2015, 42(2): 58-64.)

    [11]LAVRENKO V, CROFT W B. Relevancebased language models[C]// Proceedings of the 24th International Conference on Research and Development in Information Retrieval. New York: ACM, 2001:120-127.

    [12]劉銘,劉秉權,劉遠超.面向信息檢索的快速聚類算法[J].計算機研究與發(fā)展,2013,50(7): 1452-1463.(LIU M, LIU B Q, LIU Y C. A fast clustering algorithm for information retrieval [J]. Journal of Computer Research and Development, 2013, 50(7):1452-1463.)

    [13]張永,浮盼盼,張玉婷.基于分層聚類及重采樣的大規(guī)模數(shù)據(jù)分類[J].計算機應用, 2013, 33(10): 2801-2803.(ZHANG Y, FU P P, ZHANG Y T. Largescale data classification based on hierarchical clustering and resampling[J]. Journal of Computer Applications, 2013, 33(10): 2801-2803.)

    [14]KOLENDA T, HANSEN L K, SIGURDSSON S. Independent components in text[J]. Perspectives in Neural Computing, 2000, 32: 235-256.

    [15]WEI X, CROFT W B. LDAbased document models for Ad Hoc retrieval[C]// Proceedings of the 29th International Conference on Research and Development in Information Retrieval. New York: ACM, 2006:178-185.

    猜你喜歡
    信息檢索
    基于同態(tài)加密支持模糊查詢的高效隱私信息檢索協(xié)議
    基于信息檢索課的大學生信息檢索行為調查研究
    高職院校圖書館開設信息檢索課的必要性探討
    基于MOOC理念的“翻轉課堂”教學改革探索——以海南大學《文獻信息檢索與利用》課程為例
    網(wǎng)絡環(huán)境下數(shù)字圖書館信息檢索發(fā)展
    山西青年(2018年5期)2018-01-25 16:53:40
    醫(yī)學期刊編輯中文獻信息檢索的應用
    新聞傳播(2016年18期)2016-07-19 10:12:06
    在網(wǎng)絡環(huán)境下高職院校開設信息檢索課的必要性研究
    新聞傳播(2016年11期)2016-07-10 12:04:01
    基于神經網(wǎng)絡的個性化信息檢索模型研究
    地理信息檢索中空間相似性度量的一種模糊方法
    教學型大學《信息檢索》公選課的設計與實施
    河南科技(2014年11期)2014-02-27 14:10:19
    国产精品乱码一区二三区的特点| 亚洲一区高清亚洲精品| 怎么达到女性高潮| 男人的好看免费观看在线视频| 国内揄拍国产精品人妻在线| 国产精品1区2区在线观看.| 精品久久久久久久久久久久久| 日本免费a在线| 国产av在哪里看| 亚洲va日本ⅴa欧美va伊人久久| 免费在线观看亚洲国产| 观看美女的网站| 午夜a级毛片| 亚洲国产高清在线一区二区三| 亚洲在线自拍视频| 午夜精品久久久久久毛片777| 国产一区二区在线av高清观看| 大型黄色视频在线免费观看| 天堂av国产一区二区熟女人妻| 麻豆国产av国片精品| 丰满乱子伦码专区| 神马国产精品三级电影在线观看| 久久精品国产亚洲av涩爱 | 18+在线观看网站| 性欧美人与动物交配| 99久久无色码亚洲精品果冻| 香蕉av资源在线| 我的老师免费观看完整版| 美女被艹到高潮喷水动态| 亚洲欧美激情综合另类| 偷拍熟女少妇极品色| 日韩成人在线观看一区二区三区| 亚洲av五月六月丁香网| 两个人看的免费小视频| 国产成人aa在线观看| 午夜亚洲福利在线播放| 九九久久精品国产亚洲av麻豆| 亚洲精品在线美女| 色综合婷婷激情| 老司机福利观看| 男人的好看免费观看在线视频| 欧美一区二区国产精品久久精品| 久久这里只有精品中国| 国产黄片美女视频| 丰满人妻熟妇乱又伦精品不卡| 国产亚洲欧美在线一区二区| 色在线成人网| 两个人看的免费小视频| 日本一二三区视频观看| 嫩草影视91久久| 免费无遮挡裸体视频| 亚洲欧美日韩高清在线视频| 免费在线观看成人毛片| 女人十人毛片免费观看3o分钟| 美女黄网站色视频| 波多野结衣高清无吗| 亚洲av五月六月丁香网| 啦啦啦韩国在线观看视频| 美女高潮的动态| 一边摸一边抽搐一进一小说| 床上黄色一级片| 美女大奶头视频| 一区二区三区激情视频| 在线国产一区二区在线| 欧美极品一区二区三区四区| 男女视频在线观看网站免费| 亚洲av免费在线观看| 午夜福利18| 久久国产精品影院| 午夜日韩欧美国产| 欧美中文综合在线视频| 在线观看日韩欧美| 欧美激情在线99| 亚洲国产欧洲综合997久久,| 国产三级在线视频| 小说图片视频综合网站| 真人做人爱边吃奶动态| 久9热在线精品视频| 有码 亚洲区| 国产真实伦视频高清在线观看 | 亚洲av美国av| 亚洲乱码一区二区免费版| 女同久久另类99精品国产91| 亚洲午夜理论影院| 国产aⅴ精品一区二区三区波| 国产精品亚洲av一区麻豆| 99riav亚洲国产免费| 久久久精品欧美日韩精品| 国产蜜桃级精品一区二区三区| 大型黄色视频在线免费观看| 网址你懂的国产日韩在线| 午夜日韩欧美国产| 一本精品99久久精品77| 97超级碰碰碰精品色视频在线观看| 国产精品久久视频播放| 亚洲国产欧洲综合997久久,| 色噜噜av男人的天堂激情| 97碰自拍视频| 九九在线视频观看精品| 国产精品亚洲美女久久久| 久久久久久久亚洲中文字幕 | 熟女人妻精品中文字幕| 亚洲黑人精品在线| 嫩草影院精品99| 美女高潮喷水抽搐中文字幕| 91av网一区二区| 久久久久久人人人人人| 成年版毛片免费区| 亚洲成av人片在线播放无| 国产色爽女视频免费观看| 亚洲精品456在线播放app | 亚洲成人免费电影在线观看| 老司机深夜福利视频在线观看| 久久久精品大字幕| 蜜桃亚洲精品一区二区三区| 亚洲av免费高清在线观看| 最近最新中文字幕大全免费视频| 国产精品日韩av在线免费观看| 男女下面进入的视频免费午夜| av福利片在线观看| 怎么达到女性高潮| 日韩欧美国产在线观看| 中出人妻视频一区二区| 国产中年淑女户外野战色| 十八禁人妻一区二区| 欧美成人性av电影在线观看| 舔av片在线| 国产精品日韩av在线免费观看| 88av欧美| 他把我摸到了高潮在线观看| 美女大奶头视频| 日韩欧美国产一区二区入口| 麻豆久久精品国产亚洲av| 波野结衣二区三区在线 | 国产乱人视频| 我的老师免费观看完整版| 国产视频一区二区在线看| 成人国产综合亚洲| 搞女人的毛片| 欧美高清成人免费视频www| 国内精品久久久久精免费| 高清在线国产一区| 国产v大片淫在线免费观看| 美女 人体艺术 gogo| 欧美成狂野欧美在线观看| 色精品久久人妻99蜜桃| 日韩欧美免费精品| 亚洲熟妇熟女久久| 岛国视频午夜一区免费看| 黄色女人牲交| 久久亚洲精品不卡| 97人妻精品一区二区三区麻豆| 女同久久另类99精品国产91| 激情在线观看视频在线高清| 好看av亚洲va欧美ⅴa在| 久久久久久久久中文| 国内精品久久久久精免费| 亚洲av成人精品一区久久| 观看免费一级毛片| 一本精品99久久精品77| 黄色丝袜av网址大全| 日本三级黄在线观看| 午夜福利成人在线免费观看| 国产成人欧美在线观看| 女警被强在线播放| 久99久视频精品免费| 国模一区二区三区四区视频| 欧美zozozo另类| 久久久久久久精品吃奶| а√天堂www在线а√下载| 嫩草影院精品99| 国产成年人精品一区二区| 欧美午夜高清在线| 国产蜜桃级精品一区二区三区| 国产伦精品一区二区三区视频9 | 国产精品日韩av在线免费观看| 变态另类丝袜制服| 国产黄a三级三级三级人| 亚洲内射少妇av| 国产av不卡久久| 19禁男女啪啪无遮挡网站| 国产一区二区在线av高清观看| 国产黄a三级三级三级人| 亚洲国产欧美人成| 久久久久久大精品| 最近视频中文字幕2019在线8| 欧美性猛交黑人性爽| 久久久久久久午夜电影| 国产成人福利小说| 欧美性猛交黑人性爽| 久久久精品欧美日韩精品| 中文字幕熟女人妻在线| 中文字幕熟女人妻在线| 国产精品女同一区二区软件 | 成人欧美大片| 精品国内亚洲2022精品成人| 国产探花在线观看一区二区| 成人精品一区二区免费| 中文字幕av在线有码专区| 韩国av一区二区三区四区| 欧美绝顶高潮抽搐喷水| 99久久九九国产精品国产免费| 黄色成人免费大全| 午夜两性在线视频| 欧美日韩黄片免| 亚洲 国产 在线| 久久人人精品亚洲av| 亚洲美女黄片视频| 午夜福利欧美成人| 国产精品av视频在线免费观看| 色吧在线观看| 长腿黑丝高跟| 九九热线精品视视频播放| 欧美一区二区亚洲| 天美传媒精品一区二区| 一个人观看的视频www高清免费观看| 高清日韩中文字幕在线| 男女床上黄色一级片免费看| 99在线人妻在线中文字幕| 欧美黑人欧美精品刺激| 有码 亚洲区| 嫩草影院精品99| 极品教师在线免费播放| 狠狠狠狠99中文字幕| 欧美xxxx黑人xx丫x性爽| 久久久色成人| 在线看三级毛片| 99久久综合精品五月天人人| 精品久久久久久久久久久久久| 中文字幕久久专区| 亚洲中文日韩欧美视频| 搞女人的毛片| 小说图片视频综合网站| 国产高潮美女av| 亚洲欧美日韩无卡精品| 黄色女人牲交| 亚洲内射少妇av| 午夜亚洲福利在线播放| 欧美成人一区二区免费高清观看| 久久午夜亚洲精品久久| av片东京热男人的天堂| 日韩欧美在线二视频| 怎么达到女性高潮| 一本综合久久免费| 国产毛片a区久久久久| 亚洲国产精品合色在线| 精品国产亚洲在线| 女人高潮潮喷娇喘18禁视频| av欧美777| 国产成人福利小说| 国内毛片毛片毛片毛片毛片| 一个人观看的视频www高清免费观看| tocl精华| e午夜精品久久久久久久| 国产精品 欧美亚洲| av专区在线播放| 色老头精品视频在线观看| 亚洲国产高清在线一区二区三| 久久久久久人人人人人| www日本黄色视频网| 波多野结衣高清作品| 男女之事视频高清在线观看| 嫁个100分男人电影在线观看| aaaaa片日本免费| av黄色大香蕉| 国产熟女xx| 日韩精品中文字幕看吧| 精品国产超薄肉色丝袜足j| 国产精品久久久久久亚洲av鲁大| 亚洲va日本ⅴa欧美va伊人久久| 全区人妻精品视频| 2021天堂中文幕一二区在线观| 国产精品香港三级国产av潘金莲| 国产精品香港三级国产av潘金莲| 床上黄色一级片| 亚洲黑人精品在线| 亚洲国产色片| 亚洲av不卡在线观看| 怎么达到女性高潮| 欧美日韩瑟瑟在线播放| 12—13女人毛片做爰片一| eeuss影院久久| 一二三四社区在线视频社区8| 天天添夜夜摸| 午夜福利视频1000在线观看| 99久久精品国产亚洲精品| 亚洲天堂国产精品一区在线| 亚洲无线观看免费| 动漫黄色视频在线观看| 日本与韩国留学比较| 亚洲,欧美精品.| 性色av乱码一区二区三区2| 欧美乱妇无乱码| 亚洲第一欧美日韩一区二区三区| 高潮久久久久久久久久久不卡| 99国产精品一区二区三区| 我的老师免费观看完整版| 一区福利在线观看| 国产一区二区激情短视频| 国模一区二区三区四区视频| av片东京热男人的天堂| 欧美一级a爱片免费观看看| 成人国产综合亚洲| 日韩精品青青久久久久久| 色吧在线观看| 国产高清有码在线观看视频| 亚洲人与动物交配视频| av黄色大香蕉| 国产探花极品一区二区| 亚洲中文字幕一区二区三区有码在线看| 18禁黄网站禁片免费观看直播| 欧美午夜高清在线| 一夜夜www| 一进一出抽搐动态| 国产综合懂色| 又黄又爽又免费观看的视频| 久久欧美精品欧美久久欧美| 亚洲av美国av| 亚洲精华国产精华精| 欧美3d第一页| 午夜视频国产福利| 亚洲精品在线美女| 亚洲美女视频黄频| 欧美性猛交╳xxx乱大交人| 欧美乱妇无乱码| 欧美3d第一页| 午夜免费男女啪啪视频观看 | 国产精品98久久久久久宅男小说| 免费看a级黄色片| 亚洲熟妇熟女久久| 一本久久中文字幕| 欧洲精品卡2卡3卡4卡5卡区| 欧美+日韩+精品| 日韩欧美国产一区二区入口| 亚洲熟妇中文字幕五十中出| 亚洲精品影视一区二区三区av| xxxwww97欧美| 可以在线观看毛片的网站| 夜夜看夜夜爽夜夜摸| 婷婷六月久久综合丁香| 亚洲av第一区精品v没综合| 亚洲欧美激情综合另类| 国产精品野战在线观看| 国产午夜福利久久久久久| 精品国产美女av久久久久小说| а√天堂www在线а√下载| 国内精品久久久久久久电影| 久久久精品大字幕| 国产精品亚洲一级av第二区| 日本 av在线| 99国产精品一区二区蜜桃av| 久久久国产成人精品二区| 免费av观看视频| 中文字幕av成人在线电影| 国产国拍精品亚洲av在线观看 | 蜜桃亚洲精品一区二区三区| 一级毛片高清免费大全| 久久久久久人人人人人| 亚洲av免费在线观看| www.www免费av| 日日摸夜夜添夜夜添小说| 亚洲国产精品999在线| 热99re8久久精品国产| 国产午夜精品论理片| 久久这里只有精品中国| 亚洲欧美激情综合另类| 亚洲va日本ⅴa欧美va伊人久久| 色噜噜av男人的天堂激情| 欧美成人性av电影在线观看| 国产单亲对白刺激| 欧美+日韩+精品| 在线视频色国产色| 一个人免费在线观看电影| 99久久精品国产亚洲精品| 国产亚洲精品一区二区www| 久久久久久久久大av| 色精品久久人妻99蜜桃| 成人18禁在线播放| 欧美日韩精品网址| 国产一区在线观看成人免费| 男女视频在线观看网站免费| 国产又黄又爽又无遮挡在线| 1000部很黄的大片| 叶爱在线成人免费视频播放| 国产亚洲欧美98| 又紧又爽又黄一区二区| 19禁男女啪啪无遮挡网站| 两个人看的免费小视频| 日韩欧美一区二区三区在线观看| 精品日产1卡2卡| 女同久久另类99精品国产91| e午夜精品久久久久久久| 无限看片的www在线观看| 床上黄色一级片| 午夜福利成人在线免费观看| 亚洲 国产 在线| 啪啪无遮挡十八禁网站| 757午夜福利合集在线观看| 丰满乱子伦码专区| 亚洲精品乱码久久久v下载方式 | 热99re8久久精品国产| 精品不卡国产一区二区三区| 亚洲av第一区精品v没综合| 亚洲国产日韩欧美精品在线观看 | 老司机福利观看| 身体一侧抽搐| 女人十人毛片免费观看3o分钟| 欧美另类亚洲清纯唯美| av福利片在线观看| 亚洲,欧美精品.| 久久久国产成人免费| 在线国产一区二区在线| 无遮挡黄片免费观看| 国产伦人伦偷精品视频| 亚洲avbb在线观看| 欧美日韩综合久久久久久 | 亚洲精品影视一区二区三区av| av黄色大香蕉| 三级国产精品欧美在线观看| 色综合站精品国产| 色视频www国产| 欧美+亚洲+日韩+国产| 午夜精品在线福利| 一个人看视频在线观看www免费 | 最近在线观看免费完整版| 在线十欧美十亚洲十日本专区| 无遮挡黄片免费观看| 男女视频在线观看网站免费| 九色国产91popny在线| 国产爱豆传媒在线观看| 偷拍熟女少妇极品色| 欧美另类亚洲清纯唯美| 熟女电影av网| 久久香蕉国产精品| 欧美黄色淫秽网站| 国产乱人伦免费视频| 亚洲18禁久久av| 一级黄片播放器| 国产精品国产高清国产av| 免费电影在线观看免费观看| 欧美日韩福利视频一区二区| 国产伦在线观看视频一区| 热99在线观看视频| 亚洲最大成人手机在线| a级一级毛片免费在线观看| 精品人妻1区二区| 老鸭窝网址在线观看| 国内精品久久久久精免费| 午夜免费成人在线视频| 免费人成视频x8x8入口观看| 国产av一区在线观看免费| 1000部很黄的大片| 亚洲狠狠婷婷综合久久图片| 中出人妻视频一区二区| 国产亚洲精品久久久久久毛片| 国产亚洲欧美在线一区二区| 成年女人毛片免费观看观看9| 黄色成人免费大全| 少妇的逼好多水| 老司机午夜福利在线观看视频| 18禁国产床啪视频网站| 国产亚洲精品久久久com| 亚洲中文日韩欧美视频| 精品人妻1区二区| 亚洲熟妇中文字幕五十中出| 中文字幕精品亚洲无线码一区| 中文字幕久久专区| 999久久久精品免费观看国产| 嫩草影院精品99| 国产精品永久免费网站| 国内少妇人妻偷人精品xxx网站| 免费大片18禁| 制服人妻中文乱码| 神马国产精品三级电影在线观看| 亚洲黑人精品在线| 可以在线观看毛片的网站| 一级a爱片免费观看的视频| 国产精华一区二区三区| 韩国av一区二区三区四区| 国产精品久久久久久精品电影| 精品熟女少妇八av免费久了| 天天一区二区日本电影三级| 88av欧美| 免费看日本二区| 亚洲一区二区三区色噜噜| 日本免费a在线| 亚洲天堂国产精品一区在线| 欧美又色又爽又黄视频| 中国美女看黄片| 国产亚洲精品综合一区在线观看| 99久久精品热视频| x7x7x7水蜜桃| 99视频精品全部免费 在线| 天天添夜夜摸| 最新美女视频免费是黄的| 亚洲乱码一区二区免费版| 国产亚洲精品久久久com| 国产免费男女视频| 99热只有精品国产| 国产单亲对白刺激| 老汉色∧v一级毛片| 日本a在线网址| 脱女人内裤的视频| 男女下面进入的视频免费午夜| 国产成人aa在线观看| 欧美最新免费一区二区三区 | 日本黄大片高清| av视频在线观看入口| 成人欧美大片| 国产蜜桃级精品一区二区三区| 老司机午夜十八禁免费视频| 欧美日韩综合久久久久久 | 亚洲人成伊人成综合网2020| 国产视频一区二区在线看| 国产综合懂色| 欧美又色又爽又黄视频| 高清毛片免费观看视频网站| 久久精品亚洲精品国产色婷小说| 日本精品一区二区三区蜜桃| 亚洲avbb在线观看| 亚洲精品在线观看二区| 最后的刺客免费高清国语| 久久精品亚洲精品国产色婷小说| 国产欧美日韩精品亚洲av| 亚洲国产精品久久男人天堂| 亚洲精品一区av在线观看| 一本一本综合久久| 国语自产精品视频在线第100页| 亚洲性夜色夜夜综合| 尤物成人国产欧美一区二区三区| 村上凉子中文字幕在线| 最近在线观看免费完整版| 国产黄片美女视频| 亚洲av一区综合| a级一级毛片免费在线观看| 宅男免费午夜| 亚洲avbb在线观看| 免费看a级黄色片| 欧美日韩一级在线毛片| 在线天堂最新版资源| 丝袜美腿在线中文| 久久久久免费精品人妻一区二区| 长腿黑丝高跟| 中文在线观看免费www的网站| av国产免费在线观看| 很黄的视频免费| 国产一级毛片七仙女欲春2| 国产精品 国内视频| 内射极品少妇av片p| 淫秽高清视频在线观看| 日韩大尺度精品在线看网址| 国产欧美日韩一区二区三| 人妻久久中文字幕网| 日本与韩国留学比较| 狂野欧美白嫩少妇大欣赏| 身体一侧抽搐| 午夜免费激情av| 老司机在亚洲福利影院| 一夜夜www| 韩国av一区二区三区四区| 女生性感内裤真人,穿戴方法视频| 国产aⅴ精品一区二区三区波| 色噜噜av男人的天堂激情| 性欧美人与动物交配| 久久久久亚洲av毛片大全| 久久久国产成人免费| 亚洲 欧美 日韩 在线 免费| 最近最新免费中文字幕在线| 日韩精品中文字幕看吧| 观看美女的网站| 欧美日本视频| 欧美一区二区国产精品久久精品| 啦啦啦观看免费观看视频高清| 丰满人妻一区二区三区视频av | 老司机深夜福利视频在线观看| 一个人免费在线观看的高清视频| 国产欧美日韩精品一区二区| 国产欧美日韩精品亚洲av| 久久久久久久亚洲中文字幕 | 午夜a级毛片| 亚洲av电影不卡..在线观看| www日本黄色视频网| 中出人妻视频一区二区| 少妇人妻一区二区三区视频| 97超级碰碰碰精品色视频在线观看| 又粗又爽又猛毛片免费看| 可以在线观看的亚洲视频| 91久久精品电影网| 亚洲人成电影免费在线| 日韩欧美 国产精品| 十八禁人妻一区二区| 欧美日韩综合久久久久久 | 欧美另类亚洲清纯唯美| 国产一区在线观看成人免费| 亚洲欧美精品综合久久99| 亚洲精品日韩av片在线观看 | 亚洲国产欧美网| 中文字幕熟女人妻在线| 在线播放无遮挡| 免费大片18禁| 99国产精品一区二区三区| 国产伦人伦偷精品视频| 国产精品乱码一区二三区的特点| 91在线精品国自产拍蜜月 | 乱人视频在线观看| 香蕉久久夜色| 18禁美女被吸乳视频| 757午夜福利合集在线观看| 亚洲av熟女| 国语自产精品视频在线第100页| 日本 欧美在线| 99视频精品全部免费 在线| 午夜福利视频1000在线观看| 午夜福利在线观看免费完整高清在 | 日韩欧美三级三区|