楊攀 桂小林 田豐 王剛
摘要:針對基于關(guān)鍵詞元的話題內(nèi)事件檢測算法運行效率不高、不適合進行大規(guī)模文本話題檢測的問題,提出了一種高效的關(guān)鍵詞元聚類算法,該算法在進行詞元簇選擇時,為簇問相似度分配權(quán)值,并借鑒正態(tài)分布函數(shù)評估詞元簇的個數(shù),提高詞元簇的選擇精度,從而減少所需的詞元聚類次數(shù),實驗結(jié)果表明,將改進的方法應(yīng)用到輿情監(jiān)控的話題檢測中,能在不影響檢測精度的前提下有效地提高算法的運行效率。